Open Source - 开源项目

PaperBanana：利用 AI 自动生成研究图表 – 开源工具

February 06, 2026

标签:

Open Source Research Tools AI Illustration PaperBanana Academic Figures

PaperBanana 是一个突破性开源项目，利用 AI 简化高质量研究插图的创建。凭借干净的网页界面和强大的后台脚本，它读取学术数据，推荐图表模板，并自动生成可视化内容。无论您是在起草会议海报还是将图表嵌入期刊论文，PaperBanana 都能通过将原始数据转换为精美的图表、曲线图和流程图，在几秒钟内减轻手工工作量。了解其功能、学习设置方法，发掘科学界如何从这一高效、社区驱动的工具中受益。

阅读更多原始

实用开源项目

PostBot：开源多平台内容同步工具

February 06, 2026

标签:

Open Source Social Media Workflow Automation content-synchronization multi-platform

PostBot 是一款免费的开源工具，能够让你在浏览器中直接创建、编辑并自动发布文章、图片、视频和音频至多种国内外媒体平台。它使用 TypeScript、Vue 以及现代 Web 技术构建，支持从微信、微博、哔哩哔哩到 Twitter、Facebook、LinkedIn 等广泛平台，并将凭证保留在本地，确保安全。立即了解如何安装、配置并扩展 PostBot，以简化你的社交媒体工作流。

阅读更多原始

实用开源项目

ACE‑Step 1.5：开源音乐模型优于商业版本

February 05, 2026

标签:

Open Source AI Models Music Generation LoRA GPU

ACE‑Step 1.5 是本地音乐生成的突破，能够在消费级 GPU 上提供商业级质量，甚至在 CPU 上的速度与多付费方案相比只是一小部分时间。本篇文章将带你了解项目的架构，如何在 Windows 或 Linux 上启动运行，如何通过 Gradio 或 REST API 运行，如何利用 LoRA 训练进行自定义。无论你是开发者、播客主播还是音乐制作人，都能了解到如何利用 ACE‑Step 的混合 LM‑DiT 设计、多语言歌词支持以及强大的编辑工具——全程在本机完成，无需云端。

阅读更多原始

实用开源项目

Voicebox：由 Qwen3‑TTS 提供支持的开源语音工作室

February 04, 2026

标签:

Open Source Local AI voice synthesis Qwen3‑TTS audio editing

Voicebox 是一个本地优先、专注隐私的语音合成工作室，整个运行在您的设备上。凭借现代的 Rust、React 和 FastAPI 技术，它让您可以仅凭几秒钟的音频克隆声音，编辑多轨时间线，并使用 Qwen3‑TTS 生成语音——全部无需云订阅。无论您是播客制作人、游戏开发者还是无障碍倡导者，Voicebox 都提供快速、完全开源的商业服务替代方案。本文将引导您了解项目的核心功能、技术栈、部署选项以及真实使用案例。

阅读更多原始

实用开源项目

Lumina：用于 CoreML 集成成像的 Swift 相机库

February 02, 2026

标签:

Open Source Swift iOS coreml camera

Lumina 是一款轻量、经过实战检验的 Swift 框架，为 iOS 开发者提供即插即用的相机系统，并支持 CoreML 模型流式、二维码/条形码扫描、人脸检测、深度数据和视频捕获。不需要 AVFoundation 代码模板，只需使用视图控制器、示例应用和少量 API 调用即可快速入门。无论您是在构建具备实时商品识别的零售应用，还是具备深度感知肖像的相册日记，Lumina 都能让您专注业务逻辑，底层相机实现交由它来处理。

阅读更多原始

实用开源项目

Tokscale：跨多平台追踪 AI 令牌使用 – CLI 工具

January 31, 2026

标签:

Open Source Token Usage AI utilities cli tokscale

探索 Tokscale，这款全新的开源 CLI 让开发者能够监控来自 OpenCode、Claude Code、Codex、Gemini、Cursor、Amp 等工具的令牌消耗。了解 Tokscale 的实时定价、排行榜以及 2D/3D 贡献图如何帮助您评估成本与效率。逐步指导您从使用 Bun 安装、定制过滤器、启动交互式 TUI，到导出 JSON 数据以供仪表盘使用。无论您是自由职业者还是企业团队，Tokscale 都能为您即时洞察 AI 使用情况，帮助您优化令牌，省钱并提升生产力。

阅读更多原始

实用开源项目

Qwen3‑ASR：阿里巴巴开源 52 语言 ASR 模型

January 31, 2026

标签:

Open Source Speech Recognition Alibaba ASR Multilingual

阿里云最新发布的 Qwen3‑ASR 将最先进的多语言语音识别技术带入开源社区。支持 52 种语言和 22 种中文方言，1.7B/0.6B 两个模型在基准测试中表现优异，足以与商业 API 一较高下。本仓库配备完整的推理工具包，兼容 Transformers 或高性能 vLLM 后端，支持 Qwen3‑ForcedAligner 自动时间戳，并提供即跑的 Gradio 演示。无论你是研究员、开发者还是业余爱好者，本指南将引导你完成下载、配置、基准测试以及在 Docker 或直接在 GPU 上部署 Qwen3‑ASR，让你轻松开始转录语音、音乐和歌曲。主要亮点： - 多语言支持 - 流式推理 - 强制对齐 - 快速启动脚本 - Docker 部署 - 与 OpenAI 兼容的 API 集成

阅读更多原始

实用开源项目

PageIndex：开源的基于推理的 RAG 框架

January 29, 2026

标签:

Open Source Python LLM RAG vectorless

发现 PageIndex —— 一款突破性的开源工具，消除了检索增强生成（RAG）中对向量数据库的需求。通过构建层级树索引并利用 LLM 推理，PageIndex 实现了类人检索，无需分块或向量相似度。本文深入阐述其核心概念、安装步骤、实用用例——尤其是金融与法律文档分析——以及令人印象深刻的基准结果。无论您是研究员、开发者还是数据科学家，都能学习如何用这款轻量级 Python 库将长篇 PDF 与 Markdown 文件转化为可操作的知识。

阅读更多原始

实用开源项目

JJYB_AI VideoAutoCut：开源 AI 视频编辑工具包

January 29, 2026

标签:

Open Source Python tts ai-video-editing Flask

发现 JJYB_AI VideoAutoCut（v2.0），这是一套完整的 AI 驱动视频编辑套件，自动剪辑、添加旁白并利用 19 种语言模型、6 种视觉模型以及 4 种 TTS 引擎进行 AI 配音——全部封装在简洁的 Flask Web 界面中。学习如何在 Windows 或 macOS 上安装、配置并部署此 Python 强化解决方案，零手动编辑即可开始制作专业视频。

阅读更多原始

实用开源项目

飞书频道插件 for Clawdbot – 快速且功能丰富

January 29, 2026

标签:

Open Source clawdbot Feishu Chatbot Plugin

想要为 Clawdbot 增加 Feishu（Lark）支持？本文将引导您通过安装 @m1heng-clawd/feishu 插件、配置必要的 App ID、App Secret、事件订阅以及权限，完成在飞书开放平台的设置。本文涵盖 WebSocket 与 webhook 的连接模式、DM 与群聊策略、媒体上传/下载，以及可选的卡片渲染功能以实现丰富的 Markdown 输出。完整 FAQ 章节将解决常见问题，如消息接收失败、403 错误，以及如何使用 /new 命令开启新对话。几分钟内让您的机器人与飞书用户对话。

阅读更多原始

分类

标记为的帖子: Open Source

PaperBanana：利用 AI 自动生成研究图表 – 开源工具

PostBot：开源多平台内容同步工具

ACE‑Step 1.5：开源音乐模型优于商业版本

Voicebox：由 Qwen3‑TTS 提供支持的开源语音工作室

Lumina：用于 CoreML 集成成像的 Swift 相机库

Tokscale：跨多平台追踪 AI 令牌使用 – CLI 工具

Qwen3‑ASR：阿里巴巴开源 52 语言 ASR 模型

PageIndex：开源的基于推理的 RAG 框架

JJYB_AI VideoAutoCut：开源 AI 视频编辑工具包

飞书频道插件 for Clawdbot – 快速且功能丰富