热门开源项目

发现快速增长星标的热门开源项目。AI 摘要帮助您领先一步。

Helios:14B 实时视频生成,19.5 FPS

March 25, 2026

发现 Helios,来自 PKU-YuanGroup 的突破性 14B 参数视频生成模型,在单张 H100 GPU 上以 19.5 FPS 生成分钟级高品质视频。无需反漂移技巧,无加速黑客——纯架构创新。支持 T2V、I2V、V2V 和交互生成,开箱即用支持 Diffusers、SGLang、vLLM-Omni 和 Ascend NPU。使用组卸载在本地 ~6GB 显存运行。完整训练代码和三种模型变体(Base、Mid、Distilled)现已可用。

memory-lancedb-pro:OpenClaw AI 记忆插件

March 25, 2026

使用 memory-lancedb-pro 改造您的 OpenClaw AI 代理 – 一个基于 LanceDB 的记忆插件,为代理提供真正的长期记忆。自动捕获对话、智能提取关键事实/偏好,并在会话间自动回忆相关上下文。功能包括混合向量+BM25 检索、跨编码器重排序、Weibull 衰减和多范围隔离。一键安装脚本使 OpenClaw 2026.3+ 的设置轻松无忧。

OpenCLI:将任意网站转化为 CLI 工具

March 25, 2026

发现 OpenCLI,这款革命性的 CLI 工具,它将网站、Electron 应用和本地工具转化为命令行接口。安全复用你的 Chrome 登录会话,同时访问 50+ 平台如 Bilibili、Twitter、Reddit 等。完美适用于 AI 代理,无 LLM 成本、确定性输出,以及自动外部 CLI 发现(gh、docker、obsidian)。通过 npm 安装,今天就开始 CLI 化你的浏览器体验!

Recordly:开源屏幕录制工具,内置专业编辑

March 25, 2026

Recordly 通过内置专业编辑工具革新屏幕录制。捕获您的屏幕或窗口,然后立即使用自动缩放、平滑光标效果、动态网络摄像头叠加、时间线裁剪和样式帧进行编辑。导出精美的 MP4 或 GIF,适用于教程、演示和社交剪辑。跨平台支持 macOS、Windows 和 Linux,使所有开发者和内容创作者都能轻松使用。发现为什么 3.1k 星标不会错!

AiArtAny:创作者的 14 款 AI 图像工具

March 24, 2026

探索 AiArtAny,这是一个终极 AI 驱动平台,拥有 14 款工具,用于图像生成、编辑、风格转换、虚拟试穿等。从文本转图像到照片修复和 logo 设计,在约 30 秒内创建惊艳视觉效果。享受批量生成、实时进度、按使用付费积分和永久仪表板库。新用户获赠 100 积分免费——完美适合寻求专业效果而无需复杂性的创作者、营销人员和设计师。

FFmpeg 自动构建:Windows 和 Linux 静态二进制文件

March 23, 2026

发现 BtbN/FFmpeg-Builds,这是终极 GitHub 仓库,为 Windows(x86_64、ARM64)和 Linux 提供每日静态 FFmpeg 构建。拥有 10.6k 星标,它提供 GPL/LGPL/nonfree 变体、自动发布,以及基于 Docker 的轻松自定义构建。完美适合需要可靠、依赖齐全的 FFmpeg 二进制文件而无需编译麻烦的开发者。学习如何在几分钟内生成自己的构建。

Page Agent:用自然语言控制 Web UI

March 18, 2026

发现 Page Agent,阿里巴巴革命性的在页内 GUI 代理,将 Web 界面转变为自然语言 playground。无需浏览器扩展、无需 Python、无需无头浏览器——纯 JavaScript 魔法。拥有 10.5k GitHub 星标和 MIT 许可,这个 TypeScript powerhouse 启用 SaaS AI 副驾驶、智能表单填写、无障碍增强和多页自动化。一行代码集成,执行如“点击登录按钮”之类的命令。完美适合构建智能 Web 体验的开发者。

FunCineForge:零样本电影配音流水线

March 17, 2026

探索FunCineForge,这一开创性的开源工具包,用于创建大规模电影配音数据集和部署零样本配音模型。这一端到端流水线处理视频处理、语音分离、说话人分割和使用MLLMs的多模态校正。从原始素材构建CineDub-CN/EN数据集,并生成高质量配音,完美唇同步和音色匹配。包含推理代码、demo样本,并支持中英文。完美适用于AI研究人员和内容创作者。

VoiceChanger:开源实时语音转换

March 15, 2026

了解 VoiceChanger 如何让你实时使用尖端 AI 模型(如 Beatrice 和 RVC)来变换语音。本开源项目提供跨平台 GUI、Docker 支持、网络模式以及 AMD Linux 和 Google Colab 的教程。无论你是游戏开发者、主播还是爱好者,学习如何在数分钟内安装、配置并升级软件,探索实时语音操控的激动人心世界。

EasyOCR:一款快速、多语言 OCR 库,适用于 Python

March 15, 2026

EasyOCR 带来 80+ 语言支持,直接嵌入您的 Python 项目。只需快速 pip 安装、轻量级模型下载以及直观的 API,即可在数秒内从图像中提取文本。本指南涵盖从基础使用和自定义语言集到 Docker 部署和 Hugging Face Space 集成的一切内容。无论您是在构建照片管理工具还是数据录入流水线,EasyOCR 都能为您提供所需的速度与准确性。