AIBit - 发现开源项目

Helios：14B 实时视频生成，19.5 FPS

March 25, 2026

标签:

Open Source Real-time AI HuggingFace Video Generation diffusion-models

发现 Helios，来自 PKU-YuanGroup 的突破性 14B 参数视频生成模型，在单张 H100 GPU 上以 19.5 FPS 生成分钟级高品质视频。无需反漂移技巧，无加速黑客——纯架构创新。支持 T2V、I2V、V2V 和交互生成，开箱即用支持 Diffusers、SGLang、vLLM-Omni 和 Ascend NPU。使用组卸载在本地 ~6GB 显存运行。完整训练代码和三种模型变体（Base、Mid、Distilled）现已可用。

阅读更多原始

实用开源项目

memory-lancedb-pro：OpenClaw AI 记忆插件

March 25, 2026

标签:

RAG AI Memory OpenClaw LanceDB Vector Database

使用 memory-lancedb-pro 改造您的 OpenClaw AI 代理 – 一个基于 LanceDB 的记忆插件，为代理提供真正的长期记忆。自动捕获对话、智能提取关键事实/偏好，并在会话间自动回忆相关上下文。功能包括混合向量+BM25 检索、跨编码器重排序、Weibull 衰减和多范围隔离。一键安装脚本使 OpenClaw 2026.3+ 的设置轻松无忧。

阅读更多原始

实用开源项目

OpenCLI：将任意网站转化为 CLI 工具

March 25, 2026

标签:

AI Agents CLI tool Browser Automation opencli electron-apps

发现 OpenCLI，这款革命性的 CLI 工具，它将网站、Electron 应用和本地工具转化为命令行接口。安全复用你的 Chrome 登录会话，同时访问 50+ 平台如 Bilibili、Twitter、Reddit 等。完美适用于 AI 代理，无 LLM 成本、确定性输出，以及自动外部 CLI 发现（gh、docker、obsidian）。通过 npm 安装，今天就开始 CLI 化你的浏览器体验！

阅读更多原始

实用开源项目

Recordly：开源屏幕录制工具，内置专业编辑

March 25, 2026

标签:

Open Source screen recorder electron video-editor cursor-effects

Recordly 通过内置专业编辑工具革新屏幕录制。捕获您的屏幕或窗口，然后立即使用自动缩放、平滑光标效果、动态网络摄像头叠加、时间线裁剪和样式帧进行编辑。导出精美的 MP4 或 GIF，适用于教程、演示和社交剪辑。跨平台支持 macOS、Windows 和 Linux，使所有开发者和内容创作者都能轻松使用。发现为什么 3.1k 星标不会错！

阅读更多原始

Online AI Image Tools

AiArtAny：创作者的 14 款 AI 图像工具

March 24, 2026

标签:

AI image generator image editing tools style transfer virtual try-on logo maker

探索 AiArtAny，这是一个终极 AI 驱动平台，拥有 14 款工具，用于图像生成、编辑、风格转换、虚拟试穿等。从文本转图像到照片修复和 logo 设计，在约 30 秒内创建惊艳视觉效果。享受批量生成、实时进度、按使用付费积分和永久仪表板库。新用户获赠 100 积分免费——完美适合寻求专业效果而无需复杂性的创作者、营销人员和设计师。

阅读更多原始

实用开源项目

FFmpeg 自动构建：Windows 和 Linux 静态二进制文件

March 23, 2026

标签:

Windows Docker Linux FFmpeg Static Builds

发现 BtbN/FFmpeg-Builds，这是终极 GitHub 仓库，为 Windows（x86_64、ARM64）和 Linux 提供每日静态 FFmpeg 构建。拥有 10.6k 星标，它提供 GPL/LGPL/nonfree 变体、自动发布，以及基于 Docker 的轻松自定义构建。完美适合需要可靠、依赖齐全的 FFmpeg 二进制文件而无需编译麻烦的开发者。学习如何在几分钟内生成自己的构建。

阅读更多原始

实用开源项目

Page Agent：用自然语言控制 Web UI

March 18, 2026

标签:

Web Automation AI Agent Alibaba page-agent gui-agent

发现 Page Agent，阿里巴巴革命性的在页内 GUI 代理，将 Web 界面转变为自然语言 playground。无需浏览器扩展、无需 Python、无需无头浏览器——纯 JavaScript 魔法。拥有 10.5k GitHub 星标和 MIT 许可，这个 TypeScript powerhouse 启用 SaaS AI 副驾驶、智能表单填写、无障碍增强和多页自动化。一行代码集成，执行如“点击登录按钮”之类的命令。完美适合构建智能 Web 体验的开发者。

阅读更多原始

实用开源项目

FunCineForge：零样本电影配音流水线

March 17, 2026

标签:

movie dubbing dataset pipeline zero-shot AI speech diarization multimodal LLM

探索FunCineForge，这一开创性的开源工具包，用于创建大规模电影配音数据集和部署零样本配音模型。这一端到端流水线处理视频处理、语音分离、说话人分割和使用MLLMs的多模态校正。从原始素材构建CineDub-CN/EN数据集，并生成高质量配音，完美唇同步和音色匹配。包含推理代码、demo样本，并支持中英文。完美适用于AI研究人员和内容创作者。

阅读更多原始

实用开源项目

VoiceChanger：开源实时语音转换

March 15, 2026

标签:

Open Source AI Docker voice conversion gaming

了解 VoiceChanger 如何让你实时使用尖端 AI 模型（如 Beatrice 和 RVC）来变换语音。本开源项目提供跨平台 GUI、Docker 支持、网络模式以及 AMD Linux 和 Google Colab 的教程。无论你是游戏开发者、主播还是爱好者，学习如何在数分钟内安装、配置并升级软件，探索实时语音操控的激动人心世界。

阅读更多原始

实用开源项目

EasyOCR：一款快速、多语言 OCR 库，适用于 Python

March 15, 2026

标签:

Open Source Python OCR Multilingual easyocr

EasyOCR 带来 80+ 语言支持，直接嵌入您的 Python 项目。只需快速 pip 安装、轻量级模型下载以及直观的 API，即可在数秒内从图像中提取文本。本指南涵盖从基础使用和自定义语言集到 Docker 部署和 Hugging Face Space 集成的一切内容。无论您是在构建照片管理工具还是数据录入流水线，EasyOCR 都能为您提供所需的速度与准确性。

阅读更多原始

分类

热门开源项目

Helios：14B 实时视频生成，19.5 FPS

memory-lancedb-pro：OpenClaw AI 记忆插件

OpenCLI：将任意网站转化为 CLI 工具

Recordly：开源屏幕录制工具，内置专业编辑

AiArtAny：创作者的 14 款 AI 图像工具

FFmpeg 自动构建：Windows 和 Linux 静态二进制文件

Page Agent：用自然语言控制 Web UI

FunCineForge：零样本电影配音流水线

VoiceChanger：开源实时语音转换

EasyOCR：一款快速、多语言 OCR 库，适用于 Python