标记为的帖子: Voice AI

Content related to Voice AI

VibeVoice:Microsoft 的开源语音 AI 套件

March 15, 2026

探索 VibeVoice,Microsoft 的前沿开源工具包,为开发者与研究人员提供长时段 ASR、多说话人 TTS 与实时流式处理。了解如何利用其 60 分钟 ASR 流程、90 分钟 TTS 以及轻量级实时模型,并探索与 Hugging Face Transformers 的集成,实现无缝部署。

RCLI:面向 macOS 的本地语音 AI——零云、极速

March 13, 2026

RCLI 将您的 Mac 转变为功能齐全的本地语音助手与文档浏览器。借助 Apple Silicon 的 MetalRT GPU 引擎,它在本地运行业内尖端的 STT、LLM 与 TTS——完全无云、无 API 密钥。了解如何通过 Homebrew 安装,控制 38 种 macOS 操作,使用低于 4 ms 的 RAG 索引 PDF,并对比 MetalRT 与 llama.cpp 的性能。无论您是开发者、重度用户还是 AI 爱好者,RCLI 都以最前沿的本地 AI 为您的桌面带来极简设置体验。发现为什么该仓库是任何想构建语音驱动 macOS 工具的人的必试之选。

NeuTTS Air:即时克隆的端侧语音AI

October 23, 2025

隆重推出 NeuTTS Air,一款由 Neuphonic 带来、突破性的开源设备端文本转语音 (TTS) 模型。这款创新的人工智能技术Directly allows you to achieve超逼真的语音合成和即时语音克隆,无论是在手机还是树莓派等本地设备上。了解 NeuTTS Air 如何利用 0.5B 大语言模型骨干生成自然语音,实现实时性能,并内置安全功能。探索其主要特性、支持的语言、为提高效率而采用的 GGML 格式,以及快速入门指南,以便将这款强大的语音 AI 融入您的项目中。