标记为的帖子: Speech-to-Text

Content related to Speech-to-Text

SpeechRecognition：终极 Python 语音转文本库

April 09, 2026

标签:

Open Source Speech Recognition Python Library Speech-to-Text Whisper

发现 SpeechRecognition，这是最全面的 Python 语音转文本库。支持离线引擎如 CMU Sphinx、Vosk 和 OpenAI Whisper，以及来自 Google、OpenAI、Groq 和 Cohere 的云 API。只需一个 pip 命令即可安装，即可立即转录麦克风输入或音频文件。完美适用于语音助手、转录应用和会议录音器。包含 PyAudio、PocketSphinx 的详细设置指南和故障排除提示。

阅读更多原始

实用开源项目

WhisperLiveKit：实时本地语音转文字

August 30, 2025

标签:

Open Source Python Real-time AI Speech-to-Text Whisper

发现 WhisperLiveKit，一个强大的开源项目，可实现实时、完全本地化的语音转文本、翻译和说话人分割。它借鉴了 SimulStreaming 和 WhisperStreaming 等前沿研究，带来无与伦比的准确性和低延迟，克服了传统音频分块处理的局限性。WhisperLiveKit 拥有用户友好的服务器和 Web 用户界面，非常适合会议转录、辅助功能工具、内容创作和客户服务分析等应用。该项目可通过 pip 轻松安装，提供各种模型和后端配置选项，并为 CPU 和 GPU 环境提供使用 Docker 的稳定部署指南。

阅读更多原始

分类

标记为的帖子: Speech-to-Text

SpeechRecognition：终极 Python 语音转文本库

WhisperLiveKit：实时本地语音转文字