Edge-TTS:免费的Python文本转语音

July 17, 2025

借助 edge-tts Python 库释放 Microsoft Edge 文本转语音 (TTS) 的强大功能

对于那些寻求多功能且免费文本转语音 (TTS) 生成解决方案的开发者而言,edge-tts Python 库提供了一个出色的开源选择。该项目巧妙地利用了 Microsoft Edge 的在线 TTS 服务,让用户可以直接在 Python 应用程序中将文本转换为语音,无需专用硬件,也无需依赖 Windows 操作系统,更不用支付昂贵的 API 密钥。

轻松安装与使用

开始使用 edge-tts 非常简单。只需一条 pip install edge-tts 命令,即可将其功能集成到您的开发环境中。如果您主要使用命令行界面,我们推荐使用 pipx install edge-tts 进行安装。

该库提供了一个用户友好的命令行界面,可快速生成音频。您可以使用以下命令轻松创建音频文件及对应的字幕文件:

$ edge-tts --text "Hello, world!" --write-media hello.mp3 --write-subtitles hello.srt

若要即时播放,可使用 edge-playback 命令:

$ edge-playback --text "Hello, world!"

请注意,edge-playback 需要 mpv 命令行播放器才能进行播放,但在 Windows 系统上例外。

自定义与语音选择

edge-tts 的强大之处在于其灵活性。您可以使用 --voice 选项轻松切换 Microsoft 服务支持的众多语音。要探索可用的语音及其特性,只需运行:

$ edge-tts --list-voices

此命令将输出一个全面的语音列表,包括其名称、性别、内容类别和语音个性,让您可以根据自己的需求选择最合适的声线。

此外,细致地调整语音输出也十分便捷。您可以使用 --rate--volume--pitch 选项分别调整语速、音量和音高。在使用负值时需特别注意,必须在其后附加百分号(例如 --rate=-50%),以避免命令行被错误解析。

程序化集成

除了命令行工具的实用性,edge-tts 还为无缝集成到 Python 项目而设计。开发者可以直接在代码中导入并使用该模块,从而在各类应用程序中实现动态的文本转语音功能,应用范围涵盖交互式机器人到内容创作工具。

诸如 hass-edge-ttsPodcastfy 等其他项目已在利用 edge-tts 模块的强大功能,这充分展示了其在开发者社区中的实用性和广泛应用。

凭借其强大的功能、易用性和开源特性,edge-tts 无疑是任何希望在其 Python 项目中集成高质量、便捷易用的文本转语音功能的开发者们宝贵的工具。

原创文章: 查看原文

分享本文