Edge-TTS:免费的Python文本转语音
借助 edge-tts Python 库释放 Microsoft Edge 文本转语音 (TTS) 的强大功能
对于那些寻求多功能且免费文本转语音 (TTS) 生成解决方案的开发者而言,edge-tts
Python 库提供了一个出色的开源选择。该项目巧妙地利用了 Microsoft Edge 的在线 TTS 服务,让用户可以直接在 Python 应用程序中将文本转换为语音,无需专用硬件,也无需依赖 Windows 操作系统,更不用支付昂贵的 API 密钥。
轻松安装与使用
开始使用 edge-tts
非常简单。只需一条 pip install edge-tts
命令,即可将其功能集成到您的开发环境中。如果您主要使用命令行界面,我们推荐使用 pipx install edge-tts
进行安装。
该库提供了一个用户友好的命令行界面,可快速生成音频。您可以使用以下命令轻松创建音频文件及对应的字幕文件:
$ edge-tts --text "Hello, world!" --write-media hello.mp3 --write-subtitles hello.srt
若要即时播放,可使用 edge-playback
命令:
$ edge-playback --text "Hello, world!"
请注意,edge-playback
需要 mpv
命令行播放器才能进行播放,但在 Windows 系统上例外。
自定义与语音选择
edge-tts
的强大之处在于其灵活性。您可以使用 --voice
选项轻松切换 Microsoft 服务支持的众多语音。要探索可用的语音及其特性,只需运行:
$ edge-tts --list-voices
此命令将输出一个全面的语音列表,包括其名称、性别、内容类别和语音个性,让您可以根据自己的需求选择最合适的声线。
此外,细致地调整语音输出也十分便捷。您可以使用 --rate
、--volume
和 --pitch
选项分别调整语速、音量和音高。在使用负值时需特别注意,必须在其后附加百分号(例如 --rate=-50%
),以避免命令行被错误解析。
程序化集成
除了命令行工具的实用性,edge-tts
还为无缝集成到 Python 项目而设计。开发者可以直接在代码中导入并使用该模块,从而在各类应用程序中实现动态的文本转语音功能,应用范围涵盖交互式机器人到内容创作工具。
诸如 hass-edge-tts
和 Podcastfy
等其他项目已在利用 edge-tts
模块的强大功能,这充分展示了其在开发者社区中的实用性和广泛应用。
凭借其强大的功能、易用性和开源特性,edge-tts
无疑是任何希望在其 Python 项目中集成高质量、便捷易用的文本转语音功能的开发者们宝贵的工具。