Faster Whisper ChickenRice:日语-中文转录
ChickenRice – 一款强大的开源日语到中文转录工具
在视频和播客涵盖数十种语言的时代,能够准确、快速地自动生成字幕的能力可以为手工劳动节省数小时。ChickenRice(Faster‑Whisper‑TransWithAI)是一款即开即用的解决方案,可将日语音频或视频瞬间生成中文字幕(SRT、VTT、LRC)。它建立在极速的 Faster Whisper 引擎之上,并采用在 5 000 小时日语音频上训练的优化 日语‑中文 模型,提供业界领先的准确性。
关键特性
| 功能 | 描述 |
|---|---|
| GPU 加速 | 支持 CUDA 11.8、12.2、12.8 – 非常适合 NVIDIA RTX 系列。 |
| 批量推理 | 一次处理数十文件,自动缓存已处理项目,避免重复。 |
| 语音优化 VAD | 使用 TransWithAI 的 whisper‑VAD 去除背景噪音,聚焦语音。 |
| 多格式输出 | 导出为 SRT、VTT、LRC,或原始文本。 |
| 云端推理 | Modal 集成让你在云端 GPU 上运行模型,无需本地硬件。 |
| 零代码启动 | 拖拽 bat 文件即可在 GPU 与 CPU 模式下运行 – 无需繁重脚本。 |
| 开源 MIT | 所有源代码、数据与模型均 GPL 兼容 – 欢迎贡献。 |
为什么选择 ChickenRice?
- 高准确度:自定义的日语‑中文模型在大量母语者音频数据上训练,确保翻译正确并善于处理上下文。
- 速度:Faster Whisper 在单遍中压缩解码能力,成为最快的 Whisper 替代方案。
- 灵活性:无论你拥有 RTX 3090 还是仅 CPU,都有相应的部署路径。
- 可扩展性:源代码干净、模块化 – 可调节
generation_config.json5或加入自定义 VAD 模型。
快速安装指南
- 先决条件
- Windows 10/11(+ 可选 WSL 适用于 Linux)、Python 3.11+,以及 NVIDIA GPU 或 Modal 账号。
-
git、conda(或pip)和modalCLI。 -
克隆仓库
git clone https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice.git cd Faster-Whisper-TransWithAI-ChickenRice -
安装依赖
或者使用conda env create -f environment-cuda118.yml # 或 cuda122 / cuda128 conda activate faster-whisper-cu118pip install -r requirements.txt。 -
下载模型
python download_models.py # 拉取 Whisper 与 VAD 模型 -
本地运行
- GPU(最佳性能):
. un(GPU).bat - CPU(降级):
. un(CPU).bat - 低显存 GPU:
. un(GPU,低显存模式).bat - 仅翻译视频:
. un(翻译视频)(GPU).bat
将你的视频/音频文件拖拽到对应的批处理文件上。
- 云端推理(可选)
modal token new # 注册/续期 Modal 令牌 modal run modal_infer.py # 交互式提示将询问 GPU 类型、模型和文件
如需预构建可执行文件,请使用 modal_infer.exe。
- 自定义输出
编辑
generation_config.json5以调整 beam 大小、温度或启用segment_merge以生成更干净的字幕。
例如:
{
"segment_merge": {"enabled": true, "max_gap_ms": 500, "max_duration_ms": 2000}
}
高级主题
使用 Modal 云端推理
- 为什么选择 Modal? 无本地 GPU,或想在多任务上扩展。Modal 为你提供 T4 GPU 免费(每月最高 $30),并能自动管理扩容。
- 设置:完成
modal token new后,你可以直接从命令行或使用modal_infer.py脚本启动作业。 - 费用:根据 GPU 类型,约 $0.02–$0.05/分钟。
批量处理与缓存
工具会自动识别已处理文件并跳过。这在大规模媒体库中尤为重要;仅需重新处理未处理的文件。
扩展模型工具包
你可以将日语‑中文翻译模型替换为任何 Whisper 检查点,或通过修改 infer.py 和环境 YAML 添加自定义 VAD 模型。
社区与支持
- 问题与拉取请求:访问 GitHub 仓库报告错误或提交改进。
- Telegram:加入 AI汉化组聊天,快速获得帮助与协作开发。
- 文档:仓库包含
README.md、使用说明.txt和RELEASE_NOTES_CN.md,提供详细指导。
最后思考
ChickenRice 不仅仅是一个转录脚本;它是一条面向 YouTuber、播客和研究人员的生产级流水线,能够快速、可靠地生成日语到中文字幕。借助 GPU 加速、无缝云端扩展和 MIT 许可,采用 ChickenRice 可以显著缩短手工字幕创建时间。
尝试一下,分叉仓库,做出贡献——社区在 AI 助手转录技术上的下一次突破仅在几行代码之遥!
原创文章:
查看原文