Faster Whisper ChickenRice:日语-中文转录

ChickenRice – 一款强大的开源日语到中文转录工具

在视频和播客涵盖数十种语言的时代,能够准确、快速地自动生成字幕的能力可以为手工劳动节省数小时。ChickenRice(Faster‑Whisper‑TransWithAI)是一款即开即用的解决方案,可将日语音频或视频瞬间生成中文字幕(SRT、VTT、LRC)。它建立在极速的 Faster Whisper 引擎之上,并采用在 5 000 小时日语音频上训练的优化 日语‑中文 模型,提供业界领先的准确性。

关键特性

功能 描述
GPU 加速 支持 CUDA 11.8、12.2、12.8 – 非常适合 NVIDIA RTX 系列。
批量推理 一次处理数十文件,自动缓存已处理项目,避免重复。
语音优化 VAD 使用 TransWithAI 的 whisper‑VAD 去除背景噪音,聚焦语音。
多格式输出 导出为 SRT、VTT、LRC,或原始文本。
云端推理 Modal 集成让你在云端 GPU 上运行模型,无需本地硬件。
零代码启动 拖拽 bat 文件即可在 GPU 与 CPU 模式下运行 – 无需繁重脚本。
开源 MIT 所有源代码、数据与模型均 GPL 兼容 – 欢迎贡献。

为什么选择 ChickenRice?

  • 高准确度:自定义的日语‑中文模型在大量母语者音频数据上训练,确保翻译正确并善于处理上下文。
  • 速度:Faster Whisper 在单遍中压缩解码能力,成为最快的 Whisper 替代方案。
  • 灵活性:无论你拥有 RTX 3090 还是仅 CPU,都有相应的部署路径。
  • 可扩展性:源代码干净、模块化 – 可调节 generation_config.json5 或加入自定义 VAD 模型。

快速安装指南

  1. 先决条件
  2. Windows 10/11(+ 可选 WSL 适用于 Linux)、Python 3.11+,以及 NVIDIA GPU 或 Modal 账号。
  3. gitconda(或 pip)和 modal CLI。

  4. 克隆仓库

    git clone https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice.git
    cd Faster-Whisper-TransWithAI-ChickenRice
    

  5. 安装依赖

    conda env create -f environment-cuda118.yml    # 或 cuda122 / cuda128
    conda activate faster-whisper-cu118
    
    或者使用 pip install -r requirements.txt

  6. 下载模型

    python download_models.py  # 拉取 Whisper 与 VAD 模型
    

  7. 本地运行

  8. GPU(最佳性能):. un(GPU).bat
  9. CPU(降级):. un(CPU).bat
  10. 低显存 GPU. un(GPU,低显存模式).bat
  11. 仅翻译视频. un(翻译视频)(GPU).bat

将你的视频/音频文件拖拽到对应的批处理文件上。

  1. 云端推理(可选)
    modal token new   # 注册/续期 Modal 令牌
    modal run modal_infer.py   # 交互式提示将询问 GPU 类型、模型和文件
    

如需预构建可执行文件,请使用 modal_infer.exe

  1. 自定义输出 编辑 generation_config.json5 以调整 beam 大小、温度或启用 segment_merge 以生成更干净的字幕。

例如:

{
  "segment_merge": {"enabled": true, "max_gap_ms": 500, "max_duration_ms": 2000}
}

高级主题

  • 为什么选择 Modal? 无本地 GPU,或想在多任务上扩展。Modal 为你提供 T4 GPU 免费(每月最高 $30),并能自动管理扩容。
  • 设置:完成 modal token new 后,你可以直接从命令行或使用 modal_infer.py 脚本启动作业。
  • 费用:根据 GPU 类型,约 $0.02–$0.05/分钟。

批量处理与缓存

工具会自动识别已处理文件并跳过。这在大规模媒体库中尤为重要;仅需重新处理未处理的文件。

扩展模型工具包

你可以将日语‑中文翻译模型替换为任何 Whisper 检查点,或通过修改 infer.py 和环境 YAML 添加自定义 VAD 模型。

社区与支持

  • 问题与拉取请求:访问 GitHub 仓库报告错误或提交改进。
  • Telegram:加入 AI汉化组聊天,快速获得帮助与协作开发。
  • 文档:仓库包含 README.md使用说明.txtRELEASE_NOTES_CN.md,提供详细指导。

最后思考

ChickenRice 不仅仅是一个转录脚本;它是一条面向 YouTuber、播客和研究人员的生产级流水线,能够快速、可靠地生成日语到中文字幕。借助 GPU 加速、无缝云端扩展和 MIT 许可,采用 ChickenRice 可以显著缩短手工字幕创建时间。

尝试一下,分叉仓库,做出贡献——社区在 AI 助手转录技术上的下一次突破仅在几行代码之遥!

原创文章: 查看原文

分享本文