BabelDOC:为 AI 驱动文档打造的开源 PDF 翻译器

BabelDOC——开源AI驱动的PDF翻译器

在全球研究与快速商业扩张的时代,能够在保留布局和格式的前提下翻译复杂的PDF文档已变得至关重要。传统的基于OCR的工具往往会拆分文本、破坏表格或丢失格式,导致翻译者需要进行大量手工清理。BabelDOC应运而生,是一个社区驱动的项目,将AI驱动的翻译转化为无缝、单一的工作流程。

什么是BabelDOC?

BabelDOC是一款用Python实现的又一款文档翻译器。它接收PDF文件,使用行业最前沿的布局解析器提取文本,将句子送入LLM(默认兼容OpenAI),并将翻译后的文本重新拼接成新的PDF,保持原始设计。

关键特性包括: - 双页输出:原文页与译文页可并列或交替显示。 - 富文本支持:公式、表格和复杂格式保持完整。 - 离线资产生成:为离网环境生成字体与模型权重的ZIP包。 - 可扩展CLI与Python API:轻松集成到脚本或大型应用中。 - 词库支持:保持文档间术语一致。

开始使用 – 安装

BabelDOC 采用两种方式安装:

  1. PyPI + UV(推荐)
uv tool install --python 3.12 BabelDOC
babeldoc --help

UV 会自动解析依赖并将 babeldoc 可执行文件放入 PATH。

  1. 源码安装(面向开发者)
git clone https://github.com/funstory-ai/BabelDOC
cd BabelDOC
uv run babeldoc --help

uv run 会创建全新的虚拟环境并直接运行 BabelDOC。

基本用法

将单个 PDF 从英文翻译成中文:

babeldoc --openai --openai-model "gpt-4o-mini" \
  --openai-base-url "https://api.openai.com/v1" \
  --openai-api-key "YOUR_KEY" \
  --files example.pdf

要翻译多份文档,只需重复 --files 标志:

babeldoc --files paper1.pdf --files paper2.pdf --openai ...

输出文件位于同一文件夹,除非你提供 --output /path/to/dir

高级选项

BabelDOC 的 CLI 里装满了细粒度控制的选项: - --disable-rich-text-translate – 跳过富文本以提升兼容性。 - --watermark-output-mode – 选择水印、无水印或两者并存。 - --max-pages-per-part – 将大型 PDF 切分为可管理的块。 - --openai-model – 更换任何 OpenAI 兼容 LLM,如 glm‑4‑flashdeepseek‑chat。 - --glossary-files – 载入 CSV 术语列表,强制保持一致翻译。

这些选项非常适合需要速度、体积和一致性的生产流水线。

离线资产打包

若你在无网络环境下工作,BabelDOC 能生成自包含的资产包:

babeldoc --generate-offline-assets ./offline_assets

后续在另一台机器恢复:

babeldoc --restore-offline-assets ./offline_assets/package.zip

与 Zotero 集成

学术研究者经常在 Zotero 中管理 PDF。BabelDOC 支持通过以下方式直接集成: 1. Immersive Translate 插件(适用于 Immersive Translate Pro 会员)。 2. pdf2zh‑next 包装器(适用于自托管用户)。

这些插件会在下载时或你点击情境菜单项时自动翻译 PDF,并将译文版本添加至你的文献库。

自托管与 PDFMathTranslate

若你想完全掌控服务器栈,BabelDOC 可以嵌入至 PDFMathTranslate‑next。生成的应用包含 Web UI、批处理队列和 RESTful API。

路线图与社区

该项目持续维护,已发布 200 多个版本、6,000+ 星级。即将实现的里程碑包括: - 原生行支持 - 扩展表格处理 - Drop‑cap 支持 - 跨页段落合并 - 扫描 PDF 的 OCR 检测改进

欢迎通过 Pull Request 贡献。代码质量通过 pre‑commit 钩子、自动化测试与持续集成维持。

TL;DR

BabelDOC 能提供: - 一站式 AI PDF 翻译 - 完全控制输出格式 - CLI 与 Python API 自动化 - 离线资产支持(隔离网络) - 社区驱动开发与完善路线图

无论你是在翻译科研论文、技术手册还是商业合同,BabelDOC 都能在保持原始布局的同时,以 AI 速度完成本地化。今天就试试吧,改变你处理多语言 PDF 的方式。

原创文章: 查看原文

分享本文