Humanize-Text:开源AI文本人性化工具,绕过GPTZero和Turnitin检测
探索Humanize-Text,一款免费开源工具包,通过多步骤翻译链和LLM重写,将AI生成内容转化为无法检测、类人化的写作风格。
什么是Humanize-Text?
Humanize-Text 是一个开源 Python 工具包,旨在将 AI 生成的文本转化为自然、类人化的写作风格,从而绕过 Turnitin、GPTZero 等主流 AI 检测器。该项目由 Lynote AI 开发,提供了一个生产级流水线,结合了 LLM 重写与多引擎翻译,在保留原始含义和风格的同时,打破 AI 统计特征。
该仓库经历了两个主要版本迭代:
- v1.0 — 记录了四种人性化方法作为参考实现:翻译链、多轮 LLM 重写、检测引导反馈循环、混合引擎翻译。
- v1.5(当前) — 引入了标准流水线,这是方法1(翻译链)和方法2(LLM 重写)的生产级集成,固定为5步链,推荐用于实际使用。
标准流水线的工作原理
标准流水线将文本路由至一个4步链:
- DeepSeek(温度1.3) — 输入 → 中文(中文重写)
- DeepSeek(温度1.3) — 中文 → 日语(日语重写)
- Google 翻译 — 日语 → 芬兰语(第一次翻译跳转)
- Niutrans — 芬兰语 → 英语(第二次翻译跳转)
此链利用了两个关键策略:
- LLM 重写(步骤1-2): DeepSeek 在温度1.3下边翻译边重写,通过创造性变化打破 AI 统计特征。步骤2将步骤1作为对话历史,以实现连贯的人性化。
- 多引擎翻译(步骤3-4): 两个不同的 NMT 引擎(Google → Niutrans)引入复合结构变化。单一引擎的特征无法留存。
- 远距离语言: 中文 → 日语 → 芬兰语在每个跳转中最大化语言距离,确保在重构为英语之前进行彻底重组。
质量指标
基于50个文本对及专家评估的测试结果:
| 维度 | 得分(满分10分) |
|---|---|
| 信息完整性 | 10.0 |
| 语言流畅度 | 9.0 |
| 风格适应性 | 8.8 |
| 可读性 | 9.2 |
| 创意与影响力 | 8.5 |
| 总体 | 9.1 |
关键信息保留率:100%(50/50对)——所有文本均保留了原始关键信息,未发生扭曲。
展示结果
该流水线在5个真实输入文本上进行了测试,所有最终输出均被 AI 检测器归类为人类写作:
| # | 主题 | 检测结果 | 置信度 |
|---|---|---|---|
| 01 | 量子计算 | 人类 | 0.9997 |
| 02 | 量子就绪策略 | 人类 | 0.9982 |
| 03 | 可持续供应链 | 人类 | 0.7810 |
| 04 | 金融素养 | 人类 | 0.9924 |
| 05 | 科学同行评审 | 人类 | 0.7218 |
每个示例展示了完整轨迹:原始输入 → 步骤1(中文改写) → 步骤2(日语改写) → 步骤3(一轮翻译) → 步骤4(二轮翻译,最终)。完整轨迹请参见 examples/showcase/。
快速开始
Python 脚本
git clone https://github.com/lynote-ai/humanize-text.git
cd humanize-text
pip install -r requirements.txt
cp config/config.example.toml config/config.toml
# 在 config.toml 中填写你的 API 密钥
python -m src.standard.pipeline --input "你的 AI 生成文本"
n8n 工作流
将 n8n/humanize_standard.json 导入你的 n8n 实例,在 HTTP 请求节点中配置 DeepSeek API 密钥,然后运行。
Lynote.ai(无需设置)
访问 lynote.ai 获得零设置体验,该平台结合了所有三个层级(标准、高级、专注),并自动为每个文本段落选择最佳方法。
与其他层级的比较
| 特性 | 标准(本仓库) | Lynote.ai |
|---|---|---|
| 可用层级 | 仅标准 | 标准 + 高级 + 专注 |
| 层级选择 | 手动 | 自动按段落选择 |
| 风格保留 | 最佳 | 自适应——每个段落尽可能最佳 |
| 设置 | Python + API 密钥 | 零设置 |
| 最适合 | 对风格敏感的内容 | 任何内容类型 |
仓库结构
src/
├── standard/ # ★ v1.5.1 生产级标准流水线(推荐)
│ ├── pipeline.py # 4步链,CLI入口
│ ├── llm_rewriter.py # DeepSeek 人性化重写
│ └── translators.py # Google + Niutrans 引擎
│
└── methodologies/ # v1.0 四种方法参考实现
├── humanizer.py # v1.0 调度器 + FastAPI 应用
├── translation_chain.py # 方法1
├── llm_rewriter.py # 方法2
├── detection_pipeline.py # 方法3
├── mixed_engine.py # 方法4
├── postprocess.py
├── detectors/ # 方法3检测器
└── utils/
examples/
├── example_usage.py # ★ v1.5.1 最小入口
├── showcase/ # ★ 5个真实样本,含中间步骤输出
└── legacy/ # v1.0 示例 + 4种方法比较输出
为何重要
随着 AI 生成内容变得无处不在,人性化文本的能力对于在学术、专业和创意环境中保持真实性并避免检测至关重要。Humanize-Text 提供了一个透明、可定制且有效的解决方案,开发者可以将其集成到工作流中,或作为构建自己人性化流水线的参考。
许可证
MIT 许可证。详情请参见 LICENSE。