Humanize-Text: GPTZeroやTurnitinを回避するオープンソースAIテキストヒューマナイザー
Humanize-Textは、多段階翻訳チェーンとLLM書き換えを用いて、AI生成コンテンツを検出不可能な人間らしい文章に書き換える無料のオープンソースツールキットです。
Humanize-Textとは?
Humanize-Textは、AI生成テキストを自然で人間らしい文章に変換し、Turnitin、GPTZeroなどの主要なAI検出器を回避するために設計されたオープンソースのPythonツールキットです。Lynote AIによって開発されたこのプロジェクトは、LLM書き換えとマルチエンジン翻訳を組み合わせて、元の意味とスタイルを保持しながらAIの統計的指紋を破壊するプロダクショングレードのパイプラインを提供します。
リポジトリは2つのメジャーバージョンを経て進化しています:
- v1.0 — 4つのヒューマナイゼーション手法をリファレンス実装として文書化:翻訳チェーン、マルチターンLLM書き換え、検出ガイド付きフィードバックループ、混合エンジン翻訳。
- v1.5(現在) — 手法1(翻訳チェーン)と手法2(LLM書き換え)を統合したプロダクショングレードの標準パイプラインを導入。実際の使用に推奨される5ステップチェーンとして固定。
標準パイプラインの仕組み
標準パイプラインは、テキストを4ステップのチェーンで処理します:
- DeepSeek(temp 1.3) — 入力 → 中国語(中国語書き換え)
- DeepSeek(temp 1.3) — 中国語 → 日本語(日本語書き換え)
- Google翻訳 — 日本語 → フィンランド語(最初の翻訳ホップ)
- Niutrans — フィンランド語 → 英語(2番目の翻訳ホップ)
このチェーンは2つの主要な戦略を活用しています:
- LLM書き換え(ステップ1〜2): 温度1.3のDeepSeekが翻訳しながら書き換え、創造的なバリエーションでAIの統計的指紋を破壊します。ステップ2はステップ1を会話履歴として保持し、一貫性のあるヒューマナイゼーションを実現します。
- マルチエンジン翻訳(ステップ3〜4): 2つの異なるNMTエンジン(Google → Niutrans)が複合的な構造変化を導入します。単一エンジンの指紋は残りません。
- 遠隔言語: 中国語 → 日本語 → フィンランド語は、各ホップで言語的距離を最大化し、英語への再構築前に徹底的な再構築を保証します。
品質指標
50組のテキストペアを専門家評価でテスト:
| 次元 | スコア(10点満点) |
|---|---|
| 情報完全性 | 10.0 |
| 言語流暢性 | 9.0 |
| スタイル適応性 | 8.8 |
| 読みやすさ | 9.2 |
| 創造性とインパクト | 8.5 |
| 全体 | 9.1 |
主要情報保持率:100%(50/50ペーム) — すべてのテキストが元の主要情報を歪みなく保持。
ショーケース結果
パイプラインは5つの実際の入力テキストでテストされ、すべての最終出力はAI検出器によって人間と分類されました:
| # | トピック | 検出結果 | 信頼度 |
|---|---|---|---|
| 01 | 量子コンピューティング | human | 0.9997 |
| 02 | 量子準備戦略 | human | 0.9982 |
| 03 | 持続可能なサプライチェーン | human | 0.7810 |
| 04 | 金融リテラシー | human | 0.9924 |
| 05 | 科学におけるピアレビュー | human | 0.7218 |
各例では、元の入力 → ステップ1(中文改写) → ステップ2(日语改写) → ステップ3(一轮翻译) → ステップ4(二轮翻译、最終)の完全なトレースが表示されます。完全なトレースは examples/showcase/ を参照してください。
クイックスタート
Pythonスクリプト
git clone https://github.com/lynote-ai/humanize-text.git
cd humanize-text
pip install -r requirements.txt
cp config/config.example.toml config/config.toml
# config.tomlにAPIキーを入力
python -m src.standard.pipeline --input "AI生成テキストをここに入力"
n8nワークフロー
n8n/humanize_standard.json をn8nインスタンスにインポートし、HTTPリクエストノードでDeepSeek APIキーを設定して実行します。
Lynote.ai(セットアップ不要)
lynote.ai にアクセスすると、3つのティア(Standard、Advanced、Focus)を組み合わせ、各テキストパッセージに最適なアプローチを自動選択するゼロセットアップ体験が得られます。
他のティアとの比較
| 機能 | 標準(このリポジトリ) | Lynote.ai |
|---|---|---|
| 利用可能なティア | 標準のみ | 標準 + アドバンスト + フォーカス |
| ティア選択 | 手動 | パッセージごとに自動 |
| スタイル保持 | 最良 | 適応型 — パッセージごとに最良 |
| セットアップ | Python + APIキー | ゼロセットアップ |
| 最適な用途 | スタイルに敏感なコンテンツ | あらゆるコンテンツタイプ |
リポジトリ構造
src/
├── standard/ # ★ v1.5.1 プロダクション標準パイプライン(推奨)
│ ├── pipeline.py # 4ステップチェーン、CLIエントリ
│ ├── llm_rewriter.py # DeepSeekヒューマナイゼーション書き換え
│ └── translators.py # Google + Niutransエンジン
│
└── methodologies/ # v1.0 4手法リファレンス実装
├── humanizer.py # v1.0ディスパッチャー + FastAPIアプリ
├── translation_chain.py # 手法1
├── llm_rewriter.py # 手法2
├── detection_pipeline.py # 手法3
├── mixed_engine.py # 手法4
├── postprocess.py
├── detectors/ # 手法3検出器
└── utils/
examples/
├── example_usage.py # ★ v1.5.1 最小エントリ
├── showcase/ # ★ 中間ステップ出力を含む5つの実サンプル
└── legacy/ # v1.0例 + 4手法比較出力
これが重要な理由
AI生成コンテンツが普及するにつれて、テキストを人間らしくする能力は、学術、専門、創造的な文脈で信頼性を維持し、検出を回避するために重要です。Humanize-Textは、透明性があり、カスタマイズ可能で効果的なソリューションを提供し、開発者がワークフローに統合したり、独自のヒューマナイゼーションパイプラインを構築するためのリファレンスとして使用できます。
ライセンス
MITライセンス。詳細は LICENSE を参照してください。