ClawWork:AIアシスタントを現金を生み出す同僚に変える

ClawWork:AIアシスタントを現金生成型同僚に変える

1. ClawWork とは?

ClawWorkは、AIアシスタントを 経済的に動機付けられた同僚 に変える 無料でオープンソースのフレームワーク です。単に質問に答えるだけではなく、エージェントは GDPVal データセット(44職種にわたる220件のタスク)から 実務的なプロフェッショナルタスク を完了し、高品質な成果物のみを作成して報酬を得ます。そのコアとなるアイデアは次のとおりです:

  • トークンコスト計算 – 入力・出力トークンはすべて価格が設定されるため、エージェントは自身のAPI使用料を支払う必要があります。
  • 収入駆動型行動 – エージェントは即時の現金フローと将来の能力をバランスさせるために 働く学習する かを決定します。
  • エンドツーエンドベンチマーク – 現金はシステム側が実際に支払います(固定上限はありません)。品質はBLS(米国労働統計局)の賃金レートに連動したLLM評価ルーブリックで評価されます。

その結果、軽量でデプロイ可能なシステムが実現し、AIが受動的なチャットボットではなく 生産的な従業員 になる方法を示します。

2. Core Components

レイヤー 説明
タスクエンジン GDPVal タスクを読み込み、エージェントに割り当て、完了状況と品質を追跡します。
経済トラッカー エージェントの残高を管理し、トークン使用量を記録し、純資産を計算します。
評価エンジン GPT‑5.2(または任意のLLM)を使用して、出力を業界別ルーブリックに対してスコア付けします。
ダッシュボード React アプリで、残高・収入・コスト・タスク状況をリアルタイムで可視化します。
Nanobot / OpenClaw 統合 任意の既存 Nanobot ゲートウェイを ClawMode プラグインでラップし、すべてのメッセージに経済会計を注入します。

3. Why ClawWork Matters

  • 研究対応 – 研究者は異なるLLMが経済的圧力下でプロフェッショナル作業をどのようにこなすかを評価できます。
  • 教育的価値 – 学生は単純なボットの実際の金銭的影響を見ることで、経済学、AI政策、ソフトウェアアーキテクチャを学べます。
  • 実践的 – ビジネスチームは低コストで自律的なワーカーをプロトタイプし、レポートの校正、ブリーフ作成、データ分析を行えます。
  • 透明性 – すべての取引は token_costs.jsonl に記録されるため、トークン使用量とROIを監査できます。

4. Quick Start Guide

Below is a concise walkthrough so you can spin up a local ClawWork instance in under 10 minutes.

4.1 Clone & Prepare the Environment

# 1️⃣ Clone the repo
git clone https://github.com/HKUDS/ClawWork.git
cd ClawWork

# 2️⃣ Create a Python 3.10 virtual environment (conda recommended)
conda create -n clawwork python=3.10
conda activate clawwork
# OR use venv
python3.10 -m venv venv
source venv/bin/activate

# 3️⃣ Install core dependencies
pip install -r requirements.txt

# 4️⃣ Install the frontend
cd frontend && npm install && cd ..

4.2 Configure API Keys

Copy the example and fill in your credentials:

cp .env.example .env
# Edit .env with your keys:
# OPENAI_API_KEY=sk-...
# E2B_API_KEY=edb-...
# Optional: WEB_SEARCH_API_KEY

4.3 Start the Dashboard

./start_dashboard.sh
# Backend (FastAPI) + React (port 3000) are launched.
Open http://localhost:3000 to see the live metrics.

4.4 Run a Test Agent

./run_test_agent.sh
# The console will log each iteration and show earnings.

4.5 Integrate with Nanobot (Optional)

If you already run a Nanobot instance, enable the ClawMode plugin by following the guide in clawmode_integration/README.md. The endpoint /clawwork will now bill each reply by token price and can trigger real tasks.

5. Understanding Earnings and Costs

  • トークン価格モデルinput_per_1m および output_per_1mlivebench/configs/... に定義されています。OpenRouter の実際の価格をデフォルトで使用できます。
  • タスク支払い計算
    Payment = quality_score × (estimated_hours × BLS_hourly_wage)
    
    This means a high‑scoring 10‑hour project could pay $2,500+.
  • 学習 vs 働く – エージェントは「学習」を選択し、少なくとも200文字をメモリに保存して将来のタスクパフォーマンスを向上させます。この選択は、時給とスキル開発のリアルなキャリアトレードオフを模倣します。

6. Real‑World Performance Snapshot

Top agents using GPT‑4o or Qwen3‑Max have earned $1,500+/hr equivalent in the benchmark, outpacing typical human white‑collar productivity. The dashboard visualizes:

  • 生存日数(ボットがどれだけ長く運営できるか)
  • 最終残高
  • 総作業収入とトークンコストの比較
  • 業界横断的な定性的評価

These metrics help you evaluate an LLM model’s economic viability rather than just token usage or perplexity.

7. Extending ClawWork

  1. 新しいタスクソースlivebench/work/task_manager.py にローダーを実装します。
  2. カスタムツールlivebench/tools/direct_tools.py に新しい @tool を追加します。
  3. 追加評価ルーブリックeval/meta_prompts/ に JSON を投入します。
  4. その他のLLMプロバイダー – LangChainやLiteLLMバックエンドを組み込みます。

The modular design means you can adapt ClawWork to new datasets or business rules with minimal code changes.

8. Final Thoughts

ClawWorkは、AIアシスタントと実際の生産性とのギャップを埋めます。トークンコスト会計と現実的な収益モデルを課せることで、LLMが人間の労働者と同様に品質・速度・コストをバランスさせるよう促します。開発者、研究者、ビジネスにとって、ClawWorkは経済的圧力下で自律型AIエージェントをテストするサンドボックスを提供し、投資家やステークホルダーを感動させる魅力的なデモを提供します。

今日から実験を始め、AIを 現金生成型同僚 に変えてください――$10 の残高を数千ドルの収益に変える速度を体感できます。

この記事を共有