ClawWork : transformer les assistants IA en collègues générateurs de revenus

February 20, 2026

Catégorie: Projets Open Source Pratiques

Étiquettes:

Open Source AI coworker Economic AI Nanobot integration AI benchmark

ClawWork : transformer les assistants IA en collègues générateurs de revenus

1. Qu’est‑ce que ClawWork ?

ClawWork est un cadre gratuit et open-source qui transforme un assistant IA en un collègue économiquement motivé. Au lieu de simplement répondre aux questions, l’agent exécute des tâches professionnelles concrètes issues du jeu de données GDPVal (220 tâches réparties sur 44 professions) et ne gagne de l’argent qu’en produisant des livrables de haute qualité. Ses idées de base sont :

Comptabilité des coûts par token – Chaque token d’entrée ou de sortie est tarifé, l’agent doit donc payer son propre usage de l’API.
Comportement basé sur les revenus – L’agent décide de travailler ou d’apprendre pour équilibrer le flux de trésorerie immédiat et la capacité future.
Benchmark de bout en bout – L’argent réel est versé par le système, pas un plafond fixe. La qualité est évaluée grâce à une grille d’évaluation LLM liée aux taux de salaire du BLS.

Le résultat est un système léger et déployable qui montre comment une IA peut devenir un employé productif plutôt qu’un chatbot passif.

2. Composants clés

Couche	Description
Task Engine	Charge les tâches GDPVal, les attribue aux agents, suit la complétion et la qualité.
Economic Tracker	Maintient le solde de l’agent, enregistre l’usage des tokens, et calcule la valeur nette.
Evaluation Engine	Utilise GPT‑5.2 (ou tout LLM) pour évaluer les sorties selon une grille sectorielle.
Dashboard	Application React qui visualise le solde, le revenu, le coût et le statut des tâches en temps réel.
Nanobot / OpenClaw Integration	Enveloppe tout passerelle Nanobot vivante avec un plugin `ClawMode` qui injecte la comptabilité économique dans chaque message.

3. Pourquoi ClawWork est important

Prêt pour la recherche – Les chercheurs peuvent évaluer la manière dont différents LLM gèrent le travail professionnel sous pression économique.
Éducatif – Les étudiants étudient l’économie, la politique IA et l’architecture logicielle en voyant l’impact réel d’un simple bot.
Pratique – Les équipes commerciales peuvent prototyper des travailleurs autonomes peu coûteux pour relire des rapports, rédiger des briefs ou effectuer des analyses de données.
Transparent – Toutes les transactions sont enregistrées dans token_costs.jsonl, vous permettant d’auditer l’usage des tokens et le ROI.

4. Guide rapide

Voici un guide succinct pour lancer une instance locale de ClawWork en moins de 10 minutes.

4.1 Cloner et préparer l’environnement

# 1️⃣ Cloner le dépôt
git clone https://github.com/HKUDS/ClawWork.git
cd ClawWork

# 2️⃣ Créer un environnement virtuel Python 3.10 (conda recommandé)
conda create -n clawwork python=3.10
conda activate clawwork
# OU utiliser venv
python3.10 -m venv venv
source venv/bin/activate

# 3️⃣ Installer les dépendances principales
pip install -r requirements.txt

# 4️⃣ Installer le frontend
cd frontend && npm install && cd ..

4.2 Configurer les clés API

cp .env.example .env
# Modifier .env avec vos clés:
# OPENAI_API_KEY=sk-...
# E2B_API_KEY=edb-...
# Optionnel: WEB_SEARCH_API_KEY

4.3 Lancer le tableau de bord

./start_dashboard.sh
# Le backend (FastAPI) + React (port 3000) sont lancés.

Ouvrez http://localhost:3000 pour voir les métriques en direct.

4.4 Exécuter un agent test

./run_test_agent.sh
# La console enregistrera chaque itération et affichera les gains.

4.5 Intégrer Nanobot (optionnel)

Si vous exécutez déjà une instance Nanobot, activez le plugin ClawMode en suivant le guide dans clawmode_integration/README.md. Le point de terminaison /clawwork facturera désormais chaque réponse par prix de token et pourra déclencher des tâches réelles.

5. Comprendre les gains et les coûts

Modèle de prix par token – input_per_1m et output_per_1m sont définis dans livebench/configs/.... Le prix réel d'OpenRouter peut être utilisé par défaut.
Calcul du paiement de la tâche
```
Payment = quality_score × (estimated_hours × BLS_hourly_wage)
```
Cela signifie qu’un projet de 10 heures à haute note pourrait payer plus de 2 500 $.
Apprentissage vs Travail – L’agent peut choisir d’« apprendre » une nouvelle compétence, stockant au moins 200 caractères en mémoire pour améliorer les performances futures. Le choix imite un véritable compromis de carrière entre salaire horaire et développement des compétences.

6. Snapshot de performance réelle

Les agents de pointe utilisant GPT‑4o ou Qwen3‑Max ont gagné plus de 1 500 $/h équivalent selon le benchmark, dépassant la productivité typique des travailleurs blancs-collier. Le tableau de bord visualise :

Jours de survie (combien de temps le bot reste solvable)
Solde final
Revenu total du travail vs. coût des tokens
Évaluation qualitative par secteur

Ces métriques vous aident à évaluer la viabilité économique d’un modèle LLM plutôt que seul l’usage de tokens ou la perplexité.

7. Étendre ClawWork

Nouvelles sources de tâches – Implémentez un chargeur dans livebench/work/task_manager.py.
Outils personnalisés – Ajoutez un nouveau @tool dans livebench/tools/direct_tools.py.
Grilles d’évaluation supplémentaires – Ajoutez un fichier JSON dans eval/meta_prompts/.
Autres fournisseurs de LLM – Intégrez LangChain ou des backends LiteLLM.

La conception modulaire vous permet d’adapter ClawWork à de nouveaux jeux de données ou règles commerciales avec un minimum de modifications de code.

8. Dernières réflexions

ClawWork comble le fossé entre les assistants IA et la productivité réelle. En imposant une comptabilité des coûts par token et un modèle de gains réaliste, il oblige un LLM à équilibrer qualité, vitesse et coût — à l’instar d’un travailleur humain. Pour les développeurs, chercheurs et entreprises, ClawWork offre un environnement d’essai pour tester des agents IA autonomes sous pression économique tout en offrant une démonstration attrayante capable d’impressionner investisseurs ou parties prenantes.

Commencez à expérimenter dès aujourd’hui et transformez votre IA en collègue générateur de revenus—vous verrez à quelle vitesse un modèle peut convertir un solde de 10 $ en un flux de revenus de plusieurs milliers de dollars.

Article original: Voir l'original

Partager cet article