ClawWork : transformer les assistants IA en collègues générateurs de revenus
ClawWork : transformer les assistants IA en collègues générateurs de revenus
1. Qu’est‑ce que ClawWork ?
ClawWork est un cadre gratuit et open-source qui transforme un assistant IA en un collègue économiquement motivé. Au lieu de simplement répondre aux questions, l’agent exécute des tâches professionnelles concrètes issues du jeu de données GDPVal (220 tâches réparties sur 44 professions) et ne gagne de l’argent qu’en produisant des livrables de haute qualité. Ses idées de base sont :
- Comptabilité des coûts par token – Chaque token d’entrée ou de sortie est tarifé, l’agent doit donc payer son propre usage de l’API.
- Comportement basé sur les revenus – L’agent décide de travailler ou d’apprendre pour équilibrer le flux de trésorerie immédiat et la capacité future.
- Benchmark de bout en bout – L’argent réel est versé par le système, pas un plafond fixe. La qualité est évaluée grâce à une grille d’évaluation LLM liée aux taux de salaire du BLS.
Le résultat est un système léger et déployable qui montre comment une IA peut devenir un employé productif plutôt qu’un chatbot passif.
2. Composants clés
| Couche | Description |
|---|---|
| Task Engine | Charge les tâches GDPVal, les attribue aux agents, suit la complétion et la qualité. |
| Economic Tracker | Maintient le solde de l’agent, enregistre l’usage des tokens, et calcule la valeur nette. |
| Evaluation Engine | Utilise GPT‑5.2 (ou tout LLM) pour évaluer les sorties selon une grille sectorielle. |
| Dashboard | Application React qui visualise le solde, le revenu, le coût et le statut des tâches en temps réel. |
| Nanobot / OpenClaw Integration | Enveloppe tout passerelle Nanobot vivante avec un plugin ClawMode qui injecte la comptabilité économique dans chaque message. |
3. Pourquoi ClawWork est important
- Prêt pour la recherche – Les chercheurs peuvent évaluer la manière dont différents LLM gèrent le travail professionnel sous pression économique.
- Éducatif – Les étudiants étudient l’économie, la politique IA et l’architecture logicielle en voyant l’impact réel d’un simple bot.
- Pratique – Les équipes commerciales peuvent prototyper des travailleurs autonomes peu coûteux pour relire des rapports, rédiger des briefs ou effectuer des analyses de données.
- Transparent – Toutes les transactions sont enregistrées dans
token_costs.jsonl, vous permettant d’auditer l’usage des tokens et le ROI.
4. Guide rapide
Voici un guide succinct pour lancer une instance locale de ClawWork en moins de 10 minutes.
4.1 Cloner et préparer l’environnement
# 1️⃣ Cloner le dépôt
git clone https://github.com/HKUDS/ClawWork.git
cd ClawWork
# 2️⃣ Créer un environnement virtuel Python 3.10 (conda recommandé)
conda create -n clawwork python=3.10
conda activate clawwork
# OU utiliser venv
python3.10 -m venv venv
source venv/bin/activate
# 3️⃣ Installer les dépendances principales
pip install -r requirements.txt
# 4️⃣ Installer le frontend
cd frontend && npm install && cd ..
4.2 Configurer les clés API
cp .env.example .env
# Modifier .env avec vos clés:
# OPENAI_API_KEY=sk-...
# E2B_API_KEY=edb-...
# Optionnel: WEB_SEARCH_API_KEY
4.3 Lancer le tableau de bord
./start_dashboard.sh
# Le backend (FastAPI) + React (port 3000) sont lancés.
4.4 Exécuter un agent test
./run_test_agent.sh
# La console enregistrera chaque itération et affichera les gains.
4.5 Intégrer Nanobot (optionnel)
Si vous exécutez déjà une instance Nanobot, activez le plugin ClawMode en suivant le guide dans clawmode_integration/README.md. Le point de terminaison /clawwork facturera désormais chaque réponse par prix de token et pourra déclencher des tâches réelles.
5. Comprendre les gains et les coûts
- Modèle de prix par token –
input_per_1metoutput_per_1msont définis danslivebench/configs/.... Le prix réel d'OpenRouter peut être utilisé par défaut. -
Calcul du paiement de la tâche
Cela signifie qu’un projet de 10 heures à haute note pourrait payer plus de 2 500 $.Payment = quality_score × (estimated_hours × BLS_hourly_wage) -
Apprentissage vs Travail – L’agent peut choisir d’« apprendre » une nouvelle compétence, stockant au moins 200 caractères en mémoire pour améliorer les performances futures. Le choix imite un véritable compromis de carrière entre salaire horaire et développement des compétences.
6. Snapshot de performance réelle
Les agents de pointe utilisant GPT‑4o ou Qwen3‑Max ont gagné plus de 1 500 $/h équivalent selon le benchmark, dépassant la productivité typique des travailleurs blancs-collier. Le tableau de bord visualise :
- Jours de survie (combien de temps le bot reste solvable)
- Solde final
- Revenu total du travail vs. coût des tokens
- Évaluation qualitative par secteur
Ces métriques vous aident à évaluer la viabilité économique d’un modèle LLM plutôt que seul l’usage de tokens ou la perplexité.
7. Étendre ClawWork
- Nouvelles sources de tâches – Implémentez un chargeur dans
livebench/work/task_manager.py. - Outils personnalisés – Ajoutez un nouveau
@tooldanslivebench/tools/direct_tools.py. - Grilles d’évaluation supplémentaires – Ajoutez un fichier JSON dans
eval/meta_prompts/. - Autres fournisseurs de LLM – Intégrez LangChain ou des backends LiteLLM.
La conception modulaire vous permet d’adapter ClawWork à de nouveaux jeux de données ou règles commerciales avec un minimum de modifications de code.
8. Dernières réflexions
ClawWork comble le fossé entre les assistants IA et la productivité réelle. En imposant une comptabilité des coûts par token et un modèle de gains réaliste, il oblige un LLM à équilibrer qualité, vitesse et coût — à l’instar d’un travailleur humain. Pour les développeurs, chercheurs et entreprises, ClawWork offre un environnement d’essai pour tester des agents IA autonomes sous pression économique tout en offrant une démonstration attrayante capable d’impressionner investisseurs ou parties prenantes.
Commencez à expérimenter dès aujourd’hui et transformez votre IA en collègue générateur de revenus—vous verrez à quelle vitesse un modèle peut convertir un solde de 10 $ en un flux de revenus de plusieurs milliers de dollars.