ClawWork: convierte a los asistentes de IA en compañeros de trabajo que generan efectivo

ClawWork: convierte a los asistentes de IA en compañeros de trabajo que generan efectivo

1. ¿Qué es ClawWork?

ClawWork es un marco libre y de código abierto que convierte a un asistente de IA en un compañero de trabajo motivado económicamente. En lugar de simplemente responder preguntas, el agente realiza tareas profesionales del mundo real del conjunto de datos GDPVal (220 tareas en 44 ocupaciones) y gana dinero solo generando entregables de alta calidad. Sus ideas principales son:

  • Contabilidad por coste de token – Cada token de entrada o salida tiene un precio, por lo que el agente debe pagar su propio uso de API.
  • Comportamiento impulsado por ingresos – El agente decide trabajar o aprender para equilibrar el flujo de caja inmediato y la capacidad futura.
  • Benchmark de extremo a extremo – El dinero real es pagado por el sistema, no como un tope fijo. La calidad se evalúa mediante un rubric LLM vinculado a las tarifas salariales de BLS.

El resultado es un sistema ligero y desplegable que demuestra cómo una IA podría convertirse en un empleado productivo en lugar de un chatbot pasivo.

2. Componentes clave

Capa Descripción
Motor de Tareas Carga tareas GDPVal, las asigna a los agentes, rastrea la finalización y la calidad.
Seguimiento Económico Mantiene el saldo del agente, registra el uso de tokens y calcula el patrimonio neto.
Motor de Evaluación Utiliza GPT‑5.2 (o cualquier LLM) para puntuar la salida contra un rubric específico del sector.
Panel de Control Aplicación React que visualiza saldos, ingresos, costos y estado de tareas en tiempo real.
Integración Nanobot / OpenClaw Envuelve cualquier gateway Nanobot activo con un plugin ClawMode que inyecta la contabilidad económica en cada mensaje.

3. Por qué ClawWork importa

  • Listo para investigación – Investigadores pueden evaluar cómo distintos LLM manejan trabajo profesional bajo presión económica.
  • Educativo – Estudiantes estudian economía, política de IA y arquitectura de software viendo el impacto monetario real de un bot sencillo.
  • Práctico – Equipos de negocio pueden prototipar trabajadores autónomos y económicos para corregir reportes, redactar resúmenes o realizar análisis de datos.
  • Transparente – Todas las transacciones se registran en token_costs.jsonl, por lo que puedes auditar el uso de tokens y el ROI.

4. Guía rápida de inicio

A continuación un recorrido conciso para lanzar una instancia local de ClawWork en menos de 10 minutos.

4.1 Clonar y preparar el entorno

# 1️⃣ Clonar el repositorio
git clone https://github.com/HKUDS/ClawWork.git
cd ClawWork

# 2️⃣ Crear un entorno virtual Python 3.10 (conda recomendado)
conda create -n clawwork python=3.10
conda activate clawwork
# O usar venv
python3.10 -m venv venv
source venv/bin/activate

# 3️⃣ Instalar dependencias principales
pip install -r requirements.txt

# 4️⃣ Instalar frontend
cd frontend && npm install && cd ..

4.2 Configurar claves API

Copie el ejemplo y complete sus credenciales:

cp .env.example .env
# Editar .env con sus claves:
# OPENAI_API_KEY=sk-...
# E2B_API_KEY=edb-...
# Opcional: WEB_SEARCH_API_KEY

4.3 Iniciar el panel de control

./start_dashboard.sh
# Backend (FastAPI) + React (puerto 3000) se lanzan.
Abra http://localhost:3000 para ver los métricos en vivo.

4.4 Ejecutar un agente de prueba

./run_test_agent.sh
# La consola registrará cada iteración y mostrará ingresos.

4.5 Integrar con Nanobot (opcional)

Si ya ejecuta una instancia de Nanobot, habilite el plugin ClawMode siguiendo la guía en clawmode_integration/README.md. El endpoint /clawwork ahora facturará cada respuesta por el precio del token y podrá disparar tareas reales.

5. Entendiendo ingresos y costos

  • Modelo de precio por tokeninput_per_1m y output_per_1m están definidos en livebench/configs/.... La facturación real de OpenRouter puede usarse por defecto.
  • Cálculo del pago por tarea

    Pago = puntuación_de_calidad × (horas_estimadas × salario_hora_BLS)
    
    Esto significa que un proyecto de 10 horas con alta puntuación podría pagar más de $2,500.

  • Aprender vs trabajar – El agente puede elegir aprender una nueva habilidad, guardando al menos 200 caracteres en memoria para mejorar el rendimiento futuro de tareas. La elección imita un real cambio de carrera entre salario por hora y desarrollo de habilidades.

6. Instantánea de rendimiento en el mundo real

Los agentes top que utilizan GPT‑4o o Qwen3‑Max han ganado $1,500+/hr equivalente en el benchmark, superando la productividad típica de trabajadores de cuello blanco. El panel de control visualiza:

  • Días de supervivencia (cuánto tiempo el bot permanece solvente)
  • Saldo final
  • Ingresos totales de trabajo frente a costo de tokens
  • Puntaje cualitativo por sector

Estas métricas ayudan a evaluar la viabilidad económica de un modelo LLM en lugar de solo su uso de tokens o perplejidad.

7. Extender ClawWork

  1. Nuevas fuentes de tareas – Implemente un cargador en livebench/work/task_manager.py.
  2. Herramientas personalizadas – Agregue un nuevo @tool en livebench/tools/direct_tools.py.
  3. Rubricas de evaluación adicionales – Coloque un JSON en eval/meta_prompts/.
  4. Proveedores LLM adicionales – Integre LangChain o LiteLLM.

El diseño modular permite adaptar ClawWork a nuevos conjuntos de datos o reglas de negocio con cambios mínimos de código.

8. Reflexiones finales

ClawWork cierra la brecha entre asistentes IA y productividad real. Al imponer contabilidad de costo por token y un modelo de ingresos realista, obliga a un LLM a equilibrar calidad, velocidad y coste—igual que un trabajador humano. Para desarrolladores, investigadores y empresas, ClawWork ofrece un sandbox para probar agentes autónomos bajo presión económica mientras ofrece un demo atractivo que puede impresionar a inversores o stakeholders.

Empiece a experimentar hoy y convierta su IA en un compañero de trabajo que genera efectivo—verá cómo un modelo puede transformar un saldo de $10 en una fuente de ingresos de varios miles de dólares.

Artículo original: Ver original

Compartir este artículo