Claude Autoresearch: IA que mejora el código para siempre

Descubre Claude Autoresearch, la habilidad de Claude Code inspirada en el autoresearch de Karpathy que convierte la IA en un motor de mejora implacable. Establece un objetivo y una métrica, luego observa cómo Claude itera de forma autónoma: revisar, cambiar, probar, hacer commit o revertir, repetir para siempre. Desde la caza de errores y auditorías de seguridad hasta flujos de trabajo de envío y razonamiento adversarial, 10 comandos potentes manejan código, contenido, marketing y más. Instala en segundos vía marketplace de plugins—no se necesita AGI, solo objetivos + métricas + bucles.

Claude Autoresearch: Convierte Claude Code en un motor de mejora implacable

"Establece el OBJETIVO → Claude ejecuta el BUCLE → Despiertas con resultados"

¿Y si tu IA pudiera mejorar de forma autónoma cualquier cosa medible —código, contenido, métricas, procesos— sin que tengas que supervisarla? Claude Autoresearch (3.1k ⭐) hace esto realidad usando la fórmula probada de Karpathy: restricción + métrica mecánica + iteración autónoma = ganancias compuestas.

De 630 líneas de Python al bucle universal de Claude

Karpathy demostró que un simple script de Python podía ejecutar 100 experimentos de ML durante la noche. Claude Autoresearch generaliza esto a CUALQUIER dominio:

  • Código: Cobertura de pruebas → 90%, tamaño del bundle → 50% más pequeño
  • Rendimiento: p95 de API → <100ms
  • Seguridad: Auditorías autónomas STRIDE + OWASP
  • Envío: Flujos de trabajo universales de PR/despliegue/contenido
  • Documentación: Generación/actualización/validación automática de documentación

El bucle autónomo de 8 fases

BUCLE (POR SIEMPRE):
1. Revisar historial de git + registro de resultados
2. Elegir UN cambio enfocado
3. Git commit (experimento: prefijo)
4. Ejecutar verificación mecánica
5. MEJORADO → mantener | PEOR → revertir
6. Registrar resultados TSV
7. Repetir

8 reglas críticas aseguran un progreso implacable:

  • Un cambio por iteración (atómico)
  • Solo verificación mecánica (sin subjetividad)
  • Revertir automáticamente fallos
  • Git como memoria
  • La simplicidad gana (menos código = mejor)

10 comandos probados en batalla

Comando Caso de uso
/autoresearch Bucle principal de optimización
/autoresearch:plan Objetivo → asistente de configuración
/autoresearch:security Auditoría de seguridad autónoma
/autoresearch:ship Envío de PRs/despliegues/contenido
/autoresearch:debug Caza de TODOS los errores científicamente
/autoresearch:fix Eliminar errores hasta que no quede ninguno
/autoresearch:scenario Explorar 12 dimensiones de casos límite
/autoresearch:predict Análisis en enjambre de 5 expertos
/autoresearch:learn Motor autónomo de documentación
/autoresearch:reason Refinamiento adversarial (v1.9.0)

Instalación en 30 segundos

Plugin (Recomendado):

/plugin marketplace add uditgoenka/autoresearch
/plugin install autoresearch@autoresearch

Primera ejecución:

/autoresearch
Objetivo: Aumentar cobertura de pruebas del 72% al 90%
Alcance: src/**/*.test.ts
Verificar: npm test -- --coverage | grep "All files"

Aléjate. Claude itera de forma autónoma. Cada mejora se acumula.

Poder en el mundo real: Cadenas de comandos

# Pipeline completo de calidad
/autoresearch:reason --chain predict,scenario,debug,fix

# Seguridad → Envío
/autoresearch:security --fix --chain ship

# Documentación después de cambios
/autoresearch:learn --mode update

Guardián: Protección contra regresiones

Objetivo: Reducir respuesta de API <100ms
Verificar: npm run bench:api | grep "p95"
Guardián: npm test  # Red de seguridad

Métricas mejoran + pruebas pasan = mantener. Cualquier cosa falla = rehacer.

Por qué funciona (La ciencia)

  1. Cambios atómicos → Causa/efecto clara
  2. Memoria de Git → Aprende de cada experimento
  3. Puertas mecánicas → Sin sesgo humano
  4. Iteración ilimitada → Ganancias compuestas
  5. Revertir automático → Nunca peor que el inicio

Dominios más allá del código

  • Marketing: CTR → 3x, tasa de conversión ↑
  • Ventas: Tasas de apertura de emails, tasas de respuesta
  • Contenido: Puntuaciones de engagement, legibilidad
  • RRHH: Métricas de cumplimiento de políticas
  • DevOps: Tasa de éxito de despliegues

Seguimiento de resultados TSV:

iteración	commit	métrica	delta	estado
0	a1b2c3d	85.2	0.0	baseline
1	b2c3d4e	87.1	+1.9	mantener
3	c3d4e5f	88.3	+1.2	mantener

🚀 Comienza hoy

Instala Claude Autoresearch y experimenta la mejora autónoma. No se necesita AGI—solo objetivos, métricas y bucles que nunca se detienen.

Creadores: Udit Goenka (Experto en productos de IA) + colaboradores. Licencia MIT. 127 commits. v1.9.0 lanzada en abril de 2026.