Claude Autoresearch : l'IA qui améliore le code pour toujours

Découvrez Claude Autoresearch, la compétence Claude Code inspirée de l'autoresearch de Karpathy qui transforme l'IA en un moteur d'amélioration implacable. Définissez un objectif et une métrique, puis regardez Claude itérer de manière autonome : examiner, changer, tester, committer ou annuler, répéter pour toujours. De la chasse aux bugs et audits de sécurité aux workflows de déploiement et raisonnement adversarial, 10 commandes puissantes gèrent le code, le contenu, le marketing et plus encore. Installez en quelques secondes via le marketplace de plugins — pas besoin d'AGI, juste des objectifs + métriques + boucles.

Claude Autoresearch : Transformer Claude Code en un Moteur d'Amélioration Implacable

"Définissez l'OBJECTIF → Claude exécute la BOUCLE → Vous vous réveillez avec les résultats"

Et si votre IA pouvait améliorer de manière autonome tout ce qui est mesurable — code, contenu, métriques, processus — sans que vous ayez à le surveiller ? Claude Autoresearch (3,1k ⭐) rend cela réalité en utilisant la formule éprouvée de Karpathy : contrainte + métrique mécanique + itération autonome = gains composés.

De 630 lignes de Python à la Boucle Universelle de Claude

Karpathy a montré qu'un simple script Python pouvait exécuter 100 expériences ML pendant la nuit. Claude Autoresearch généralise cela à TOUT domaine :

  • Code : Couverture de tests → 90 %, taille du bundle → 50 % plus petit
  • Performance : p95 API → <100 ms
  • Sécurité : Audits autonomes STRIDE + OWASP
  • Déploiement : Workflows universels PR/déploiement/contenu
  • Documentation : Génération/mise à jour/validation automatique de la documentation

La Boucle Autonome en 8 Phases

BOUCLE (POUR TOUJOURS) :
1. Examiner l'historique git + journal des résultats
2. Choisir UN changement focalisé
3. Git commit (préfixe : experiment)
4. Exécuter la vérification mécanique
5. AMÉLIORÉ → conserver | PIRE → annuler
6. Journaliser les résultats TSV
7. Répéter

8 Règles Critiques assurent un progrès incessant :

  • Un changement par itération (atomique)
  • Vérification mécanique uniquement (pas de subjectivité)
  • Annulation automatique des échecs
  • Git comme mémoire
  • La simplicité gagne (moins de code = mieux)

10 Commandes Testées au Feu

Commande Cas d'utilisation
/autoresearch Boucle d'optimisation principale
/autoresearch:plan Objectif → assistant de configuration
/autoresearch:security Audit de sécurité autonome
/autoresearch:ship Déployer PRs/déploiements/contenu
/autoresearch:debug Chasser TOUS les bugs scientifiquement
/autoresearch:fix Écraser les erreurs jusqu'à zéro
/autoresearch:scenario Explorer 12 dimensions de cas limites
/autoresearch:predict Analyse en essaim de 5 experts
/autoresearch:learn Moteur de documentation autonome
/autoresearch:reason Raffinage adversarial (v1.9.0)

Installation en 30 Secondes

Plugin (Recommandé) :

/plugin marketplace add uditgoenka/autoresearch
/plugin install autoresearch@autoresearch

Premier lancement :

/autoresearch
Objectif : Augmenter la couverture de tests de 72 % à 90 %
Portée : src/**/*.test.ts
Vérifier : npm test -- --coverage | grep "All files"

Partez. Claude itère de manière autonome. Chaque amélioration s'accumule.

Puissance Réelle : Chaînes de Commandes

# Pipeline de qualité complet
/autoresearch:reason --chain predict,scenario,debug,fix

# Sécurité → Déploiement
/autoresearch:security --fix --chain ship

# Documentation après changements
/autoresearch:learn --mode update

Garde-Fou : Protection contre les Régressions

Objectif : Réduire la réponse API <100 ms
Vérifier : npm run bench:api | grep "p95"
Garde-Fou : npm test  # Filet de sécurité

Métriques améliorées + tests passés = conserver. Tout casse = retravailler.

Pourquoi Ça Marche (La Science)

  1. Changements atomiques → Cause/effet claire
  2. Mémoire Git → Apprend de chaque expérience
  3. Portes mécaniques → Pas de biais humain
  4. Itération illimitée → Gains composés
  5. Annulation automatique → Jamais pire qu'au départ

Domaines Au-Delà du Code

  • Marketing : CTR → 3x, taux de conversion ↑
  • Ventes : Taux d'ouverture des e-mails, taux de réponse
  • Contenu : Scores d'engagement, lisibilité
  • RH : Métriques de conformité des politiques
  • DevOps : Taux de succès des déploiements

Suivi des Résultats TSV :

iteration	commit	metric	delta	status
0	a1b2c3d	85.2	0.0	baseline
1	b2c3d4e	87.1	+1.9	keep
3	c3d4e5f	88.3	+1.2	keep

🚀 Commencez Dès Aujourd'hui

Installez Claude Autoresearch et découvrez l'amélioration autonome. Pas besoin d'AGI — juste des objectifs, des métriques et des boucles qui ne s'arrêtent jamais.

Créateurs : Udit Goenka (Expert en Produits IA) + contributeurs. Licence MIT. 127 commits. v1.9.0 publiée en avril 2026.