Claude Autoresearch : l'IA qui améliore le code pour toujours
Découvrez Claude Autoresearch, la compétence Claude Code inspirée de l'autoresearch de Karpathy qui transforme l'IA en un moteur d'amélioration implacable. Définissez un objectif et une métrique, puis regardez Claude itérer de manière autonome : examiner, changer, tester, committer ou annuler, répéter pour toujours. De la chasse aux bugs et audits de sécurité aux workflows de déploiement et raisonnement adversarial, 10 commandes puissantes gèrent le code, le contenu, le marketing et plus encore. Installez en quelques secondes via le marketplace de plugins — pas besoin d'AGI, juste des objectifs + métriques + boucles.
Claude Autoresearch : Transformer Claude Code en un Moteur d'Amélioration Implacable
"Définissez l'OBJECTIF → Claude exécute la BOUCLE → Vous vous réveillez avec les résultats"
Et si votre IA pouvait améliorer de manière autonome tout ce qui est mesurable — code, contenu, métriques, processus — sans que vous ayez à le surveiller ? Claude Autoresearch (3,1k ⭐) rend cela réalité en utilisant la formule éprouvée de Karpathy : contrainte + métrique mécanique + itération autonome = gains composés.
De 630 lignes de Python à la Boucle Universelle de Claude
Karpathy a montré qu'un simple script Python pouvait exécuter 100 expériences ML pendant la nuit. Claude Autoresearch généralise cela à TOUT domaine :
- Code : Couverture de tests → 90 %, taille du bundle → 50 % plus petit
- Performance : p95 API → <100 ms
- Sécurité : Audits autonomes STRIDE + OWASP
- Déploiement : Workflows universels PR/déploiement/contenu
- Documentation : Génération/mise à jour/validation automatique de la documentation
La Boucle Autonome en 8 Phases
BOUCLE (POUR TOUJOURS) :
1. Examiner l'historique git + journal des résultats
2. Choisir UN changement focalisé
3. Git commit (préfixe : experiment)
4. Exécuter la vérification mécanique
5. AMÉLIORÉ → conserver | PIRE → annuler
6. Journaliser les résultats TSV
7. Répéter
8 Règles Critiques assurent un progrès incessant :
- Un changement par itération (atomique)
- Vérification mécanique uniquement (pas de subjectivité)
- Annulation automatique des échecs
- Git comme mémoire
- La simplicité gagne (moins de code = mieux)
10 Commandes Testées au Feu
| Commande | Cas d'utilisation |
|---|---|
/autoresearch |
Boucle d'optimisation principale |
/autoresearch:plan |
Objectif → assistant de configuration |
/autoresearch:security |
Audit de sécurité autonome |
/autoresearch:ship |
Déployer PRs/déploiements/contenu |
/autoresearch:debug |
Chasser TOUS les bugs scientifiquement |
/autoresearch:fix |
Écraser les erreurs jusqu'à zéro |
/autoresearch:scenario |
Explorer 12 dimensions de cas limites |
/autoresearch:predict |
Analyse en essaim de 5 experts |
/autoresearch:learn |
Moteur de documentation autonome |
/autoresearch:reason |
Raffinage adversarial (v1.9.0) |
Installation en 30 Secondes
Plugin (Recommandé) :
/plugin marketplace add uditgoenka/autoresearch
/plugin install autoresearch@autoresearch
Premier lancement :
/autoresearch
Objectif : Augmenter la couverture de tests de 72 % à 90 %
Portée : src/**/*.test.ts
Vérifier : npm test -- --coverage | grep "All files"
Partez. Claude itère de manière autonome. Chaque amélioration s'accumule.
Puissance Réelle : Chaînes de Commandes
# Pipeline de qualité complet
/autoresearch:reason --chain predict,scenario,debug,fix
# Sécurité → Déploiement
/autoresearch:security --fix --chain ship
# Documentation après changements
/autoresearch:learn --mode update
Garde-Fou : Protection contre les Régressions
Objectif : Réduire la réponse API <100 ms
Vérifier : npm run bench:api | grep "p95"
Garde-Fou : npm test # Filet de sécurité
Métriques améliorées + tests passés = conserver. Tout casse = retravailler.
Pourquoi Ça Marche (La Science)
- Changements atomiques → Cause/effet claire
- Mémoire Git → Apprend de chaque expérience
- Portes mécaniques → Pas de biais humain
- Itération illimitée → Gains composés
- Annulation automatique → Jamais pire qu'au départ
Domaines Au-Delà du Code
- Marketing : CTR → 3x, taux de conversion ↑
- Ventes : Taux d'ouverture des e-mails, taux de réponse
- Contenu : Scores d'engagement, lisibilité
- RH : Métriques de conformité des politiques
- DevOps : Taux de succès des déploiements
Suivi des Résultats TSV :
iteration commit metric delta status
0 a1b2c3d 85.2 0.0 baseline
1 b2c3d4e 87.1 +1.9 keep
3 c3d4e5f 88.3 +1.2 keep
🚀 Commencez Dès Aujourd'hui
Installez Claude Autoresearch et découvrez l'amélioration autonome. Pas besoin d'AGI — juste des objectifs, des métriques et des boucles qui ne s'arrêtent jamais.
Créateurs : Udit Goenka (Expert en Produits IA) + contributeurs. Licence MIT. 127 commits. v1.9.0 publiée en avril 2026.