Claude Autoresearch:コードを永遠に改善するAI
April 03, 2026
カテゴリ:
Claude Code Skills
Claude Autoresearch:Claude Codeを執拗な改善エンジンに変える
"GOALを設定 → ClaudeがLOOPを実行 → 結果が待っています"
AIがベビーシッターなしで、測定可能なあらゆるもの—コード、コンテンツ、メトリクス、プロセス—を自律的に改善できるとしたら? Claude Autoresearch(3.1k ⭐)は、Karpathyの証明された公式を使用:制約 + 機械的メトリクス + 自律的イテレーション = 複利的な利益。
630行のPythonからClaudeのユニバーサルループへ
KarpathyはシンプルなPythonスクリプトで一晩に100のML実験を実行できることを示しました。Claude Autoresearchはこれを任意のドメインに一般化します:
- コード:テストカバレッジ → 90%、バンドルサイズ → 50%小
- パフォーマンス:API p95 → <100ms
- セキュリティ:自律STRIDE + OWASP監査
- 出荷:ユニバーサルPR/デプロイ/コンテンツワークフロー
- ドキュメント:自動生成/更新/検証
8段階の自律ループ
LOOP (FOREVER):
1. git履歴 + 結果ログをレビュー
2. 1つの集中した変更を選択
3. Git commit (実験: プレフィックス)
4. 機械的検証を実行
5. 改善 → 保持 | 悪化 → 巻き戻し
6. TSV結果をログ
7. 繰り返し
8つの重要ルールが執拗な進歩を保証: - イテレーションごとに1変更(アトミック) - 機械的検証のみ(主観なし) - 自動ロールバック失敗 - Gitをメモリとして - シンプルさが勝つ(少ないコード = 良い)
10の戦闘テスト済みコマンド
| コマンド | ユースケース |
|---|---|
/autoresearch |
コア最適化ループ |
/autoresearch:plan |
目標 → 設定ウィザード |
/autoresearch:security |
自律セキュリティ監査 |
/autoresearch:ship |
PR/デプロイ/コンテンツを出荷 |
/autoresearch:debug |
科学的バグ狩り |
/autoresearch:fix |
エラーをゼロにするまで潰す |
/autoresearch:scenario |
エッジケースの12次元探索 |
/autoresearch:predict |
5専門家スウォーム分析 |
/autoresearch:learn |
自律ドキュメントエンジン |
/autoresearch:reason |
敵対的洗練 (v1.9.0) |
30秒でインストール
プラグイン(推奨):
/plugin marketplace add uditgoenka/autoresearch
/plugin install autoresearch@autoresearch
初回実行:
/autoresearch
Goal: テストカバレッジを72%から90%に向上
Scope: src/**/*.test.ts
Verify: npm test -- --coverage | grep "All files"
離れてください。Claudeが自律的にイテレートします。每回の改善が積み重なります。
実世界の力:コマンドチェーン
# フル品質パイプライン
/autoresearch:reason --chain predict,scenario,debug,fix
# セキュリティ → 出荷
/autoresearch:security --fix --chain ship
# 変更後のドキュメント
/autoresearch:learn --mode update
Guard:回帰保護
Goal: APIレスポンスを<100msに削減
Verify: npm run bench:api | grep "p95"
Guard: npm test # セーフティネット
メトリクス改善 + テスト通過 = 保持。何か壊れたら = 修正。
なぜ機能するのか(科学)
- アトミック変更 → 明確な原因/効果
- Gitメモリ → 毎の実験から学習
- 機械的ゲート → 人間のバイアスなし
- 無制限イテレーション → 複利的な利益
- 自動ロールバック → 開始時より悪くならない
コードを超えたドメイン
- マーケティング:CTR → 3x、コンバージョン率 ↑
- セールス:メール開封率、返信率
- コンテンツ:エンゲージメントスコア、可読性
- HR:ポリシ準拠メトリクス
- DevOps:デプロイ成功率
TSV結果追跡:
iteration commit metric delta status
0 a1b2c3d 85.2 0.0 baseline
1 b2c3d4e 87.1 +1.9 keep
3 c3d4e5f 88.3 +1.2 keep
🚀 今日から始めよう
Claude Autoresearchをインストールして、自律改善を体験。AGI不要—目標、メトリクス、決して止まらないループだけ。
作成者:Udit Goenka (AIプロダクトエキスパート) + 貢献者。MITライセンス。127コミット。v1.9.0 2026年4月リリース。
オリジナル記事:
オリジナルを表示