Claude Autoresearch：コードを永遠に改善するAI

April 03, 2026

カテゴリ: Claude Code Skills

タグ:

Claude Code Autonomous AI Autoresearch Karpathy Claude Plugin

Claude Autoresearch：Claude Codeを執拗な改善エンジンに変える

"GOALを設定 → ClaudeがLOOPを実行 → 結果が待っています"

AIがベビーシッターなしで、測定可能なあらゆるもの—コード、コンテンツ、メトリクス、プロセス—を自律的に改善できるとしたら？ Claude Autoresearch（3.1k ⭐）は、Karpathyの証明された公式を使用：制約 + 機械的メトリクス + 自律的イテレーション = 複利的な利益。

630行のPythonからClaudeのユニバーサルループへ

KarpathyはシンプルなPythonスクリプトで一晩に100のML実験を実行できることを示しました。Claude Autoresearchはこれを任意のドメインに一般化します：

コード：テストカバレッジ → 90%、バンドルサイズ → 50%小
パフォーマンス：API p95 → <100ms
セキュリティ：自律STRIDE + OWASP監査
出荷：ユニバーサルPR/デプロイ/コンテンツワークフロー
ドキュメント：自動生成/更新/検証

8段階の自律ループ

LOOP (FOREVER):
1. git履歴 + 結果ログをレビュー
2. 1つの集中した変更を選択
3. Git commit (実験: プレフィックス)
4. 機械的検証を実行
5. 改善 → 保持 | 悪化 → 巻き戻し
6. TSV結果をログ
7. 繰り返し

8つの重要ルールが執拗な進歩を保証： - イテレーションごとに1変更（アトミック） - 機械的検証のみ（主観なし） - 自動ロールバック失敗 - Gitをメモリとして - シンプルさが勝つ（少ないコード = 良い）

10の戦闘テスト済みコマンド

コマンド	ユースケース
`/autoresearch`	コア最適化ループ
`/autoresearch:plan`	目標 → 設定ウィザード
`/autoresearch:security`	自律セキュリティ監査
`/autoresearch:ship`	PR/デプロイ/コンテンツを出荷
`/autoresearch:debug`	科学的バグ狩り
`/autoresearch:fix`	エラーをゼロにするまで潰す
`/autoresearch:scenario`	エッジケースの12次元探索
`/autoresearch:predict`	5専門家スウォーム分析
`/autoresearch:learn`	自律ドキュメントエンジン
`/autoresearch:reason`	敵対的洗練 (v1.9.0)

30秒でインストール

プラグイン（推奨）：

/plugin marketplace add uditgoenka/autoresearch
/plugin install autoresearch@autoresearch

初回実行：

/autoresearch
Goal: テストカバレッジを72%から90%に向上
Scope: src/**/*.test.ts
Verify: npm test -- --coverage | grep "All files"

離れてください。Claudeが自律的にイテレートします。每回の改善が積み重なります。

実世界の力：コマンドチェーン

# フル品質パイプライン
/autoresearch:reason --chain predict,scenario,debug,fix

# セキュリティ → 出荷
/autoresearch:security --fix --chain ship

# 変更後のドキュメント
/autoresearch:learn --mode update

Guard：回帰保護

Goal: APIレスポンスを<100msに削減
Verify: npm run bench:api | grep "p95"
Guard: npm test  # セーフティネット

メトリクス改善 + テスト通過 = 保持。何か壊れたら = 修正。

なぜ機能するのか（科学）

アトミック変更 → 明確な原因/効果
Gitメモリ → 毎の実験から学習
機械的ゲート → 人間のバイアスなし
無制限イテレーション → 複利的な利益
自動ロールバック → 開始時より悪くならない

コードを超えたドメイン

マーケティング：CTR → 3x、コンバージョン率 ↑
セールス：メール開封率、返信率
コンテンツ：エンゲージメントスコア、可読性
HR：ポリシ準拠メトリクス
DevOps：デプロイ成功率

TSV結果追跡：

iteration   commit  metric  delta   status
0   a1b2c3d 85.2    0.0 baseline
1   b2c3d4e 87.1    +1.9    keep
3   c3d4e5f 88.3    +1.2    keep

🚀 今日から始めよう

Claude Autoresearchをインストールして、自律改善を体験。AGI不要—目標、メトリクス、決して止まらないループだけ。

作成者：Udit Goenka (AIプロダクトエキスパート) + 貢献者。MITライセンス。127コミット。v1.9.0 2026年4月リリース。

オリジナル記事: オリジナルを表示

この記事を共有