Claude Autoresearch:永不停歇改进代码的 AI
April 03, 2026
Claude Autoresearch:将 Claude Code 转变为无情的改进引擎
“设定 GOAL → Claude 运行 LOOP → 你醒来看到结果”
如果你的 AI 能自主改进任何可衡量的东西——代码、内容、指标、流程——而无需你 babysitting 呢?Claude Autoresearch(3.1k ⭐)使用 Karpathy 的经证明公式使其成为现实:约束 + 机械指标 + 自主迭代 = 复合收益。
从 630 行 Python 到 Claude 的通用循环
Karpathy 展示了简单的 Python 脚本可以在一夜之间运行 100 个 ML 实验。Claude Autoresearch 将其泛化到任何领域:
- 代码:测试覆盖率 → 90%,捆绑大小 → 缩小 50%
- 性能:API p95 → <100ms
- 安全:自主 STRIDE + OWASP 审计
- 发布:通用的 PR/部署/内容工作流
- 文档:自动生成/更新/验证文档
8 阶段自主循环
LOOP (FOREVER):
1. 审查 git 历史 + 结果日志
2. 选择 ONE 专注变更
3. Git commit (experiment: 前缀)
4. 运行机械验证
5. IMPROVED → 保留 | WORSE → 回滚
6. 记录 TSV 结果
7. 重复
8 个关键规则确保无情的进步: - 每次迭代一个变更(原子性) - 仅机械验证(无主观性) - 自动回滚失败 - Git 作为记忆 - 简洁取胜(代码越少越好)
10 个经过实战检验的命令
| 命令 | 用例 |
|---|---|
/autoresearch |
核心优化循环 |
/autoresearch:plan |
目标 → 配置向导 |
/autoresearch:security |
自主安全审计 |
/autoresearch:ship |
发布 PR/部署/内容 |
/autoresearch:debug |
科学狩猎所有 bug |
/autoresearch:fix |
碾压错误直到归零 |
/autoresearch:scenario |
探索 12 个边缘案例维度 |
/autoresearch:predict |
5 专家群分析 |
/autoresearch:learn |
自主文档引擎 |
/autoresearch:reason |
对抗性精炼 (v1.9.0) |
30 秒安装
插件(推荐):
/plugin marketplace add uditgoenka/autoresearch
/plugin install autoresearch@autoresearch
首次运行:
/autoresearch
Goal: 将测试覆盖率从 72% 提高到 90%
Scope: src/**/*.test.ts
Verify: npm test -- --coverage | grep "All files"
走开。Claude 自主迭代。每项改进都会叠加。
真实世界力量:命令链
# 完整质量管道
/autoresearch:reason --chain predict,scenario,debug,fix
# 安全 → 发布
/autoresearch:security --fix --chain ship
# 变更后文档
/autoresearch:learn --mode update
Guard:回归保护
Goal: 将 API 响应时间降至 <100ms
Verify: npm run bench:api | grep "p95"
Guard: npm test # 安全网
指标改进 + 测试通过 = 保留。任何东西坏掉 = 重工。
为什么有效(科学原理)
- 原子变更 → 清晰因果
- Git 记忆 → 从每个实验中学习
- 机械关卡 → 无人类偏见
- 无限迭代 → 复合收益
- 自动回滚 → 永不比开始差
代码之外的领域
- 营销:CTR → 3x,转化率 ↑
- 销售:邮件打开率、回复率
- 内容:参与度分数、可读性
- HR:政策合规指标
- DevOps:部署成功率
TSV 结果跟踪:
iteration commit metric delta status
0 a1b2c3d 85.2 0.0 baseline
1 b2c3d4e 87.1 +1.9 keep
3 c3d4e5f 88.3 +1.2 keep
🚀 今天就开始
安装 Claude Autoresearch,体验自主改进。无需 AGI——只需目标、指标和永不停止的循环。
创建者:Udit Goenka(AI 产品专家)+ 贡献者。MIT 许可。127 次提交。v1.9.0 于 2026 年 4 月发布。
原始文章:
查看原文