Claude Autoresearch:永不停歇改进代码的 AI

Claude Autoresearch:将 Claude Code 转变为无情的改进引擎

“设定 GOAL → Claude 运行 LOOP → 你醒来看到结果”

如果你的 AI 能自主改进任何可衡量的东西——代码、内容、指标、流程——而无需你 babysitting 呢?Claude Autoresearch(3.1k ⭐)使用 Karpathy 的经证明公式使其成为现实:约束 + 机械指标 + 自主迭代 = 复合收益

从 630 行 Python 到 Claude 的通用循环

Karpathy 展示了简单的 Python 脚本可以在一夜之间运行 100 个 ML 实验。Claude Autoresearch 将其泛化到任何领域

  • 代码:测试覆盖率 → 90%,捆绑大小 → 缩小 50%
  • 性能:API p95 → <100ms
  • 安全:自主 STRIDE + OWASP 审计
  • 发布:通用的 PR/部署/内容工作流
  • 文档:自动生成/更新/验证文档

8 阶段自主循环

LOOP (FOREVER):
1. 审查 git 历史 + 结果日志
2. 选择 ONE 专注变更
3. Git commit (experiment: 前缀)
4. 运行机械验证
5. IMPROVED → 保留 | WORSE → 回滚
6. 记录 TSV 结果
7. 重复

8 个关键规则确保无情的进步: - 每次迭代一个变更(原子性) - 仅机械验证(无主观性) - 自动回滚失败 - Git 作为记忆 - 简洁取胜(代码越少越好)

10 个经过实战检验的命令

命令 用例
/autoresearch 核心优化循环
/autoresearch:plan 目标 → 配置向导
/autoresearch:security 自主安全审计
/autoresearch:ship 发布 PR/部署/内容
/autoresearch:debug 科学狩猎所有 bug
/autoresearch:fix 碾压错误直到归零
/autoresearch:scenario 探索 12 个边缘案例维度
/autoresearch:predict 5 专家群分析
/autoresearch:learn 自主文档引擎
/autoresearch:reason 对抗性精炼 (v1.9.0)

30 秒安装

插件(推荐):

/plugin marketplace add uditgoenka/autoresearch
/plugin install autoresearch@autoresearch

首次运行:

/autoresearch
Goal: 将测试覆盖率从 72% 提高到 90%
Scope: src/**/*.test.ts
Verify: npm test -- --coverage | grep "All files"

走开。Claude 自主迭代。每项改进都会叠加。

真实世界力量:命令链

# 完整质量管道
/autoresearch:reason --chain predict,scenario,debug,fix

# 安全 → 发布
/autoresearch:security --fix --chain ship

# 变更后文档
/autoresearch:learn --mode update

Guard:回归保护

Goal: 将 API 响应时间降至 <100ms
Verify: npm run bench:api | grep "p95"
Guard: npm test  # 安全网

指标改进 + 测试通过 = 保留。任何东西坏掉 = 重工。

为什么有效(科学原理)

  1. 原子变更 → 清晰因果
  2. Git 记忆 → 从每个实验中学习
  3. 机械关卡 → 无人类偏见
  4. 无限迭代 → 复合收益
  5. 自动回滚 → 永不比开始差

代码之外的领域

  • 营销:CTR → 3x,转化率 ↑
  • 销售:邮件打开率、回复率
  • 内容:参与度分数、可读性
  • HR:政策合规指标
  • DevOps:部署成功率

TSV 结果跟踪:

iteration   commit  metric  delta   status
0   a1b2c3d 85.2    0.0 baseline
1   b2c3d4e 87.1    +1.9    keep
3   c3d4e5f 88.3    +1.2    keep

🚀 今天就开始

安装 Claude Autoresearch,体验自主改进。无需 AGI——只需目标、指标和永不停止的循环。

创建者:Udit Goenka(AI 产品专家)+ 贡献者。MIT 许可。127 次提交。v1.9.0 于 2026 年 4 月发布。

原始文章: 查看原文

分享这篇文章