舞台助理:AI 支持的浏览器自动化框架

August 08, 2025

Stagehand:用 AI 革新浏览器自动化

在不断发展的 Web 开发和自动化领域,对强大且灵活的工具的需求至关重要。Stagehand 应运而生,这是一个开源框架,巧妙地将 AI 的强大功能与 Playwright 等传统浏览器自动化库的可靠性相结合。

Stagehand 由 Browserbase 开发,解决了行业面临的一项关键挑战:纯 AI 驱动代理的不可预测性与低级编码框架的冗长性之间的权衡。Stagehand 提供了一种混合方法,允许开发人员智能地选择何时利用自然语言命令处理复杂或不熟悉的任务,以及何时使用精确的代码执行已知操作。

主要特性和优势:

  • 混合控制: 在 AI 驱动的操作(用于直观导航)和 Playwright 的精确代码执行之间无缝切换。这种灵活性确保了对各种自动化需求的适应性和控制力。
  • AI 集成: 只需一行代码,即可轻松集成 OpenAI 和 Anthropic 等领先提供商的最先进的计算机使用模型。
  • 操作预览与缓存: 在执行前预览 AI 生成的操作,从而获得信心。Stagehand 还促进可重复操作的缓存,从而优化效率并减少令牌消耗。
  • 以开发者为中心的设计: Stagehand 专为快速原型设计和生产环境而设计,使开发人员能够更轻松、更可预测地构建复杂的浏览器自动化。

开始使用 Stagehand:

入门非常简单。您可以使用以下命令启动一个新的 Stagehand 项目:

npx create-browser-app

对于那些喜欢从源码构建的人来说,流程如下:

git clone https://github.com/browserbase/stagehand.git
cd stagehand
pnpm install
pnpm playwright install
pnpm run build

要配置 LLM 提供商和 Browserbase 的凭据 API 密钥,请复制示例环境变量文件并进行编辑:

cp .env.example .env
nano .env

Stagehand 拥有令人印象深刻的社区采用率,拥有数千名用户和贡献者,这凸显了它在开发社区中日益增长的重要性。

贡献 Stagehand:

Stagehand 是一个活跃的开源项目,欢迎各种贡献。团队优先考虑在可靠性、速度和成本效益方面的改进。我们鼓励有兴趣的贡献者通过其 Slack 社区与核心团队联系,以使贡献与项目目标保持一致。详细指南可在项目的 贡献指南 中找到。

结论:

Stagehand 提供了一个引人注目的解决方案,适用于任何希望构建强大、可扩展且智能的浏览器自动化工具的人。通过有效地融合 AI 功能和传统编码实践,它使开发人员能够以前所未有的灵活性创建复杂的自动化流程。无论您是自动化复杂的 Web 交互、抓取数据还是构建复杂的机器人,Stagehand 都提供了成功的工具和框架。

了解更多: 访问 docs.stagehand.dev 获取全面的文档和资源。

原创文章: 查看原文

分享本文