Vibium:零配置浏览器自动化,助力 AI 代理

VIBIUM:零配置浏览器自动化,助力 AI 代理

在大型语言模型与自治代理日益普及的时代,驱动真实浏览器的价值前所未有。但大多数工具迫使你处理多个可执行文件、下载驱动和编写大量模板代码。Vibium 消除了这些痛点:一个约10 MB的 Go 可执行文件,负责整个 Chrome 生命周期,支持 WebDriver BiDi,并暴露 MCP 服务器,让 Claude Code 等代理能即插即用地操作浏览器。

TL;DR – 如果你需要快速、可靠的 AI 或代码浏览器自动化,安装 Vibium 并用一句命令启动即可。无需 Chrome 设置、环境变量 – 只需你熟悉的 API。

What Problems Does Vibium Solve?

  1. 零配置开销 – Chrome 与 Chromium 驱动在 npmpip 安装过程中自动下载。
  2. 单一可执行文件 – 一个 Go 可执行文件即可处理浏览器、BiDi 代理、MCP 服务器以及自动等待引擎。
  3. 基于标准 – 以开放的 WebDriver BiDi 协议为基础,而非专有扩展。
  4. 跨平台 – 兼容 Linux、macOS(Intel 与 Apple Silicon)和 Windows。
  5. 双 API – JS/TS 与 Python 提供同步与异步客户端库。
  6. 代理即插即用 – 内置 MCP 服务器让 Claude Code、Codex、Gemini 等通过简易文本提示驱动浏览器。

Get Started in Minutes

以下快速入门教程演示如何:

  1. 安装 Vibium。
  2. 启动浏览器。
  3. 导航至页面。
  4. 查找并点击元素。
  5. 截图。
  6. 关闭浏览器。

JavaScript / TypeScript

npm install vibium
# 或
yarn add vibium
// sync client
const { browserSync } = require('vibium');
const vibe = browserSync.launch();
await vibe.go('https://example.com');
const link = vibe.find('a');
await link.click();
const png = vibe.screenshot();
await require('fs/promises').writeFile('screenshot.png', png);
vibe.quit();
// async client (ES modules)
import { browser } from 'vibium';

async function main() {
  const vibe = await browser.launch();
  await vibe.go('https://example.com');
  const link = await vibe.find('a');
  await link.click();
  const png = await vibe.screenshot();
  await Deno.writeFile('screenshot.png', png);
  await vibe.quit();
}
main();

Python

pip install vibium
# sync client
from vibium import browser_sync as browser

vibe = browser.launch()
vibe.go('https://example.com')
link = vibe.find('a')
link.click()
png = vibe.screenshot()
with open('screenshot.png', 'wb') as f:
    f.write(png)
vibe.quit()
# async client
import asyncio
from vibium import browser

async def main():
    vibe = await browser.launch()
    await vibe.go('https://example.com')
    link = await vibe.find('a')
    await link.click()
    png = await vibe.screenshot()
    with open('screenshot.png', 'wb') as f:
        f.write(png)
    await vibe.quit()

asyncio.run(main())

Running Vibium in an Agent‑First Workflow

通过标准 I/O 暴露 MCP 服务器,你可以用单个 CLI 命令将 Vibium 插件到 Claude Code:

claude mcp add vibium -- npx -y vibium

现在模型可以发出如下命令:

"Go to example.com and click the first link."

Vibium 会解析该命令并为你与浏览器交互。

Advanced Features

Feature Description
Auto‑Wait(自动等待) 在交互前隐式等待元素,降低测试不稳定性。
Visible By Default(默认可见) Chrome 实例以可见窗口启动,适合调试。
Binary Size(二进制尺寸) 约10 MB的 Go 可执行文件;无需外部运行时。
BiDi Proxy(BiDi 代理) :9515 充当 WebSocket 服务器,转发所有 BiDi 调用。
Extensible Client Libraries(可扩展客户端库) npm 与 pip 包提供干净的 API,未来语言可复制此模式。
Future Roadmap(未来路线图) Java 客户端、内存/导航层(Cortex)、视频录制、AI 驱动定位器。

Contribution & Community

Vibium 欢迎贡献。Fork 仓库,运行测试并提交 PR。项目遵循 Apache‑2.0 开源协议,并维护尊重合作的行为准则。

Why Vibium Stands Out

  • 一键安装 – 无需 Chrome 驱动安装或环境配置。
  • 代理中心化设计 – 内置 MCP 服务器消除自定义桥接需求。
  • 以标准为先 – WebDriver BiDi 确保浏览器演进后兼容性。
  • 开发友好库 – 支持 Web 开发者最常用的语言异步与同步 API。
  • 可扩展且轻量 – 简单可执行文件可演进为完整自动化框架。

Bottom Line

如果你正在构建需要上网浏览功能的 AI 代理,或希望拥有可靠、零配置的自动化工具来完成日常任务,Vibium 能为你提供理想的简洁、强大与标准兼容的平衡。今天就试一试,集成到你的代理工作流中,见证你的自动化栈变得更精简、更易维护。

原创文章: 查看原文

分享本文