Vibium:AI エージェント向けゼロコンフィグブラウザ自動化

VIBIUM:AI エージェント向けゼロコンフィグブラウザ自動化

大型言語モデルや自律エージェントが主流になる時代に、実際のブラウザを操作することはかつてないほど重要です。しかし、多くのツールは別々のバイナリを管理し、ドライバをダウンロードし、テンプレートコードを書かせます。Vibium はこの摩擦を解消します:単一の約10 MBのGoバイナリが Chrome のライフサイクルを管理し、WebDriver BiDi を通話し、MCPサーバーを公開することで、Claude Code のようなエージェントがデフォルトでブラウザと対話できます。

TL;DR – AI やコード向けに高速で信頼できるブラウザ自動化を求めるなら、Vibium をインストールし、ワンライナーで起動させてください。Chrome の設定も環境変数も不要です。API は慣れた言語をそのまま使用できます。

Vibium が解決する問題

  1. ゼロセットアップ – Chrome と Chromium ドライバは、npmpip のインストール時に自動でダウンロードされます。
  2. 単一バイナリ – ブラウザ、BiDi プロキシ、MCP サーバー、オートウォイトエンジンを扱う 1 つの Go バイナリです。
  3. 標準ベース – 独自拡張ではなく、オープンな WebDriver BiDi プロトコルを利用します。
  4. クロスプラットフォーム – Linux、macOS(Intel & Apple Silicon)、Windows で動作します。
  5. 二重 API – JS/TS と Python で同期・非同期両方のクライアントライブラリを提供します。
  6. エージェント対応 – 組み込みの MCP サーバーにより、Claude Code、Codex、Gemini などが簡単なテキストプロンプトでブラウザを操作できます。

数分で始める

以下は、インストールからブラウザ操作までを示す簡易チュートリアルです。

  1. Vibium をインストールする。
  2. ブラウザを起動する。
  3. ページに移動する。
  4. 要素を検索してクリックする。
  5. スクリーンショットを取得する。
  6. ブラウザを終了する。

JavaScript / TypeScript

npm install vibium
# または
yarn add vibium
// sync client
const { browserSync } = require('vibium');
const vibe = browserSync.launch();
await vibe.go('https://example.com');
const link = vibe.find('a');
await link.click();
const png = vibe.screenshot();
await require('fs/promises').writeFile('screenshot.png', png);
vibe.quit();
// async client (ES modules)
import { browser } from 'vibium';

async function main() {
  const vibe = await browser.launch();
  await vibe.go('https://example.com');
  const link = await vibe.find('a');
  await link.click();
  const png = await vibe.screenshot();
  await Deno.writeFile('screenshot.png', png);
  await vibe.quit();
}
main();

Python

pip install vibium
# sync client
from vibium import browser_sync as browser

vibe = browser.launch()
vibe.go('https://example.com')
link = vibe.find('a')
link.click()
png = vibe.screenshot()
with open('screenshot.png', 'wb') as f:
    f.write(png)
vibe.quit()
# async client
import asyncio
from vibium import browser

async def main():
    vibe = await browser.launch()
    await vibe.go('https://example.com')
    link = await vibe.find('a')
    await link.click()
    png = await vibe.screenshot()
    with open('screenshot.png', 'wb') as f:
        f.write(png)
    await vibe.quit()

asyncio.run(main())

エージェントファーストワークフローでの Vibium 実行

MCP サーバーを標準 I/O 経由で公開するので、Claude Code へ単一 CLI コールで接続できます。

claude mcp add vibium -- npx -y vibium

これでモデルは次のようなコマンドを出すことができます。

「example.com に移動して最初のリンクをクリック」

Vibium はそれを解釈し、ブラウザを操作します。

高度な機能

機能 説明
オートウォイト 要素が利用可能になるまで非同期で待機し、テストの不安定さを減らします。
デフォルト可視 Chrome インスタンスは可視ウィンドウで起動し、デバッグに適しています。
バイナリサイズ 約10 MB の Go バイナリ。外部ランタイムは不要です。
BiDi プロキシ :9515 で WebSocket サーバーとして機能し、すべての BiDi 呼び出しを転送します。
拡張可能なクライアントライブラリ npm と pip パッケージがクリーンな API を提供し、将来の言語も同様に構築可能です。
ロードマップ Java クライアント、メモリ/ナビゲーション層(Cortex)、ビデオ録画、AI 生成ロケータなど。

貢献とコミュニティ

Vibium は貢献を歓迎します。リポジトリをフォークし、テストを実行し、PR を送信してください。プロジェクトはオープンソースライセンス(Apache‑2.0)を採用し、敬意ある協力のためのコードオブコンダクトを維持しています。

Vibium の優位性

  • ワンクリックセットアップ – Chrome ドライバのインストールや環境設定は不要です。
  • エージェント中心設計 – MCP サーバーが組み込まれているので、カスタムブリッジは不要です。
  • 標準優先 – WebDriver BiDi で将来のブラウザ変更に対応します。
  • 開発者フレンドリーライブラリ – 主に使われる言語で同期・非同期 API を提供します。
  • 拡張性と軽量化 – シンプルなバイナリが完全な自動化フレームワークへと拡大できます。

結論

AI エージェントがウェブを閲覧する必要がある、または日常タスクのための信頼できるゼロコンフィグ自動化ツールを求めているなら、Vibium はシンプルさ、パワー、標準遵守の完璧なバランスを提供します。ぜひ今日使ってみて、エージェントワークフローに統合し、あなたの自動化スタックをより軽量かつ保守しやすくしてください。

この記事を共有