Vibium : Automatisation de navigateur sans configuration pour les agents IA

VIBIUM : Automatisation de navigateur sans configuration pour les agents IA

À l'ère des grands modèles de langage et des agents autonomes, piloter un vrai navigateur est plus utile que jamais. Pourtant, la plupart des outils vous obligent à jongler avec des binaires séparés, télécharger des pilotes et écrire du code boilerplate. Vibium élimine cette friction : un seul binaire Go d’environ 10 Mo qui gère l’intégralité du cycle de vie de Chrome, parle WebDriver –BiDi, et expose un serveur MCP afin que des agents comme Claude Code puissent communiquer avec un navigateur dès la sortie de la boîte.

TL;DR – Si vous voulez une automatisation de navigateur rapide et fiable pour l’IA ou le code, installez Vibium et lancez‑le en une seule ligne. Pas de configuration Chrome, pas de variables d'environnement – juste l’API qui vous convient.

Quels problèmes Vibium résout-il ?

  1. Pas de charge de configuration – Les pilotes Chrome et Chromium se téléchargent automatiquement pendant l'installation via npm ou pip.
  2. Un seul binaire – Un seul binaire Go qui gère le navigateur, un proxy BiDi, un serveur MCP et un moteur d’attente automatique.
  3. Basé sur les standards – S’appuie sur le protocole open WebDriver –BiDi plutôt que sur des extensions propriétaires.
  4. Multiplaforme – Fonctionne sur Linux, macOS (Intel & Apple Silicon) et Windows.
  5. API double – Bibliothèques clients sync et async en JS/TS et Python.
  6. Prêt pour les agents – Le serveur MCP intégré permet à Claude Code, Codex, Gemini, et d'autres de piloter le navigateur avec de simples invites textuelles.

Démarrer en quelques minutes

Voici un tutoriel rapide qui montre comment :

  1. Installer Vibium.
  2. Lancer le navigateur.
  3. Accéder à une page.
  4. Trouver et cliquer sur un élément.
  5. Faire une capture d’écran.
  6. Fermer le navigateur.

JavaScript / TypeScript

npm install vibium
# ou
yarn add vibium
// client sync
const { browserSync } = require('vibium');
const vibe = browserSync.launch();
await vibe.go('https://example.com');
const link = vibe.find('a');
await link.click();
const png = vibe.screenshot();
await require('fs/promises').writeFile('screenshot.png', png);
vibe.quit();
// client async (ES modules)
import { browser } from 'vibium';

async function main() {
  const vibe = await browser.launch();
  await vibe.go('https://example.com');
  const link = await vibe.find('a');
  await link.click();
  const png = await vibe.screenshot();
  await Deno.writeFile('screenshot.png', png);
  await vibe.quit();
}
main();

Python

pip install vibium
# client sync
from vibium import browser_sync as browser

vibe = browser.launch()
vibe.go('https://example.com')
link = vibe.find('a')
link.click()
png = vibe.screenshot()
with open('screenshot.png', 'wb') as f:
    f.write(png)
vibe.quit()
# client async
import asyncio
from vibium import browser

async def main():
    vibe = await browser.launch()
    await vibe.go('https://example.com')
    link = await vibe.find('a')
    await link.click()
    png = await vibe.screenshot()
    with open('screenshot.png', 'wb') as f:
        f.write(png)
    await vibe.quit()

asyncio.run(main())

Exécuter Vibium dans un flux de travail centré sur l’agent

Avec le serveur MCP exposé via l’I/O standard, vous pouvez connecter Vibium à Claude Code avec un seul appel CLI :

claude mcp add vibium -- npx -y vibium

Maintenant, le modèle peut émettre des commandes comme :

"Aller sur example.com et cliquer sur le premier lien."

Vibium interprète cela et interagit avec le navigateur à votre place.

Fonctionnalités avancées

Fonctionnalité Description
Auto‑Attente Attente implicite des éléments avant les interactions, réduisant les tests intermittents.
Visible par défaut L'instance Chrome démarre dans une fenêtre visible, idéale pour le débogage.
Taille du binaire Binaire Go d’environ 10 Mo ; pas de runtimes externes.
Proxy BiDi Sert de serveur WebSocket à :9515, transférant tous les appels BiDi.
Bibliothèques clients extensibles Les packages npm et pip exposent une API propre ; de futures langues peuvent copier ce modèle.
Feuille de route future Client Java, couche mémoire/navigation (Cortex), enregistrement vidéo, localisateurs propulsés par l’IA.

Contribution & Communauté

Vibium accueille les contributions. Forkez le dépôt, lancez les tests et soumettez des PR. Le projet suit une licence open‑source (Apache‑2.0) et maintient un code de conduite pour une collaboration respectueuse.

Pourquoi Vibium se démarque

  • Installation en un clic – Pas d'installation du pilote Chrome ni de configuration d'environnement.
  • Conception centrée sur l’agent – Le serveur MCP intégré élimine le besoin de ponts personnalisés.
  • Standards avant tout – WebDriver –BiDi garantit la compatibilité à mesure que les navigateurs évoluent.
  • Bibliothèques conviviales pour les développeurs – APIs async et sync dans les langages les plus utilisés par les développeurs web.
  • Extensible et léger – Binaire simple qui peut évoluer vers un cadre d'automatisation complet.

Point clé

Si vous créez des agents IA qui doivent naviguer sur le web, ou si vous cherchez un outil d'automatisation fiable et sans configuration pour vos tâches quotidiennes, Vibium offre l’équilibre parfait entre simplicité, puissance et conformité aux standards. Essayez‑le dès aujourd’hui, intégrez‑le dans vos flux de travail agents, et voyez votre pile d'automatisation devenir plus légère et plus maintenable.

Original Article: Voir l’original

Partager cet article