Vibium: Automatización de Navegadores sin Configuración para Agentes de IA

VIBIUM: Automatización de Navegadores sin Configuración para Agentes de IA

En la era de los modelos de lenguaje grandes y los agentes autónomos, dirigir un navegador real es más útil que nunca. Sin embargo, la mayoría de las herramientas te obligan a gestionar binarios separados, descargar drivers y escribir código repetitivo. Vibium elimina esta fricción: un único binario Go de ~10 MB que gestiona todo el ciclo de vida de Chrome, habla WebDriver BiDi y expone un servidor MCP para que agentes como Claude Code puedan conectarse a un navegador de inmediato.

TL;DR – Si buscas una automatización de navegador rápida y confiable para IA o código, instala Vibium y ejecútalo con una sola línea. Sin configuración de Chrome, sin variables de entorno—solo la API con la que te sientas cómodo.

¿Qué problemas resuelve Vibium?

  1. Sin coste de configuración – Los drivers de Chrome y Chromium se descargan automáticamente durante la instalación con npm o pip.
  2. Binario único – Un único binario Go que administra el navegador, un proxy BiDi, un servidor MCP y un motor de espera automática.
  3. Basado en estándares – Se basa en el protocolo abierto WebDriver BiDi en lugar de extensiones propietarias.
  4. Multiplataforma – Funciona en Linux, macOS (Intel y Apple Silicon) y Windows.
  5. APIs duales – Librerías cliente tanto asíncronas como síncronas en JS/TS y Python.
  6. Listo para agentes – El servidor MCP integrado permite que Claude Code, Codex, Gemini y otros dirijan el navegador con simples indicaciones de texto.

Comienza en minutos

Abajo tienes un tutorial de inicio rápido que demuestra cómo:

  1. Instalar Vibium.
  2. Lanzar el navegador.
  3. Navegar a una página.
  4. Encontrar y hacer clic en un elemento.
  5. Tomar una captura de pantalla.
  6. Cerrar el navegador.

JavaScript / TypeScript

npm install vibium
# o
yarn add vibium
// sync client
const { browserSync } = require('vibium');
const vibe = browserSync.launch();
await vibe.go('https://example.com');
const link = vibe.find('a');
await link.click();
const png = vibe.screenshot();
await require('fs/promises').writeFile('screenshot.png', png);
vibe.quit();
// async client (ES modules)
import { browser } from 'vibium';

async function main() {
  const vibe = await browser.launch();
  await vibe.go('https://example.com');
  const link = await vibe.find('a');
  await link.click();
  const png = await vibe.screenshot();
  await Deno.writeFile('screenshot.png', png);
  await vibe.quit();
}
main();

Python

pip install vibium
# sync client
from vibium import browser_sync as browser

vibe = browser.launch()
vibe.go('https://example.com')
link = vibe.find('a')
link.click()
png = vibe.screenshot()
with open('screenshot.png', 'wb') as f:
    f.write(png)
vibe.quit()
# async client
import asyncio
from vibium import browser

async def main():
    vibe = await browser.launch()
    await vibe.go('https://example.com')
    link = await vibe.find('a')
    await link.click()
    png = await vibe.screenshot()
    with open('screenshot.png', 'wb') as f:
        f.write(png)
    await vibe.quit()

asyncio.run(main())

Ejecutar Vibium en un flujo de trabajo centrado en el agente

Con el servidor MCP expuesto a través de la E/S estándar, puedes integrar Vibium en Claude Code con una sola llamada CLI:

claude mcp add vibium -- npx -y vibium

Ahora el modelo puede emitir comandos como:

"Ve a example.com y haz clic en el primer enlace."

Vibium interpreta eso e interactúa con el navegador por ti.

Funciones avanzadas

Feature Description
Auto‑Wait Espera implícita de elementos antes de las interacciones, reduciendo pruebas inestables.
Visible By Default La instancia de Chrome inicia en una ventana visible, ideal para depuración.
Binary Size Binario Go de ~10 MB; sin runtimes externos.
BiDi Proxy Actúa como servidor WebSocket en :9515, reenviando todas las llamadas BiDi.
Extensible Client Libraries Los paquetes npm y pip exponen una API limpia; lenguajes futuros pueden clonar este patrón.
Future Roadmap Cliente Java, capa de memoria/navegación (Cortex), grabación de vídeo, localizadores impulsados por IA.

Contribución y comunidad

Vibium da la bienvenida a contribuciones. Haz un fork del repositorio, ejecuta las pruebas y envía PRs. El proyecto sigue una licencia de código abierto (Apache‑2.0) y mantiene un código de conducta para una colaboración respetuosa.

Por qué Vibium destaca

  • Instalación de un clic – No se necesita instalar driver de Chrome ni configurar el entorno.
  • Diseño centrado en al agente – El servidor MCP incorporado elimina la necesidad de puentes personalizados.
  • Primeros estándares – WebDriver BiDi garantiza compatibilidad conforme evolucionan los navegadores.
  • Librerías amigables para desarrolladores – APIs asíncronas y síncronas en los lenguajes más usados por desarrolladores web.
  • Extensible y ligera – Binario simple que puede crecer hasta convertirse en un framework de automatización completo.

Conclusión

Si estás construyendo agentes de IA que necesitan navegar por la web, o buscas una herramienta de automatización confiable y sin configuración para tareas cotidianas, Vibium ofrece el equilibrio perfecto entre simplicidad, potencia y cumplimiento de estándares. Pruébalo hoy, intégralo a tus flujos de trabajo de agentes y observa cómo tu pila de automatización se vuelve más liviana y mantenible.

Artículo original: Ver original

Compartir este artículo