Vibium: Automatización de Navegadores sin Configuración para Agentes de IA
VIBIUM: Automatización de Navegadores sin Configuración para Agentes de IA
En la era de los modelos de lenguaje grandes y los agentes autónomos, dirigir un navegador real es más útil que nunca. Sin embargo, la mayoría de las herramientas te obligan a gestionar binarios separados, descargar drivers y escribir código repetitivo. Vibium elimina esta fricción: un único binario Go de ~10 MB que gestiona todo el ciclo de vida de Chrome, habla WebDriver BiDi y expone un servidor MCP para que agentes como Claude Code puedan conectarse a un navegador de inmediato.
TL;DR – Si buscas una automatización de navegador rápida y confiable para IA o código, instala Vibium y ejecútalo con una sola línea. Sin configuración de Chrome, sin variables de entorno—solo la API con la que te sientas cómodo.
¿Qué problemas resuelve Vibium?
- Sin coste de configuración – Los drivers de Chrome y Chromium se descargan automáticamente durante la instalación con npm o pip.
- Binario único – Un único binario Go que administra el navegador, un proxy BiDi, un servidor MCP y un motor de espera automática.
- Basado en estándares – Se basa en el protocolo abierto WebDriver BiDi en lugar de extensiones propietarias.
- Multiplataforma – Funciona en Linux, macOS (Intel y Apple Silicon) y Windows.
- APIs duales – Librerías cliente tanto asíncronas como síncronas en JS/TS y Python.
- Listo para agentes – El servidor MCP integrado permite que Claude Code, Codex, Gemini y otros dirijan el navegador con simples indicaciones de texto.
Comienza en minutos
Abajo tienes un tutorial de inicio rápido que demuestra cómo:
- Instalar Vibium.
- Lanzar el navegador.
- Navegar a una página.
- Encontrar y hacer clic en un elemento.
- Tomar una captura de pantalla.
- Cerrar el navegador.
JavaScript / TypeScript
npm install vibium
# o
yarn add vibium
// sync client
const { browserSync } = require('vibium');
const vibe = browserSync.launch();
await vibe.go('https://example.com');
const link = vibe.find('a');
await link.click();
const png = vibe.screenshot();
await require('fs/promises').writeFile('screenshot.png', png);
vibe.quit();
// async client (ES modules)
import { browser } from 'vibium';
async function main() {
const vibe = await browser.launch();
await vibe.go('https://example.com');
const link = await vibe.find('a');
await link.click();
const png = await vibe.screenshot();
await Deno.writeFile('screenshot.png', png);
await vibe.quit();
}
main();
Python
pip install vibium
# sync client
from vibium import browser_sync as browser
vibe = browser.launch()
vibe.go('https://example.com')
link = vibe.find('a')
link.click()
png = vibe.screenshot()
with open('screenshot.png', 'wb') as f:
f.write(png)
vibe.quit()
# async client
import asyncio
from vibium import browser
async def main():
vibe = await browser.launch()
await vibe.go('https://example.com')
link = await vibe.find('a')
await link.click()
png = await vibe.screenshot()
with open('screenshot.png', 'wb') as f:
f.write(png)
await vibe.quit()
asyncio.run(main())
Ejecutar Vibium en un flujo de trabajo centrado en el agente
Con el servidor MCP expuesto a través de la E/S estándar, puedes integrar Vibium en Claude Code con una sola llamada CLI:
claude mcp add vibium -- npx -y vibium
Ahora el modelo puede emitir comandos como:
"Ve a example.com y haz clic en el primer enlace."
Vibium interpreta eso e interactúa con el navegador por ti.
Funciones avanzadas
| Feature | Description |
|---|---|
| Auto‑Wait | Espera implícita de elementos antes de las interacciones, reduciendo pruebas inestables. |
| Visible By Default | La instancia de Chrome inicia en una ventana visible, ideal para depuración. |
| Binary Size | Binario Go de ~10 MB; sin runtimes externos. |
| BiDi Proxy | Actúa como servidor WebSocket en :9515, reenviando todas las llamadas BiDi. |
| Extensible Client Libraries | Los paquetes npm y pip exponen una API limpia; lenguajes futuros pueden clonar este patrón. |
| Future Roadmap | Cliente Java, capa de memoria/navegación (Cortex), grabación de vídeo, localizadores impulsados por IA. |
Contribución y comunidad
Vibium da la bienvenida a contribuciones. Haz un fork del repositorio, ejecuta las pruebas y envía PRs. El proyecto sigue una licencia de código abierto (Apache‑2.0) y mantiene un código de conducta para una colaboración respetuosa.
Por qué Vibium destaca
- Instalación de un clic – No se necesita instalar driver de Chrome ni configurar el entorno.
- Diseño centrado en al agente – El servidor MCP incorporado elimina la necesidad de puentes personalizados.
- Primeros estándares – WebDriver BiDi garantiza compatibilidad conforme evolucionan los navegadores.
- Librerías amigables para desarrolladores – APIs asíncronas y síncronas en los lenguajes más usados por desarrolladores web.
- Extensible y ligera – Binario simple que puede crecer hasta convertirse en un framework de automatización completo.
Conclusión
Si estás construyendo agentes de IA que necesitan navegar por la web, o buscas una herramienta de automatización confiable y sin configuración para tareas cotidianas, Vibium ofrece el equilibrio perfecto entre simplicidad, potencia y cumplimiento de estándares. Pruébalo hoy, intégralo a tus flujos de trabajo de agentes y observa cómo tu pila de automatización se vuelve más liviana y mantenible.