Browser Harness : Automatisez les tâches web avec des agents propulsés par LLM

Révolutionnez votre flux de travail avec Browser Harness

Dans le monde de l'IA en évolution rapide, la capacité de combler le fossé entre les grands modèles de langage (LLM) et les interfaces web réelles change la donne. Voici Browser Harness, un projet open-source conçu pour connecter votre LLM directement à votre navigateur via un harness léger et modifiable basé sur le protocole Chrome DevTools (CDP).

Qu'est-ce que Browser Harness ?

Browser Harness n'est pas juste un autre script d'automatisation. C'est un environnement auto-réparateur où l'agent lui-même écrit le code nécessaire pour effectuer les tâches. Lorsqu'un agent rencontre une fonction d'assistance manquante ou un élément d'interface complexe, il écrit la logique nécessaire dans agent_helpers.py ou crée une nouvelle domain-skill. Cela signifie que le système s'améliore à chaque exécution.

Fonctionnalités clés

  • Contrôle direct du navigateur : Une connexion websocket vers Chrome sans intermédiaire, offrant une liberté totale pour les tâches complexes.
  • Compétences auto-réparatrices : Les agents génèrent leurs propres « compétences de domaine » pour des sites web spécifiques. Au lieu que vous écriviez des sélecteurs, l'agent apprend les flux, les cas limites et les particularités de l'interface des sites que vous utilisez le plus souvent.
  • Browser Use Cloud : Besoin de passer à l'échelle ? Le projet s'intègre avec Browser Use Cloud pour un déploiement headless, la prise en charge de proxys et la résolution de captchas intégrée.
  • Axé sur la communauté : Avec plus de 12 000 étoiles sur GitHub, le projet prospère grâce aux contributions de la communauté. Vous pouvez facilement partager vos compétences de domaine générées via des pull requests pour aider les autres à automatiser leurs flux de travail.

Pour commencer

La configuration de Browser Harness est simple. En suivant les instructions dans install.md, vous pouvez connecter votre LLM préféré (comme Claude) à votre navigateur local. L'agent vous guidera à travers la configuration du débogage à distance, lui permettant d'interagir avec vos onglets comme s'il s'agissait d'un utilisateur humain.

Pourquoi est-ce important ?

Les outils d'automatisation traditionnels tombent souvent en panne lorsqu'un site web met à jour son interface. Browser Harness résout ce problème en permettant à l'IA de « voir » le navigateur et de s'adapter en temps réel. En abandonnant les sélecteurs fragiles codés en dur au profit de compétences de domaine générées par l'agent, nous entrons dans une nouvelle ère d'agents web autonomes et résilients.

Prêt à arrêter de cliquer et à commencer à automatiser ? Consultez le dépôt GitHub de Browser Harness et commencez à construire votre propre agent autonome dès aujourd'hui.

Article original: Voir l'original

Partager cet article