Controla tu Mac con IA: Presentamos los Agentes macOS-use

Controla tu Mac con IA: Presentamos los Agentes de macOS-use

Imagina decirle a tu MacBook qué hacer y ver cómo ejecuta tareas complejas en cualquier aplicación, sin esfuerzo. Esta visión se está convirtiendo rápidamente en realidad con 'macOS-use', un ambicioso proyecto de código abierto liderado por Ofir Ozeri, con importantes contribuciones de Magnus y Gregor.

'macOS-use' es una iniciativa innovadora cuyo objetivo es construir un agente de IA específicamente para el marco MLX de Apple. Su propósito principal es permitir que los agentes de IA realicen cualquier acción en cualquier dispositivo Apple, empezando por los MacBooks. Esto significa liberar a los usuarios de clics repetitivos y entradas manuales, transformando las indicaciones en lenguaje natural en acciones tangibles en tu ordenador.

Cómo Funciona

En esencia, 'macOS-use' aprovecha modelos de IA (actualmente mejor soportados por las API de OAI y Anthropic, con Gemini también funcional) para comprender los comandos del usuario. Una vez integrado, puedes indicarle a tu Mac que realice una serie de operaciones. El proyecto proporciona instrucciones de instalación claras, haciéndolo accesible para desarrolladores y entusiastas deseosos de experimentar. Un simple pip install mlx-use te pone en marcha, seguido de la configuración de tu clave de API.

Sé Testigo del Poder: Impresionantes Demostraciones

El repositorio del proyecto muestra varias demostraciones convincentes de 'macOS-use' en acción:

  • Automatización de Calculadora: Pide al agente que "Calcule cuánto es 5 X 4 y devuelva el resultado", y observa cómo abre la aplicación de calculadora, realiza el cálculo y muestra la respuesta.
  • Automatización de Inicio de Sesión Web: Instrúyelo para "Ir a auth0.com, iniciar sesión con autenticación de Google, elegir la cuenta de Gmail ofiroz91, iniciar sesión en el sitio web", una notable hazaña de interacción con elementos web y flujos de autenticación.
  • Recuperación de Información en Línea: Pregunta "¿Puedes verificar a qué hora es Shabat en Israel hoy?", y el agente navega inteligentemente para encontrar y mostrar la información.

Estos ejemplos resaltan el inmenso potencial de 'macOS-use' para agilizar los flujos de trabajo y reducir el esfuerzo manual.

La Visión de Futuro

El objetivo final de 'macOS-use' es crear un agente de IA completamente de código abierto, ejecutable localmente y potenciado por MLX y MLX-VLM. Esto significa permitir la inferencia privada a costo cero, haciendo que el control avanzado de la IA sea accesible para todos. La hoja de ruta incluye objetivos ambiciosos como:

  • Lograr una fiabilidad de última generación en MacBooks.
  • Refinar las indicaciones del agente para una precisión aún mayor.
  • Mejorar los mecanismos de autocorrección.
  • Agregar la capacidad para que el agente verifique las aplicaciones instaladas y solicite la entrada del usuario cuando sea necesario.
  • Optimizar la eficiencia y el costo de las tareas mediante inferencia local con modelos ajustados.
  • Ampliar el soporte a dispositivos iPhone y iPad.

Consideraciones Importantes

Es crucial tener en cuenta que 'macOS-use' todavía se encuentra en desarrollo activo. Como herramienta poderosa que interactúa directamente con tu sistema operativo y aplicaciones, usará credenciales privadas, accederá a servicios de autenticación e interactuará con todos los componentes de la interfaz de usuario. Por lo tanto, se recomienda encarecidamente la discreción del usuario, y aún no se aconseja operar sin supervisión. Los desarrolladores están refinando activamente las medidas de seguridad e instan a los usuarios a proporcionar comentarios para mejorar el proyecto.

'macOS-use' representa un paso significativo hacia una experiencia informática más intuitiva y basada en la IA. Su naturaleza de código abierto invita a la colaboración, prometiendo un futuro en el que tus dispositivos Apple realmente comprendan y ejecuten tus comandos.

Artículo original: Ver original

Compartir este artículo