AIBit Découvrir des projets open source

Accueil / Projets Open Source Pratiques

RCLI : Assistant vocal IA sur l’appareil pour macOS – Zero‑Cloud, Rapide

March 13, 2026

Catégorie: Projets Open Source Pratiques

Étiquettes:

macOS Voice AI on‑device MetalRT RCLI

Qu’est‑ce que RCLI?\n\nRCLI (RunAnywhere Command‑Line Interface) est un assistant vocal entièrement local et open source pour macOS. Il regroupe un moteur Speech‑to‑Text (STT), un modèle de grande langue (LLM) et un moteur Text‑to‑Speech (TTS), le tout fonctionnant sur le GPU Apple Silicon via le moteur d’inférence propriétaire MetalRT. Le résultat est un Mac activé par la parole qui peut contrôler des applications, récupérer des informations depuis vos documents locaux et répondre en temps réel – tout cela sans envoyer de données vers le cloud.\n\nPoints clés :\n- 38 actions macOS différentes (lancer Spotify, régler le volume, prendre des captures d’écran, ouvrir des URL, etc.) accessibles par la voix ou le texte.\n- Génération augmentée par récupération locale (RAG) qui indexe les fichiers PDF, DOCX et texte brut avec une recherche hybride vectorielle + BM25 en environ 4 ms.\n- Latence de bout en bout inférieure à 200 ms du moment où vous parlez jusqu’à ce que vous entendiez la réponse.\n- Pas de dépendance à des API externes ; aucune clé API requise.\n- Une interface interactive basée sur le terminal vous permet de gérer les modèles, les actions et le moteur MetalRT.\n\n### Installation\n\nRCLI est disponible via Homebrew ou une installation par script unique. Pour une configuration rapide, exécutez :\n\n`bash\ncurl -fsSL https://raw.githubusercontent.com/RunanywhereAI/RCLI/main/install.sh | bash\n`\n\nOu utilisez Homebrew :\n\n`bash\nbrew tap RunanywhereAI/rcli https://github.com/RunanywhereAI/RCLI.git\nbrew install rcli\nrcli setup # downloads ~1 GB of local models on first run\n`\n\nSi votre Mac exécute macOS 13+ avec une puce Apple Silicon (M3 ou ultérieure recommandée), le moteur GPU MetalRT sera utilisé automatiquement. Sur les machines M1/M2, RCLI revient à la mise en œuvre d’inférence open‑source rapide llama.cpp.\n\n### Commandes rapides\n\n| Commande | Fonction |\n|--------------------------|--------------------------------------------------------|\n| `rcli` | Lance l’interface TUI interactive (parlez ou saisissez du texte) |\n| `rcli listen` | Mode voix continu (vous parlez simplement) |\n| `rcli ask \"open Safari\"`| Commande unique texte ou voix |\n| `rcli metalrt` | Gestion du moteur GPU MetalRT |\n| `rcli llamacpp` | Gestion du moteur Llama.cpp |\n\nDans la TUI, vous pouvez appuyer sur `A` pour activer ou désactiver les actions, `M` pour afficher les modèles, `R` pour importer des documents pour le RAG, et `X` pour effacer le contexte de conversation.\n\n### Fonctionnalités détaillées\n\n#### 1. Pipeline vocal complet\n- VAD – Detections d’activité vocale Silero.\n- STT – Whisper Tiny/Small/Medium ou Zipformer en streaming.\n- LLM – Qwen3, variantes LFM2, ou Qwen3.5 ; tous chargés dans MetalRT avec Flash Attention.\n- TTS – Voix Kokoro ou moteurs TTS alternatifs.\n- Appel d’outils – Fonctionne avec Qwen3 et LFM2 pour les appels d’outils natifs pour les actions macOS.\n\n#### 2. 38 actions macOS\nRCLI converte les intentions du LLM en commandes AppleScript ou shell. Catégories courantes :\n- Productivité – créer des notes, des rappels, ou exécuter des raccourcis.\n- Communication – envoyer des messages, démarrer des appels FaceTime.\n- Média – contrôler Spotify, Apple Music, régler le volume.\n- Système – ouvrir/quitter des apps, verrouiller l’écran, basculer le mode sombre.\n- Web – rechercher, ouvrir des URL ou des cartes.\n\n#### 3. RAG local\nIndexez vos dossiers avec `rcli rag ingest ~/Documents`. Les requêtes sur l’index sont répondues via un moteur de récupération hybride qui reste entièrement sur l’appareil. Avec un temps de réponse d’environ 4 ms sur des milliers de morceaux, vous pouvez bénéficier d’un Q&A basé sur les documents en temps réel.\n\n#### 4. Benchmarks\n- Débit décodage MetalRT : jusqu’à 550 tokens/s, surpassant llama.cpp et Apple MLX sur M3 Max.\n- Facteur temps réel : MetalRT STT est 714 fois plus rapide que le temps réel, et le pipeline global reste inférieur à 200 ms.\n\n### Comment contribuer\nRCLI accepte les pull requests. Contribuez en :\n- Ajouter de nouvelles actions macOS ou améliorer celles existantes.\n- Ajouter le support de plus de modèles (LLM, STT, TTS).\n- Améliorer la TUI ou ajouter une nouvelle documentation.\nConsultez `CONTRIBUTING.md` pour les instructions de construction.\n\n### Est‑ce gratuit ?\nLe dépôt est sous licence MIT. Le moteur GPU MetalRT est lui‑même propriétaire mais peut être utilisé librement pour des projets personnels ou commerciaux après contact avec le fournisseur.\n\n### Résumé\nRCLI propose une solution vocale sur l’appareil pour macOS, éliminant la nécessité de services cloud et de clés API. Avec une liste grandissante d’actions exécutées localement, un RAG en temps réel et une inférence MetalRT ultra‑rapide, c’est un projet idéal pour les développeurs désireux de créer des assistants vocaux axés sur la confidentialité ou pour les utilisateurs avancés qui souhaitent un contrôle instantané de leur Mac.\n\n> Prochaine étape : clonez le dépôt, installez via Homebrew, et expérimentez avec les commandes vocales. Partagez vos actions personnalisées ou vos invites vocales sur les forums communautaires et aidez à faire progresser le projet.

Article original: Voir l'original

Partager cet article