Catégories
- Toutes les publications 549
- Projets Open Source Pratiques 478
- Articles Tutoriels 22
- Utilitaires en ligne 13
- Actualités IA 7
- Tiny Startups Showcase 7
- Claude Code Skills 6
- Modèles d'Invites 5
- Espaces Hugging Face 3
- OpenClaw Use Cases 3
- LLM Learning Resources 1
- Online AI Image Tools 1
- OpenClaw Master Skills Collection 1
- Rust Training Resources 1
- AI Short Drama Tools 1
- Mes favoris 0
Publications marquées avec: Voice AI
Content related to Voice AI
VibeVoice : la suite d'IA vocale open-source de Microsoft
Explorez VibeVoice, l'outil open-source de pointe de Microsoft qui apporte la reconnaissance vocale longue (ASR), la synthèse vocale multi-voix (TTS) et le streaming en temps réel aux développeurs et chercheurs. Découvrez comment exploiter son pipeline ASR de 60 minutes, son TTS de 90 minutes, et son modèle en temps réel léger, ainsi que son intégration avec Hugging Face Transformers pour un déploiement sans effort.
RCLI : Assistant vocal IA sur l’appareil pour macOS – Zero‑Cloud, Rapide
RCLI transforme votre Mac en un assistant vocal entièrement local et en explorateur de documents. Propulsé par le moteur GPU MetalRT d’Apple Silicon, il exécute un STT, un LLM et un TTS à la pointe de la technologie en local – sans cloud, sans clés API. Découvrez comment l’installer avec Homebrew, contrôler 38 actions macOS, intégrer des PDF avec un RAG en moins de 4 ms, et tester MetalRT contre llama.cpp. Que vous soyez développeur, utilisateur avancé ou passionné d’IA, RCLI offre l’IA locale la plus avancée sur votre bureau avec un minimum de configuration. Découvrez pourquoi ce dépôt est un incontournable pour toute personne construisant des outils macOS basés sur la voix.
NeuTTS Air : Une IA vocale embarquée avec clonage vocal instantané
Découvrez NeuTTS Air, le modèle de synthèse vocale (TTS) open source révolutionnaire de Neuphonic, conçu pour fonctionner directement sur vos appareils. Cette IA innovante offre une synthèse vocale ultra-réaliste et un clonage de voix instantané, directement accessibles depuis vos appareils locaux, qu'il s'agisse de téléphones ou de Raspberry Pi. Découvrez comment NeuTTS Air s'appuie sur une architecture LLM de 0,5 milliard de paramètres pour produire un discours naturel, garantir des performances en temps réel et offrir une sécurité intégrée. Explorez ses fonctionnalités clés, les langues prises en charge, le format GGML pour une efficacité optimale, et un guide de démarrage rapide pour intégrer cette puissante IA vocale dans vos projets.