Articles étiquetés avec: ASR
Content related to ASR
VibeVoice : la suite d'IA vocale open-source de Microsoft
March 15, 2026
Étiquettes:
Explorez VibeVoice, l'outil open-source de pointe de Microsoft qui apporte la reconnaissance vocale longue (ASR), la synthèse vocale multi-voix (TTS) et le streaming en temps réel aux développeurs et chercheurs. Découvrez comment exploiter son pipeline ASR de 60 minutes, son TTS de 90 minutes, et son modèle en temps réel léger, ainsi que son intégration avec Hugging Face Transformers pour un déploiement sans effort.
Qwen3‑ASR d'Alibaba Cloud est la toute dernière version à offrir une reconnaissance vocale multilingue de pointe au monde open‑source. Disponible en 52 langues et 22 dialectes chinois, les deux variantes 1.7B/0.6B excellent sur les benchmarks et rivalisent avec les API commerciales. Le dépôt fournit un kit d'inférence complet compatible avec Transformers ou le backend haute‑performance vLLM, un timestamping automatique via Qwen3‑ForcedAligner, ainsi qu'une démo Gradio prête à l'emploi. Que vous soyez chercheur, développeur ou passionné, ce guide vous conduit à travers le téléchargement, l'installation, l'évaluation et le déploiement de Qwen3‑ASR en Docker ou directement sur GPU, vous permettant de transcrire rapidement parole, musique et chansons.
January 31, 2026
Étiquettes:
Points forts : support multilingue, inference en streaming, alignement forcé, scripts de démarrage rapide, déploiements Docker, et intégration API compatible OpenAI.