Publications marquées avec: ASR

Content related to ASR

VibeVoice : la suite d'IA vocale open-source de Microsoft

March 15, 2026

Étiquettes:

Explorez VibeVoice, l'outil open-source de pointe de Microsoft qui apporte la reconnaissance vocale longue (ASR), la synthèse vocale multi-voix (TTS) et le streaming en temps réel aux développeurs et chercheurs. Découvrez comment exploiter son pipeline ASR de 60 minutes, son TTS de 90 minutes, et son modèle en temps réel léger, ainsi que son intégration avec Hugging Face Transformers pour un déploiement sans effort.

Lire plus Original

Projets Open Source Pratiques

Qwen3‑ASR d'Alibaba Cloud est la toute dernière version à offrir une reconnaissance vocale multilingue de pointe au monde open‑source. Disponible en 52 langues et 22 dialectes chinois, les deux variantes 1.7B/0.6B excellent sur les benchmarks et rivalisent avec les API commerciales. Le dépôt fournit un kit d'inférence complet compatible avec Transformers ou le backend haute‑performance vLLM, un timestamping automatique via Qwen3‑ForcedAligner, ainsi qu'une démo Gradio prête à l'emploi. Que vous soyez chercheur, développeur ou passionné, ce guide vous conduit à travers le téléchargement, l'installation, l'évaluation et le déploiement de Qwen3‑ASR en Docker ou directement sur GPU, vous permettant de transcrire rapidement parole, musique et chansons.

January 31, 2026

Étiquettes:

Open Source Speech Recognition Alibaba ASR Multilingual

Points forts : support multilingue, inference en streaming, alignement forcé, scripts de démarrage rapide, déploiements Docker, et intégration API compatible OpenAI.

Lire plus Original

Catégories

Publications marquées avec: ASR

VibeVoice : la suite d'IA vocale open-source de Microsoft