Categorías
- Todas las publicaciones 552
- Proyectos Prácticos de Código Abierto 479
- Artículos Tutoriales 22
- Utilidades en Línea 13
- Noticias de IA 7
- Tiny Startups Showcase 7
- Claude Code Skills 6
- Plantillas de Prompts 5
- Espacios de Hugging Face 3
- OpenClaw Use Cases 3
- LLM Learning Resources 1
- Online AI Image Tools 1
- OpenClaw Master Skills Collection 1
- Rust Training Resources 1
- AI Short Drama Tools 1
- AI Image Generate Maker 1
- Linux Security Vulnerabilities 1
- Mis Favoritos 0
Publicaciones etiquetadas con: ASR
Content related to ASR
VibeVoice: El conjunto de herramientas de IA de voz de código abierto de Microsoft
Explora VibeVoice, el kit de herramientas de código abierto de vanguardia de Microsoft que ofrece ASR de larga duración, TTS multihablante y streaming en tiempo real a desarrolladores e investigadores. Aprende a aprovechar su canal de ASR de 60 minutos, su TTS de 90 minutos y su modelo ligero en tiempo real, y descubre la integración con Hugging Face Transformers para un despliegue sin problemas.
Qwen3-ASR: Modelo de ASR de 52 idiomas de código abierto de Alibaba
El último lanzamiento de Alibaba Cloud, Qwen3‑ASR, aporta reconocimiento de voz multilingüe de última generación a la comunidad de código abierto. Con soporte para 52 idiomas y 22 dialectos chinos, los dos modelos 1.7B/0.6B destacan en pruebas comparativas y rivalizan con API comerciales. El repositorio incluye un conjunto completo de herramientas de inferencia que funcionan con transformers o el backend vLLM de alto rendimiento, marcas de tiempo automáticas mediante el Qwen3‑ForcedAligner y un demo Gradio listo para usar. Ya sea que seas investigador, desarrollador o aficionado, esta guía te muestra cómo descargar, instalar, evaluar y desplegar Qwen3‑ASR en Docker o directamente en GPU, para que puedas empezar a transcribir voz, música y canciones con facilidad. Puntos clave: soporte multilingüe, inferencia en streaming, alineación forzada, scripts de inicio rápido, despliegues en Docker y integración de API con endpoints compatibles con OpenAI.