Categorías
- Todas las publicaciones 549
- Proyectos Prácticos de Código Abierto 478
- Artículos Tutoriales 22
- Utilidades en Línea 13
- Noticias de IA 7
- Tiny Startups Showcase 7
- Claude Code Skills 6
- Plantillas de Prompts 5
- Espacios de Hugging Face 3
- OpenClaw Use Cases 3
- LLM Learning Resources 1
- Online AI Image Tools 1
- OpenClaw Master Skills Collection 1
- Rust Training Resources 1
- AI Short Drama Tools 1
- Mis Favoritos 0
Publicaciones etiquetadas con: Voice AI
Content related to Voice AI
VibeVoice: El conjunto de herramientas de IA de voz de código abierto de Microsoft
Explora VibeVoice, el kit de herramientas de código abierto de vanguardia de Microsoft que ofrece ASR de larga duración, TTS multihablante y streaming en tiempo real a desarrolladores e investigadores. Aprende a aprovechar su canal de ASR de 60 minutos, su TTS de 90 minutos y su modelo ligero en tiempo real, y descubre la integración con Hugging Face Transformers para un despliegue sin problemas.
RCLI: IA de voz en dispositivo para macOS – Sin nube, rápido
RCLI convierte tu Mac en un asistente de voz totalmente local y explorador de documentos. Impulsado por el motor GPU MetalRT de Apple Silicon, ejecuta STT, LLM y TTS de última generación localmente—sin nube, sin claves API. Descubre cómo instalarlo con Homebrew, controlar 38 acciones de macOS, incrustar PDFs con RAG <4 ms y comparar MetalRT con llama.cpp. Ya seas desarrollador, usuario avanzado o entusiasta de la IA, RCLI trae la IA local más vanguardista a tu escritorio con un mínimo de configuración. Descubre por qué este repo es imprescindible para cualquiera que esté construyendo herramientas macOS impulsadas por voz.
NeuTTS Air: IA de Voz en el Dispositivo con Clonación Instantánea
Descubre NeuTTS Air, el innovador modelo de texto a voz (TTS) de código abierto y en dispositivo de Neuphonic. Esta IA revolucionaria lleva la síntesis de voz superrealista y la clonación de voz instantánea directamente a tus dispositivos locales, desde teléfonos hasta Raspberry Pis. Aprende cómo NeuTTS Air aprovecha una arquitectura LLM de 0.5B para un habla de sonido natural, rendimiento en tiempo real y seguridad integrada. Explora sus características clave, los idiomas compatibles, el formato GGML para una mayor eficiencia y una guía de inicio rápido para integrar esta potente IA de voz en tus proyectos.