Categorías
- Todas las publicaciones 549
- Proyectos Prácticos de Código Abierto 478
- Artículos Tutoriales 22
- Utilidades en Línea 13
- Noticias de IA 7
- Tiny Startups Showcase 7
- Claude Code Skills 6
- Plantillas de Prompts 5
- Espacios de Hugging Face 3
- OpenClaw Use Cases 3
- LLM Learning Resources 1
- Online AI Image Tools 1
- OpenClaw Master Skills Collection 1
- Rust Training Resources 1
- AI Short Drama Tools 1
- Mis Favoritos 0
Publicaciones etiquetadas con: Whisper
Content related to Whisper
SpeechRecognition: La biblioteca definitiva de Python para reconocimiento de voz a texto
Descubre SpeechRecognition, la biblioteca de Python más completa para convertir voz en texto. Soporta motores sin conexión como CMU Sphinx, Vosk y OpenAI Whisper, además de APIs en la nube de Google, OpenAI, Groq y Cohere. Instala con un solo comando pip e inicia la transcripción de entrada de micrófono o archivos de audio al instante. Perfecta para asistentes de voz, aplicaciones de transcripción y grabadoras de reuniones. Incluye guías detalladas de configuración para PyAudio, PocketSphinx y consejos de solución de problemas.
AI‑Video‑Transcriber: Transcribe y Resume Cualquier Video con IA
Descubre cómo AI‑Video‑Transcriber trae la próxima generación de transcripción de voz a texto y resumen impulsado por IA a cada plataforma de video. Con Faster‑Whisper, FastAPI y una traducción opcional de OpenAI GPT‑4o, admite más de 30 sitios, incluidos YouTube, TikTok, Bilibili, y más de 100 idiomas. Aprende a instalarlo vía Docker o scripts, configura los modelos Whisper y optimiza el rendimiento para contenido de larga duración. Ideal para desarrolladores, creadores de contenido e investigadores que buscan una solución lista para usar, de código abierto, que escale desde portátiles hasta servidores en la nube.
WhisperLiveKit: Transcripción de Voz a Texto Local en Tiempo Real
Descubre WhisperLiveKit, un potente proyecto de código abierto que permite el reconocimiento de voz a texto, la traducción y la diarización de hablantes en tiempo real y de forma totalmente local. Aprovecha investigaciones de vanguardia como SimulStreaming y WhisperStreaming para una precisión sin precedentes y una baja latencia, superando las limitaciones del procesamiento tradicional de fragmentos de audio. Con un servidor y una interfaz web fáciles de usar, WhisperLiveKit es ideal para aplicaciones que van desde transcripciones de reuniones y herramientas de accesibilidad hasta la creación de contenido y el análisis de atención al cliente. El proyecto ofrece una instalación sencilla a través de pip, varias opciones de configuración para diferentes modelos y backends, y guías de implementación robustas tanto para entornos de CPU como de GPU utilizando Docker.