Entradas etiquetadas con: Audio-Driven
Content related to Audio-Driven
MultiTalk: Genera vídeos de varias personas a partir de audio
Explora MultiTalk, un innovador proyecto de código abierto que revoluciona la generación de video impulsada por audio. Este marco permite crear conversaciones realistas entre varias personas, cantos y control interactivo de personajes utilizando solo entrada de audio e imágenes de referencia. Descubre sus características clave, que incluyen compatibilidad con personajes de dibujos animados, resolución flexible y generación de video extendida de hasta 15 segundos. El repositorio proporciona guías de instalación completas, pasos para la preparación de modelos e instrucciones de inferencia detalladas para varios escenarios, desde configuraciones de una sola GPU hasta múltiples GPU y entornos con VRAM limitada. Sumérgete en el código y las contribuciones de la comunidad para dar vida a tus ideas de video conversacional.