LiveTalking : Humain numérique IA en temps réel avec synchronisation labiale

LiveTalking : Créez des humains numériques IA de qualité commerciale avec du code open source

Transformez le texte en avatars parlants réalistes

LiveTalking (7.2k ⭐️) propose des humains numériques en temps réel prêts pour la production, synchronisant l'audio, les mouvements des lèvres et les expressions faciales avec une qualité commerciale. Initialement metahuman-stream, cette puissance Python prend en charge plusieurs modèles de pointe et le streaming WebRTC pour une intégration fluide dans le navigateur.

🚀 Fonctionnalités principales

  • 4+ Modèles d'humains numériques : wav2lip (60 FPS sur RTX 3060), musetalk (72 FPS sur 4090), ernerf, Ultralight-Digital-Human
  • Clonage vocal : TTS en temps réel avec support des interruptions
  • WebRTC + Caméra virtuelle : Streaming compatible navigateur
  • Multi-concurrence : Évolutivité sur les ressources CPU/GPU
  • Avatars personnalisés : Téléchargez vos propres images de personnages

🎯 Démarrage rapide (5 minutes)

# Ubuntu 24.04 + Python 3.10 + CUDA 12.4
conda create -n livetalking python=3.10
conda activate livetalking
conda install pytorch==2.5.0 torchvision==0.20.0 pytorch-cuda=12.4 -c pytorch -c nvidia
pip install -r requirements.txt

# Téléchargez les modèles (liens Quark/Google Drive)
python app.py --transport webrtc --model wav2lip --avatar_id wav2lip256_avatar1

Test navigateur : http://your-server:8010/webrtcapi.html → Tapez → Regardez l'IA parler !

🐳 Docker (Zéro configuration)

docker run --gpus all -it --network=host registry.cn-beijing.aliyuncs.com/codewithgpu2/lipku-metahuman-stream:2K9qaMBu8v

⚡ Benchmarks de performance

Modèle GPU FPS
wav2lip256 RTX 3060 60
wav2lip256 RTX 3080Ti 120
musetalk RTX 4090 72

💎 Extensions commerciales disponibles

  • Modèles wav2lip HD
  • Sous-titres en temps réel + interruption
  • Multi-avatars par flux
  • Expressions pilotées par caméra
  • Durée d'avatar illimitée

🎮 Cas d'utilisation

  1. Streaming en direct : Co-animateurs IA interactifs
  2. Éducation : Tuteurs multilingues
  3. Service client : Agents IA 24/7
  4. Création de contenu : Têtes parlantes automatisées
  5. Événements virtuels : Présentateurs numériques évolutifs

📦 Déploiement cloud en un clic

Commencez : GitHub - lipku/LiveTalking ⭐️ + 🚀 = Avatars IA commerciaux en quelques minutes !

Licence Apache 2.0 • 1.1k forks • Communauté active

Original Article: Voir l’original

Partager cet article