Huobao Drama : Générateur de courts drames IA open‑source

Huobao Drama : Générateur de courts drames IA open‑source

La vidéo courte est partout — des clips TikTok aux YouTube Shorts — mais le processus créatif reste largement manuel. Écrivains esquissent, artistes dessinent, monteurs assemblent. Huobao Drama rompt ce cycle en transformant une seule ligne de texte en un micro‑film fini, alimenté entièrement par des logiciels open‑source et des grands modèles linguistiques (LLMs).

Pourquoi un kit d’outils open‑source pour courts drames ?

  • Démocratisation de la création de contenu IA – Une petite équipe peut produire des clips au look professionnel sans recourir à des outils propriétaires coûteux.
  • Personnalisabilité – Installez vos propres LLMs, modèles d’images ou de vidéos et peaufinez le flux de travail pour l’adapter aux pipelines de votre studio.
  • Croissance pilotée par la communauté – Des contributeurs GitHub aux discussions Discord, le projet prospère grâce aux retours et aux demandes de fonctionnalités de la communauté.

Core Architecture

La stack est soigneusement divisée en quatre couches, suivant les principes de Domain‑Driven Design qui maintiennent la logique métier propre et l’infrastructure modulaire.

├─ API Layer (Gin HTTP)          // Expose les points de terminaison REST
├─ Application Services Layer    // Orchestration de la logique métier
├─ Domain Layer                  // Modèles pour scénarios, scènes, personnages
└─ Infrastructure Layer          // Base de données, clients IA, stockage de fichiers

Go alimente le backend (version 1.23+), tandis que Vue 3 + TypeScript + Vite construit une interface conviviale. Le projet utilise modernc.org/sqlite hébergé sur GitHub pour un pilote SQLite entièrement Go, garantissant l’absence de dépendances C‑go et des builds multiplateformes.

What the Platform Can Do

  • Analyse intelligente de scénario – Un LLM traite une phrase d’entrée et extrait la liste des personnages, les décors et les scènes du storyboard.
  • Génération de personnages et de scènes – Les modèles OpenAI ou Gemini créent des portraits détaillés et des images de fond.
  • Création de storyboard – Génère des invites texte‑à‑image pour chaque prise, crée une séquence de plans.
  • Synthèse vidéo – Deux approches : texte‑à‑vidéo (Sora) et image‑à‑vidéo (FFMPEG + modèle). Combinez les deux pour des résultats haute‑qualité.
  • Montage et transitions – Coupe automatique, fondu‑in/fondu‑out et synchronisation audio.
  • Gestion des ressources – Bibliothèque centrale d’actifs, prise en charge d’export/import, et suivi en temps réel de progression.

Quick Start – Docker Compose

Docker offre la voie la plus simple pour essayer Huobao Drama. Le fichier docker-compose.yml télécharge la dernière image, monte un répertoire de données local et expose les ports 5678 (API) et 3012 (frontend).

# Récupérer l'image et démarrer la stack
$ docker compose up -d

# Vérifier les logs
$ docker compose logs -f

# Arrêter la stack
$ docker compose down

Toute la configuration se trouve dans configs/config.yaml. Modifiez des valeurs telles que ai.default_text_provider ou server.port avant le premier lancement.

Development Mode – Hot‑Reload

Vous souhaitez ajuster le frontend ou le backend ? Clonez le dépôts, installez les dépendances et lancez chaque partie séparément :

# Backend
$ go run main.go
# Frontend
$ cd web && npm run dev

Le frontend est configuré pour proxy les requêtes API vers localhost:5678, afin que vous puissiez expérimenter en temps réel.

Contributing Guide

  • Cloner le dépôt, créer une branche de fonctionnalité, pousser les modifications.
  • Rédiger des messages de commit clairs et garder les titres des PRs concis.
  • Lancer go vet et npm run lint avant la soumission.
  • Consulter docs/CONTRIBUTING.md pour les standards de codage et les instructions de test.

Potential Use Cases

  1. Les écoles de cinéma expérimentent des récits prototypes rapides.
  2. Les équipes marketing produisent des micro‑vidéos de marque pour les réseaux sociaux.
  3. Les créateurs de contenu génèrent des idées infinies pour Vlogs ou YouTube.
  4. Les chercheurs IA testent les pipelines texte‑à‑vidéo avec un pipeline prêt à l’emploi.

Future Roadmap

  • Support pour plus de fournisseurs LLM (Claude, Llama‑2).
  • Génération vidéo accélérée par GPU avec un runtime ONNX optionnel.
  • Interface et analyse de scénario multilingue.
  • Tableau de bord analytique pour métriques de production.

Get Involved

Que vous soyez développeur, designer ou conteur, il y a une place pour vous. Rejoignez le dépôt GitHub, forkez et commencez à coder. Pour des questions rapides, laissez un message dans les discussions ou contactez les responsables sur Discord.

Laissez Huobao Drama transformer la prochaine grande idée en un court‑métrage soigné en quelques clics, le tout alimenté par l’IA open‑source.

Original Article: Voir l’original

Partager cet article