Huobao Drama:オープンソースAI短編ドラマジェネレーター

Huobao Drama:オープンソースAI短編ドラマジェネレーター

ショートフォーマットの動画はTikTokのクリップやYouTube Shortsなど、あらゆる場所に存在しますが、創作サイクルは依然として多く手作業が必要です。作家はアウトラインを作り、アーティストが描き、編集者が組み立てます。Huobao Drama は、単一行のテキストを仕上げられたマイクロフィルムへと変換することで、このサイクルを打破し、完全にオープンソースソフトウェアと大規模言語モデル(LLM)によって動力を得ています。

なぜオープンソースの短編ドラマツールキットが必要か?

  • AIコンテンツ制作の民主化 – 少人数チームでも高級感のあるクリップを、高価な専用ツールを使わずに作れます。
  • カスタマイズ性 – 独自のLLM、画像や動画モデルをプラグインし、スタジオのパイプラインに合わせてワークフローを調整できます。
  • コミュニティ主導の成長 – GitHubの貢献者からDiscordでのディスカッションまで、プロジェクトはコミュニティのフィードバックと機能要望により発展しています。

コアアーキテクチャ

スタックは4層にきちんと分割されており、ビジネスロジックをクリーンに保ちつつインフラをモジュール化するドメイン駆動設計(DDD)の原則に従っています。

├─ API Layer (Gin HTTP)          // Exposes REST endpoints
├─ Application Services Layer    // Orchestrates domain logic
├─ Domain Layer                  // Models for scripts, scenes, characters
└─ Infrastructure Layer          // Database, AI clients, file storage

バックエンドはGo(バージョン1.23+)で動作し、フロントエンドはVue 3 + TypeScript + Viteでユーザーフレンドリーに構築されています。プロジェクトはGitHubホストのmodernc.org/sqliteを使用して、純粋なGoのSQLiteドライバを提供し、C‑goの依存関係をゼロにし、クロスプラットフォームビルドを実現しています。

プラットフォームの機能一覧

  • インテリジェントなスクリプト解析 – LLMが1文入力を処理し、キャラクターリスト、設定、ストーリーボードシーンを抽出します。
  • キャラクター・シーン生成 – OpenAIやGeminiモデルが詳細な肖像画と背景画像を生成します。
  • ストーリーボード作成 – 各ショットのテキスト→画像プロンプトを生成し、フレームの連続を作成します。
  • 動画合成 – 2つのアプローチがあります:テキスト→動画(Sora)画像→動画(FFMPEG + モデル)。両方を組み合わせて高品質のアウトプットを実現します。
  • 編集・トランジション – 自動カット、フェードイン/アウト、音声同期を行います。
  • リソース管理 – 中央資産ライブラリ、エクスポート/インポート対応、リアルタイム進捗追跡をサポートします。

クイックスタート – Docker Compose

DockerはHuobao Dramaを試す最も簡単な方法を提供します。docker-compose.ymlファイルは最新イメージをプルし、ローカルデータディレクトリをマウント、ポート5678(API)と3012(フロントエンド)を公開します。

# Pull the image and start the stack
$ docker compose up -d

# Check logs
$ docker compose logs -f

# Stop the stack
$ docker compose down

すべての設定はconfigs/config.yamlにあります。ai.default_text_providerserver.portなどの値を初回起動前に編集してください。

開発モード – ホットリロード

フロントエンドやバックエンドを調整したいですか?リポジトリをクローンし、依存関係をインストールして、各側を別々に実行します:

# Backend
$ go run main.go
# Frontend
$ cd web && npm run dev

フロントエンドはAPIリクエストをlocalhost:5678へプロキシするように設定されているので、リアルタイムで実験できます。

貢献ガイド

  • リポジトリをフォークし、フィーチャーブランチを作成し、変更をプッシュします。
  • 明確なコミットメッセージを書き、PRタイトルは簡潔に保ちます。
  • 提出前にgo vetnpm run lintを実行します。
  • コーディング規約とテスト手順はdocs/CONTRIBUTING.mdを確認してください。

可能なユースケース

  1. 映像学校が迅速なプロトタイピングによるストーリーテリングを実験します。
  2. マーケティングチームがSNS向けブランドのマイクロビデオを制作します。
  3. コンテンツクリエイターがVlogやYouTube用に無限のアイデアを生成します。
  4. AI研究者がテキスト→動画パイプラインを準備済みパイプラインでテストします。

今後のロードマップ

  • Claude、Llama‑2など、より多くのLLMプロバイダーをサポート。
  • GPUアクセラレーション付き動画生成(ONNXランタイムのオプション)。
  • 多言語UIとスクリプト解析。
  • 制作メトリクスの分析ダッシュボード。

参加する

開発者、デザイナー、ストーリーテラーのいずれであっても、あなたに適した場所があります。GitHubリポジトリに参加し、フォークしてコーディングを始めましょう。簡単な質問はディスカッションに投稿するか、Discordでメンテナーに連絡してください。

Huobao Dramaが次の大きなアイデアを数クリックで磨き上げた短編映画に変えることを、すべてオープンソースAIで実現します。

この記事を共有