Huobao Drama:开源 AI 短剧生成器

Huobao Drama:开源 AI 短剧生成器

短视频无处不在——从 TikTok 片段到 YouTube Shorts——但创作流程仍然高度手工。作家撰写剧本,艺术家绘制分镜,编辑人员组装。Huobao Drama打破这一循环,凭借完全开源的软件和大型语言模型(LLMs),将一句话直接转化为完成的微电影。

为何选择开源短剧工具包?

  • AI 内容创作民主化 – 小团队即可在无需昂贵专有工具的情况下制作出专业级片段。
  • 可定制性 – 插入你自己的 LLM、图像或视频模型,调整工作流以匹配你工作室的流程。
  • 社区驱动增长 – 从 GitHub 合作者到 Discord 讨论,项目依赖社区反馈与功能需求蓬勃发展。

核心架构

该技术栈清晰划分为四层,遵循领域驱动设计(DDD)原则,保持业务逻辑清晰、基础设施模块化。

├─ API Layer (Gin HTTP)          // 暴露 REST 接口
├─ Application Services Layer    // 编排领域逻辑
├─ Domain Layer                  // 脚本、场景、角色模型
└─ Infrastructure Layer          // 数据库、AI 客户端、文件存储

Go 驱动后端(版本 1.23+),Vue 3 + TypeScript + Vite 构建易用前端。项目使用 GitHub 托管的 modernc.org/sqlite,提供纯 Go SQLite 驱动,确保零 C‑Go 依赖并支持跨平台构建。

平台能做什么

  • 智能剧本解析 – LLM 处理一句输入,提取角色列表、场景设定和分镜故事板。
  • 角色与场景生成 – OpenAI 或 Gemini 模型生成细致人像和背景图像。
  • 分镜制作 – 为每个镜头生成文本到图片提示,创建连续帧序列。
  • 视频合成 – 两种方式:文本到视频 (Sora)图像到视频 (FFMPEG + 模型)。两者组合可实现高质量输出。
  • 编辑与过渡 – 自动剪辑、淡入淡出与音频同步。
  • 资源管理 – 集中资产库、导入导出支持,以及实时进度跟踪。

快速开始 – Docker Compose

Docker 是尝试 Huobao Drama 的最简捷方式。docker-compose.yml 文件拉取最新镜像,挂载本地数据目录,暴露 5678(API)和 3012(前端)端口。

# 拉取镜像并启动栈
$ docker compose up -d

# 查看日志
$ docker compose logs -f

# 停止栈
$ docker compose down

所有配置位于 configs/config.yaml。在首次启动前,请编辑 ai.default_text_providerserver.port 等参数。

开发模式 – 热重载

想要修改前端或后端?克隆仓库,安装依赖后分别运行各部分:

# 后端
$ go run main.go
# 前端
$ cd web && npm run dev

前端已配置为代理 API 请求至 localhost:5678,从而可以实时实验。

贡献指南

  • Fork 仓库,创建功能分支,推送更改。
  • 撰写清晰的提交信息,并保持 PR 标题简洁。
  • 提交前运行 go vetnpm run lint
  • 查看 docs/CONTRIBUTING.md,了解编码规范与测试说明。

潜在用例

  1. 影像学院尝试快速原型化故事叙述。
  2. 营销团队为社交媒体制作品牌微视频。
  3. 内容创作者为 Vlog 或 YouTube 生成无尽创意。
  4. AI 研究人员使用现成管线测试文本到视频流程。

未来路线图

  • 支持更多 LLM 提供商(Claude、Llama‑2)。
  • GPU 加速视频生成,可选 ONNX 运行时。
  • 多语言 UI 与剧本解析。
  • 生产指标分析仪表盘。

参与进来

无论你是开发者、设计师还是讲故事的人,都有属于你的舞台。加入 GitHub 仓库,fork 并开始编码。若有快速问题,欢迎在 讨论区 留下备注,或在 Discord 上联系维护者。

让 Huobao Drama 在数次点击中把下一个大创意变成精致短片,全部由开源 AI 提供动力。

原创文章: 查看原文

分享本文