Netflix VOID：从视频中移除物体及交互

April 05, 2026

分类: 实用开源项目

标签:

Netflix VOID：具备物理感知的革命性视频物体移除

Netflix 已开源 VOID（Video Object and Interaction Deletion，视频物体及交互删除），这是一个超越传统视频修复的先进模型。VOID 不仅仅擦除物体——它还会移除物体与环境的物理交互，创造出令人难以置信的真实效果。

传统视频编辑工具难以处理次级运动效果。移除一个手持吉他的人的时候？吉他会悬浮在空中。VOID 解决了这个问题：

https://github.com/Netflix/void-model/raw/main/assets/teaser-with-name.mp4

# 1. 打开 Colab 笔记本（推荐 40GB+ VRAM）
# 2. 模型自动从 Hugging Face 下载
# 3. 几分钟内处理示例视频

实时演示：Gradio 接口

my-video/
├── input_video.mp4
├── quadmask_0.mp4
└── prompt.json  # {"bg": "A table with a cup on it."}

VOID 提供完整的数据生成流水线：

生成配对的反事实视频（有/无物体）并训练两阶段模型。

VOID 代表了视频理解的前沿——结合 VLM 推理、SAM2 分割和扩散模型，实现前所未有的视频操作能力。

原始文章: 查看原文