Netflix VOID：動画から物体と相互作用を除去

April 05, 2026

タグ:

Netflix VOID：物理認識による革新的な動画物体除去

NetflixはVOID (Video Object and Interaction Deletion)をオープンソース化しました。これは従来の動画補完を超えた最先端モデルです。VOIDは単に物体を消すだけでなく、環境との物理的相互作用を除去し、驚くほど現実的な結果を生み出します。

従来の動画編集ツールは二次運動効果に苦戦します。ギターを持った人を除去しても、ギターが浮いたままになります。VOIDはこれを解決します：

https://github.com/Netflix/void-model/raw/main/assets/teaser-with-name.mp4

# 1. Colabノートブックを開く (40GB+ VRAM推奨)
# 2. モデルをHugging Faceから自動ダウンロード
# 3. サンプル動画を数分で処理

ライブデモ: Gradio Interface

my-video/
├── input_video.mp4
├── quadmask_0.mp4
└── prompt.json  # {"bg": "A table with a cup on it."}

VOIDには完全なデータ生成パイプラインが付属：

ペアの反事実動画（物体あり/なし）を生成し、両パスをトレーニング。

VOIDは動画理解の最先端を体現 – VLM推論、SAM2セグメンテーション、拡散モデルを組み合わせ、前例のない動画操作能力を提供します。

オリジナル記事: オリジナルを表示