ByteDance フラッグシップモデル

Seedance 2.0

ByteDanceの次世代AI動画モデル、革新的な@-referenceシステムを搭載。テキスト、画像、動画クリップ、音声を単一のプロンプトで組み合わせられます。ネイティブな映像音声同期、V2V編集、最大2K解像度・30fpsの出力を、すべて統一された生成プロセスで実現します。

About

Seedance 2.0について

Seedance 2.0はByteDanceの最先端AI動画生成モデルで、2026年2月に発表されました。統合型マルチモーダル音声動画共同生成アーキテクチャを採用し、テキスト、最大9枚の画像、最大3本の動画クリップ、最大3本の音声トラックという4つの入力モダリティを同時に処理できます。画期的な@-referenceシステムを使用すると、プロンプト内の特定の要素にタグを付け、アップロードした参照ファイルにバインドすることで、カメラの動き、キャラクターの外見、音声のリズム、視覚スタイルを細かく制御できます。出力は最大2K解像度に達し、多言語リップシンク、効果音、背景音楽を含むネイティブ同期音声に対応しています。

Seedance 2.0について

Seedance 2.0の主な機能

@-Referenceシステム

プロンプト内で@Image、@Video、@Audioラベルを使用する革新的な参照タグ付け機能。特定の要素をアップロードしたファイルにバインドし、カメラの動き、キャラクターの動作、音声リズム、視覚スタイルを精密に制御できます。

4モダリティ入力

テキスト、最大9枚の画像、最大3本の動画クリップ、最大3本の音声トラックを単一の生成リクエストで組み合わせられます。Seedance 2.0は4つの入力タイプすべてを同時に処理する最初のモデルです。

ネイティブ音声映像同期

音声と映像の統合合成により、リップシンク対応の台詞、効果音、背景音楽を視覚出力と同期して生成します。音素レベルの精度で多言語リップシンクに対応しています。

V2V動画編集

参照-to-動画モードで既存の動画を編集。アップロードしたクリップから動作パターン、カメラパス、テンポを転写します。元の構造を保持したまま、服装の変更、アクションの修正、要素の置き換えが可能です。

2K解像度&30fps

ネイティブ2K(2048×1080)出力、30fps、複数の品質レベルに対応:480p、720p、1080p。生成あたりの動画長は4〜15秒です。

マルチショットキャラクター一貫性

同じキャラクターを様々な角度から撮影した複数の参照画像をアップロード。Seedance 2.0は、生成された複数のクリップ間で顔、服装、身体プロポーション、アクセサリーの一貫性を維持します。

公式ショーケース

公式ショーケース

Seedance 2.0のマルチモーダル参照制御、ネイティブ音声生成、動画編集機能をご覧ください

全モダリティを組み合わせたマルチ参照プロンプト
@-Referenceシステム

@Image1が@Image2の中を歩く、@Video1のカメラワーク、@Audio1の背景音楽

全モダリティを組み合わせたマルチ参照プロンプト

音声ビート参照でガイドされるキャラクターの動き
@-Referenceシステム

@Image1のキャラクターが@Audio1のリズムに合わせて@Image3の環境で踊る

音声ビート参照でガイドされるキャラクターの動き

視覚コンテンツと同期したリップシンク台詞
ネイティブ音声生成

英語の同期音声とスライド遷移を伴うプレゼンテーションを行う人物

視覚コンテンツと同期したリップシンク台詞

料理動作と同期したナレーション
ネイティブ音声生成

ステップバイステップのナレーションと台所の環境音を伴う料理チュートリアル

料理動作と同期したナレーション

FAQ

Seedance 2.0 FAQ

Seedance 2.0 FAQ

@-referenceシステムは、プロンプト内の要素を@Image1、@Video1、@Audio1ラベルでタグ付けし、アップロードした参照ファイルにバインドできる機能です。Seedance 2.0は動画参照からカメラの動き、音声からビートリズム、画像から構図スタイルを抽出します。これにより、生成される動画のあらゆる側面を細かく制御できます。

Seedance 2.0は4つの入力モダリティを同時にサポートします:テキストプロンプト(長さ無制限)、最大9枚の参照画像(各30MB以下)、最大3本の動画クリップ(合計2〜15秒、各50MB以下)、最大3本の音声トラック(合計15秒以下、各15MB以下)。ファイル総数制限:リクエストあたり最大12ファイルです。

Seedance 2.0はネイティブ2K(2048×1080)解像度、30fpsで出力し、複数の品質レベル(480p、720p、1080p)に対応しています。生成あたりの動画長は4〜15秒です。対応アスペクト比は横長、縦長、21:9ウルトラワイドです。

Seedance 2.0はデュアルブランチアーキテクチャを採用し、動画と音声の潜在表現を並列処理します。音声は映像と同時に生成されるため、ミリ秒単位の同期が保証されます。多言語リップシンク台詞、動作に合った効果音、雰囲気に適した背景音楽をサポートしています。また、音声参照を入力としてアップロードすることも可能です。

V2V編集は、既存の動画クリップを参照としてアップロードし、その動作パターン、カメラパス、テンポを継承した新しい動画を生成できる機能です。元の動作構造を保持したまま、服装、アクション、シーンの詳細などの特定の要素を変更できます。

Seedance 2.0は動画と音声の参照入力を新たに追加し、画像参照を1枚から9枚に増加、@-referenceシステムによるマルチモーダル制御を導入、V2V動画編集を追加、最大解像度を1080pから2Kに拡張、長さを12秒から15秒に延長し、1.5 Proと比較して約30%高速化されています。

Seedance 2.0は解像度に基づく秒単位の動的料金設定を採用しています:480p(14〜28クレジット/秒)、720p(28.5〜57クレジット/秒)、1080p(640〜3,810クレジット/秒)。標準と高速の2つの速度バリエーションがあり、高速版は約30%高速です。

Seedance 2.0は、精密なモーション制御が必要な映像ディレクター、ポストプロダクション不要でネイティブ音声同期を求めるコンテンツクリエイター、ブランド動画コンテンツを制作する広告主、ナレーション付きチュートリアルを作成する教育者、そしてプロ品質のAI動画と同期サウンドを必要とするすべての方に最適です。

Testimonials

クリエイターが語るSeedance 2.0の魅力

@-referenceシステムは本当に革新的です。参照クリップからカメラの動きを抽出して即座に適用できる — まったく新しいクリエイティブワークフローです。

Alex Kim

Alex Kim

映像ディレクター

Alex Kim: “@-referenceシステムは本当に革新的です。参照クリップからカメラの動きを抽出して即座に適用できる — まったく新しいクリエイティブワークフローです。

Priya Sharma: “ネイティブ音声同期のおかげで後処理の時間が大幅に短縮されました。非英語の台詞でもリップシンクの精度が驚くほど高いです。

Lucas Müller: “V2V編集を使えば、撮り直しをしなくても既存の映像を強化できます。Seedance 2.0は今や私たちの制作パイプラインの中核ツールです。

Yuki Tanaka: “4モダリティ入力は状況を一変させます。キャラクターデザイン、カメラワークの参考、背景音楽をすべて1つのプロンプトに入れれば、思い描いた通りのものが得られるのです。

他のAI動画モデルを探索

Grok Video

Grok Video

新着

Grok Video(Grok Imagine Video採用)は、Grokエコシステムに直接組み込まれたxAIの動画生成モデルです。独自のAuroraエンジンを搭載し、テキストプロンプトや静止画像を同期オーディオ付きのショート動画クリップに変換します。Grok Videoの特長はそのスピード——クリップを数分ではなく数秒で生成——に加え、リアルタイムWebデータアクセスによる最新かつ関連性の高いビジュアル参照にあります。プロンプトへの忠実性と自然な動きの一貫性を重視しており、迅速なソーシャルメディアコンテンツ、高速プロトタイピング、反復的なクリエイティブワークフローに最適です。

今すぐ試す

Seedance 2.0で今すぐ作成を始める

Seedance 2.0 — ByteDanceが誇る最先端の動画生成AIをオンラインで無料体験

user 1
user 2
user 3
user 4
user 5

10,000+ users