開始・終了フレームによる動画生成
開始画像と終了画像を指定して、1 本の動画を生成できます。Veo 3.1 が中間ショットを自動で構築するため、自然な遷移と高いストーリー制御が可能です。
Google Veo 3.1 は、複数要素の合成、クリップの延長、開始フレームと終了フレームを使った動画生成に対応しています。時間的な理解力とマルチモーダル制御がさらに強化されており、複雑なシーンでも人物や環境の一貫性を保ちながら、高品質な映像、滑らかなカメラ遷移、そして精密に同期したネイティブ音声を実現します。
ショット制御、シーン継続性、音声同期まで、Veo 3.1 は本番運用レベルの動画ワークフロー向けに設計されています。
開始画像と終了画像を指定して、1 本の動画を生成できます。Veo 3.1 が中間ショットを自動で構築するため、自然な遷移と高いストーリー制御が可能です。
最大 3 枚の参照画像を使って、人物のアイデンティティ、ビジュアルスタイル、特定要素を保ちながら動画を生成できます。キャラクター重視の演出やブランド動画に適しています。
映像と同期した高品質な音声を自動生成し、会話、環境音、空気感まで含めて、より没入感のある動画に仕上げます。
複数のショットやシーンをまたいでも、人物の見た目、服装、特徴を安定して維持できるため、ストーリーテリングや連続コンテンツに適しています。
Veo 3.1 は複雑なテキスト指示を正確に理解し、創造的なコンセプト、動きのディテール、シーン文脈を高い忠実度で動画に変換できます。
既存クリップに自然につながる新しいセグメントを生成し、映像スタイルと音の連続性を保ったまま長さを拡張できます。
Veo 3.1 は、開始画像と終了画像から動画を生成できます。2 枚の間に自然で滑らかな遷移を自動で構築し、中間シーケンス全体を作りながら、それに合った音声も同時に生成します。
開始フレームと終了フレームを導入と締めのショットとして使い、カップルがカフェに入り、席に着いてコーヒーを飲み、その後楽しそうに会話を始める 10 秒の滑らかなトランジション動画を生成する。
この機能では最大 3 枚の参照画像を使って、生成結果のビジュアルスタイルを定義できます。人物、衣装、シーン設計の連続性を保ちたいときに特に効果的です。



青と金を基調にした豪華な宮殿ホールを舞台にしたシネマティックなファッション広告。モデルの顔と髪型は人物参照画像と一致させる。衣装参照画像のベージュのプリーツスカートと黒のノースリーブトップを着用し、ブラウンのショルダーバッグとサングラスを合わせる。モデルはホールの片側から優雅にフレームインし、カメラがなめらかに追従する。ラグジュアリーなファッションフィルムの質感を目指す。
Veo 3.1 は、Veo 3 を印象づけたネイティブ音声生成をそのまま受け継いでいます。映像だけでなく、シーンに合った雰囲気、効果音、空気感までを同期したサウンドとして組み立てられます。
夜明けの海辺。黄金色の光が水面にきらめき、波が何度も砂浜に打ち寄せる。サーファーがボードを抱えて海へ向かって歩き、カメラは浜辺からゆっくりと人物を追う。自然音として、波音、海風、遠くのカモメ、砂を踏む細かな音が聞こえる。リアルな空気感と映画のような海岸風景。
雨の夜の街角にあるカフェ。窓には雨粒が当たり、店内はやわらかく温かな光に包まれている。バリスタがカウンターでコーヒーを淹れ、蒸気がゆっくりと立ちのぼる。カメラはコーヒーカップへ静かに寄っていく。自然音として、窓を打つ雨音、コーヒーマシンの蒸気音、カップが触れ合う軽い音、遠くで交わされる会話のざわめきがある。映画的で没入感のある映像。
キャラクターの一貫性は、AI 動画でも特に求められる機能です。Veo 3.1 はショットをまたいでも人物の同一性を安定して保てるため、短い物語や複数カット構成でも映像全体にまとまりが出ます。
短い髪の若い旅行者。黄色いジャケットを着てカメラを持っている。1つ目のショットではパリのエッフェル塔の前を歩く。2つ目のショットでは夜の東京のネオン街で写真を撮る。3つ目のショットではニューヨークのタイムズスクエアの人混みの中を歩く。すべてのショットで同じ顔立ち、髪型、服装を維持する。映画的なカメラワーク、旅のドキュメンタリー調、リアルな都市環境。
Veo 3.1 は複雑なテキスト記述を正確に理解し、創造的なコンセプト、動きのディテール、シーン文脈を高精度な動画へと変換します。
夕暮れの海沿いの道路。ひとりの少年が自転車で海岸線に沿って進んでいく。カメラは高い空撮視点からゆっくり下降し、道路に近づいたあと、横から追いかけるショットに切り替わる。海風が服を揺らし、遠くでは波が岩に打ちつけている。最後は逆光の正面アングルへ移動し、地平線上に金色の夕日が輝く。映画的なカメラ言語とリアルな自然光。
雨の夜の未来都市の通り。濡れた路面にはネオンが鮮やかに反射している。トレンチコート姿の探偵が通りの中央を歩き、その周囲には高層のサイバーパンク建築が立ち並ぶ。細かな雨が降り続き、遠くの広告スクリーンが点滅する。サイバーパンクとクラシックなフィルムノワールを融合し、彩度を抑えた照明と強い影のコントラストで映画的な質感を作る。
シーン拡張を使えば、物語を最初の結果で終わらせずに続けられます。Veo 3.1 は前のクリップの最後の瞬間を自然な起点として、次のセグメントを生成できます。
夜の都市広場。街灯の下でストリートヴァイオリニストが演奏し、やわらかな光が地面を照らし、静かな通りに音が響いている。
若いピアニストが移動式ピアノを広場まで押してきて、ヴァイオリニストと一緒に演奏を始める。通りすがりの人たちが少しずつ足を止めて耳を傾ける。
さらにミュージシャンが加わる。ドラマーとサックス奏者が参加し、演奏はよりにぎやかになり、観客が輪を作り始める。
音楽は続き、広場の観客はリズムに合わせてゆっくりと体を揺らす。街の灯りと夜景が溶け合い、広場全体が熱気ある即興コンサートへと変わっていく。
クイックガイド
Veo 3.1 のジェネレーターを開き、目的に合った動画モードを選んで、プロンプトと参照素材を組み合わせれば、より高い制御性と一貫性を持つ AI 動画を作成できます。
ステップ 1
Veo 3.1 の動画生成ページを開く して Veo 3.1 を選択し、テキストから動画、画像から動画、frame-to-frame、複数参照生成など必要なワークフローに切り替えます。
ステップ 2
プロンプトを入力するか、開始フレーム、終了フレーム、参照画像をアップロードして、人物、シーン、ショットのつながりを細かく調整します。
ステップ 3
生成設定を調整して矢印ボタンを押し、出力パネルから結果の再調整、ダウンロード、延長を続けます。
まだ質問がありますか?
ご不明な点があれば、こちらまでお問い合わせください:
Google Veo 3.1 は、Google が提供する次世代の AI 動画生成モデルです。改良された Veo 3 アーキテクチャをベースにしており、テキストプロンプトや画像入力から高品質な動画を生成できます。従来版よりもプロンプト理解が正確になり、開始・終了フレーム制御や参照画像によるスタイル合わせにも対応しつつ、キャラクターの一貫性やネイティブ音声生成も高い水準で維持しています。
はい。Veo 3.1 は映像を生成するのと同時に、ネイティブ音声も自動で生成できます。会話、環境音、背景の空気感まで、シーンに合った音を作り出せるため、AI 動画がよりリアルで没入感のある仕上がりになります。
frame-to-frame 機能では、開始画像と終了画像をアップロードできます。Veo 3.1 はその 2 枚の間をつなぐ連続した映像を生成し、自然で滑らかなトランジションを作ります。ビジュアル変形、シーン転換、物語性のある映像表現に特に向いています。
このワークフローでは、人物画像、シーン画像、スタイル参照など複数の素材を使って動画を生成できます。Veo 3.1 はそれらの要素をまとめて理解し、内容の整合性とビジュアルの統一感を保った 1 本のクリップに融合します。
はい。新規ユーザーには通常、Veo 3.1 を試せる無料クレジットが一定量付与されます。テキストや画像から動画を作成し、無料枠の範囲内でモデルの性能を試すことができます。
はい。Veo 3.1 は正確なモーション表現、安定したキャラクター一貫性、柔軟なスタイル制御を備えているため、広告制作、短尺動画、プロレベルのコンテンツ制作にも十分対応できます。