あらゆる入力から何かを作成する
Gemini Omni はビデオから始まり、Gemini の推論と生成的な創造を結び付けます。
Gemini Omni は、自然なステップバイステップのビデオ編集、テキスト、画像、ビデオ、オーディオ参照、世界の知識、現実世界の物理学、一貫したマルチターン作成をサポートしています。
Gemini Omni ビデオ モデルがクリエイティブの生成、ビデオ編集、リファレンス コントロール、マルチモーダル ストーリーテリングをどのようにサポートしているかをご覧ください。
会話型ビデオ編集
アクション、ビジュアルスタイル、シーンの詳細を自然言語で編集します。
マルチモーダルなビデオ作成
プロンプトとマルチモーダルなリファレンスから一貫したビデオを作成します。
リファレンスガイド付き制御
画像、ビデオ、またはオーディオのリファレンスを使用して、最終出力をガイドします。
映画のようなシーンの生成
現実世界のロジック、モーション、映画のような構成を紹介します。
クリエイティブな製品クリップ
コンセプト、広告、製品ストーリー、短い形式のコンテンツに役立ちます。
ソーシャルビデオの例
Gemini ビデオのサンプルは、視聴者向けの簡単なクリップ用に作成されています。
文字とスタイルの一貫性
繰り返しを通じて、対象と環境の一貫性を保ちます。
動きとカメラの方向
プロンプトの指示でペーシング、モーション、フレーミングを制御します。
ストーリー主導のビデオ出力
さまざまなソース素材を 1 つのまとまりのある結果に結合します。
ビデオの作成、編集、参照、生成の透明性に関する Gemini Omni 機能の実践的な概要。
あらゆる入力から何かを作成する
Gemini Omni はビデオから始まり、Gemini の推論と生成的な創造を結び付けます。
自然なマルチターン会話
一貫したシーンを変更後も維持しながら、ビデオを段階的に編集します。
テキスト / 画像 / ビデオ / オーディオ
複数のリファレンス入力を単一のまとまった出力に変換します。
歴史、科学、背景
Gemini の知識を使用して、ビデオ ストーリーを現実世界のロジックに基づいて作成します。
動きと力
重力、運動エネルギー、流体力学、アクションに適切に追従する動きを生成します。
Gemini / Google Flow / YouTube Shorts
Google は、テクノロジーを試すための Gemini、Google Flow、および YouTube Shorts をユーザーに示します。
SynthID および C2PA
Google には、Gemini app、フロー、または YouTube で作成または編集されたコンテンツには透かしと認証情報が含まれていると記載されています。
ティアと地域によって異なります
Google では、Google AI のサブスクリプションが必要であり、機能は階層と地域によって異なることに注意してください。
Gemini Omni は、AI ビデオをワンショット生成から、会話的で参照を意識した反復的な作成へと推し進めます。
このモデルは、ビデオへのプロンプトの作成だけでなく、自然言語による既存のビデオの編集にも重点を置いています。
画像、ビデオ、オーディオ、テキストは、スタイル、主題、モーション、コンテキストの参照として連携できます。
物理的な直観とGemini世界の知識は、出力がより一貫性があり、ストーリーを意識するのに役立ちます。
検索目的に関しては、Gemini Omni は単なるテキストをビデオに変換するツールではありません。その差別化要因は、会話形式の編集、マルチモーダルな参照、Gemini 世界の知識です。
アクション、スタイル、エフェクト、カメラの方向に対する段階的な変更を依頼します。
画像、テキスト、ビデオ、またはオーディオを創造的かつ構造的な参照として使用します。
歴史、科学、数学、文化に関するGeminiの知識は、成果を基礎づけることができます。
公式の位置づけでは、力、動き、一貫したシーンのロジックが強調されています。
Gemini、Google Flow、YouTube Shorts は主要な公式アクセス サーフェスです。
Google は SynthID の透かしと C2PA のコンテンツ認証情報を強調表示します。
| 能力 | Gemini Omni | Veo / Gemini 動画 | クラシックなビデオジェネレーター |
|---|---|---|---|
| 自然言語ビデオ編集 | 強い | 部分的 | 限定 |
| テキストからビデオへ | 強い | 強い | 強い |
| 画像/ビデオ/オーディオのリファレンス | 強い | 部分的 | 部分的 |
| マルチターンの一貫性 | 強い | 部分的 | 限定 |
| 世界の知識と科学の背景 | 強い | 部分的 | 不明 |
| SynthID / C2PA の透明度 | ハイライト表示 | Google エコシステム | 異なります |
強い
製品例によって明示的に強調されています。
部分的
一部の製品サーフェスまたはワークフローを通じて利用できます。
不明
公式ページには実装の完全な詳細は記載されていません。
機能、プラン、利用可能な地域は変更される可能性があります。ご購入前に商品ページをご確認ください。
Gemini Omni の検索目的を中心に構築されています: 作成、編集、リファレンス、シーン ロジック、クリエイティブなビデオのサンプル。
アクション / スタイル / エフェクト
自然言語を使用して、アクション、環境、素材、または視覚的な扱いを変更します。
キャラクター・商品・シーン
参照画像とクリップをより一貫性のある主題とシーンに変換します。
物理学 / 生物学 / 歴史
Gemini の知識を使用して、より論理的な教育ビデオのストーリーを作成します。
ショートパンツ / リール / TikTok
ソーシャル プラットフォーム向けに創造的な短いクリップや視覚的な実験を生成します。
キャンペーン / 商品 / ストーリー
公式の例を製品ビデオ、広告、ブランド ストーリーテリングのインスピレーションとして使用します。
テキスト / 画像 / ビデオ / オーディオ
さまざまな入力を 1 つのコヒーレントなビデオ出力に結合します。
研究から実稼働への移行: 計画を選択し、プロンプトと参考資料を準備して、製品内で生成を開始します。
Gemini Omni は、ビデオから始まるマルチモーダルな作成および編集モデルです。
編集、参照、モーション、シーンの一貫性がどのように処理されるかを学びます。
アクション、シーン、参照、サウンド、カメラ、およびネガティブ制約を指定します。
サブスクリプション層と利用可能な地域に応じて、Gemini または Google Flow を開きます。
Gemini Omni の主要な検索質問に対する回答。