昨日の Google I/O イベントは、主にコンピュータを利用したテクノロジーの最新の進歩を紹介することに焦点を当てていました。人工知能。
Mountain View の巨人が提供する最も重要なイノベーションの中でも、Veo は際立っています。AIを活用したビデオ作成サンダー・ピチャイと彼のチームによって開発されました。
したがって、OpenAI は月曜日に基準を引き上げようとしましたが、新しいバージョンの言語モデル GPT-4o を使用3 か月後、Google は Sora の発売に応じ、高解像度ビデオを生成するための高度なテキストから画像へのモデルの分野で競争に参入しました。
映画のために生まれた
Google は、Veo で作成されたビデオは、他の同様のツールで作成されたビデオよりも一貫性があり詳細なものになると述べています。
この利点の一部は、ユーザーの次の能力によってもたらされます。生成されたコンテンツに介入する。
クリックするだけでビデオの再生時間を延長したり、以前に得られた結果を完璧にすることができます。
同社は、Veo によりユーザーは次のようなものを作成できると主張しています。高品質の 1080p クリップ継続時間が 60 秒を超えるもの。
テキストプロンプトだけでなく、画像や動画を認識して利用することも期待されており、多用途性が実証されています。
Veo は幅広い範囲を採用できます。映画のようなスタイル自然言語を理解できるため、「タイムラプス」や「風景の航空写真」など、さまざまな専門用語を解釈できます。
このモデルはビデオの内容を学習して理解し、高解像度のサウンドと画像をレンダリングし、現実世界の物理をシミュレートして、没入型でリアルな体験を提供しようとします。
様子を見よう
Google DeepMind の CEO、デミス・ハサビス氏は、追加のプロンプト。
さらに、Google は AI がストーリーボードやより長いシーンを生成できるようにする追加機能を検討しており、これによりモデルの創造的な可能性が広がります。
ただし、Veo の利用は当初、VideoFX 内のプライベート プレビューを介して一部のクリエイターに限定されます。
ウェイティングリストへの登録はすでに始まっているが、Googleはメンバーシップが地域によって制限されていると警告した。
Veo は現在、Google のビデオ生成モデルの進化における最高点を示しています。
その間に、OpenAI はソラをハリウッドに積極的に宣伝していますまた、今年後半には Adobe Premiere Pro などのビデオ編集アプリケーションで直接一般公開する予定です。
さらに、生成されるビデオを充実させるためにオーディオを統合する計画もあります。
ビデオ生成ツールへの関心が高まる中、Veo と Sora は両方とも一般の人々を驚かせたいと考えています。
しかし、OpenAIが市場で早期にリードしたことで、Googleのプロジェクトにとって競争はさらに困難になる可能性がある。