この Google AI を使用すると、数回クリックするだけでビデオを作成でき、その結果は驚くべきものになります。

ChatGPT、さらには Midjourney や Dall-E との AI 競争で意表を突かれた Google は、この熾烈な競争に追いつくために懸命に努力してきました。 Gemini の印象的なプレゼンテーションの後、Mountain View 社はまったく驚くべきビデオ生成 AI である Lumière を発表しました。

クレジット: Google

テクノロジー大手が現在リードしている人工知能の競争では、グーグルはやや遅れをとっている。マウンテン ビューの会社は、ChatGPT 現象の後に、Dall-E や Midjourney などの AI ベースの消費者向けツールが爆発的に普及することをまったく予想していなかったとしましょう。

いずれにせよ、Alphabet 子会社はゲームに復帰するために懸命に努力してきました。Bard、その会話型 AI。しかし、2023 年 12 月には、GoogleはGeminiの発表で大打撃を受けた、主な競合他社よりも大幅に効率的なまったく新しい人工知能です。チャットGPT。ジェミニはすでに統合されていることに注意してください。ピクセル8プロ、少なくとも米国では。ヨーロッパでは、GDPR によりプロセスが遅くなりました。

Google が驚異的なビデオ生成 AI「Lumière」を発表

しかし、Google はそこで止まるつもりはなく、むしろその逆です。実際、ウェブ巨人はつい最近明らかにした動画生成専用AI「Lumière」。画像を生成するよりもはるかに困難で複雑なタスクです。当然のことながら、ビデオをゼロから生成するには、AI が次のような複数の要素を考慮する必要があります。動きや装飾との相互作用の可能性(衝突、困難な地形など)。

また、アクションが互いに一貫して続く、比較的流動的なシーケンスを実現することも必要です。これを行うには、漫画のように一連の画像を組み立てるのではなく、Lumière は、オブジェクトとその動きを同時に管理することで、最初から最後までビデオを作成します。U-Net 時空間アーキテクチャは、モデルを 1 回通過することで、ビデオの時間的継続時間全体を一度に生成します。これは、離れたキーフレームを合成した後に時間的超解像を行う既存のビデオ モデルとは対照的であり、このアプローチでは全体的な時間的コヒーレンスが本質的に困難になります。」プロジェクトの背後にある研究者について説明します。

Light の機能を理解するために、科学者の Hila Chefer がいくつかの抜粋とデモンストレーションを共有しました。×。具体的には、Lumièreは解像度5秒程度の動画を生成できます。1024×1024ピクセル。これを行うには、テキストのコマンド ラインに基づいて行うことも、イメージに基づいて行うこともできます。また、静止画像の特定の部分をアニメーション化することもできます (たとえば、上のビデオで見られるように、機関車からの煙など)。いずれにせよ、可能性は存在しており、すでに素晴らしい結果が得られています。今のところ、Lumièreはまだプロジェクト段階にあり、Googleはその計画をまだ明らかにしていない。