人工知能はテキストの説明からビデオを作成する方法を認識しました

人工知能はテキストの説明からビデオを作成する方法を認識しました

Stability AI の最新発明である Stability Video Diffusion が示すように、生成 AI は 1 年間で「単純な」テキスト アシスタントから、画像作成者、ビデオ ジェネレータへと進化しました。

stability ai video
クレジット: 安定性 AI

主要な言語モデルと AI のニュースを少しでもフォローしていると、次のような名前が表示されます。安定した AI はおなじみのはずです。この会社はOpenAIやGoogleに比べて知名度は低いですが、すでに以下のようなAIを作っています。安定した拡散Midjourney や DALL-E のように、次のことが可能になります。テキストの説明から画像を生成する、あるいはスケッチを図面に変える Stable Doodle

クレジット: 安定性 AI

同社のエンジニアは、これまでの研究に基づいて、人工知能の次の進化を今日発表しました。多かれ少なかれリアルなビデオの作成高解像度で。 Stable Diffusion によって作成された潜在ビデオ放送モデルにより、次のことが可能になります。テキストの説明から画像とビデオを生成する。彼らのスタイルは、写実的な写真から抽象芸術まで多岐にわたります。この結果を達成するために、Stability AI はAI作品への時間的次元そして「各フレームを小規模で高品質のビデオ データセットに調整しました。」

この AI を使用すると、テキストの説明から高品質のビデオを作成できます

とはいえ、Stable Video Diffusion を使用して長編映画を作成したい場合は、すぐに Github に急ぐ必要はありません。現在のテクノロジーでは、解像度 1024 x 576 ピクセルで最大 25 フレーム/秒 (SVD は SVD と SVD-XT の 2 つの形式で提供されます) で 2 秒しか生成できません。同社はこの点について「このモデルはそうではありません」と主張しているので、それは問題ではありません。現段階では、現実世界や商用アプリケーションを目的としていません。安全性と品質に関するご意見やフィードバックは、このモデルを改良してリリースするために重要です。 »

こうした制限にもかかわらず、YouTube で公開されているビデオを見れば、SVD によって安定性 AI が確かに開かれつつあることを十分に納得できるでしょう。AI支援によるビデオ制作の時代すべてのために。