Stability AI の最新発明である Stability Video Diffusion が示すように、生成 AI は 1 年間で「単純な」テキスト アシスタントから、画像作成者、ビデオ ジェネレータへと進化しました。
主要な言語モデルと AI のニュースを少しでもフォローしていると、次のような名前が表示されます。安定した AI はおなじみのはずです。この会社はOpenAIやGoogleに比べて知名度は低いですが、すでに以下のようなAIを作っています。安定した拡散Midjourney や DALL-E のように、次のことが可能になります。テキストの説明から画像を生成する、あるいはスケッチを図面に変える Stable Doodle。
同社のエンジニアは、これまでの研究に基づいて、人工知能の次の進化を今日発表しました。多かれ少なかれリアルなビデオの作成高解像度で。 Stable Diffusion によって作成された潜在ビデオ放送モデルにより、次のことが可能になります。テキストの説明から画像とビデオを生成する。彼らのスタイルは、写実的な写真から抽象芸術まで多岐にわたります。この結果を達成するために、Stability AI はAI作品への時間的次元そして「各フレームを小規模で高品質のビデオ データセットに調整しました。」
この AI を使用すると、テキストの説明から高品質のビデオを作成できます
とはいえ、Stable Video Diffusion を使用して長編映画を作成したい場合は、すぐに Github に急ぐ必要はありません。現在のテクノロジーでは、解像度 1024 x 576 ピクセルで最大 25 フレーム/秒 (SVD は SVD と SVD-XT の 2 つの形式で提供されます) で 2 秒しか生成できません。同社はこの点について「このモデルはそうではありません」と主張しているので、それは問題ではありません。現段階では、現実世界や商用アプリケーションを目的としていません。安全性と品質に関するご意見やコメントは、このモデルを改良して公開できるようにするために重要です。 »
こうした制限にもかかわらず、YouTube で公開されているビデオを見れば、SVD によって安定性 AI が確かに開かれつつあることを十分に納得できるでしょう。AI支援によるビデオ制作の時代すべてのために。