ChatGPT の作成者である OpenAI は、短いテキストの説明を取得して詳細なビデオ クリップに変換できる、Sora と呼ばれる注目すべき新しい生成ビデオ モデルを発表しました。彼について私たちが知っていることは次のとおりです。
Google は新しい Gemini 1.5 AI を発表したばかりですが、OpenAI は最初の有能なツールである Sora ですぐに反撃しましたテキストをビデオに変換するにはでした最大持続時間は 1 分です。Sora はデジタル ツールボックスの単なるアプリケーションではありません。これは、クリエイターと一般大衆にとっての未来を象徴しているようです。
実際、私たちはここで、によって提案された結果からはほど遠いところにいます。Runway AI、ビデオを生成できるもう一つのテクノロジー数秒のかなりぼやけていて、途切れ途切れで、歪んでいて、時にはまったく不快なものです。
OpenAI は、新しいシステムを日本語の「Sora」にちなんで名付けました。シエル」。研究者のティム・ブルックス氏とビル・ピーブルズ氏を含むこの技術の背後にあるチームは、次のような理由からこの名前を選んだと伝えられています。無限の創造的可能性のアイデアを呼び起こす»。
OpenAI は、新しい人工知能によって生成されたいくつかのビデオ クリップを共有しましたが、その結果は控えめに言っても素晴らしいものです。それらの 1 つで、次のリクエストを読み取ることができます。美しい雪の街・東京が本格的に動き出す。カメラはにぎやかな市内の通りを移動し、美しい雪の天気を楽しんだり、近くの屋台で買い物を楽しんだりする数人の人々を追っています。美しい桜の花びらが雪の結晶とともに風に舞う」。リクエストに応じて、生成されたビデオは東京の路上で行われ、次のことを明確に示しています。ソラは、オブジェクトが 3D でどのように組み合わされるかを学びました。次にカメラはシーンに潜り込み、店の列を通り過ぎていくカップルを追跡します。
OpenAI ツールのビデオは、たとえ小さな欠陥に気づくことがあっても、他の既存のツールが提供するものよりもはるかに説得力があります。そのうちの1つで、通りを歩いている女性を見て、私たちは次のように気づきました。いくつかの画像では、彼の足が動きに正しく追従していないことがわかります。
こちらもお読みください–OpenAIは開発中のこの新しい検索エンジンで本当にGoogleを潰したいと考えている
ソラはまだ誰もが利用できるわけではありません
現時点では、Sora はまだ開発段階にあるため、一般公開されていません。しかし、OpenAIはすでにこのツールを特定の学者や他の研究者と共有しており、彼らはそれを「レッドチーム」に提出することになる。これは、以下の責任を負う少人数のグループです。そのテクノロジーがもたらす危険性を理解することを目的として、それを悪用するあらゆる方法を研究してください。
確かなことは、OpenAI は次のことを行う必要があるということです。自分たちの動画が誤った情報に使用されないようにする方法を見つける, なぜなら、一部の人々が論争を引き起こす可能性のある偽のビデオを作成して楽しんでいる可能性があると想像しているからです。今月初め、OpenAIはテキストから画像への変換ツールDALL-E 3に透かしを追加すると発表したが、透かしは「簡単に削除できる」と述べた。したがって、同社が偽ビデオを簡単に識別できるようにする新しい方法に取り組んでいることを願っています。
OpenAI は、選ばれたビジュアル アーティスト、デザイナー、映画製作者にフィードバックを求めるアクセスも提供します。彼女は、既存のモデルは複雑なシーンの物理を正確にシミュレートしていない可能性があり、原因と結果の一部のケースを正しく解釈できない可能性があると指摘しています。このテクノロジーは、より広く利用できるようになるまでに、まだ成熟する必要があります。