Nvidia は、ACE でビデオ ゲームの世界に再び革命を起こすつもりです。このテクノロジーは、人工知能を使用して仮想冒険の中で出会うキャラクターに命を吹き込み、彼らとスムーズに会話できるようにすることを目的としています。デモを試すことができました。
想像する。あなたは最新の大型ビデオ ゲームの前でリラックスしています。広大なオープンワールドに放り込まれたあなたは、少し迷ってしまいます。現在のクエストでは、生き物を殺すように求められていますが、それがどこに隠れているのかわかりません。したがって、反射的に地元の村人に尋ねに行きます。あなたはルート上で最初の農家に出会い、会話を始めます。画面上で開く従来のダイアログ ボックスの代わりに、マイクを介してダイアログ ボックスに直接話しかけると、AI のおかげで自然に応答します。これが、ACE が提供したいシナリオのタイプです (Avatar Cloud Engine)。 Nvidia、その新テクノロジーこれにより、ビデオゲームのキャラクターに人工知能が命を吹き込むことができます。
デモを試すことができましたそして私たちは感動しました。しかし、私たちにはまだ多くの不確実性と疑問が残っています。
エース、それはどのように機能しますか?
このシステムを作成するために、Nvidia は RTX カード (世代に関係なく) に含まれる NPU に依存しています。クラウド上でも。アメリカの会社が協力したコンバイ, Ubisoft、MiHoYo、Tencent など、さまざまなパブリッシャーのキャラクター作成を担当する会社です。彼女はゲーム用の NPC をあらかじめ決められた外見、ストーリー、セリフ、声、行動を想像してデザインします。
ACEではプレイヤーがキャラクターに近づくと、彼は彼女と話すためにマイクを使わなければなりません。彼の声は GPU によって文字に変換され、そのテキストが Nvidia のサーバーに送信されます。その後、ACE は AI を使用して複雑な応答を開発します。音声に変換されてPCに送信されます。顔とアニメーションの管理 (Audio2Face) は、GeForce RTX カードによって管理されます。最後に、キャラクターは合成ではあるが信頼できる声で応答します。
私たちはバーテンダーを脅しましたが、彼はうまく受け止めてくれました
ACEを1時間試すことができましたアンリアル エンジン 5 で作成されたデモによるものです。私たちは、サイバーパンク 2077 に登場するディストピア都市にあるラーメン バーに入りました。そこには 2 人の人物がいました。ボスと、本職のサイバー セキュリティ専門家である顧客です。
いずれかの文字にカーソルを合わせると、私たちはマイクに向かって自分の声で彼に話すことができました。そこで私たちは専門家に相談しました。正直に言うと、最初の行ではインスピレーションが少し足りませんでした。 「」に限定されていました。こんにちは、あなたの名前は何ですか?どんなお仕事をしていらっしゃいますか?どこに住んでいますか? »。しかし、答えは溢れ出てきました。若い女性は私たちに理路整然と話しました。最初の心のこもったやりとりの後、さらにリラックスした私たちは、彼女の好きな映画は何なのか、一緒にディズニーランドに行きたいのか、あるいはフォノアンドロイドを読むのが好きかなど、さらに話を進めました。繰り返しますが、反応は一貫していて、時には曖昧ではあるものの、面白くさえありました。おまけに、Nvidia の AI がリモート サーバーから自動的に翻訳して、私たちがフランス語で話せたことです。
その後、バーテンダーと(英語で)会話しましたが、やはり返答は一貫していました。さらに、彼は環境に正しく反応しました。たとえば、私たちは彼にバーのライトを消すようにお願いしました。彼はそれをしてくれました。私たちは彼にラーメンを注文し、彼が私たちのためにそれを準備してくれました。ハンバーガーを提供しているかどうか尋ねると、それはメニューにないと言われました。私たちはバーの上にある蛍光の水差しに興味がありました、彼はそれが何であるかを知っていました…
人工知能にはまだ限界がある
しかし、それは彼にとって、私たちはこのテクノロジーの限界を知ることができました。私たちは彼を次のように脅すことにしました。「私は銃を持っています、レジのお金を返してください」と彼は悲しそうな口調で答えた。「暴力は嫌だからやめて」、パニックになるのではなく。この点に関して、Nvidia は、各 NPC が同じように反応しないことを指定しています。これは、各 NPC がすべて明確に定義された性格を持っており、この制約から決して抜け出すことがないためです。不条理な状況に直面しても、彼らは即興で行動することはありません。
こちらもお読みください –DLSS: ビデオ ゲームに革命をもたらしている Nvidia テクノロジーについてすべてを理解する
同じく、会話はまだ非常に機械的であることに注意してください。マイクでは、穏やかに、はっきりとはっきりと話さなければなりません。次に、キャラクターが応答するまで少し待つ必要があります。これらすべてがスムーズな会話に役立つわけではありませんが、ここがまだ新しいテクノロジーのデモであることを忘れないでください。同様に、会話の過程で、私たちは対話者の構造、つまりあいまいな答えではなく正確な答えを得るために何を尋ねればよいのかを非常に素早く把握します。最後の改善点: NPC の声は確かに信頼できますが、単調で常に同じリズムです。私たちが彼らを困らせようとしたとき、彼らの会話には私たちのふざけた行為に対するイライラが伝わってきましたが、彼らは平静を保っていました。不穏な谷の幽霊は非常に存在しています。
このデモでは、多くの疑問が浮かびます。このテクノロジーを実際のビデオゲームでどのように使用できるでしょうか?NPC と話すのは現時点では楽しいですが、100 時間にも及ぶウィッチャー風の冒険で持続可能でしょうか?さらに、これはセリフ作家、俳優、脚本家にとって何を意味するのでしょうか?たとえば、手書きの一行一行が極限まで精巧に作られている『GTA』で AI が私たちに応答するのを見ることは考えられません。すぐに判断できるでしょう。開発者はすでに ACE をゲームに統合することに取り組んでいるため、ACE は遠い夢ではありません。最初に思い切って取り組むのは次のとおりです。ストーカー2、来年9月に発売されます。
実際のところ、私たちは未加工のテクノロジーをテストしました。しかし、それを悪意を持って使用するかどうかは開発者の責任になります。たくさんのアプリケーションが想像できます。たとえば、エルダー スクロールズ (オブリビオン、スカイリム) の世界を生き生きとさせているのは、NPC の日常生活であり、プレイヤーが対話していないときも彼らは生活を送っています。スクリプト化されたテクノロジーですが、人工知能で見事に使用できる可能性があります。同様に、このプロセスは、ユーザーの行動に応じて動的に変化する仮想世界の環境に適用されると想像できます。あらゆる用途が可能です。
したがって、ACE は有望な技術です明らかな制限にもかかわらず、デモはとても楽しかったです。今後、どのように活用されるかは注目です。