Microsoft は人工知能を使用した 2 つのツールを発表しました。 1 つ目は写真から非常にリアルなアバターを生成し、2 つ目は録音された短いテキストの読み上げ後の音声を再現します。
力が高まる一方、人工知能ベースのツールますます悪用の恐れが高まる中、Microsoft は論争を巻き起こすこと間違いなしの 2 つを提示します。 1 つ目は「Azure AI Speech テキスト読み上げアバター」と呼ばれます。原理は単純です。r を作成します。人物を写実的に 2D 表現し、アニメーション化してしゃべらせる。仮想的に表現したい人物の写真を提供したり、既存のモデルから選択したりすることが可能です。使用される音声は、提案された音声のいずれか、またはあなたのものから再現された。
こちらもお読みください –ディープフェイク:AIを使って友人のふりをして被害者から56万ユーロを盗む
Microsoft はいくつかの使用例を挙げています: 旅行サイトのチャットボット、カンファレンスで話す CEO の仮想分身、生徒と対話するデジタル教師... アバターはモデルを使用します。Azure OpenAI サービス GPT-3.5テキストによって提起される質問に答えるため。スポーツ用品サイトの仮想販売員にランニング シューズなどに関するアドバイスを求めるところを想像してみてください。必要に応じて、彼はいくつかの言語も話します。
起こり得る逸脱はすぐに想像できます。技術的には、トム クルーズやその他の有名人の写真を配布してデジタル バージョンを作成することを妨げるものはありません。 Microsoft はこの種のケースについてはコメントしていません。同社がそれらを回避するための措置を計画しているかどうか、また今後何らかの事態が発生するかどうかはわかりません。補償の形式たとえ、ビデオの中の人物が AI を使用して作成されたものであることを指摘する必要はないとしても。たとえば、YouTube は混乱を避けるために「現実的な AI」というラベルを実装しました。。下のビデオは、Microsoft の新しいツールによって生成されたアバターを示しています。
提示された 2 番目の新機能により、次のことが可能になります。画面上の短いテキストを読んだ後に声を再現する。 「Personal Voice」と名付けられたこの機能には、記録されたユーザーの同意機能する前に。現時点では、生成された音声に合わせてテキストを読み上げたり、アプリケーション外で結果を共有したりするためにこれを使用しないでください。最終的には、この制限は必然的に解除されます。ここでもマイクロソフトは、声優などの声が使用された場合に報酬が支払われるかどうか、また声優が AI によるものであることを示す必要があるかどうかについては明らかにしていない。
ソース :マイクロソフト