Google は、簡単な説明から画像を作成できる人工知能 Imagen を発表しました。このテクノロジーは、言語理解とフォトリアリスティックな画像デザインを組み合わせたものです。提案された結果は本当に驚くべきものです。そして、人工知能は既知のデザインを再現したり、描画スタイルや絵画スタイルを使用したりすることもできます。
近年、機械学習と人工知能の進歩は目覚ましいものがあります。そして、これが SF 小説に追いつくまで進化し続けることは明らかだと思われます。私たちは、人工知能が自然言語でリクエストに応答できることを知っていました。アシスタント、Siri、Alexa などの仮想アシスタントは、これを毎日私たちに確認します。また、人工知能が言葉と画像を関連付けることができることもわかっています。Googleフォトで「犬」や「ビーチ」を検索すると、エンジンは関連する結果を提供します。
こちらもお読みください –ディープフェイク: この AI は映画の吹き替えの信頼性をさらに高めます
また、AI が多かれ少なかれ現実的な画像を作成できることもわかっていました。ディープフェイクについてだけ話しているわけではありません、潜在的には似ている可能性がありますが。私たちは何もないところからシーンを再作成することについて話しているだけです。しかし、言語理解、意味解釈、視覚的生成という 3 つのテクノロジーを組み合わせたところを少し想像してみましょう。これにより、Imagen が開発された新しいテクノロジーが提供されます。グーグルブレイン、人工知能に特化した同社のチーム。
Imagen は文章を解釈して画像に変換します
Imagen は、単純に驚くべき AI です。説明から画像を作成します。この記事の上部には、で収集された 4 つの画像のモンタージュが表示されます。イマージェンの公式ウェブサイト。左下の説明は簡単です。犬が好奇心をもって鏡を見つめます。そして彼はそこに猫を見つけます」。この 2 つの簡単な文で十分でした。左下のビジュアルについては、「巨大なコブラが野原に座っています。トウモロコシの粒から作られています。 » Phonandroid 編集スタッフ一同、これらの画像のリアルさに驚きました。
公式ウェブサイトにアクセスすると、Imagenを「テスト」する可能性。確かに、多肢選択テキストが提供されます。気になる部分を選択すると、適切な画像が表示されます。そしてさらに驚くべきことに、このシステムはフォトリアリスティックなモンタージュまたは画像の選択を提供します。有名なアーティストのスタイルを真似する、レンブラントのように。
この公式ページには、そのようなテクノロジーが持つ可能性のある制限と社会的影響に関するテキストも掲載されています。なぜなら、イマージェンは、ディープフェイクを作成するのに十分な強力さ被害者は何もすることができないまま、公人の被害に遭った。 Google は、Imagen が人種差別的、ポルノ的、さらには品位を傷つける傾向のある画像をブロックしていることを認めています。しかし、同社が自社のシステムに課している制限はこれだけではなく、Googleは同社のAIがどちらかというと白人っぽい人間の画像を作成する傾向にも言及している。それはあまり包括的ではありません。