Bing AI は間もなく画像検索を可能にし、マルチモーダルになります

Microsoft は、GPT-4 を Bing AI および Edge に統合し、ソーシャル ネットワーク上で公式に公開しました。

Microsoft 製品は数か月間イノベーションの最前線に立っています人工知能の統合という観点から。しかし、これまで以上に効率的でアクセスしやすい AI の出現により、この分野におけるレドモンドの会社のリードは太陽の下でシャーベットのように溶け始めています。確かに、バード、GoogleのAIは後から市場に登場しましたが、すでにマルチモーダルです。今朝ツイッターでこう発表したのは、マイクロソフトの広告・サービス担当ディレクター、ミハイル・パラキン氏だ。Microsoft の AI は次のレベルに進み、マルチモーダルにもなります

読むには —ChatGPT は深刻な競合相手であることがわかりました。Claude 2 について何がわかっていますか?

パラキン氏はソーシャル ネットワークで次のように述べています。「OK、ついにマルチモーダル/画像理解をあらゆる場所に展開しました (まあ、ほぼ — 展開は明日完了しますが、99% は今日完了します)」。OpenAI が GPT-4 を発表、2023 年 3 月に「深層学習を拡張する取り組みの最終段階」となります。実際、この新しい大規模言語モデルは文字だけでなく画像も理解できる。したがって、この新機能により、Bing AI は、たとえば画像に基づいて詩を書いたり、テキストの説明に基づいてメロディーを生成したりできるようになります。

新しい OpenAI LLM が正式に発表されてから 4 か月後、Microsoft のエンジニアはそれを同社の製品に実装しています。画像で検索Bing チャットおよび/またはエッジ、それは明日のためです...そしてそれは革命的です。このような発表が呼び起こすかもしれないという熱意にもかかわらず、依然として打ち上げにはいくつかの問題が伴うことを示唆するいくつかの問題

この新しいマルチモーダル AI をプレビューすることができた Twitter のメンバーは、同社の代表者に次のような苦情を送りました。唯一の大きな問題はそれです画像をアップロードし、マイクを使用して質問すると、Bing は画像がないと言います。つまり、映像とマイクが連携して機能しないのだと思います。」