Copilot は間もなく会話中にライブ画像を生成できるようになります

同社が申請した新しい特許を信じるのであれば、マイクロソフトは本当にCopilotを市場で最も興味深いAIにしたいと考えており、その特許は同社が取り組んでいることをすでに明らかにしている。

2024 年 10 月 10 日に米国特許商標庁 (USPTO) によって最近公開された特許により、Microsoft が Copilot の新機能に取り組んでいることが明らかになりました。この20ページの文書は前年の4月5日に最初に提出されたもので、は、音声を AI 生成の画像に変換できるシステムについて説明しています。

このテクノロジーがどのように機能するかは非常に興味深いです。会議や会議中に、システムはマイクを介して参加者の音声をキャプチャし、即座にテキストに変換します。。このテキストは文に分割され、各セグメントは言語モデルによって要約され、画像生成プロンプトを作成します。

こちらもお読みくださいCopilot: Microsoft AI は WhatsApp で利用できます。その活用方法は次のとおりです。

副操縦士はすぐにさらに実用的になるはずです

Microsoft は、この機能を主に Teams に展開する予定です。 AIが生成した画像はリアルタイムで画面に表示され、会話の進行に合わせて変化していきます。それで、話者が話題を変えると、イラストが自動的に適応されます、提供物ダイナミックで関連性の高い視覚的なサポート。

同社はそのビジョンを次のように説明しています。画像が口頭コミュニケーションを補完すると、概念が明確になり、理解しやすくなります。これは、視覚的なサポートでよりよく学習する人にとって特に有益です。»。

このイノベーションはフレームワークの一部ですMicrosoft 365 Copilot サブスクリプションの、主に企業向け。このプランでは、AI アシスタントをすべての Microsoft 365 アプリ (Word、PowerPoint、Excel、Outlook など) に統合し、エンタープライズ グレードのセキュリティと Copilot Studio へのアクセスというボーナスも追加されます。

ただし、特許の申請は製品の発売を体系的に保証するものではないことに注意することが重要です。テクノロジー業界では、企業が自社のイノベーションを保護し、競争を防ぐために特許を申請するのが一般的です、必ずしもそれぞれのアイデアを実現する必要はありません。この留保にもかかわらず、Microsoft のこの潜在的な進歩により、近い将来、AI の限界を押し広げ、これまで以上に豊かで直感的な人間と機械のインタラクションが提供される可能性があります。このような機能が今後数カ月以内に日の目を見るかどうかはまだ分からない。