Google アシスタント: 本物の声と区別できない新しい人間の声

Google アシスタントの音声は間もなく、よりリアルになる予定です。 Google は、テキストを人間の声と区別できない音声ファイルに変換できるシステムである Tacotron 2 の開発に成功しました。人工知能は句読点、アクセント、大文字、さらには文の文脈を考慮して発音にニュアンスを与えます。 Google が公開したスニペットは、まさに印象的です。

人に文章を読ませて楽しんだことがない人はいないでしょうか。Google翻訳のロボット音声、彼の奇妙なアクセントをからかうためですか?長年にわたり、この奇妙な声は伝説になりました。ラッパーのオレルサンの「コンピューター支援フリースタイル」(YouTubeで視聴可能)のように、それを芸術的に転用することに成功した人もいる。しかし、この象徴的な声の消滅により、ページが変わろうとしています。 Google 翻訳や Google アシスタントの音声がおかしい時代はもうすぐ終わります。

Google アシスタント: 新しい Tacotron 2 の音声は人間よりも明瞭です

Googleは人工知能によって生成された新しい音声を発表した。 Tacotron 2 と呼ばれるこの音声は、人間の声とほとんど区別がつきません。このシステムは 2 つの人工ニューラル ネットワークに基づいています。最初のネットワークは、テキストをスペクトログラム、つまりオーディオ周波数の視覚的表現に変換します。このスペクトログラムは、Google DeepMind によって開発されたシステムであり、この表現を読み取ってオーディオ ファイルを生成できる WaveNet に送信されます。

Google が公開しているさまざまな抜粋は次のとおりです。ただただ素晴らしい。各文は会社の従業員と Tacotron 2 によって読まれます。その文がロボットによって読まれたのか人間によって読まれたのかを知ることは、不可能ではないにしても非常に困難です。 Tacotron 2 は、句読点に基づいて発音を微妙に変えることができ、最も複雑な名前も発音することができます。

このテクノロジーは実験室に留まることを意図したものではありません。現在の Google アシスタントの音声は間もなく置き換えられますそしてGoogle翻訳。しかし今のところ、人工知能は英語を話す単一の女性の声を模倣するようにのみ訓練されています。彼女はいくつかの言語をマスターし、男性のように話すために、より長い訓練を必要とするでしょう。それまでの間、人間の声と比較し、その後複雑な文章を読んで、この新しい声を自分で発見してください。