街中で友達とおしゃべりしながら歩いていると、周囲の騒音がうるさくて相手の声が聴こえないという状況によく陥ります。
地下鉄の車内なども周囲のノイズが大きくて、相手の声がなかなか聞こえず、不満が溜まったことがある人は多いでしょう。
アメリカのワシントン大学(University of Washington)に所属するシャム・ゴラコタ氏ら研究チームは、そんなイライラを解決するかもしれない新しいノイズキャンセリングヘッドホンを開発しました。
なんと3~5秒相手を見つめることで、その相手を登録し、相手の声だけを拾うことができるというのです。
これでもう、重要なセリフに「え? なんだって?」と聞き返されることはなくなるかもしれません。
研究の詳細は、2024年5月11日付の科学誌『Association for Computer Machinery』に掲載されました。
目次
- ノイズキャンセリングの歴史
- 1人の声だけを選択的に聞き取るノイズキャンセリングヘッドホン
ノイズキャンセリングの歴史
最近のヘッドホンやイヤホンには当たり前のようについているノイズキャンセリング機能ですが、この技術は過去数十年で劇的に進化してきました。
初期のノイズキャンセリング技術は、飛行機のエンジン音などを消すことを目的としていました。
飛行機のパイロットが、飛行中でも正確な通信を行えるように開発されたものだったのです。
その後パイロットだけでなく、航空機客室にも適用され、次第に日常生活でも使用できるヘッドホンやイヤホンが登場するようになりました。
最近では、より高度な環境音の除去が可能になっています。
電車やバスなどの騒音が大きな環境で音楽を楽しみたい場合や、周囲の音を気にせず仕事や勉強に集中したい場合に利用されていますね。
そして、これらノイズキャンセリング技術には、いくつかの方法があります。
例えば、耳を物理的に密閉することで外部のノイズをある程度遮断できます。
また、ノイズに対して逆位相の音を生成し、それをぶつけることで打ち消すこともできます。
実際に最新のノイズキャンセリング技術を体感した人は、騒音がかなり小さくなることに驚くはずです。
しかし、ノイズキャンセリング技術には、まだ課題が残っています。
これまでの技術では、特定の音だけを選択的に聞き取ることはできなかったのです。
そのため、騒音の中で特定の相手と会話を楽しみたい場合には、ノイズキャンセリング機能をオフにしなければいけませんでした。
そこで今回、ワシントン大学のゴラコタ氏ら研究チームは、この「ノイズキャンセリングと会話の二者択一」の課題に果敢に取り組んでいます。
1人の声だけを選択的に聞き取るノイズキャンセリングヘッドホン
ゴラコタ氏ら研究チームは、AIを活用することでノイズキャンセリングと会話の両立を可能にしました。
ゴラコタ氏は、この点を次のように語っています。
「現在、AIは質問に回答するチャットボットだと考えられがちです。
しかし、このプロジェクトでは、ヘッドホンを装着している人の聴覚を、その人の好みに応じて変更するAIを開発しました。
私たちのデバイスを使用するなら、騒がしい環境で大勢の人が話していても、1人の話者の声をはっきりと聞き取れるようになります」
そのAIシステムを利用したへッドホンを装着し、話している相手にまっすぐ顔を向けながらボタンを押すと、「登録」プロセスが開始されます。
相手に顔を向けるということは、話者が発する音波がヘッドホンの両側のマイクに同時に届くということです。(誤差は16度まで)
これにより、ヘッドホンは話者特有の音声パターンを学習。相手の声を捉えることができます。
この登録プロセス全体にかかる時間はわずか3~5秒です。
登録後はシステムが話者の声を捉え続けるので、自分と相手が顔を動かしたり、動き回ったりしても、周囲の騒音を抑えつつ、相手の声だけははっきりと聞こえるようにしてくれます。
しかも登録された相手が話し続けることで、システムがさらに多くのデータを収集。声を捉える能力が向上するのだとか。
以下のビデオから、実際にどのように聞こえるか試してみてください。
最初は後方にいる人の声(雑音)により話者の話を聞き取りづらい(動画 1:05~)ですが、システムをONにすることで、雑音がほとんど聞こえなくなり(動画 1:15~)、話者の声だけがはっきりと聞き取れます。
そして研究チームは、このヘッドホンをテストするため、21人の参加者と共に実験を行いました。
参加者は、野外または室内の環境でヘッドホンを使用し、420分以上かけて話者の声の明瞭度を評価しました。
その結果、参加者たちは、新システムを使用する場合に、使用しない場合と比べて、話者の音声の明瞭度を約2倍も高く評価しました。
新しいヘッドホンを使用するなら、どんなに騒がしい環境でも、周囲の騒音に気を散らされることなく、相手とじっくり会話を楽しむことができるのです。
この機能は、カフェのテラス席や騒がしいレストラン、居酒屋などで活躍することでしょう。
将来的には、ヘッドホンだけでなくイヤホンや補聴器にも応用される予定であり、より一般的になるだけでなく、難聴者や高齢者が特定の人の声を聞き取りやすくなるはずです。
とはいえ、現段階では限界も抱えています。
このヘッドホンは1度に1人の話者しか登録することができません。
また、話者と同じ方向から大きな別の音が鳴り響いている場合、話者の声を正確に登録することができません。
それでも新しいシステムは、私たちの生活をより便利にしてくれる可能性を秘めており、今後の進展と改良に期待できます。
参考文献
AI headphones let wearer listen to a single person in a crowd, by looking at them just once
https://www.eurekalert.org/news-releases/1045862
元論文
Look Once to Hear: Target Speech Hearing with Noisy Examples
https://doi.org/10.1145/3613904.3642057
ライター
大倉康弘: 得意なジャンルはテクノロジー系。機械構造・生物構造・社会構造など構造を把握するのが好き。科学的で不思議なおもちゃにも目がない。趣味は読書で、読み始めたら朝になってるタイプ。
編集者
海沼 賢: ナゾロジーのディレクションを担当。大学では電気電子工学、大学院では知識科学を専攻。科学進歩と共に分断されがちな分野間交流の場、一般の人々が科学知識とふれあう場の創出を目指しています。