多くの研究で「猫の鳴き声は主に人間に向けて使われている」と指摘されています。

野生の猫はほとんど鳴きませんが、飼い猫はご飯が欲しいとき、扉を開けてほしいとき、遊んでほしいときなど状況に応じて実に多彩な鳴き声を使い分けます。

その複雑さは従来の常識を超えるもので、近年では地域や飼い主によって“猫の方言”が存在する可能性を指摘する研究も進んでいるほどです。

こうした中、アメリカのPatternofUSAInc.所属の研究者により、猫の鳴き声を40種類に細分類し、95%以上の精度で聞き分けてリアルタイムに翻訳できる画期的なAIシステムが開発されました。

このシステムはこれまでの翻訳アプリよりもはるかに細かく猫の気持ちを汲み取れるとされており、人とペットのコミュニケーションを大きく変える可能性があります。

猫が伝えたい本音とは一体どんなものなのでしょうか?

研究内容の詳細は論文共有プラットフォームである『ResearchGate』にて発表されました。

目次

  • なぜ猫はヒトにだけ話すのか──“操縦説”の真偽を探れ
  • 猫語40単語をAIが同時通訳
  • 猫語翻訳AIが変える人と猫の未来

なぜ猫はヒトにだけ話すのか──“操縦説”の真偽を探れ

なぜ猫はヒトにだけ話すのか──“操縦説”の真偽を探れ / Credit:Canva

猫好きなら一度は「このコは何を考えているんだろう?」と思ったことがあるでしょう。

研究では、野生の猫はほとんど互いに鳴き交わさず、成猫同士の「ニャー」は稀で、家猫だけが人に向けて多彩な鳴き声を使うことが知られています。

飼い猫が鳴き声で人の気を引く様子から、「猫の鳴き声は人間を思い通りに操るために進化した」との説が語られるほどです。

とはいえ、その“猫語”を人間が理解するのは容易ではありません。

鳴き声の音色や長さ、繰り返し方には微妙な違いがありますが、それが示す意味(「餌をくれ」「撫でてくれ」「不満だ」など)は経験から推測するしかなく、科学的に検証された「辞書」は存在しませんでした。

過去にも猫の気持ちを翻訳するスマホアプリが話題になったことがあります。

しかし過去の翻訳アプリは9~11程度の意図分類に限られ、約90%の精度しか出せなかったため、専門家から信頼性を疑問視されていました。

例えば「ごはんちょうだい」「怒ってる」など大まかなカテゴリに当てはめるだけで、専門家からは信頼性に疑問の声も上がっていたのです。

そこで今回アメリカの研究者は、より包括的で科学的に裏付けられた「猫語の辞書」を作り、それを使って猫の鳴き声を高度に分類・翻訳するAIの開発に挑みました。

Reznikov博士は以前から猫の発する音声を体系化する「FGC(FelineGlossaryClassification)」と呼ばれる分類法に取り組んでおり、今回はその最新版FGC2.3にもとづいて大規模なデータ収集とAIモデル訓練を行いました。

目標は40種類もの猫の声を識別できる汎用モデルを作り、人間向けにリアルタイム表示できる「猫語翻訳機」を実現することです。

猫語40単語をAIが同時通訳

猫語40単語をAIが同時通訳 / Credit:FGC2.3 Feline Vocalization Classification and Cat Translation Project

研究チームはまず、猫の鳴き声を5つの大分類(食事要求、日常生活、ケンカ/防衛、発情/交配、苦情/不調)に分け、それをさらに細かい場面ごとに40種類の「声種」に定義しました。

例えば「食事」グループには「空腹を訴えるニャー(f140A)」「カリカリを食べるときのカリカリ音(f150A)」「水を飲むときのペチャペチャ音(f180A)」などが含まれます。

日常生活のグループには「母猫が子猫を呼ぶゴロニャーン(f210F)」から「トイレの後に砂をかくシャッシャッという音(f275A)」までがあり、甘えるゴロゴロから構ってほしいときの呼びかけ音まで網羅されています。

ケンカのグループには威嚇の「シャーッ(f360A)」や低いうなり声(f340A)など攻撃的な声、発情期のグループにはオス猫の独特な大声やメス猫の求愛の鳴き声が含まれます。

そして「苦情/不調」には痛みや不満を訴える声、くしゃみ(f530A)や嘔吐時の声(f520A)まで含まれており、猫が発するありとあらゆる音を40分類でカバーしたのです。

こうして整理した約2500件以上の猫の声の録音データにラベル付けし、畳み込み型ニューラルネットワーク(CNN)と長短期記憶ネットワーク(LSTM)を用いたディープラーニングモデルを訓練しました(最新版ではVisionTransformerも併用されています)。

その結果、モデルは95%以上という高い識別精度を達成し、研究チームの目標をクリアしました。

従来の手法では数十秒程度の短い鳴き声サンプルに対しせいぜい90%前後の精度が報告されていたため(しかも分類対象は9~11種類程度でした)、40種類もの細分類でこの精度は驚異的です。

さらに完成したモデルを組み込んで、研究チームはスマートフォン向けの試験アプリ(iOS)を開発しました。

このアプリにデバイスのマイクを通して猫の声を聞かせると、リアルタイムで分析が行われ、その鳴き声の種別と「意味」が画面に表示されます。

例えば猫が「ゴロゴロ」と喉を鳴らせば「満足:リラックス中」といった具合に緑色の文字が、威嚇の「シャーッ」なら「怒り:警告の威嚇」という赤文字のメッセージが表示される仕組みです。

実際に生きた猫で試験したところ、AIはニャーやシャーッ、ゴロゴロといった様々な声を正しく聞き分け、表示した翻訳メッセージも飼い主の直感とよく合致するものでした。

研究チームは論文内で「40種類を分類する包括的な猫語翻訳手法」であると述べ、その精度と範囲の広さを強調しています。

従来アプリが解読できたのは精々10種類程度の“大雑把なフレーズ”でしたが、このAI翻訳機は40種類の鳴き声を科学的に分類したデータベースに基づいて動作しており、桁違いにきめ細かな“通訳”が可能になったのです。

猫語翻訳AIが変える人と猫の未来

猫語翻訳AIが変えるケアと倫理 / Credit:clip studio . 川勝康弘

猫の鳴き声をここまで詳細に分類・解読した例は世界でも前例がなく、本研究は「猫語」を本格的に解読した初の事例と言えます。

飼い主は自分の猫が何を訴えているのか、その一端をついに垣間見ることができるようになりました。

研究チームは「AIを使うことで、人間とペットのコミュニケーションがより豊かになる可能性がある」と述べています。

完成した翻訳アプリは今後一般公開される予定で、研究者は「このツールは単なる物珍しさに留まらず、例えば猫の声から痛みや緊急の要求(苦情カテゴリの鳴き声)を察知して飼い主に知らせることでペットの健康管理にも役立つ可能性がある」と指摘しています。

実際、猫は本能的に弱みを隠す動物のため、痛みや体調不良を鳴き声で訴えていても人間が気づかないことがあります。

本システムを応用すれば、そうしたSOSサインを見逃さずに済むかもしれません。

一方で、猫のコミュニケーションの解明は始まったばかりです。

今回のAIが識別する40種類の「猫語」は氷山の一角かもしれません。

鳴き声以外にも、しっぽや耳の動き、ボディランゲージと組み合わせて初めて伝わるニュアンスもあるでしょう。

また現在進行中の研究では、猫の鳴き声にも人間の言語の「方言」に似た地域差がある可能性が示唆されています。

研究では、地域差を示唆する事例として「ハドソン川流域やテムズ川流域での方言形成」の可能性が報告されています。

これが事実なら、猫は人間と同じように環境に応じた“話し方”すら身につけていることになり、驚くべき適応能力です。

今回の研究成果は、そうした猫のコミュニケーションの豊かさが従来考えられていたよりはるかに奥深いことを裏付けるものです。

猫が発する一つひとつの「声」に注意を傾ければ、その裏側にある本音をAIが教えてくれる日も遠くないでしょう。

飼い猫が見上げる瞳の奥には、「早くご飯!」「遊んでよ」「ちょっと放っておいて…」といった生き生きとしたメッセージが隠れているのです。

今回開発された猫語翻訳AIは、それを汲み取って人間に伝える橋渡し役となります。

ペットと会話する――昔は夢物語だと思われていた光景が、AIの力で現実になり始めています。

私たち人間が猫の気持ちを理解し、猫もまた人間に自分の意思を“伝えられる”未来が、すぐそこまで来ているのかもしれません。

全ての画像を見る

元論文

FGC2.3 Feline Vocalization Classification and Cat Translation Project
http://dx.doi.org/10.13140/RG.2.2.26145.93286

ライター

川勝康弘: ナゾロジー副編集長。 大学で研究生活を送ること10年と少し。 小説家としての活動履歴あり。 専門は生物学ですが、量子力学・社会学・医学・薬学なども担当します。 日々の記事作成は可能な限り、一次資料たる論文を元にするよう心がけています。 夢は最新科学をまとめて小学生用に本にすること。

編集者

ナゾロジー 編集部

情報提供元: ナゾロジー
記事名:「 猫の鳴き声を95%の精度で「分類➔解読➔翻訳」するAIが完成