- 週間ランキング
その結果、最も高性能なAIモデルでも、時計の針の位置を正確に認識できず、正解率は25%以下でした。
特に、ローマ数字を使用した時計では認識が難しく、間違った時刻を導き出すことが多かったようです。
また、装飾的な針のデザインを持つ時計でも、AIの間違いが頻発しました。
ちなみに、秒針の有無による影響は少なかったことから、AIは針の検出と角度の理解が苦手であると判明しました。
では、カレンダーの読み取りではどんな結果になったのでしょうか。
研究チームは、実験の中で、「休日の特定」や「日付の計算」など、カレンダーに基づく様々な質問にAIが答えるよう依頼しました。
その結果、最も優れたパフォーマンスを発揮したAIモデルでさえ、日付の計算を5分の1の確率で間違えました。
AIは日付の計算自体は簡単に行えます。
チャットボットに日付や曜日を質問したり、計算をお願いしたりするとすぐに正確な答えを提出してくれるでしょう。
しかし、人間のように実世界のカレンダーを見て、理解することは、AIにとってハードルが高いのです。
研究チームは、今回の結果を受けて、次のように述べています。
「ほとんどの人は幼いころから時刻を知ったり、カレンダーを使ったりできます。
私たちの調査結果は、”AIの能力”と”人間にとって基本的なスキルを実行すること”の間に大きなギャップがあることを示しています。
AIが時間に敏感な実世界に上手に対応するには、これらの弱点を改善しなければいけません」
近年のAI研究では、複雑な推論、高度な言語処理や画像生成に重点が置かれることが多く、それらは実際に私たちを驚嘆させます。
しかし皮肉なことに、それらの高度なAIシステムは、より単純で日常的なタスクに依然として苦戦しています。
今回の研究は、AI開発がこうしたギャップに対処する時期に突入したことを示唆しています。
参考文献
Most AI struggles to read clocks and calendars, study finds
https://www.eurekalert.org/news-releases/1076820
Most AI struggles to read clocks and calendars
https://www.ed.ac.uk/news/most-ai-struggles-to-read-clocks-and-calendars
ライター
大倉康弘: 得意なジャンルはテクノロジー系。機械構造・生物構造・社会構造など構造を把握するのが好き。科学的で不思議なおもちゃにも目がない。趣味は読書で、読み始めたら朝になってるタイプ。
編集者
ナゾロジー 編集部