AI・コンピュータビジョン分野における世界最高峰の国際会議「CVPR2024」にて論文採択
2024年3月14日
立教大学
報道関係各位
立教大学大学院人工知能科学研究科(所在地:東京都豊島区、研究科委員長:内山泰伸)の博士課程後期課程1年次の安木駿介さんと瀧雅人准教授の論文がCVPR2024(The IEEE/CVF Conference on Computer Vision and Pattern Recognition 2024)に採択されました。本成果の詳細は、2024年6月17日から6月21日まで米国ワシントン州シアトルで開催される同国際会議にて発表されます。
CVPRはパターン認識・コンピュータビジョン分野に関する世界最高峰の国際会議として知られています。Google Scholarのh5-indexによる全科学分野の学術雑誌・国際会議のランキングによると、CVPRはNature、NEJM、Scienceに続いて第4位にランクインしているトップ国際会議です。
研究の概要
AIシステムが行う判断の根拠に関する説明性の向上は、AI分野の重要な課題です。特に画像を扱うシステムでは、AIが画像に関する判断を行う上で、特にAIが重視した画像領域を特定する説明アルゴリズムが広く利用されています。CAMと呼ばれる古い説明アルゴリズムを起点として、これまでたくさんの複雑な説明アルゴリズムが提案されてきました。ところが本研究では、最新の画像AIモデルの知見を利用すると、実は古くからあるCAMを使うだけで、他の工夫された最先端のアルゴリズムに匹敵するクオリティーの説明性が実現できることが明らかになりました。そのため、本論文には「CAM Back Again」というタイトルがつけられています。
背景
2012年頃から畳み込みニューラルネット(CNN)を用いた深層学習が大きく進展し、コンピュータビジョンの研究は著しく進歩しました。この数年は、ChatGPTなどのTransformerアーキテクチャの成功に触発され、コンピュータビジョンにおいてもCNNの代わりにTransformerを用いる研究が進み、その高い性能が脚光を浴びています。CNNはTransformerに性能面で劣るため、両アーキテクチャ間の性能差を縮めようとする研究も活発になされており、カーネルサイズを拡大した現代的なCNN(ラージカーネルCNN)などが注目されています。ラージカーネルCNNは、物体検出やセグメンテーションなどの幅広い視覚タスクで高い性能を示しています。先行研究によれば、この高い性能はラージカーネルを介して得られる大きな有効受容野に起因するとされています。しかし、この見解を支持する十分なエビデンスはありませんでした。そこで本研究では、この非自明な見解の妥当性を、弱教師ありオブジェクトローカリゼーション(WSOL)という視覚タスクの観点から掘り下げます。
WSOLは、画像分類のためのAIモデルを用いて、分類クラスだけではなく、オブジェクトが画像内のどこにあるのかという位置情報まで特定するタスクです。このタスクにおける古典的な手法として有名なアルゴリズムがCAMです。CAMはAIによる画像分類の予測根拠として、画像内の実際のオブジェクト領域を正確に炙り出すように設計されたアルゴリズムです。しかし実際のCAMにはオブジェクト全体ではなく、その一部分のみを根拠として抽出する傾向があります。例えば図の一番上の例では、鳥の顔部分にのみ焦点が当たっています。このようにCAMはオブジェクト全体の位置を正確に特定できない問題を抱えており、これまで巧妙に工夫された数多くの改善アルゴリズムが提案されてきました。
【画像:https://kyodonewsprwire.jp/img/202403148006-O1-4Z9R2jvL】
成果
本研究では、ラージカーネルCNNが高いWSOL性能(位置特定の性能)を示すことが明らかにされ、さらにその要因が徹底的に解析されています。まず既存の見解の妥当性について検証するため、有効受容野サイズがWSOL性能を向上させるかどうかを調査しました。その結果、有効受容野が性能向上を導くという従来の見解を支持しないいくつもの実験結果が提示されました。
次に本研究では、解析により得られた数々の発見を報告しています。第一に、現代的なラージカーネルCNNでは従来のCAMが抱えていた問題点が自動的に解消されていることが明らかになりました。2016年にCAMが登場して以来、その改善のために多くの手法が提案されてきました。しかし本研究では、ラージカーネルCNNとCAMを組み合わせるだけで、過去の数多くの研究の大半を上回るWSOL性能を実現しました。これは、ラージカーネルCNNが先天的に画像特徴量のグローバルな情報を過不足なく捉えられるためです。
さらに画像特徴量の主成分分析(PC1)を行うだけで、オブジェクトの位置を精密に特定できることを発見しました。この新たな手法により、CNNを用いたWSOLの最先端性能が達成されました。これらの発見を踏まえ私たちは、ラージカーネルCNNが様々なタスクで高い性能を示す要因は、アーキテクチャの先天的な能力とそれにより得られる画像特徴量の改善によるものであるとする、独自の見解を示しました。
展望
説明性アルゴリズムは、AIの透明性を高める手法として社会から大きな期待を寄せられています。しかし実際には、既存の説明性アルゴリズムでは手法ごとに説明結果が大きく変化し、十分信頼できる結果が得られていません。本研究では、最新の画像AIモデルの性能改善が、結果として古典的な説明性アルゴリズムから得られる説明結果も大きく改善し得ることを明らかにしました。このような発見は、説明性アルゴリズムの挙動を解明し、透明性を備えたAIの運用をより現実的なものにします。高い信頼性を備えたAIが得られれば、未知の科学的知識をAIから引き出したり、AIが学習から獲得した知見をAIから直接学ぶことができるなど、幅広い活用が期待できます。こうした人間社会のより深い部分で役にたつAIを見据えて、今後も研究を進めて参ります。
キーワード
● 畳み込み:局所的な情報を集約することで、画像などから情報抽出をする手法。一種のフィルタリング。
● 畳み込みニューラルネット:畳み込みを使った画像に特化したニューラルネット。
● カーネルサイズ:畳み込みが局所的な情報を集約する際に、情報を集める範囲の広さ。
● CAM:画像分類モデルの分類層の重みと推論過程の特徴量を用いた演算により、推論画像が予測したクラスに属すると判断した根拠に相当する領域を可視化。
● 弱教師ありオブジェクトローカリゼーション:画像の分類だけを学習したAIに、分類されたオブジェクト(物体)がどの位置・範囲にあるのかまでを特定させるタスク。分類は教えるが位置情報は教えないという意味で弱教師ありと呼ばれる。
● 有効受容野:AIモデルの持つ、一種の視野の広さ。
● 特徴量:AIの予測の手掛かりとなる変数。深層学習では、AI自身が特徴量を発見する。
● コンピュータビジョン:コンピュータに画像の認識や処理を行わせる分野。
● Transformer:大域的な情報集約が可能なニューラルネット。
● 主成分分析:多変数データの情報を要約し、元のデータの本質を表すような少ない変数のデータに変換する手法。
論文情報
● 論文タイトル:CAM Back Again: Large Kernel CNNs from a Weakly Supervised Object Localization Perspective
● 著者:Shunsuke Yasuki, Masato Taki
● 論文:https://arxiv.org/abs/2403.06676
人工知能科学研究科 瀧雅人研究室について
瀧雅人研究室では、これからのAIを支える深層学習に関して、基礎から応用まで幅広く研究しています。本成果以外にもAI・機械学習分野の国際会議「NeurIPS 2022」「AAAI 2024」に論文が採択されるなど、さまざまな成果を出しています。
【プレミア12】広島勢活躍で米国撃破も坂倉翔吾「新井さんが怒ってないことだけ祈ります」と心配顔
【11月22日生まれの著名人】aiko、成田凌、遠野なぎこ、泉綾乃ら
【プレミア12】小園海斗「盛り上がれば」アイブラック形は現役メジャーリーガーの落書きだった
【プレミア12】桑原将志5打席目に意地の適時打「吹っ切れた」パットンと対戦実現せず「残念」
【プレミア12】死球禍の中で小園海斗2発7打点にSNS「アメリカ当てすぎ 小園打ちすぎ」
GLAY、紅白出場に続きビッグニュース発表にファン歓喜!「凄いの一言」
ワンワールド、グローバル・マーケティングキャンペーンを5年ぶりに実施 音響アイデンティティも作製
【プレミア12】侍ジャパンが米国投手陣に1イニング3死球を食らう珍事もしっかり3得点
【プレミア12】「やばい見つかる」小園海斗躍動にX興奮「MVPだな」「ここぞの小園さく裂」
「まさかふたごちゃん!?」菊地亜美、”一番出てる自信ある”妊娠6か月のお腹を公開
クロちゃんを騙した「レイちゃま(小林レイミ)」の現在が別人すぎると話題に
俳優・火野正平さん死去 75歳 腰を骨折し体調崩す
二階堂ふみが結婚!?お相手が衝撃的過ぎてネット民「マジか・・・」
斎藤元彦・前知事の再選確実 兵庫県知事選、失職から返り咲き
3刷目の重版決定!榎原依那のファースト写真集「Inaism」から、完全未公開カットをご紹介♡
小池里奈「超むっっっっっちむち」美バスト輝く黒ブラジャー近影に称賛「色気が増してる」
岡田将生が高畑充希との結婚発表
三浦瑠璃氏、斎藤元彦氏再選に「一番の敗者は当然、マスコミです」と私見
ガーシーが綾野剛のLINE公開でネット騒然「ショック」「すごいエンタメ」
「スケスケ水着美尻」35歳女芸人のセミヌード写真展が大阪でも12月開催決定「本当に最後」
クロちゃんを騙した「レイちゃま(小林レイミ)」の現在が別人すぎると話題に
ガーシーが綾野剛のLINE公開でネット騒然「ショック」「すごいエンタメ」
二階堂ふみが結婚!?お相手が衝撃的過ぎてネット民「マジか・・・」
四千頭身、テレビから消えた理由を明かすも批判殺到「人のせいにするな」
大谷翔平の「盗塁」巡り訴訟、ドジャースなどが訴えられる 50、51個目の盗塁が対象
父が再婚の丸山隆平(36)現在の家族関係がとんでもないことになっていたと話題に
ユーチューバーもこう氏、元彼女・成海瑠奈について赤裸々告白
3時のヒロイン福田麻貴(32)は元アイドルだった!昔の姿がかわいいとヲタク歓喜
たぬかな、「あのチビやろ?」迷惑系黒人YouTuberへの苦言が物議
多部未華子(30)結婚の裏事情あまりにも恐ろしすぎると話題に!
【プレミア12】広島勢活躍で米国撃破も坂倉翔吾「新井さんが怒ってないことだけ祈ります」と心配顔
【11月22日生まれの著名人】aiko、成田凌、遠野なぎこ、泉綾乃ら
【プレミア12】小園海斗「盛り上がれば」アイブラック形は現役メジャーリーガーの落書きだった
【プレミア12】桑原将志5打席目に意地の適時打「吹っ切れた」パットンと対戦実現せず「残念」
【プレミア12】死球禍の中で小園海斗2発7打点にSNS「アメリカ当てすぎ 小園打ちすぎ」
GLAY、紅白出場に続きビッグニュース発表にファン歓喜!「凄いの一言」
ワンワールド、グローバル・マーケティングキャンペーンを5年ぶりに実施 音響アイデンティティも作製
【プレミア12】侍ジャパンが米国投手陣に1イニング3死球を食らう珍事もしっかり3得点
【プレミア12】「やばい見つかる」小園海斗躍動にX興奮「MVPだな」「ここぞの小園さく裂」
「まさかふたごちゃん!?」菊地亜美、”一番出てる自信ある”妊娠6か月のお腹を公開