早稲田大学大学院情報生産システム研究科博士後期課程のWang Jiazhe氏、同研究科の吉江 修(よしえおさむ)教授、家入 祐也(いえいりゆうや)講師の研究グループは、この課題に対し、画像を小さな領域(パッチ)に分けたうえで、それぞれのパッチが「どの医用画像データセット(網膜血管、腹部多臓器、など)」に属していて、「どの画像」の、「どの場所」のパッチであるかを3次元で保持する「パッチベースの学習法」と、データ種別ごとに専門的な処理を行う「Mixture of Experts(MoE)」を組み合わせた新手法「PatchMoE」を開発しました。体の部位が異なる4種の異なる医療画像を対象に検証を行い、従来手法を上回る精度を実現しました。
本研究成果は、国際学術誌「Neural Computing and Applications」に2025年5月8日にオンライン公開されました。 論文名: Conducting patch contrastive learning with mixture of experts on mixed datasets for medical image segmentation
(2)新たに実現しようとしたこと、明らかになったこと、そのために新しく開発した手法 本研究では、解像度やアノテーション基準の異なる複数の医療画像データセットを、1つのモデルで統一的に学習できる新たな手法「PatchMoE(Patch-based Mixture of Experts)」を提案しました。 これは、混合データセットに起因する学習の干渉や精度低下の問題を克服することを目指しています。提案手法の主な構成要素は以下の2つです。 ①パッチ分割と3次元パッチ位置表現(Patch Position Embedding:PPE) PPEモジュールにより、画像を固定サイズの小領域(パッチ)に分割し、それぞれのパッチに「データセットID」「画像ID」「パッチID」の3次元情報を特徴空間に埋め込むことで、空間的・構造的な情報を保ったままTransformerベースのモデル※4に入力します。これにより、異なる解像度の画像を扱う際にも空間的関係を維持し、コンテキスト理解を損なうことなく一貫した特徴抽出が可能となります。
②専門家混合型デコーダ(Mixture of Experts:MoE) デコーダ部分において、データセットIDに基づいて稀疎な構造を持つMoE機構を導入し、各タスクに適した専門家ネットワークの組み合わせを動的に選択することで、マルチタスク学習における最適化の競合(パレート効果)を抑制します。
(7)論文情報 雑誌名:Neural Computing and Applications 論文名:Conducting patch contrastive learning with mixture of experts on mixed datasets for medical image segmentation 執筆者名(所属機関名):Jiazhe Wang*, Osamu Yoshie, Yuya Ieiri (Waseda University) 掲載日時(現地時間):08 May 2025 掲載URL:https://link.springer.com/article/10.1007/s00521-025-11234-1 DOI:10.1007/s00521-025-11234-1