研究の内容 「だいち2号」搭載のPALSAR-2は日本の国土全体を3 mなどの高解像度モードでくまなく観測しています。また、この観測は地震などによる地殻変動を捉えるために定常的に実施されており、「だいち2号」の周回軌道に合わせ年4回程度の割合で国土のほぼ全体のデータが更新されます。今回の成果は画像用に開発された教師無し学習手法の一つ、Masked Auto Encoder(MAE)から派生したMixMAEにより大規模事前学習を実施し、国土を観測した豊富なSARデータから基盤モデルを構築しました。
基盤モデルの性能には、データの量はもちろん、データに含まれる情報の多様性も大きく影響します。例えば日本の国土は70%が森林に覆われており、無作為にデータを学習させると森林に知識が偏ることが予想されます。実際には森林以外にも市街地や河川、耕作地帯など国土の土地種別はさまざまです。そこで、すでに得られている国内の土地利用・土地被覆データを参照し、森林、市街地、水域(河川や湖など)、耕作地帯を均等に指定しました。学習に用いるデータとするため、指定地点を中心とした256 x 256画素の小画像(画像パッチ)に切り分け、30万枚以上の学習データを準備しました。また、SAR特有のスペックルノイズや反射条件による極端に強い信号の影響を低減するため、極端に反射電波強度の強い領域の影響を無視するような損失関数を考案しました。基盤モデルは、作成した学習データセットと考案した損失関数による教師無し学習を実施して構築しました。
発表情報 会議名:日本リモートセンシング学会第78回(令和7年度春季)学術講演会 タイトル:Self-Supervised Pre-Training and Image Segmentation Task on ALOS2 Single-Channel SAR Images 著者:Nevrez Imamoglu , Ali Caglayan, Toru Kouyama
Masked Auto Encoder(MAE) 大量の画像から基盤モデルを構築するために提案された教師無し学習手法の一つで、画像一部をわざと欠損させ、欠損部分を含め画像全体を再現するタスクを通じてAIモデルの学習を進める技法です。画像全体の情報や意味を推定できるような高い表現能力が獲得できることが知られています。