富士通研究所、正解が少ないデータでも高精度に学習するAIの新技術「Wide Learning」を開発
- 2018年09月19日 14:00:00
- テクノロジー
- JCN Newswire
- コメント
様々な分野においてデータを利活用するためにAIが使われてきていますが、分析にかけるデータ量が少ない場合や偏りがある場合に、AIによる分析の精度に影響がおよびます。本技術では、まず、データの項目どうしをすべて組み合わせ、その大量の組合せを仮説として、重要度の高いものを選別します。さらに、仮説を構成する項目の重複関係に基づいてそれぞれの影響度を制御することで、どの仮説に対しても均等に学習することができ、データに偏りがある場合でも従来よりも高精度な判断を下すことが可能となります。また、仮説は論理的な表現で記述されているため、人間にも判断理由を理解することが可能です。
本技術により、判断したい対象のデータが少ない医療やマーケティングなどの現場でもAIを活用し、AIによる業務の自動化や業務支援が促進されます。
開発の背景
近年、医療やマーケティング、金融などの様々な分野においてAIが導入されはじめ、AIの判断を活用した業務支援や自動化に対する期待が高まっています。しかし、業界や業種によっては、判断したい対象に対してAIの学習に必要な十分な量のデータを取得することが難しく、実用に耐える高い精度が出ないという問題があります。また、AIが十分に高い精度での認識・分類性能を出したとしても、なぜその答えが出てきたのか専門家や開発者自身も説明できないため、現場で説明責任を果たせずAIの導入が進まない大きな要因となっています。
課題
従来のディープラーニングをベースとしたAIは、判断したい対象のデータ(正解データ)を十分に含む大量のデータを学習させることにより、高精度の判断を実現していました。しかし、実際の現場では判断したい対象データが極端に足りない場合が少なくありません。このような場合、未知のデータに対する高精度の判断を実現することは困難です。また、従来のディープラーニングをベースとしたAIの学習モデルは、ブラックボックス型のモデルで、AIの判断理由を説明できないという透明性の問題がありました。したがって、様々な社会課題においてAIを活用していくためには、正解が少ないデータでも高精度の判断を実現し、透明性を兼ね備えた新たなAI技術の開発が求められます。
開発した技術
今回、正解データが少ない場合でも高精度に判断できる機械学習技術「Wide Learning」を新たに開発しました。「Wide Learning」技術の特長は下記の2点です。
1. データ項目を組み合わせて大量の仮説を抽出
すべてのデータ項目の組合せパターンを仮説とし、各仮説に対し分類ラベルのヒット率で、その仮説の重要度を判断します。例えば、商品購入に対しての傾向をAIで分析する際に、これまでの購入者・未購入者(分類ラベル)のデータ項目から、<女性・免許所有> <未婚・20~34歳>などすべてのパターンを組み合わせ、これらを仮説とした際に実際の商品購入者のデータとどれくらいヒットするかを分析します。このとき一定以上のヒット率の仮説をナレッジチャンクとよび、重要な仮説であると定義します。これにより、元々の判断対象となるデータが十分に揃っていない場合でも、注目すべき仮説をもれなく抽出することができ、これまで考えつかなかった仮説の発見にも貢献します。
2. ナレッジチャンクの影響度を調整し高精度な分類モデルを構築
抽出した複数のナレッジチャンクとラベルに基づき分類モデルを構築します。この際に、ナレッジチャンクを構成する項目が他のナレッジチャンクを構成する項目と重複が多い場合に、分類モデルへの影響度を小さくなるように制御します。これにより、ラベルやデータに偏りがある場合にも、高精度な分類が可能なモデルを学習します。
例えば、商品購入データの中で未購入の男性のデータが大多数を占めている場合に、影響度を制御しないで学習すると、性別とは関係なく得られた<免許所有>の項目を含むナレッジチャンクが分類に影響しなくなります。開発方式では、項目の重複に応じて<男性>が含まれるナレッジチャンクの影響度を抑え、少数である<免許所有>が含まれるナレッジチャンクの影響度が相対的に大きくなるように学習することで、<男性>でも<免許所有>でも正しく分類できるモデルを構築します。
効果
本技術について、デジタルマーケティングや医療などの領域のデータに対して適用し、検証を行いました。
UC Irvine Machine Learning Repository (注2)のマーケティングと医療領域のベンチマークデータを用いたテストで、ディープラーニングに比べ正解データを当てる精度が約10~20%向上し、サービスに加入する見込みの高い客や罹患患者を見逃す確率を約20~50%低減することを達成しました。今回、約5,000件の顧客データの中で購入顧客が約230件と正解データが少ないマーケティングのデータを使ったところ、本技術を用いて販促する人を決めると、見込み顧客を販促対象から外す数をディープラーニングの分析結果である120人から74人と減らすことができました。
さらに、本技術のベースになっているナレッジチャンクが、論理的な表現形式を持つことから、判断の理由を説明できることも社会実装において有効です。新たなデータに対する結果から、モデルの修正が必要だと判断した際にも、結果の理由が理解できるため、より適切な修正を施すことが可能となります。
今後
今後、不正利用や設備故障などの低頻度の事象を扱う業務や、金融取引、医療診断などのAIの判断理由を求められる業務において実践を進め、富士通株式会社のAI技術「FUJITSU Human Centric AI Zinrai」を支える新たな機械学習技術として2019年度の実用化を目指します。
また、本技術のもつ説明可能な特性も有効に活用し、導入先の業務における判断・意思決定支援の高度化、人間との協働を含めた全体のシステムの設計などの研究開発を進めていきます。
本リリースの詳細は下記URLをご参照ください。
http://pr.fujitsu.com/jp/news/2018/09/19-2.html
概要:富士通株式会社
詳細は http://jp.fujitsu.com/ をご覧ください。
Copyright 2018 JCN Newswire. All rights reserved. www.jcnnewswire.com
東国原英夫氏、斎藤元彦知事の疑惑で「PR会社の数名が現場にいる。選挙運動員ではないのか」
高須院長、CM出演で「莫大なギャラをいただきました」→全額寄付にフォロワー「これが真の富豪」
前田日明が藤原喜明と伝説のジャージーで2ショットに「涙出る」「欲しい」「青春」ファン感激
張本勲氏が米挑戦の菅野智之に期待「俺の好きな大谷を打ち取ったら大アッパレをあげる」
ぜんじろう、松本人志の騒動に「いいとか悪いとか以前に、触れたらダメというのは風通しが悪い」
「エグい」42歳熊田曜子が最強ボディーの全数値公開、驚異の体脂肪率に「低すぎ」「全部筋肉」
宮崎牛を「いい肉の日」に半額で!広島ミートファクトリーの魅力
アメフトNFL会場にドジャース名物リポーター登場 オフはファッションモデルでも大活躍!
ウィルミナ、色選び不要の「ルナジェナ クリアアップファンデーション」を発売
【中日】村松開人がバット工場で職人と新バット作成「印象に残るバッティングをしたい」
前澤友作氏「全ての方向で法的措置を検討します」と警告
ガーシーが綾野剛のLINE公開でネット騒然「ショック」「すごいエンタメ」
3刷目の重版決定!榎原依那のファースト写真集「Inaism」から、完全未公開カットをご紹介♡
二階堂ふみが結婚!?お相手が衝撃的過ぎてネット民「マジか・・・」
クロちゃんを騙した「レイちゃま(小林レイミ)」の現在が別人すぎると話題に
ナイナイ岡村、鈴木紗理奈の不倫報道に複雑な思い「チクりがなければ…」
藤本美貴、「早く死ぬ確率が高く、不安定な」庄司智春と結婚した理由を聞かれ“一言”で回答
え!42歳?「我慢できなくなっちゃった」熊田曜子“透け透け入浴”超絶ボディーに悶絶の声
元鳥取知事の片山善博氏「かえってマイナスに作用したんじゃ」斎藤元彦氏兵庫県知事再選で分析
へずまりゅう、妻を襲撃した男の“素性”情報を報告「妻は精神をズタボロにされて」
クロちゃんを騙した「レイちゃま(小林レイミ)」の現在が別人すぎると話題に
ガーシーが綾野剛のLINE公開でネット騒然「ショック」「すごいエンタメ」
二階堂ふみが結婚!?お相手が衝撃的過ぎてネット民「マジか・・・」
四千頭身、テレビから消えた理由を明かすも批判殺到「人のせいにするな」
ユーチューバーもこう氏、元彼女・成海瑠奈について赤裸々告白
父が再婚の丸山隆平(36)現在の家族関係がとんでもないことになっていたと話題に
3時のヒロイン福田麻貴(32)は元アイドルだった!昔の姿がかわいいとヲタク歓喜
多部未華子(30)結婚の裏事情あまりにも恐ろしすぎると話題に!
たぬかな、「あのチビやろ?」迷惑系黒人YouTuberへの苦言が物議
「愛が生まれた日」藤谷美和子(56)の現在がヤバい!?徘徊生活を送っていた過去も明らかに。
東国原英夫氏、斎藤元彦知事の疑惑で「PR会社の数名が現場にいる。選挙運動員ではないのか」
高須院長、CM出演で「莫大なギャラをいただきました」→全額寄付にフォロワー「これが真の富豪」
前田日明が藤原喜明と伝説のジャージーで2ショットに「涙出る」「欲しい」「青春」ファン感激
張本勲氏が米挑戦の菅野智之に期待「俺の好きな大谷を打ち取ったら大アッパレをあげる」
ぜんじろう、松本人志の騒動に「いいとか悪いとか以前に、触れたらダメというのは風通しが悪い」
「エグい」42歳熊田曜子が最強ボディーの全数値公開、驚異の体脂肪率に「低すぎ」「全部筋肉」
宮崎牛を「いい肉の日」に半額で!広島ミートファクトリーの魅力
アメフトNFL会場にドジャース名物リポーター登場 オフはファッションモデルでも大活躍!
ウィルミナ、色選び不要の「ルナジェナ クリアアップファンデーション」を発売
【中日】村松開人がバット工場で職人と新バット作成「印象に残るバッティングをしたい」