三井化学と日立製作所は、日立が開発した人工知能(AI)を活用したマテリアルズ・インフォマティクス(MI)技術を、実際の新材料開発に適用する実証試験を開始する。
※1:情報処理学会「マルチメディア、分散、協調とモバイル(DICOMO2021)シンポジウム」
この実証試験に先立ち、日立の開発技術を三井化学が提供した過去の有機材料の材料開発データで検証したところ、高性能な新材料の開発に必要な実験の試行回数が従来のMIと比較し約1/4に削減され開発期間を短縮できることを確認した。
なお、本技術は、2021年6月30日より開催される学会「DICOMO2021(※1)」にて発表予定。
今後、日立は今回開発したMI技術の実用化をめざし、先進的な技術を活用した「Lumada」ソリューションとして提供している「材料開発ソリューション」(※2) へ適用することで、顧客・パートナーのより短時間・低コストでの材料開発や競争力強化を支援していく。三井化学は、DXを通じた社会課題解決のため、革新的な製品やサービス、ビジネスモデルをアジャイルに創出し、社会に提供していく。両社は、これからも素材開発の協創(※3)を推進し、持続可能な社会の実現に貢献していく。
※2:「材料開発ソリューション」は、DXを加速させる日立の「Lumada」ソリューションの一つで、MIによるお客様の新材料の開発を支援するサービスである。材料開発に関する膨大なシミュレーションデータや実験データの可視化・高速な分析を容易に行うことができるクラウドサービス「材料データ分析環境提供サービス」や、日立が材料データをお預かりして、お客さまの研究開発に最適なAIなどを開発し、分析を代行する「材料データ分析サービス」などを提供している。
※3:日立と三井化学は2017年からMIを用いた材料開発で協創を進めている。
三井化学のねらい
三井化学にとって、新製品の開発は事業活動の要である。ただ、新製品開発には、課題抽出、基礎研究から、スケールアップなどの実証実験など、多大な時間・コストを要する。今回、三井化学が過去から蓄積している膨大な開発に関する知見と日立が提供するデジタル技術とを融合することで、新製品開発に掛かる時間・コストを大幅に削減することが可能になると考えている。
日立が開発したMI技術※
日立は、AIやシミュレーション技術などを活用して新材料を探索するMIの高度化に向けて、これまで大量の実験データを必要としていた有機材料開発において、少量の実験データでも高性能な新材料の候補化合物(化学式)を発案することができる深層学習技術を新たに開発した。
開発した技術の特長は以下の通りである。
1. 大規模なオープンデータを活用できる「入れ子型」のAI(注1)
2. 高性能な化合物の生成を加速する成分調整方式(注2)
注1:大規模なオープンデータ(※4) で学習したAIの内側に、実験データで学習したAIを埋め込む入れ子型構造(※5) を採用したことにより、本技術は少数の実験データ*(※6)しかない場合でも新材料開発に活用できる。
注2:本方式では、外側のAIで文字情報である化学式を一度数値情報に変換し、内側のAIでこの数値情報から性能に影響する成分を分離・調整する(※7) ことで、高性能な化合物を表現する数値情報を新たに作る。それを再び化学式に変換し直すことで高性能な化学式を高確率で生成し、実験回数を削減する。
※4:特許出願中
※5:実存する化学式を文字列で表現したSMILES(Simplified Molecular Input Line Entry System)と呼ばれる形式のデータ群。およそ50万件規模。
※6:100~1000件規模の化学式とその材料特性値のデータ。
※7:特許出願中
※補足説明(背景情報)
材料科学分野では、環境負荷の少ないプラスチック素材などの材料需要の多様化に応えるため、AIやシミュレーションなどの技術を用いて新材料の研究開発効率を向上するMIの活用が期待されている。たとえば、AIを用いて素材の配合比率や製造条件(温度や圧力など)といったデータを解析し、高性能な材料を作るための最適な配合量や製造条件を推定することができる。
一般に、有機材料開発においてMIを適用する場合、その化学式(例:エタノール(CH3CH2OH))は文字情報であり、AIでは簡単に扱うことができないことから、化合物の構造や特性を数値化して記述子で表し(※8)、これらの記述子からAIに材料性能を予測させる手法が知られている。ところが、この記述子は容易には化学式に逆変換できないため、従来は有識者がAIの予測性能値をもとに大量に提示された化学式の中から有望と思われるものだけを選別し、それらの候補を実験して材料性能を評価することで、新材料の化学式を特定する方法が取られてきた(図(1)を参照)。
近年では、深層学習の発展に伴い、直接化学式を発案するAIも開発されているものの、こうしたAIが高性能な材料の化学式を発案できるよう学習させるためには、化学式とその性能指標値(※9) がペアになった大量の実験データが必要となるなど、学習用のベースとなるデータを得るために実験回数が増えてしまうといった課題があった。
※8:化合物の化学的特徴を数値化してあらわしたもので、記述子(fingerprint)などと呼ばれる。
※9:粘性や溶解度など、材料がもつ機能や特性を定量的に評価した数値。