Tomoyasu Yokoyama Computational Materials Scientist's Pages

2022年の読んでおきたいマテリアルズ・インフォマティクス論文5選

マテリアルズ・インフォマティクス(MI)の分野は毎日数十報もの論文が公開されます。そうした論文を流し見し続けている中で、1ヶ月に1回くらいの頻度で「お!?」となる論文があります。ツイートしているだけだと後から見返すのが大変なので、記録という意味もこめて、個人的注目論文を分野ごとに5本ピックアップしてみました。

機械学習ポテンシャル

2022年の中でMI関連で最も多かったと感じた論文が「機械学習ポテンシャル」関連です。

機械学習ポテンシャルとは、原子の間に働くエネルギーや原子間力を機械学習により予測する手法です。従来の第一原理計算をはじめとする計算科学的な手法では計算コストが高いという課題を、機械学習で解決しようという取り組みです。これにより、これまで時間がかかって難しかった有限温度でのシミュレーションや表面や界面などのマクロスケールのシミュレーションが可能になると期待されています。昨年までで手法がかなり進化してきたため、今年はさまざまな材料・デバイスに機械学習ポテンシャルを応用する研究が一気に増えました。僕自身もよく使いました。

そうした中でも面白かったのが、以下のDeepMindさんの機械学習ポテンシャルの論文。これまでのポテンシャルは、エネルギー曲面がガタガタで(=局所解が多く)、最適解へ抜け出すことが難しかったのですが、この論文は調和ポテンシャルを学習することで、エネルギー曲面を平坦にして局所解を減らすor抜け出す点がポイントのようです。面白いことに、原子間力の予測精度が悪くてもちゃんとした構造を予測できるとのことで、機械学習ポテンシャルのさらなるブレイクスルーに繋がりそうと感じました。

機械学習波動関数

この1年間で最も増加したと感じた論文が「機械学習波動関数」関連です。

機械学習波動関数は、電子の振る舞いを表す方程式であるシュレディンガー方程式を機械学習を用いて解いて波動関数を予測する手法です。シュレディンガー方程式を厳密に解くことができないため、従来は近似して波動関数を求めていましたが、機械学習により厳密解に近い波動関数を予測する取り組みです。これにより、これまでの近似手法に基づいている第一原理計算では実験を再現できない材料系(強相関系など)を正確に予測できる、つまり第一原理計算を超えることができると期待されています。機械学習ポテンシャルに比べるとまだ歴史は浅いですが、昨年と比べ今年は論文数が急増した印象でした。

そうした中で注目度が高いのが、これまたDeepMindさんの論文。2020年にDeepMindさんが報告した機械学習波動関数の続編で、自然言語処理の分野で効果を発揮しているトランスフォーマーを使うことで従来より精度が大きく改善したそうです。おそらくまだ精度や計算コスト等の面で課題があると思いますが、5年後くらいには今の機械学習ポテンシャルのような存在になっているのではないかと期待しています。

自動実験装置のオープンソース化

ソフト面だけでなくハード面でも今年は気になる動きがありました。それは実験装置のオープンソース化です。

Githubなどで最新のコードを試すことができるようにソフト面ではオープンソース化が浸透してきましたが、それがハード面でも起きる可能性を感じました。これにより、誰でも簡単に自動実験装置などを導入でき、生成コストが高かった実験データを簡単に集めることができ、機械学習と組み合わせて開発時間を短縮できることが期待されます。

例えば、以下のような電池セルを自動作成する実験装置のオープンソース化についての論文を読むと、数年後にはそうした未来が到来するように期待してしまいます。装置のための部品の型番や、組み立て方、操作方法、操作・解析のためのソフトまで公開されています。新しい装置ビジネスにもつながりそう。お金さえあれば・・。

機械学習の外挿性

あと増えたなと感じたのが、実際にMIを適用する際に生じる課題を解決するより実践的なアプローチです。具体的には「機械学習で物性を高精度に予測できました」という単純な論文だけでなく、実際に探索する時の課題になる「外挿性」とどううまく付き合うかという点です。

材料デバイス分野は既存よりも高い物性・特性を有する材料・デバイスを見つけたいという問題設定が多く、データが少ない領域である外挿領域を予測することが重要視されます。しかし学習データがそもそも少ないので、機械学習は外挿領域の予測は苦手です。そこで「データの偏り」や「不確実性」を考慮し外挿性を高めようとする、材料デバイスに特化した手法が最近報告されています。

例えば、特異点を想定した最適化アルゴリズムにより従来の400倍早く最適化することができるとの報告があります。いい材料はデータの中で見ると異常値でしかないので、それを超えるさらに異常値の材料を見つけるのはまだまだ難しいと思いますが、こうした取り組みが進むことで少しでも確率を上げられるといいなと思います。

マテリアルズ・インフォマティクスによる発見

「で、実際MIは役に立っているの?」という話ですが、機械学習で予測された材料が実験でちゃんと合成でき、予測通り高い特性を持つことがわかったという報告が年々増えています。2022年で特に注目度が高かったのは以下の高エントロピー合金の論文です。(部品さんのツイートを引用させていただきました。)

高エントロピー合金とは、5種類以上の元素を混ぜた金属材料で、考えられうる元素の組み合わせとその比率が膨大であるため、従来のアプローチでは最適材料の発見は困難です。この論文では、オートエンコーダーを用いて合成可能な元素の組み合わせ候補を生成し、回帰モデルでその候補の物性を予測し、高い物性の候補を実際に実験を行ってフィードバックするというループを繰り返すことで、熱膨張係数が極めて低い高エントロピー合金を発見しています。カッコいい・・こんな発見がしたいです。

以上です、2023年はどんな面白いマテリアルズ・インフォマティクスの研究成果が報告されるのか、楽しみです。

番外編その1

マテリアルズ・インフォマティクスのレビュー論文です。わかりやすくまとめてあって、初学者からプロまでおすすめの一本です。

番外編その2

材料データの標準化の論文です。分子構造はいろんな書き方があり、機械学習で統一のフォーマットに変換しようという取り組みです。

標準フォーマットを権利化できると何もしなくてもお金もちになれます。IBMさんは頭がいい。

番外編その3

MIは関係ないですが、笑ってしまったのでここに記録しておきます。盛り上がる研究分野に対し論文数を稼ぐような意味のない研究をするなと警鐘鳴らす論文です。何を入れたとしても特性が良くなるので論文を公開するのに意味がないという論法です。

面白いのは原料として鳥のフンを使っている点、ちゃんと特性が改善するそうです。ツバを吐きかけても改善するだろうと言っており、どこまでも尖っています。