2022年の読んでおきたいマテリアルズ・インフォマティクス論文5選

マテリアルズ・インフォマティクス（MI）の分野は毎日数十報もの論文が公開されます。そうした論文を流し見し続けている中で、１ヶ月に1回くらいの頻度で「お！？」となる論文があります。ツイートしているだけだと後から見返すのが大変なので、記録という意味もこめて、個人的注目論文を分野ごとに5本ピックアップしてみました。

機械学習ポテンシャル

2022年の中でMI関連で最も多かったと感じた論文が「機械学習ポテンシャル」関連です。

機械学習ポテンシャルとは、原子の間に働くエネルギーや原子間力を機械学習により予測する手法です。従来の第一原理計算をはじめとする計算科学的な手法では計算コストが高いという課題を、機械学習で解決しようという取り組みです。これにより、これまで時間がかかって難しかった有限温度でのシミュレーションや表面や界面などのマクロスケールのシミュレーションが可能になると期待されています。昨年までで手法がかなり進化してきたため、今年はさまざまな材料・デバイスに機械学習ポテンシャルを応用する研究が一気に増えました。僕自身もよく使いました。

そうした中でも面白かったのが、以下のDeepMindさんの機械学習ポテンシャルの論文。これまでのポテンシャルは、エネルギー曲面がガタガタで（＝局所解が多く）、最適解へ抜け出すことが難しかったのですが、この論文は調和ポテンシャルを学習することで、エネルギー曲面を平坦にして局所解を減らすor抜け出す点がポイントのようです。面白いことに、原子間力の予測精度が悪くてもちゃんとした構造を予測できるとのことで、機械学習ポテンシャルのさらなるブレイクスルーに繋がりそうと感じました。

DeepMindさんの機械学習ポテンシャルが登場。

学習モデルの力の予測がうまくいかなくても、安定構造を予測できるという驚きの結果。なぜうまくいくのかまだわからないそうです。

VASPなど第一原理計算コードよりも最適解にたどりつきやすい点も興味深い。これらのコードもAIに駆逐されてしまうのか… https://t.co/yQ1MRmIfhV
— 横山トモヤス｜計算材料科学者 (@yoko_materialDX) October 3, 2022

機械学習波動関数

この１年間で最も増加したと感じた論文が「機械学習波動関数」関連です。

機械学習波動関数は、電子の振る舞いを表す方程式であるシュレディンガー方程式を機械学習を用いて解いて波動関数を予測する手法です。シュレディンガー方程式を厳密に解くことができないため、従来は近似して波動関数を求めていましたが、機械学習により厳密解に近い波動関数を予測する取り組みです。これにより、これまでの近似手法に基づいている第一原理計算では実験を再現できない材料系（強相関系など）を正確に予測できる、つまり第一原理計算を超えることができると期待されています。機械学習ポテンシャルに比べるとまだ歴史は浅いですが、昨年と比べ今年は論文数が急増した印象でした。

そうした中で注目度が高いのが、これまたDeepMindさんの論文。2020年にDeepMindさんが報告した機械学習波動関数の続編で、自然言語処理の分野で効果を発揮しているトランスフォーマーを使うことで従来より精度が大きく改善したそうです。おそらくまだ精度や計算コスト等の面で課題があると思いますが、5年後くらいには今の機械学習ポテンシャルのような存在になっているのではないかと期待しています。

機械学習でシュレディンガー方程式を解く論文。

DeepMindさんは一昨年にFermiNetを発表しましたが、今年はPsiformerだそうです。

Transformerアーキテクチャで電子間の相互作用を学習することで劇的に精度が改善したとのこと。

来年はこの分野もTransformerが主流に？https://t.co/KE8CjDNhMW
— 横山トモヤス｜計算材料科学者 (@yoko_materialDX) December 4, 2022

自動実験装置のオープンソース化

ソフト面だけでなくハード面でも今年は気になる動きがありました。それは実験装置のオープンソース化です。

Githubなどで最新のコードを試すことができるようにソフト面ではオープンソース化が浸透してきましたが、それがハード面でも起きる可能性を感じました。これにより、誰でも簡単に自動実験装置などを導入でき、生成コストが高かった実験データを簡単に集めることができ、機械学習と組み合わせて開発時間を短縮できることが期待されます。

例えば、以下のような電池セルを自動作成する実験装置のオープンソース化についての論文を読むと、数年後にはそうした未来が到来するように期待してしまいます。装置のための部品の型番や、組み立て方、操作方法、操作・解析のためのソフトまで公開されています。新しい装置ビジネスにもつながりそう。お金さえあれば・・。

電池開発の自動実験の論文。

ロボットを使って1日に64個の電池セルを組む自動実験システムを構築したそうです。

面白いのは、データやコードだけでなく必要な部品やその組み立て方、操作方法などもGitHubに公開されており、（お金さえあれば）誰でも再現が可能です。https://t.co/5Zuwn7UBM8 pic.twitter.com/Wjv5KYczf1
— 横山トモヤス｜計算材料科学者 (@yoko_materialDX) November 9, 2022

機械学習の外挿性

あと増えたなと感じたのが、実際にMIを適用する際に生じる課題を解決するより実践的なアプローチです。具体的には「機械学習で物性を高精度に予測できました」という単純な論文だけでなく、実際に探索する時の課題になる「外挿性」とどううまく付き合うかという点です。

材料デバイス分野は既存よりも高い物性・特性を有する材料・デバイスを見つけたいという問題設定が多く、データが少ない領域である外挿領域を予測することが重要視されます。しかし学習データがそもそも少ないので、機械学習は外挿領域の予測は苦手です。そこで「データの偏り」や「不確実性」を考慮し外挿性を高めようとする、材料デバイスに特化した手法が最近報告されています。

例えば、特異点を想定した最適化アルゴリズムにより従来の400倍早く最適化することができるとの報告があります。いい材料はデータの中で見ると異常値でしかないので、それを超えるさらに異常値の材料を見つけるのはまだまだ難しいと思いますが、こうした取り組みが進むことで少しでも確率を上げられるといいなと思います。

データの偏りを考慮した最適化の論文。

材料探索では特異点のような高い特性の材料を見つけたいですが、データの多くは低い特性のため、通常の手法では最適化できない問題がありました。

この偏りを考慮できる手法が提案されたそうです。

良い材料って異常値ですもんね。https://t.co/lkq5wXTPZQ pic.twitter.com/o2zTUdE4Pr
— 横山トモヤス｜計算材料科学者 (@yoko_materialDX) September 2, 2022

マテリアルズ・インフォマティクスによる発見

「で、実際MIは役に立っているの？」という話ですが、機械学習で予測された材料が実験でちゃんと合成でき、予測通り高い特性を持つことがわかったという報告が年々増えています。2022年で特に注目度が高かったのは以下の高エントロピー合金の論文です。（部品さんのツイートを引用させていただきました。）

高エントロピー合金とは、５種類以上の元素を混ぜた金属材料で、考えられうる元素の組み合わせとその比率が膨大であるため、従来のアプローチでは最適材料の発見は困難です。この論文では、オートエンコーダーを用いて合成可能な元素の組み合わせ候補を生成し、回帰モデルでその候補の物性を予測し、高い物性の候補を実際に実験を行ってフィードバックするというループを繰り返すことで、熱膨張係数が極めて低い高エントロピー合金を発見しています。カッコいい・・こんな発見がしたいです。

Machine learning–enabled high-entropy alloy discoveryhttps://t.co/NN2DvfLLFs
機械学習で超熱膨張率の高エントロピー合金を発見してScience、時代を感じる
— 部品（本田翼） (@tjmlab) October 7, 2022

以上です、2023年はどんな面白いマテリアルズ・インフォマティクスの研究成果が報告されるのか、楽しみです。

番外編その１

マテリアルズ・インフォマティクスのレビュー論文です。わかりやすくまとめてあって、初学者からプロまでおすすめの一本です。

#マテリアルズインフォマティクスの最新レビュー論文。

300以上の論文が目的や手法ごとにまとまっています。

物性予測や機械学習ポテンシャルに加え、ここ最近は機械学習汎関数の研究が増えてきているとのこと、たしかに。

教科書的で初学者にもオススメです。https://t.co/apc4BwIuOQ pic.twitter.com/dIUvLVINvF
— 横山トモヤス｜計算材料科学者 (@yoko_materialDX) April 15, 2022

番外編その2

材料データの標準化の論文です。分子構造はいろんな書き方があり、機械学習で統一のフォーマットに変換しようという取り組みです。

標準フォーマットを権利化できると何もしなくてもお金もちになれます。IBMさんは頭がいい。

IBMさんの機械学習により分子構造を標準化する論文。

分子の書き方は任意性があり僅かな違いが予測精度を下げる要因になります。

適当な構造から標準化されたフォーマットに高精度に変換できるTransformerモデルを構築したそうです。

標準化はビジネスの匂いがしますね。https://t.co/hLDGoEHJPO pic.twitter.com/8eXov4Wk8E
— 横山トモヤス｜計算材料科学者 (@yoko_materialDX) November 25, 2022

番外編その3

MIは関係ないですが、笑ってしまったのでここに記録しておきます。盛り上がる研究分野に対し論文数を稼ぐような意味のない研究をするなと警鐘鳴らす論文です。何を入れたとしても特性が良くなるので論文を公開するのに意味がないという論法です。

面白いのは原料として鳥のフンを使っている点、ちゃんと特性が改善するそうです。ツバを吐きかけても改善するだろうと言っており、どこまでも尖っています。

面白い論文を見つけました。

グラフェン電極を鳥のフンでコートすると優れた活性が得られるという論文。

グラフェンに元素を添加すると特性が上がる論文が量産されていることに対する批判を込めた研究だそうです。

唾を吐きかけても改善するだろうと書いてあり笑えます。https://t.co/lff7NUgaPr
— 横山トモヤス｜計算材料科学者 (@yoko_materialDX) April 2, 2022

2022年の読んでおきたいマテリアルズ・インフォマティクス論文5選

機械学習ポテンシャル

機械学習波動関数

自動実験装置のオープンソース化

機械学習の外挿性

マテリアルズ・インフォマティクスによる発見

番外編その１

番外編その2

番外編その3

You may also enjoy:

2024年の読んでおきたいマテリアルズ・インフォマティクス論文5選

人生が変わった一本の論文との出会い

2023年の読んでおきたいマテリアルズ・インフォマティクス論文5選