【ステップ別】実験系材料技術者が独学でマテリアルズインフォマティクスを業務活用するまでに有用な参考書

Laboratory Analysis Chemistrypython

昨今のDX・AIの波により材料開発界隈にもマテリアルズインフォマティクス(MI)として開発プロセスの革新が進んでいます。

実験系技術者といえど、今後ともデータサイエンスと一切無関係にいることは恐らくできないでしょう。

MIを強力に推進している組織に所属している実験系材料技術者の方は教育を受ける機会があります。

しかし、そうでない組織に所属している方の場合には、どういった勉強をすればよいか悩ましいかと思います。

マテリアルズインフォマティクスを業務で活用している企業内の実験系材料技術者の私個人の経験から、マテリアルズインフォマティクスの学習・実践に有用であった書籍について紹介します。

なお本記事の読者としては、マテリアルズインフォマティクスを推進していない組織に属し、分子デザインというよりは実験計画を必要としている電池や塗料、ゴムなどといった類の技術者を想定しています。

ステップ

業務でマテリアルズインフォマティクスを活用するまでの学習ステップを以下のように設定します。

  1. マテリアルズインフォマティクスの概要を知る
  2. プログラム(python)に触れてみる
  3. 機械学習・マテリアルズインフォマティクスに触れてみる
  4. 機械学習のテクニックを向上させる
  5. 機械学習のテクニックを向上させる(主に関係者への説明のために)
  6. 理論に触れてみる
  7. プログラミングのレベルを上げてみる
  8. 開発環境を整えてみる
  9. 【参考】マテリアルズインフォマティクス活用で失敗しないために
  10. 【参考】先が見通せない世界で働いていくために

マテリアルズインフォマティクスの概要を知る

実務に入る前に概念としてマテリアルズインフォマティクスの概要を把握します。

プログラミングや、複雑な数式なしにざっくりと概要を把握します。

マテリアルズ・インフォマティクス 材料開発のための機械学習超入門
Amazonで岩﨑 悠真のマテリアルズ・インフォマティクス 材料開発のための機械学習超入門。アマゾンならポイント還元本が多数。一度購入いただいた電子書籍は、KindleおよびFire端末、スマートフォンやタブレットなど、様々な端末でもお楽しみいただけます。

プログラムに触れてみる

マテリアルズインフォマティクスを実践するのに一般的に使用されるプログラミング言語であるpythonの入門学習を行います。

Pythonスタートブック[増補改訂版]
Amazonで辻 真吾のPythonスタートブック[増補改訂版]。アマゾンならポイント還元本が多数。一度購入いただいた電子書籍は、KindleおよびFire端末、スマートフォンやタブレットなど、様々な端末でもお楽しみいただけます。

一点注意としては、pythonの環境構築でよく利用されるanacondaは一定規模以上の企業では有料ライセンスとなることです。個人が学習で取り敢えず触る分には問題ないですが、企業内で業務活用したい場合にはライセンスを確認してください。

一定規模以上の企業でpythonを利用する場合にはanacondaの有料ライセンスを利用するか、他の環境構築方法を選択する必要があります。

Anacondaが有償化されて困っている人に贈る、Pythonのパッケージ管理 - Qiita
Anacondaの商用有償化 こちらの記事でご存知の方も多いかと思いますが、 2020/4より、従業員数200名以上の営利企業では、Anacondaの利用が有償化されたようです (無料のIndividual Editionではな...

機械学習・マテリアルズインフォマティクスに触れてみる

とりあえず自身でMI・機械学習の基礎的なプログラムを動かせるようになることを目指します。

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎
Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎
Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析 (KS情報科学専門書)
Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析 (KS情報科学専門書)

機械学習のテクニックを向上させる

もう少し実践的なプログラムを構築できるようになることを目指します。

この辺りまで来ると、手元のデータをとりあえず解析できるようになってるでしょう。

Kaggleで勝つデータ分析の技術
Amazonで門脇 大輔, 阪田 隆司, 保坂 桂佑, 平松 雄司のKaggleで勝つデータ分析の技術。アマゾンならポイント還元本が多数。一度購入いただいた電子書籍は、KindleおよびFire端末、スマートフォンやタブレットなど、様々な端末でもお楽しみいただけます。
前処理大全[データ分析のためのSQL/R/Python実践テクニック]
Amazonで本橋 智光, 株式会社ホクソエムの前処理大全[データ分析のためのSQL/R/Python実践テクニック]。アマゾンならポイント還元本が多数。一度購入いただいた電子書籍は、KindleおよびFire端末、スマートフォンやタブレットなど、様々な端末でもお楽しみいただけます。

機械学習のテクニックを向上させる(主に関係者への説明のために

機械学習自体は特性値の予測を得意としていますが、実際の材料開発ではどうしてそう予測したのかという根拠を求められます。

機械学習が予測した値の根拠を説明するテクニックを学習します。

機械学習を解釈する技術〜予測力と説明力を両立する実践テクニック
Amazonで森下 光之助の機械学習を解釈する技術〜予測力と説明力を両立する実践テクニック。アマゾンならポイント還元本が多数。一度購入いただいた電子書籍は、KindleおよびFire端末、スマートフォンやタブレットなど、様々な端末でもお楽しみいただけます。

理論に触れてみる

上記までで、何となくマテリアルズインフォマティクスが使えるんじゃないかという雰囲気になると、より理論的な疑問わいたり、質問が飛んできたりするでしょう。

理論面について入門してみます。

ガウス過程と機械学習 (機械学習プロフェッショナルシリーズ)
Amazonで持橋大地, 大羽成征のガウス過程と機械学習 (機械学習プロフェッショナルシリーズ)。アマゾンならポイント還元本が多数。一度購入いただいた電子書籍は、KindleおよびFire端末、スマートフォンやタブレットなど、様々な端末でもお楽しみいただけます。
多変量解析入門――線形から非線形へ
多変量解析入門――線形から非線形へ
データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)
データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)

ただし上記参考書では、機械学習でよく利用される決定木系のアルゴリズムについて触れられていません。(良い参考書誰か教えてください)

プログラミングのレベルを上げてみる

周りもpythonを始めたりすると適当な我流コードでは見せるのが恥ずかしい気持ちになります。

読みやすいコードを目指します。

リーダブルコード ―より良いコードを書くためのシンプルで実践的なテクニック (Theory in practice)
リーダブルコード ―より良いコードを書くためのシンプルで実践的なテクニック (Theory in practice)

とりあえず試行錯誤のコードであればコードのデザインなどはあまり考えないでしょうが、ある程度形に残そうとすると綺麗なデザインである方が望ましいです。

コードのデザインパターンについて学習します。

実践 Python 3
実践 Python 3

開発環境を整えてみる

手元の実験データを少し解析する程度であれば問題ありませんが、ある程度のスケールの機械学習を行おうとするとデータベースや機械学習の実験管理といった環境を整備したくなります。

実践 データ分析の教科書
Amazonで株式会社日立製作所の実践 データ分析の教科書。アマゾンならポイント還元本が多数。一度購入いただいた電子書籍は、KindleおよびFire端末、スマートフォンやタブレットなど、様々な端末でもお楽しみいただけます。

【参考】マテリアルズインフォマティクス活用で失敗しないために

マテリアルズインフォマティクスを学んでみると、マテリアルズインフォマティクスを利用して何かを行いたくなり、手段が目的化することが往々にしてあります。

これを避けるためには、その仕事の目的をしっかり確認する必要があります。

以下は、何のためにその仕事をするのか、という点を確認するために参考になる書籍です。

仕事の説明書〜あなたは今どんなゲームをしているのか〜 (土日出版)
Amazonで田宮 直人, 西山 悠太朗, パブリック・ブレインの仕事の説明書〜あなたは今どんなゲームをしているのか〜 (土日出版)。アマゾンならポイント還元本が多数。一度購入いただいた電子書籍は、KindleおよびFire端末、スマートフォンやタブレットなど、様々な端末でもお楽しみいただけます。

【参考】先が見通せない世界で働いていくために

先行きが不透明で、将来の予測が困難な時代と言われる今、上記のようにマテリアルズインフォマティクスやプログラミングを学んでも、「一過性のブームですぐに廃れてた」、「技術進歩が速く誰でも自動機械学習で材料技術者がプログラミングをする必要がなくなった」等で今後もずっと役に立つことはないかもしれません。

こういった時代の荒波を乗り越えるための参考になる書籍です。

ライフピボット 縦横無尽に未来を描く 人生100年時代の転身術 できるビジネスシリーズ
Amazon.co.jp: ライフピボット 縦横無尽に未来を描く 人生100年時代の転身術 できるビジネスシリーズ eBook : 黒田 悠介: 本

まとめ

マテリアルズインフォマティクスを業務で活用することを目指し、pythonの入門からチームでの活用までステップ別に参考になるであろう書籍を紹介しました。

参考になりましたら幸いです。

コメント

タイトルとURLをコピーしました