【ステップ別】実験系材料技術者が独学でマテリアルズインフォマティクスを業務活用するまでに有用な参考書

Laboratory Analysis Chemistrypython

昨今のDX・AIの波により材料開発界隈にもマテリアルズインフォマティクス(MI)として開発プロセスの革新が進んでいます。

実験系技術者といえど、今後ともデータサイエンスと一切無関係にいることは恐らくできないでしょう。

MIを強力に推進している組織に所属している実験系材料技術者の方は教育を受ける機会があります。

しかし、そうでない組織に所属している方の場合には、どういった勉強をすればよいか悩ましいかと思います。

マテリアルズインフォマティクスを業務で活用している企業内の実験系材料技術者の私個人の経験から、マテリアルズインフォマティクスの学習・実践に有用であった書籍について紹介します。

なお本記事の読者としては、マテリアルズインフォマティクスを推進していない組織に属し、分子デザインというよりは実験計画を必要としている電池や塗料、ゴムなどといった類の技術者を想定しています。

ステップ

業務でマテリアルズインフォマティクスを活用するまでの学習ステップを以下のように設定します。

  1. マテリアルズインフォマティクスの概要を知る
  2. プログラム(python)に触れてみる
  3. 機械学習・マテリアルズインフォマティクスに触れてみる
  4. 機械学習のテクニックを向上させる
  5. マテリアルズインフォマティクスについてもう少し触れてみる
  6. 機械学習のテクニックを向上させる(主に関係者への説明のために)
  7. 理論に触れてみる
  8. プログラミングのレベルを上げてみる
  9. 開発環境を整えてみる
  10. 【参考】マテリアルズインフォマティクス活用で失敗しないために
  11. 【参考】先が見通せない世界で働いていくために

マテリアルズインフォマティクスの概要を知る

実務に入る前に概念としてマテリアルズインフォマティクスの概要を把握します。

プログラミングや、複雑な数式なしにざっくりと概要を把握します。

マテリアルズ・インフォマティクス 材料開発のための機械学習超入門
Amazon.co.jp: マテリアルズ・インフォマティクス 材料開発のための機械学習超入門 eBook : 岩﨑 悠真: Kindleストア

プログラムに触れてみる

マテリアルズインフォマティクスを実践するのに一般的に使用されるプログラミング言語であるpythonの入門学習を行います。

Pythonスタートブック[増補改訂版]
Amazon.co.jp: Pythonスタートブック[増補改訂版] eBook : 辻 真吾: Kindleストア

一点注意としては、pythonの環境構築でよく利用されるanacondaは一定規模以上の企業では有料ライセンスとなることです。個人が学習で取り敢えず触る分には問題ないですが、企業内で業務活用したい場合にはライセンスを確認してください。

一定規模以上の企業でpythonを利用する場合にはanacondaの有料ライセンスを利用するか、他の環境構築方法を選択する必要があります。

Anacondaが有償化されて困っている人に贈る、Pythonのパッケージ管理 - Qiita
Anacondaの商用有償化こちらの記事でご存知の方も多いかと思いますが、2020/4より、従業員数200名以上の営利企業では、Anacondaの利用が有償化されたようです(無料のIndivi…

機械学習・マテリアルズインフォマティクスに触れてみる

とりあえず自身でMI・機械学習の基礎的なプログラムを動かせるようになることを目指します。

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎
Pythonの機械学習用ライブラリの定番、scikit-learnのリリースマネージャを務めるなど開発に深く関わる著者が、scikit-learnを使った機械学習の方法を、ステップバイステップで解説します。 ニューラルネットを学ぶ前に習得しておきたい機械学習の基礎をおさえるとともに、優れた機械学習システムを実装し精度の...
Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析 (KS情報科学専門書)
★ 実験を効率化する強い味方 ★ もう実験で疲弊しない。次に試す実験条件は、データと統計学が教えてくれる! ベイズ最適化とPythonを駆使して、効率よく研究・開発を進めよう! 《すぐに試せるサンプルデータセット・サンプルコード付き》 ■ データ解析の初歩から、モデルの設計、実践的な応用事例までを導く。 ■ 実験時間や...

機械学習のテクニックを向上させる

もう少し実践的なプログラムを構築できるようになることを目指します。

この辺りまで来ると、手元のデータをとりあえず解析できるようになってるでしょう。

Kaggleで勝つデータ分析の技術
Amazon.co.jp: Kaggleで勝つデータ分析の技術 eBook : 門脇 大輔, 阪田 隆司, 保坂 桂佑, 平松 雄司: Kindleストア
前処理大全[データ分析のためのSQL/R/Python実践テクニック]
Amazon.co.jp: 前処理大全[データ分析のためのSQL/R/Python実践テクニック] eBook : 本橋 智光, 株式会社ホクソエム: Kindleストア

マテリアルズインフォマティクスについてもう少し触れてみる

高分子や、結晶構造など自身の分野に即し、ドメイン知識とデータサイエンスの両方の知見を活かした解析が必要になります。

マテリアルズインフォマティクス
現在、学問的にも産業界的にもマテリアルズインフォマティクスが注目されている。マテリアルズインフォマティクスは、データ科学に基づく材料工学・物質科学であり、材料開発を効率化し、物性を理解する上で新たな視点を与えるものである。このようなマテリアルズインフォマティクスを理解し、使いこなすためには、マテリアルズインフォマティク...

機械学習のテクニックを向上させる(主に関係者への説明のために

機械学習自体は特性値の予測を得意としていますが、実際の材料開発ではどうしてそう予測したのかという根拠を求められます。

機械学習が予測した値の根拠を説明するテクニックを学習します。

機械学習を解釈する技術〜予測力と説明力を両立する実践テクニック
Amazon.co.jp: 機械学習を解釈する技術〜予測力と説明力を両立する実践テクニック eBook : 森下 光之助: Kindleストア

理論に触れてみる

上記までで、何となくマテリアルズインフォマティクスが使えるんじゃないかという雰囲気になると、より理論的な疑問わいたり、質問が飛んできたりするでしょう。

理論面について入門してみます。

ガウス過程と機械学習 (機械学習プロフェッショナルシリーズ)
圧倒的に柔軟なベイズ的回帰モデルであるガウス過程の日本初の入門書。基礎の線形回帰から始め、ガウス過程の原理をゼロからていねいに解説。教師なし学習、実応用など最近の話題まで紹介した。さあ、はじめよう!
多変量解析入門――線形から非線形へ
諸科学、産業界のあらゆる分野で、複雑な多次元データから情報やパターンを抽出する必要性は増すばかりである。本書では、回帰モデルやベイズ判別、主成分分析、サポートベクターマシーンによる判別法などさまざまな解析手法について、単変量から多変量、二群から多群、線形から非線形への展開を、実例とともに平易に解き明かす。
データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)
現象を数理モデルで表現・説明するのに慣れていない人のために、章ごとに異なる例題を解決していく過程を通して、統計モデルの基本となる考えかたを説明する。前半では、応用範囲のひろい統計モデルのひとつである一般化線形モデルの基礎を、後半では、実際のデータ解析に使えるように、それらをベイズ統計モデル化する方法を説明する。

ただし上記参考書では、機械学習でよく利用される決定木系のアルゴリズムについて触れられていません。(良い参考書誰か教えてください)

プログラミングのレベルを上げてみる

周りもpythonを始めたりすると適当な我流コードでは見せるのが恥ずかしい気持ちになります。

読みやすいコードを目指します。

リーダブルコード ―より良いコードを書くためのシンプルで実践的なテクニック (Theory in practice)
「美しいコードを見ると感動する。優れたコードは見た瞬間に何をしているかが伝わってくる。そういうコードは使うのが楽しいし、 自分のコードもそうあるべきだと思わせてくれる。本書の目的は、君のコードを良くすることだ」(本書「はじめに」より)。 コードは理解しやすくなければならない。本書はこの原則を日々のコーディングの様々な場...

とりあえず試行錯誤のコードであればコードのデザインなどはあまり考えないでしょうが、ある程度形に残そうとすると綺麗なデザインである方が望ましいです。

コードのデザインパターンについて学習します。

実践 Python 3
仕事や研究で役立つ実践的な側面を重視し、一般的なプログラミングのベストプラクティスをPythonに適用する方法について解説します。 主なテーマは、エレガントなコーディングのためのデザインパターン、処理速度向上のための並行処理とCython、高レベルなネットワーク処理、そしてグラフィックスです。 読者対象は中級以上のPy...

開発環境を整えてみる

手元の実験データを少し解析する程度であれば問題ありませんが、ある程度のスケールの機械学習を行おうとするとデータベースや機械学習の実験管理といった環境を整備したくなります。

実践 データ分析の教科書
Amazon.co.jp: 実践 データ分析の教科書 eBook : 株式会社日立製作所: Kindleストア

【参考】マテリアルズインフォマティクス活用で失敗しないために

マテリアルズインフォマティクスを学んでみると、マテリアルズインフォマティクスを利用して何かを行いたくなり、手段が目的化することが往々にしてあります。

これを避けるためには、その仕事の目的をしっかり確認する必要があります。

以下は、何のためにその仕事をするのか、という点を確認するために参考になる書籍です。

Bitly

【参考】先が見通せない世界で働いていくために

先行きが不透明で、将来の予測が困難な時代と言われる今、上記のようにマテリアルズインフォマティクスやプログラミングを学んでも、「一過性のブームですぐに廃れてた」、「技術進歩が速く誰でも自動機械学習で材料技術者がプログラミングをする必要がなくなった」等で今後もずっと役に立つことはないかもしれません。

こういった時代の荒波を乗り越えるための参考になる書籍です。

ライフピボット 縦横無尽に未来を描く 人生100年時代の転身術 できるビジネスシリーズ
Amazon.co.jp: ライフピボット 縦横無尽に未来を描く 人生100年時代の転身術 できるビジネスシリーズ eBook : 黒田 悠介: 本

まとめ

マテリアルズインフォマティクスを業務で活用することを目指し、pythonの入門からチームでの活用までステップ別に参考になるであろう書籍を紹介しました。

参考になりましたら幸いです。

コメント

タイトルとURLをコピーしました