実験計画法は企業研究者に必須の技術
多くの場合、企業研究者の研究開発には目標とする性能や水準があります。
その目標に対してどういうアプローチで研究開発を進めるか、というのは研究者のセンスが問われるところです。
本記事では、複雑な目標・課題に対して効果を発揮する実験計画法について解説します。
実験計画法を使って効率的に成果を出すためのプロセス全体を説明していきます。
「仮説生成型」や「データ駆動型」と呼ばれる研究の進め方の解説、という言い方もできます。
一般的に実験計画法というと、要因計画や直行表、空間充填計画など、複雑な現象を精度高く、かつ効率的に分析するためにはどのような実験点を打つべきかを扱う学問です。
しかし、本記事では広義の実験計画法、つまり実験計画法を使った研究プロセス全体に関してまとめています!
一般的な、狭義の実験計画法の解説は別記事でまとめる予定です。
実験計画法とは
ケーススタディ: あなたならどう研究を進める?
最初に簡単なケーススタディをやってみましょう。
以下のようなケースで2種類の課題が与えられたとき、あなたならどう研究を進めるか考えてみてください。
いかがでしょうか?
①のケースでは、誰もが同じような答えにたどり着くのではないでしょうか。
例えば、成分X / Y / Zの比を一定にして、共重合体の量をいくつかの水準で変えて物性αを測定し、共重合体の量と物性αの関係を2次元プロット等で確認しますね。
では、②のケースではどうでしょうか。ここでは回答が異なるかもしれません。
多くの研究者は次のように研究を進めるのではないでしょうか。
「過去の経験から、成分Xと共重合体の量比が物性αに及ぼす影響が大きい。まずはそこを探索してみよう。」
「量比だけでは目標値に達しなかった。次は共重合体のモノマー組成を色々と変更してみよう。」
「やはりうまくいかない。共重合体の分子量が影響するかもしれない。やってみよう。」
どうでしょう。心当たりのある進め方ではないでしょうか。
これは「仮説検証型」や「仮説駆動型」と呼ばれるスタイルです。
このスタイルがうまくハマることももちろんあります。
ただしこのケースで考えると、上記以外にも成分YやZの量など、物性に影響しそうな因子が多く存在します。
仮説検証型で一つずつ潰していくと、目標に到達するのに非常に時間がかかる恐れがあります。
では、実験計画法を活用する場合は②に対してどうアプローチするのでしょうか。
実験計画法による研究方針
では実験計画法を使う場合、その研究者がまず考えることは、ずばり……
「物性 = f(X) のモデルを作って、目標を達成する最適条件を見つけよう!」
ということです。
いいですね。非常にシンプルです。
もう少し読み解いていきましょう。
まず「物性 = f(X)のモデルを作る」という部分ですが、これは言い換えると「物性に影響する因子を説明変数として、物性を導出する数式を作る」という意味です。
イメージが湧きにくい人は、例えば以下のような数式を考えてみましょう。
物性α = 1.5 × (共重合体量 / 成分X) + 0.8 × (共重合体分子量) - 0.4 * (モノマーA / モノマーC) + ……
これは線形重回帰モデルと呼ばれる形ですが、このように説明変数によって物性αを計算できる式を作ります。
この式を作るために、まずは必要な数のデータを実際に取得して、そこからモデリングするわけです。
モデルを作れば何が嬉しいでしょう。勘のいい人は分かりますね。
そう、目標の物性αを満たす条件を逆に導出できるんです。以下イメージ図です。
イメージ図の曲面がモデルによって表されるもので、実験で得られたデータをうまく説明できるように作られます。
そして、その曲面の中で目標を達成する条件点を見つけてくるわけです。
この方法のほうが目標達成が早いケースが非常に多いです。
このモデルに求められることは、「未知の実験点に対する精度」です。
最初にモデルを作るために実験データを取得しますが、そのデータで目標を達成するのはスーパーラッキーケースです。
通常、最初のデータを元に作ったモデルからはじき出した最適条件で再度実験を行います。
その時の精度が非常に重要というわけです。
そして、精度の高いモデルを作り、より早く目標を達成するための一連の研究プロセスが実験計画法(広義)ということです。
どうでしょう。イメージ湧いたのではないでしょうか。
実験計画法で必ず解が得られるわけではない
さて、ここまで「実験計画法とは何か?」について解説してきましたが、当然実験計画法を用いて研究を進めたとして、必ず解が得られるわけではありません。
例えば、「モデルは組めたが、目標値を達成する条件は存在しないじゃないか!」というケースもあります。
ただ、この場合でも「今の系では可能性が低い。何か新しい要素を持ち込む必要がある。」という判断が早くなりますよね。
「仮説検証型」の進め方では、諦めがつかず、いつまでも重箱の隅をつつくような条件を探索してしまうことがあります。
撤退や方向転換の判断が遅いのは企業研究者としては致命的です。
実験計画法によるアプローチで得られる情報は、意思決定の根拠をも定量的に与えてくれるのです。
実験計画法の全体像
大きく分けて6ステップ
では、実験計画法による研究プロセスの全体像を見ていきましょう。
図解したのでこれをベースに解説していきます。この図は頭に叩き込みましょう。
まずは実験デザインから始まります。
ここで、「目標は何か」「どの程度の実験点数が取れそうか」など必要な情報を整理した上で、具体的にどの条件で実験をするかを決めます。
そして実際にデータ取得を行った後、まずはデータを観察します。
「外れ値はないか」「変数変換は必要ないか」など、モデリングに入る前にデータ外観を観察します。
次にモデリングです。
モデリングには様々な手法が存在しますが、適切なものを選んでモデルを作成します。
作成したモデルの精度を評価したり、モデルの解釈を試みます。
そして、とうとう最適化です。
モデルから目標に達する条件を逆解析し、その条件で確認実験を行います。
各ステップについて、もう少し詳しく見ていきましょう。
実験デザイン
このステップは非常に重要です。上図のようなことを考えます。
とくに説明変数の洗い出しと選定が大事!
ここはやはり化学の知識や過去の経験、ノウハウが効いてきます。
(経験やノウハウは逆にミスリードにつながることもありますが…。)
モデルを作るときに説明変数が多いと困ることがあるため、取得できる実験点の数にも依りますが、できるだけ少ないほうが望ましいです。
もちろん少なすぎても精度の高いモデルが作れなくなるので、バランスが重要です。
実験デザインのステップに関する詳説は別記事でまとめる予定です。
データ取得、データ観察
データ取得は「フィッシャーの三原則」に注意して行います。
ここでは深く立ち入りませんので、気になる方はググってください。
得られたデータでいきなりモデルを作りにいかないようにしましょう。
まずは観察です。上図のようなことを考えます。
とくに外れ値の確認が大事!
実験計画法(狭義)を用いて計画した実験点は、説明変数側での外れ値はありませんが、目的変数にはあり得ます。
これは、「その条件付近でのみ目的変数が大きく変わる」か、「実験的ミスによる外れ値」の2パターンあります。
前者ならいいのですが、後者であれば実験のやり直しが必要です。
外れ値がある状態でモデリングを行うと、外れ値に引っ張られた精度の低いモデルになる可能性があるので、事前にしっかり確認しましょう。
データ観察のステップに関する詳説は別記事でまとめる予定です。
モデリング、最適化、確認実験
モデリング⇒最適化はプロセス全体の中でも花形といっていいでしょう。
それぞれ、上図のようなことを考えます。
とくにモデリングは奥が深く、データ分析者の腕の見せ所です。
モデルは精度と解釈性のバランスが重要です。
化学研究へ応用する場合、モデルを解釈することで新たな発見につながるケースが多々あります。
例えば、「この説明変数がここまで強く効いていると思っていなかった」など。
モデリングに関してはいくつかの記事で取り扱っていく予定です。
実験計画法は一本道ではない
もちろん、上述した手順1回で目標達成することもありますが、厳しい世の中です、そんなうまくいきません。
例えば「確認実験したけど目標に達しなかった」。
こんな時は確認実験の結果を含めて再度モデリング⇒最適化⇒確認実験の手順を踏みます。
設定した説明変数が不適切だったため、実験デザインからやり直し、なんてこともザラにあります。
あるいは「決めた条件で実験したけど、そもそもその条件では実験が成り立たない」。
こんな時は条件範囲を変更するために実験デザインに立ち戻る必要があります。
また、既存の実験データがあるケースもあるでしょう。
その場合はデータ観察から始まります。
このように様々なケースがありますが、全体プロセスを頭に入れておけば、目標に向けて多種多様なルートを描くことができるはずです。
全体像はしっかり理解しておきましょう!
おわりに
実験計画法を活用した研究プロセスの全体像の解説をしてきました!
どうでしょうか。知らなかった人は目から鱗の内容だったはず。
少なくとも、私が最初にこの手法を知ったとき、結構な衝撃でした!
これを知っているのと知らないとでは、企業研究者として実績を残せるかどうかが結構変わってくると思います。
ぜひ、この考え方を身に着け、さらに実践できるようにしていってください。
実践はPythonがあれば誰でもできます。
本ブログではPythonによる実装も扱っていくので楽しみにしていてください。
参考文献
本書は、数理モデル全体が有機的に繋がって見えるような「横糸的な」理解を可能にする、全く新しい入門的な教科書です。…