注目キーワード

必須Pythonライブラリガイド

一括インストールから用途別に徹底解説


はじめに

化学研究や実験データ解析、さらには自動化や機械学習による開発加速が求められる中、Pythonはこうした業務を大幅に効率化するための強力なツールです。

本記事では、化学の若手・中堅研究者の方々が、研究活動や業務改善に役立てるためにぜひインストールしておいてほしいサードパーティライブラリを紹介します。
それらを一括でインストールする方法と、それぞれの分類ごとの役割・使いどころについて丁寧に解説していきます。

化学者のPython活用のために必要なライブラリが分からない初学者向けの記事です。

合わせて読みたい

なぜ化学者にPythonが必要なのか? はじめに 化学メーカーで研究職に従事していると、日々の実験結果のデータ整理や解析、雑務などの定型作業に時間を取られることが多いですよね。また最近では、従来の実験だけでな[…]

合わせて読みたい

PythonとJupyter Labをインストールして開発環境を構築しよう! はじめに Pythonは手軽に使えて強力な機能を備えたプログラミング言語として、化学者や研究開発担当者の間で注目を集めています。本[…]

ライブラリとは


ライブラリは「パワーアップアイテム」

初学者にはいきなり「ライブラリ」という耳慣れない言葉が出てきましたが、ゲームの「パワーアップアイテム」のようなものと考えることができます。

ゲームを進める中で、特定のアイテムを手に入れると簡単に敵を倒せたり、高くジャンプできたりしますよね。
それと同じように、ライブラリはPythonに新しい能力を与えるアイテムのような存在です。

エクセル操作は研究者の業務自動化に必須ですが、適切なライブラリ無しではPythonでエクセル操作ができないのです。

サードパーティライブラリとは

ライブラリには以下2種類があります。
インストールが必要なのはサードパーティライブラリのみです。

  1. 標準ライブラリ(os、tkinter、randomなど)
    Pythonに元々装備されているライブラリ
  2. サードパーティライブラリ(今回のメインテーマ)
    標準ライブラリでは足りない機能を持つ外部ライブラリ

 

サードパーティライブラリのインストール方法

サードパーティライブラリは、「pip」と呼ばれるパッケージ管理ツールを使用してインストールします。

具体的には、コマンドプロンプトに「pip install ライブラリ名」と入力するだけです。

次項でさらに詳しく解説していきます。

おすすめライブラリの一括インストール


一括インストールコマンド

本記事では23個のライブラリを紹介しています。

一つずつインストールするのは面倒、という方は以下のコードをコマンドプロンプトにコピペするだけですべてのライブラリを一括インストールできます!

pip install pyinstaller numpy scipy sympy pandas openpyxl xlwings pypdf pymupdf tabula-py matplotlib seaborn plotly statsmodels optuna ipywidgets opencv-python pillow rdkit beautifulsoup4 selenium scikit-learn gpy

 

用途別のインストール例

用途に合わせた環境構築をしたい場合には、以下のように必要なものだけをインストールする例も参考にしてください。

業務自動化

pip install pyinstaller numpy pandas openpyxl xlwings pypdf pymupdf tabula-py matplotlib opencv-python pillow beautifulsoup4 selenium

データサイエンス、マテリアルズ・インフォマティクス

pip install numpy scipy sympy pandas openpyxl matplotlib seaborn plotly statsmodels optuna ipywidgets rdkit scikit-learn gpy

 

トラブルシューティング

GPyのインストールについて、Python 3.13を導入している場合にエラーが出ることがあります(2025年4月時点)。

そのため、Pythonのバージョンは3.12を推奨します。
バージョンを確認するには、コマンドプロンプトで以下コードを入力してください。

python --version

すでにPython 3.13を導入している方は、こちらの記事を参考にダウングレードすることをお勧めします。

関連記事

Pythonのバージョン変更方法を徹底解説 はじめに 現在のPython最新バージョンは3.13ですが、3.13はリリースされてからまだ日が浅いです(2025年4月時点)。 そのため、安定版である Python 3.12 と比較し[…]

各ライブラリの紹介

ここからは、上記ライブラリを用途別に分類し、概略を解説していきます。

データ分析・数値計算系

Pandas(パンダス)

表形式のデータ(データフレーム)の操作に優れ、Excelなどから取り込んだデータの整形や集計に必須のライブラリです。
非常に使用頻度の高いライブラリです。

Numpy(ナムパイ)

機械学習やデータ分析を中心に様々な分野で利用されるライブラリです。
多次元配列(ndarray)を効率的に扱い、行列演算や統計計算に必須です。
使用頻度の高いライブラリです。

Scipy(サイパイ)

Numpy同様に計算系のライブラリです。
サブパッケージを個別にimportする必要がありますが、NumPyより多くの機能を扱うことが可能です。

Sympy(シムパイ)

シンボリック計算(数式処理)に特化したライブラリで、数式の展開や微分積分などの解析に利用できます。
理論モデリングや数学的検証に重宝します。

データ可視化系

Matplotlib(マットプロットリブ)

基本的かつ最も広く使われるグラフ描画ライブラリです。
実験データを折れ線グラフ、散布図、ヒストグラムなどに変換して視覚的に表現します。

Seaborn(シーボーン)

Matplotlibをベースにした高水準なライブラリで、統計的なグラフが美しく描けます。
データ傾向を視覚的に把握するのに適しています。

Plotly(プロットリー)

グラフを動かしたり拡大したりと、インタラクティブなグラフ作成を可能にするライブラリです。
魅せるデータ分析を可能にします。

機械学習系

Scikit-learn(サイキットラーン)

機械学習の定番ライブラリで、回帰分析、分類、クラスタリングなど、幅広いアルゴリズムを搭載しています。

Statsmodels(スタッツモデル)

様々な統計モデルが扱えるライブラリです。実験データに基づく統計解析で、仮説検証や傾向分析が可能です。

GPy(ジーパイ)

ガウス過程に基づいたモデリングを提供するライブラリです。
非線形回帰や予測モデル構築に活用でき、実験条件の最適化に役立ちます。

Optuna(オプチュナ)

ハイパーパラメータの自動最適化のためのライブラリで、機械学習モデルの性能改善に欠かせません。
複数の実験条件を試す際、効率的に最適値を探索できます。

エクセル、PDF操作系

Openpyxl(オープンパイエクセル)

Excelファイルの読み書きが手軽に行え、化学研究者の業務自動化に必須のライブラリです。

Xlwings(エクセルウィングス)

Openpyxlと同様にExcel操作の自動操作を可能にするライブラリです。
基本的にはOpenpyxlのほうが高性能ですが、Excelマクロとの連携はXlwingsでのみ可能です。

PyPDF / PyMuPDF

PDFファイルの読み取りや編集を可能にするライブラリで、論文や実験報告書のデータ抽出の自動化に役立ちます。

Tabula-py

PDF内の表データを抽出し、CSVやExcel形式で出力できるライブラリです。
文献や報告書から数値データを取り出すのに役立ちます。

画像処理系

Pillow(ピロウ)

画像の加工・変換を手軽に行えるライブラリです。

OpenCV-Python(オープンシーブイパイソン)

高度な画像処理技術を提供するライブラリで、画像データ解析や自動認識に向いています。

Webスクレイピング

BeautifulSoup4(ビューティフルスープ)

WebページのHTML解析によって、必要な情報の抽出を可能にするライブラリです。

Selenium(セレニウム)

ブラウザの自動操作を可能にするライブラリで、動的コンテンツを持つWebサイトからデータを収集する際に非常に有用です。
BeautifulSoupと併用することが多いです。

その他

RDKit(アールディーキット)

化学分子構造の操作・解析に特化したライブラリです。
RDkitを使用することで、Pythonで化学構造を取り扱えるようになります。

ipywidgets(アイパイウィジェット)

Jupyter Notebook内でインタラクティブなウィジェットを作成し、データ解析やシミュレーション結果の動的操作・表示を可能にするライブラリです。

PyInstaller(パイインストーラー)

PythonスクリプトをWindows上で実行可能なexeファイルに変換するライブラリです。
自作したプログラムをPythonが入っていないPCに配布する際に利用します。

おわりに

今回ご紹介したライブラリ群は、化学研究現場でのデータ処理、解析、自動化、機械学習、さらには分子構造や論文データの取り扱いに至るまで、幅広いニーズに応える強力なツールです。

まずは、一括インストールの方法を参考に、各ライブラリをインストールしてみてください。

各ライブラリの具体的な使い方については、今後の記事で解説していきたいと思います。

最新情報をチェックしよう!