高分子化学

ポリマーのガラス転移温度について

ケモインフォマティクスでの高分子の解析事例として度々登場するガラス転移温度についてまとめた。 (ここの記事はポリマーのガラス転移温度に関する内容です) ガラス転移点とは (樹脂,ポリマーの場合)ゴム状態から固化状態(ガラス状態)になる境界の...
可視化

変数のクラスタリングとデンドログラム作成

回帰分析やクラス分類をする際、ある2つの説明変数間に強い相関がある(=相関係数の絶対値が大きい)とき、それらの変数のうちどちらか1つの変数を削除する必要がある。単に、説明変数の数を減らすだけならこの方法で問題ないが、モデルに解釈な必要な変数...
データベース

スクレイピングで化合物データを試薬サイトから収集する

はじめに マテリアルズインフォマティクス、材料分野におけるデータ解析では、データがないという問題に直面することが多々ある。試薬サイトには化合物の基礎物性情報が集約されているため、そこからデータを収集してみた。(試薬サイトのサイト名、サイトU...
高分子化学

ハンセン溶解度パラメーターと溶解パラメーター(SP値)について

ハンセン溶解度パラメーターとは 物質の溶解性に用いられる値(Charles M. Hansenが1967年に博士論文で発表した) HSP(Hansen solubility parameter)とも呼ばれる 以下の3つのパラメーターから構...
tips

Matplotlibで3次元の散布図を描画する

コード from matplotlib import pyplot as plt import numpy as np from mpl_toolkits.mplot3d.axes3d import Axes3D #グラフをポップアップで...
tips

クロスバリデーションでの分割数の目安

1000 サンプル以上 : 2-fold クロスバリデーション 1000 から 100 くらいまで : 5-fold クロスバリデーション 100 から 30 くらいまで : 10-fold クロスバリデーション 30 以下 : leav...
tips

pickle形式でのオブジェクトの保存と読み込み(python)

データや学習済みモデルなどのオブジェクトを pickle形式で保存することができる。 こうすることで、プログラムを実行し終えた後もオブジェクトの呼び出しが可能。 import pickle #オブジェクトの保存(sample_object...
tips

pystanの計算がmacで実行できない時の対処法

以下のコードを追記する import multiprocessing multiprocessing.set_start_method("fork") 以上 参考 PyStan throws error when r...
tips

pandasでxlsxファイルが読めない時の対処法(xlrderror)

xlrdの新バージョンでは、xlsxのサポートがなくなったらしい。 openpyxlをインストールして、pandasでのread_excelの際に、openpyxlを指定する。 pip install openpyxl df = pd.re...
tips

matplotlibを日本語表示対応にする方法

1.japanize matplotlib をインストールする pip install japanize-matplotlib 2.japanize_matplotlibをmatplotlibと共にインポートする import matplo...