tips

pickle形式でのオブジェクトの保存と読み込み(python)

データや学習済みモデルなどのオブジェクトを pickle形式で保存することができる。 こうすることで、プログラムを実行し終えた後もオブジェクトの呼び出しが可能。 import pickle #オブジェクトの保存(sample_object...
tips

pystanの計算がmacで実行できない時の対処法

以下のコードを追記する import multiprocessing multiprocessing.set_start_method("fork") 以上 参考 PyStan throws error when r...
tips

pandasでxlsxファイルが読めない時の対処法(xlrderror)

xlrdの新バージョンでは、xlsxのサポートがなくなったらしい。 openpyxlをインストールして、pandasでのread_excelの際に、openpyxlを指定する。 pip install openpyxl df = pd.re...
tips

matplotlibを日本語表示対応にする方法

1.japanize matplotlib をインストールする pip install japanize-matplotlib 2.japanize_matplotlibをmatplotlibと共にインポートする import matplo...
回帰

重回帰分析の概要とpython 実装

 概要 回帰分析:目的変数と説明変数の関係をモデル化し、説明変数によって目的変数がどれだけ説明できるのかを定量的に分析すること。(説明変数が一つなら単回帰分析、複数なら重回帰分析と呼ぶ) Multiple Linear Regressio...
分類

ロジスティック回帰の概要とpythonでの実装

ロジスティック回帰とは 一般化線形モデルの一つであり、目的変数が2値の時(二値判別問題)や確率を求めたい時によく使用される。(例|病気の発症率や、迷惑メールか否かの判定など) ある事象がおこる確率を予測し、クラス分類の問題の場合には、その...
統計

誤差について(メモ)

はじめに 測定には誤差が必ず伴うため、測定によって得られた値には不確かさがあることに留意する。 誤差が測定ごとにランダムであると仮定すれば、データを統計処理することで不確かさを小さくすることができる。 誤差(測定誤差) 誤差:測定値と真値と...
技術レポート再現

技術レポート再現(フィンガープリントによる化合物の予測根拠可視化 | 三井化学)

これまでの記事では、Fingerprintの可視化や構造式描画のカスタマイズについてまとめてきた。 今回は、それらでまとめてきた手法を駆使して、機会学習による化合物の物性予測根拠の可視化を実施する。 具体的には、第43回ケモインフォマティク...
RDkit

rdMolDraw2Dモジュールを使って構造式描画をカスタマイズ

前回の記事では、原子ごとに類似度の寄与率を可視化することができるメソッドSimilarityMapsを使って、TPSAなどの分子記述子に対する各原子の寄与を可視化する方法についてまとめた。 今回は類似度マップ(SmililarityMaps...
RDkit

分子記述子への各原子の寄与率を可視化する

原子ごとに類似度の寄与率を可視化することができるメソッドSimilarityMapsを使って、TPSAなどの分子記述子に対する各原子の寄与を可視化する方法についてまとめた。 (本記事は「化学の新しいカタチ」の内容を簡潔にまとめたものです。よ...