tips

Jupyter Notebook のデザインカスタマイズ

(参考|Jupyter Notebook テーマのカスタマイズ) 1. jupyterthemesのインストール # use conda conda install -c conda-forge jupyterthemes # use p...
tips

エクセル表のMarkdown形式への変換(python)

ライブラリ pandas、pytablewriterを使用する。 モジュールのインスール # conda conda install -c conda-forge pytablewriter # pip pip install pytab...
化学データ可視化

ChemPlotを使ったケミカルスペースの可視化

ChemPlotとは 化学空間(ケミカルスペース|chemical space)を可視化することを目的としたケモインフォマティクスツール。 (要は、沢山の分子構造からなるデータセット中の各分子を、2次元上(のグラフ)にいい感じにプロットして...
可視化

pythonを使った三角ダイアグラム(ternary plot)の描画

三角プロット(ternary diagram)とは 三角プロット(ternary diagram)は,3成分のデータを三角形のグラフにプロットしたもので、3成分の相対的な割合(組成データなど)をによって,正三角形の位置でグラフ化する。プロッ...
数学

ヤコビアンについて(メモ)

2変数関数の重積分(面積)を考えた場合。 $xy$平面→ $uv$平面の変数変換によるヤコビアン(ヤコビ行列; Jacobian matrix)は $$ J(u,v) = \begin{vmatrix} \frac{\partial x}{...
高分子化学

高分子の分子量(数平均分子量と重量平均分子量)について

高分子について 低分子は単一分子として存在するため、分子量は組成式(分子構造)に依存してある一定の値となる。 一方で高分子はさまざまな分子量のポリマーの混合物であるため、その分子量を議論する際には注意が必要となる。 高分子の分子量を表す指標...
データ分析

SHAP を用いた機械学習への解釈性付与

(noteの「クリエイターを応援する」で応援していただけると嬉しいです。よろしくお願いします) SHAP(SHapley Additive exPlanations)とは 背景 昨今では機械学習モデルに解釈性や説明性が強く求められるようにな...
機械学習

catBoostの概要と使い方

CatBoostについて(ざっくり) 勾配ブースティング決定木 (Gradient Boosting Decision Tree) を扱うためのフレームワーク LightGBM や XGBoost と並んでよく用いられている。予測精度や速...
機械学習

LightGBM Tunerを使ったハイパーパラメータ最適化

lightGBM Tunerについて Preferred NetworksによってOptunaの拡張機能として開発された、LightGBMのハイパーパラメータ自動最適化モジュール。 通常のハイパーパラメータ最適化では、最適化したいパラメー...
機械学習

lightGBMの使い方とハイパーパラメータについて

lightGBMについて(ざっくり) 回帰・クラス分類手法の一つ(XGBoostと並んでKaggleでもよく使われる人気の手法) 決定木ベースの勾配ブースティング手法(Gradient Boosting Dicision Tree) アン...