スポンサーリンク
技術レポート再現

技術レポート再現(フィンガープリントによる化合物の予測根拠可視化 | 三井化学)

これまでの記事では、Fingerprintの可視化や構造式描画のカスタマイズについてまとめてきた。 今回は、それらでまとめてきた手法を駆使して、機会学習による化合物の物性予測根拠の可視化を実施する。 具体的には、第4...
RDkit

rdMolDraw2Dモジュールを使って構造式描画をカスタマイズ

前回の記事では、原子ごとに類似度の寄与率を可視化することができるメソッドSimilarityMapsを使って、TPSAなどの分子記述子に対する各原子の寄与を可視化する方法についてまとめた。 今回は類似度マップ(Smililar...
RDkit

分子記述子への各原子の寄与率を可視化する

原子ごとに類似度の寄与率を可視化することができるメソッドSimilarityMapsを使って、TPSAなどの分子記述子に対する各原子の寄与を可視化する方法についてまとめた。 (本記事は「化学の新しいカタチ」の内容を簡潔にまと...
RDkit

Fingerprintの可視化について

フィンガープリント(Fingerprint)をRDkitで可視化する方法についてまとめた。 (本記事は「化学の新しいカタチ」の内容を簡潔にまとめたものです。より詳しい内容はそちらに載っています) フィンガープリントについて フィ...
可視化

主成分分析(概要とpython実装)

データ可視化手法としてよく用いられる主成分分析についてまとめた。 主成分分析について 概要 教師なし手法の一つであり、PCA(Principal Component Analysis)と呼ばれる。 多次元のデータ...
変数選択

Borutaによる変数選択

変数選択は精度の高い予測モデルの構築において非常に重要といえる。本記事では、変数選択手法の一つであるBorutaについてまとめた。 Borutaについて ランダムフォレスト(RF)の変数重要度に基づく変数...
検定

多重検定問題を回避した変数選択(Holm法)

前回は、多重検定問題を回避する方法の一つとして知られるBonferroni法(ボンフェローニ法)についてまとめたが、ついでに今回はHolm法(ホルム法)についてまとめた。 多重の多重性について 検定の多重性とは、仮設検定...
検定

多重検定問題を回避した変数選択(Bonferroni法)

多重検定問題を回避する方法の一つとして知られるBonferroni法(ボンフェローニ法)についてまとめた。 多重の多重性について 検定の多重性とは、仮説検定を何度も繰り返すことで、発生する問題のことをさす。 例えば...
検定

無相関検定(概要とpython実装)

ある因子(変数)ペアに互に相関があるか検定できる無相関検定についてまとめた。 無相関の検定について 標本から得られた相関係数から「母集団にも同様の相関がある」と言えるかどうかを検定するもの。 帰無仮説を「母相関係数は0であ...
可視化

相関係数の計算と可視化

データ解析・ケモインフォマティクスでは、ある化合物の物性など(目的変数)に対して、実験条件や記述子など(説明変数)が関係しているか調査するために、相関係数を計算することが必須の作業になる。 本記事では相関係数の種類や計算方法についてまとめ...
タイトルとURLをコピーしました