ケモインフォマティクス

化学データ可視化

SHAPを使った構造物性相関の予測根拠可視化

以前、構造物性相関解析(QSPR)でフィンガープリントを変数として回帰分析した際に、化学構造のどの部分が物性に寄与しているかを可視化するという記事を書いた(フィンガープリントによる化合物の予測根拠可視化)。 ただ、以前用いた方法は線形回帰...
RDkit

SA スコアを使った合成難易度の見積もり

ケモインフォマティクスにおける逆解析では、何か有用そうな化合物構造が得られたとしても、>その化合物が実際に合成できるかどうか<はまた別の話。仮に化合物提案ができたとしても合成が出来なかったり、そもそもそのような構造が存在し得ない...
化学データ可視化

ChemPlotを使ったケミカルスペースの可視化

ChemPlotとは 化学空間(ケミカルスペース|chemical space)を可視化することを目的としたケモインフォマティクスツール。 (要は、沢山の分子構造からなるデータセット中の各分子を、2次元上(のグラフ)にいい感じにプロットして...
高分子化学

高分子の分子量(数平均分子量と重量平均分子量)について

高分子について 低分子は単一分子として存在するため、分子量は組成式(分子構造)に依存してある一定の値となる。 一方で高分子はさまざまな分子量のポリマーの混合物であるため、その分子量を議論する際には注意が必要となる。 高分子の分子量を表す指標...
高分子化学

ポリマーのガラス転移温度について

ケモインフォマティクスでの高分子の解析事例として度々登場するガラス転移温度についてまとめた。 (ここの記事はポリマーのガラス転移温度に関する内容です) ガラス転移点とは (樹脂,ポリマーの場合)ゴム状態から固化状態(ガラス状態)になる境界の...
データ

スクレイピングで化合物データを試薬サイトから収集する

はじめに マテリアルズインフォマティクス、材料分野におけるデータ解析では、データがないという問題に直面することが多々ある。試薬サイトには化合物の基礎物性情報が集約されているため、そこからデータを収集してみた。(試薬サイトのサイト名、サイトU...
高分子化学

ハンセン溶解度パラメーターと溶解パラメーター(SP値)について

ハンセン溶解度パラメーターとは 物質の溶解性に用いられる値(Charles M. Hansenが1967年に博士論文で発表した) HSP(Hansen solubility parameter)とも呼ばれる 以下の3つのパラメーターから構...
実践

技術レポート再現(フィンガープリントによる化合物の予測根拠可視化 | 三井化学)

これまでの記事では、Fingerprintの可視化や構造式描画のカスタマイズについてまとめてきた。 今回は、それらでまとめてきた手法を駆使して、機会学習による化合物の物性予測根拠の可視化を実施する。 具体的には、第43回ケモインフォマティク...
RDkit

rdMolDraw2Dモジュールを使って構造式描画をカスタマイズ

前回の記事では、原子ごとに類似度の寄与率を可視化することができるメソッドSimilarityMapsを使って、TPSAなどの分子記述子に対する各原子の寄与を可視化する方法についてまとめた。 今回は類似度マップ(SmililarityMaps...
RDkit

分子記述子への各原子の寄与率を可視化する

原子ごとに類似度の寄与率を可視化することができるメソッドSimilarityMapsを使って、TPSAなどの分子記述子に対する各原子の寄与を可視化する方法についてまとめた。 (本記事は「化学の新しいカタチ」の内容を簡潔にまとめたものです。よ...