RDkit

化合物の記述子化まとめ

化合物の構造情報から生成できる変数(記述子)のまとめ 前準備 使用するデータ 1290分子の水溶解度(LogS)データ(sdfファイル形式)の内、20分子を使用 (金子研究室HPのデータセットから取得) モジュールのインストール conda...
実践

化合物の溶解度予測(予測の信頼性も評価する)

化合物の溶解度予測(基礎編)をベースにして、今回は予測の信頼性(=予測値の分散=予測値がどれだけ不安定か)も合わせて評価した。 具体的には、分割の異なる訓練・テストデータを使って何度も予測を行うことで、予測値がどれだけブレるか検証した。 目...
実践

化合物の溶解度予測(基本編)

オープンになっているデータセット、具体的には1290化合物の水溶解度のデータで構造物性相関解析(いわゆるQSPR)を行う。 目的 分子の水溶解度(LogS)を予測すること 諸条件 データ 1290分子の水溶解度(LogS)データ(sdfファ...
データ

pubchem から化合物情報を一気に取得する

目的 化合物の基本的な情報(化合物名やCASなど)から、その化合物の情報(カノニカルSMILESや、分子量などの基本的な記述子)を取得する。 (SMILES情報があれば記述子を計算→化合物の物性予測の変数として使用できるが、SMILESを収...
データ

外部データベースのまとめ(ケモインフォマティクス )

主にケモインフォマティクスで活用できそうな外部データベースのまとめ。 API利用などで一括取得が可能なDB Pubchem 化合物のデータベース。(APIを使った自動取得が可能) (参考:pubchem から化合物情報を一気に取得...