スポンサーリンク
RDkit

RDkit を用いた分子の骨格変換

前準備 モジュールのインストール conda install -c conda-forge rdkit データの準備 1290分子の水溶解度(LogS)データ(sdfファイル形式) (金子研究室HPのデータセットを利用) 分子構...
RDkit

RDkit を用いた分子構造の描画

前準備 モジュールのインストール conda install -c conda-forge rdkit conda install xlsxwriter 分子構造の描画 モジュールのインポート import pandas as ...
技術レポート再現

MI関連技術レポート再現(AIを用いたポリマー設計・検証サイクルの試行回数大幅低減 | 昭和電工)

マテリアルズインフォマティクス に関する企業の技術レポート・解析内容を再現する。 はじめに 技術レポート内容 以下は、産総研の研究成果記事(2018/11/27)1より 昭和電工株式会社(社長:森川 宏平 以下、昭和電工)と国立研究...
RDkit

化合物の記述子化まとめ

はじめに 化合物の構造情報から生成できる変数(記述子)のまとめ 前準備 使用するデータ 1290分子の水溶解度(LogS)データ(sdfファイル形式)の内、20分子を使用 (金子研究室HPのデータセットから取得) モ...
実践

化合物の溶解度予測(予測の信頼性も評価する)

化合物の溶解度予測(基礎編)をベースにして、今回は予測の信頼性(=予測値の分散=予測値がどれだけ不安定か)も合わせて評価した。 具体的には、分割の異なる訓練・テストデータを使って何度も予測を行うことで、予測値がどれだけブレるか検証した...
tips

Tips(データ分析関係)

解析に関するノウハウやTIPS(コツ)なのどのメモです。 (20'/12/13 更新) クロスバリデーションの分割数 1000 サンプル以上 : 2-fold クロスバリデーション 1000 から 100 くらいまで :...
実践

化合物の溶解度予測(基本編)

オープンになっているデータセット、具体的には1290化合物の水溶解度のデータで構造物性相関解析(いわゆるQSPR)を行う。 目的 分子の水溶解度(LogS)を予測すること 諸条件 データ 1290分子の水溶解度(LogS)データ(...
データ

pubchem から化合物情報を一気に取得する

目的 化合物の基本的な情報(化合物名やCASなど)から、その化合物の情報(カノニカルSMILESや、分子量などの基本的な記述子)を取得する。 (SMILES情報があれば記述子を計算→化合物の物性予測の変数として使用できるが、SMILES...
データベース

外部データベースのまとめ(ケモインフォマティクス )

主にケモインフォマティクスで活用できそうな外部データベースのまとめ。 API利用などで一括取得が可能なDB Pubchem 化合物のデータベース。(APIを使った自動取得が可能) (参考:pubchem から化合物情報を一気...
タイトルとURLをコピーしました