主にケモインフォマティクスで活用できそうな外部データベースのまとめ。
API利用などで一括取得が可能なDB
- Pubchem
化合物のデータベース。(APIを使った自動取得が可能)
(参考:pubchem から化合物情報を一気に取得する) - ChemSpider
化合物のデータベース。(APIを使った自動取得が可能) - GDB-17,13,11
GDB-11:C,H,N,O,F から構成される原子数(水素は除く)が11個の化合物のデータベース
GDB-13:C,H,N.O,D,Cl から構成される原子数(水素は除く)が13個の化合物のデータベース - MoleculeNet
機械学習による分子特性予測をテストするために設計されたベンチマーク用データセット。化学構造と量子化学計算出力値をまとめたデータセット(QM7, QM8, QM9)や
水溶解度(logP)のデータなどが収容。
(おそらく)一括取得不可
- Polyinfo
高分子の物性に関するデータベース。利用するには登録が必要。スクレイピングなどのデータの一括取得は基本的には禁止されている。 - Bordwell pKa Table
pKa のデータベース。構造化データではないため解析に使用するにはデータの整形が必要。
一括取得の可否不明
- CAS
アメリカ化学会が運営しているデータベース - PubChemQC
量子化学計算のデータベース - ZINC15
バーチャルスクリーニング用途に市販化合物を集めたデータベース - ChEMBL
化学構造と生物活性データを集めた、医薬品・医薬品候補化合物データベース - PDB
タンパク質の立体構造データベース - CCDC
低分子や結晶構造のデータベース - SDBS
有機化合物のスペクトルデータベース
参考
以下のHPの情報を使わせてもらいました。
関連書籍
リンク
リンク
リンク