外部データベースのまとめ(ケモインフォマティクス )

主にケモインフォマティクスで活用できそうな外部データベースのまとめ。

API利用などで一括取得が可能なDB

  • Pubchem
    化合物のデータベース。(APIを使った自動取得が可能)
    (参考:pubchem から化合物情報を一気に取得する)
  • ChemSpider
    化合物のデータベース。(APIを使った自動取得が可能)
  • GDB-17,13,11
    GDB-11:C,H,N,O,F から構成される原子数(水素は除く)が11個の化合物のデータベース
    GDB-13:C,H,N.O,D,Cl から構成される原子数(水素は除く)が13個の化合物のデータベース
  • MoleculeNet
    機械学習による分子特性予測をテストするために設計されたベンチマーク用データセット。化学構造と量子化学計算出力値をまとめたデータセット(QM7, QM8, QM9)や
    水溶解度(logP)のデータなどが収容。

(おそらく)一括取得不可

  • Polyinfo
    高分子の物性に関するデータベース。利用するには登録が必要。スクレイピングなどのデータの一括取得は基本的には禁止されている。
  • Bordwell pKa Table
    pKa のデータベース。構造化データではないため解析に使用するにはデータの整形が必要。

一括取得の可否不明

  • CAS
    アメリカ化学会が運営しているデータベース
  • PubChemQC
    量子化学計算のデータベース
  • ZINC15
    バーチャルスクリーニング用途に市販化合物を集めたデータベース
  • ChEMBL
    化学構造と生物活性データを集めた、医薬品・医薬品候補化合物データベース
  • PDB
    タンパク質の立体構造データベース
  • CCDC
    低分子や結晶構造のデータベース
  • SDBS
    有機化合物のスペクトルデータベース

参考

以下のHPの情報を使わせてもらいました。

関連書籍