データ分析

スポンサーリンク
可視化

主成分分析(概要とpython実装)

データ可視化手法としてよく用いられる主成分分析についてまとめた。 主成分分析について 概要 教師なし手法の一つであり、PCA(Principal Component Analysis)と呼ばれる。 多次元のデータ...
変数選択

Borutaによる変数選択

変数選択は精度の高い予測モデルの構築において非常に重要といえる。本記事では、変数選択手法の一つであるBorutaについてまとめた。 Borutaについて ランダムフォレスト(RF)の変数重要度に基づく変数...
可視化

相関係数の計算と可視化

データ解析・ケモインフォマティクスでは、ある化合物の物性など(目的変数)に対して、実験条件や記述子など(説明変数)が関係しているか調査するために、相関係数を計算することが必須の作業になる。 本記事では相関係数の種類や計算方法についてまとめ...
機械学習

XGBoostについて(ハイパーパラメータ最適化)

XGboostのハイパーパラメータ調整方法についてまとめた。 XGBoostの概要、ハイパーパラメータについては前回の記事参照。 今回検討したパラメータ最適化方法 ランダムサーチ パラメータの候補となる値をランダムに選出&組み合...
機械学習

XGBoostについて(概要と実装)

XGBoostの概要(理論面はのぞく)、使い方、ハイパーパラメータとその調整の仕方についてまとめた。 XGBoostについて(ざっくり) 回帰・クラス分類手法の一つ(データ分析コンペでもよく使われる人気の手法) 決定木ベー...
タイトルとURLをコピーしました