データ分析

データ分析

テーブルデータ分析コンペに参加して(メモ)

データ分析コンペ(テーブルコンペ|ビギナー用)に参加した際に自分なりに工夫した点のメモ。 (ちなみにコンペの結果は7位でした) コンペの内容 中古マンションの価格を予想するというもの。 2000年第1四半期〜2020年第2四半期までのデータ...
データ分析

カテゴリ変数のエンコーディングについて

データ分析において、カテゴリ変数は何らかの数値に変換する必要がある。 その変換方法とコードについてのまとめ。 エンコーディングの種類(概要) One-Hot エンコーディング:変数におけるラベルの種類ごとに特徴量(列)を生成し、True(...
tips

クロスバリデーションでの分割数の目安

1000 サンプル以上 : 2-fold クロスバリデーション 1000 から 100 くらいまで : 5-fold クロスバリデーション 100 から 30 くらいまで : 10-fold クロスバリデーション 30 以下 : leav...
回帰

重回帰分析の概要とpython 実装

 概要 回帰分析:目的変数と説明変数の関係をモデル化し、説明変数によって目的変数がどれだけ説明できるのかを定量的に分析すること。(説明変数が一つなら単回帰分析、複数なら重回帰分析と呼ぶ) Multiple Linear Regressio...