統計基礎

変数の種類と尺度水準について

変数の尺度

統計やデータ分析において、変数はその性質に応じて質的変数量的変数に分けられる。
さらに質的変数量的変数はその性質に応じて以下4つの種類に分けることができる

質的変数

  • 名義尺度: 他と区別し分類するための名称のようなもの(数字の大小には意味がない)
  • 順序尺度: 順序や大小には意味があるが間隔には意味がないもの

量的変数

  • 間隔尺度: 順番を表し間隔が一定なもの(「0」には意味がない)
  • 比例尺度: 0が原点であり、間隔と比率に意味があるもの

名義尺度

他と区別し分類するための名称のようなもの(数字の大小には意味がない)
:性別、血液型、郵便番号、電話番号、背番号、住所、学籍番号)

順序尺度

順序や大小には意味があるが間隔には意味がないもの
(足し算引き算など四則演算には意味がない)
:ランキング、順序など)

間隔尺度

順番を表し間隔が一定なもの(「0」には意味がない)
足し算・引き算はできるが、掛け算・割り算には意味がない
(例えば、気温19℃ + 1℃=20℃ だが、 20℃/10℃=2倍にはならない)
: 気温(摂氏)、西暦、テストの点数)

比例尺度

0が原点であり、間隔と比率に意味があるもの
(足し算・引き算・掛け算・割り算すべて可能)
: 身長、速度、絶対温度 [K])

データ分析上での取り扱い

通常、目的変数が間隔尺度比例尺度の場合には回帰分析目的名義尺度や順序尺度の場合にはクラス分類を用いる。

名義尺度や順序尺度の変数を回帰分析の解析したい場合には、それぞれの目的変数をone-hotベクトルに変換することで回帰分析が可能となる。(参考|カテゴリ変数のエンコーディングについて)
ただし、この場合には基本的には目的変数毎に回帰モデルを一つ構築する。

参考

参考書籍




udemy講座

【はじめての統計学】
エクセルで学ぶマーケティング統計分析&戦略

ottantacinqueをフォローする
データ分析とケモインフォ

コメント