統計基礎

検定

多重検定問題を回避した変数選択(Bonferroni法)

多重検定問題を回避する方法の一つとして知られるBonferroni法(ボンフェローニ法)についてまとめた。 多重の多重性について 検定の多重性とは、仮説検定を何度も繰り返すことで、発生する問題のことをさす。 例えば、回帰や分類問題の解析にお...
検定

無相関検定(概要とpython実装)

ある因子(変数)ペアに互に相関があるか検定できる無相関検定についてまとめた。 無相関検定について 標本から得られた相関係数から「母集団にも同様の相関がある」と言えるかどうかを検定するもの。 帰無仮説を「母相関係数は0である (同様の相関は...
検定

正規性の検定(概要とpython実装)

正規性の検定について 得られたデータが正規分布に従うか(正規性を有するか)を調べるための検定方法として、シャピロ-ウィルク検定や、コロモゴロフ-スルミノフ検定などがある。 データの正規性に関する情報は、t 検定やF検定などの種々の検定を行う...
検定

ウィルコクソンの符号順位和検定(概要とpython実装)

ウィルコクソンの符号順位和検定について ノンパラメトリック検定の一つ サインランク検定ともいう 順位尺度を用いており、データ間における代表値(中央値)の差を検定する方法 対応のあるデータにおいて、データに正規性を仮定できない(データが正規...
検定

対応のあるt検定(概要とpython実装)

対応のあるt検定について 2群間の平均値の差を比較する検定(下図参照) 2群間の平均値が独立とはいえない、つまりデータに対応がある(従属である)場合に用いる。 (例:ある患者たちの1ヶ月の体重の推移をみる場合など) ...
検定

ウェルチのt検定(概要とpython実装)

t検定について 2群間の平均値の差を比較する検定 2群間の平均値が独立であり(データに対応がない)、かつ2群間に等分散性が仮定できない場合に用いる。(下図参照) 「多重性の問題」を避けるために、最近では等分散性の検...
検定

F検定(概要とpython実装)

F検定について 対象とする独立な2群の分散が等しい(等分散)であるかを調べる検定。 (下記図参照) コード ※ scipyモジュールには、 F検定を直接実行するメソッドがないので一つ一つ計算する。 用いるデータは「対応のないデータ」と仮...
検定

スチューデントのt検定(概要とpython実装)

スチューデントのt検定について 2群間の平均値の差を比較する検定 2群間の平均値が独立であり(データに対応がない)、かつ2群間に等分散性が仮定できる場合に用いる(下記図参照) コード 2群間には対応はなくそ...
検定

マン・ホイットニーのU検定(概要とpython実装)

マン・ホイットニーのU検定について 独立2群間の代表値の差の検定 2群間の平均値が独立であり(データに対応がない)、かつ正規分布が仮定できない(ノンパラメトリック)場合に用いる。下記図参照。 ウィルコクソンの順位和...