母比率の検定(投票・アンケートの過半数ラインの可能性)
※免責:統計の入門書をかじっただけなので、不正確な内容や不十分な説明があります。
統計において、母比率の推定には一般に以下の検定統計量Tについての式が近似的に用いられます。
T=Np(1−p)p0−p
ここで、pは「確かめたい(検定対象の)割合」(母比率)、p0は任意の回答Aの実割合(標本比率)、Nは投票数(サンプル数)です。
確かめたい割合を50%としたとき
さらに、「ある過半数(>50%)の項目の母比率(サンプル数が十分に多いときの割合)が実は50%じゃないか?」と仮定して、この母比率の検定を行うとすると、式(1)はp=0.5を代入して、
T=N0.5⋅(1−0.5)p0−0.5=N21⋅21p0−0.5=N41p0−0.5=4N1p0−0.5=4N1p0−0.5=2N1p0−0.5=2N(p0−0.5)
より、p=0.5(50%)を母比率と仮定したときの検定統計量は、
T=2N(p0−0.5)~N(0,1)
であると整理出来ます。(これが標準正規分布N(0,1)に近似的に従います)
過半数超え(割れ)の確率を求める
あとは、標準正規分布の計算をツールサイトや表計算ソフト(NORM.S.DIST(式(2)で求めたT,TRUE))で「下側(上側)累積確率」を求めると、「投票の任意の回答Aの割合 p0 と投票数Nから、回答Aが50%を上回る(下回る)可能性」を求めることが出来ます(出来るはずです)。
※このとき、p0>0.5(>50%)のときは「下側累積確率」、p0<0.5(<50%)のときは「上側累積確率」を使用してください。
- カシオの高精度計算機サイト
- 表計算ソフトの場合
- 下側累積確率: NORM.S.DIST(式(3)のT, TRUE) (p0>0.5)
- 上側累積確率: 1- NORM.S.DIST(式(3)のT, TRUE) (p0<0.5)