信頼区間の使い方・利用シーン

顔妻です。
みなさんは信頼区間というものをご存知でしょうか?標準誤差やサンプル誤差と言われれば聞いたことのある人も多いのではないかと思います。アンケート調査を設計するにあたって非常に大事な点のひとつであるサンプルサイズの設計に必ず使われるこの方法について今回は説明をしたいと思います。

利用シーン

ずはりアンケート調査を実施する際のサンプルサイズを決めるときや結果の読み取りに利用されます。信頼区間を使うと母集団から標本抽出したサンプルの集計結果がどの位の誤差を持っているかがわかります。

そうしたら、サンプルサイズを可能な限り増やせばいいじゃないかと思う方もいると思いますが、ここが難しいところです。というのも、アンケートはNETにしろ街頭にしろテレビのワイドショーでやっているような適当な調査とは違って調査に協力してもらったお礼として謝礼を渡す必要があります。このため、誤差を減らすためにサンプルサイズを増やそうとすると非常にお金と手間がかかってします。実務の現場では、調査の目的や課題と予算に応じてある程度の誤差を許容して調査を行うことが多いです。

逆に近年のビッグデータと言われるものは、サンプルサイズを気にしないでデータを読み取ることができる点でも非常に魅力のある点のひとつだと思います。

 

利用方法

連続値の場合には「図①」を利用し離散値の場合には「図②」を利用してください。

 

利用例

先ほどの利用法に記載している信頼区間の公式から、サンプル数×集計結果の値の誤差表を作成しました。アンケートでの集計結果をみるとき参考にしてください。ちなみに、肌感覚で言うとn数が30は傾向としてそんな気がする程度、n数が200あるときには結構信頼できるかなと思いながらみるのがいいと思います。

■下限値

n数
30 50 100 200 400 1000 2000
確率 10% -0.7% 1.7% 4.1% 5.8% 7.1% 8.1% 8.7%
20% 5.7% 8.9% 12.2% 14.5% 16.1% 17.5% 18.2%
30% 13.6% 17.3% 21.0% 23.6% 25.5% 27.2% 28.0%
40% 22.5% 26.4% 30.4% 33.2% 35.2% 37.0% 37.9%
50% 32.1% 36.1% 40.2% 43.1% 45.1% 46.9% 47.8%
60% 42.5% 46.4% 50.4% 53.2% 55.2% 57.0% 57.9%
70% 53.6% 57.3% 61.0% 63.6% 65.5% 67.2% 68.0%
80% 65.7% 68.9% 72.2% 74.5% 76.1% 77.5% 78.2%
90% 79.3% 81.7% 84.1% 85.8% 87.1% 88.1% 88.7%

 

■上限値

n数
30 50 100 200 400 1000 2000
確率 10% 20.7% 18.3% 15.9% 14.2% 12.9% 11.9% 11.3%
20% 34.3% 31.1% 27.8% 25.5% 23.9% 22.5% 21.8%
30% 46.4% 42.7% 39.0% 36.4% 34.5% 32.8% 32.0%
40% 57.5% 53.6% 49.6% 46.8% 44.8% 43.0% 42.1%
50% 67.9% 63.9% 59.8% 56.9% 54.9% 53.1% 52.2%
60% 77.5% 73.6% 69.6% 66.8% 64.8% 63.0% 62.1%
70% 86.4% 82.7% 79.0% 76.4% 74.5% 72.8% 72.0%
80% 94.3% 91.1% 87.8% 85.5% 83.9% 82.5% 81.8%
90% 100.7% 98.3% 95.9% 94.2% 92.9% 91.9% 91.3%

 

まとめ

ほとんどの人が普段の集計や結果の読み取り時には考えていることが少ないと思いますが、この信頼区間があるかないかを知っているだけで結果の解釈やアクションへの確度で非常に差がでてくるのではないでしょうか。また、A/Bテストやランダム化比較実験(RCT)にもつながってくる考え方ですのでデータ分析に関わりのある人は是非とも身に着けることをおススメします。

 

コメントを残す

メールアドレスが公開されることはありません。

CAPTCHA