サンプルサイズとは?
サンプルサイズとは、統計学や市場調査の分野で頻繁に使われる用語です。特に母集団の大きいアンケート調査をする際には、必ずといっていいほど登場します。適切なサンプルサイズの決定は、大規模な母集団に対する調査を行う際には必須となります。
ウェビナー:『デジタル時代におけるグローバル ブランドの管理方法』
では、サンプリング(調査対象者の抽出)とは何でしょうか。また、サンプルサイズはなぜ重要と考えられているのでしょうか。
どのような調査であれ、調べたい対象となる集団全員について調査するのが理想的です。しかし、対象が大規模になるにつれ、全員から回答を得ることは現実的に不可能に近くなります。そこで、その集団を代表するような個人を母集団から無作為に抽出し、サンプルとします。
正確で統計的に有意な結果を得て、調査を成功させるには、調査のサンプルサイズを適切に設定できるかどうかは非常に重要です。
- サンプルサイズが小さすぎると、異常値や例外が本来の割合以上に含まれてしまう可能性があります。それによって結果が不正確となり、母集団を公平・正確に把握できなくなります。
- サンプルサイズが大きすぎると、調査全体が複雑になり、実施するのに多くの費用と時間がかかってしまいます。結果の精度は向上するものの、コストがメリットを上回ってしまう場合があります。
必要な変数がすでに算出されている場合は、オンラインのサンプルサイズ計算ツール (英語) を利用することで、適切なサンプルサイズをすぐに計算することができます。
このページでは、市場調査の適切なサンプルサイズの決定方法を知りたい方のために、以下に手順を説明します。
サンプルサイズの決定方法
適切なサンプルサイズを選ぶには、統計の基本を理解し、調査に影響を与える複数の要因について考慮する必要があります。その上で、サンプルサイズの計算式を使うことにより、統計的に正確な調査ができる可能性が高くなり、自信を持って標本調査に取り組むことが可能になります。
ここで示すのは、連続データ(数値的にカウントされるデータ)用のサンプルサイズを求めるのに適した手順です。カテゴリーデータ(緑/青、男性/女性などの分類を行うためのデータ)に適した方法ではないことに留意してください。
ステップ 1:サンプルサイズの変数を検討する
サンプルサイズを計算する前に、対象とする母集団と求める精度について、いくつかの事項を決定しておく必要があります。
1. 母集団のサイズ
対象となる人の数は全体でどのくらいになるでしょうか?母集団のサイズを割り出すには、その集団に当てはまる人と、そうでない人の区分けを明確にする必要があります。
例えば、犬の飼い主について調べる際に、少なくとも一度は犬を飼ったことがある人全員を対象にするのか、現在は飼っていないものの飼った経験がある人は含めるのか含めないのかなどを、調査目的に応じて定めておく必要があります。一方で、厳密な数がわからなくても問題ありません。正確な数が不明な場合に、推定値を用いることもよくあります。
2. 許容される誤差の範囲(信頼区間)
誤差は避けられないものですが、問題はどの程度許容するかです。許容される誤差の範囲は「信頼区間」とも呼ばれ、抽出するサンプルの平均値と母集団の平均値との間に、どれだけの差を許容するかを設定します。ニュース等で報じられる世論調査でも、「有権者の68%が政策Zを支持すると回答しました。その誤差は±5%です」などと信頼区間が示されることがあります。
3. 信頼水準
名前は似ていますが、ステップ2の信頼区間とは別の概念です。信頼水準は、実際の平均値が、設定した誤差の範囲に収まることを「どの程度確信したいか」を定めるものです。一般的には 90%、95%、99% 等の値が、信頼水準として頻繁に使用されます。
4. 標準偏差
得られた回答がお互いにどのくらい離れているか、また平均値からどのくらい離れているかを示す標準偏差を推定する必要があります。標準偏差が小さい場合は、すべての値が平均値の周りに集まっていることを意味します。
一方、大きい場合は、非常に小さな値や大きな値があるなど、値がより広い範囲に分散していることを意味します。調査を実施していない段階では、安全策として、標準偏差を 0.5 とすることで、十分に大きなサンプルサイズを確保できます。
ステップ 2:サンプルサイズを計算する
ステップ1 の 1〜4 で必要な情報が揃い、サンプルサイズを計算する準備が整いました。先述のオンラインのサンプルサイズ計算ツール (英語) を使ってもよいですし、自分で計算することもできます。
5. Zスコアを求める
次に、信頼水準をZスコアに変換する必要があります。以下は、最も一般的に使われる信頼水準におけるZスコアです。
- 90% – Zスコア = 1.645
- 95% – Zスコア = 1.96
- 99% – Zスコア = 2.576
これ以外の信頼水準を使用する場合は、Zスコア(英語) 表を使ってスコアを求めることができます。
市場調査に便利な SaaS ツール。クアルトリクスのプラットフォーム、無料版はこちらからお申し込みを
6. サンプルサイズの計算式を使用する
サンプルサイズ計算ツールに、Zスコア、標準偏差、信頼区間を入力して計算するか、以下のサンプルサイズの計算式を用いて計算します。
なおこの式は、母集団のサイズが未知の場合、または非常に大きい場合のものです。母集団が既知で小さい場合は、先述(またはこちら)のサンプルサイズ計算ツールを使用しましょう。
実際の例で見てみましょう。
ここでは、信頼水準95%、標準偏差0.5、誤差の範囲(信頼区間)±5%を選んだ場合の例を示します。
((1.96)2 x .5(.5)) / (.05)2
(3.8416 x .25) / .0025
.9604 / .0025
384.16
385人の回答者が必要
サンプルサイズが計算できました。
サンプルサイズの結果に関するトラブルシューティング
算出されたサンプルサイズが大きすぎて管理しにくい場合、次のいずれかの方法で結果を調整することが可能です。
- 信頼水準を下げる
- 許容される誤差の範囲を大きくする
これにより、サンプリング時に誤差が生じる可能性は高くなるものの、必要となる回答数を大幅に減らすことができます。
ウェビナー:『デジタル時代におけるグローバル ブランドの管理方法』