統計の理解
統計について
クアルトリクス統計へようこそ。これは Qualtricsでプロジェクトを作成および分析する際に役立つ基本統計の概要ですここでは、いくつかの基本的な統計的概念を取り上げ、それらをプラットフォームに適用し、クアルトリクス以外の追加オプションについて説明します。
定量データおよびカテゴリデータ
データには、定量とカテゴリの 2 つのタイプがあります。
定量データは数値スケールで評価されます。量的データの例として、年齢、身長、収入などがあります。
カテゴリデータは、名目スケールで評価されます。カテゴリデータの例として、性別、婚姻状況、職業などがあります。アンケートで収集されるデータのほとんどはカテゴリ別で、カテゴリに属する回答者の数が取得されます。
センタのメジャー
定量的データに使用される中心には、平均、中央値、モードの 3 つのメジャーがあります。
平均 (平均) は、データが大まかに正規分布している場合や、釣鐘曲線のように見える場合に最も適した中心の尺度です。平均は、すべての観測値を合計し、観測値の合計数で除算することでわかります。
中央値 (中央値) は、データが偏っているように見える場合に中心を測る良い指標です。すべての観測値を順番に並べると、中央値が中央値になります。
モードは、データで最も頻繁に発生する値です。平均または中央値ほど一般的に使用されるわけではありません。
スプレッドのメジャー
データの分布を測定するのに役立つ統計 (標準偏差、分散、範囲) がいくつかあります。
標準偏差は、平均からの観測値の平均距離です。平均と同様に、標準偏差はほぼ正規分布データで使用する必要があります。
分散は、単純に標準偏差の 2 乗です。
範囲は、最大値と最小値の差異です。
ビジュアル化での統計
Qualtricsの統計テーブルの図表には、最小値、最大値、平均、差異、標準偏差、回答の合計数が表示されます。
すべての質問では回答オプションごとに値がコード化されているため、クアルトリクスはデータが定量的かカテゴリ的かを問わず、これらの統計を調べます。これらの統計が研究のコンテキストで意味を持つかどうかは、ユーザの判断によります。
たとえば、回答者にお気に入りの色(赤、黄、青、緑)を質問し、それぞれ1、2、3、4とコード化できます。Qualtricsは平均的な好みの色を教えてくれますが、平均的な好みの色を持つことは意味がありません。
回答者が映画を1~5つ星で評価していたら、平均が役に立ちます。2.98星や4.32星のような意味で映画を比較しやすい。
Qualtricsでは、さまざまなチャート、グラフ、表を提供しています。棒グラフには、各回答選択肢カテゴリの回答の頻度が表示されます。
円グラフには、これらの頻度が円のパーセントとして表示されます。
棒チャートと円チャートの両方によって、カテゴリ間の頻度の比較が非常に簡単になります。
折れ線チャートは、順序付けられた観測値の 2 次元散布図です。時間の経過に伴う傾向を確認するには良い方法です。
ゲージチャートは、選択した指標(平均、合計など)をスケールと比較します。指標がどこに分類されるかに応じて、目盛の色が変わります。メーターチャートは、値の予想パフォーマンスとその実際のパフォーマンスを迅速に比較するのに役立ちます。
クロスタブ
カテゴリーデータを分析する 1 つの方法は、 クロス集計は、偶発事象テーブルまたは 2 方向テーブルとも呼ばれます。クロスタブには、テーブルのセルに特定の特性が記載されている回答者の数が記録されます。
この例では、週次、月次、および年次で購入された各アイテムタイプの数を確認することができます (たとえば、11 個のコートが毎月購入されます)。
クロスタブは、それぞれ列と行、またはバナーとスタブで構成され、各バナーとスタブで質問から頻度データが取得されます。クアルトリクスでは、クロス集計に対応した質問のみを選択できます(自由記述自由回答の質問がクロス集計に対応していないなど)。複数のバナーまたはスタブを選択した場合は、クロスタブエディターでバナーまたはスタブをクリックして、表示するバナーまたはスタブを選択できます。複数レベルのドリルダウンをクロス集計に追加すると、1個の変数が別の変数のサブカテゴリとして表示されます。
カイ二乗検定統計
カイ二乗検定統計では、スタブとバナーの間の重要な関係がテストされます。
クロスタブに複数のスタブとバナーを含めると、クアルトリクスではバナーとスタブの組み合わせごとに1つのカイ二乗の値も複数生成されます。
カイ二乗検定統計の計算方法を知っておくと有益です。最初に、各セルの予測カウント、または行合計、列合計、およびテーブル合計に基づいてセルに含まれると予想されるカウントを確認する必要があります。予測されるカウントを見つけるには、ローの合計にカラムの合計を掛け、結果をテーブルの合計で割ります。
カウントが予想できたら、以下の計算を実行します。
カイ二乗検定統計は、観測値から期待値を差し引き、この差を微分し、各セルの期待値で割ることによって求められる。その後、これらの個々のカイ二乗テスト成分が加算され、その結果がカイ二乗検定統計になります。カイ二乗値は、変数間の関係が統計的に有意であるかどうかを判断するために使用されます。
P値
カイ二乗検定統計は、信頼水準とともに、p値を探すために使用されます。p値は、2つの変数間の関連付けが統計的に有意であるかどうかを決定します。低いP値は、観測されたテーブル関係が非常に低い確率で発生することを意味するため、2つの変数の間には有意な関係があります。p-値が小さい場合、一般的には 0.05 未満の数値とみなされます。
当社の p 値は .28 ですが、これは重要ではありません。そのため、訪問の頻度と購入したアイテムのタイプとの関係はありません。
追加分析
相関関係や回帰などの定量的データの詳細な分析は、Excel または統計ソフトウェアパッケージに組み込むことができます。
相関関係
相関係数 r は、2 つの定量変数間の大まかな線形関係の強度および方向を示します。r の値は常に -1 と 1 の間にあり、-1 と 1 に最も近い値は強い相関関係を表し、ゼロに近い値は弱い。プラス符号またはマイナス符号は、関係のプラス方向またはマイナス方向を示します。-.3 と .3 の間の相関値は低いと見なされ、.7 と 1 の間の相関値、または -.7 と -1 の間の相関値は高いと見なされます。
覚えておくべき重要な点は、相関関係が因果関係と同じではないことである。2つの変数の相関性が高いからといって、これらの変数の1つがもう1つの変数を発生させるわけではありません。
回帰分析
回帰分析を使用すると、1つ以上の予測変数に基づいて1個の変数を予測できます。回帰の詳細については、以下のページを参照してください。