事前構成済 R スクリプト
事前構成済み R スクリプトについて
R は、柔軟で強力な分析に広く使用されている統計プログラミング言語です。Stats iQでRコーディングを使用する場合、Rをより簡単かつ効率的に使用できるように、複数の分析スクリプトから選択できます。
R コードのスクリプトの選択
- 分析する変数を選択します。詳細については、R コードのデータフレーム変数の選択を参照してください。
- [詳細設定] をクリックします。
- [R コード] をクリックします。
- スクリプトを選択します。分析オプションの詳細については、以下のセクションを参照してください。
- [次へ] をクリックします。
- 選択した変数を確認します。変数を変更する場合は、ドロップダウンをクリックして新しい変数を選択します。
- 必要に応じて、変数の名前を編集します。詳細については、R コードのデータフレーム変数の命名を参照してください。
- データフレーム変数の編集が終了したら、[コードカードを作成]をクリックします。
事前構成済 R コードスクリプトのナビゲーション
スクリプトが R コードカードのコードセクションにペーストされます。このコードには、選択した分析を生成するためのコマンドとともにアドバイスが含まれます。分析を実行するには、[すべて実行] をクリックします。結果は右側の出力ボックスに表示されます。
、データフレーム変数を編集したり、分析にフィルタを追加したりできます。3 つのドットのメニューをクリックして、コードカードにノートを追加したり、分析をコピーしたり、カードを全画面で開いたりします。
SHORTCUTS
キーボードショートカットを使用して、R コードカードをより効率的にナビゲートすることができます。ショートカットをクリックして、実行可能なアクションの一覧を表示します。
パッケージ
Stats iQのRコーディングには、分析に使用される最も一般的なRパッケージの何百ものパッケージがあらかじめインストールされています。カードの右半分にあるパッケージタブをクリックして、利用可能なパッケージの一覧を表示します。パッケージの使用の詳細については、Stats iQのRコーディングを参照してください。
尺度の信頼性
スケール信頼度は、複数項目スケールの項目がコンストラクトを確実に測定できる範囲を評価します。つまり、同じ質問セットを使用して同じことを測定すれば、確実に似た結果が出るのだろうか。もしそうであれば、今後どのような変化が見られるかは、調査対象母集団の変化やスコア向上のために行われた介入によるものだという確信がある。
再責任測定の解釈
スケール信頼性の指標は 0 と 1 の間にあり、本質的にはスケール内のすべての項目間の集計相関関係です。
Cronbachのアルファは、広く使われている信頼性指標であり、特定の仮定によって信頼性を過小評価することが多い。推奨代替手段であるマクドナルドオメガは、こうした欠陥を避けている。デフォルトでマクドナルドのオメガを使っていますが、クロンバッハのアルファは今でも広く受け入れられています。
結果の数値を解釈する正しい方法は 1 つではありませんが、両方のオメガについて推奨される経験則を以下に示します。
0.65 未満 | 非常に不満足 |
0.65 | 許容可能 |
0.8 | とてもよい |
信頼性のあるスケールが受け入れられない場合は、データセットを修正するためのオプションがいくつかあります。
- オメガやアルファを下げているアイテムはすべて取り除きます。
- 2 つの異なるコンストラクトが測定されている可能性があります。その場合、変数を 2 つのグループに分割し、各グループでこの分析を実行すると、初期分析の信頼性スコアよりも高い信頼性スコアが生成されます。これは、出力で相関マトリックスを確認するか、探索係数分析スクリプトを使用してデータから自然にどのグルーピングが抜けているかを確認することで調べることができます。
- 最終的には、アンケートを変更して再度実行することが必要になる場合があります。他のアイテムとの相関性が低いアイテムについては、明確化または再作業が必要になる場合があります。また、他のアイテムの追加が必要な場合もあります。
非常に高い結果 (例: 0.95) は、スケールに問題があることを示している場合もあります。通常は、それほど多くの明細が存在しなくても非常に信頼できるスケールを保持することができます。この場合、最も有用でないアイテムをスケールから削除し、分析を再実行することをお奨めします。
明細レベルの統計情報の解釈
スクリプトは、最初に全体的な信頼性メジャーを実行してから、変数ごとに 1 回の反復を実行します。アイテムごとの信頼性分析の目的は、スケールの構築に最も役立つアイテムを把握することです。Stats iQは、次のような表を出力します:
マクドナルド全体のオメガ:0.71
N | 平均 | 明細 – 合計相関 | マクドナルドオメガ (削除された場合) | |
A1 | 2784 | 4.59 | 0.31 | 0.72 |
A2 | 2773 | 4.80 | 0.56 | 0.69 |
A3 | 2774 | 4.60 | 0.59 | 0.61 |
… | … | … | … | … |
- 一般的な目標は、品目数が少ないマクドナルドオメガを高くすることです。そのため、研究者が新しいスケールを作っていたら、実際にはオメガがなければ高くなるので、A1を除去したいと考えているでしょう。
- 除去すれば信頼性が低くなる項目の残りは、調査者次第で判断。たとえば、調査者のアンケート疲労が懸念される場合、変数の削除を決定する際に信頼性が大幅に低下する可能性があります。
- 項目合計相関は、その項目と他のすべての項目の平均の間の相関関係です。低い項目 – 合計相関は、変数が基本となる構成体に対して不十分であることを示しています。最も一般的な経験則は、特に信頼性指標を人為的に膨らませる項目が多い場合、「項目合計相関」が0.3以下のものに対して疑念を抱くことである。
アイテムを削除することを選択した場合は、他のアイテムを削除するかどうかを決定する前に、他のすべての統計を再実行する必要があります。つまり、Stats iQではカード全体から変数を削除するだけで、残りは自動的に行われます。
明細間相関マトリクス
明細間相関マトリクスは、分析の各変数と相互の変数間の相関関係を示します。たとえば、ある変数が別の変数と非常に高い相関関係にある場合(例:0.9)、それらの質問は冗長であり、削除すると信頼性に小さな影響しか与えられません。
平均明細間相関は、マトリクス内の数の平均です。番号が大きいほど、一部のアイテムは冗長であり、削除される可能性があります。通常、変数は 0.2 から 0.4 の範囲内に収まる必要があります。
その他のリソース
評価者間の信頼性
評価者間信頼度 (IRR) は、評価において複数の評価者が同意する範囲を評価するために使用されます。たとえば、3 つの異なるコーダは、あるテキストコメントにポジティブ、ニュートラル、またはネガティブなセンチメントがあったと評価し、IRR は相互にどの程度同意したかを示します。
中間信頼性の測定
IRR は、データの構造に基づいて若干異なるメトリクスを使用して評価されます。たとえば、2 つのレーティング者の相互信頼性の分析では、3 rater の相互信頼性のメトリックとは若干異なるメトリックが使用されます。
Stats iQでは、データに適した指標が自動的に選択されます。
インタープレッシング結果
Kappa または ICC メトリクスは、0 から 1 までの一次生成であり、評価者の相関関係を示します。Kappa を解釈するには、以下の範囲を使用することをお奨めします。
0.75 から 1 | 非常によい |
0.6 から 0.75 | 高品質 |
0.4 から 0.6 | まあよい |
0.4 以下 | あまりよくない |
その他のリソース
- この信頼性分析は、IRR R パッケージの機能によって実行されます。さまざまな詳細設定が文書で説明されています。この分析を実行するために、これらの設定を使用または理解する必要はありません。
探索的因子分析
探索係数分析 (EFA) は、多数の変数をより小さく、管理しやすい集計 ‘係数’ セットに削減するのに役立つ統計手法です。これにより、分析結果の解釈、通信、および追加分析 (回帰分析など) の実行が大幅に容易になります。EFA は通常、以下のステップセットに従います。
- 診断: データが係数分析に適しているかどうかを判断する診断のセットを実行し、解釈します。変数は、意味のあるグループ化を形成するのに十分な相関関係を持つ必要がありますが、実質的に冗長であるほど高い相関関係を持つことはできません。
- 係数の選択: データに存在する係数の数を決定します。係数は、類似する変数のグループです。デフォルトでは、R スクリプトは自動的に計算および実行される基準を使用します。
- 命名の要因:データの主要テーマを最も的確に表す EFA の実行後、いくつかの要因が残ります。これらの要因に、その意味を捉える人間が判読できる名前でラベルを付けると便利です。
- 関連するメジャー & メトリクス: 係数分析は、前のステップの係数数を使用して実行されます。結果は、ファクタリングの統計的説明とともに、変数のグループ化のセットになります。
結果は、名前付き要素とそのコンポーネントアンケート項目のセットになります。これらの要因は、追加分析の概念的なフレームワークとして機能するか、データに適用し直すことができます。
診断
このスクリプトでは、最初に、データが EFA に適していることを確認するための一連の診断が実行されます。
- サンプルサイズ:通常は、項目に対する回答の 10:1 の比率が提案されます。たとえば、10個の質問がある場合、少なくとも100名の回答者が必要です。
- Bartlett の Test of Sphericity:このテストでは、品目が有用で係数にグループ化するのに十分な相関性があるかどうかを評価します。これが失敗すると、他のアイテムとの相関性が十分でない明細が複数存在する可能性があります。他のユーザーと相関しない項目を分析から削除することを検討したり、関連する項目をさらにアンケートに追加したりできます。
- 決定要因: 決定要因は、明細を係数にグループ化するには相関性が高すぎるかどうかを評価します。この診断が失敗した場合、互いに類似しすぎて、要因に分離できない項目が存在する可能性があります。アンケート項目の編集をより明確にすることを検討してください。
- Kaiser-Meyer-Olkin (KMO) 指標:このメジャーは、アンケート項目が意味のある要素にグループ化するのに十分な共通点があるかどうかをチェックします。この診断に合格すると、アンケートの回答に多くの共通点があり、適切にグループ化できます。それ以外の場合、項目はカテゴリにクラスタ化されません。この診断が失敗した場合、アンケート項目を修正してより類似したテーマを取り込み、他のユーザーとの明確な関係を示していない項目を削除することを検討してください。
チョーシングファクタ
EFA のポイントは、多くの変数を分析に役立つ比較的小さな数値に沸騰させることです。そのため、さまざまな係数を使用して係数分析を数回実行し、ユーザにとって有効なグループを見つける必要がある場合があります。EFA スクリプトでは、固有値を使用して係数の数が提案されます。
EFA スクリプトでは、変数の固有値を降順で表示する画面プロットが出力されます。チャートを調べて、チャート内の “ひじき” の前に発生する係数の数を確認することができます。この数を超える要因を加えると、有用性が低くなります。
要因の命名
EFA の実行後、各変数が係数に割り当てられます。各要素に、説明の簡潔さを示す名前を付けると便利です。これにより、発見事項にアクセスしやすくなります。ここでの目標は、複雑なデータを理解しやすいいくつかのテーマに簡素化することです。
以下に、要素に名前を付けるためのガイドラインをいくつか示します。
- わかりやすくする: グループ内の変数を要約する共通テーマを取得してください。
- シンプルさを保つ:要素名は理解しやすく、コミュニケーションしやすいものである必要があります。技術的な専門用語や過度に複雑なフレーズは避けてください。
- 対象者を考慮する:要素名は、分析を使用する人にとって理にかなっている必要があります。たとえば、「清潔感」は、ホテルマネージャーとホテル宿泊客の両方にとって有意義です。
- 一貫性:アンケートまたはデータセットが複数のドメインまたはサブジェクトにわたる場合は、要素名が整合していることを確認してください。
関連メジャー、メトリクス
係数積載テーブルは、EFA のキー出力の 1 つです。特定の可変係数ペアの係数ロードは、その変数と係数の間の相関関係です。変数の係数が特定の係数に対して高い場合、その係数に質問が強く関連していることを意味します。
一意性は、差異のうち、特定の変数に対して一意であり、他の変数と共有されていない部分です。一意性の値の範囲は 0 ~ 1 で、値が大きいほど変数は一意であり、どの係数にも適合しないことを示します。
一般的に、係数の負荷が 0.3 を超えるか、変数の一意性が 0.7 を超える場合は、変数を削除することをお奨めします。
結果の使用
係数分析は、反復的なプロセスです。そのため、機能するグループを見つけるために、異なる数の係数で係数分析を複数回実行する必要がある場合があります。ほとんどの研究者にとって、重要なポイントはデータに対する新しいインサイトを提供できる要因のグループを特定することですが、回帰分析やクラスタ分析などの後続の分析で、これらの要因を新しい変数として使用することができます。 たとえば、グループ化されたすべての変数の平均値を取得する新規変数を係数ごとに登録することができます。
相関関係マトリックス
相関行列は、提供された変数の各ペア間の相関関係を示すテーブルです。このテーブルは、デフォルトで Pearson の r を使用して相関関係を測定しますが、必要に応じて Spearman の rho に変更することができます。
corrplot() 関数のパラメータを編集して、テーブルを変更し、読みやすくすることができます。詳細については、正式な R ウォークスルーおよび文書を参照してください。