Statistik verstehen
Informationen zu Statistiken
Willkommen bei Qualtrics Statistics. Dies ist eine Übersicht über grundlegende Statistiken, die für Sie nützlich sein können, wenn Sie Projekte in Qualtrics erstellen und analysieren. Wir werden einige grundlegende statistische Konzepte behandeln, sie auf die Plattform anwenden und einige weitere Optionen außerhalb von Qualtrics besprechen.
Quantitative und kategorische Daten
Es gibt zwei Arten von Daten: quantitativ und kategorisch.
Quantitative Daten werden auf einer numerischen Skala bewertet. Beispiele für quantitative Daten sind Alter, Höhe oder Einkommen.
Kategorische Daten werden auf nominaler Skala bewertet. Beispiele für kategorische Daten sind Geschlecht, Familienstand oder Beruf. Die meisten in einer Umfrage gesammelten Daten sind kategorisch, wobei die Anzahl der Befragten, die in eine Kategorie fallen, ermittelt wird.
Kennzahlen des Zentrums
Für quantitative Daten werden drei Mittelwerte verwendet: Mittelwert, Median und Modus.
Der Mittelwert ist das beste Maß für das Zentrum, wenn die Daten ungefähr normal verteilt sind oder wie eine Glockenkurve aussehen. Der Mittelwert wird gefunden, indem alle Beobachtungen addiert und durch die Gesamtzahl der Beobachtungen dividiert werden.
Der Median (Mittelwert) ist ein gutes Maß für das Zentrum, in dem die Daten scheinbar verzerrt sind. Wenn Sie Ihre gesamte Beobachtung in der richtigen Reihenfolge aneinanderreihen, ist der Median der mittlere Wert.
Der Modus ist der Wert, der am häufigsten in Ihren Daten vorkommt. Er wird nicht so häufig verwendet wie der Mittelwert oder der Median.
Spread-Kennzahlen
Es gibt einige nützliche Statistiken, um die Verteilung Ihrer Daten zu messen: Standardabweichung, Varianz und Bereich.
Eine Standardabweichung ist der durchschnittliche Abstand der Beobachtungen von ihrem Mittelwert. Wie der Mittelwert sollte auch bei grob normalverteilten Daten eine Standardabweichung verwendet werden.
Die Varianz ist einfach die Standardabweichung zum Quadrat.
Der Bereich ist die Differenz zwischen dem größten und dem kleinsten Wert.
Statistiken in Visualisierungen
Eine Statistiktabellen-Visualisierung in Qualtrics zeigt den Mindestwert, den Höchstwert, den Mittelwert, die Abweichung, die Standardabweichung und die Gesamtzahl der Antworten an.
Da für jede Antwortoption in jeder Frage ein Wert kodiert ist, findet Qualtrics diese Statistik, unabhängig davon, ob die Daten quantitativ oder kategorisch sind. Es liegt an Ihnen zu entscheiden, ob diese Statistiken im Rahmen Ihrer Studie sinnvoll sind.
Sie können die Teilnehmer beispielsweise nach ihrer bevorzugten Farbe fragen: rot, gelb, blau oder grün, kodiert als 1, 2, 3 und 4. Qualtrics wird Ihnen einen Mittelwert geben, aber es ist nicht sinnvoll, eine durchschnittliche Favoritenfarbe zu haben.
Wenn die Teilnehmer Filme auf einer Skala von 1 bis 5 Sternen bewerten würden, wäre ein Mittelwert nützlich. Mittel wie 2,98 Sterne oder 4,32 Sterne machen Filme leicht zu vergleichen.
Qualtrics bietet eine Vielzahl von Diagrammen, Grafiken und Tabellen. Ein Balkendiagramm zeigt die Häufigkeit der Antworten in jeder Antwortauswahlkategorie an.
Ein Kreisdiagramm zeigt diese Häufigkeiten als Prozentsatz des Kreisdiagramms an.
Sowohl Balkendiagramme als auch Kreisdiagramme erleichtern den Vergleich der Häufigkeiten zwischen Kategorien.
Ein Liniendiagramm ist ein zweidimensionales Streudiagramm für geordnete Beobachtungen. Es ist eine gute Möglichkeit, Trends im Laufe der Zeit zu erkennen.
Ein Tachometerdiagramm vergleicht eine ausgewählte Metrik (z. B. Durchschnitt, Summe) mit einer Skala. Je nachdem, wo die Metrik liegt, ändert sich die Farbe der Skala. Tachometerdiagramme sind hilfreich, um schnell die erwartete Performance eines Werts mit der tatsächlichen Performance zu vergleichen.
Kreuztabellen
1 Möglichkeit, kategorische Daten zu analysieren, ist über eine Kreuztabelle, auch als Ausnahmetabelle oder 2-Wege-Tabelle bezeichnet. Eine Kreuztabelle zeichnet die Anzahl der Teilnehmer auf, die die in den Zellen der Tabelle beschriebenen spezifischen Merkmale aufweisen.
In diesem Beispiel sehen Sie die Anzahl der einzelnen Artikelarten, die wöchentlich, monatlich und jährlich gekauft wurden (z.B. 11 Mäntel werden monatlich gekauft).
Eine Kreuztabelle besteht aus Spalten und Zeilen bzw. Bannern und Stubs, wobei jedes Banner und jeder Stub Frequenzdaten aus einer Frage abruft. Qualtrics ermöglicht Ihnen nur die Auswahl von Fragen, die für eine Kreuztabelle kompatibel sind (z. B. Fragen zu offenen Texteinträgen sind nicht mit einer Kreuztabelle kompatibel). Wenn Sie mehrere Banner oder Stubs auswählen, können Sie auswählen, welches Banner oder welchen Stub Sie anzeigen möchten, indem Sie auf sie im Editor für Kreuztabellen klicken. Wenn Sie Ihrer Kreuztabelle einen mehrstufigen Drilldown hinzufügen, wird 1 Variable als Unterkategorie einer anderen angezeigt.
Chi-Square-Teststatistik
Die Chi-Quadrat-Teststatistik testet auf eine signifikante Beziehung zwischen einem Stub und einem Banner.
Wenn Sie mehrere Stubs und Banner in Ihre Kreuztabelle aufnehmen, erzeugt Qualtrics auch mehrere Chi-Quadrat-Werte, 1 für jede Banner- und Stub-Kombination.
Es ist von Vorteil zu wissen, wie eine Chi-Quadrat-Teststatistik berechnet wird. Zunächst müssen Sie die erwartete Anzahl für jede Zelle ermitteln oder die erwartete Anzahl der Zelle basierend auf der Zeilensumme, der Spaltensumme und der Tabellensumme. Um eine erwartete Anzahl zu finden, verwenden Sie die Zeilensumme multipliziert mit der Spaltensumme und dividieren das Ergebnis durch die Tabellensumme.
Sobald Sie die erwartete Anzahl erreicht haben, führen Sie die folgende Berechnung durch:
Die Chi-Quadrat-Teststatistik wird gefunden, indem der beobachtete Wert minus dem erwarteten Wert zum Quadrat dieser Differenz verwendet und durch den erwarteten Wert für jede Zelle dividiert wird. Diese einzelnen Chi-Quadrat-Testkomponenten werden dann addiert und das Ergebnis ist die Chi-Quadrat-Teststatistik. Der Chi-Quadratwert wird dann verwendet, um zu ermitteln, ob die Beziehung zwischen Ihren Variablen statistisch signifikant ist.
p-Wert
Die Chi-Quadrat-Teststatistik wird zusammen mit dem Konfidenzniveau verwendet, um einen p-Wert zu finden. Ein p-Wert bestimmt, ob die Zuordnung zwischen den beiden Variablen statistisch signifikant ist. Ein niedriger p-Wert bedeutet, dass die beobachtete Tabellenbeziehung mit sehr geringer Wahrscheinlichkeit auftreten würde, sodass es eine signifikante Beziehung zwischen den beiden Variablen gibt. Ein niedriger p-Wert wird im Allgemeinen als eine Zahl kleiner als 0,05 betrachtet.
Unser p-Wert ist 0,28, was nicht signifikant ist. Daher besteht keine Beziehung zwischen der Besuchshäufigkeit und der Art des gekauften Artikels.
Zusätzliche Analysen
Weitere Analysen für quantitative Daten, wie Korrelation und Regression, können in Excel oder in ein statistisches Softwarepaket übernommen werden.
Korrelation
Der Korrelationskoeffizient r beschreibt die Stärke und Richtung für eine etwa lineare Beziehung zwischen 2 quantitativen Größen. Der Wert von r liegt immer innerhalb von -1 und 1, wobei Werte, die -1 und 1 am nächsten liegen, eine starke Korrelation darstellen und Werte, die nahe Null liegen, schwach sind. Das Plus- oder Minuszeichen gibt die positive oder negative Richtung der Beziehung an. Korrelationswerte zwischen -.3 und .3 werden als eher niedrig betrachtet, während Korrelationswerte zwischen .7 und 1 oder -.7 und -1 als hoch betrachtet werden.
Ein wichtiger Punkt ist, dass die Korrelation nicht mit der Verursachung übereinstimmt. Nur weil 2 Variablen stark korreliert sind, bedeutet dies nicht, dass 1 dieser Variablen die andere 1 verursacht.
Regression
Die Regressionsanalyse kann verwendet werden, um Vorhersagen für eine Variable basierend auf einer oder mehreren Prädiktorvariablen zu erstellen. Weitere Informationen zu Regressionen finden Sie auf den folgenden Seiten:
- Benutzerfreundlicher Leitfaden zur linearen Regression
- Benutzerfreundlicher Leitfaden zur logistischen Regression