zum Hauptinhalt springen
Loading...
Skip to article
  • Qualtrics Platform
    Qualtrics Platform
  • Customer Journey Optimizer
    Customer Journey Optimizer
  • XM Discover
    XM Discover
  • Qualtrics Social Connect
    Qualtrics Social Connect

Regression und relative Wichtigkeit


Was this helpful?


This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

The feedback you submit here is used only to help improve this page.

That’s great! Thank you for your feedback!

Thank you for your feedback!


Regression und relative Wichtigkeit

Regression zeigt Ihnen, wie sich mehrere Eingabevariablen zusammen auf eine Ausgabevariable auswirken. Wenn beispielsweise sowohl die Eingaben „Jahre als Kunde“ als auch „Unternehmensgröße“ mit der Ausgabe „Zufriedenheit“ und miteinander korreliert sind, können Sie mithilfe der Regression herausfinden, welche der beiden Eingaben für die Zufriedenheit wichtiger war.

Die Analyse der relativen Wichtigkeit ist die Best-Practice-Methode für die Regression von Umfragedaten und die Standardausgabe von Regressionen, die in Stats iQ durchgeführt werden. Relative Wichtigkeit ist eine moderne Erweiterung der Regression, die Situationen berücksichtigt, in denen die Eingabevariablen miteinander korreliert sind, ein sehr häufiges Problem in der Umfrageforschung (bekannt als „Multicollinearität“). Relative Wichtigkeit wird auch als Johnson’s Relative Weights bezeichnet, ist eine Variation der Shapley-Analyse und steht in engem Zusammenhang mit der Dominanzanalyse.

Nachfolgend finden Sie Anweisungen zum Einrichten einer Regression in Stats iQ. Weitere Anleitungen zum Denken in die analytischen Teile der Regressionsanalyse finden Sie auf den folgenden Seiten:

Tipp: In der Stats iQ-Plattform gibt es jetzt hilfreiche Tooltips! Während Sie in Stats iQ arbeiten, können Sie auf die i-Symbole klicken, die auf der gesamten Plattform angezeigt werden, um zusätzliche Informationen und Definitionen anzuzeigen.
Pfeil, der zur Quick-Info neben dem Titel der relativen Wichtigkeit im Diagramm zeigt
Tipp: Sie können bis zu 750 Karten in Ihrem Arbeitsbereich haben. Wenn Sie dieses Limit erreichen, wird ein Fehler angezeigt, wenn Sie versuchen, eine neue Karte anzulegen. Sie werden darauf hingewiesen, dass Ihre ältesten Karten gelöscht werden.

 

Für die lineare Regression folgt Relative Wichtigkeit in Stats iQ den in Lipovetsky, Stan & Conklin, Michael. (2001) beschriebenen Techniken. In: Analysis of Regression in Game Theory Approach. Angewandte Stochastische Modelle in Wirtschaft und Industrie. 17. 319 – 330. 10.1002/asmb.446.

Variablen für Regressionskarten auswählen

Wenn Sie eine Regressionskarte erstellen, können Sie nachvollziehen, wie sich die Werte anderer Variablen auf den Wert einer Variable in Ihrem Datenset auswirken.

Bei der Auswahl von Variablen hat eine Variable einen Schlüssel. Für die Regression ist die Schlüsselvariable die Ausgabevariable. Jede andere Variable, die nach der Schlüsselvariablen ausgewählt wird, ist eine Eingabevariable. Mit anderen Worten, wir versuchen zu erklären, wie der Wert der Ausgabevariablen von den Eingabevariablen gesteuert wird.

Schlüssel, der angibt, dass die Ausgabevariable Auswirkung At-At-Home ist

Bei der Auswahl von Variablen für die Regression sind folgende Punkte zu beachten:

  • Sie können die Schlüsselvariable ändern, indem Sie auf das Schlüsselsymbol neben einer beliebigen Variablen im Variablenbereich klicken.
  • Wenn mehr Variablen als die Anzahl der Antworten ausgewählt sind, wird die Regression nicht ausgeführt.
  • Sie können bis zu 25 Eingabevariablen auswählen. Sie sollten jedoch versuchen, 1-10 Eingabevariablen auszuwählen, sonst können Ihre Ergebnisse sehr kompliziert werden.

Wenn Sie eine große Anzahl von Variablen in eine Analyse einbeziehen möchten, sollten Sie die folgenden Ansätze in Betracht ziehen:

  • Führen Sie einige initiale Regressionen aus, und schließen Sie die Variablen aus, die im Modell nur eine geringe Bedeutung haben.
  • Kombinieren Sie mehrere Variablen, indem Sie z.B. den Durchschnitt bilden.
  • Wenn die Struktur Ihrer Daten dies zulässt, können Sie einen Prozess mit zweistufiger relativer Wichtigkeit verwenden, wie hier auf Seite 341 beschrieben.

Beispiel: Stellen Sie sich beispielsweise vor, Sie haben zehn Kennzahlen zur Zufriedenheit mit der Mitarbeiterautonomie und zehn Kennzahlen zur Zufriedenheit mit der Mitarbeitervergütung.

  • Diese Gruppen werden in zwei verschiedenen Gruppenergebnisvariablen gemittelt – eine für Autonomie und eine für Vergütung.
  • Führen Sie eine Analyse der relativen Wichtigkeit mit der Gesamtzufriedenheit als Ausgabe und den beiden Zusammenfassungsvariablen als Ihre Eingabe aus, um zu sehen, welche Gruppe wichtiger ist.
  • Führen Sie dann eine Analyse der relativen Wichtigkeit mit Gesamtzufriedenheit als Ergebnis und nur die zehn Autonomievariablen als Eingaben aus, um zu sehen, welche innerhalb dieser Gruppe am wichtigsten sind.
  • Führen Sie eine Analyse der relativen Wichtigkeit mit der Gesamtzufriedenheit als Ergebnis und nur den zehn Vergütungsvariablen als Eingaben durch, um zu sehen, welche innerhalb dieser Gruppe am wichtigsten sind.

Nachdem Sie Ihre Variablen ausgewählt haben, klicken Sie auf Regression, um eine Regression auszuführen.

Oben links von stats iQ, Auswahl der Regressionstaste

Tipp: Am oberen Rand der Regressionskarte befindet sich eine grüne (und manchmal rote) Linie. Wenn Sie darauf klicken, wird die Anzahl der Antworten angezeigt, die für diese Karte als „Eingeschlossen“ oder „Fehlt“ markiert sind.

  • Enthalten: Teilnehmer, die die Frage für jede einzelne Frage oder jeden Datenpunkt beantwortet haben, die in der Regressionsanalyse verwendet werden, oder deren Daten für fehlende Eingabevariablen angerechnet wurden. Diese Daten werden in der Regressionsanalyse verwendet.
  • Fehlt: Teilnehmer, denen ein Wert für die ergebnisabhängige Variable fehlt. Diese Daten werden in der Regressionsanalyse nicht verwendet.

Regressionsarten

Es gibt zwei Hauptarten von Regressionsläufen in Stats iQ. Wenn die Ausgabevariable eine Zahlenvariable ist, führt Stats iQ eine lineare Regression aus. Wenn die Ausgabevariable eine Kategorievariable ist, führt Stats iQ eine logistische Regression aus.

Im Einzelnen werden folgende Regressionsarten ausgeführt:

Lineare Regression

Die relative Wichtigkeit wird mit den Ordinary Least Squares (OLS) kombiniert. Die Ausgabe ergibt sich aus einer Kombination der beiden Analysen:

  • Relative Wichtigkeit: Alles in diesem Abschnitt stammt aus der relativen Wichtigkeit mit Ausnahme des R-Quadrats, das aus der OLS-Regression stammt.
  • Erkunden Sie das Modell im Detail: Alles in diesem Abschnitt stammt aus der relativen Wichtigkeit, mit Ausnahme der Verteilungen, die aus den Daten selbst stammen.
  • Analysieren Sie die OLS-Regressionsdiagnostik und die Residuen, um Ihr Modell zu verbessern: Alles in diesem Abschnitt stammt aus der OLS-Regression.

Logistische Regression

Die logistische Regression ist eine binäre Klassifikationsmethode, die zum Verständnis der Treiber einer binären (z. Ja oder Nein), wenn eine Reihe von Eingabevariablen vorhanden ist. Wenn Sie eine Regression für eine Ausgabevariable mit mehr als zwei Gruppen ausführen, wählt Stats iQ eine Gruppe und einen Bucket die anderen zusammen aus, um sie zu einer binären Regression zu machen (Sie können ändern, welche Gruppe nach der Ausführung der Regression analysiert wird).

Tipp: Stats iQ führt die am besten geeignete Regressionsgleichung für Ihren Variablentyp aus. Wenn Sie den Variablentyp ändern, kann sich ändern, welche Art von Regression angewendet wird, wodurch sich die Ausgabe ändert.

Relative Wichtigkeit

Eingabevariablen in Umfragedaten sind häufig stark miteinander korreliert. Dies ist ein Problem, das als „Multicollinearity“ bezeichnet wird. Dies kann zu einer Regressionsausgabe führen, die die Wichtigkeit einer Variablen künstlich erhöht und die Wichtigkeit einer anderen korrelierten Variablen verringert. Relative Wichtigkeit wird als Best-Practice-Methode anerkannt, um dies zu berücksichtigen.

Die relative Wichtigkeit (insbesondere die relativen Gewichtungen von Johnson) leidet nicht unter diesem Problem und gleicht die Wichtigkeit der Eingabevariablen angemessen aus, unabhängig davon, welche Art von Regression ausgeführt wird.  Außerdem wird die relative Gewichtung (oder relative Wichtigkeit) jeder Variablen berechnet, der Anteil der erklärbaren Variation in der Ausgabe aufgrund dieser Variablen. Dies wird als eine Reihe von Prozentsätzen angezeigt, die 100 % ergeben.

Die Spalte Relative Wichtigkeit wird unter Modell im Detail untersuchen hervorgehoben.

Sie gibt ähnliche Ergebnisse wie die Ausführung einer Reihe von Regressionen zurück, eines für jede Variation der Eingabevariablen. Wenn Sie beispielsweise zwei Variablen hätten, würde dies dem Ausführen von drei Regressionen gleichwertig sein: eine mit Variable A, eine mit Variable B und eine mit beiden. Dies ermöglicht es, die Wichtigkeit jeder Variablen zu quantifizieren und diese Quantifizierung wieder auf das Regressionsergebnis anzuwenden.

Tipp: Wenn Sie mit der Dominanzanalyse vertraut sind, ist dies eine Erweiterung der Shapley-Regression, die eine rechnerisch effizientere Annäherung der Dominanzanalyse darstellt.
Tipp: Basierend auf dem obigen Beispiel können Ihre Ergebnisse als „34 % der Angaben des Modells über den NPS dem Alter des Umfrageteilnehmers zugeordnet werden.“ gemeldet werden.

Regressionsausgabe

Wenn Sie eine Regression in Stats iQ ausführen, enthalten die Analyseergebnisse die folgenden Abschnitte:

Numerische Zusammenfassung

Numerische Zusammenfassung der Regression
Oben auf der Karte befindet sich eine Zusammenfassung für die Regressionsanalyse. In dieser Zusammenfassung wird anhand der ausgewählten Variablen erläutert, welche Variablen die primären und sekundären Treiber sind und welche die geringe kumulative Auswirkung hatten. Die Datentabelle enthält den Stichprobenumfang und den R-Quadratwert.

Relative Wichtigkeit

Diagramm, das die Variablen mit niedriger und hoher Auswirkung von relativer Wichtigkeit anzeigt

  1. Variablen mit geringer Auswirkung: Variablen, die einzeln eine relative Wichtigkeit von 10 % oder weniger haben, werden gruppiert. Wenn diese Option ausgewählt ist, wird in einem Abschnitt die relative Wichtigkeit und statistische Signifikanz jeder Variablen mit geringer Auswirkung erläutert.
  2. Variablen mit hoher Auswirkung: Jede Variable mit hoher Auswirkung ist separat und anklickbar. Sobald eine Variable ausgewählt wurde, können Sie unterhalb des Balkendiagramms die Variation anzeigen, die berücksichtigt wurde, und was passieren würde, wenn andere Variablen im Modell gesteuert würden.

Zusätzliche Modelldetails

Wenn Sie Modell im Detail durchsuchen auswählen, werden Ihre Eingabevariablen und Ihre Ausgabevariablen aufgelistet. Ihre Eingabevariablen enthalten die folgenden Informationen:
Tabelle mit Eingabevariablen, relativer Wichtigkeit, Koeffizient, standardisiertem Koeffizienten, p-Wert, Häufigkeit und Transformation

  • Relative Wichtigkeit: Der Anteil des R-Quadrats, der von einer einzelnen Variablen beigetragen wird. Das R-Quadrat ist der Anteil der Variation der Ergebnisvariablen, der durch die Eingabevariablen in diesem Modell erklärt werden kann. Weitere Informationen finden Sie unter Relative Wichtigkeit.
  • Odds Ratio: Nur relevant für logistische Regression. Das Chancenverhältnis für eine bestimmte Eingabevariable gibt den Faktor an, um den sich die Chancen für jede Einheitenerhöhung in der erklärenden Variablen ändern.
    Beispiel: Wenn das Chancenverhältnis für die Zufriedenheit mit dem Manager 1,1 beträgt und die Gruppen der Ausgabevariablen Zufrieden und Nicht zufrieden sind, sind die Chancen der Ausgabevariablen für jede Instanz, in der Zufriedenheit mit dem Manager um 1 höher ist, 1,1 höher (10 % höher).  Wenn die Datenzeile eine Kategorie ist, wie Farbe[blau], stellt der Koeffizient die Änderung der Antwortvariablen dar, wenn die Kategorievariable diese bestimmte Kategorie (blau) anstelle der Baseline-Gruppe (rot, grün usw.) ist.
  • Koeffizient: Jede Erhöhung um 1 Einheit in einer Eingabevariablen ist mit einer Erhöhung des Koeffizienten in der Ausgabevariablen verknüpft. Diese Koeffizienten werden auf der Grundlage der Ergebnisse der Analyse der relativen Wichtigkeit konstruiert und passen sich daher an die Multikollinearität an und stimmen nicht mit den Koeffizienten überein, die sich aus einer normalen Regression der kleinsten Normalquadrate ergeben würden.
  • Standardisierter Koeffizient: Der standardisierte Koeffizient ist der Koeffizient geteilt durch die Varianz der Eingabevariable. Dadurch wird jede Variable auf dieselbe Skala gesetzt, sodass ihre Koeffizienten direkter verglichen werden können.
  • P-Wert: Der p-Wert ist das Maß für die statistische Signifikanz. Niedrigere Werte sind mit niedrigeren Abweichungen verbunden, dass es sich bei der Beziehung um einen Zufall handelt. Bei kategorischen Variablen gibt der p-Wert die statistische Signifikanz der Differenz zwischen einer Gruppe und der “Baseline”-Gruppe in der Variable an.
  • Transformation: Siehe Variablen transformieren.

OLS-Regression analysieren

Klicken Sie für die lineare Regression auf OLS-Regressionsdiagnosen und -Residuen analysieren, um Ihr Modell unter der Schlüssel-/Ausgabevariablen zu verbessern und die Diagramme Prognostiziert vs. Ist und Residuen anzuzeigen. Weitere Informationen finden Sie unter Interpreting Residual Plots to Improvement Your Regression.
Analyse von OLS-Regressionsdiagnosen und Residuen, um Ihre Modelltabelle zu verbessern

Variable eingeschlossen

Neben dem obersten Kopf der Regressionskarte sehen Sie die in der Regression verwendeten Variablen.

Der oberste Kopf lautet CES, Pfeil, Abteilung, da CES und Department die Variablen sind, die wir in der Regression verwendet haben.

Klicken Sie auf den Namen einer Variablen, um ein neues Fenster zu öffnen, in dem Sie Werte umkodieren oder zusammenfassen können. Klicken Sie auf die Pfeile, um zwischen den Eingabevariablen und den Ausgabevariablen in der Analyse zu wechseln.

Wenn zu viele Variablen für die Anzeige im Kopf beteiligt sind, wird eine Dropdown-Liste Erklärende Variablen angezeigt, in der Sie zwischen den Variablen wählen können, die Sie umkodieren möchten.

Der oberste Kopf hat einen Variablennamen, einen Pfeil und dann die Dropdown-Liste, die beschrieben wird.

Variablen hinzufügen und entfernen

Nachdem Sie eine Regressionskarte angelegt haben, können Sie der Analyse zusätzliche Variablen hinzufügen, indem Sie die folgenden Schritte ausführen:
Hinzufügen einer Variable über Explore the model im Detail

  1. Klicken Sie auf Modell im Detail durchsuchen.
  2. Wählen Sie unten auf der Karte Variablen zu Ihrem Modell hinzufügen. Dadurch wird eine Liste der Variablen angezeigt, die noch nicht für die Regression verwendet wurden.
  3. Wählen Sie eine Variable aus dieser Liste aus.
  4. Wählen Sie Übernehmen, um die Analyse erneut mit der neuen Variable auszuführen.

Um eine Variable aus der Regression zu entfernen, bewegen Sie den Mauszeiger über die gewünschte Variable, und klicken Sie auf das blaue X ganz rechts in der Tabelle. Nachdem Sie Variablen zum Hinzufügen oder Entfernen ausgewählt haben, stellen Sie sicher, dass Sie „Anwenden“ wählen, um das neue Modell auszuführen.

Hinzufügen einer Variable über Explore the model im Detail

Variablen anrechnen

Die Regression berücksichtigt nur Zeilen, in denen alle Eingabevariablen Daten enthalten. Bei der Umfragedatensammlung fehlen jedoch häufig Daten, was sich negativ auf Ihre Regressionsanalyse und Ihr Modell auswirken kann. Wenn Sie nur Zeilen ohne fehlende Daten in Ihre Regression aufnehmen, können Ihre Analyseergebnisse voreingenommen sein, da Ihre Stichprobe nicht für das gesamte Datenset repräsentativ ist.

Mit der Anrechnung füllt Stats iQ fehlende Daten automatisch mit geschätzten Werten. Wenn fehlende Daten eingegeben werden, können Sie mehr Ihrer ursprünglichen Daten in die Regressionsanalyse aufnehmen, was zu einem Regressionsmodell mit weniger Voreingenommenheit führt, das die Variation in der gewünschten Ergebnisvariablen besser erklären kann.

Die Anrechnung erfolgt automatisch. Wenn Sie also eine Regressionsanalyse für ein Datenset mit fehlenden Werten ausführen, wird das Datenset vor Berechnungen angerechnet.

Achtung: Stats iQ wendet nur Werte für Eingabevariablen an und wird nie den Wert einer Ergebnisvariablen berechnen.
Tipp: Die Anrechnung gilt nicht für bestehende Regressionskarten. Nur neue Regressionskarten werden automatisch angerechnet. Um die Anrechnung auf eine alte Regressionskarte zu verwenden, müssen Sie die alte Regression in einer neuen Karte neu anlegen.
Klicken Sie hier, um ein Beispieldatenset vor und nach der Anrechnung von Variablen anzuzeigen.
Vor der Anrechnung:
Für diese Regression ist „Datennutzung“ die Ergebnisvariable und „Alter“, „Internetservice“ und „Minuten der Bildschirmzeit“ sind die Eingabevariablen.

Zeilen-ID Datennutzung Alter Internet-Service Bildschirmzeit (Minuten)
1 75 39 Satellit 503
2 19 41 Glasfaseroptik 52
3 87 434
4 54 23 Satellit
5 14 101
6 75 Satellit
7 81 57 DSL 329
Achtung: Wenn Sie eine Regression ausgeführt haben, ohne die fehlenden Werte einzugeben, werden nur die Zeilen 1, 2 und 7 berücksichtigt.

Nach Anrechnung:

Zeilen-ID Datennutzung Alter Internet-Service Bildschirmzeit (Minuten)
1 75 39 Satellit 503
2 19 41 Glasfaseroptik 52
3 87 50.9 FEHLT 434
4 54 23 Satellit 359.0
5 14 50,9 FEHLT 101
6 75 50,9 Satellit 359.0
7 81 57 DSL 329
Tipp: “Internet Service” ist eine kategorische Variable, keine numerische, daher wird der fehlende Wert als “MISSING” gefüllt.

Anrechnungsmethoden

Stats iQ verwendet derzeit folgende Anrechnungsmethoden:

  • Standardkategorie: Stats iQ erstellt einen neuen „MISSING“-Kategoriewert, um fehlende Daten zu ergänzen. Diese Methode wird für kategorische Variablen verwendet.
  • Mittelwert: Wenn Stats iQ bei der Verteilung der numerischen Variablen keine Ausreißer erkennt, werden fehlende Daten für die Variable mit dem Mittelwert (Durchschnittswert) gefüllt. Diese Methode wird für numerische Variablen verwendet.
  • Median: Wenn Stats iQ bei der Verteilung der numerischen Variablen Ausreißer erkennt, werden fehlende Daten für die Variable mit dem Medianwert gefüllt. Diese Methode wird für numerische Variablen verwendet.

Anrechnungskennzeichen

Wenn Sie eine Regressionsanalyse für das Datenset durchführen, wird oben auf der Regressionskarte ein Anrechnungskennzeichen angezeigt.

Regressionskarte mit hervorgehobener Anrechnungsoption

Weitere Informationen zur Anrechnung erhalten Sie, indem Sie auf das Informationssymbol ( i ) neben Anrechnungsmethode klicken.

Informationen verfügbar, wenn auf Informationsmethode geklickt wird

Anrechnung deaktivieren

Stats iQ wendet die Anrechnung automatisch auf alle Regressionskarten an. Um die automatische Anrechnung zu deaktivieren, klicken Sie oben auf der Regressionskarte auf Fehlende Daten für Ihr Beispiel automatisch berechnen.

Schaltfläche zum Ein-/Ausschalten der automatischen Anrechnung

Anrechnungswarnungen

  • Wenn zu viele Daten angerechnet werden, wird Ihr Regressionsmodell voreingenommen und unzuverlässig. Wenn mehr als 50 % Ihres Datensatzes ausgefüllt wurden, warnt Sie Stats iQ davor, Schlussfolgerungen aus Ihren Regressionsergebnissen zu ziehen.
    Warnmeldung, wenn mehr als 50 % der Daten fehlen
  • Wenn Ausreißer in einer der numerischen Eingabevariablen erkannt werden, berechnet Stats iQ die Variablen mit dem Medianwert anstelle des Mittelwerts. In diesem Szenario warnt Stats iQ Sie, wenn Sie das Modell im Detail erkunden.
    Ausreißer-Warnmeldung

Variablen transformieren

Wenn Sie eine Regressionsanalyse in Stats iQ ausführen, stellen Sie möglicherweise fest, dass Sie Ihr Modell verbessern müssen. Die häufigste Methode zur Verbesserung eines Modells ist die Transformation einer oder mehrerer Variablen, in der Regel mithilfe eines „Protokolls“ oder einer anderen funktionalen Transformation.

Das Transformieren einer Variable ändert die Form ihrer Verteilung. Generell funktionieren Regressionsmodelle besser mit symmetrischen, glockenförmigen Verteilungen. Probieren Sie verschiedene Arten von Transformationen aus, bis Sie eine finden, die Ihnen diese Art der Verteilung liefert.

Tipp: Es ist vielleicht nicht möglich, eine Transformation zu finden, die zu einer symmetrischen Verteilung führt.

So transformieren Sie eine Variable:
Schritte für den Zugriff auf Transformationen

  1. Blättern Sie unter der Option Modell im Detail durchsuchen zur Spalte Transformieren.
  2. Klicken Sie auf die Schaltfläche Funktion (f(x)) für die Variable, die Sie transformieren möchten.
  3. Wählen Sie aus der Liste die Funktion aus, die Sie anwenden möchten, und Stats iQ berechnet die Karte mit der neuen transformierten Variable neu.

Die folgenden Transformationen sind in Stats iQ verfügbar:

Quartisch, Würfel, Quadrat, Quadratwurzel, logarithmisch und reziproke Funktionen

Die mit Abstand häufigste Transformation ist log(x). Es wandelt eine „Potenzverteilung“ (wie die Größe der Stadtbevölkerung) mit vielen kleineren Werten und einer geringen Anzahl größerer Werte in eine glockenförmige „Normalverteilung“ (wie Höhe) um, in der die meisten Werte in Richtung Mitte geclustert sind.

Verwenden Sie log(x+1), wenn die zu transformierende Variable einen Nullwert hat, da log(x) nicht berechnet werden kann, wenn x Null ist.

Weitere Informationen dazu, wann Sie Ihre Variablen transformieren müssen, finden Sie unter Interpretieren von Residualdiagrammen zur Verbesserung Ihrer linearen Regression

.

Andere in Stats iQ verfügbare lineare Regressionstechniken

Relative Wichtigkeit in Kombination mit den ordentlichen kleinsten Quadraten ist die Standardausgabe für eine lineare Regression. Es stehen jedoch weitere Optionen zur Verfügung.

Um auf die M-Schätzung, die Ordinary Least Squares und die Ridge Regression zuzugreifen, klicken Sie auf die Einstellungen in der oberen rechten Ecke Ihrer Regressionskarte. Wenn Sie unter Regressionsmethoden auf den Namen der Regressionstechnik klicken, können Sie die für die Regressionskarte verwendete Regressionstechnik ändern. Dies ist nur für die lineare Regression möglich.
Auswahl anderer Regressionsmethoden und Erläuterungen

  • M-Schätzung: Vorgesehen, um Ausreißer in der Ausgabevariable besser zu handhaben als normale kleinste Quadrate (OLS).
  • Ordinary Least Squares: Ordinary Least Squares (OLS) ist die klassische Regressionstechnik. Da Ausreißer und andere Verstöße in ihren Annahmen empfindlich sind, empfehlen wir robustere Methoden wie M-Schätzung. Da OLS in der standardmäßigen Ausgabe für die relative Wichtigkeit verwendet wird, sollten Sie diese Option nur dann auswählen, wenn Sie an den Funktionen interessiert sind, die noch nicht in die Ausgabe der relativen Wichtigkeit angepasst wurden: Vorhersage von Ergebnissen und Hinzufügen von Interaktionsbegriffen.
  • Ridge-Regression: Die Ridge-Regression ist eine Technik, die der Standard-OLS-Regression ähnelt, jedoch mit einem Alpha-Tuning-Parameter. Dieser Alpha-Parameter unterstützt den Umgang mit hoher Varianz und Daten, die unter Multikollinearität leiden. Bei korrekter Optimierung liefert die Rückenregression im Allgemeinen bessere Vorhersagen als OLS aufgrund eines besseren Kompromisses zwischen Bias und Varianz. In Stats iQ können Sie den Alpha-Parameter auswählen, wenn Sie die Ridge Regression verwenden.

Sobald Sie M-Schätzung, Normale kleinste Quadrate oder Ridge-Regression ausgewählt haben, können Sie die Ausgabe sehen. Die Ausgabe wird unter dem Abschnitt Regressionsmethoden angezeigt.
Numerische Zusammenfassung, Koeffizientendetails sowie Diagnose- und Residualdaten

  1. Numerische Zusammenfassung: Oben auf der Karte befindet sich eine Zusammenfassung für die Regressionsanalyse. Dazu gehören Stichprobenumfang, Fehlende Fälle, Methode, R-Quadratwert, Standardfehler, Variationskoeffizient und Modellanpassung.
  2. Koeffizientendetails: Die primären Ergebnisse der Regression, die mathematische Gleichung, befinden sich unter der Zusammenfassung. Die Ausgabe-/Schlüsselvariable befindet sich links neben der Gleichung. Die Eingabevariablen befinden sich auf der rechten Seite. Wenn Sie den Mauszeiger über eine Variable bewegen, wird eine Quick-Info angezeigt, die einfach erklärt, wie diese Variable zur Ausgabevariablen beiträgt. Hier können Sie auch Werte in die mathematische Gleichung für die Schätzung von Werten für Ihre Ausgabevariable eingeben. Weitere Informationen finden Sie im folgenden Abschnitt über die Schätzung von Ausgabevariablenwerten.
  3. Diagnose und Residuen: Stats iQ bietet Diagnosen, mit denen Sie die Genauigkeit und Gültigkeit Ihres Modells beurteilen können. Weitere Informationen finden Sie unter Interpreting Residual Plots to Improvement Your Linear Regression oder The Confusion Matrix and the Precision-Recall Tradeoff in Logistic Regression.

Ausgabevariablenwerte schätzen

Tipp: Diese Option ist nur für M-Estimation, Ordinary Least Squares und Ridge Regression.Um auf diese Optionen zuzugreifen, klicken Sie oben rechts auf Ihrer Regressionskarte auf das Zahnrad für die Einstellungen. Wenn Sie unter Regressionsmethoden auf den Namen der Regressionstechnik klicken, können Sie die für die Regressionskarte verwendete Regressionstechnik ändern. Dies ist nur für die lineare Regression möglich.

Nachdem Sie eine Regression ausgeführt haben, können Sie die mathematische Gleichung im Abschnitt Details Koeffizient verwenden, um die Ausgabevariablenwerte basierend auf den von Ihnen ausgewählten Eingabewerten zu schätzen. Auf der rechten Seite der Gleichung sehen Sie Ihre Eingabevariablen. Sie können Werte für jede Ihrer Eingabevariablen festlegen. Auf der linken Seite der Gleichung befindet sich Ihre Ausgabevariable. Nachdem Sie Werte für Ihre Eingabevariablen eingegeben haben, berechnet die Gleichung eine Schätzung für die Ausgabevariable basierend auf dem Regressionsmodell.
Eingabe von Werten für Eingabevariablen

  1. Diese Eingabevariablen sind eine Kategorietypvariable. Um einen Wert für Kategorievariablen einzugeben, klicken Sie in der Liste der Optionen auf den gewünschten Wert.
  2. Diese Eingabevariablen sind Variablen vom Typ Zahl. Um einen Wert für Zahlenvariablen einzugeben, klicken Sie auf Geben Sie einen Wert ein, und geben Sie eine Zahl ein.
  3. Diese Variable ist die Ausgabevariable Ihrer Regressionsgleichung. Nachdem Sie Werte für Ihre Eingabevariablen ausgewählt haben, wird ein Schätzwert für Ihre Ausgabevariable neben Schätzung angezeigt.
Beispiel: Im folgenden Beispiel versuchen wir, den Kunden-NPS auf der Grundlage einiger Eingabevariablen vorherzusagen. Nachdem Sie Werte für die Eingabevariablen ausgewählt haben, wird ein geschätzter NPS-Wert von 4,98 angezeigt.
Ein Bild der Koeffizientendetails nach der Eingabe von Eingabevariablenwerten. Auf der linken Seite der Gleichung wurde basierend auf dem Regressionsmodell ein NPS-Wert von 4,98 prognostiziert.

Vorhersage von Ergebnissen

Tipp: Diese Option ist nur für M-Estimation, Ordinary Least Squares und Ridge Regression verfügbar. Um auf diese Optionen zuzugreifen, klicken Sie auf das Zahnrad in der oberen rechten Ecke Ihrer Regressionskarte. Wenn Sie unter Regressionsmethoden auf den Namen der Regressionstechnik klicken, können Sie die für die Regressionskarte verwendete Regressionstechnik ändern. Dies ist nur für die lineare Regression möglich.

In der Regel verwenden Sie die Regressionsanalyse in Stats iQ, um die Beziehung zwischen Eingabevariablen und Ausgabevariablen zu verstehen. Sobald ein Regressionsmodell erstellt wurde, kann es jedoch auch verwendet werden, um den Ausgabewert für Datenzeilen vorherzusagen, in denen Sie Werte für die Eingaben haben.
OLS-Regression mit hervorgehobenen Prognosen analysieren

Interaktionsbedingungen und andere erweiterte Bedenken

Hinzufügen von Interaktionsbedingungen

Wenn Sie Ihr Regressionsmodell verbessern möchten, können Sie zusätzlich zu den vorhandenen Eingabevariablen Interaktionsbedingungen hinzufügen. Ein Interaktionsbegriff wird hinzugefügt, wenn Sie vermuten, dass sich der Wert einer der Eingabevariablen ändert, wie sich eine andere Eingabevariable auf die Ausgabevariable auswirkt.

So sind zum Beispiel für Menschen mit Kindern, die während eines Hotelaufenthalts anwesend sind, jüngere Menschen zufriedener als ältere Menschen, aber für Menschen ohne anwesende Kinder sind jüngere weniger zufrieden. Das würde eine Interaktion zwischen „Kinder präsentieren“ und „Alter“ bedeuten.

Wenn Sie zwei Variablen unter Interaktion hinzufügen zwischen unten in der Liste der Eingabevariablen auf der Karte auswählen, wird der Regression ein Interaktionsbegriff hinzugefügt. Diese Funktion ist nur in den Ordinary Least Squares, M-Estimation und Ridge Regression verfügbar.
Hervorheben der Interaktion zwischen Optionen
Sie können denselben Effekt für kategorische Variablen in einer Analyse der relativen Wichtigkeit erzielen, indem Sie eine neue Variable erstellen, die beide kombiniert. Beispielsweise können Sie die Variable Farbe (mit roten und grünen Gruppen) mit der Größe (mit großen und kleinen Gruppen) kombinieren, um eine Variable namens ColorSize (mit den Gruppen BigRed, BigGreen, SmallRed und SmallGreen) zu bilden.

Multikollinearität

Multicollinearität tritt in einem Regressionskontext auf, wenn zwei oder mehr Eingabevariablen stark miteinander korreliert sind.

Wenn zwei Variablen stark korreliert sind, setzt die Mathematik für die Regression in der Regel so viel Wert wie möglich in eine Variable und nicht in die andere. Dies zeigt sich in einem größeren Koeffizienten für diese Variable. Wenn das Modell jedoch auch in geringem Umfang geändert wird (z.B. durch Hinzufügen eines Filters), kann sich die Variable ändern, in der der größte Teil des Werts platziert wurde. Das bedeutet, dass selbst eine kleine Änderung drastische Auswirkungen auf das Regressionsmodell haben kann.

Die Analyse der relativen Wichtigkeit behandelt dieses Problem, sodass Sie sich keine Sorgen machen müssen. Wenn Sie eine der anderen Methoden bevorzugen und Ihr Modell dieses Problem hat, löst das Vorhandensein von Multicollinearität (gemessen durch „Varianzinflationsfaktor“) eine Warnung aus und schlägt vor, eine Variable zu entfernen oder Variablen zu kombinieren, indem Sie z.B. den Durchschnitt bilden.

Warnmeldungen

Stats iQ warnt Sie, wenn es potenzielle Probleme mit Ihren Regressionsergebnissen gibt. Dazu gehören folgende Situationen:

  • Eingabevariablen in Ihrer Regression sind statistisch nicht signifikant.
  • Ihre Transformation hat Daten aus der Regression entfernt.
  • Zwei oder mehr Variablen sind stark miteinander korreliert und führen zu instabilen Ergebnissen, d.h. Multikollinearität.
  • Die Residuen weisen ein Muster auf, das darauf hindeutet, dass das Modell verbessert werden könnte.
  • Eine Variable mit nur einem Wert wurde automatisch entfernt.
  • Die Stichprobengröße ist im Verhältnis zur Anzahl der Eingabevariablen in der Regression zu niedrig.
  • Eine Kategorievariable mit zu vielen Antwortoptionen wurde hinzugefügt.

Häufig gestellte Fragen

Viele Seiten dieses Portals wurden mithilfe maschineller Übersetzung aus dem Englischen übersetzt. Obwohl wir bei Qualtrics die bestmögliche maschinelle Übersetzung ausgewählt haben, um ein möglichst gutes Ergebnis zu bieten, ist maschinelle Übersetzung nie perfekt. Der englische Originaltext gilt als offizielle Version. Abweichungen zwischen dem englischen Originaltext und den maschinellen Übersetzungen sind nicht rechtlich bindend.