Korrespondenzanalyse (BX)
Korrespondenzanalyse
Die Korrespondenzanalyse zeigt die relativen Beziehungen zwischen und innerhalb zweier Gruppen von Variablen, basierend auf den in einer Eventualtabelle angegebenen Daten. Für Markenwahrnehmungen sind diese beiden Gruppen:
- Instanzen
- Attribute, die für diese Marken gelten
Angenommen, ein Unternehmen möchte erfahren, welche Attribute Verbraucher mit verschiedenen Marken von Getränkeprodukten verknüpfen. Die Korrespondenzanalyse hilft dabei, Gemeinsamkeiten zwischen Marken und die Stärke von Marken hinsichtlich ihrer Beziehungen zu verschiedenen Attributen zu messen. Wenn Brand Owner die relativen Beziehungen verstehen, können sie die Auswirkungen vorheriger Aktionen auf verschiedene markenbezogene Attribute ermitteln und über die nächsten Schritte entscheiden.
Die Korrespondenzanalyse ist in Bezug auf die Markenwahrnehmung aus verschiedenen Gründen wertvoll. Wenn Sie versuchen, sich die relativen Beziehungen zwischen Marken und Attributen anzusehen, kann die Markengröße eine irreführende Auswirkung haben. Die Korrespondenzanalyse entfernt diesen Effekt. Die Korrespondenzanalyse bietet auch eine intuitive Schnellansicht der Markenattributbeziehungen (basierend auf Nähe und Entfernung vom Ursprung), die nicht von vielen anderen Graphen bereitgestellt wird.
Auf dieser Seite sehen wir uns ein Beispiel an, wie Sie die Korrespondenzanalyse auf einen Anwendungsfall für verschiedene (fiktive) Marken von Soda-Produkten anwenden können.
Beginnen wir mit dem Eingabedatenformat – einer Ausnahmetabelle.
Ausnahmetabellen
Eine Eventualtabelle ist eine zweidimensionale Tabelle mit Gruppen von Variablen in den Zeilen und Spalten. Wenn unsere Gruppen, wie oben beschrieben, Marken und ihre zugehörigen Attribute wären, würden wir Umfragen durchführen und unterschiedliche Antwortanzahlen erhalten, die verschiedene Marken mit den angegebenen Attributen verknüpfen. Jede Zelle in der Tabelle stellt die Anzahl der Antworten oder Anzahlen dar, die dieses Attribut mit dieser Marke verknüpfen. Diese “Assoziation” wird über eine Umfragenfrage wie “Marken aus einer Liste auswählen, unter der Sie glauben, das Attribut ___ anzuzeigen.” angezeigt.
Hier sind die beiden Gruppen “Marken” (Zeilen) und “Attribute” (Spalten). Die Zelle in der unteren rechten Ecke stellt die Anzahl der Antworten für die Marke “Brawndo” und das Attribut “Wirtschaftlich” dar.
Tasty | Ästhetisch | Wirtschaftlich | |
Butterbier | 5 | 7 | 2 |
Erwerbe | 18 | 46 | 20 |
Slurm | 19 | 29 | 39 |
Fizzy-Liftgetränk | 12 | 40 | 49 |
Brawndo | 3 | 7 | 16 |
Residuen (R)
In der Korrespondenzanalyse wollen wir uns die Residuen jeder Zelle ansehen. Ein Rest quantifiziert die Differenz zwischen den beobachteten Daten und den Daten, die wir erwarten würden – vorausgesetzt, es gibt keine Beziehung zwischen den Zeilen- und Spaltenkategorien (diese wären in diesem Fall Marke und Attribut). Ein positiver Rest zeigt uns, dass die Anzahl für diese Markenattributpaarung viel höher als erwartet ist, was auf eine starke Beziehung hindeutet. Dementsprechend weist ein negativer Rest einen niedrigeren Wert als erwartet auf, was auf eine schwächere Beziehung hindeutet. Lassen Sie uns diese Residuen berechnen.
Ein Rest (R) ist gleich: R = P – E, wobei P die beobachteten Anteile und E die erwarteten Anteile für jede Zelle ist. Lassen Sie uns diese beobachteten und erwarteten Anteile aufschlüsseln!
Beobachtete Anteile (P)
Ein beobachteter Anteil (P) ist gleich dem Wert in einer Zelle geteilt durch die Gesamtsumme aller Werte in der Tabelle. Für unsere Tabelle mit Ausnahmesituationen wäre die Gesamtsumme also: 5 + 7 + 2 + 18 … + 16 = 312. Das Dividieren der einzelnen Zellenwerte durch die Summe ergibt in der Tabelle unten die beobachteten Proportionen (P).
Beispiel: In der Zelle unten rechts wurde der initiale Zellenwert 16/312 = 0,051 verwendet. Dies zeigt uns den Anteil unseres gesamten Diagramms, den die Paarung von Brawndo und Economic basierend auf unseren gesammelten Daten darstellt.
Tasty | Ästhetisch | Wirtschaftlich | |
Butterbier | 0.016 | 0.022 | 0,006 |
Erwerbe | 0,058 | 0,147 | 0.064 |
Slurm | 0,061 | 0,093 | 0,125 |
Fizzy-Liftgetränk | 0,038 | 0,128 | 0,157 |
Brawndo | 0,01 | 0.022 | 0,051 |
Zeilen- und Spaltenmassen
Etwas, was wir leicht aus unseren beobachteten Proportionen berechnen können und viel später verwendet werden, sind die Summen der Zeilen und Spalten unserer Tabelle der Proportionen, die als Zeilen- und Spaltenmassen bezeichnet werden. Eine Zeilen- oder Spaltenmasse ist der Anteil der Werte für diese Zeile/Spalte. Die Zeilenmasse für “Butterbeer”, die unser Diagramm oben betrachtet, würde 0,016 + 0,022 + 0,006 betragen, was 0,044 ergibt.
Die Ausführung ähnlicher Berechnungen endet mit Folgendem:
Tasty | Ästhetisch | Wirtschaftlich | Zeilen-Massen | |
Butterbier | 0.016 | 0.022 | 0,006 | 0.044 |
Erwerbe | 0,058 | 0,147 | 0.064 | 0.269 |
Slurm | 0,061 | 0,093 | 0,125 | 0.279 |
Fizzy-Liftgetränk | 0,038 | 0,128 | 0,157 | 0.324 |
Brawndo | 0,01 | 0.022 | 0,051 | 0.083 |
Spaltenmassen | 0.182 | 0.413 | 0.404 |
Erwartete Anteile (E)
Erwartete Proportionen (E) wären das, was wir im Verhältnis jeder Zelle erwarten, vorausgesetzt, es gibt keine Beziehung zwischen Zeilen und Spalten. Der erwartete Wert für eine Zelle wäre die Zeilenmasse dieser Zelle multipliziert mit der Spaltenmasse dieser Zelle.
Siehe oben links die Zeilenmasse für Butterbeer multipliziert mit der Spaltenmasse für Tasty, 0,044 * 0,182 = 0,008.
Tasty | Ästhetisch | Wirtschaftlich | |
Butterbier | 0.008 | 0.019 | 0.018 |
Erwerbe | 0.049 | 0.111 | 0.109 |
Slurm | 0,051 | 0.115 | 0.113 |
Fizzy-Liftgetränk | 0.059 | 0.134 | 0.131 |
Brawndo | 0.015 | 0.034 | 0,034 |
Wir können nun unsere Residualtabelle (R) berechnen, wobei R = P – E. Residuale quantifizieren die Differenz zwischen unseren beobachteten Datenanteilen und unseren erwarteten Datenanteilen, wenn angenommen wird, dass es keine Beziehung zwischen den Zeilen und Spalten gibt.
Unter Berücksichtigung unseres negativsten Werts von -0,045 für Squishee und Economic würden wir hier einen negativen Zusammenhang zwischen Squishee und Economic interpretieren; Squishee wird viel weniger als „Economic“ angesehen als unsere anderen Getränkemarken.
Tasty | Ästhetisch | Wirtschaftlich | |
Butterbier | 0,008 | 0.004 | -0.012 |
Erwerbe | 0.009 | 0.036 | -0.045 |
Slurm | 0,01 | -0.022 | 0.012 |
Fizzy-Liftgetränk | -0.021 | -0.006 | 0.026 |
Brawndo | -0.006 | -0.012 | 0.018 |
Indizierte Residuen (I)
Es gibt jedoch einige Probleme mit dem bloßen Lesen von Residuen.
Wenn wir uns die oberste Zeile aus unserer Tabelle zur Berechnung von Residuen oben ansehen, stellen wir fest, dass alle diese Zahlen sehr nahe Null sind. Daraus sollten wir nicht die offensichtliche Schlussfolgerung ziehen, dass Butterbeer in keinem Zusammenhang mit unseren Attributen steht, da diese Annahme falsch ist. Die eigentliche Erklärung wäre, dass die beobachteten Proportionen (P) und die erwarteten Proportionen (E) klein sind, weil, wie uns unsere Zeilenmasse mitteilt, nur 4,4 % der Stichprobe Butterbeer sind.
Dies wirft ein großes Problem bei der Betrachtung von Residuen auf, da wir die tatsächliche Anzahl der Datensätze in den Zeilen und Spalten ignorieren, werden unsere Ergebnisse in Richtung der Zeilen/Spalten mit größeren Massen verzerrt. Wir können dies beheben, indem wir unsere Residuen durch unsere erwarteten Anteile (E) dividieren und uns eine Tabelle unserer indizierten Residuen (I, I = R / E) geben:
Tasty | Ästhetisch | Wirtschaftlich | |
Butterbier | 0,95 | 0,21 | -0,65 |
Erwerbe | 0,17 | 0,32 | -0,41 |
Slurm | 0,2 | -0,19 | 0,11 |
Fizzy-Liftgetränk | -0,35 | -0,04 | 0,2 |
Brawndo | -0,37 | -0,35 | 0,52 |
Indizierte Residuen sind leicht zu interpretieren: Je weiter der Wert aus der Tabelle, desto größer ist der beobachtete Anteil relativ zum erwarteten Anteil.
Wenn man beispielsweise den oberen linken Wert nimmt, wird Butterbeer um 95 % öfter als „Tasty“ angesehen als das, was wir erwarten würden, wenn es keine Beziehung zwischen diesen Marken und Attributen gäbe. Während Butterbeer ganz oben rechts steht, wird Butterbeer mit 65 Prozent seltener als “wirtschaftlich” angesehen als das, was wir erwarten würden – da es keine Beziehung zwischen unseren Marken und Attributen gibt.
Tasty | Ästhetisch | Wirtschaftlich | |
Butterbier | 0,95 | 0,21 | -0,65 |
Erwerbe | 0,17 | 0,32 | -0,41 |
Slurm | 0,2 | -0,19 | 0,11 |
Fizzy-Liftgetränk | -0,35 | -0,04 | 0,2 |
Brawndo | -0,37 | -0,35 | 0,52 |
In Anbetracht unserer indizierten Residuen (I), unserer erwarteten Anteile (E), unserer beobachteten Anteile (P) und unserer Zeilen- und Säulenmassen lassen Sie uns unsere Korrespondenzanalysewerte für unser Diagramm berechnen!
Koordinatenberechnung für Korrespondenzanalyse
Einzelwertaufschlüsselung (SVD)
Der erste Schritt ist die Berechnung der Singular-Value-Zerlegung. Die SVD gibt uns Werte zur Berechnung der Abweichung und zur Darstellung unserer Zeilen und Spalten (Marken und Attribute).
Wir berechnen den SVD auf dem standardisierten Rest (Z), wobei Z = I * sqrt(E), wobei I unser indizierter Rest und E unser erwarteter Anteil ist. Die Multiplikation mit E führt dazu, dass unser SVD so gewichtet wird, dass Zellen mit einem höheren erwarteten Wert eine höhere Gewichtung erhalten und umgekehrt, was bedeutet, dass erwartete Werte häufig mit der Stichprobengröße zusammenhängen, „kleinere“ Zellen in der Tabelle, bei denen der Stichprobenfehler größer gewesen wäre, abwärts gewichtet sind. Somit ist die Korrespondenzanalyse mit einer Eventualtabelle relativ robust gegenüber Ausreißern, die durch Stichprobenfehler verursacht werden.
Zurück zu unserem SVD haben wir: SVD = svd(Z). Eine singuläre Wertzerlegung erzeugt 3 Ausgänge:
Ein Vektor, d, der die singulären Werte enthält.
1. Dimension | 2. Dimension | 3. Dimension |
2.65E-01 | 1.14E-01 | 4.21E-17 |
Eine Matrix, u, die die linken Singularvektoren (Marken) enthält.
1. Dimension | 2. Dimension | 3. Dimension | |
Butterbier | -0.439 | -0.424 | -0.084 |
Erwerbe | -0.652 | 0.355 | -0.626 |
Slurm | 0.16 | -0.0672 | -0.424 |
Fizzy-Liftgetränk | 0.371 | 0.488 | -0.274 |
Brawndo | 0.469 | -0.06 | -0.588 |
Eine Matrix, v, die die richtigen Einzelvektoren (Attribute) enthält.
1. Dimension | 2. Dimension | 3. Dimension | |
Tasty | -0,41 | -0.81 | -0.427 |
Ästhetisch | -0.489 | >0.59 | -0.643 |
Wirtschaftlich | 0.77 | -0.055 | -0.635 |
Die linken Singularvektoren entsprechen den Kategorien in den Zeilen der Tabelle, die rechten Singularvektoren den Spalten. Jeder einzelne Wert für die Berechnung der Varianz und die entsprechenden Vektoren (d.h. Spalten von u und v) für Zeichnungspositionen entsprechen einer Dimension. Die Koordinaten, die zum Zeichnen von Zeilen- und Spaltenkategorien für unser Korrespondenzanalysediagramm verwendet werden, werden aus den ersten beiden Dimensionen abgeleitet.
Abweichung, die durch unsere Dimensionen ausgedrückt wird
Quadrierte singuläre Werte werden als Eigenwerte (d^2) bezeichnet. Die Eigenwerte in unserem Beispiel sind 0,0704, 0.0129 und 0,0000. Wenn wir jeden Eigenwert als Anteil an der Gesamtsumme angeben, wird die in jeder Dimension unserer Korrespondenzanalyse erfasste Varianz basierend auf dem Einzelwert jeder Dimension angegeben. Wir erhalten 84,5 % der Varianz, ausgedrückt durch unsere erste Dimension, und 15,5 % in unserer zweiten Dimension (unsere dritte Dimension erklärt 0 % der Varianz).
Standardkorrespondenzanalyse
Wir sind nun mit den Ressourcen ausgestattet, um die grundlegende Form der Korrespondenzanalyse zu berechnen, unter Verwendung der sogenannten Standardkoordinaten, berechnet aus unseren linken und rechten Singularvektoren. Bisher gewichteten wir die indizierten Residuen vor der Durchführung der SVD. Um Koordinaten zu erhalten, die unsere indizierten Residuen darstellen, müssen wir nun die Ausgaben der SVD ungewichten, indem wir jede Zeile der linken Singularvektoren durch die Quadratwurzel der Zeilenmassen dividieren und jede Spalte der rechten Singularvektoren durch die Quadratwurzel der Spaltenmassen dividieren, wodurch wir die Standardkoordinaten der Zeilen und Spalten für die Plottierung erhalten.
Markenstandardkoordinaten:
1. Dimension | 2. Dimension | 3. Dimension | |
Butterbier | -2.07 | -2 | -0,4 |
Erwerbe | -1.27 | 0.68 | -1.21 |
Slurm | 0,3 | -1.27 | -0,8 |
Fizzy-Liftgetränk | 0,65 | 0.86 | -0.48 |
Brawndo | 1.62 | -0,21 | -2.04 |
Standardkoordinaten des Attributs:
1. Dimension | 2. Dimension | 3. Dimension | |
Tasty | -0.96 | -1.89 | -1 |
Ästhetisch | -0.76 | 0.92 | >-1 |
Wirtschaftlich | 1.21 | -0.09 | -1 |
Wir verwenden die beiden Dimensionen mit der höchsten erfassten Abweichung für die Darstellung, die erste Dimension auf der X-Achse und die zweite Dimension auf der Y-Achse, um unser Standardkorrespondenzanalysediagramm zu generieren.
Wir haben die Grundlage für die Berechnungen geschaffen, die wir für die Standardkorrespondenzanalyse benötigen. Im nächsten Abschnitt werden wir die Vor- und Nachteile verschiedener Arten der Korrespondenzanalyse untersuchen und die am besten für unsere Zwecke geeignet sind, die Analyse der Markenwahrnehmung zu unterstützen.
Korrespondenzanalysearten
Analyse der Haupt-/Spalten-Hauptkorrespondenz
Die Standardkorrespondenzanalyse ist einfach zu berechnen, und es können aussagekräftige Ergebnisse daraus gezogen werden. Die Standardkorrespondenz ist jedoch eine schlechte Wahl für unsere Anforderungen. Die Abstände zwischen Zeilen- und Spaltenkoordinaten sind übertrieben, und es gibt keine einfache Interpretation von Beziehungen zwischen Zeilen- und Spaltenkategorien. Was wir für die Interpretation von Beziehungen zwischen Zeilen- (Marken-)Koordinaten und für die Interpretation von Beziehungen zwischen Zeilen- und Spaltenkategorien wünschen, ist die Zeilen-Principal-Normalisierung (oder, wenn sich unsere Marken auf unseren Spalten befanden, die Spalten-Principal-Normalisierung).
Für die Zeilen-Principal-Normalisierung möchten Sie die oben berechneten Standardkoordinaten für Ihre Spaltenwerte (Attributwerte) verwenden, aber Sie möchten die Hauptkoordinaten für Ihre Zeilenwerte (Markenwerte) berechnen. Die Berechnung der Hauptkoordinaten ist genauso einfach wie das Multiplizieren der Standardkoordinaten mit den entsprechenden Singularwerten (d). Für unsere Zeilen möchten wir also einfach unsere Standardzeilenkoordinaten mit unseren einzelnen Werten (d) multiplizieren, die in der folgenden Tabelle dargestellt sind. Für die Spaltenprinzipalnormalisierung würden wir unsere Spalten anstelle der Zeilen einfach mit unseren singulären Werten (d) multiplizieren.
1. Dimension | 2. Dimension | 3. Dimension | |
Butterbier | -0.55 | -0.23 | 0 |
Erwerbe | -0.33 | 0,08 | 0 |
Slurm | 0,08 | -0.14 | 0 |
Fizzy-Liftgetränk | 0,17 | 0,1 | 0 |
Brawndo | 0.43 | -0.02 | 0 |
Wir ersetzen unsere Hauptkoordinaten für unsere Zeilen (Marken) mit:
Da wir nach unseren Singularwerten skaliert sind, stellen unsere Hauptkoordinaten für unsere Zeilen den Abstand zwischen den Zeilenprofilen unserer ursprünglichen Tabelle dar; wir können die Beziehungen zwischen unseren Zeilenkoordinaten in unserem Korrespondenzanalysediagramm durch ihre Nähe zueinander interpretieren.
Der Abstand zwischen unseren Spaltenkoordinaten, da sie auf Standardkoordinaten basieren, ist noch übertrieben. Auch die Skalierung nach unseren singulären Werten in nur einer der beiden Kategorien (Zeilen/Spalten) hat uns eine Möglichkeit gegeben, Beziehungen zwischen Zeilen- und Spaltenkategorien zu interpretieren. Je ein Zeilenwert und ein Spaltenwert, z.B. Butterbeer (Zeile) und Tasty (Spalte), desto länger ihr Abstand zum Ursprung, desto stärker ist ihre Verknüpfung mit anderen Punkten auf der Karte. Je kleiner der Winkel zwischen den beiden Punkten (Butterbeer und Tasty), desto höher ist die Korrelation zwischen den beiden Punkten.
Der Abstand zum Ursprung in Kombination mit dem Winkel zwischen den beiden Punkten ist das Äquivalent des Punktprodukts; das Punktprodukt zwischen einem Zeilen- und Spaltenwert misst die Stärke der Zuordnung zwischen den beiden. Wenn die erste und zweite Dimension alle Abweichungen in den Daten erklären (zusammen 100 %), ist das Punktprodukt direkt gleich dem indizierten Rest der beiden Kategorien. Hier wäre das Punktprodukt der Abstand zum Ursprung der beiden Punkte multipliziert mit dem Kosinus des Winkels zwischen ihnen; 0,59*2,12*cos(41) = .94. Unter Berücksichtigung von Rundungsfehlern entspricht er unserem indizierten Restwert von 0,95. So stellen Winkel kleiner als 90 Grad einen positiven indizierten Rest und damit eine positive Assoziation dar, und Winkel größer als 90 Grad stellen eine negative indizierte Rest- oder negative Assoziation dar.
Skalierte Zeile Principal-Korrespondenzanalyse
Wenn wir uns unser Diagramm oben für die Zeilen-Principal-Normalisierung ansehen, haben wir eine einfache Beobachtung. Die Punkte für unsere Säulen (Merkmale) sind viel stärker verteilt, und unsere Punkte für unsere Zeilen (Marken) sind um den Ursprung geclustert. Dies kann dazu führen, dass die Analyse unseres Diagramms nach Augen eher schwierig und unintuitiv ist und manchmal nicht möglich ist, die Zeilenkategorien zu lesen, wenn sie alle überlappen. Glücklicherweise gibt es eine einfache Möglichkeit, unseren Graphen zu skalieren, um unsere Spalten einzubinden, während es weiterhin möglich ist, das Punktprodukt (Abstand vom Ursprung und Winkel zwischen Punkten) zu verwenden, um die Beziehungen zwischen unseren Zeilen- und Spaltenpunkten zu analysieren, die als skalierte Zeilen-Principal-Normalisierung bezeichnet werden.
Die skalierte Zeilen-Principal-Normalisierung nimmt die Zeilen-Principal-Normalisierung an und skaliert die Spaltenkoordinaten auf die gleiche Weise wie die X-Achse der Zeilenkoordinaten, d.h. unsere Spaltenkoordinaten werden mit dem ersten Wert unserer Singularwerte (d) skaliert. Unsere Zeilenwerte bleiben dieselben wie die Zeilen-Principal-Normalisierung, aber jetzt werden unsere Spaltenkoordinaten um einen konstanten Faktor nach unten skaliert.
1. Dimension | 2. Dimension | 3. Dimension | |
Tasty | -0,2544 | -0.501 | -0.265 |
Ästhetisch | -0,201 | 0.2438 | -0,265 |
Wirtschaftlich | 0.321 | -0.02 | -0,265 |
Das bedeutet für uns, dass unsere Spaltenkoordinaten viel besser auf unsere Zeilenkoordinaten skaliert werden, was die Trendanalyse wesentlich erleichtert. Da wir alle unsere Spaltenkoordinaten um denselben konstanten Faktor skaliert haben, haben wir den Punktwert unserer Säulenkoordinaten auf der Karte kontrahiert, aber keine Änderung an ihren Relativitäten vorgenommen. Wir verwenden das Punktprodukt weiterhin, um die Stärke der Assoziationen zu messen. Die einzige Änderung besteht darin, dass, wenn unsere erste und zweite Dimension die gesamte Varianz in den Daten abdeckt, anstatt dass das indizierte Restprodukt dem Punktprodukt der beiden Kategorien entspricht, es nun dem skalierten Punktprodukt der beiden Kategorien entspricht, bei dem es sich um das Punktprodukt handelt, das durch einen konstanten Wert unseres ersten Singularwerts (d) skaliert wird. Die Interpretation des Diagramms bleibt wie die Zeilen-Principal-Normalisierung.
Hauptkorrespondenzanalyse
Eine abschließende Form der Korrespondenzanalyse, die wir erwähnen werden, ist die wichtigste Korrespondenzanalyse, auch bekannt als symmetrische Karte, französische Skalierung oder kanonische Korrespondenzanalyse. Anstatt nur die Standardzeilen oder -spalten mit den singulären Werten(d) zu multiplizieren, wie in der Zeile/Spalten-Principal-Korrespondenzanalyse, multiplizieren wir beide mit den singulären Werten. Unsere Standardspaltenwerte, multipliziert mit den einzelnen Werten, werden also wie folgt:
1. Dimension | 2. Dimension | 3. Dimension | |
Tasty | -0,2544 | -0.215 | 0 |
Ästhetisch | -0,201 | 0.105 | 0 |
Wirtschaftlich | 0.321 | -0,01 | 0 |
Wenn wir diese Werte mit unseren in der Zeilen-Prinzipalanalyse berechneten Zeilenwerten zusammenfassen, erhalten wir:
Kanonische Korrespondenzanalyse skaliert sowohl die Zeilen- als auch die Spaltenkoordinaten nach den einzelnen Werten. Das bedeutet, dass wir unsere Beziehungen zwischen unseren Zeilenkoordinaten genauso interpretieren können wie bei der Row-Principal-Korrespondenzanalyse (basierend auf der Nähe). UND wir können unsere Beziehungen zwischen unseren Spaltenkoordinaten ähnlich wie die Spalten-Hauptkorrespondenzanalyse interpretieren. Wir können Beziehungen zwischen Marken und Beziehungen zwischen Attributen analysieren. Außerdem geht das Zeilen-/Spalten-Clustering in der Mitte der Karte aus der Zeilen-/Spaltenprinzipalanalyse verloren. Was wir jedoch aus der kanonischen Korrespondenzanalyse verlieren, ist eine Möglichkeit, Beziehungen zwischen unseren Marken und Attributen zu interpretieren, was in der Markenwahrnehmung sehr nützlich ist.
Side-by-Side-Vergleich
Standardkorrespondenzanalyse
Die einfachste Art der Korrespondenzanalyse, die berechnet wird, indem linke und rechte Singularvektoren von SVD geteilt durch Zeilen- und Spaltenmassen verwendet werden. Die Abstände zwischen Zeilen- und Spaltenkoordinaten sind übertrieben, und es gibt keine einfache Interpretation von Beziehungen zwischen Zeilen- und Spaltenkategorien.
Korrespondenzanalyse Zeilen-Principal-Normalisierung
Verwendet die oben genannten Standardkoordinaten, multipliziert die Zeilenkoordinaten jedoch mit den zu normalisierenden Einzelwerten. Beziehungen zwischen Zeilen (Marken) basieren auf der Entfernung zueinander. Spaltenabstände (Attributabstände) sind noch übertrieben. Beziehungen zwischen Zeilen und Spalten können vom Punktprodukt interpretiert werden. Zeilen (Marken) neigen dazu, in der Mitte zu klumpen.
Skalierte Zeile Principal-Normalisierung Korrespondenzanalyse
Nimmt die Zeilen-Principal-Normalisierung und skaliert die Spaltenkoordinaten um eine Konstante des ersten Singularwerts. Dieselben Interpretationen werden als Zeilen-Principal-Normalisierung gezeichnet, wobei das Punktprodukt durch das skalierte Punktprodukt ersetzt wird. Hilft dabei, das Klumpen von Zeilen in der Mitte zu entfernen. Dies ist der von uns bevorzugte Stil der Korrespondenzanalyse.
Principal-Normalisierungs-Korrespondenzanalyse (symmetrisch, französische Karte, kanonisch)
Eine weitere gängige Form der Korrespondenzanalyse, bei der prinzipiell normalisierte Koordinaten sowohl in den Zeilen als auch in den Spalten verwendet werden. Beziehungen zwischen Zeilen (Marken) können voneinander distanziert werden; dasselbe gilt für Spalten (Attribute). Für Beziehungen zwischen Zeilen und Spalten kann keine Interpretation gezogen werden.
Zusammenfassung
Zusammenfassend wird die Korrespondenzanalyse verwendet, um die relativen Beziehungen zwischen und innerhalb zweier Gruppen zu analysieren. In unserem Fall wären diese Gruppen Marken und Attribute.
Die Korrespondenzanalyse eliminiert durch die Verwendung indizierter Residuen eine Schiefe in den Ergebnissen unterschiedlicher Massen zwischen Gruppen. Für die Markenwahrnehmung für die Korrespondenzanalyse verwenden wir die Normalisierung des Zeilen-Principals (oder Spaltenprinzipals, wenn die Marken in den Spalten platziert sind), da wir so Beziehungen zwischen verschiedenen Marken anhand ihrer Nähe zueinander analysieren können. Außerdem können wir Beziehungen zwischen Marken und Attributen anhand ihres Abstands in Verbindung mit dem Winkel zwischen ihnen und dem Ursprungswinkel (dem doten Produkt) analysieren, um die Beziehungen zwischen den Attributen nicht darzustellen. Wir verwenden die skalierte Zeilen-/Spaltenprinzipalnormalisierung, um die kostenlose Analyse unseres Diagramms zu erleichtern. Wir möchten darauf achten, dass wir die aus den X- und Y-Achsenbeschriftungen (erste und zweite Dimension) erläuterte Abweichung addieren, um die in der Karte erfasste Gesamtabweichung anzuzeigen. Je niedriger diese Zahl ist, desto unerklärlicher ist die Varianz in den Daten und desto irreführender ist das Diagramm.
Als letztes ist zu beachten, dass die Korrespondenzanalyse nur Relativitäten zeigt, da wir den Massenfaktor unserer Daten eliminiert haben; unser Graph wird uns nichts darüber erzählen, welche Marken die “höchsten” Punktzahlen in den Attributen haben. Sobald Sie verstanden haben, wie Sie die Diagramme anlegen und analysieren, ist die Korrespondenzanalyse ein leistungsstarkes Werkzeug, das Markensizing-Effekte ignoriert, um aussagekräftige und leicht zu interpretierende Einblicke in Beziehungen zwischen und innerhalb von Marken und deren anwendbaren Attributen zu ermöglichen.