zum Hauptinhalt springen
Qualtrics Home page

Probieren Sie Qualtrics
kostenlos aus

Kostenloses Konto

Faktorenanalyse

Lesezeit: 13 Minuten
Die Faktorenanalyse wurde Anfang des 20. Jahrhunderts entwickelt und diente damals der Auswertung von Intelligenztests. Seitdem hat sich das Verfahren der multivariaten Statistik enorm weiterentwickelt. Heutzutage werden damit aus einer Menge an Variablen eine reduzierte Anzahl an Faktoren gebildet. Wozu eine Faktorenanalyse angewandt wird und welcher Unterschied zwischen einer explorativen und einer konfirmatorischen Faktorenanalyse besteht, erfahren Sie in diesem Ratgeber.

Was ist eine Faktorenanalyse?

Eine Faktorenanalyse ist eine Methode, um Daten auszuwerten, indem zahlreiche Variablen auf nur wenige relevante Faktoren reduziert werden. Sie gehört zu den struktur-entdeckenden Verfahren und findet vor allem im Rahmen von Positionierungsanalysen Verwendung. Weiterhin kann die Reduktion der Variablenanzahl entweder durch die konfirmatorische oder die explorative Faktorenanalyse vonstattengehen:

  • Die konfirmatorische Faktorenanalyse ist hypothesengeleitet – sie prüft, ob vorher theoretisch festgelegte Modelle zu der Faktorenverteilung tatsächlich so eingesetzt werden können.
  • Die explorative Faktorenanalyse geht hingegen explorativ und mathematisch vor. Es wird demnach untersucht, wie gut jede einzelne Variable zu den verschiedenen Faktoren passt, bevor diese zugeteilt werden.

Welchen Vorteil hat eine Faktorenanalyse?

Durch die Faktorenanalyse lassen sich mehrere Variablen zu aussagekräftigen Faktoren zusammenfassen, wie beispielsweise „Qualität“ oder „Nutzen“.
So wird die Datengrundlage sehr viel übersichtlicher und strukturierter – da klar ist, wie die einzelnen Variablen zusammenhängen und welche davon unabhängig voneinander zur Fragestellung beitragen.
Außerdem lassen sich mithilfe der Faktorenanalyse Antworten-Cluster bei Marktstudien aufdecken. Anstatt eine Vielzahl von ähnlichen Variablen auszuwerten, können sich Marketer auf die wichtigsten Themen konzentrieren – und den analytischen Nutzen somit vergrößern.

Unterschied konfirmatorische und explorative Faktorenanalyse

Bei der konfirmatorischen Faktorenanalyse gibt es bereits ein konkretes Modell der möglichen Faktoren. Die Analyse dient hier der Validierung der vorgegebenen Faktorenstruktur. Es soll beantwortet werden, ob das Modell mit den vorhandenen Daten konsistent ist. Zu diesem Zweck folgt die konfirmatorische Faktorenanalyse folgenden Schritten:

  1. Modellspezifikation
  2. Parameterschätzung
  3. Modellbeurteilung
  4. ggf. Modellmodifikation

Bei der explorativen Faktorenanalyse geht es darum, die Zusammenhänge sowie die vorab unbekannten Strukturen zwischen den Variablen aufzudecken. Die Anzahl der zu extrahierenden Faktoren sowie deren inhaltliche Bedeutung ist vor der Analyse unbekannt. Die explorative Faktorenanalyse hat die Komplexitätsreduktion zum Ziel.
Im weiteren Verlauf wird es um die explorative Faktorenanalyse gehen.

Zielkonflikt der Faktorenanalyse

Der Zielkonflikt der Faktorenanalyse besteht darin zu wählen, ob eine hohe oder eine geringe Faktorenanzahl zielführender ist.

Hohe Faktorenanzahl Geringe Faktorenanzahl
  • Geringe Reduktion der Variablen
  • Umfassende Reduktion der Variablen
  • Dadurch geringerer Analysenutzen
  • Dadurch hoher Analysenutzen
  • Allerdings auch: geringer Informationsverlust
  • Allerdings auch: hoher Informationsverlust

Da beide Vorgehensweisen Vor- und Nachteile mit sich bringen, muss für jede Fragestellung einzeln entschieden werden, welches Verfahren sich besser eignet.

Vorgehen bei einer Faktorenanalyse

Die Durchführung einer explorativen Faktorenanalyse beinhaltet mehrere Schritte. Dabei geht es nicht nur darum zu bestimmen, welche Faktorenanzahl angemessen ist, sondern auch, welche Variablen angewendet werden sollen.

Auswahl der Variablen und Erstellung der Korrelationsmatrix

Zunächst gilt es die einzelnen Variablen auszuwählen. Dafür sollte vorab eine Korrelationsmatrix für alle zu berücksichtigten Variablen erstellt werden. Hier kann es drei verschiedene Interpretationsmöglichkeiten geben:

  1. Variable A beeinflusst Variable B
  2. Variable B beeinflusst Variable A
  3. Der Faktor C (gemeinsame Hintergrundvariable) beeinflusst Variable A und B

Da bei der Faktorenanalyse immer mit Möglichkeit 3 gearbeitet wird, bedeutet dies im Umkehrschluss: Eine Faktorenanalyse ist nur dann möglich, wenn die dritte Option sachlogisch ist.
Die Korrelationsmatrix zeigt zudem auf, welche Variablen für die Faktorenanalyse berücksichtigt werden sollten – jene, die kaum Berührungspunkte zu den anderen haben, können ausgeschlossen werden.

Faktorenextraktion: Grundannahmen

Nun müssen die vorhandenen Variablen auf Hintergrundvariablen aufgeteilt, also die Faktoren extrahiert werden. Dabei gelten die folgenden Bedingungen:

  • Jeder Wert einer Ausgangsvariablen lässt sich als Linearkombination hypothetischer Faktoren beschreiben.
  • Der Begriff „Faktorladung“ bezieht sich auf die Stärke des Zusammenhangs zwischen dem Faktor und der Variablen.
  • Der Zusammenhang zwischen den Variablen ist mathematisch formulierbar:
    Zusammenhang zwischen Variablen

    • Die mathematische Formel mit den standardisierten Werten sieht dann wie folgt aus: Formel standardisierte Werte
    • Also vereinfacht: Z=P+A‘
    • Daraus wird das Fundamentaltheorem von Thurstone hergeleitet: R=A*C*A‘
    • R ist die Korrelationsmatrix; A ist die Faktorladung; C ist die Korrelation zwischen den Faktoren.
  • Sind die Faktoren voneinander unabhängig und ist eine Linearverknüpfung vorhanden, dann gilt das gekürzte Fundamentaltheorem: R=A*A‘

Nun lässt sich die Faktorenextraktion grafisch in einem Vektor-Diagramm darstellen.

Faktorenextraktion: Kommunalitäten definieren

Je weniger Faktoren extrahiert werden, desto mehr Informationen gehen verloren. Diese als Varianz bezeichnete Abweichung lässt sich auch auf Ebene einzelner Variablen berechnen. Der Wert, der dabei herauskommt, wird Kommunalität genannt – er gibt an, wieviel der Varianz einer Variablen durch die Faktoren erklärt werden kann. Die Kommunalität wird als Unbekannten-Komponente U der obigen Formel hinzugefügt. Um diesen Schätzwert zu bestimmen gibt es zwei Optionen:

  • Es wird angenommen, dass die Faktoren die gesamte Varianz erklären können. Daher ist die Summe der Kommunalitäten immer 1.
  • Ein Schätzwert wird aufgrund von Überlegungen vorgegeben. Dies ist meist der höchste quadrierte Korrelationseffizient der Korrelationsmatrix R.

Durchführung der Faktorenextraktion: Methoden

Zur Durchführung einer Faktorenextraktion bestehen zwei Möglichkeiten, eine Hauptachsen- oder eine Hauptkomponentenanalyse:

  • Hauptachsenanalyse: Hier gilt die Annahme, dass die Varianz einer Ausgangsvariablen immer auf Einzelrestvarianz und Kommunalitäten aufgeteilt ist. Die Höhe der Kommunalitäten muss daher geschätzt werden. Dabei sollen die Faktoren die Varianzen der Variablen in der Höhe der Kommunalitäten erklären.
  • Hauptkomponentenanalyse: Es wird angenommen, dass die Varianz einer Ausgangsvariablen komplett durch die Faktorenextraktion erklärt werden kann. Das Ziel ist, mit möglichst wenigen Faktoren die Datenstruktur möglichst umfassend zu reproduzieren. Daher gibt es hier keine Unterscheidung zwischen Kommunalitäten und Einzelrestvarianzen.

Festlegen der Faktorenanzahl

Es gibt weder die richtige Anzahl an Faktoren noch allgemeingültige Richtlinien zu ihrer Bestimmung. Um die Entscheidung zu vereinfachen, helfen allerdings verschiedene Kriterien:

  • Es wird so lange extrahiert, bis eine festgelegte Prozentzahl der Varianz erklärt ist. Varianz bezeichnet in diesem Fall die Standardabweichung.
  • Kaiser-Kriterium: Alle Faktoren, die einen Eigenwert von über eins haben, werden extrahiert. Eigenwert bedeutet die Summe aller quadrierten Faktorladungen eines Faktors über alle Variablen.
  • Scree-Test oder auch Ellenbogenkriterium: Die Eigenwerte der Faktoren werden im Screeplot (Eigenwertdiagramm) abnehmend eingeordnet.
  • Vorab wird inhaltlich eine bestimmte Anzahl an Faktoren festgelegt.
  • Die Zahl der Faktoren soll geringer sein als die Hälfte der Variablen.
  • Alle Faktoren, die interpretiert werden können, werden extrahiert.

Interpretation der Faktorenanalyse

Da die Faktoren, die im vorangegangenen Schritt extrahiert wurden, nur schwer auszuwerten sind, werden sie nun transformiert. Dies wird als Rotation bezeichnet.

Zunächst erfolgt allerdings eine Analyse der (unrotierten) Faktorladungen. Dabei muss der Analysierende eine umfassende Kenntnis der inhaltlichen Thematik haben. Wurde vorher eine Hauptachsenanalyse vorgenommen, erfolgt die Interpretation nun kausal. Ist stattdessen eine Hauptkomponentenanalyse durchgeführt worden, ist das nicht möglich und auch nicht nötig. Denn in diesem Fall gibt es keine Faktorenrotation.

Faktorrotation zur einfacheren Analyse der Faktoren

Vor der Rotation können die den Faktoren zugewiesenen Variablen unterschiedlich stark mit ihnen korrelieren – sie haben also verschiedene Faktorladungen. Dies macht die Interpretation schwieriger, da die Gewichtung eines Faktors nicht vollends geklärt ist. Aus diesem Grund werden die Faktorladungen rotiert, wie in dieser Grafik ersichtlich wird:

rotierte Faktorladung

Dabei werden die Koordinationsachsen des Diagramms in ihrem Ursprung rotiert, sodass sich die Faktorladungen sinnvoller auf die Faktoren aufteilen. Denn sowohl die Faktorenladungen als auch die Eigenwerte verändern sich, während die Kommunalitäten gleich bleiben.
Zur Auswahl stehen zwei verschiedene Rotationsverfahren:

  • Orthogonale (rechtwinklige) Rotation: Hier besteht die Annahme, dass Faktoren untereinander nicht korrelieren. Aus diesem Grund stehen ihre Vektoren immer senkrecht zueinander. Unterdessen bleiben die Faktorenachsen während der Rotation einander stets im rechten Winkel ausgerichtet.
  • Oblique (schiefwinklige) Rotation: Bei dieser Rotation wird dagegen angenommen, dass die Faktoren untereinander korrelieren. Daher können sich die Winkel zwischen den Faktoren während des Rotationsvorganges verschieben. Der Vorteil ist, dass die Faktorladungen sehr viel genauer auf die Faktoren aufgeteilt werden. Gleichzeitig widerspricht dieses Modell einer der Grundannahmen der Faktorenanalyse: Die Faktoren sind hier nicht mehr unabhängig voneinander.

Faktorenwerte interpretieren

Als letzter Schritt der Faktorenanalyse erfolgt nun die Interpretation der Faktorenwerte. Diese können sowohl positiv oder negativ ausfallen oder nahe der Null liegen. Die Faktorenwerte können folgendermaßen interpretiert werden:

  • Positive Werte: Das Objekt ist hinsichtlich des betrachteten Faktors sowie im Vergleich zu anderen Objekten überdurchschnittlich ausgeprägt.
  • Negative Werte: Das Objekt ist hinsichtlich des betrachteten Faktors sowie im Vergleich zu anderen Objekten unterdurchschnittlich ausgeprägt.
  • Faktorwert liegt nahe Null: Das Objekt ist hinsichtlich des betrachteten Faktors sowie im Vergleich zu anderen Objekten durchschnittlich ausgeprägt.

Mehr über Qualtrics

Demo anfordern

Faktorenanalyse: Beispiel

In diesem Beispiel einer Faktorenanalyse möchte ein Hersteller von Eistee seine Produkte im Wettbewerbsumfeld ideal positionieren. Daher sollen Veränderungen am Produkt über einen längeren Zeitraum beobachtet und deren Auswirkungen auf die Zielgruppen gemessen werden.

Um das Messinstrument optimal zu entwickeln, definiert das Unternehmen im ersten Schritt Variablen, um eine qualitative Studie durchführen zu können. Zunächst soll getestet werden, ob diese Variablen hinsichtlich des Untersuchungsziels valide sind.
In diesem Rahmen sollen folgende Fragestellungen beantwortet werden:

  • Ist es möglich, auf Basis der Variablen wesentliche Bewertungsdimensionen abzuleiten, die eine komprimierte Ergebnisdarstellung zulassen?
  • Können die Variablen ausreichend präzise definiert werden, um den jeweiligen Dimensionen eindeutig zugeordnet werden zu können?
  • Gibt es in der Liste redundante Merkmale, deren Streichung den Aufwand der Studie erheblich verringern würde?
  • Sind die Merkmale inhaltlich valide? Liefern sie die gesuchte Information?

Variablen, die untersucht werden

Innerhalb der beispielhaften Faktorenanalyse werden folgende Variablen untersucht:

V01 Schmeckt nach Tee
V02 Angenehmer Geschmack
V03 Intensiver Geschmack
V04 Bitter
V05 Süß
V06 Konzentrationsfördernd
V07 Übler Geruch
V08 Gut verträglich
V09 Erfrischend
V10 Durstlöschend
V11 Mild
V12 Verdauungsfördernd
V13 Allergikerfreundlich
V14 Unbekömmlich
V15 Anregend
V16 Künstlicher Geschmack

Die nachfolgende Bewertung erfolgt auf einer Skala mit sieben Stufen. Dabei trifft 1 überhaupt nicht zu und 7 trifft voll und ganz zu.

Beispiel einer Hauptkomponentenanalyse

Mithilfe der Hauptkomponentenanalyse werden die Merkmale Schritt für Schritt extrahiert. Zusätzlich nehmen sie einen maximalen Teil der Varianz auf.
In dieser Abbildung sind die Eigenwerte der Hauptkomponenten ersichtlich, dies entspricht bei der Hauptkomponentenanalyse der Varianz. Die Varianz nimmt von Komponente 1 bis zu Nummer 16 immer weiter ab. Insgesamt ergibt die kumulierte Summe der Eigenwerte 100 Prozent.

Komponente Gesamt % der Varianz Kumulierte %
1 6,462 40,386 40,386
2 2,773 17,330 57,716
3 1,525 9,530 67,246
4 0,869 5,432 72,678
5 0,713 4,454 77,132
6 0,643 4,018 81,150
7 0,496 3,101 84,251
8 0,475 2,968 87,219
9 0,415 2,591 89,810
10 0,364 2,275 92,085
11 0,319 1,992 94,077
12 0,256 1,601 95,678
13 0,217 1,357 97,035
14 0,184 1,148 98,183
15 0,165 1,029 99,212
16 0,126 0,788 100,000

Beispiel für das Festlegen der Faktorenanzahl

Für das Festlegen der Faktorenanzahl wird in diesem Beispiel der Scree-Test herangezogen:

Eigenwertstabelle

Bei dieser als Ellbogendiagramm bezeichneten Grafik zeigt die „Beuge“ an, welche Anzahl von Faktoren am besten geeignet ist. Da die Beuge in diesem Fall auf der senkrechten Achse etwa bei 3 beginnt, sollten hier drei Dimensionen extrahiert werden.

Interpretation der Beispiel-Faktorenanalyse

Innerhalb der Faktoranalyse werden die Variablen in drei Dimensionen / Faktoren eingeteilt. Unter Berücksichtigung der Korrelationsmatrix ergibt sich nach der Faktorenanalyse folgende Interpretation:

Faktor 1 Faktor 2 Faktor 3
V01 Schmeckt nach Tee V08 Gut verträglich V04 Bitter
V02: Angenehmer Geschmack V11 Mild V07 Übler Geruch
V03 Intensiver Geschmack V12 Verdauungsfördernd V14 Unbekömmlich
V10 Durstlöschend V13 Allergikerfreundlich V16 Künstlicher Geschmack
V05 Süß
V06 Konzentrationsfördernd
V09 Erfrischend
V15 Anregend
  • Faktor 1 enthält Variablen, die sich auf den Geschmack und die Wirkung beziehen. Hier korrespondieren also gleich zwei Dimensionen von Variablen.
  • Faktor 2 beinhaltet Variablen, die sich auf die Verträglichkeit des Produkts beziehen.
  • Faktor 3 fasst Merkmale zusammen, die störend wirken, also als Störreize bezeichnet werden können.

Wann sich eine Faktoranalyse eignet

Eine große Herausforderung der Statistik ist das Erfassen von latenten Variablen. Diese sind im Gegensatz zu manifesten Variablen nicht direkt messbar. Daher werden Verfahren benötigt, um mit diesen Variablen arbeiten zu können. Die Faktorenanalyse ist eines davon. Sie unterstützt nicht nur dabei, diese latenten Variablen herauszufiltern, sondern ihren Informationsgehalt möglichst relevant auf einzelne Faktoren aufzuteilen.

So können beispielsweise Umfragen, Marktforschungen und Fragebögen viel unkomplizierter ausgewertet werden.

Bereit anzufangen? Fordern Sie jetzt Ihre Demoversion an!