Aufgabenstellung für die Korrespondenzanalyse

Die Korrespondenzanalyse dient dazu, die Beziehungen zwischen zwei kategorialen Variablen zu veranschaulichen. Solche Variablen können Objekte wie Personengruppen oder bewertete Produkte auf der einen Seite und Beschreibungen dieser Objekte wie Statements oder Prozentangaben auf der anderen Seite sein.

Das Verfahren versucht, die Distanzen, die zwischen den Kategorien einer Variablen hinsichtlich der Beschreibung durch die jeweils andere Variable bestehen, in einer reduzierten Lösung so weit wie möglich beizubehalten.

Da man im Allgemeinen eine Reduzierung in einen zweidimensionalen Raum anstrebt, nämlich eine Darstellung in einer Ebene, wird damit hinsichtlich jeder Variablen eine Reduzierung von der ursprünglichen Kategorienzahl auf zwei Dimensionen erreicht.

Bei der Reduzierung der Dimensionen gibt es verschiedene Möglichkeiten der Normierung. Der Focus kann auf der Darstellung der Zeilen- oder Spaltenvariablen liegen. Man kann also beeinflussen, ob Objekte oder Merkmale genauer dargestellt werden oder ob die Normierung symmetrisch sein soll.

Das Ergebnis einer Korrespondenzanalyse ist eine Abbildung, in der Objekte und deren Beschreibungen gemeinsam als Punkte auf einer Ebene dargestellt sind. Die Distanzen zwischen den Objekten geben deren Unähnlichkeit wieder, gleiches gilt für die Distanzen zwischen den Merkmalen.

Dagegen sind die Distanzen zwischen Objekten und Merkmalen nicht interpretierbar. Indem man jedoch die Merkmale als Richtungen (Koordinatenachsen) interpretiert, lässt sich ablesen, wie stark Objekte darin ausgeprägt sind.

Zu sehen ist das Beispiel einer Korrespondenzanalyse mit Positionierung der Abteilungen einer Kaufhauskette. Eingeteilt ist die Darstellung in verschiedene Kästchen.

Beispiel einer Korrespondenzanalyse – Positionierung der Abteilungen einer Kaufhauskette

Voraussetzungen

Grundlage für eine Korrespondenzanalyse liefert eine sogenannte Kontingenztafel, also eine Tabelle, die die Beziehung zwischen den beiden Variablen (z.B. Objekten und Merkmalen) wiedergibt. Rein rechnerisch sind somit auch Informationen auf einer sehr geringen Fallbasis darstellbar. Für die statistische Sicherheit der Ergebnisse gelten aber die gleichen Bedingungen wie in der beschreibenden Statistik allgemein. Ergebnisse, die auf weniger als 30 Fällen beruhen, sollten daher im Allgemeinen nicht dargestellt werden. Je nach Rahmenbedingungen (Größe der Grundgesamtheit, Involviertheit der Befragten, Komplexität der Befragung) können auch höhere Fallzahlen notwendig sein.

Wichtig ist, die Darstellung richtig zu lesen. Die größte Gefahr besteht darin, die Distanzen zwischen Objekt- und Merkmalspunkten zu interpretieren und somit Fehlschlüsse daraus abzuleiten.