Was ist ein Strukturgleichungsmodell?
Ein Strukturgleichungsmodell (englisch: Structural Equation Model = SEM) beinhaltet ein System von Beziehungen zwischen beobachtbaren Variablen (Indikatoren oder manifeste Variablen) und nicht-beobachtbaren Variablen (Konstrukte, latente Variablen oder Faktoren). Nach dem ersten Programm das fĂŒr normale Anwender handhabbar war, werden diese manchmal auch als LISREL-Modelle bezeichnet. Weitere Programme, mit denen die Parameter eines SEMs geschĂ€tzt werden können, sind MPlus, Amos, EQS, Stata und R.
Ăbersicht
SEMs verbinden zwei wichtige Analyseverfahren: die Faktorenanalyse, mit der latente Variablen untersucht werden, und die Pfadanalyse, die Systeme mit mehreren abhĂ€ngigen Variablen abbilden kann. Das macht sie fĂŒr Sozialwissenschaftler attraktiv, denn unsere Theorien bestehen oft aus einem ganzen Netz von Annahmen ĂŒber die ZusammenhĂ€nge zwischen Variablen, von denen viele nicht direkt beobachtbar sind. Ein Beispiel ist der vermutete Zusammenhang zwischen Deprivationserfahrungen, Fremdenfeindlichkeit und der Wahl rechter Parteien. Die Strukturgleichungsmodellierung hat sich deshalb in den letzten Jahren zu einem Standardverfahren der Empirischen Sozialforschung entwickelt.
Die wichtigsten Annahmen, Grundbegriffe und Anwendungsmöglichkeiten zum Thema erklÀre ich in meiner Vorlesung:
Was kann ich mit einem Strukturgleichungsmodell tun?
In der Politischen Soziologie, der Sozialpsychologie und der Politikwissenschaft sind SEMs oft das Mittel der Wahl, weil mit ihrer Hilfe komplexe ZusammenhĂ€nge zwischen beobachteten und nicht beobachteten Variablen analysiert werden können. Ein Beispiel dafĂŒr ist der Aufsatz “Christian Religiosity and Voting for West European Radical Right Parties” (Arzheimer/Carter 2009) (“Christian Religiosity & the Radical Right” hier auch als frei zugĂ€nglicher pre-print).  In diesem Beitrag prĂŒfen wir drei Hypothesen:
- Vor allem in der US-amerikanischen Forschung zeigt sich seit Jahrzehnten, dass sehr fromme Menschen gegenĂŒber AndersglĂ€ubigen und ethnischen Minderheiten sehr negative Einstellungen entwickeln.
- Zugleich propagiert das Christentum Toleranz, MitgefĂŒhl und NĂ€chstenliebe. Deshalb wĂ€re zu erwarten, dass glĂ€ubige Christen benachteiligten Minderheiten positiv gegenĂŒber stehen.
- Vor allem im europĂ€ischen Kontext ist auĂerdem zu erwarten, dass ĂŒberzeugte Christen eine Parteibindung zu einer konservativen oder christdemokratischen Partei entwickeln und deshalb fĂŒr die Radikale Rechte nicht verfĂŒgbar sind.
Alle drei Hypothesen können wir mit einem (komplexen) Modell testen. Die latente Variable “christliche ReligiositĂ€t” messen wir mit vier Indikatoren; die latente Variable “radikale rechte Einstellungen” sogar mit mehr als zehn Indikatoren. Wir gehen zudem davon aus, dass eine Korrelation zwischen Parteibindung und rechten Einstellungen besteht, dass alle Einstellungsvariablen in einem Zusammenhang mit soziodemographischen Merkmalen wie Alter, Geschlecht und Bildung stehen, und dass sowohl die Einstellungs- als auch die soziodemographischen Variablen einen Effekt auf das Wahlverhalten haben. Das Ergebnis sieht so aus:
Eine Besonderheit unseres Modells besteht darin, dass sowohl die manifeste abhÀngige Variable (Wahl einer radikalen Rechtspartei) als auch eine der latenten Variablen (Identifikation mit einer christdemokratischen oder konservativen Partei) dichotom sind, also nur die Werte 0 oder 1 annehmen können. Moderne Programme können auch mit nicht-kontinuierlichen Variablen umgehen.
Kann ich mit einem SEM KausalitĂ€t prĂŒfen?
In der Literatur werden Strukturgleichungsmodelle manchmal auch als Kausalmodelle bezeichnet. Deshalb gehen viele Anwender davon aus, dass man mit dieser Methode das Vorliegen von Ursache-Wirkungs-ZusammenhĂ€ngen testen kann. Leider stimmt dies so nicht. Die Bezeichnung “Kausalmodell” erklĂ€rt sich einfach daraus, dass im SEM solche Annahmen explizit ausformuliert werden. In welche Richtung die KausalitĂ€t wirkt, lĂ€sst sich mit einem Strukturgleichungsmodell aber per se genauso wenig entscheiden wie mit einem normalen Regressionsmodell.  Entscheidend ist hier vielmehr das Forschungsdesign, mit dem die Daten erhoben wurden:
Manchmal lassen sich aber auf Grund logischer Ăberlegungen zumindest Gruppen von Variablen bilden, die in einer eindeutigen kausalen Reihenfolge stehen mĂŒssen. Im Beispiel sieht das so aus:
Lehrbuch Strukturgleichungsmodelle
Wer mehr zum Thema erfahren möchte, kommt aber um die LektĂŒre eines Lehrbuches nicht herum. FĂŒr den englischsprachigen Markt existiert seit langem eine ganze Reihe hervorragender Lehrwerke, und mit dem Buch von Jost Reinecke ist vor einigen Jahren eine gute deutschsprachige ErgĂ€nzung zu diesen hinzugekommen. Bislang fehlt es aber an einer anwendungsorientierten EinfĂŒhrung fĂŒr Politikwissenschaftlerinnen und Politikwissenschaftler. Ziel meines Lehrbuches (das natĂŒrlich auch fĂŒr andere Sozialwissenschaftlerinnen und Sozialwissenschaftler geeignet ist) ist es, diese LĂŒcke zu schlieĂen.
Vorgestellt werden grundlegende Modelle zur Messung politikwissenschaftlicher Konstrukte (z.B. Fremdenfeindlichkeit und political efficacy), zur SchÀtzung von Messfehlern und zur Modellierung von Beziehungen zwischen latenten Variablen. Als fortgeschrittene Themen werden u.a. latente Wachstumsmodelle und fehlende Werte (missing values) behandelt. Der Schwerpunkt liegt dabei auf der Illustration durch politikwissenschaftliche Beispiele, die durch Hinweise zur Umsetzung der Verfahren in Standardprogrammen (LISREL, Stata, MPlus) ergÀnzt werden. Als Leseprobe können das Inhaltsverzeichnis, die Einleitung und das Glossar heruntergeladen werden. Weitere Leseproben gibt es bei Google Books und beim Verlag.
Der Inhalt im einzelnen:
SEMs: Beispiele
Im Mittelpunkt des Buches stehen die wichtigsten politikwissenschaftlichen und sozialwissenschaftlichen AnwendungsfĂ€lle. Dazu gehört vor allem die konfirmatorische Faktorenanalyse (SchĂ€tzung eines Modells zur Messung latenter Variablen), die am Beispiel der Einstellungen zu Migranten vorgestellt wird. Zu den wichtigsten Komplikationen der konfirmatorischen Faktorenanalyse zĂ€hlen der Gruppenvergleich und die vorgelagerte Frage nach der Ăquivalenz von Messungen ĂŒber kulturelle, Sprach- und LĂ€ndergrenzen hinweg. An Beispielen aus der Praxis zeigt das Buch, wie diese Fragen mit den gĂ€ngigen Programmen untersucht werden können. Ebenfalls ausfĂŒhrlich vorgestellt wird der Umgang mit kategorialen Variablen, die in politikwissenschaftlichen AnwendungsfĂ€llen eher die Regel als die Ausnahme darstellen. Zuletzt schlieĂlich werden latente Wachstumsmodelle prĂ€sentiert, die die VerĂ€nderung einer latenten Variablen ĂŒber die Zeit beschreiben. Den vollstĂ€ndigen Quellcode und die DatensĂ€tze fĂŒr alle Beispiele aus dem Buch (Daten und Code fĂŒr Stata, LISREL, MPlus) gibt es hier zum Download.
Der Inhalt im Ăberblick:
Einleitung
Das Einleitungskapitel stellt die GrundzĂŒge der beiden Verfahren vor, auf denen das Modell basiert: die Pfadanalyse und die Faktoranalyse. Es gibt auĂerdem einen Ăberblick ĂŒber den Aufbau des Buches, die einschlĂ€gige Software und die wichtigsten Internetquellen.
Grundlagen
Das zweite Kapitel ist den Grundlagen des Verfahrens gewidmet und ist vor allem zum spĂ€teren Nachschlagen gedacht. Zu diesen Grundlagen gehören zum einen eine knappe EinfĂŒhrung in die Matrixalgebra, zum anderen ein zweiter Blick auf die Bausteine des Modells: Korrelationsrechnung, Regressionsrechnung, Faktorenanalyse und die GrundzĂŒge der klassischen Testtheorie. Im Anschluss daran werden das allgemeine Strukturgleichungsmodell vorgestellt und wichtige Grundfragen der Modellierung (u.a. SchĂ€tzverfahren und Identifikation von Modellen) erörtert.
Beispiele und Anwendungen
FĂŒr Politikwissenschaftler ist der wichtigste Anwendungsfall die SchĂ€tzung konfirmatorischer Faktorenanalyse. In diesem Kapitel wird an vielen ausfĂŒhrlich kommentierten Beispielen und mit realen Daten (European Social Survey, ALLBUS) gezeigt, wie sich solche Modelle mit Hilfe der gĂ€ngigen Programme schĂ€tzen lassen.
Fortgeschrittene Themen und Ausblick
Zu den fortgeschrittenen Themen, die fĂŒr Politikwissenschaftler relevant sind, gehört vor allem der Umgang mit kategorialen Variablen, der wiederum mit einem Beispiel aus der politikwissenschaftlichen Einstellungsforschung illustriert wird. Relativ neu fĂŒr die Politikwissenschaft sind die latenten Wachstumsmodelle, die die VerĂ€nderung einer Variablen ĂŒber die Zeit beschreiben. Eine solche Variable ist das Interesse am Wahlkampf, das im Lauf der Kampagne mehr oder minder stark zunimmt. Weitere fortgeschrittene Themen, die in diesem Kapitel in knapperer Form vorgestellt werden, sind missing data, kategoriale latente Variablen und Mehr-Ebenen-Strukturgleichungsmodelle.