Ein Märchen aus tausend und einer Nacht? Kommentar zu dem Artikel von Frederike Wuermelings “Paßt die Türkei zur EU und die EU zu Europa?”

 

I. Einleitung

Frederike Wuermelings in Heft 2/2007 dieser Zeitschrift erschienener Beitrag über die Verankerung der EU-Grundprinzipien Religionsfreiheit, Demokratie, Gleichberechtigung und Rechtsstaatlichkeit in der türkischen Bevölkerung (Wuermeling 2007) wird ohne Zweifel die bislang recht verhaltene wissenschaftliche Debatte über einen möglichen Beitritt der Türkei zu Europäischen Union beleben. Eher ungewöhnlich ist allerdings die Resonanz, die der Beitrag bereits jetzt außerhalb der Fachöffentlichkeit gefunden hat. Noch bevor das Heft an die Abonnenten ausgeliefert wurde, wurde die Kernaussage des Papiers — die Türkei als islamisch geprägter Staat sei derzeit noch nicht reif für einen EU-Beitritt — von Massenmedien wie dem Kölner Stadtanzeiger, der österreichischen „Presse“, dem „Neuen Volksblatt“ und sogar der Deutschen Welle aufgegriffen und verbreitet. In einer zweiten Rezeptionswelle erreichten — wiederum vor Erscheinen des Heftes — die eingängigsten Thesen aus der Berichterstattung von Stadtanzeiger und „Presse“ sowie aus der von der Universität Köln herausgegebenen Pressemitteilung die einschlägigen Diskussionsforen und „blogs“ im Internet.1 Was man dort schon immer zu wissen glaubte — „je höher der Anteil an Muslimen, desto geringer das Akzeptanzniveau“ demokratischer Werte — wird nun quasi mit dem Gütesiegel der Kölner Soziologie verbreitet.

Bedenklich ist dies deshalb, weil Würmelings Artikel einerseits substantiell wenig Neues enthält — die von ihr verwendeten Daten wurden 1999-2001 erhoben (siehe Abschnitt II.3.) und bereits mehrfach unter genau diesem Aspekt ausgewertet (Gerhards 20042007) — und andererseits in den Teilen, in denen er von Jürgen Gerhards Beiträgen abweicht, erheblich theoretische und methodische Mängel aufweist, die im nächsten Abschnitt skizziert werden.

 

II. Probleme

 

1. Theoretische Basis und Hypothesen

Der Titel von Frederike Wuermelings Studie — „Paßt die Türkei zur EU und die EU zu Europa“ — ist aus mehreren Gründen irreführend. Denn erstens wird der zweite Teil der im Titel aufgeworfenen Frage im Text nur am Rande angesprochen. Zweitens läßt sich die Doppelfrage nicht im eigentlichen Sinne beantworten, da es keinen Maßstab dafür gibt, wieviel Zustimmung auf den von Wuermeling konstruierten Skalen gegeben sein muß, damit von einer Passung gesprochen werden kann. Drittens schließlich steht ein Vergleich der Ländermittelwerte untereinander oder mit einem externen Maßstab gar nicht im Zentrum des Artikels.

Von den bislang vorliegenden Analysen der Daten aus der European Values Study (EVS) unterscheidet sich der Beitrag von Wuermeling vielmehr vor allem dadurch, daß die Autorin ein Mehr-Ebenen-Modell spezifiziert, mit dessen Hilfe siehe eine Reihe von Hypothesen über das Zustandekommen dieser Länderunterschiede überprüfen will. Diese Hypothesen wiederum gewinnt Wuermeling aus zwei sehr weitgefaßten Erklärungsansätzen. Unter dem Rubrum „Kultureller Kontext“ diskutiert Wuermeling unter Rückgriff auf Weber (2006, zuerst 1904/05) und Huntington (1996) die Frage, ob die EU-Prinzipien in der Türkei deshalb abgelehnt werden, weil es sich um ein islamisch geprägtes Land handele (Wuermeling 2007: 189-193). Diese Überlegungen münden in der Hypothese „je größer der Anteil der Muslime in einem Land, desto geringer ist das Akzeptanzniveau der EU- Grundprinzipien“ (Wuermeling 2007: 192). Eine zweite Gruppe von Überlegungen, die in einem losen Zusammenhang mit Inglehart (1997) und Bell (1973) stehen, faßt Wuermeling unter der Überschrift „Modernisierungsgrad“ zusammen. Hier lautet die Kernhypothese „Je höher der ökonomische Modernisierungsgrad eines Landes, desto höher das Akzeptanzniveau der EU-Grundprinzipien“ (Wuermeling 2007: 194).

Wuermelings theoretische Einlassungen werden jedoch ihren Gewährsleuten nicht gerecht. So ist Ingleharts Ansatz trotz aller Modifikationen und obwohl Inglehart sich in den letzten Jahren schwerpunktmäßig mit Makro-Analysen befaßt hat (u. a. Inglehart und Baker 2000), im Kern dem methodologischen Individualismus verpflichtet: Individuelle Wertorientierungen werden auf individuelle Sozialisationserfahrungen während einer prägenden Jugendphase zurückgeführt. Daß etwa beispielsweise die aktuelle Wirtschaftslage einen Einfluß auf Wertorientierungen haben könnte, wurde von Inglehart deshalb stets energisch bestritten.

Eine präzise Erklärung dafür, warum ein höheres Bruttoinlandsprodukt (BIP) im Jahr der Umfrage (und nicht etwa das individuelle oder Haushaltseinkommen) unter Kontrolle diverser Mikro-Variablen zu einer stärkeren Befürwortung der EU-Prinzipien führen soll, bleibt Wuermeling schuldig, zumal sie selbst davon ausgeht, daß die von ihr analysierten Einstellungen nur mit einer „Zeitverzögerung“ (Wuermeling 2007: 193) auf veränderte Randbedingungen reagieren. Wenn überhaupt, dann sollten die wirtschaftlichen Bedingungen in der formativen Phase (eine Makro- Variable, die mit der Kohortenzugehörigkeit variiert) oder die Wirtschaftslage in der vorangegangenen Dekade einen Einfluß auf die Akzeptanz der EU-Prinzipien haben.

Selbst dann stellt sich allerdings die Frage, ob das BIP, d. h. die schiere Leistungsfähigkeit einer Volkswirtschaft, ein geeigneter Indikator für die von Inglehart und Bell gemeinten Prozesse sein kann. Nicht umsonst sprechen die von Wuermeling angeführten Autoren von „Post-Modernisierung“ beziehungsweise „Post-Industrialisierung“ als einer neuen Phase des ökonomischen und gesellschaftlichen Wandels, die durch einen (partiellen) Niedergang des industriellen Sektors, den Übergang zu „Post-Fordistischen“ Produktionsstrukturen und einen Bedeutungsgewinn (gehobener) Dienstleistungen gekennzeichnet ist (Inglehart und Baker 2000: 22). Vor diesem Hintergrund erscheint es geradezu absurd, Inglehart und Bell als Kronzeugen für eine wie auch immer geartete kausale Wirkung des gegenwärtigen Bruttoinlandsproduktes auf individuelle demokratische Einstellungen anzurufen.

Ähnlich unverbindlich ist Wuermelings Rekurs auf Webers Überlegungen zum Zusammenhang zwischen protestantischer Ethik und kapitalistischen Produktionsstrukturen. Wie der Rekonstruktionsversuch von Coleman (1994) zeigt, handelt es sich bei der „Protestantischen Ethik“ im Kern ebenfalls um eine Mehr-Ebenen-Erklärung, die sich in stark verkürzter Weise so darstellen läßt: (1) Protestantisch-Calvinistische Werte und Normen der „innerweltlichen Askese“ werden von der Kirche und anderen Institutionen propagiert, (2) die entsprechenden Einstellungen werden von den Akteuren internalisiert und (3) gewinnen so Einfluß auf deren Verhalten im Erwerbsleben, was (4) durch die Aggregation individueller Handlungen zur Entstehung einer leistungsfähigen, kapitalintensiven Volkswirtschaft führt, so daß (5) auf der Makro-Ebene ein Zusammenhang zwischen Protestantismus und Kapitalismus besteht (Coleman 1994: 8).

Von diesem Argument übernimmt Wuermeling lediglich die erste Hälfte, derzufolge Religionen Einstellungen auch in solchen Bereichen beeinflussen können, die in keinem unmittelbaren Zusammenhang mit den Glaubenslehren stehen. Wie und auf welcher Ebene aber soll „der Islam“ politische Einstellungen beeinflussen? Ist hier tatsächlich der nationale politische Kontext entscheidend, oder werden Einstellungen nicht eher innerhalb von Familien, (religiösen) Gemeinden oder Regionen geformt? Werden räumliche Kontexte im 21. Jahrhundert nicht in für die Fragestellung Wuermelings entscheidender Weise von transnationalen Medienkontexten (etwa den vor allem von Saudi-Arabien finanzierten religiös-politischen Satellitenprogrammen) überlagert? Ist schließlich vor dem Hintergrund der strengen islamischen Lehren ernsthaft davon auszugehen, daß „der Islam“ als kultureller Faktor die über ein Korruptions-Item gemessene Akzeptanz der Rechtsstaatlichkeit beeinträchtigt? Diese und ähnliche Fragen werden von Wuermeling nicht einmal angerissen.

Da Wuermeling die individuelle Zugehörigkeit zu einer Religionsgemeinschaft nicht berücksichtigt, ist es überdies unmöglich zu entscheiden, ob der von ihr gefundene Effekt des Moslemanteils (1) ein echter Kontexteffekt ist (muslimisch geprägte Gesellschaften reduzieren die individuelle Akzeptanz von Demokratie, Rechtsstaatlichkeit etc.), (2) durch die Komposition der Stichproben zustande kommt (in überwiegend muslimischen Gesellschaften ist die Wahrscheinlichkeit größer, daß ein Befragter das Individualmerkmal „Moslem“ aufweist und deshalb unabhängig von seinem nationalen-religiösen Kontext die EU-Prinzipien in einem geringeren Umfang akzeptiert) oder (3) auf eine Kombination beider Effekte zurückgeht.

Auch wenn man von all diesen fundamentalen Schwächen absieht, ist die von Wuermeling gewählte Spezifikation äußerst problematisch. Da, wie bereits erwähnt, die islamische Prägung über den Anteil der Muslime an der Gesamtbevölkerung gemessen wird, handelt es sich um eine metrische Größe auf der Ebene des nationalen Kontextes, die einen linearen Effekt auf individuelle Einstellungen haben soll.

Die Implikationen dieser Modellierung sind bei näherer Betrachtung nachgerade absurd: Beispielsweise müßte man davon ausgehen, daß in Westdeutschland, einer gefestigten westlichen Demokratie, die 1951/57 zu den Gründungsmitgliedern der Europäischen Gemeinschaften zählte, die Akzeptanz der EU-Prinzipien ceteris paribus niedriger sein müßte als im postsozialistischen Ostdeutschland, das erst durch die Wiedervereinigung Teil der EU wurde, da im Westen der Anteil der Muslime mit 4,7 Prozent um fast fünf Punkte höher liegt als in den neuen Ländern. In Frankreich (6,8 Prozent Muslime), einem weiteren Gründungsmitglied der EG, das 1789 Demokratie und Rechtsstaatlichkeit zu Staatsprinzipien erhob, 1791 als erstes Land der Welt die Strafverfolgung von Homosexuellen abschaffte und bis heute auf einer strikten Trennung von Staat und Religion besteht, sollte die Zustimmung zu den EU-Prinzipien ebenfalls niedriger sein als etwa in Estland (0,3 Prozent Muslime) oder der Slowakei (0 Prozent Muslime), die vor und nach dem Beitritt zur EU von der Kommission immer wieder wegen ihrer Minderheitenpolitiken gerügt wurden, oder in Polen (0 Prozent Muslime), das wegen der Diskriminierung von Homosexuellen vom Europäischen Gerichtshof für Menschenrechte verurteilt und vom Menschenrechtskommissar des Europarates scharf kritisiert wurde. Umgekehrt müßte man davon ausgehen, daß während der von Korruption, Autokratie und ethnischen Konflikten geprägten Spätphase des osmanischen Reiches die Zustimmung zu den EU-Prinzipien ceteris paribus höher gewesen wäre als in der modernen Türkei, weil der Anteil der Muslime an der Bevölkerung vor dem Ersten Weltkrieg lediglich bei etwa 70 Prozent lag.

Die Vorstellung, daß die bloße, mehr oder minder stark ausgeprägte Gegenwart von Muslimen in einem Land einen „kulturellen Kontext“ darstellt, der individuelle Einstellungen erklären könnte, ist offensichtlich nicht haltbar. Wenn überhaupt, dann sollte die religiös-konfessionelle Heterogenität eines Landes berücksichtigt oder aber eine dichotome Variable für eine Dominanz des Islam gebildet werden. In diesem Fall ergibt sich aber ein neues Problem: Unter allen in der europäischen Wertestudie untersuchten Ländern ist nur die Türkei islamisch geprägt. Bulgarien als das Land, das mit rund 12 Prozent den zweitgrößten muslimischen Bevölkerungsanteil aufweist, wird von allen Autoren, die mit diesen Kategorien operieren, klar dem orthodoxen Kulturkreis zugeordnet (vgl. z. B. Inglehart und Norris 2004: Kapitel 6).

Eine dichotome Variable für die Prägung durch den Islam wäre deshalb perfekt mit einem Ländereffekt für die Türkei korreliert. Empirisch trifft dies jedoch auch auf die von Wuermeling verwendete metrische Variable zu: Die Korrelation zwischen dem Muslimanteil und einem Indikator für das Befragungsland Türkei beträgt 0,99. Damit ist es unmöglich, zwischen einem (wie auch immer zu erklärenden) Effekt des Anteils der Muslime an der Bevölkerung und dem Einfluß anderer Merkmale der Systemebene, die für die Türkei spezifisch sind, zu unterscheiden. Die wichtigste Aussage des Artikels — „Je höher der Anteil an Muslimen im Land, desto geringer das Akzeptanzniveau der EU- Grundprinzipien“ — (Wuermeling 2007: 211) ist deshalb von den Daten nicht gedeckt.

 

2. Replizierbarkeit

Im Sinne einer intersubjektiven Überprüfbarkeit sollten empirische Arbeiten dem „replication standard“ (King 1995) genügen, d. h. es sollte ohne Mühe möglich sein, die berichteten Ergebnisse exakt zu reproduzieren. Frederike Wuermelings Beitrag genügt diesen Minimalanforderungen leider nicht. In keinem Fall werden die Namen der verwendeten Variablen genannt, obwohl diese in den Fragebögen der European Values Study neben den Fragetext gedruckt sind, so daß eine Zuordnung besonders leicht möglich wäre.2 Besonders ärgerlich ist dies im Falle der „vier Variablen“ die „sich für die Erstellung eines Demokratie-Indizes (sic) an[bieten]“ (Wuermeling 2007: 197). Tatsächlich folgen im EVS- Fragebogen acht Variablen (v216-v223) aufeinander, die sich auf demokratische und nicht- demokratische Systeme beziehen. Vor diesem Hintergrund gerät die Identifikation der von Wuermeling verwendeten Variablen zum Ratespiel.

Auch die Bildung der Indizes für Religionsfreiheit und Befürwortung demokratischer Prinzipien ist unzureichend dokumentiert. Wie zwei Items mit je fünf Antwortvorgaben beziehungsweise vier Items mit je vier Antwortvorgaben von der Autorin zu einer fünf- beziehungsweise „vierstufigen Likertskala“ (Wuermeling 2007: 197) kombiniert werden, ist alles andere als offensichtlich. Auch darüber, wie sie Kirchgangshäufigkeit (acht Stufen) und Gebetshäufigkeit (sieben Stufen) zu einer „7-stufigen Skala der Intensität der individuellen Religiosität“ (Wuermeling 2007: 198) kombiniert, gibt die Autorin keine Auskunft. Letzteres ist besonders problematisch, da das zweite Item in Schweden und Slowenien überhaupt nicht erfragt wurde, so daß die entsprechenden Werte in diesen Ländern für alle Befragten fehlen. Darüber hinaus können die in den Tabellen genannten Fallzahlen nicht korrekt sein, da trotz listenweisem Ausschluß fehlender Werte stets die Gesamtzahl der Befragten im Datensatz (35.462) ausgewiesen ist.

 

3. Datenbasis und Operationalisierungen

Die Autorin weist selbst darauf hin, daß die von ihr analysierten Daten der EVS vergleichsweise alt sind, rechtfertigt ihre Verwendung aber damit, daß „Grundeinstellungen … keinem schnellen zeitlichen Wandel unterliegen, da sie eng mit Wertvorstellungen verbunden sind“ (Wuermeling 2007: 196). Diese Annahme steht allerdings in einem gewissen Widerspruch zu den Erfahrungen mit dem relativ raschen Wandel der politischen Kultur etwa in Westdeutschland, dem Versuch der türkischen Eliten, mit Blick auf eine EU- Mitgliedschaft gesellschaftliche Wandlungsprozesse zu forcieren, dem raschen Nachrücken jüngerer und nach Einschätzung von Wuermeling selbst liberalerer Generationen in der Türkei, und nicht zuletzt der von ihr aufgestellten Hypothese, daß der über das Pro-Kopf- Inlandsprodukt operationalisierte gegenwärtige gesellschaftliche Wohlstand mit einer größeren Akzeptanz der EU-Prinzipien einhergeht.

Problematischer als das Alter der Daten sind allerdings die von Wuermeling verwendeten Operationalisierungen und hier insbesondere der von ihr konstruierte Index der Religionsfreiheit, der für eine valide Messung nicht geeignet ist, wie im folgenden gezeigt wird.3 Als normativen Maßstab für die EU-Prinzipien verwendet Wuermeling die vom europäischen Konvent erarbeitete Grundrechtecharta, die sich wiederum auf die Menschenrechtskonvention des Europarates und die Allgemeine Erklärung der Menschenrechte der Vereinten Nationen stützt.

Religionsfreiheit im Sinne dieser Dokumente läßt sich, anders als von Wuermeling (2007: 196) behauptet, nicht auf „Säkularisierung … [als] Prozess der institutionellen Trennung von Kirche/Religion und Staat (bzw. öffentlichen Ämtern)“ reduzieren. Nach dem Text der Charta hat Religionsfreiheit vielmehr mindestens sieben Aspekte: (1) das Recht, die Religion zu wechseln oder aufzugeben, sowie (2) das Recht auf private und (3) öffentliche Ausübung der eigenen Religion (Artikel II-704), (4) das Recht der Eltern, ihre Kinder im Sinne der eigenen religiösen Überzeugungen zu erziehen (Artikel II-74), (5) das Verbot der Diskriminierung aufgrund religiöser Überzeugungen (Artikel II-81) und schließlich (6) der Schutz der religiösen Vielfalt durch die Europäische Union (Artikel II-82). Säkularisierung im Sinne im Sinne von Wuermeling ist nicht mehr als eine Voraussetzung für die negative Religionsfreiheit (1) und die weltanschauliche Neutralität der Union (5).

Ohne Zweifel steht es um die faktische Anerkennung der Religionsfreiheit durch die öffentliche Gewalt in der Türkei nicht zum besten. Zwar garantiert die türkische Verfassung in Artikel 14 die Religionsfreiheit, und drei wichtige religiöse Minderheiten (Juden, orthodoxe und armenische Christen) sind offiziell als Religionsgemeinschaften anerkannt. Andere Religionen werden jedoch diskriminiert (Freedom House 2007), und auch die Situation der orthodoxen Christen ist prekär.

Die beiden von Wuermeling verwendeten Items v129 und v131 sind jedoch nur sehr bedingt geeignet, um die Akzeptanz der Religionsfreiheit durch die Bevölkerung zu messen. V129 erfaßt die Zustimmung zu der Aussage „Politiker, die nicht an Gott glauben, sind ungeeignet für ein öffentliches Amt“. Wenn überhaupt, dann besteht hier ein Zusammenhang mit den Aspekten (1) und (5), d. h. dem Recht, keiner Religion anzugehören und dem Verbot der Diskriminierung auf Grund religiöser und weltanschaulicher Überzeugungen. Allerdings richtet sich diese „Diskriminierung“ gegen die sehr spezifische Subgruppe der Bevölkerung, die sich öffentlichen Wahlen stellt, bei denen in allen Ländern der Welt selbstverständlich und legitimerweise auch Charaktereigenschaften der Kandidaten eine Rolle spielen. Das Adjektiv „ungeeignet“ (in der englischen Ausgangsversion des Fragebogens „unfit“) ist primär eine moralische beziehungsweise inhaltlich-politische, nicht aber eine juristisch-staatsrechtliche Bewertung.5 Daß eine starke Präferenz für fromme Politiker mit der Bereitschaft einhergeht, in anderen Bereichen des öffentlichen Lebens Atheisten, Agnostiker und Angehörige religiöser Minderheiten zu diskriminieren, ist durchaus wahrscheinlich, ergibt sich aber nicht aus den hier analysierten Daten.

In der Türkei gewinnt das Item durch den dauerhaften Konflikt zwischen religiös orientierten Politikern und der Militärführung überdies eine besondere und nicht ohne weiteres auf andere Länder übertragbare Bedeutung. Die Generale haben in der Vergangenheit bekanntlich mehrfach in die Politik eingegriffen, weil sie die laizistisch- nationalistischen Staatsprinzipien in Gefahr sahen. Die türkischen EVS-Daten wurden 2001 erhoben, d. h. in dem Jahr, in dem die islamische „Tugendpartei“ verboten wurde, deren Nachfolgerin AKP dann die Parlamentswahl von 2002 gewann. Vor diesem Hintergrund ist es schwer vorstellbar, daß das Item ausschließlich oder auch nur überwiegend die Akzeptanz für die Prinzipien der Grundrechtecharta erfaßt. Dies gilt aus offensichtlichen Gründen noch weitaus stärker für das Item v131: „Es wäre besser für die Türkei, wenn mehr Menschen mit einer starken religiösen Überzeugung öffentliche Ämter innehätten“.

Zusammenfassend läßt sich festhalten, daß die von Wuermeling verwendeten Items eine Präferenz für oder gegen religiös orientierte Politiker erfassen, die in der Türkei eine besondere Bedeutung hat, aber keine Aussagen über Einstellungen gegenüber der Trennung von Kirche und Staat zulassen. Der aus den Items v129 und v131 gebildete Index ist deshalb ungeeignet, die Akzeptanz der Religionsfreiheit valide zu messen.

Zum Abschluß dieses Abschnitts sollen noch zwei vergleichsweise kleine Operationalisierungsprobleme angesprochen werden: Das Lebensalter der Befragten wird durch die Dekade des Geburtsjahres (Wuermeling 2007: 198) erfaßt, was im Ergebnis zur einer komplexen und vermutlich nicht intendierten nicht-metrischen Transformation führt. Beispielsweise wird zwei Befragten A und B, die Anfang 1970 beziehungsweise Ende 1979 geboren sind, jeweils ein Wert von 7 zugewiesen, obwohl sich ihr Lebensalter um fast zehn Jahre unterscheidet. Eine dritte Person C, die Anfang 1980 geboren wurde, erhält hingegen den Wert 8, selbst wenn er oder sie nur wenige Tage älter ist als B. Umgekehrt behandelt Wuermeling die im Datensatz vorhandenen numerischen Codes für die Größe des Wohnortes als eine metrische Variable, obwohl sich die Abstände zwischen den Kategorien dramatisch unterscheiden.

 

4. Meßmodelle

Wuermelings Analyse enthält für zwei der vier abhängigen Variablen sowie für eine der unabhängig Variablen ein implizites Meßmodell: Indem die Autorin für die Akzeptanz von Religionsfreiheit und Demokratie sowie für die individuelle Religiösität jeweils einen Index konstruiert, geht sie stillschweigend davon aus, daß die von ihr in diesen Indizes zusammengefaßten Indikatoren (1) tatsächlich in allen Kontexten dasselbe messen und (2) die Zusammenhänge zwischen den Items über die 29 untersuchten Länder beziehungsweise Gebiete hinweg identisch sind. Die einfachste Möglichkeit, diese Annahmen zu überprüfen, ist die länderweise Berechnung von Cronbachs Alpha, das der (für die Zahl der Indikatoren korrigierten) mittleren Korrelation zwischen den Items einer Skala entspricht.

Als Minimum für eine reliable Messung wird dabei in der Literatur ein Wert von 0,7 genannt. Dieser Schwellenwert ist naturgemäß willkürlich, aber recht großzügig angesetzt. Im Falle einer Skala mit zwei beziehungsweise vier Indikatoren genügen bereits mittlere Korrelation von 0,54 beziehungsweise 0,38, um den Schwellenwert zu erreichen, was einer gemeinsamen Varianz von lediglich 29 beziehungsweise 14 Prozent entspricht. Für den Index der Religionsfreiheit ist jedoch in 12 der 29 Kontexte nicht einmal diese minimale Anforderung erfüllt. In ähnlicher Weise gilt dies auch für den als unabhängige Variable verwendeten Index der individuellen Religiosität. Den niedrigsten Wert für Alpha erzielt hier mit 0,29 ausgerechnet die Türkei, gefolgt von Rumänien und Griechenland (0,52 beziehungsweise 0,59). Bei näherer Betrachtung ist dies nicht allzu erstaunlich, da beide Items als Indikatoren für die intrinsische beziehungsweise extrinisische Sub-Dimension (vgl. Allport und Ross 1967: 434-435) der Religiosität betrachtet werden können, die in Abhängigkeit vom kulturellen Kontext mehr oder minder unabhängig voneinander sind.

In allen drei Ländern kommt der relativ schwache Zusammenhang zwischen beiden Items dadurch zustande, daß eine größere Zahl von Befragten selten eine Kirche beziehungsweise Moschee besucht, aber dennoch relativ häufig betet. Besonders ausgeprägt ist dieses Muster in der Türkei, wo selbst unter den Befragten, die angeben, niemals an Gottesdiensten teilzunehmen, 63 Prozent täglich mindestens einmal beten. Eine plausible Erklärung für diesen Befund liegt darin, daß im Islam dem fünfmal täglich zu verrichtenden Gebet in Richtung Mekka („Namaz“) ein weitaus höherer Stellenwert zukommt als dem Besuch einer Moschee. Weiter kompliziert wird der Sachverhalt dadurch, daß im türkischen Fragebogen, der sich ja nicht nur an Muslime richtet, nicht auf dieses spezifische Gebet Bezug genommen, sondern ein allgemeineres Wort („Dua“) benutzt wird.6 Damit sind Mißverständnisse und andere befragten- beziehungsweise interviewerspezifische Effekte vorprogrammiert.

Die Reliabilität des aus den Demokratie-Items gebildeten Indexes ist noch weitaus geringer und erreicht in keinem der untersuchten Länder den Schwellenwert von 0,7. Mit Abstand am niedrigsten ist der Wert von Alpha wiederum in der Türkei, wo lediglich ein Wert von 0,39 erreicht wird. Dies erklärt sich zu einem gewissen Grad dadurch, daß das „starker Führer“-Item in der Türkei praktisch nicht mit den beiden Fragen korreliert ist, die sich direkt auf die Demokratie beziehen, während in den übrigen Ländern mit r = -0, 28 beziehungsweise r = -0, 23 zumindest ein moderater negativer Zusammenhang besteht. Auch der Zusammenhang zwischen dem „starker Führer“-Item und der Frage zur Bewertung einer Militärdiktatur ist in der Türkei mit r = 0, 17 deutlich schwächer ausgeprägt als im Mittel der übrigen Länder, wo immerhin ein Wert von 0, 34 erreicht wird.

Zu einem ähnlichen Ergebnis gelangten auf der Basis des World Values Survey 1997 bereits Tessler und Altinoglou (2004: 35): Damals bestand überdies eine substantielle positive Beziehung zwischen der Befürwortung der Akzeptanz der Demokratie und dem Vertrauen in die Armee. Eine mögliche Erklärung für diese eher ungewöhnlichen Befunde liegt in der ambivalenten Rolle, die die Militärführung in der Geschichte der Türkei gespielt hat. Einerseits intervenierten die Offiziere zwischen 1960 und 1998 viermal im größeren Maßstab, um unerwünschte politische Entwicklungen zu verhindern (Tessler und Altinoglou 2004: 22-23), was mit demokratischen Prinzipien unvereinbar ist. Andererseits waren diese Eingriffe nicht auf die Einrichtung einer dauerhaften Militärdiktatur gerichtet und wurden vom Militär stets mit seiner Sonderrolle als Hüter der türkischen Demokratie und der republikanischen Prinzipien begründet, die von der Verfassung garantiert und zumindest von Teilen der Bevölkerung akzeptiert ist (Tessler und Altinoglou 2004: 35).

Unabhängig von Spekulationen über die möglichen Ursachen läßt sich festhalten, daß die von Wuermeling konstruierte Skala in keinem der untersuchten Länder reliabel ist. Auch die Ergebnisse bezüglich der Akzeptanz des EU-Prinzips Demokratie sind deshalb nicht zu verwerten.

Aus anderen Gründen ist auch die Messung der Unterstützung für die Gleichberechtigung der Frau problematisch. Während die Indizes für die Akzeptanz der Religionsfreiheit und der Demokratie trotz der skizzierten Validitäts- und Reliabilitätsproblematik zumindest eine große Zahl von Meßwerten aufweisen und deshalb als quasi-metrisch betrachtet werden könnten, wird die Akzeptanz der Gleichberechtigung mit einem einzigen Item gemessen, bei dem lediglich drei Antwortmöglichkeiten vorgegeben waren: (1) „stimme zu“, (2) „lehne ab“ und (3) „weder noch“. Selbst wenn man davon absieht, daß Option (3) vermutlich von etlichen Befragten als „weiß nicht“-Kategorie mißverstanden beziehungsweise benutzt wurde, ist die Annahme einer metrischen Skalierung hier offensichtlich nicht haltbar und die von Wuermeling gewählte lineare Spezifikation unangemessen.

Damit verbleibt als einzig unproblematische der vier abhängigen Variablen das Korruptions-Item. Bezeichnenderweise wird jedoch gerade diese Variable von Wuermeling nicht in multivariater Perspektive untersucht, weil die Türkei bei diesem EU-Prinzip von allen Ländern die höchsten Zustimmungsraten aufweist. Aus der Sicht der vergleichenden Einstellungsforschung ist ein solcher negativer (beziehungsweise politisch positiver) Fall, in dem sich die von Wuermeling aufgestellten Hypothesen prima facie7 nicht bestätigen lassen, mindestens ebenso interessant wie die relativ niedrigen türkischen Mittelwerte für die anderen Indikatoren. Gute wissenschaftliche Gründe, gerade diesen Fall nicht näher zu betrachten, lassen sich nur schwer vorstellen.

 

5. Modellierung

Selbst ohne alle bislang skizzierten Probleme wären die von Wuermeling geschätzten Modelle fehlspezifiziert. Bei den in Wuermelings Tabelle 2 (Wuermeling 2007: 206) präsentierten Ergebnissen handelt es sich um Schätzungen auf der Basis von Hierarchisch- Linearen- oder Mehr-Ebenen-Modellen (Snijders und Bosker 2000Hox 2002), bei denen der Achsenabschnitt nicht als fix betrachtet wird, sondern zufällig über die untersuchten Länder variiert (random-intercept-Modell). Solche Mehr-Ebenen-Modelle tragen auf elegante Weise der Tatsache Rechnung, daß in vielen sozialwissenschaftlichen Anwendungen (1) die Fälle nicht unabhängig voneinander, sondern in Kontexten gruppiert sind, was zu über-optimistischen Standardfehlern führt, (2) Merkmale der Kontexte selbst einen Einfluß auf die abhängige Variable haben können und (3) die Parameter des zu schätzenden Regressionsmodells (Achsenabschnitt und Steigungskoeffizienten) über die Kontexte hinweg ähnlich, aber nicht notwendigerweise identisch sind (kontextuelle Heterogenität). Für die vorliegenden Daten sind die von Wuermeling spezifizierten Modelle jedoch ungeeignet.

Ein erster Punkt betrifft dabei die von der Autorin vorgenommene Zentrierung der Individualvariablen an ihren jeweiligen Ländermittelwerten. Eine solche gruppenspezifische Zentrierung ist unüblich, weil sie die Bedeutung der geschätzten Effekte massiv und in einer oft schwer nachzuvollziehenden Weise verändert. Zudem ist sie mit einem Informationsverlust verbunden, sofern nicht auch die Gruppenmittelwerte als erklärende Variable im Modell enthalten sind (Kreft et al. 1995Hofmann und Gavin 1998Hox 2002: 62). Eine gruppenspezifische Zentrierung der Individualvariablen wäre nur dann anzuraten, wenn es sehr gute theoretische Gründe dafür gäbe anzunehmen, daß die Wirkung der betreffenden Variable einem „frog pond“-Mechanismus folgt (Kreft et al. 1995: 18; Hox 2002: 62). Mit Bezug auf die Türkei müßte man beispielsweise argumentieren, daß die Wirkung des Merkmals „Berufstätigkeit“ auf die Akzeptanz der EU-Prinzipien vom allgemeinen Beschäftigungsniveau in dem betreffenden Land abhängt. Eine solche theoretische Begründung für die gewählte Spezifikation ist nur schwer vorstellbar und in dem Beitrag von Wuermeling nicht zu erkennen.

Ein zweiter, grundsätzlicherer Punkt betrifft die Voraussetzungen, die für die Schätzung von Modellen mit Zufallskoeffizienten gelten. Erstens muß es sich bei den analysierten Kontexten tatsächlich um eine Zufallsstichprobe aus einer (großen) Population von Kontexten handeln (Kreft et al. 1995: 2), die als prinzipiell austauschbar betrachtet werden können. Insbesondere müssen innerhalb der Kontexte grundsätzlich dieselben Zusammenhänge bestehen und alle realen Abweichungen als zufällig interpretierbar sein. Zweitens sollte unabhängig davon die Zahl der Kontexte möglichst groß sein. In der Literatur werden als Minimum Zahlen zwischen 30 und 50 Kontexten genannt (Snijders und Bosker 2000: 140). Wenn wie bei Wuermeling Varianzkomponenten geschätzt werden, sollte die Zahl der Kontexte nochmals deutlich größer sein (Hox 2002: 175).

Im Fall der EU-Staaten sind diese Voraussetzungen schon deshalb offensichtlich nicht erfüllt, weil es sich gerade nicht um eine Stichprobe, sondern um die (mit Ausnahme Zyperns) vollständige Population der Länder handelt, über die eine Aussage gemacht werden soll (vgl. Berk 2004: 42-56 für eine weiterführende Diskussion). In der einschlägigen Literatur wird für Konstellationen wie die hier betrachtete deshalb ausdrücklich empfohlen, einen möglichen Einfluß der nationalen Kontexte durch fixe Effekte zu modellieren (siehe z. B. Duch und Stevenson 2005: 400 (FN 19)) beziehungsweise separate Modelle zu schätzen.

Darüber hinaus besteht hier keine echte Notwendigkeit für die Spezifikation eines Modells mit Zufallskoeffizienten. Typischerweise werden Modelle mit Zufallskoeffizienten genutzt, wenn die Zahl der Kontexte sehr groß, die Zahl der Personen pro Kontext aber relativ klein (normalerweise zwischen 2 und 100) ist, so daß es nicht möglich ist, für jeden Kontext ein eigenes Modell zu spezifizieren. Statt dessen wird zur Schätzung der kontextspezifischen Parameter in mehr oder minderem großem Umfang Informationen aus anderen Kontexten herangezogen („borrowing strength“), was zu präziseren, aber verzerrten Schätzungen führt.

Die Notwendigkeit, Informationen aus anderen Kontexten heranzuziehen, nimmt jedoch selbstverständlich mit der Zahl der Befragten in einem Kontext ab. Ist diese wie hier mit rund 1.000 Personen pro Land sehr groß und gleichzeitig die Zahl der Kontexte vergleichsweise gering, so sollte auf weniger voraussetzungsreiche konventionelle Verfahren zurückgegriffen werden (Snijders und Bosker 2000: 43-44).

Im vorliegenden Fall könnte als Äquivalent zu den von Wuermeling spezifizierten Modellen etwa ein „dummy variable model“ geschätzt werden, das für jedes Land einen eigenen Achsenabschnitt enthält, der an die Stelle des random intercept und der Kontextvariablen tritt, aber ansonsten auf der Annahme basiert, daß die Effekte der unabhängigen Variablen in den einzelnen Ländern trotz des unterschiedlichen Ausgangsniveaus identisch sind. Da die verbleibenden zufälligen Einflüsse auf der Länderebene nicht notwendigerweise konstant und voneinander unabhängig sind, sollten überdies Huber-White-Standardfehler berechnet werden, die gegenüber solchen Klumpeneffekten robust sind. Auf diese Weise würde allen Aspekten der hierarchischen Datenstruktur Rechnung getragen.

Im Falle des Gleichberechtigungs-Items müßte mit Blick auf das Skalenniveau darüber hinaus eine nicht-lineare, d. h. ordinale oder multinomiale Spezifikation gewählt werden. Auf der Grundlage der Mittelwerte beziehungsweise Antwortwahrscheinlichkeiten, die sich aus diesem relativ einfachen Modell ergeben, lassen sich einige aufschlußreiche Gedankenexperimente durchführen. Setzt man beispielsweise für die Türkei das im Mittel deutlich höhere skandinavische Bildungsniveau in das Modell ein, so werden die Kompositionseffekte, die sich aus den unterschiedlichen Bevölkerungsstrukturen ergeben, ausgeglichen und die Kontexteffekte isoliert. Im Ergebnis steigt der erwartete Anteil derjenigen, die dem Gleichberechtigungs-Item zustimmen, erheblich an, liegt aber immer noch 50 Prozentpunkte unter den skandinavischen Werten.8

Daß es für diese extremen Unterschiede zwischen Skandinavien auf der einen und der Türkei (sowie vielen kontinentaleuropäischen Ländern) auf der anderen Seite eine Erklärung auf der Systemebene geben muß, ist offensichtlich. Ebenso offensichtlich ist jedoch, daß es für die Identifikation dieser Faktoren einer intensiven Beschäftigung mit den betreffenden Ländern bedarf, die sich nicht auf einige Regressionsmodelle auf der Grundlage der EVS-Daten und zweier Makro-Indikatoren beschränken kann.

Eine Vielzahl von Erweiterungen des Modells wären leicht zu realisieren, ohne daß auf Zufallskoeffizienten zurückgegriffen werden müßte. Dies würde aber eine gründliche theoretische Auseinandersetzung mit den Determinanten der Einstellungen zu den Geschlechterrollen voraussetzen, die von der Autorin nicht geleistet wird.

 

III. Fazit

Frederike Wuermelings Studie zur Verankerung demokratischer Prinzipien in der Türkei wird die wissenschaftliche Debatte über einen möglichen Türkei-Beitritt und das „demokratische Defizit“ der EU neu beleben. Substantiell geht Wuermelings Artikel jedoch nicht über die altbekannten Mittelwert-Differenzen hinaus, da ihre multivariaten Analysen aufgrund der zahlreichen inhaltlichen und methodischen Defizite nicht zu verwerten sind. Die Kernaussagen ihres Beitrages sind deshalb nicht haltbar. Daß Wuermelings Beitrag dennoch politisch instrumentalisiert wurde, ist der Autorin nicht anzulasten, wohl aber, daß sie eine Vielzahl von methodischen und inhaltlichen Problemen übersehen oder ignoriert hat.

 

Literatur

 

   Allport, Gordon W., und Ross, J. Michael, 1967: Personal Religious Orientation and Prejudice. Journal of Personality and Social Psychology 5: 432—443.

Bell, Daniel, 1973: The Coming of the Post-Industrial Society. A Venture in Social Forecasting. New York: Basic Books.

Berk, Richard A., 2004: Regression Analysis. A Constructive Critique. Thousand Oaks, London, New Delhi: Sage.

Coleman, James S., 1994: Foundations of Social Theory. Cambridge, London: The Belknap Press of Harvard University Press.

Duch, Raymond M., und Stevenson, Randy, 2005: Context and the Economic Vote. A Multilevel Analysis. Political Analysis 13: 387—409.

Freedom House, 2007: Turkey. http://www.freedomhouse.org/modules/mod_call_dsp_country-fiw.cfm?year=2007&country=7291 (20.07.2007): Freedom House.

Gerhards, Jürgen, 2004: Europäische Werte — Passt die Türkei kulturell zu Europa? Aus Politik und Zeitgeschichte 2004: 14—20.

Gerhards, Jürgen, 2007: Cultural Overstretch? The enlargement of the European Union and the cultural differences between old and new member states and Turkey. London, New York: Routledge.

Hofmann, David A., und Gavin, Mark B., 1998: Centering Decisions in Hierarchical Linear Models: Implications for Research in Organizations. Journal of Management 24: 623—641.

Hox, Joop, 2002: Multilevel Analysis. Techniques and Applications. Mahwah: Lawrence Erlbaum.

Huntington, Samuel, 1996: The Clash of Civilizations and the Remaking of World Order. New York: Simon and Schuster.

Inglehart, Ronald, 1997: Modernization and Postmodernization. Cultural, Economic, and Political Change in 43 Societies. Princeton: Princeton University Press.

Inglehart, Ronald, und Baker, Wayne E., 2000: Modernization, Cultural Change, and the Persistence of Traditional Values. American sociological review 65: 19—51.

Inglehart, Ronald, und Norris, Pippa, 2004: Sacred and Secular. Religion and Politics Worldwide. Cambridge: Cambridge University Press.

King, Gary, 1995: Replication, Replication. PS: Political Science and Politics 28: 443—499.

Kreft, Ita G. G., Leeuw, Jan de, und Aiken, Leona S., 1995: The Effect of Different Forms of Centering in Hierarchical Linear Models. Multivariate Behavioral Research 30: 1—22.

Snijders, Tom A. B., und Bosker, Roel J., 2000: Multilevel Analysis. An Introduction to Basic and Advanced Multilevel Modeling. London, Thousand Oaks: Sage.

Tessler, Mark, und Altinoglou, Ebru, 2004: Political Culture in Turkey: Connections Among Attitudes Toward Democracy, the Military and Islam. Democratization 11: 21—50.

Weber, Max, 2006, zuerst 1904/05: Die protestantische Ethik und der Geist des Kapitalismus, Vollständige Ausgabe. Herausgegeben und eingeleitet von Dirk Kaesler. München: Beck.

Wuermeling, Frederike, 2007: Passt die Türkei zur EU und die EU zu Europa? Kölner Zeitschrift für Soziologie und Sozialpsychologie 59: 185—214.

*Department of Government, University of Essex, Wivenhoe Park, Colchester CO4 3SQ. Ich danke Sarah Kirschmann (Mainz) für die Beschaffung der Makro-Daten und Ersin Oezsahin (Konstanz) für die Übersetzung der türkischen Items aus dem EVS-Fragebogen sowie für zahlreiche wertvolle Hinweise und Anregungen.

1Vgl. statt vieler „Jihad Watch Deutschland“ http://fredalanmedforth.blogspot.com/2007_07_01_archive.html, „Politically Incorrect“ http://www.politicallyincorrect.de/2007/07/tuerkei-nur-ein-drittel-fuer-gleichberechtigung/ und „Weckstube — gegen die Islamisierung Deutschlands“ http://weckstube.info/archives/26.

2Hier und im folgenden beziehe mich auf die vom Zentralarchiv unter der Nummer 3811 bereitgestellte Version der Daten und der Dokumentation.

3Auch die Indikatoren für die Akzeptanz der beiden Prinzipien „Gleichberechtigung“ und „Rechtsstaatlichkeit“ sind nicht ideal, da sie auf sehr spezifische Teilaspekte (geschlechtsspezifische Berufsrollen beziehungsweise Schmiergelder) abzielen (siehe Wuermeling 2007: 197).

4Hier und im folgenden wird die Numerierung des Verfassungsvertrages verwendet, wie er von Bundestag und Bundesrat beschlossen wurde (Bundestagsdrucksache 15/4900).

5Dies gilt ausdrücklich auch für die türkische Version des Fragebogens.

6Ich danke Ersin Oezsahin für die Erläuterung beider Begriffe.

7Korrekte Messungen und eine angemessene Spezifikation des Modells vorausgesetzt wäre es zumindest denkbar, daß die Effekte der Kontextvariablen von stärkeren Effekten der Individualvariablen überlagert werden.

8Stata-Skripte zur Replikation dieser Befunde werden hier zur Verfügung gestellt: hdl:1902.1/11171 UNF:3:eHkqqsOl69GCE2ap0dRWMw== .

Die Wähler der Extremen Rechten 1980-2002

 

Spätestens seit den frühen 1980er Jahren haben sich die Parteien der Extremen Rechten – manchmal auch als Radikale Rechte, Neue Rechte oder Populistische Rechte bezeichnet – als neue Parteienfamilie in Westeuropa etabliert. Fast jeder der alten EU-Mitgliedsstaaten sowie Norwegen und die Schweiz mußte sich in diesem Zeitraum mit einer oder mehreren dieser Parteien auseinandersetzen, deren Verhältnis zur liberalen Demokratie häufig als problematisch erscheint.

Die Unterstützung für diese Parteien schwankt allerdings in erheblichem Umfang über die Zeit und zwischen den hier untersuchten Ländern. Es liegt nahe, dies auf politische Faktoren zurückzuführen, die sich der Kontrolle der Rechtsparteien weitgehend entziehen. In dieser Studie werden das Wählerprofil der Extremen Rechten sowie der Einfluß von Kontextfaktoren auf deren Wahlerfolge untersucht.

Something old, something new, something borrowed, something true? A comment on Lister’s ‘Institutions, Inequality and Social Norms: Explaining Variations in Participation’

 

1 Introduction

During the last 15 years, the (aggregate) analysis of electoral turnout in liberal democracies has become a minor industry. A recent survey of the relevant literature (Geys2006) lists not fewer than 83 empirical studies that relate turnout to a plethora of institutional, political and social factors. Amongst these, population size, the closeness of the respective contest, and (a rather less surprising finding) compulsory voting emerge as the most important independent variables. Michael Lister’s (2007) recent article in this journal is a valuable addition to this discussion, because by focusing on social inequality, he draws our attention to a whole host of societal factors that have by and large been neglected so far. Moreover, Lister’s contribution is one of the few studies that analyses turnout over time and in a cross-national perspective, whereas the majority of the analyses looks at subnational units, often in a cross-sectional perspective.

There are, however, a number of methodological and substantive issues with Lister’s analysis that call the validity of his findings into question: First, Lister’s account of causal relationships is highly problematic, second, the methodology is not appropriate given the low and unequal number of elections per year, third, most variables in the model are constant or near-constant within countries, and forth, even if there is a statistically significant relationship between inequality and turnout, it is trivial. In what follows, I will address these points in turn.

2 Is there an effect of inequality on turnout?

2.1 Causality


Macro level welfare state institutions PICPICMicro level internalised norms/expectations electoral participation (f )(b)(d)(a)(c)(e): +/- ? Squares represent observed variables, ovals represent variables for which there are no data. The solid line is the single observed relationship, dashed lines represent hypothesised, the dotted line represents the confounding effects of inequality on attitudes.

Figure 1: Observed and unobserved variables and relationships in the causal chain

Lister’s central argument is that the institutions of the welfare state shape citizens’ expectations (or norms) and thereby their political behaviour (Lister2007, 25). More specifically, he argues that welfare state institutions which are based on universalist principles provide ‘more support for norms of solidarity’ (Lister2007, 25). These norms encourage electoral participation both directly and indirectly. Means-tested welfare programs, on the other hand, have opposite effects (Lister2007, 25). Building on Coleman’s (1994, 7) framework for sociological explanation, his argument can be reconstructed in a slightly simplified way by employing three causal statements (see Figure 1):

  1. Features of the welfare state (a macro-level variable) affect internalised norms and expectations, i.e. individual attitudes.
  2. These individual attitudes have an impact on an individual’s decision to participate in a national election
  3. These individual decisions constitute turnout, another macro-level variable

Amongst these, only the third statement is unproblematic since it involves a purely mechanical aggregation (given that in liberal democracies, people are normally not prevented from voting in any systematic way). Statements (a) and (b) on the other hand are rather bold claims about the consequences and antecedents of individual variables which can never be proven right or wrong on the basis of macro-data. Ever since Robinson (1950) published his famous paper on ecological correlation, social scientists have struggled with the problem of ecological fallacies, i.e. the impossibility of deriving valid conclusions about individual behaviour from the aggregate measures.

Even the most advanced statistical techniques in the field that aim at making probabilistic statements about the likely strength of relationships between micro-level variables (say race and voting in a two-party competition, see King 1997) rely on information about the distribution of micro-level variables on the macro-level. In the absence of such information on the distribution of individual norms and expectations, nothing can be said about the validity of statements (a) and (b). Moreover, the analysis presented in Lister relies on another unobserved relationship, namely the causal connection between the institutions of the welfare state and inequality between households (d). While the nature of the welfare state’s institutions at any given point t (‘universalistic’ vs. ‘liberal’ or ‘minimal’ arrangements) will arguably have a substantial effect on inequality between households at t, it will hardly completely determine the current level of inequality. Rather, a whole host of other factors including the global and the national economy, the system and level of taxation, the previous level of inequality at points t – 1,t – 2,… as well as the previous nature of welfare state institutions and all sorts of unintended consequences and side-effects of previous policy will affect the current level of inequality, making this a rather crude measure of welfare state arrangements. Finally, over and above serving as an indicator for welfare state arrangements, inequality in itself can easily have a positive or a negative impact on one’s internalised norms and attitudes, thereby either masking or exaggerating the importance of causal effects that work along path (a). On the one hand, very low and falling levels of inequality (which are presumably associated with very high tax rates) could encourage the parties of the centre and the right to mobilise the middle classes, which would ceteris paribus lead to an increase in turnout. On the other hand, a high level of inequality would provide the working class with an incentive to vote in order to achieve a more comprehensive welfare state — this is the logic of the ‘democratic class struggle’ (Anderson and Davidson1943).1

To summarise, while Lister’s article builds on a complex framework involving three aggregate and two micro-level variables, claims about three causal relationships which are crucial for the argument and a fourth which can potentially distort the results are not and cannot be backed by data. Therefore, any conclusions from the analysis are confined to claims about the relationship between inequality and turnout on the aggregate level (i.e. ‘polities which face a high level of inequality will ceteris paribus experience a high/lower turnout than those with a more egalitarian distribution of resources’).

2.2 Data and Modelling

2.2.1 Data

The analysis presented by Lister relies chiefly on a single source which is in the public domain: the ‘Comparative Welfare States Data Set’ (Huber et al.2004) that compiles information for 18 countries from a variety of sources, covering the time-span from 1960-2000. This data set provides information on turnout (VTURN, drawn from Mackie and Rose 1982 and the reports in the European Journal of Political Research) as well as on a number of control variables such as a (chain) index of GDP per capita (RGDPC), the strength of bicameralism (STRBIC), the presence and strength of federalism (FED),2 the proportionality of the electoral system (SINGMEMD), and whether the respective country has a presidential system (PRES). These are merged with information on the focal independent variable income inequality (INEQ), which comes from the University of Texas Inequality Project (2004), and a report on compulsory voting (COMPVOTE) which was compiled by IDEA (Gratschew2001).

While Lister dismisses welfare state spending data very quickly, comparing income inequality across time and countries is full of pitfalls (Atkinson and Brandolini2000). There is no discussion of the quality and particular features of the data from the University of Texas Inequality Project whatsoever, and alternative data sources such as the Luxembourg Income Study (Atkinson2004) that might well be better suited for the research problem at hand are not even considered.

More generally relying on data sets in the public domain has clear advantages in terms of availability and replication, yet it imposes equally clear restrictions on the selection of observations and the time-frame (1963-93), which are not addressed in the text. This notwithstanding, it would have been helpful to discuss the rationale for not including Norway and New Zealand in the analysis, although these countries are covered by the sources, since the inclusion/exclusion of a single country can substantially affect the results of the regression model (see section 2.2.3 below).3


Variable β x β ×x
C -2.449 1.000 -2.449
COMPVOTE 0.216 0.225 0.077
SINGMEMD -0.004 0.574 -0.002
FED -0.031 0.527 -0.017
PRES -0.126 0.155 -0.020
STRBIC 0.115 0.698 0.081
RGDPC -4.060×10-6 1.559×104 -0.063
INEQ -0.015 33.373 -0.517
VTURNLAG 0.055 83.054 4.551
1.613
Table 1: Mean turnout rate implied by Lister’s model

To replicate Lister’s findings as closely as possible, a data set (available from hdl:1902.1/10558 UNF:3:2UNq+CMPvmjb7Aat9NvpKw==) was constructed in the following way: from the Comparative Welfare States Data Set, the 15 countries under study were selected. For those, all election years between 1963 and 1993 were retained (averaging over the 1974/1982 elections for the UK and Ireland), resulting in 136 observations with non-missing values for turnout, federalism, presidentialism, bicameralism, and GDP per capita.

Best efforts notwithstanding, it proved impossible to reproduce Lister’s findings exactly, although the differences are fairly small.4 More troubling is the fact that at first glance, the coefficients reported by Lister do not seem to sum up. If one plugs in the mean values5 for all the independent variables, the expected turnout is a staggering 161 per cent (see Table 1). However, the magnitude of the coefficients and the constant reveals that the author has converted turnout6 from its original percentage scale to a relative frequency scale and then applied a logit transformation to the new variable to account for the fact that the dependent variable is bound to the interval [0;100].7

Accordingly, lagged turnout (VTURNLAG) was constructed by taking the turnout from the previous election for all election years as outlined in footnote 4 while LOGITVTURN was constructed as ln (-TURNOUT-∕100-)<br /><br /><br />  1-(TURNOUT∕100). Then, a variable was created that reflects Bingham Powell’s assessment of the proportionality of each electoral systems.8 Information on compulsory voting is a dummy variable which takes the value ‘1’ for Australia, Belgium, and Italy and ‘0’ for all other countries. Finally, information on inequality from the University of Texas Inequality Project (2004) was matched to the data set. Since this information is missing for four French, one Italian and two British election years, the number of observations is further reduced to 129 observations.

2.2.2 Inappropriate Methodology

The data constitute a Time-Series-Cross-Sectional (TSCS) or panel arrangement: (very short) time series from n = 15 countries are pooled and analysed jointly. In political science, this design became extremely popular after Beck and Katz (19951996) suggested that the familiar Ordinary Least Squares (OLS) estimator can be applied to this specific data structure as long as the standard errors are ‘panel corrected’ (PCSE) to account for the dependencies amongst observations.

Following Beck and Katz (1995, 636), a generic TSCS model can be written as

y=x ☐ +ε    with  i=1,...,N;t=1,...,T<br /><br /><br />  i,t   i,t    i,t<br /><br /><br /> (1)

where y is the dependent variable, x is a vector of independent variables (including the constant), ε is a random error term, and observations are indexed by unit/country (i) and time (t). With TSCS data, the standard assumptions of regression analysis are likely to be violated as one would expect the ε to be ‘non-spherical’ that is, contemporaneously correlated, heteroscedastic, and serially correlated (Beck and Katz1995, 636), rendering ‘raw’ standard errors invalid and thereby giving rise to confidence intervals that are too narrow and significance tests that are too generous.9

(Positive) contemporaneous correlation, which is a consequence of unobserved factors increasing or decreasing turnout in several countries at the same time, cannot be ruled out completely but is unlike to pose huge problems for the analysis since the unit of observation is the national election.10 On the other hand, heteroscedasticity (the variance of ε is greater in country i than in country i + 1) is very likely to occur in the case of turnout: in countries where voting is compulsory, the variance of ε is bound to be smaller than in other polities.

Finally, the presence of (positive) serial correlation (the impact of some unobserved factor that affects turnout in country i at time t will still be felt at t + 1 and possibly t + 2,t + 3,…) can be taken for granted. Like most analysts of TSCS data, Lister follows the suggestions by Beck and Katz and accounts for this problem by including the lagged dependent variable (LDV).

This leads, however, to an intricate complication. The length of the election period varies both over time and across countries, e.g. it is fixed at four years in the US, comes empirically very close to the same value in the UK and in Italy, and varies between one year and five years in Canada (where there is a moderate upward trend in the duration of the election period). As a consequence, the autocorrelation of ε will also vary across countries and over time. The approach chosen by Lister does not deal with this, and even if it did, estimating a multitude of autocorrelations poses obvious problems, especially given the low N and T. While one could hope that the inclusion of the LDV somehow ameliorates the situation, exactly the same problems apply to the coefficient for the LDV which should again vary with the length of the election period. Therefore, any findings should be interpreted with extra caution.


PCSE Bootstrap GEE
LOGITVTURN LOGITVTURN LOGITVTURN
(1) (2) (3)
COMPVOTE 0.427*** 0.427* 0.360*
(3.498) (2.223) (2.505)
SINGMEMD -0.005 -0.005 -0.021
(-0.156) (-0.109) (-0.545)
FED 0.036 0.036 0.022
(0.721) (0.631) (0.429)
PRES -0.122 -0.122 -0.095
(-1.488) (-1.208) (-1.268)
STRBIC 0.062 0.062 0.070
(1.557) (1.079) (1.586)
RGDPC -0.000 -0.000 -0.000
(-1.387) (-1.058) (-0.547)
INEQ -0.024 ** -0.024 -0.021
(-3.207) (-1.872) (-1.599)
VTURNLAG 0.056*** 0.056*** 0.059***
(10.142) (7.145) (7.709)
Constant -2.130*** -2.130* -2.516 **
(-3.326) (-2.262) (-2.674)
R2 0.882 0.882
n 129 129 129

* p<0.05, ** p<0.01, *** p<0.001.
Instead of standard errors, t-values are given in brackets to maximise the comparability with Lister’s findings. PCSE were estimated using the xtpcse procedure in Stata 10 with the casewise option for the computation of the covariance matrix. The number of replications for the bootstrap is 200. GEE estimates assume a first-order autoregressive process for the errors. GEE standard errors are based on the ‘robust’ (Huber-White) estimate for the variance.

Table 2: A replication of Lister’s model with Panel Corrected and Bootstrapped standard errors

Given the likely presence of heteroscedasticity and autocorrelation, applying the corrections outlined by Beck and Katz seems to be a sensible strategy at first glance. However, the approach by Beck and Katz was developed for balanced panels consisting of say 10 to 40 time periods (Beck and Katz 1995, 640-642; Beck 2007, 97). In the data set compiled for this analysis, T ≥ 10 in only six countries with a maximum of 13 in Denmark while the number of panel waves is just 7 to 9 in five other countries and extremely low (4 to 6) in four other countries. Under these conditions, PCSEs are not guaranteed to perform well (see Shor et al. 2007 for a review of the associated problems).

As a simple safeguard, a non-parametric bootstrapping procedure (Efron and Tibshirani1993) was applied, that is, 200 samples of n = 129 were drawn from the original data set (with replacement), and the analysis was repeated for each of these samples, thereby simulating the process that generated the data. Since each of these samples is slightly different from the others, the parameter estimates will vary, too. This variation generally provides a realistic approximation for the standard error in circumstances where the distributional assumptions might not hold. The results are shown in column 2 of Table 2. Compared with the first column, the t-values are substantially reduced, rendering all independent variables except compulsory voting and the LDV insignificant.

However, the unequal and rather low T suggests an alternative robustness check with an estimator that does not rely on the time-series nature of the data. Amongst the host of estimators available for panel data, Generalised Estimating Equation Models (GEE) have recently gained prominence in political science because they can accommodate complex structures for the correlation of ε and are fairly robust against misspecification (Zorn2001).11 As it turns out, this method yields almost identical point estimates, and again, compulsory voting and the LDV emerge as the only variables with statistically significant effects (column 3). The upshot is that the calculation of PCSE in Lister’s original analysis of the turnout data is not appropriate and leads him to overconfident conclusions.

2.2.3 Unit Effects and Lack of Variation over Time

But there are even more fundamental issues with this analysis of turnout and inequality. First, one must be sure that the units (countries) can be pooled, i.e. that (roughly) the same slope coefficient(s) prevail(s) in all countries. In the turnout data set, a rigorous check of this assumption that would involve the estimation of country-specific models is impossible because the institutional control variables are constant or almost constant within countries.12 Second, one must check for the presence of unit effects, i.e. for country-specific intercepts.13 If units are pooled and unit effects are not accounted for, massive bias can result. For instance, if some variable x has a moderately positive effect on y within two countries A and B, and the average value of x is higher in country B while the overall level of y is higher in country A, a coefficient with a negative sign might be estimated unless country-specific intercepts are included in the model.14 Unfortunately, it is not possible to test for unit effects since the institutional variables do not vary within countries and are therefore perfectly collinear with the country-specific intercepts. Moreover, there are non-trivial linear dependencies between the independent variables: federalism and bicameralism correlate at r = 0.41,15 the correlation between federalism and proportionality is -0.4816 and even inequality and proportionality correlate at -0.44.


PIC

Figure 2: Inequality over time

To make things worse, the focal independent variable is ‘sluggish’ (Beck2001Wilson and Butler2007Plümper and Troeger2007), i.e. inequality varies a lot between countries but does not vary much within most countries (see Figure 2). While there are marked upward trends in Australia, Belgium, and the UK, and some apparently random variation in the Netherlands, inequality is largely stable elsewhere. Therefore, roughly 80 per cent of the total variation occurs between countries.

In a similar fashion, the variation of turnout within most countries is very moderate if compared to the variation between countries (see Figure 3). Turnout is consistently close to 100 per cent in Australia and Belgium (where compulsory voting is enforced) and still very high (i.e. above 80 per cent) in Austria, Denmark, Italy, and Sweden,17 whereas the figure for Japan hovers consistently around 70 per cent, and turnout in the US is permanently below or just above 60 per cent. Across the whole sample, only about 10 per cent of the total variation in turnout (or its transformation) occurs within countries while between-country differences account for the lion’s share of the variation.


PIC

Figure 3: Turnout over time

There are other issues here. Although the inclusion of the LDV was championed by Beck and Katz, the LDV is likely to cause problems. Estimates will be biased even if the errors are uncorrelated, and inconsistent in the presence of correlation amongst the errors (Ostrom1990, 62-65).18 There is a whole host of alternative dynamic specifications (Wilson and Butler2007, 106), and, as Wilson and Butler demonstrate, these can give wildly different estimates in many cases.

Yet, the most fundamental problem of the analysis at hand is this: like many (if not most) other comparative data sets, the turnout data are plagued by collinearity and a lack of intra-unit variation and are therefore not very informative (Western and Jackman1994).19 With most of the variation in both the dependent and the independent variables occuring between countries, one can be quite sure that polity-level factors have an effect on turnout, but it is not possible to disentangle the relative effects of the various variables that are constant (like federalism), do not vary much (like inequality) or are constant but not included in the model (unit effects). There is something about the US that depresses turnout while there is something about Australia that drives turnout close to its theoretical maximum, but while registration procedures and compulsory voting are highly likely suspects, it is not possible to prove that these factors are decisive.

No methodology, however advanced, can overcome this basic lack of independent pieces of information. Given this fundamental problem, it is not surprising that the estimates for the effect of inequality (and the other independent variables) are rather unstable and depend on the inclusion/exclusion of certain observations. This can be most easily demonstrated by removing all observations from a given year or country from the sample. For instance, the coefficient for inequality is reduced from -0.024 to -0.018 if the four elections in 1971 are excluded. By contrast, the coefficient goes up to -0.028 if the four observations in 1970 are excluded. The impact of excluding a single country is even more dramatic: if Austria (eight observations), a country with average inequality but high turnout rates, is removed from the sample, the coefficient rises to -0.038. Excluding Sweden (ten observations), a country with low inequality and high turnout, reduces the estimate to -0.016. Even excluding single observations can have a discernible impact on the estimates: without the Australian general election of 1993, the estimate for the coefficient is -0.028, while excluding the Dutch general election of 1971 brings it down to -0.017. In other words, removing a single observation from the sample can result in a change of the estimate that is roughly equivalent to one standard error.


PIC

Figure 4: Turnout and inequality

So is there anything at all that can be said about the relationship between inequality and turnout? The short answer turns out to be ‘no, not really’. One very basic approach is to ignore the institutional control variables as well as the potential impact of the GDP and to analyse the bivariate relationship on a per-country basis (see Fisher 2007 for a related bivariate analysis of turnout and the left vote).20 Figure 4 shows the respective scatter plots, with country-specific linear regression lines overlaid. This figure is quite revealing. Leaving aside the very low variation along both the x- and the y-axis in most countries, only five polities — Austria, France, West Germany, the Netherlands, and Sweden — display a clearly negative relationship between inequality and turnout, and even this statement requires qualification. Fitting any sort of trend to four data points (France) is obviously risky, and the variation of inequality is extremely low in Sweden, Austria, and West Germany. Moreover, the clear-cut negative trend in Austria and West Germany hinges on one outlying election respectively, which happens to be the rather unusual first election immediately after unification in Germany. This leaves the Netherlands as the only real example for the negative relationship between inequality and turnout. In all other countries, the relationship is weakly positive or close to nil.


PCSELOGITVTURN VTURN

(1) (2) (3) (4) (5) (6) (7) (8)
INEQ 0.022 0.022 0.025 0.020 0.203 0.203 0.234 0.183
(1.615) (1.585) (1.870) (1.315) (1.302) (1.299) (1.628) (1.050)
RGDPC -0.000*** -0.000*** -0.000*** -0.000*** -0.000*** -0.000*** -0.000*** -0.000***
(-3.376) (-3.437) (-6.835) (-5.757) (-4.268) (-4.270) (-7.987) (-6.402)
VTURNLAG 0.029** 0.027* 0.321* 0.319*
(2.642) (2.446) (2.308) (2.288)
AUS -0.579*** -0.587*** -0.679*** -0.692*** -4.055*** -4.065*** -5.165*** -5.244***
(-9.056) (-9.008) (-14.626) (-12.045) (-5.489) (-5.491) (-9.793) (-8.380)
BEL -0.407*** -0.414*** -0.500*** -0.499*** -2.674** -2.681** -3.698*** -3.599***
(-3.486) (-3.461) (-4.361) (-3.693) (-2.854) (-2.854) (-4.516) (-3.740)
CAN -1.343*** -1.376*** -1.903*** -1.897*** -14.497*** -14.539*** -20.689*** -20.585***
(-5.854) (-5.907) (-33.006) (-25.188) (-4.877) (-4.881) (-21.366) (-15.623)
DEN -0.760*** -0.775*** -0.974*** -0.998*** -4.950*** -4.968*** -7.315*** -7.534***
(-8.805) (-8.789) (-23.430) (-18.640) (-4.652) (-4.658) (-17.463) (-14.211)
FIN -1.293*** -1.323*** -1.783*** -1.793*** -13.641*** -13.679*** -19.051*** -19.126***
(-6.747) (-6.785) (-29.264) (-24.846) (-5.493) (-5.497) (-19.386) (-16.668)
FRG -0.714*** -0.726*** -0.893*** -0.909*** -4.707*** -4.722*** -6.687*** -6.811***
(-6.346) (-6.390) (-11.516) (-10.368) (-3.830) (-3.837) (-8.307) (-7.454)
IRE -1.568*** -1.609*** -2.247*** -2.241*** -17.468*** -17.520*** -24.972*** -24.890***
(-5.539) (-5.601) (-28.574) (-23.998) (-4.991) (-4.996) (-24.652) (-20.513)
ITA -0.667*** -0.676*** -0.795*** -0.788*** -4.585*** -4.595*** -5.991*** -5.846***
(-6.431) (-6.386) (-9.754) (-7.853) (-4.181) (-4.181) (-7.913) (-6.123)
JPN -1.480*** -1.524*** -2.202*** -2.193*** -17.630*** -17.684*** -25.602*** -25.433***
(-5.042) (-5.112) (-31.927) (-25.276) (-4.729) (-4.735) (-24.644) (-18.478)
NET -0.863*** -0.877*** -1.093*** -1.083*** -7.365*** -7.382*** -9.902*** -9.813***
(-5.240) (-5.161) (-8.665) (-5.985) (-3.738) (-3.738) (-7.028) (-5.033)
SWE -0.564*** -0.577*** -0.729*** -0.776*** -3.189** -3.205** -5.013*** -5.442***
(-5.800) (-5.767) (-7.885) (-7.055) (-2.908) (-2.913) (-5.326) (-4.831)
UK -1.282*** -1.319*** -1.883*** -1.892*** -13.860*** -13.906*** -20.501*** -20.543***
(-5.452) (-5.516) (-37.812) (-28.284) (-4.554) (-4.559) (-24.074) (-18.291)
USA -1.574*** -1.634*** -2.602*** -2.586*** -25.465*** -25.541*** -36.822*** -36.557***
(-3.921) (-4.008) (-42.096) (-37.140) (-5.005) (-5.011) (-47.153) (-39.413)
Constant -0.112 0.068 2.744*** 2.907*** 63.822*** 64.047*** 95.376*** 96.934***
(-0.102) (0.061) (6.225) (5.800) (4.713) (4.720) (20.864) (17.636)
ρ 0.031 0.222 0.003 0.205
R2 0.923 0.919 0.913 0.885 0.944 0.943 0.937 0.934
n 124 124 124 124 124 124 124 124

* p<0.05, ** p<0.01, *** p<0.001.
T-values are given in brackets. PCSE were estimated using the xtpcse procedure in Stata 10 with the casewise option for the computation of the covariance matrix. Australia is the reference category.

Table 3: Regression of turnout on inequality, GDP, a LDV, and unit effects with Panel Corrected standard errors

To carry out a more formal test, one could run a final pooled regression of turnout on inequality and control for GDP as well as for unit effects (assuming that the effects of GDP and inequality are constant across countries).21 The results are shown in Table 3.22 As expected, the effect of inequality is positive but insignificant. This holds regardless of the transformation of the dependent variable (models 1-4 vs. models 5-8), the inclusion of the LDV (columns 1, 2, 5, and 6) and the specification of a (common23 ) autoregressive term for the errors (models 2, 4, 6, and 8) . Given the data at hand, the conclusion is that there is no evidence for a negative effect of inequality on turnout.

2.2.4 Trivial Effect Size

Lister’s interpretation of his findings is driven almost exclusively by the statistical significance of the coefficients, and accordingly, much of the discussion in the two preceding sections has focused on the merits of various modelling techniques, the choice of estimators, and the statistical significance of parameter estimates. However, the findings from a statistical model should always be judged in terms of their substantive implications and political relevance (King et al.2000).

After all, statistical significance is nothing but a statement about the conditional probability of observing an estimate of a given magnitude. In itself, such a probabilistic statement is not of substantive interest. First, it is easily possible that politically important effects go undetected because the respective significance test does not have enough power in small samples. Second, provided that the sample size is large, significance tests will pick up tiny deviations from the null hypothesis that are of no political consequence whatsoever. Therefore, statistical significance is entirely distinct from the substantive significance of the underlying factual claim. As a consequence, many significance tests that are routinely carried out are utterly insignificant in terms of their material implications (Gill1999).

The (disputed) statistically significance of inequality would simply imply that it is highly unlikely to come up with an estimate of this magnitude if the true value of this coefficient is exactly zero — not less, but certainly not more. It would not prove that inequality has any real-world consequence on turnout.

As it turns out, the analyses presented by Lister would not support his central argument — the institutions of the welfare state have an indirect impact on turnout — even if they were not conceptually and methodologically flawed and the estimates could be taken at face value. This is because the consequences of the alleged negative effect of inequality reported in Lister (2007) are negligible.

This fact is somewhat disguised by the non-linear transformation of the dependent variable but become readily apparent if one takes a closer look at Table 1 above. If all independent variables are at their mean, the expected transformed turnout is 1.613, that is 83.38 per cent (invlogit (1.613) × 100). If inequality is set to its empirical minimum of 27.08 (Sweden 1979), the expected turnout rate changes to 84.68 per cent (invlogit(1.710) × 100). If, on the other hand, inequality reaches its empirical maximum of 39.53 (Italy 1968), the expected turnout falls to invlogit(1.517) × 100 = 82.01 per cent — hardly a difference of any political relevance, even if it was significant in statistical terms.24

3 Conclusion

Michael Lister’s article makes a useful contribution to the (already very large) discussion on aggregate variables that foster or depress turnout by drawing attention to societal factors. But while the question of whether inequality reduces turnout in the aggregate is a relevant one, his analysis is fraught with methodological problems that call the validity of his findings into question. Firstly, the original article builds on an interesting theoretical argument about the impact of institutions on attitudes, from which a complex causal framework is derived, but Lister’s claims about causal relationship are not backed by data. Therefore, his analysis is confined to the question of whether there is a negative relationship between inequality and turnout in the aggregate. Secondly, no rationale is given for selecting this particular time-frame and sample of countries, and it is difficult to exactly reproduce the findings. Thirdly, Lister applies techniques developed by Beck and Katz to overcome the small-N problem of comparative politics. But since most of the control variables are constant within countries and highly correlated while the focal explanatory variable as well as the dependent variable are ‘sluggish’ (i.e. nearly constant within most countries), there are simply not enough truly independent observations to estimate the model specified by Lister.

By applying simple bootstrapping techniques it can be shown that the t-values reported by Lister are far too large, thereby overestimating the reliability/statistical significance of the parameters. This is confirmed by an alternative robustness test that applies Generalised Estimating Equations to the same data. Moreover, it can be demonstrated that the estimates change considerably if a single year, country or even a single observation is removed from the sample. Simple bivariate regression plots on a country-by-country basis as well as an alternative model that is less demanding than Lister’s specification confirm the assertion that there is no evidence for the supposed universal negative relationship between inequality and turnout.

Some of the problems outlined above can be traced back to Lister’s sole reliance on aggregate data. Over the past two decades, multi-level modelling techniques have been applied in subfields of political science as various as attitude formation (MacKuen and Brown1987), support for European integration (Gabel1998), recycling behaviour (Guerin et al.2001) and the vote for the Extreme Right (Arzheimer and Carter2006), and the joint analysis of individual and macro-data would seem like an obvious remedy for at least some of the issues identified in the first part of this paper. As a case in point, in a recent contribution Anderson and Beramendi (2005) regress individual turnout on a number of individual and polity-level variables and find that income inequality at the macro-level reduces the probability of electoral participation.

But like PCSE, multi-level analysis is no panacea. Even if they are jointly analysed with individual-level information, data on the institutions of modern democracies will often be inherently ‘weak’ (Western and Jackman1994), because both the number of countries and the level of institutional variation within these countries is low, time-series are short, and strong unit effects are likely to prevail. This makes it extremely difficult to identify any causal effect.

Finally, it should be borne in mind that statistical significance is unrelated to substantive relevance. Even if the estimates and standard errors in Lister’s analysis could be taken at face value, they would not support the hypothesis that the institutions of the welfare state have an impact of turnout, because the political relevance of the alleged effects of inequality are negligible.

4 Figures and Tables

References

Anderson, C.J. and Beramendi, P. (2005) ‘Economic Inequality, Redistribution, and Political Inequality’, Paper prepared for presentation at the conference on ‘Income Inequality, Representation, and Democracy: Europe in Comparative Perspective.’, Maxwell School, Syracuse University, available at http://www.maxwell.syr.edu/moynihan/programs/euc/May6-7_Conference_Papers/Anderson%20and%20Beramendi%20EUC%20Conference%202005.pdf.

Anderson, D. and Davidson, P. (1943) The Democratic Class Struggle (Stanford: Stanford University Press).

Arellano, M. and Bond, S. (1991) ‘Some tests for specification for panel data: Monte carlo evidence and an application to employment equations’, Review of Economic Studies, 58, 277—297.

Arzheimer, K. and Carter, E. (2006) ‘Political opportunity structures and right-wing extremist party success’, European Journal of Political Research, 45, 419—443.

Atkinson, A.B. (2004) ‘The luxembourg income study (lis): Past, present and future’, Socio-Economic Review, 2, 165—190.

Atkinson, A.B. and Brandolini, A. (2000) ‘Promise and pitfalls in the use of ’secondary’ data-sets: Income inequality in OECD countries’, Temi di discussione (Economic working papers) 379, Bank of Italy, Economic Research Department, available at http://ideas.repec.org/p/bdi/wptemi/td_379_00.html.

Beck, N. (2001) ‘Time-series-cross-section data. what have we learned in the past few years?’, Annual Review of Political Science, 4, 271—293.

Beck, N. (2007) ‘From statistical nuisances to serious modeling: Changing how we think about the analysis of time-series-cross-section data’, Political Analysis, 15, 97—100.

Beck, N. and Katz, J.N. (1995) ‘What to do (and not to do) with time-series cross-section data’, American Political Science Review, 89, 634—647.

Beck, N. and Katz, J.N. (1996) ‘Nuisance vs. substance: Specifying and estimating time-series-cross-section models’, Political Analysis, 6, 1—36.

Berk, R.A. (2004) Regression Analysis. A Constructive Critique (Thousand Oaks, London, New Delhi: Sage).

Berk, R.A., Western, B. and Weiss, R.E. (1995) ‘Statistical inference for apparent populations’, Sociological Methodology, 25, 421—458.

Coleman, J.S. (1994) Foundations of Social Theory (Cambridge, London: The Belknap Press of Harvard University Press).

Efron, B. and Tibshirani, R.J. (1993) An Introduction to the Bootstrap (New York: Chapman and Hall).

Fisher, S.D. (2007) ‘(change in) turnout and (change in) the left share of the vote’, Electoral Studies, 26:3, 598—611.

Gabel, M. (1998) ‘Public support for european integration. an empirical test of five theories’, Journal of Politics, 60, 333—354.

Gallagher, M. (1991) ‘Proportionality, disproportionality and electoral systems’, Electoral Studies, 10, 33—51.

Geys, B. (2006) ‘Explaining voter turnout. a review of aggregate-level research’, Electoral Studies, 25, 637—663.

Gill, J. (1999) ‘The insignificance of null hypothesis significance testing’, Political Research Quarterly, 52, 647—674.

Gratschew, M. (2001) Compulsory Voting (http://www.idea.int/vt/compulsory_voting.cfm (04.06.2007): IDEA).

Guerin, D., Crete, J. and Mercier, J. (2001) ‘A multilevel analysis of the determinants of recycling behavior in the european countries’, Social Science Research, 195—218.

Huber, E., Ragin, C., Stephens, J.D., Brady, D. and Beckfield, J. (2004) Comparative Welfare States Data Set (http://www.lisproject.org/publications/welfaredata/welfareaccess.htm (04.06.2007): Northwestern University, University of North Carolina, Duke University and Indiana University).

King, G. (1997) A Solution to the Ecological Inference Problem. Reconstructing Individual Behavior from Aggregate Data (Princeton: Princeton University Press).

King, G., Tomz, M. and Wittenberg, J. (2000) ‘Making the most of statistical analysis. improving interpretation and presentation’, American Journal of Political Science, 44, 341—355.

Lijphart, A. (1984) Democracies. Patterns of Majoritarian and Consensus Government in Twenty-one Countries (Stanford: Stanford University Press).

Lijphart, A. (1999) Patterns of Democracy. Government Forms and Performance in Thirty-Six Countries (New Haven: Yale University Press).

Lister, M. (2007) ‘Institutions, inequality and social norms: Explaining variations in participation’, British Journal of Politics and International Relations, 9, 20—35.

Mackie, T.T. and Rose, R. (1982) The International Almanac of Electoral History (Houndmills, London: Macmillan).

MacKuen, M. and Brown, C. (1987) ‘Political context and attitude change’, The American Political Science Review, 81:2, 471—490.

Ostrom, C.W. (1990) Time Series Analysis. Regression Techniques (Newbury Park, London, New Delhi: Sage).

Plümper, T. and Troeger, V.E. (2007) ‘Efficient estimation of time-invariant and rarely changing variables in finite sample panel analyses with unit fixed effects’, Political Analysis, 15:2, 124—139.

Powell Bingham, G. (1986) ‘American voter turnout in comparative perspective’, The American Political Science Review, 80, 17—43.

Robinson, W.S. (1950) ‘Ecological correlation and the behavior of individuals’, American Sociological Review, 15, 351—357.

Shor, B., Bafumi, J., Keele, L. and Park, D. (2007) ‘A bayesian multilevel modeling approach to time-series cross-sectional data’, Political Analysis, 15:2, 165—181.

University of Texas Inequality Project (2004) Estimated Household Income Inequality Data Se (http://utip.gov.utexas.edu/data/UTIP_UNIDO2001rv3.xls (04.06.2007): University of Texas).

Western, B. and Jackman, S. (1994) ‘Bayesian inference for comparative research’, American Political Science Review, 88, 412—423.

Wilson, S.E. and Butler, D.M. (2007) ‘A lot more to do: The sensitivity of time-series cross-section analyses to simple alternative specifications’, Political Analysis, 15:2, 101—123.

Zorn, C.J.W. (2001) ‘Generalized estimating equation models for correlated data: A review with applications’, American Journal of Political Science, 45:2, 470—490.

*Thanks to Sarah Kirschmann for research assistance and Elisabeth Carter, Harald Schoen, and two anonymous reviewers for their valuable comments and suggestions. Needless to say, the usual disclaimer applies.

1One could even argue that causality works the other way around: a constantly high level of turnout (which is indicative of a mobilised working class) forces the government to maintain a high level of welfare state protection.

2Information on federalism, bicameralism and presidentialism is drawn from Lijphart (19841999), although there is an inconsistency in the data set: Lijphart (1999, 189) codes federalism with integers ranging from ‘1’ (unitary states with no elements of de-centralisation) to ‘5’ (strong federal arrangements). In Huber et al. (2004), this scale reduced to just three integers (0-2= no/weak/strong federalism) in a not entirely transparent way. Particularly confusing is the case of Belgium, which is coded as ‘0’ until 1993 although it is assigned a value of ‘3’ by Lijphart (1999).

3Moreover, the measure for the proportionality of the electoral system (SINGMEMD) (which is apparently not drawn from Powell’s (1986) seminal paper but rather from Lijphart (19841999)) is a static index, while there is now ample evidence that proportionality is best understood as the result of the dynamic interaction between electoral rules on the one hand and the fragmentation and spatial distribution of party support on the other hand (see e.g. Gallagher 1991. At any rate, it is unlikely that an index will have a linear effect. Like federalism and bicameralism, it should probably be replaced by a series of dummy variables.

4First, including a lagged dependent variable (turnout at point t -1) would normally imply that the first wave of the panel is lost, but here it is possible to retain the first wave since turnout was recorded for the elections preceding the cut-off year of 1963. Second, the data on compulsory voting (Gratschew2001) are somewhat ambiguous with regard to Austria, the Netherlands, and Italy. Finally, the UK (1974) and Ireland (1982) held two general elections in a single year, and various solutions for dealing with this problem are conceivable.

5Calculated for those 129 election years for which complete information is available and treating Australia, Belgium, and Italy as having compulsory voting.

6Apparently, no such transformation was applied to the lagged dependent variable.

7In practice, the predicted values are well-behaved even without the transformation, and predictions based on the original and the transformed values are extremely highly correlated (r = 0.99). Whatever the transformation’s utility, while a discussion of the procedure and the rationale for its application could be relegated to an appendix, the fact that the variable was transformed should be mentioned in the article.

8Bingham Powell’s index refers to French presidential elections and classifies them as very proportional, which seems rather odd. Nonetheless, the coding scheme discussed by Lister (2007, 30) suggests that this variable was used in the original analysis. My replication data set also includes the alternative variable provided by Huber et al. (2004), but the substantive conclusions are the same, regardless of which operationalisation is chosen.

9Non-spherical errors also render the parameter estimates inefficient, but this is usually considered a minor problem (Beck and Katz1995, 636).

10While there are historical events like the oil price crises that might affect turnout in all countries in a given year, it is not easy to conceive of an error process that affects say the second election in the period of study in each or even most countries in the same way. Yet, such effects are not entirely implausible. For instance, in five countries, the second election under study was held in the eventful year of 1968.

11Another panel estimator with desirable properties was proposed by Arellano and Bond (1991). However, the Arellano-Bond estimator involves first differences of the independent variables and can therefore not deal with those regressors that are (almost) constant within panels. An Arellano-Bond regression of turnout on the dynamic variables (GDP and inequality) is therefore not fully comparable to the results in Table 2 but demonstrates again that inequality has no significant effect (not shown as a table).

12In Sweden, STRBIC changes from ‘weak bicameralism’ to ‘no second chamber or second chamber with very weak powers’ after a constitutional reform in 1970.

13A wider definition of unit effects would include country-specific slopes and error variances, see Wilson and Butler 2007, 104.

14See the figures in Wilson and Butler for graphical examples. The inclusion of the LDV in the model does not necessarily capture unit effects (Wilson and Butler2007, 107).

15Goodman and Kruskal’s γ = 0.53.

16γ = -0.64.

17West Germany is another high-turnout country. The rather low value in 1990 is actually a combined figure for both West and East Germany.

18The inclusion of the LDV also changes the interpretation of the coefficients for the independent variables because the impact of x will cumulate over time (Ostrom1990, 72-74). The situation is even more complicated here because the lagged endogenous variable was apparently not transformed. See footnote 24 for an explanation.

19A more general and almost philosophical question is whether ‘apparent populations’ should be treated as samples at all. See the exchange initiated by Berk et al. (1995) and the monograph by Berk (2004, 42-56) for a critical assessment.

20To ease interpretation, actual turnout was plotted against inequality. Analyses using the transformed variable (LOGITVTURN) lead to essentially the same conclusions.

21See Plümper and Troeger (2007) for an interesting new approach that aims at giving biased but relatively efficient estimates for the effects of slowly changing or time-invariant variables in the presence of unit-effects.

22The four French elections and the German election of 1990 were removed from the sample for reasons stated above.

23As explained above, it seems unwise to estimate panel-specific autoregressive terms.

24The issue is actually slightly more complicated because (a) Lister’s specification includes a LDV, which implies that the present effect indirectly affects future levels of turnout and (b) because the dependent is transformed in a non-linear fashion while the LDV is retained in its original scale, thereby creating a complex linear-non-linear feedback loop. As a consequence, turnout would rapidly (within 10 elections) converge towards 100 per cent if the process starts from the mean values in Table 1 and is otherwise left alone. However, this convergence depends on the initial level of turnout. Setting inequality to its maximum and thereby reducing the initial level of turnout to 82 per cent is sufficient to trigger a convergence towards a 0 per cent turnout rate, again within the course of ten elections. The decision over whether such a specification make sense substantially is left to the reader.

Political Efficacy

 

Political Efficacy is a term that refers to the “the feeling that individual political action does have, or can have, an impact upon the political process, i.e. that it is worth while to perform one’s civic duties” (Campbell/Gurin/Miller 1954: 187). Like with many important concepts in the field of political communication and sociology, its origins can be traced back to a string of bi-annual surveys directed by Angus Campbell and his associates at the University of Michigan’s Survey Research Center (SRC) that eventually became to be known as the (American) National Election Studies (ANES).

The SRC’s approach to the study of politics focused on three basic tenets: (1) the idea that attitudes guide political behavior, (2) the notion that research has to be cumulative and (3) the willingness to draw on the rich tradition of political polling that was already established as well as on commonsensical ideas about politics. Therefore, the four items – a fifth item was dropped later on – which were introduced in 1952 were not derived from some overarching theory, but were simply considered interesting and relevant by the SRC group, given the political situation of the time.

They read: “I don’t think public officials care much what people like me think” (1), “Voting is the only way that people like me can have any say about how the government runs things” (2), “People like me don’t have any say about what the government does” (3) and “Sometimes politics and government seem so complicated that a person like me can’t really understand what’s going on” (4). Items 1, 3, and 4 were replicated in the ANES from 1956 on on a more or less bi-annual basis, and therefore at least in the U.S. it is possible to track the waxing and waning of the general public’s sense of efficacy over several decades. Translations of the SRC items were developed for surveys of social and political attitudes in a whole host of other countries, and nowadays, the concept has gained universal recognition in western democracies.

Campbell and his associates initially assumed that (1) people with a high Socio-Economical Status (SES) would (rightly) consider themselves more influential than people with a low SES and that (2) people who consider themselves influential are more likely to participate in politics (this is even a part of their definition given above). Therefore, efficacy should be an important intervening variable that could help explain the manifest link between SES and electoral participation. This conclusion was borne out in countless election studies. Moreover, political efficacy turned out to be a good predictor for other, more unconventional forms of political participation like protest marches, sit-ins or boycotts.

In the late 1960s/early 1970s, the lack of a theoretical foundation of the concept finally led to a third strand of research that re-interpreted the meaning of the items in the context of other approaches. In turn, a low sense of political efficacy was seen as an indicator for political alienation, a low level of support for the political system in the sense of Easton (1975), and as sign of political disaffection and malaise. Arguably the single most important contribution to the latter debate was Robinson’s (1976) article on “Public Affairs Television and the Growth of Political Malaise”, which essentially blamed (political) television for the sharp decline in efficacy starting in the late 1960s. This alleged causal relationship between TV consumption and a low sense of political efficacy became known as the “videomalaise hypothesis” and sparked a scientific debate that is still far from closed. In its course, the political efficacy items were increasingly seen as core indicators for political disaffection. This interpretation of the concept rests on the (implicit) argument that for democracies high levels of participation by all members of the public are desirable per se, and that low levels of efficacy are therefore a sign of crisis. On the other hand, functional or elitist theories of democracy claim that high levels of participation may well lead to overload and instability of the political system as well as to sub-optimal political results.

A fourth and final strand of research focuses on the dimensionality of the concept. As early as 1959, Robert Lane pointed out that the SRC items refer to two distinct sub-dimensions of the concept: Items 1 and 3 reflect perceived attributes of the political system (“external political efficacy”), while items 2 and 4 tap evaluations of the respondent’s own political abilities (“internal political efficacy”). 15 years later, George Balch could empirically prove that internal and external efficacy do indeed form two separate (but closely related) sub-dimensions of the original concept. Adherents of elitist theories hold that the combination of low levels of internal efficacy with high levels of external efficacy is most beneficial for the stability of democracy (see Almond and Verbas development of the “civic culture” for a closely related argument).

The existence of two sub-dimensions is nowadays uncontroversial. However, the long tradition of the concept not withstanding, its measurement underwent considerable change over the years. From the late 1960s on, additional items were introduced in the ANES surveys, the wording of the original items was varied somewhat to avoid response sets, the format of admissible answers was changed from agree/disagree to a Likert-type rating scale, and new or modified items were conceived. Therefore, a whole host of measurement models has been proposed during the last three decades, and the debate about the best (i.e. most valid and reliable) way to measure political efficacy is far from over.

 

See also: Political Disaffection

Further Readings:

Almond, G. A. and Verba S. (1965), The Civic Culture. Political Attitudes and Democracy in Five Nations, Boston: Little, Brown and Company.

Balch, George I. (1974), ‘Multiple Indicators in Survey Research: The Concept of “Sense of Political Efficacy”‘, Political Methodology 1(1): 1-43.

Campbell, A. & Gurin, G. & Miller, W.E. (1954). The Voter Decides. Evanston: Harper and Row.

Easton, D. (1975), ‘A Re-Assessment of the Concept of Political Support’, British Journal of Political Science 5: 435-457.

Lane, Robert (1959), Political Life. Why People Get Involved in Politics, Glencoe: The Free Press.

Robinson, M. J. (1976), ‘Public Affairs Television and the Growth of Political Malaise: The Case of “The Selling of the Pentagon”’, American Political Science Review 70: 409-432.

Vetter, A. (1997), ‘Political Efficacy: Alte und neue Meßmodelle im Vergleich’, Kölner Zeitschrift für Soziologie und Sozialpsychologie 49: 53-73.

Voter Behaviour

 

Between the early 1940s and the late 1960s, four basic models of voter behavior have been proposed on which almost all studies of electoral behavior draw. These models describe how humans react to environmental factors and choose between different courses of action. Homo sociologicus (more or less implicitly) forms the basis of the approaches to voting behavior laid out in the first three parts of this entry. In contrast rational voter theory explicitly invokes homo oeconomicus through deductive reasoning. A closer examination reveals, however, that these seemingly very different approaches are in fact complementary and can be regarded as aspects of an overarching model. In the past few years this line of reasoning has become increasingly present both in social-psychological as well as rational choice writings.

The Micro-Sociological Model

The micro-sociological model was developed in the early 1940s by Paul F. Lazarsfeld and his colleagues and its formulation in The People’s Choice first appeared at the end of World War II. A milestone of modern electoral research, itwas also criticized for its methodological and empirical deficiencies and these critiques informed the design of the follow-up study Voting.

The motivating question for Lazarsfeld and his colleagues can be found in the sub-title of The People’s Choice; how do voters develop concrete vote intentions over the course of an election? Lazarsfeld et al. investigated this question by conducting an intensive study of Erie County, Ohio during the 1940 presidential election. They interviewed a representative sample up to seven times over the course of the campaign with regard to vote intention, their evaluation of the candidates and assessment of the major political issues. By doing so the researchers sought to determine how each individual voter developed their political attitudes over time and the impact of the campaign on this process.

Lazarsfeld et al. rapidly determined that socio-structural variables, above all socio-economic status and religious affiliation, strongly influenced vote intention for both major American parties. Taken together with a voter‘s living situation (urban or rural), the researchers constructed an “Index of Political Predisposition” with an extremely accurate predictive capability. Blue-collar workers and Catholics disproportionately trended toward the Democrats while Protestants and middle class voters predominantly supported the Republicans, with the interaction of both variables strengthening these effects.

With muted reservations, the authors concluded that the political preferences of their respondents were largely socially determined. For many voters, party choice was fixed months before the election and new information was used selectively to reinforce rather than challenge or update prior opinions. These findings were far removed from the ideal of the responsible democratic citizen, painstakingly informing themselves about the various parties and candidates before coming to a decision based on sober reflection.

As they conceded, however, Lazarsfeld et al. could only tentatively explain why socio-structural variables influenced vote choice so strongly, despite the relative anonymity of individual members to these large, impersonal structures. The authors argued implicitly that socio-structural variables could be viewed as indicators of membership in a mostly homogenous social environment of friends, family, neighbors and colleagues with similar political views. This web of interactions is then capable of reinforcing wavering individual opinions through social pressure. In these circumstances so-called Opinion Leaders played an important role by intensively informing themselves about political events through the media and then passing their observations on to less interested or educated citizens. To describe this relationship Lazarsfeld et al. formed their famous „two-step-flow“ hypothesis of political communication.

The Columbia-Group’s emphasis on the immediate social environment disposed them to observe an interesting phenomenon: If a voter‘s social environment is not homogenous and they belong to multiple social groups with incompatible political norms, conflicting behavioral expectations (cross pressures) should develop. To explain non-voting or party-switching, two phenomena that electoral researchers have always been pre-occupied with, Lazarsfeld et al. were forced to rely above all on cross pressures in the immediate social environment.

The Macro-Sociological Model

In contrast to the Columbia study, the macro-sociological approach focuses its explanations on processes at the level of the entire society. In Germany this approach was initially forwarded by M. Rainer Lepsius who was primarily occupied with “social-moral milieus”, a key characteristic of German society in the Imperial and Weimar periods. Internationally Lepsius had little impact, while even within the German literature his approach was soon displaced by a competing macro-sociological model that argued from the outset with abstract categories, was tailored to explain a larger area (Western Europe) and was easily portable to other contexts. This model was the “cleavage” theory of Seymour Martin Lipset and Stein Rokkan, originally formulated in the comprehensive introductory chapter of their work Party Systems and Voter Alignments.

By “cleavage” Lipset and Rokkan mean a social “fault line”, a sustained social conflict pitting (at least) two large groups with conflicting social interests (and defined by their social characteristics) against one another. According to Lipset and Rokkan, European social conflicts can be systematically ordered and divided into four groups:

  1. Conflicts between the national Center and the subordinate Periphery,

  2. Conflicts between the State and the Catholic Church;

  3. Conflicts between Urban and Rural territories; and

  4. Conflicts between Labor and Capital.

These four conflicts ultimately go back to processes of modernization. The first two refer predominantly to the cultural sphere and hearken back to the development of modern nation-states, while the latter conflicts are above all economically motivated and consequences of the Industrial Revolution.

For Lipset and Rokkan, social conflicts become politically relevant if a specific set of conditions is fulfilled:

  1. The conflict must remain virulent over a long period and play a central role in the life of the affected individuals.

  2. Social mobility must be low, so that one typically remains a lifelong member of the relevant social group.

  3. Those affected by the conflict must have the motivation and opportunity to ensure that their interests are incorporated into formal associations.

  4. The leaders of these “pressure groups” must found their own party or agree to some form of coalition with a pre-existing party.

  5. This party must have an opportunity within the electoral system to cross the threshold of parliamentary representation.

Under these conditions social conflicts achieve a sort of political reification. The parties that develop are understood as the agents of social groups and are treated as such by group members. The format of the party system that develops, such as the number of parties or polarization between them is determined by the number of relevant social cleavages and whether these fault lines run parallel to or overlap with one another. So long as the system of social conflicts remains stable, for example when parties negotiate a lasting compromise that is also acceptable to their represented social groups, the party system will remain fundamentally stable.

Lipset and Rokkan’s unpacking of the relationship between social structures and the party system is highly internally consistent and constitutes a powerful analytical frame, in that prior findings on voting behavior are easily integrated into a cleavage theory. An obvious deficiency in their model, however, is the failure to consider the individual level and the role of communication. Lipset and Rokkan are silent on why individual voters usually behave empirically as elites expect them to.

It is possible to close the micro-level gap and integrate Lipset and Rokkan’s macro-sociological model with the complimentary micro-sociological findings of the Lazarsfeld-Group and Lepsius’ work at the meso-level. But even this combined approach has a major deficiency, as it only poorly explain moments of political change. For relatively short-term fluctuations in the relative strength of political parties, which lead to relatively frequent changes in the size and composition of governing parties or coalitions, the picture of an ideal-typical homo sociologicus blindly adhering to the norms of his reference groups is unsatisfying. The socio-psychological model represents a solution to this problem and its findings are highly complementary with the previous sociological models.

The Socio-Psychological Model

Ten years after The People’s Choice Angus Campbell and his associates at the Survey Research Center published their first major election study. The Voter Decides was distinct from the Lazarsfeld-Group’s work in two respects. First, Campbell and his co-authors conducted a random sample covering the entire United States, as opposed to prior regionally limited inquiries. Second, Campbell et al. initially explained voting behavior exclusively through psychological variables, specifically the evaluation of candidates, their positions on the major political issues and their “party identification”, the degree of attachment to a political party. Initially all three psychological variables were considered equally important. Sociological variables, of primary importance to Lazarsfeld et al., were held in The Voter Decides as exogenous and remained unconsidered.

Campbell et al. were initially and correctly criticized for almost fully ignoring the social context of vote choice and for relying on variables so temporally and empirically connected with the act of voting that the model risked tautology. Campbell et al. reacted to these critiques by extending their inquiries to include the broader social context, a social-psychological model of behavior that would become identified with the University of Michigan as the “Ann-Arbor-Model”. Put forward in the American Voter, this new model demonstrated its effectiveness by using surveys from the 1952 and 1956 elections. The response from the scientific community was overwhelming: The American Voter became one of the most influential monographs in the history of electoral research and the Ann-Arbor-Model dominated the study of voting behavior in western democracies for many years after its publication.

The American Voter deviated from the Michigan-Group’s past work in two respects. First, party identification was now taken as a long-term stable variable, causally prior to individual evaluations of candidates and political issues. Second, psychological variables were no longer taken as given, but rather were seen as influenced by a voter’s sociological background. This included the experiences of an individual’s reference groups with the various parties and an integral role for the strengthening or weakening of opinions through a voter‘s immediate social circumstances. The Ann-Arbor-Model can therefore be considered an extension of sociological theories of voting behavior.

It is often overlooked, however, that the American Voter describes a wide range of potential influencing factors, in later years were seen as alternatives to the social-psychological model. These factors include for example the institutional context, economic situation or personality structure of voters.

Using the famous image of the “causality funnel” Campbell et al. summarized the relationship of all these varied factors. Individual vote decision is understood as the result of a complex process principally traced far back into a voter’s past. At the moment of the vote decision itself, only the previously identified psychological variables are of interest. The further one moves back into a voter’s history, the more potential influences have to be taken into account to explain the final behavior. The causality funnel therefore expands into the past until a complexity of factors is reached that the researcher can no longer untangle.

Despite its evident advantages, a dispute arose over the next several years concerning the Ann-Arbor-Model’s portability outside of the American context. Especially problematic for the Michigan-Group was the central concept of party identification: The idea of a “psychological membership” seemed too dependent on the peculiarities of the American system, particularly the (relatively) stable two-party system, the organizational weakness of the major parties and the absence of historically-based ideological conflicts.

In an influential contribution Russell Dalton, Paul Allen Beck and Scott C. Flanagan showed that long-term stable party identification did not imply a “psychological party membership”. The characteristic coalitions between social groups on the one hand and ideological parties on the other in Europe, as set out by Lipset und Rokkan, could instead be considered the functional equivalent of party identificationdescribed in the American Voter.

The Rational Voter Model

The theory of rational voting goes back to Anthony Downs’ pioneering study An Economic Theory of Democracy. Building on prior work by Kenneth Arrow, Joseph Schumpeter, Herbert Simon and others, Downs applied the tenets of neo-classical economics to voting behavior and provided the impetus for a new and fruitful research agenda in political science.

Downs’ concept differed from previous approaches in two respects. First, Downs’ approach to electoral research was primarily theoretical: Downs engaged in no empirical studies, but rather limited himself to deductively deriving axiomatic propositions that could be empirically tested. Second, the approach founded by Downs was based much more strongly on formal modeling than earlier approaches. While the sociological and socio-psychological approaches tied into experiences from everyday political life and seemed intuitively plausible despite their abstractions, the rational choice approach initially struck many researchers as all too artificial and unrealistic. That the contributions of rational choice theorists were often presented through systems of equations only strengthened this impression.

The starting point for Downs is the assumption that politicians and voters behave as rational actors in a market, in which political power (in the form of votes) is exchanged for the realization of political objectives. The “rationality” of actors is therefore understood in a formal sense that has nothing to do with “reasonableness” in the commonly accepted sense, but rather is solely related to the decision between alternative actions.

According to the model, rational actors possess stable and transitive preferences, which gives them the ability to select from a set of alternatives to maximize their benefits. “Benefits” are not limited to economic gains for an actor, but rather any result that is in line with their preferences. “Stable” means nothing more than that the preferences of actors remain constant during the period in question; “transitive” means that there are no contradictory or cycling preferences. A rational actor that prefers a government formed by Party A to one formed by Party B, and prefers Party B to Party C, must therefore prefer Party A to Party C given a choice between the two.

If one assumes that political programs can be placed as positions on an ideological Left-Right continuum, a rational voter will choose the party that stands nearest to their “ideal point” on that continuum (the point where their benefits are maximized). At the same time, parties will formulate their political programs with an eye toward maximizing their vote total. As the preferences of actors are seen as stable, changes in behavior are only explained through structural changes, such through the entry of a Party D.

How the “benefits” of actors persist and how their preferences come about are not discussed in rational choice models. As the preferences of actors are as a rule constructed from observations of their behavior, the rational voter approach is fundamentally tautological: The rationality postulate is an axiom rather than an empirically tested hypothesis.

But this tautological structure is precisely the greatest strength of the rational choice approach. It makes it possible to connect psychological or sociological models to the rational choice approach by treating them as mechanisms for the construction of preference sets. Thus it is possible to hold exogenous the complex and often-idiosyncratic backgrounds of individual voters in order to focus on the influence the structural features of a situation have on decision-making.

Downs himself recognized some of the complications that arose from exporting market behavior to electoral research. The most famous of these problems is the so-called „paradox of voting“: Independent of the electoral system, in a mass-democracy with millions of voters the probability of any one voter casting the winning vote is impossibly small. There is therefore effectively no relationship between a voter’s behavior and the victory of their preferred party. While it is unlikely that an actor can draw some personal (instrumental) benefit from casting their ballot, participation certainly entails costs. A voter has to spend time and/or money to build a picture about the intentions of the various parties (information costs). Furthermore, the acts of voting or voter registration often take time, which means foregoing other material or immaterial benefits (opportunity costs).

The net benefit of voting is therefore always negative and rational individuals should not choose to vote. This conclusion contradicts actual voter turnout, which consistently reached 70-80% in many democratic states in the 20th Century. Many solutions have been suggested to solve the paradox of voting, though all have their complications.

The uncertainty inherent in the act of voting is not limited to whether one’s own behavior can affect the outcome. For example, a voter cannot be certain whether she will receive their desired outcome for the actual costs spent; her party could lose the election. Uncertainty also exists regarding a party’s future actions. Even when parties intend to honor promises made during the election, changes in the general political situation could cause them to depart from their programs.

Voters in mass-democracies find themselves thus in a “low-cost situation” (Kirchgässner). Rational choice explanations typically do not delve further into the intricacies of behavior in low-cost situations, as it is already highly irrational under these circumstances for rational actors to put effort into collecting information or engaging in a cost-benefit analysis. Instead moral and expressive patterns dominate behavior in these situations; decisions are made on the basis of everyday information, group norms or fundamental ideological beliefs, which function as information shortcuts (Popkin). Rational voters therefore often behave as the sociological or social-psychological models would predict. Such considerations were already evident in Downs’ approach and stand at the center of the research agenda for some newer theories of rational voting.

Kai Arzheimer / Jürgen W. Falter

See also: Lazarsfeld, Paul F., Party Identification,People’s Choice, The (book), Survey Research Center , Voting (book), Two – Step Flow Model of Communication

Further Readings and References

Berelson, B., Lazarsfeld, P. F., & McPhee, W. N. (1954). Voting. A Study of Opinion Formation in a Presidential Campaign. Chicago: Chicago University Press.

Brennan, G., & Lomasky, L. (1993). Democracy and Decision. The Pure Theory of Electoral Preference. Cambridge, New York: Cambridge University Press.

Campbell, A., Converse, P. E., Miller, W. E., & Stokes, D. E. (1960), The American Voter. New York: John Wiley.

Dalton, R. J., Beck, P. A., & Flanagan, S. C. (1984). Electoral Change in Advanced Industrial Democracies. In R. J. Dalton & S. C. Flanagan & P. A. Beck (Eds.), Electoral Change in Advanced Industrial Democracies: Realignment or Dealignment (pp. 3-22). Princeton: Princeton University Press.

Downs, A. (1957). An Economic Theory of Democracy. New York: Harper.

Kirchgässner, G. (1992). Towards a Theory of Low-cost Decisions. European Journal of Political Economy, 8, 305-320.

Lazarsfeld, P. F., Berelson, B., & Gaudet, H. (1944). The People’s Choice. How the Voter Makes up His Mind in a Presidential Campaign. Chicago: Columbia University Press.

Lipset, S. M. & Rokkan, S. (1967), Cleavage Structures, Party Systems, and Voter Alignments: An Introduction, in: Lipset, S. M. & Rokkan, S. (Eds.), Party Systems and Voter Alignments: Cross-National Perspectives (pp. 1-64). New York, London: Collier-Macmillan

Popkin, Samuel L. (1994). The Reasoning Voter. Communication and Persuasion in Presidential Campaigns (2 ed.). Chicago, London: University of Chicago Press.