This is the author’s version of the work. Please cite as:

    Arzheimer, Kai. “Quantitative Methoden zur Erforschung von rechtsextremistischem / rechtsradikalem / rechtspopulistischem Wahlverhalten.” Handbuch Rechtsextremismus. Eds. Häusler, Alexander, Cordelia Hess, Anke Hoffstad, and Florian Virchow. Wiesbaden: Springer VS, 2023. .
    [BibTeX] [Download PDF] [HTML]

    @InCollection{arzheimer-2023b,
    author = {Arzheimer, Kai},
    title = {Quantitative Methoden zur Erforschung von rechtsextremistischem /
    rechtsradikalem / rechtspopulistischem Wahlverhalten},
    booktitle = {Handbuch Rechtsextremismus},
    publisher = {Springer VS},
    year = 2023,
    editor = {Häusler, Alexander and Hess, Cordelia and Hoffstad, Anke and
    Virchow, Florian},
    address = {Wiesbaden},
    url = {https://www.kai-arzheimer.com/quantitative-methoden-rechtsradikal-wahlverhalten.pdf},
    html = {https://www.kai-arzheimer.com/quantitative-methoden-rechtsextremismus},
    }

Einleitung und Überblick

Die Ergebnisse zur Wahlsoziologie rechtsextremer, rechtsradikaler und rechtspopulistischer Parteien (im Folgenden: rechte Flügelparteien) stützen sich primär auf quantitative Methoden zur Erhebung und Auswertung von Daten. Diese sind im Wesentlichen identisch mit den Verfahren, die in der allgemeinen Wahlforschung angewendet werden. Eine Besonderheit besteht aber darin, dass die Wahl solcher Parteien von Forschenden oft als problematisch, zumindest aber als besonders erklärungsbedürftig betrachtet wird. Deshalb wurden hier auch einige vergleichsweise komplexe theoretische Ansätze entwickelt, zu deren empirischer Prüfung entsprechende Daten und Verfahren benötigt werden. Die Wahlsoziologie der Rechtsaußenparteien ist deshalb stark von der methodologischen Innovation in den Sozialwissenschaften beeinflusst.

Um sich einen Überblick über Daten und Erklärungsmuster zu verschaffen, hat sich in der Literatur eine Dreiteilung in Mikro-, Meso- und Makro-Ebene durchgesetzt (Arzheimer (2018); für eine ergänzende Perspektive siehe Schoen (2014)). Dabei beziehen sich Mikro-Variablen auf einzelne Personen, während Makro-Variablen – z.B. die nationale Arbeitslosenquote oder das Wahlsystem zum Bundestag – Phänomene auf der Ebene der Gesamtgesellschaft beschreiben. Zwischen diesen beiden Polen liegt die Meso-Ebene, die im weitesten Sinne die Beziehungen innerhalb sozialer Gruppen und deren Eigenschaften umfasst. Die Liste der Gruppen, auf die sich potentiell relevante Variablen beziehen, reicht dabei von den kleinsten Einheiten (Kernfamilie bzw. Haushalt) über Nachbarschaften und Gemeinden bis hin zu großen Einheiten (Regionen und Bundesländer). Auch der vorliegende Artikel orientiert sich an dieser Einteilung.

Der nächste Abschnitt geht zunächst auf das in der Wahlsoziologie dominierende Forschungsdesign und insbesondere auf dessen Schwächen ein. Die darauf folgenden Abschnitte sind dann den Datenquellen und Erhebungsmethoden bzw. den Auswertungsmethoden gewidmet. Eine kurze Zusammenfassung schließt den Artikel ab.

Forschungsdesigns

Grundsätzlich lassen sich zwei Haupttypen von Forschungsdesigns unterscheiden (siehe für das Folgende z.B. Schnell et al. 2018, Kap. 5): experimentelle Designs und Ex-post-facto-Designs. Kern aller experimentellen Designs ist, dass die Forschenden den Wert einer Variablen, für die ein ursächlicher Effekt auf die abhängige Variable (hier: die Wahlentscheidung) vermutet wird, manipulieren können. Kombiniert man diese Manipulation mit einer Randomisierung, d.h. einer zufälligen Aufteilung der Untersuchungspersonen auf zwei oder mehrere Gruppen, für die diese Variable auf unterschiedliche Werte gesetzt wird, lassen sich mit einem experimentellen Design kausale Effekte nachweisen: Da beide Gruppen zufällig zusammengesetzt sind und sich nur im Wert der unabhängigen Variablen unterscheiden, können eventuelle Mittelwertunterschiede bezüglich der abhängigen Variablen nur durch diese zu erklären sein (Schnell et al. 2018, S. 199).

Bis vor kurzem haben experimentelle Designs für die Rechtsextremismus- und Rechtsradikalismus-Forschung so gut wie keine Rolle gespielt, da zentrale Variablen wie die soziale Klasse, die Generationszugehörigkeit, der Bildungsgrad oder die Erfahrung von Jobverlust und Deprivation nicht manipuliert werden können und dürfen. Der weit überwiegende Teil der Forschung basiert deshalb auf Ex-post-facto-Designs, bei denen Variablen, die möglicherweise kausal verbunden sind, von den Forschenden beobachtet werden, ohne dass diese den Wert der vermeintlichen unabhängigen Variablen beeinflussen und die Untersuchungspersonen diesen unterschiedlichen Stimuli zufällig zuweisen können. In einem solchen Design ist nie auszuschließen, dass ein statistischer Zusammenhang zwischen zwei Variablen nicht kausal ist, sondern durch eine gemeinsame Hintergrundvariable verursacht wird (Schnell et al. 2018, Kap. 5.4.3).

Am besten lässt sich dies an einem Beispiel illustrieren. In einer Vielzahl von Untersuchungen hat sich gezeigt, dass Arbeitslose etwas häufiger rechtsradikale Parteien wählen als Nicht-Arbeitslose. Zwischen beiden Merkmalen besteht also ein statistischer Zusammenhang. Möglicherweise kommt dieser aber durch eine gemeinsame Ursache zustande. So dokumentiert eine lange Forschungstradition die Verbindung zwischen rigiden Denkstilen und der Unterstützung rechter Parteien (zusammenfassend Schumann 2001, 2005). In einer Zeit, in der im Beruf lebenslanges Lernen und immer größere Flexibilität gefordert werden, ist es zumindest plausibel, dass solche Denkstile nicht nur das Wahlverhalten beeinflussen, sondern auch das Risiko eines Jobverlustes erhöhen. Die Verbindung zwischen Arbeitslosigkeit und Rechtswahl wäre dann ein Scheinzusammenhang.

Auch im Rahmen eines Ex-post-facto-Designs kann ein solcher Scheinzusammenhang aufgedeckt werden, indem die Hintergrundvariable statistisch kontrolliert wird (Schnell et al. 2018, Kap. 5.4.3.1.3). Dazu könnte man die Untersuchungspersonen in eine Gruppe mit hohen und eine Gruppe mit niedrigen Werten für Rigidität aufteilen. Innerhalb dieser beiden Gruppen sollte dann zwischen Arbeitslosigkeit und Rechtswahl kein Zusamenhang mehr bestehen.

Mit Hilfe des unten vorgestellten Verfahrens der multiplen Regression kann diese Logik des “Konstanthaltens” für mehre potentielle Hintergrundvariablen parallel angewendet werden. Voraussetzung ist aber immer, dass diese Hintergrundvariablen bekannt sind und auch tatsächlich gemessen wurden, während das experimentellen Design gleichsam automatisch für alle potentiellen Hintergrundvariablen kontrolliert, da sich durch die Randomisierung deren Verteilung zwischen den Gruppen nicht systematisch unterscheidet. Diese grundlegende Schwäche des Ex-post-facto-Designs ist auch durch raffinierteste statistische Verfahren nicht zu beheben (Sekhon 2009).

Wie in anderen Bereichen der Politikwissenschaft ist deshalb auch in der Rechtsextremismusforschung das Interesse an alternativen und komplementären Designs gewachsen (Faas und Huber 2010, S. 722–723). Besonders beliebt sind dabei Survey-Experimente (Faas und Huber 2010, S. 728–729). Diese integrieren eine experimentelle Komponente in den Ablauf einer Befragung (siehe z.B. Bos et al. 2020; Kaufmann 2019; Marx und Schumacher 2018; Spanje und Weber 2017). Auf diese Weise können Eigenschaften (fiktiver) Parteien, PolitikerInnen und politischer Botschaften variiert werden, um deren kausale Wirkungen auf die Untersuchungspersonen zu identifizieren. Wie bei jedem sozialwissenschaftlichen Experiment stellt sich hier allerdings die Frage nach der externen Validität, d.h. nach der Übertragbarkeit der unter kontrollierten Bedingungen gefundenen Effekte auf die wesentlich unstrukturierteren Kommunikationssituationen im Alltag.

Bei sogenannten natürlichen Experimenten ((Schnell et al. 2018, S. 204–205)(Titiunik 2021)) ist diese externe Validität hingegen sehr hoch. In einem solchen “quasi-experimentellen” Design kommt es beispielsweise während der Feldzeit einer Ex-post-facto-Studie (meistens einer Befragung) zu einem Ereignis, das potentiell einen kausalen Effekt auf die abhängige Variable haben könnte. Anders als beim echten Experiment wird dieses Ereignis nicht von den Forschenden ausgelöst, und es gibt keine Randomisierung. Wenn man jedoch argumentieren kann, dass sich die Personen, die kurz vor Eintritt des Ereignisses befragt oder beobachtet wurden, nicht systematisch von den kurz danach untersuchten Personen unterscheiden, lassen sich eventuelle Unterschiede plausibel auf das Ereignis selbst zurückführen. Aktuelle Beispiele aus der Forschung sind die Zunahme von negativen Einstellungen gegenüber ZuwanderInnen unmittelbar nach einem islamistischen Terroranschlag in Paris (Ferrín et al. 2019) sowie der Rückgang der Unterstützung für die rechtsradikale spanische Partei VOX nach der Wahlniederlage Donald Trumps (Turnbull-Dugarte und Rama 2022).

Allerdings lassen sich mit Survey- und Quasi-Experimenten nur die Wirkungen von Eigenschaften der politischen Situation untersuchen. Eigenschaften der Personen selbst können im Survey-Experiment nicht manipuliert werden, und individuelle “natürliche” Ereignisse (z.B. der Verlust des Arbeitsplatzes oder der Umzug in eine Gegend mit einem hohen Anteil von MigrantInnen) treten, wie oben dargelegt, nicht quasi-zufällig auf. Trotz seiner Schwächen bleibt das Ex-post-facto-Design deshalb für die Wahlforschung von zentraler Bedeutung.

Datenquellen

Mikro-Ebene: standardisierte Umfragen

Die moderne Wahlforschung orientiert sich am erkenntnisleitenden Prinzip des methodologischen Individualismus. Die überwältigende Mehrheit der in der Wahlforschung betrachteten Daten bezieht sich deshalb auf die Mikro-Ebene. Hier wiederum stammen die weitaus meisten Daten aus standardisierten Befragungen (siehe Schumann 2019; Schnell 2019). Andere Erhebungsformen (Beobachtung, Inhaltsanalyse, teilstandardisierte oder offene Interviews) spielen kaum eine Rolle. Charakteristisch für standardisierte Umfragen ist, dass beim Entwurf des Fragebogens nicht nur die Fragetexte, sondern bei den meisten Fällen auch die möglichen Antwortkategorien festgelegt werden.

Zur Erfassung sozio-demographischer Merkmale existiert dafür eine Reihe von Empfehlungen und De-facto-Standards (Beckmann et al. 2016), was die Vergleichbarkeit der Ergebnisse verbessert. Dies gilt, wie unten dargelegt, in ähnlicher Form auch für die Fragen zur Erhebung von politischen und anderen Einstellungen.

Das bei weitem verbreitetste Format für Einstellungsfragen besteht aus einer Aussage (Item), die sich auf den Gegenstandsbereich der Einstellung bezieht und von den Befragten bewertet werden soll. Dabei wird eine geordnete Reihe von Antworttexten vorgegeben, die von starker Ablehnung bis zu starker Zustimmung reichen. Variationen gibt es u.a. hinsichtlich der Zahl der Antwortvorgaben und der verbalen Beschreibung der einzelnen Abstufungen ((Schnell 2019, Kap. 4.4.3)(Schumann 2019, S. 58–74)).

Oft werden Items, die sich auf dieselbe oder eng verwandte Einstellungen beziehen, in Blöcken (Itembatterien) zusammengefasst. Idealerweise sollten dabei positive und negative Formulierungen gemischt werden, um die Befragten nicht in eine bestimmte Richtung zu drängen und stereotypes Antwortverhalten zu reduzieren.

Wie bei anderen Erhebungsformen lassen sich auch bei standardisierten Befragungen Quer- und Längsschnittstudien unterscheiden. Querschnittsbefragungen finden nur zu einem einzigen Zeitpunkt statt, während längsschnittliche Untersuchungen mehrere Befragungszeitpunkte umfassen. Dabei kann man noch einmal zwischen zwei Varianten differenzieren. Bei Trendstudien wird ein ganz oder in Teilen identisches Frageprogramm in mehr oder minder großen Abständen einer jeweils neuen Gruppe von Untersuchungspersonen vorgelegt (Schnell et al. 2018, S. 221–222). Auf diese Weise lassen sich gesellschaftliche Veränderungen über die Zeit – die im Namen angesprochenen Trends – nachzeichnen. Wesentlich aufwendiger sind Panelstudien, bei denen dieselben Untersuchungspersonen wiederholt befragt werden (Schnell et al. 2018, Kap. 5.4.3.2). Mit den resultierenden Daten lassen sich nicht nur kollektive, sondern auch individuelle Veränderungen nachverfolgen.

Dieser Stärke des Paneldesigns stehen aber einige Nachteile gegenüber (Schnell et al. 2018, S. 215–216). Der Aufbau und die Pflege eines Panels ist aufwendig und teuer, da die Befragten über Jahre, wenn nicht über Jahrzehnte nachverfolgt und motiviert werden müssen. Dies gelingt vor allem bei am Thema der Befragung besonders interessierten Teilnehmenden, so dass das Panel mit der Zeit der Allgemeinbevölkerung immer unähnlicher wird. Zudem steht zu erwarten, dass es bei den Teilnehmenden durch die wiederholte Beschäftigung mit denselben Fragen zu Meinungsbildungsprozessen kommt, die in dieser Form in der Bevölkerung nicht stattfinden. Wenn solche Paneleffekte nicht korrigiert werden, gefährden sie die Repräsentativität der Stichprobe.

Im allgemeinen Sprachgebrauch gilt eine Stichprobe als repräsentativ, wenn sie wie ein verkleinertes Abbild der Gesamtbevölkerung (Grundgesamtheit) betrachtet werden kann ((kritisch zum Begriff Schumann 2019, S. 84)(Schnell 2019, Kap. 7.4.3)). Dies ist durch eine rein zufällige Auswahl der Untersuchungspersonen aus der Grundgesamtheit gesichert. Bei einer solchen Zufallsstichprobe ist für alle Angehörigen der Grundgesamtheit angebbar, mit welcher Wahrscheinlichkeit sie in die Stichprobe eingeschlossen werden.

Allerdings stößt das klassische Umfragedesign – zufällige Auswahl eines Haushalts, dann zufällige Auswahl der Zielperson innerhalb des Haushalts, mit der anschließend ein persönliches Interview geführt wird (Schumann 2019, Kap. 3.2) – immer stärker an seine Grenzen. Einerseits sind persönliche Befragungen kaum noch zu finanzieren, andererseits ist die Teilnahmebereitschaft stark und in systematischer Weise gesunken, so dass vor allem besonders interessierte, gut gebildete und motivierte Zielpersonen erreicht werden. Um die daraus resultierenden Verzerrungen zu korrigieren, müssen die Daten entsprechend gewichtet werden.

Das Problem steigender Kosten bei niedriger, selektiver und weiter sinkender Teilnahmebereitschaft stellt sich in ähnlicher (was die Beteiligungsraten angeht sogar verschärfter) Form bei telefonischen Zufallsbefragungen, die wegen der grundsätzlich niedrigeren Kosten zwischenzeitlich an Beliebtheit gewonnen hatten (Schnell 2019, S. 275). Deshalb greift auch die akademische Forschung in den letzten Jahren verstärkt auf Pools von Personen (access panel) zurück, die grundsätzlich bereits sind, sich (zumeist online) an Umfragen zu beteiligen. Um die oben angesprochenen Verzerrungen gering zu halten, ist es wichtig, dass die Teilnehmenden (auch) offline rekrutiert werden (Bandilla 2015). Üblich ist außerdem, dass bei der Auswahl aus dem Pool vorab Quoten für Alter, Geschlecht, Bildung und andere sozio-demographische Merkmale festgelegt werden. Damit dies gelingen kann und niemand zu häufig befragt wird, sollte der Pool idealerweise mindestens einige tausend Personen umfassen.

Trotzdem sind selbst Querschnittsbefragungen, die meist im Rahmen eines befristeten und auch inhaltlich beschränkten Forschungsprojektes durchgeführt werden, teuer und meist nur mit externen Mitteln zu finanzieren. Deshalb ist es inzwischen Standard (und teils Voraussetzung für eine externe Förderung), dass die erhobenen Daten nach Abschluss des jeweiligen Projektes der wissenschaftlichen Gemeinschaft zur Verfügung gestellt werden.

Öffentlich finanzierte Trend- und Panelstudien sind von vornherein auf eine solche kollektive Nutzung ausgelegt. Sie bestehen aus einem wiederkehrenden Kern und einer Reihe von Modulen zu bestimmten Themen, von denen einige in großen Abständen wiederholt werden. Die überwältigende Mehrzahl der Studien zur Wahlsoziologie rechtextremer und rechtsradikaler Parteien stützt sich auf solche Datensätze, die über das Datenarchiv von GESIS oder kleinere Repositorien öffentlich zugänglich sind. Nicht immer sind diese Datensätze in idealer Weise zur Beantwortung der jeweiligen Fragestellung geeignet. Andererseits ermöglicht es diese Praxis der Sekundäranalyse, bereits vorhandene Daten nach Jahren oder Jahrzehnten noch einmal mit innovativen Methoden und auf neue Fragestellungen hin zu untersuchen (siehe z.B. Mayer 2011) und die Robustheit publizierter Studienergebnisse kritisch zu überprüfen.

Für empirische Studien zur Wahlsoziologie rechter Flügelparteien werden Datensätze benötigt, die mindestens Angaben zu den gängigen sozio-demographischen Merkmalen (Alter, Geschlecht, formale Bildung, Beruf, Religion, Bundesland) sowie Angaben zur Wahlabsicht oder zu vergangenen Wahlentscheidungen enthalten. Darüber hinaus sollten auch Informationen zu politischen Einstellungen vorhanden sein. Da die Bandbreite potentiell relevanter Einstellungen sehr groß ist, findet sich in den meisten Datenquellen nur eine Teilmenge der gewünschten Informationen. Glücklicherweise wurden im Lauf der Zeit aber die entsprechenden Frageformulierungen weitgehend standardisiert (siehe dazu das Portal https://zis.gesis.org/). Deshalb ist es oft möglich, Einzelbefunde über heterogene Datensätze hinweg zu vergleichen oder sich aus mehreren Datensätzen einen Gesamteindruck zu verschaffen.

Zu den für die Wahlsoziologie der rechten Flügelparteien wichtigsten Einstellungen zählen die Parteiidentifikation, die allgemeine Links-Rechts-Selbsteinstufung, die Bewertung politischer KandidatInnen, die generalisierte Bewertung möglichst aller Parteien (Parteisympathie) sowie Einstellungen zu Zugewanderten, zur Zuwanderung und zu anderen politischen Themen. Hinzu kommen eine Reihe von Item-Batterien, die speziell entwickelt wurden, um die Wahl rechter Flügelparteien zu erklären. Zu diesen gehören verschiedene Skalen, die auf populistische Einstellungen abzielen (Silva et al. 2020), Skalen zur Messung von Rechtsautoritarismus (Altemeyer 1981) sowie Instrumente zur Messung von rechtsextremistischen Einstellungen (für einen Überblick siehe Arzheimer 2020). Im deutschen Kontext spielt der Bezug zum Nationalsozialismus dabei naturgemäß eine zentrale Rolle.

Erste Versuche, ein Standardinstrument zur Messung rechtsextremer Einstellungen zu entwickeln, gab es bereits seit Ende der 1960er Jahre (Klingemann und Pappi 1972; Herz 1975). Aufbauend auf diesen Arbeiten wurde dann Anfang der 1990er Jahre an der Universität Mainz eine Itembatterie entwickelt, die rund zehn Jahre später wiederum die Grundlage für die Arbeit der sogenannten “Konsensgruppe” bildete (Kreis 2007). Zum Kern der Mainzer Batterie zählten eine Reihe von Items, die Antisemitismus (u.a. “Auch heute noch ist der Einfluss der Juden zu groß”) und die Verharmlosung des Nationalsozialismus (u.a. “Ohne die Judenvernichtung würde man Hitler heute als einen großen Staatsmann ansehen”) erfassen sollten. Obwohl ein Konsens im Sinne eines universell akzeptierten Instruments nicht zustande kam, werden einige der damals entwickelten Items in ursprünglicher oder leicht veränderter Form bis heute genutzt.

Zu den wichtigsten Trendstudien, die für Sekundäranalysen zur Wahlsoziologie rechter Flügelparteien zur Verfügung stehen, zählen in Deutschland die Allgemeine Bevölkerungsumfrage der Sozialwissenschaften (ALLBUS), das deutsche Teilprojekt des European Social Survey (ESS) und die German Longitudinal Election Study (GLES). Alle drei Studien werden durch den Bund und die Länder finanziert, entsprechen höchsten methodologischen Standards und sind mittlerweile gemeinsam unter dem Dach des GESIS Leibniz-Instituts für Sozialwissenschaften untergebracht.

Der ALLBUS ist eine klassische, am Vorbild des US-amerikanischen General Social Survey orientierte Mehr-Themen-Befragung, die seit 1980 im Zwei-Jahres-Rhythmus wiederholt wird. Neben den sehr umfassenden sozio-demographischen Variablen werden in jeder Welle u.a. die Wahlabsicht sowie die Links-Rechts-Selbsteinstufung abgefragt. Hinzu kommen eine Reihe von Schwerpunkten, die für Wahlsoziologie rechter Flügelparteien besonders interessant sind. Dazu zählen u.a. die Themen “Ausländer, Immigration und ethnische Minderheiten” (1996, 2006, 2016) sowie “Nationalstolz und Rechtsextremismus” (2008, 2018). Durch die Replikation einzelner Fragebatterien lassen sich gesellschaftliche Entwicklungen nachvollziehen, die in diesem Bereich seit den 1990er Jahren stattgefunden haben.

Der European Social Survey ähnelt in seiner Struktur dem ALLBUS, ist aber als international vergleichende Studie im Zwei-Jahres-Abstand angelegt, an der seit 2002 mehr als 40 europäische Länder sporadisch oder regelmäßig teilgenommen haben. Deutschland hat sich an allen elf Erhebungsrunden beteiligt, so dass hier eine weitere sehr dichte Zeitreihe vorliegt. Neben den Basisinformationen zu Wahlabsicht und grundlegenden politischen Einstellungen enthält das Kernprogramm des ESS auch Fragen zu Gefühlen der kulturellen und ökonomischen Bedrohung durch Immigration. Hinzu kommen Schwerpunkte zu den Themen Migration (2002 und 2014) und Demokratieverständnis (2002 und 2020).

Die GLES schließlich ist die nationale Wahlstudie für Deutschland, die in ihrer heutigen Form seit 2009 betrieben wird. Nachdem ihre Struktur zwischenzeitlich etwas vereinfacht wurde, besteht sie aktuell aus fünf Komponenten: (1) zwei Querschnittsbefragungen, die in den Wochen vor und nach einer Bundestagswahl stattfinden, (2) einer rollierenden Querschnittsbefragung, bei der in den beiden Monaten vor einer Bundestagswahl täglich 100-120 Personen befragt werden, um kurzfristige Stimmungsänderungen im Wahlkampf abbilden zu können, (3) einer Panelstudie mit mehreren Befragungszeitpunkten zwischen 2016 und 2021, (4) eine Serie von kurzen, online-basierten Querschnittsbefragungen (Tracking) mit drei bis vier Befragungszeitpunkten pro Jahr seit 2009 und (5) einer Befragung von Kandidierenden zu jeder Bundestagswahl. Gegenüber ALLBUS und ESS hat die GLES den Vorteil, dass ihr ganzes Design auf die Erklärung von Wahlverhalten hin ausgelegt ist und aufgrund der insgesamt sehr großen Fallzahlen vor allem in der Tracking-Komponente auch die Wähler kleinerer Parteien gut erfasst werden können. Andererseits werden in der GLES nur wenige Einstellungen erhoben, die speziell für Erklärung von rechtsradikalem oder rechtsextremem Wahlverhalten von Interesse sind.

Neben ALLBUS, GLES und ESS ist das Sozio-Ökonomische Panel (SOEP) eine weitere öffentlich finanzierte Datenquelle, die für die Sozialforschung in Deutschland von zentraler Bedeutung ist. Allerdings wird im SOEP nicht die Wahlabsicht, sondern nur eine Form der Parteiidentifikation erhoben. Deshalb spielt es für die Wahlsoziologie keine große Rolle.

Indirekt öffentlich finanziert und ebenfalls über das Datenarchiv verfügbar sind außerdem das Politbarometer und der Deutschlandtrend. Dabei handelt es sich um zwei Trendstudien, die in meist monatlichem Abstand für die Politikberichterstattung von ZDF bzw. ARD erhoben werden. Beide enthalten vergleichsweise wenig kontinuierlich erhobene Fragen, sind aber wegen der großen Fallzahlen, der häufigen Befragungen und der sehr langen Zeitreihen von Interesse: der Deutschlandtrend reicht bis 1998, das Politbarometer sogar bis 1977 zurück.

Zuletzt müssen an dieser Stelle noch die “Mitte”-Studien erwähnt werden, die seit 2002 im Zwei-Jahres-Rhythmus durchgeführt und von verschiedenen Stiftungen finanziert wurden. 2014 kam es zu einer Spaltung: die von der ursprünglichen Gruppe an der Universität Leipzig koordinierte Studienserie firmiert jetzt als Leipziger Autoritarismusstudie, während die neue Mitte-Studie nun unter neuer Leitung an der Universität Bielefeld angesiedelt ist. Nicht zuletzt wegen der teils reißerischen Titel der zugehörigen Berichte werden die Ergebnisse dieser Studien kontrovers diskutiert, zugleich aber von einer viel breiteren Öffentlichkeit wahrgenommen, als dies bei Arbeiten mit dem ALLBUS, dem ESS oder der GLES normalerweise der Fall ist. Anders als die Daten aus diesen Befragungen sind die Ergebnisse der Mitte-Studien aber nicht für Sekundäranalysen zugänglich. Für die akademische Forschung sind sie deshalb von untergeordneter Bedeutung.

Trotz oder wegen ihrer zentralen Rolle für die Wahlsoziologie rechtsradikaler und rechtsextremistischer Parteien werden Umfragedaten in der Öffentlichkeit manchmal mit einer gewissen Skepsis betrachtet. Neben Zweifeln an der Repräsentativität wird dabei oft das Phänomen der “sozialen Erwünschtheit” (social-desirability bias) angesprochen. Zu einer solchen Verzerrung von Antworten in Richtung des sozial Erwünschten kann es kommen, weil es vielen Menschen unangenehm ist, sich gegenüber den InterviewerInnen zu Meinungen oder Verhaltensweisen zu bekennen, von denen sie annehmen, dass diese gesellschaftlich nicht akzeptiert sind. Dieser Effekt dürfte dazu beigetragen haben, dass in früheren Umfragen die Unterstützung für rechte Flügelparteien häufig unterschätzt wurde.

In persönlichen Befragungen kamen deshalb für solche heiklen Fragen Hilfsmittel wie Antwortlisten oder Kartenspiele zum Einsatz, die die Effekte der sozialen Erwünschtheit reduzieren sollten. Statt einer verbalen Antwort musste dann beispielsweise nur der Buchstabe genannt werden, der der entsprechenden Antwortvorgabe in nicht-alphabetischer Reihenfolge zugeordnet war.

In telefonischen Umfragen ist ein Rückgriff auf solche Hilfsmittel nicht möglich. Zugleich scheinen die Effekte sozialer Erwünschtheit hier aber deutlich schwächer zu sein als im persönlichen Interview. Dies gilt noch mehr für Online-Befragungen, bei denen es gar keine InterviewerInnen gibt. Durch die sinkende Bedeutung persönlicher Befragungen sollte sich das Problem der sozialen Erwünschtheit deshalb reduzieren.

Außerdem ist die aktuelle Situation in Deutschland nicht mit der vergangener Jahrzehnte vergleichbar, in der rechte Flügelparteien nur sporadische Erfolge erzielen konnten. So zeigen Bischof und Wagner (2019) mit Daten aus den Niederlanden, dass unmittelbar mit dem Einzug rechter Parteien ins Parlament die Bereitschaft der Befragten steigt, sich selbst als “rechts” einzustufen, da sie sich nun als weniger isoliert wahrnehmen. Seit den flächendeckenden Wahlerfolgen der AfD sind vergleichbare Effekte auch für Deutschland zu erwarten. Tatsächlich zeigt sich empirisch, dass die AfD anders als ihre Vorgängerparteien in Umfragen nicht unterschätzt wird. Deshalb ist davon auszugehen, dass die Wahlsoziologie rechter Flügelparteien nicht stärker vom Phänomen der sozialen Erwünschtheit betroffen ist als andere Bereich der empirischen Sozialforschung auch.

Meso- und Makro-Ebene: amtliche und andere Daten

Wie oben dargelegt beziehen sich Meso- und Makro-Daten auf Einheiten oberhalb der Individualebene. Aggregatdaten, die durch Mittelwertbildung oder Anteilsberechnung über Personengruppen hinweg zustande kommen, bilden eine wichtige Untergruppe von Meso- und Makro-Daten. Man muss sich jedoch klar machen, dass viele für die Wahlsoziologie interessante Meso- und Makro-Variablen nicht durch die Aggregation von Individualdaten zustande kommen, sondern Eigenschaften der höheren Ebene selbst beschreiben (Hox 2010). In der Wahlsoziologie ist das vielleicht bekannteste Beispiel für solche Variablen die Klassifikation des Wahlsystems eines Landes als listenbasiert, personenorientiert oder gemischt. Es handelt sich hier um eine Eigenschaft des politischen Systems selbst, also eine (globale) Makro-Variable, die nicht auf individuelle Eigenschaften der BürgerInnen zurückzuführen ist. Gleiches gilt auch für weitere institutionelle Variablen wie etwa die Einordnung des politischen Systems als parlamentarisch, präsidentiell oder semi-presidentiell (Shugart und Carey 1992). Bei anderen relevanten Makro-Variablen handelt es sich hingegen tatsächlich um Aggregatdaten. Das im Zusammenhang der Wahl rechter Flügelparteien vermutlich bekannteste Beispiel ist die nationale Arbeitslosenquote, die als Anteil der Arbeitssuchenden an der Erwerbsbevölkerung definiert ist. Auch der Stimmenanteil rechtsextremer und rechtsradikaler Parteien fällt in diese Kategorie.

Eine wichtige Quelle für aggregierte Makro-Daten bildet die amtliche Statistik. In praktisch allen europäischen Ländern gibt es hier eine große Vielfalt sehr genauer, über einen langen Zeitraum gesammelter Daten, die für wissenschaftliche Zwecke zugänglich, wenn auch nicht immer geeignet sind (Schoen 2014, S. 115–123). Makro-Daten, die sich auf das System selbst beziehen, müssen hingegen von den Forschenden mit teils erheblichem Aufwand selbst erhoben werden. Ähnlich wie im Bereich der Umfrageforschung gibt es deshalb einige größere Projekte, die ihre Datensätze als Kollektivgut zur Verfügung stellen. Die aktuell umfassendste Datensammlung ist dabei die des V-Dem Projektes (https://v-dem.net/).

Da sich Makro-Variablen per definitionem auf die System-Ebene beziehen, sind sie primär für ländervergleichende Analysen von Interesse. Denkbar ist aber auch ein Einsatz innerhalb eines Landes über einen längeren Zeitraum hinweg (Zeitreihenanalyse) oder eine Kombination von Ländervergleich und Zeitreihenanalyse (time-series cross-sectional design oder TSCS). Hierbei stellen sich allerdings mehrere Probleme. Erstens ist selbst mit einem TSCS-Design die Zahl der Beobachtungen relativ klein, während viele interessante institutionelle Variablen innerhalb der Länder kaum oder gar nicht über die Zeit variieren. Reine Makro-Datensätze sind deshalb ohnehin relativ “schwach” (Western und Jackman 1994, S. 414–415). Zweitens ist außerdem wegen der normalerweise großen Abstände zwischen einzelnen Wahlen die Zahl der Beobachtungen in der Wahlforschung besonders niedrig. Drittens ist die Wahlsoziologie primär an individuellem Verhalten interessiert. Dementsprechend sollten zu seiner Erklärung nach Möglichkeit Individualdaten vorliegen (Achen und Shively 1995): Weil ganz unterschiedliche Mechanismen auf der Individualebene für die beobachteten Aggregatmuster verantwortlich sein können (Schnell et al. 2018, S. 227), besteht bei der Übertragung von Aggregatzusammenhängen auf individuelles Verhalten stets die Gefahr eines “ökologischen Fehlschlusses” (siehe aber King 1997).

Beispielsweise ist für die 1990er Jahre auf der Kreisebene ein deutlicher Zusammenhang zwischen dem AusländerInnenanteil und dem Stimmenanteil rechtsextremer Parteien dokumentiert. Während hier schon aus Gründen des fehlenden Wahlrechts klar ist, dass dieser Zusammenhang nicht durch das Verhalten der AusländerInnen zustandekam, wurde ein vergleichbare Korrelation zwischen Arbeitslosenquote und rechtsextremen Wahlerfolgen oft als Beleg dafür interpretiert, dass Arbeitslose überdurchschnittlich häufig rechte Parteien unterstützen. Dies mag durchaus der Fall sein. Denkbar ist aber auch, dass Nicht-Arbeitslose sich als Reaktion auf die Arbeitslosigkeit in ihrer Umgebung den rechten Parteien zuwenden, dass es eine gemeinsame Ursache für Arbeitslosigkeit und Rechtswahl gibt (etwa die regionalen Auswirkungen der ökonomischen Globalisierung) oder dass diese und weitere Prozesse parallel ablaufen und so das Aggregatmuster hervorbringen.

Für sich genommen sind Aggregatdaten deshalb nicht gut für die Wahlsoziologie geeignet. Moderne Varianten der Regressionanalyse ermöglichen es jedoch, Mehr-Ebenen-Erklärungen des Wahlverhaltens abzubilden, indem sie abhängige und unabhängige Variablen auf der Mikro-Ebene gemeinsam mit zusätzlichen unabhängigen Variablen auf der Makro- und Meso-Ebene modellieren (Hox 2010). Auf diese Weise lassen sich beispielsweise die Effekte individueller und kollektiver Arbeitslosigkeit auf das individuelle Wahlverhalten schätzen, ohne dass die Gefahr eines Fehlschlusses besteht.

Als Meso-Daten werden die vielfältigen Variablen bezeichnet, die sich auf soziale Strukturen oder Personengruppen unterhalb der nationalen Ebene beziehen. Eine besonders wichtige Datenquelle ist auch hier die amtliche Statistik. Für die Wahlsoziologie der rechten Flügelparteien von Interesse sind hier u.a. Informationen zum Wahlverhalten, zur demographischen Struktur der Bevölkerung (Alter, Geschlecht, Bildung, ZuwanderInnen), zu regionalen Wirtschafts- und Sozialdaten (Wachstum, Arbeitslosigkeit, Sozialleistungen, Wirtschaftsstruktur) und zur Infra- und Siedlungsstruktur.

Wie in anderen Bereichen des öffentlichen Lebens auch ist die Nutzung der in Deutschland prinzipiell vorhandenen Informationen für die Forschung durch drei Faktoren beschränkt: den Datenschutz, den Föderalismus und die mangelhafte digitale Erschließung der Daten. Zumindest beim letzten Punkt hat sich die Situation in den letzten Jahren aber deutlich verbessert: Für die Ebene der Kreise und kreisfreien Städte steht ist eine Vielzahl von Informationen in maschinenlesbarer Form über die Portale https://www.regionalstatistik.de/ und https://www.inkar.de/ zur Verfügung. Einige Variablen sind auch für die Ebene der Städte und Gemeinden verfügbar. Da Größe, Zahl und Aufgaben der Gemeinden zwischen den Bundesländern aber sehr stark variieren, stellt sich hier die Frage nach der Vergleichbarkeit der Daten.

Ein Spezialfall der amtlichen Statistik ist die repräsentative Wahlstatistik (Schoen 2014, S. 123–125). Für diese Sonderauszählung werden in knapp drei Prozent aller Stimmbezirke die Wählerverzeichnisse nach Geschlecht und zehn Altersklassen aufgeteilt und die Stimmzettel entsprechend markiert, so dass diese nach Gruppen getrennt ausgezählt werden können. Auf diese Weise kann für jede der zwanzig Merkmalskombinationen die Wahlbeteiligung und das Wahlverhalten ermittelt werden. In den Berichten, die das Statistische Bundesamt zu jeder Wahl bereitstellt, werden diese Ergebnisse nicht nur insgesamt, sondern auch nach Bundesländern und Groß-Regionen (alte Länder plus West-Berlin vs neue Länder plus Ost-Berlin) getrennt ausgewiesen.

Da es sich nicht um eine Befragung handelt, sondern tatsächliches Wahlverhalten sowie die Eintragungen zu Alter und Geschlecht aus den Melderegistern erfasst werden, sind die Daten praktisch fehlerfrei. Zudem ist die Stichprobe mit 1,9 Millionen Wahlberechtigten (2021) so groß, dass selbst auf der Ebene einzelner Bundesländer Stichprobenfehler keine nennenswerte Rolle spielen. Deshalb lässt sich auf Grundlage der repräsentativen Wahlstatistik beispielsweise mit größter Sicherheit festhalten, dass die AfD bei der Bundestagswahl 2021 wie auch bei den vorangegangenen Wahlen in den mittleren Jahrgängen deutlich erfolgreicher war als bei jüngeren und älteren Wahlberechtigten und bei Männern weitaus besser abschnitt als bei Frauen. Weitergehende Aussagen zur Wirkung anderer sozio-demographischer Variablen oder zu den Motiven der AfD-WählerInnen sind auf dieser Grundlage jedoch nicht möglich. Zurecht bemerkt deshalb Schoen, dass das “analytische Potential … mit der Validität der Daten nicht Schritt halten” kann (2014, S. 125).

Jenseits dessen, was die amtliche Statistik zu bieten hat, sind viele Meso-Variablen für die Wahlsoziologie von theoretischem Interesse. Zu nennen wären hier etwa das Meinungsklima in der Umgebung (Rees et al. 2019; Assche et al. 2017), die organisatorische Stärke von Orts- und Kreisverbänden rechter Parteien (Loxbo und Bolin 2016), die Ausstattung der Wohnortgemeinde mit Sozialkapital (Fitzgerald und Lawrence 2011; Fitzgerald 2018) oder der politisch-historische Kontext (Hoerner et al. 2019; Haffert 2021). Diese Informationen müssen allerdings von den Forschenden selbst erhoben werden. Dies ist mit erheblichem Aufwand verbunden, zudem sind Variablen und Operationalisierungen zwischen einzelnen Studien nur schwer vergleichbar.

Auswertungsmethoden

Seit den 1990er Jahren kommen in der empirischen Sozialforschung und damit auch in der Rechtsextremismusforschung zusehends komplexere Analyseverfahren zum Einsatz, deren kompetenter Einsatz ein mehrjährige Aus- und Fortbildung erfordert. Zu jedem einzelnen Verfahren existiert neben der mathematisch-statistischen Grundlagenliteratur eine unübersehbare Menge von Lehr- und Einführungswerken. In diesem Abschnitt kann es deshalb nur darum gehen, einen ganz groben Überblick über die Analysemöglichkeiten zu vermitteln.

Zunächst muss man sich klar machen, dass die quantitative Rechtsextremismusforschung auf Stichproben basiert. Alle Werte, die auf Grundlage einer solchen Stichprobe berechnet werden, weichen mehr oder minder stark von den Verhältnissen in der Grundgesamtheit ab (Stichprobenfehler). Wenn es sich um eine Zufallsstichprobe handelt, folgen diese Stichprobenfehler einer bekannten Zufallsverteilung, und es lässt sich berechnen, wie wahrscheinlich Fehler in einer bestimmten Größenordnung sind. Mit den in der wissenschaftlichen und kommerziellen Forschung gängigen Stichproben von 1000 bis 2000 Fällen sind recht präzise Aussagen möglich. Dies lässt sich mit der Konstruktion von Konfidenzintervallen für Anteilswerte illustrieren. Wenn in einer einfachen Zufallsstichprobe von 1000 Personen 10 Prozent der Befragten angeben, die AfD wählen zu wollen, ergibt sich daraus ein sogenannter Standardfehler von $\sqrt(10 \times (100-10) / 1000) \approx 0,95$ Prozentpunkten. Nach einer gängigen Approximation kann man daraus ein 95-Prozent-Konfidenzintervall mit den Werten 10 ± 1, 96 × 0, 95 ableiten. Dies bedeutet: man kann mit großer (aber nicht absoluter) Sicherheit davon ausgehen, dass der wahre Wert der AfD-AnhängerInnen in der Grundgesamtheit in einem Bereich von etwa 8 bis 12 Prozent liegt.1

Neben der Berechnung von Anteils- und Mittelwerten mit ihren jeweiligen Konfidenzintervallen ist das Verfahren der multiplen Regression das wichtigste Analysewerkzeug der Wahlsoziologie. Die multiple Regression ist ein statistisches Modell, beim dem eine abhängige Variable als mathematische Funktion mehrere unabhängiger Variablen betrachtet wird. Am einfachsten lässt sich dies an einem Beispiel nachvollziehen:

$$\begin{aligned} \text{Wahrscheinlichkeit AfD-Wahl} = \beta_{0} + \beta_{1} \times \text{Mann} \\ + \beta_{2} \times \text{Ost} + \beta_{3} \times \text{Schuljahre} \\ + \beta_{4} \times \text{Bewertung NS}\end{aligned}$$

In diesem einfachen Modell der AfD-Wahl werden die Versuchspersonen zunächst gefragt, wie wahrscheinlich es ist, dass sie sich bei einer zukünftigen Wahl für die AfD entscheiden würden. Die Antwortvorgaben reichen dabei von “sehr unwahrscheinlich” (1) bis “sehr wahrscheinlich” (11). Mit den Zahlenwerten dazwischen kann die Antwort abgestuft werden. Diese auch als “subjektive Wahrscheinlichkeit” bezeichnete Verhaltensabsicht wird auf die Effekte einiger unabhängiger Variablen zurückgeführt: Geschlecht (Mann=1, Frau=0), Wohnort im alten Westen (0) oder im Beitrittsgebiet (1), Dauer der Schul- bzw. Hochschulausbildung in Jahren sowie Bewertung der Aussage “der Nationalsozialismus hatte auch gute Seiten” auf einer Skala von “stimme gar nicht zu” (0) bis “stimme voll zu” (4). Neben diesen erklärenden Variablen benötigt das Modell noch eine Konstante β0, die meist von geringem inhaltlichen Interesse ist.2

Alle diese Variablen wurden im ALLBUS 2018 tatsächlich erhoben, so dass die Parameter des Modells empirisch geschätzt werden können. Hier sind die resultierenden Werte:

$$\begin{aligned} \text{Wahrscheinlichkeit AfD-Wahl} = 1,73 + 0,53 \times \text{Mann} \\ + 0,58 \times \text{Ost} + -0,04 \times \text{Schuljahre} \\ + 0,68 \times \text{Bewertung NS}\end{aligned}$$

Aus den Koeffizienten lässt sich ablesen, dass unter Konstanthaltung der jeweils anderen Variablen (ceteris paribus) für Männer eine um etwa einen halben Skalenpunkt höhere subjektive Wahlwahrscheinlichkeit erwartet wird als für Frauen. Dies gilt sinngemäß auch für Befragte aus den neuen Bundesländern. Formale Bildung hat hingegen einen negativen Effekt: statistisch betrachtet sinkt mit jedem zusätzlichen Jahr die subjektive Wahlwahrscheinlichkeit um 0,04 Skalenpunkte. Sehr stark positiv wirkt sich hingegen die Bewertung des Nationalsozialismus aus: für jede zusätzliche Stufe der Zustimmung nimmt die erwartete subjektive Wahlwahrscheinlichkeit um 0,7 Skalenpunkte zu.

Ähnlich wie für Anteilswerte können auch für die Koeffizienten des Regressionsmodells Konfidenzintervalle berechnet werden. Für den Effekt der Bewertung des Nationalsozialismus beträgt das 95-Prozent-Konfidenzintervall 0,68 0,077, d.h. man kann mit großer Sicherheit davon ausgehen, dass in der Grundgesamtheit für eine Veränderung der Einstellung zum Nationalsozialismus um einen Skalenpunkt eine Zunahme der subjektiven Wahlwahrscheinlichkeit um 0,61 bis 0,76 Skalenpunkte zu erwarten ist.3 Inhaltlich bedeutet dies, dass der Effekt rechtsextremer Einstellungen mit großer Präzision geschätzt werden kann und von erheblicher politisch-praktischer Bedeutung ist. Dies ist umso bemerkenswerter, als die AfD 2013 als moderat euroskeptische, “liberal-konservative” Partei angetreten war.

Das hier beschriebene Modell ist “linear-additiv”. “Additiv” bedeutet, dass die Effekte der unabhängigen Variablen in einfacher und vom Niveau der anderen Variablen unabhängiger Weise zusammenwirken: Beispielsweise wird für einen ostdeutschen Mann über alle Ausprägungen von Bildungs- und ideologischer Variable hinweg stets eine um 0, 53 + 0, 58 = 1, 11 Punkte höhere subjektive Wahlwahrscheinlichkeit als für eine westdeutsche Frau erwartet. “Linear” meint, dass für eine Veränderung der unabhängigen Variablen um eine Einheit stets die gleiche Veränderung in der abhängigen Variablen erwartet wird. Dies bedeutet beispielsweise, dass die erwartete Differenz zwischen Befragten, die der NS-Aussage “gar nicht” zustimmen und denjenigen die ihr “eher nicht” zustimmen genau so groß sein sollte wie die zwischen Befragten, die “eher” zustimmen und denen, die “voll” zustimmen. Beide Annahmen mögen wenig realistisch erscheinen, sind aber oft ein guter Ausgangspunkt für eine Modellierung und können nötigenfalls aufgegeben werden, wenn theoretische Überlegungen eine spezifischere Form des Zusammenwirkens nahelegen.

Weitere Komplikationen ergeben sich, wenn die abhängige Variable anders als in diesem Beispiel nicht als kontinuierlich betrachtet werden kann, sondern in Form der Wahlabsicht für eine von mehreren Parteien vorliegt, denen kein numerischer Wert zugeordnet werden kann. Für diese Fälle existieren spezielle Erweiterungen des Regressionsmodells, die aber grundsätzlich der gleichen Logik folgen.

Unabhängig vom verwendeten Verfahren ist es wichtig, sich immer wieder in Erinnerung zu rufen, dass die Unterscheidung zwischen abhängiger und unabhängigen Variablen aufgrund theoretischer Überlegungen von den Forschenden getroffen wird, aber nicht statistisch überprüft werden kann. Im vorliegenden Fall ist es plausibel, dass das Niveau der formalen Bildung die Wahlwahrscheinlichkeit beeinflusst, aber nicht umgekehrt. Die Richtung einer möglichen Kausalität ist also klar. Denkbar wäre aber auch, dass es eine gemeinsame Hintergrundvariable (z.B. das Elternhaus) gibt, die beide Größen beeinflusst. Ob ein gefundener Zusammenhang kausal interpretiert werden kann, hängt deshalb letztlich immer vom Forschungsdesign ab.

Zusammenfassung und Ausblick

Die Wahlsoziologie rechtsextremer Parteien stützt sich primär auf die quantitative Analyse standardisierter Befragungen. Sie ist deshalb stark vom Strukturwandel in der Umfragepraxis betroffen: das klassische persönliche Interview ist sehr teuer geworden, und die Teilnahmebereitschaft sinkt selektiv.

Zugleich profitiert sie gerade in Deutschland von einer hervorragend ausgebauten Forschungsinfrastruktur. ALLBUS, GLES und ESS sind dauerhaft öffentlich finanziert und generieren unter Wahrung höchster Standards eine Vielzahl relevanter Datensätze, die der Fachöffentlichkeit sehr rasch zugänglich gemacht werden. Weitere, teils historische Datensätze werden über das Datenarchiv für Sekundäranalysen erschlossen.

Das wichtigste statistische Werkzeug zur Auswertung dieser Daten ist nach wie vor die Regressionsanalyse. Innovationen wie deren Erweiterung für nicht-kontinuierliche Variablen, für indirekt gemessene Variablen und für Mehr-Ebenen-Strukturen ermöglichen es, die theoretischen Ansätze der Wahlsoziologie adäquat zu modellieren.

Literatur

Achen, Christopher H., und W. Phillips Shively. 1995. Cross-Level Inference. Chicago: University of Chicago Press.

Altemeyer, Bob. 1981. Right-Wing Authoritarianism. Winnipeg: The University of Manitoba Press.

Arzheimer, Kai. 2018. Explaining Electoral Support for the Radical Right. in The Oxford Handbook of the Radical Right, Hrsg. Jens Rydgren, 143–165. Oxford University Press.

Arzheimer, Kai. 2020. Politischer Extremismus. in Politikwissenschaftliche Einstellungs- und Verhaltensforschung. Handbuch für Wissenschaft und Studium, Hrsg. Thorsten Faas, Oscar W. Gabriel, und Jürgen Maier, 296–308. Baden-Baden: Nomos.

Assche, Jasper van, Arne Roets, Jonas de Keersmaecker, und Alain van Hiel. 2017. The Mobilizing Effect of Right-Wing Ideological Climates: Cross-Level Interaction Effects on Different Types of Outgroup Attitudes. Political Psychology 38(5):757–776. DOI: https://doi.org/10.1111/pops.12359.

Bandilla, Wolfgang. 2015. Online-Befragungen. Mannheim: Gesis Leibniz-Institut für Sozialwissenschaften.

Beckmann, Katharina, Axel Glemser, Christiane Heckel, Christian von der Heyde, Jürgen H.P. Hoffmeyer-Zlotnik, Ute Hanefeld, Robert Herter-Eschweiler, und Carola Kühnen. 2016. Demographische Standards. Eine gemeinsame Empfehlung des ADM, Arbeitskreis Deutscher Markt- und Sozialforschungsinstitute e.V., der Arbeitsgemeinschaft Sozialwissenschaftlicher Institute e.V. (ASI) und des Statistischen Bundesamtes 6. Aufl. Wiesbaden: Statistisches Bundesamt.

Bischof, Daniel, und Markus Wagner. 2019. Do Voters Polarize When Radical Parties Enter Parliament? American Journal of Political Science 63(4):888–904. DOI: https://doi.org/10.1111/ajps.12449.

Bos, Linda, Christian Schemer, Nicoleta Corbu, Michael Hameleers, Ioannis Andreadis, Anne Schulz, Desirée Schmuck, Carsten Reinemann, und Nayla Fawzi. 2020. The Effects of Populism as a Social Identity Frame on Persuasion and Mobilisation: Evidence From a 15-country Experiment. European Journal of Political Research 59(1):3–24. DOI: https://doi.org/10.1111/1475-6765.12334.

Faas, Thorsten, und Sascha Huber. 2010. Experimente in der Politikwissenschaft: Vom Mauerblümchen zum Mainstream. Politische Vierteljahresschrift 51(4):721–749. DOI: https://doi.org/10.1007/s11615-010-0039-3.

Ferrín, Mónica, Moreno Mancosu, und Teresa M. Cappiali. 2019. Terrorist Attacks and Europeans’ Attitudes Towards Immigrants: An Experimental Approach. European Journal of Political Research:online first. DOI: https://doi.org/10.1111/1475-6765.12362.

Fitzgerald, Jennifer. 2018. Close to Home. Local Ties and Voting Radical Right in Europe. Cambridge: Cambridge University Press.

Fitzgerald, Jennifer, und Duncan Lawrence. 2011. Local Cohesion and Radical Right Support: The Case of the Swiss People’s Party. Electoral Studies 30(4):834–847. DOI: https://doi.org/10.1016/j.electstud.2011.08.004.

Haffert, Lukas. 2021. The Long-Term Effects of Oppression: Prussia, Political Catholicism, and the Alternative für Deutschland. American Political Science Review online first:1–20. DOI: https://doi.org/10.1017/s0003055421001040.

Herz, Thomas A. 1975. Soziale Bedingungen für Rechtsextremismus in der Bundesrepublik Deutschland und in den Vereinigten Staaten : eine vergleichende Analyse der Anhänger der Nationaldemokratischen Partei Deutschlands und der Anhänger von George C. Wallace. Meisenheim am Glan: Hain.

Hoerner, Julian M., Alexander Jaax, und Toni Rodon. 2019. The Long-Term Impact of the Location of Concentration Camps on Radical-Right Voting in Germany. Research & Politics 6(4):1–8. DOI: https://doi.org/10.1177/2053168019891376.

Hox, Joop J. 2010. Multilevel Analysis. Techniques and Applications 2. Aufl. New York: Routledge.

Kaufmann, Eric. 2019. Can Narratives of White Identity Reduce Opposition to Immigration and Support for Hard Brexit? A Survey Experiment. Political Studies 67(1):31–46. DOI: https://doi.org/10.1177/0032321717740489.

King, Gary. 1997. A Solution to the Ecological Inference Problem. Reconstructing Individual Behavior from Aggregate Data. Princeton: Princeton University Press.

Klingemann, Hans-Dieter, und Franz Urban Pappi. 1972. Politischer Radikalismus. Theoretische und methodische Probleme der Radikalismusforschung, dargestellt am Beispiel einer Studie anläßlich der Landtagswahl 1970 in Hessen. München, Wien: Oldenbourg.

Kreis, Joachim. 2007. Zur Messung von rechtsextremer Einstellung. Probleme und Kontroversen am Beispiel zweier Studien. Berlin: Freie Universität Berlin.

Loxbo, Karl, und Niklas Bolin. 2016. Party Organizational Development and the Electoral Performance of the Radical Right: Exploring the Role of Local Candidates in the Breakthrough Elections of the Sweden Democrats 2002-2014. Journal of Elections, Public Opinion and Parties 26(2):170–190. DOI: https://doi.org/10.1080/17457289.2016.1145685.

Marx, Paul, und Gijs Schumacher. 2018. Do Poor Citizens Vote for Redistribution, Against Immigration or Against the Establishment? A Conjoint Experiment in Denmark. Scandinavian Political Studies 41(3):263–282. DOI: https://doi.org/10.1111/1467-9477.12119.

Mayer, Sabrina. 2011. Die Wähler der NPD. Eine empirische Untersuchung der Einflussfaktoren auf die Wahl der NPD 1969. Wiesbaden: Drewipunkt.

Rees, Jonas H., Yann P. M. Rees, Jens H. Hellmann, und Andreas Zick. 2019. Climate of Hate: Similar Correlates of Far Right Electoral Support and Right-Wing Hate Crimes in Germany. Frontiers in Psychology 10:online first. DOI: https://doi.org/10.3389/fpsyg.2019.02328.

Schnell, Rainer. 2019. Survey-Interviews Methoden standardisierter Befragungen 2. Aufl. Wiesbaden: Springer VS.

Schnell, Rainer, Paul B. Hill, und Elke Esser. 2018. Methoden der empirischen Sozialforschung 11. Aufl. Berlin, Boston: De Gruyter Oldenbourg.

Schoen, Harald. 2014. Daten in der empirischen Wahlforschung. in Handbuch Wahlforschung, Hrsg. Jürgen W. Falter, und Harald Schoen, 109–131. Wiesbaden: Springer VS.

Schumann, Siegfried. 2001. Persönlichkeitsbedingte Einstellungen zu Parteien. Der Einfluß von Persönlichkeitseigenschaften auf Einstellungen zu politischen Parteien. München, Wien: Oldenbourg.

Schumann, Siegfried. 2005. Die ASKO-Skala. in Persönlichkeit. Eine vergessene Größe der empirischen Sozialforschung, Hrsg. Siegfried Schumann, und Harald Schoen, 41–57. Wiesbaden: VS Verlag für Sozialwissenschaften.

Schumann, Siegfried. 2019. Repräsentative Umfrage. Praxisorientierte Einführung in empirische Methoden und statistische Analyseverfahren 7. Aufl. Berlin, Boston: De Gruyter Oldenbourg.

Sekhon, Jasjeet S. 2009. Opiates for the Matches: Matching Methods for Causal Inference. Annual Review of Political Science 12:487–508. DOI: https://doi.org/10.1146/annurev.polisci.11.060606.135444.

Shugart, Matthew Søberg, und John M. Carey. 1992. Presidents and Assemblies. Constitutional Design and Electoral Dynamics. Cambridge: Cambridge University Press.

Silva, Bruno Castanho, Sebastian Jungkunz, Marc Helbling, und Levente Littvay. 2020. An Empirical Comparison of Seven Populist Attitudes Scales. Political Research Quarterly 73(2):409–424. DOI: https://doi.org/10.1177/1065912919833176.

Spanje, Joost van, und Till Weber. 2017. Does Ostracism Affect Party Support? Comparative Lessons and Experimental Evidence. Party Politics:online first. DOI: https://doi.org/10.1177/1354068817730722.

Titiunik, Rocío. 2021. Natural Experiments. in Advances in Experimental Political Science, Hrsg. James N. Druckman, und Donald P.Editors Green, 103–129. Cambridge University Press.

Turnbull-Dugarte, Stuart J., und José Rama. 2022. When the Us Far-right Sneezes, the European Far-right Catches a Cold. Quasi-experimental Evidence of Electoral Contagion From Spain. Electoral Studies 76:online first. DOI: https://doi.org/10.1016/j.electstud.2022.102443.

Western, Bruce, und Simon Jackman. 1994. Bayesian Inference for Comparative Research. American Political Science Review 88:412–423.


  1. Innerhalb des klassischen inferenzstatistischen Ansatzes ist die exakte Interpretation solcher Konfidenzintervalle wenig anschaulich: Wenn die Stichprobenziehung unter essentiell identischen Bedingungen sehr oft wiederholt würde, würden die Konfidenzintervalle, die um den Anteilswert in der jeweiligen Stichproben herum konstruiert werden, in 95 von 100 Fällen den unbekannten wahren Anteilswert in der Grundgesamtheit einschließen.
  2. Die Konstante entspricht dem Wert, der für eine Befragte erwarte würde, bei der alle unabhängigen Variablen den Wert 0 annehmen. Dies ist in manchen Konstellationen gar nicht möglich oder zumindest unwahrscheinlich. Im konkreten Fall ist β0 die subjektive Wahrscheinlichkeit, die für eine westdeutsche Frau erwartet wird, die den Nationalsozialismus stark negativ bewertet und keinerlei formale Schulbildung hat.
  3. Das Konfidenzintervall schließt außerdem den Wert von null nicht mit ein. Diese Information ist äquivalent zu einem Test auf statistische Signifikanz: Die Wahrscheinlichkeit, mit den Daten aus der Stichprobe einen so großen (oder noch größeren) Koeffizienten zu ermitteln, wenn dessen wahrer Wert in der Bevölkerung gleich null ist, ist (sehr viel) kleiner als fünf Prozent.

Quantitative Methoden zur Erforschung von rechtsextremistischem / rechtsradikalem / rechtspopulistischem Wahlverhalten

Einleitung und Überblick

Die Ergebnisse zur Wahlsoziologie rechtsextremer, rechtsradikaler und rechtspopulistischer Parteien (im Folgenden: rechte Flügelparteien) stützen sich primär auf quantitative Methoden zur Erhebung und Auswertung von Daten. Diese sind im Wesentlichen identisch mit den Verfahren, die in der allgemeinen Wahlforschung angewendet werden. Eine Besonderheit besteht aber darin, dass die Wahl solcher Parteien von Forschenden oft als problematisch, zumindest aber als besonders erklärungsbedürftig betrachtet wird. Deshalb wurden hier auch einige vergleichsweise komplexe theoretische Ansätze entwickelt, zu deren empirischer Prüfung entsprechende Daten und Verfahren benötigt werden. Die Wahlsoziologie der Rechtsaußenparteien ist deshalb stark von der methodologischen Innovation in den Sozialwissenschaften beeinflusst.

Um sich einen Überblick über Daten und Erklärungsmuster zu verschaffen, hat sich in der Literatur eine Dreiteilung in Mikro-, Meso- und Makro-Ebene durchgesetzt (Arzheimer (2018); für eine ergänzende Perspektive siehe Schoen (2014)). Dabei beziehen sich Mikro-Variablen auf einzelne Personen, während Makro-Variablen – z.B. die nationale Arbeitslosenquote oder das Wahlsystem zum Bundestag – Phänomene auf der Ebene der Gesamtgesellschaft beschreiben. Zwischen diesen beiden Polen liegt die Meso-Ebene, die im weitesten Sinne die Beziehungen innerhalb sozialer Gruppen und deren Eigenschaften umfasst. Die Liste der Gruppen, auf die sich potentiell relevante Variablen beziehen, reicht dabei von den kleinsten Einheiten (Kernfamilie bzw. Haushalt) über Nachbarschaften und Gemeinden bis hin zu großen Einheiten (Regionen und Bundesländer). Auch der vorliegende Artikel orientiert sich an dieser Einteilung.

Der nächste Abschnitt geht zunächst auf das in der Wahlsoziologie dominierende Forschungsdesign und insbesondere auf dessen Schwächen ein. Die darauf folgenden Abschnitte sind dann den Datenquellen und Erhebungsmethoden bzw. den Auswertungsmethoden gewidmet. Eine kurze Zusammenfassung schließt den Artikel ab.

Forschungsdesigns

Grundsätzlich lassen sich zwei Haupttypen von Forschungsdesigns unterscheiden (siehe für das Folgende z.B. Schnell et al. 2018, Kap. 5): experimentelle Designs und Ex-post-facto-Designs. Kern aller experimentellen Designs ist, dass die Forschenden den Wert einer Variablen, für die ein ursächlicher Effekt auf die abhängige Variable (hier: die Wahlentscheidung) vermutet wird, manipulieren können. Kombiniert man diese Manipulation mit einer Randomisierung, d.h. einer zufälligen Aufteilung der Untersuchungspersonen auf zwei oder mehrere Gruppen, für die diese Variable auf unterschiedliche Werte gesetzt wird, lassen sich mit einem experimentellen Design kausale Effekte nachweisen: Da beide Gruppen zufällig zusammengesetzt sind und sich nur im Wert der unabhängigen Variablen unterscheiden, können eventuelle Mittelwertunterschiede bezüglich der abhängigen Variablen nur durch diese zu erklären sein (Schnell et al. 2018, S. 199).

Bis vor kurzem haben experimentelle Designs für die Rechtsextremismus- und Rechtsradikalismus-Forschung so gut wie keine Rolle gespielt, da zentrale Variablen wie die soziale Klasse, die Generationszugehörigkeit, der Bildungsgrad oder die Erfahrung von Jobverlust und Deprivation nicht manipuliert werden können und dürfen. Der weit überwiegende Teil der Forschung basiert deshalb auf Ex-post-facto-Designs, bei denen Variablen, die möglicherweise kausal verbunden sind, von den Forschenden beobachtet werden, ohne dass diese den Wert der vermeintlichen unabhängigen Variablen beeinflussen und die Untersuchungspersonen diesen unterschiedlichen Stimuli zufällig zuweisen können. In einem solchen Design ist nie auszuschließen, dass ein statistischer Zusammenhang zwischen zwei Variablen nicht kausal ist, sondern durch eine gemeinsame Hintergrundvariable verursacht wird (Schnell et al. 2018, Kap. 5.4.3).

Am besten lässt sich dies an einem Beispiel illustrieren. In einer Vielzahl von Untersuchungen hat sich gezeigt, dass Arbeitslose etwas häufiger rechtsradikale Parteien wählen als Nicht-Arbeitslose. Zwischen beiden Merkmalen besteht also ein statistischer Zusammenhang. Möglicherweise kommt dieser aber durch eine gemeinsame Ursache zustande. So dokumentiert eine lange Forschungstradition die Verbindung zwischen rigiden Denkstilen und der Unterstützung rechter Parteien (zusammenfassend Schumann 2001, 2005). In einer Zeit, in der im Beruf lebenslanges Lernen und immer größere Flexibilität gefordert werden, ist es zumindest plausibel, dass solche Denkstile nicht nur das Wahlverhalten beeinflussen, sondern auch das Risiko eines Jobverlustes erhöhen. Die Verbindung zwischen Arbeitslosigkeit und Rechtswahl wäre dann ein Scheinzusammenhang.

Auch im Rahmen eines Ex-post-facto-Designs kann ein solcher Scheinzusammenhang aufgedeckt werden, indem die Hintergrundvariable statistisch kontrolliert wird (Schnell et al. 2018, Kap. 5.4.3.1.3). Dazu könnte man die Untersuchungspersonen in eine Gruppe mit hohen und eine Gruppe mit niedrigen Werten für Rigidität aufteilen. Innerhalb dieser beiden Gruppen sollte dann zwischen Arbeitslosigkeit und Rechtswahl kein Zusamenhang mehr bestehen.

Mit Hilfe des unten vorgestellten Verfahrens der multiplen Regression kann diese Logik des “Konstanthaltens” für mehre potentielle Hintergrundvariablen parallel angewendet werden. Voraussetzung ist aber immer, dass diese Hintergrundvariablen bekannt sind und auch tatsächlich gemessen wurden, während das experimentellen Design gleichsam automatisch für alle potentiellen Hintergrundvariablen kontrolliert, da sich durch die Randomisierung deren Verteilung zwischen den Gruppen nicht systematisch unterscheidet. Diese grundlegende Schwäche des Ex-post-facto-Designs ist auch durch raffinierteste statistische Verfahren nicht zu beheben (Sekhon 2009).

Wie in anderen Bereichen der Politikwissenschaft ist deshalb auch in der Rechtsextremismusforschung das Interesse an alternativen und komplementären Designs gewachsen (Faas und Huber 2010, S. 722–723). Besonders beliebt sind dabei Survey-Experimente (Faas und Huber 2010, S. 728–729). Diese integrieren eine experimentelle Komponente in den Ablauf einer Befragung (siehe z.B. Bos et al. 2020; Kaufmann 2019; Marx und Schumacher 2018; Spanje und Weber 2017). Auf diese Weise können Eigenschaften (fiktiver) Parteien, PolitikerInnen und politischer Botschaften variiert werden, um deren kausale Wirkungen auf die Untersuchungspersonen zu identifizieren. Wie bei jedem sozialwissenschaftlichen Experiment stellt sich hier allerdings die Frage nach der externen Validität, d.h. nach der Übertragbarkeit der unter kontrollierten Bedingungen gefundenen Effekte auf die wesentlich unstrukturierteren Kommunikationssituationen im Alltag.

Bei sogenannten natürlichen Experimenten ((Schnell et al. 2018, S. 204–205)(Titiunik 2021)) ist diese externe Validität hingegen sehr hoch. In einem solchen “quasi-experimentellen” Design kommt es beispielsweise während der Feldzeit einer Ex-post-facto-Studie (meistens einer Befragung) zu einem Ereignis, das potentiell einen kausalen Effekt auf die abhängige Variable haben könnte. Anders als beim echten Experiment wird dieses Ereignis nicht von den Forschenden ausgelöst, und es gibt keine Randomisierung. Wenn man jedoch argumentieren kann, dass sich die Personen, die kurz vor Eintritt des Ereignisses befragt oder beobachtet wurden, nicht systematisch von den kurz danach untersuchten Personen unterscheiden, lassen sich eventuelle Unterschiede plausibel auf das Ereignis selbst zurückführen. Aktuelle Beispiele aus der Forschung sind die Zunahme von negativen Einstellungen gegenüber ZuwanderInnen unmittelbar nach einem islamistischen Terroranschlag in Paris (Ferrín et al. 2019) sowie der Rückgang der Unterstützung für die rechtsradikale spanische Partei VOX nach der Wahlniederlage Donald Trumps (Turnbull-Dugarte und Rama 2022).

Allerdings lassen sich mit Survey- und Quasi-Experimenten nur die Wirkungen von Eigenschaften der politischen Situation untersuchen. Eigenschaften der Personen selbst können im Survey-Experiment nicht manipuliert werden, und individuelle “natürliche” Ereignisse (z.B. der Verlust des Arbeitsplatzes oder der Umzug in eine Gegend mit einem hohen Anteil von MigrantInnen) treten, wie oben dargelegt, nicht quasi-zufällig auf. Trotz seiner Schwächen bleibt das Ex-post-facto-Design deshalb für die Wahlforschung von zentraler Bedeutung.

Datenquellen

Mikro-Ebene: standardisierte Umfragen

Die moderne Wahlforschung orientiert sich am erkenntnisleitenden Prinzip des methodologischen Individualismus. Die überwältigende Mehrheit der in der Wahlforschung betrachteten Daten bezieht sich deshalb auf die Mikro-Ebene. Hier wiederum stammen die weitaus meisten Daten aus standardisierten Befragungen (siehe Schumann 2019; Schnell 2019). Andere Erhebungsformen (Beobachtung, Inhaltsanalyse, teilstandardisierte oder offene Interviews) spielen kaum eine Rolle. Charakteristisch für standardisierte Umfragen ist, dass beim Entwurf des Fragebogens nicht nur die Fragetexte, sondern bei den meisten Fällen auch die möglichen Antwortkategorien festgelegt werden.

Zur Erfassung sozio-demographischer Merkmale existiert dafür eine Reihe von Empfehlungen und De-facto-Standards (Beckmann et al. 2016), was die Vergleichbarkeit der Ergebnisse verbessert. Dies gilt, wie unten dargelegt, in ähnlicher Form auch für die Fragen zur Erhebung von politischen und anderen Einstellungen.

Das bei weitem verbreitetste Format für Einstellungsfragen besteht aus einer Aussage (Item), die sich auf den Gegenstandsbereich der Einstellung bezieht und von den Befragten bewertet werden soll. Dabei wird eine geordnete Reihe von Antworttexten vorgegeben, die von starker Ablehnung bis zu starker Zustimmung reichen. Variationen gibt es u.a. hinsichtlich der Zahl der Antwortvorgaben und der verbalen Beschreibung der einzelnen Abstufungen ((Schnell 2019, Kap. 4.4.3)(Schumann 2019, S. 58–74)).

Oft werden Items, die sich auf dieselbe oder eng verwandte Einstellungen beziehen, in Blöcken (Itembatterien) zusammengefasst. Idealerweise sollten dabei positive und negative Formulierungen gemischt werden, um die Befragten nicht in eine bestimmte Richtung zu drängen und stereotypes Antwortverhalten zu reduzieren.

Wie bei anderen Erhebungsformen lassen sich auch bei standardisierten Befragungen Quer- und Längsschnittstudien unterscheiden. Querschnittsbefragungen finden nur zu einem einzigen Zeitpunkt statt, während längsschnittliche Untersuchungen mehrere Befragungszeitpunkte umfassen. Dabei kann man noch einmal zwischen zwei Varianten differenzieren. Bei Trendstudien wird ein ganz oder in Teilen identisches Frageprogramm in mehr oder minder großen Abständen einer jeweils neuen Gruppe von Untersuchungspersonen vorgelegt (Schnell et al. 2018, S. 221–222). Auf diese Weise lassen sich gesellschaftliche Veränderungen über die Zeit – die im Namen angesprochenen Trends – nachzeichnen. Wesentlich aufwendiger sind Panelstudien, bei denen dieselben Untersuchungspersonen wiederholt befragt werden (Schnell et al. 2018, Kap. 5.4.3.2). Mit den resultierenden Daten lassen sich nicht nur kollektive, sondern auch individuelle Veränderungen nachverfolgen.

Dieser Stärke des Paneldesigns stehen aber einige Nachteile gegenüber (Schnell et al. 2018, S. 215–216). Der Aufbau und die Pflege eines Panels ist aufwendig und teuer, da die Befragten über Jahre, wenn nicht über Jahrzehnte nachverfolgt und motiviert werden müssen. Dies gelingt vor allem bei am Thema der Befragung besonders interessierten Teilnehmenden, so dass das Panel mit der Zeit der Allgemeinbevölkerung immer unähnlicher wird. Zudem steht zu erwarten, dass es bei den Teilnehmenden durch die wiederholte Beschäftigung mit denselben Fragen zu Meinungsbildungsprozessen kommt, die in dieser Form in der Bevölkerung nicht stattfinden. Wenn solche Paneleffekte nicht korrigiert werden, gefährden sie die Repräsentativität der Stichprobe.

Im allgemeinen Sprachgebrauch gilt eine Stichprobe als repräsentativ, wenn sie wie ein verkleinertes Abbild der Gesamtbevölkerung (Grundgesamtheit) betrachtet werden kann ((kritisch zum Begriff Schumann 2019, S. 84)(Schnell 2019, Kap. 7.4.3)). Dies ist durch eine rein zufällige Auswahl der Untersuchungspersonen aus der Grundgesamtheit gesichert. Bei einer solchen Zufallsstichprobe ist für alle Angehörigen der Grundgesamtheit angebbar, mit welcher Wahrscheinlichkeit sie in die Stichprobe eingeschlossen werden.

Allerdings stößt das klassische Umfragedesign – zufällige Auswahl eines Haushalts, dann zufällige Auswahl der Zielperson innerhalb des Haushalts, mit der anschließend ein persönliches Interview geführt wird (Schumann 2019, Kap. 3.2) – immer stärker an seine Grenzen. Einerseits sind persönliche Befragungen kaum noch zu finanzieren, andererseits ist die Teilnahmebereitschaft stark und in systematischer Weise gesunken, so dass vor allem besonders interessierte, gut gebildete und motivierte Zielpersonen erreicht werden. Um die daraus resultierenden Verzerrungen zu korrigieren, müssen die Daten entsprechend gewichtet werden.

Das Problem steigender Kosten bei niedriger, selektiver und weiter sinkender Teilnahmebereitschaft stellt sich in ähnlicher (was die Beteiligungsraten angeht sogar verschärfter) Form bei telefonischen Zufallsbefragungen, die wegen der grundsätzlich niedrigeren Kosten zwischenzeitlich an Beliebtheit gewonnen hatten (Schnell 2019, S. 275). Deshalb greift auch die akademische Forschung in den letzten Jahren verstärkt auf Pools von Personen (access panel) zurück, die grundsätzlich bereits sind, sich (zumeist online) an Umfragen zu beteiligen. Um die oben angesprochenen Verzerrungen gering zu halten, ist es wichtig, dass die Teilnehmenden (auch) offline rekrutiert werden (Bandilla 2015). Üblich ist außerdem, dass bei der Auswahl aus dem Pool vorab Quoten für Alter, Geschlecht, Bildung und andere sozio-demographische Merkmale festgelegt werden. Damit dies gelingen kann und niemand zu häufig befragt wird, sollte der Pool idealerweise mindestens einige tausend Personen umfassen.

Trotzdem sind selbst Querschnittsbefragungen, die meist im Rahmen eines befristeten und auch inhaltlich beschränkten Forschungsprojektes durchgeführt werden, teuer und meist nur mit externen Mitteln zu finanzieren. Deshalb ist es inzwischen Standard (und teils Voraussetzung für eine externe Förderung), dass die erhobenen Daten nach Abschluss des jeweiligen Projektes der wissenschaftlichen Gemeinschaft zur Verfügung gestellt werden.

Öffentlich finanzierte Trend- und Panelstudien sind von vornherein auf eine solche kollektive Nutzung ausgelegt. Sie bestehen aus einem wiederkehrenden Kern und einer Reihe von Modulen zu bestimmten Themen, von denen einige in großen Abständen wiederholt werden. Die überwältigende Mehrzahl der Studien zur Wahlsoziologie rechtextremer und rechtsradikaler Parteien stützt sich auf solche Datensätze, die über das Datenarchiv von GESIS oder kleinere Repositorien öffentlich zugänglich sind. Nicht immer sind diese Datensätze in idealer Weise zur Beantwortung der jeweiligen Fragestellung geeignet. Andererseits ermöglicht es diese Praxis der Sekundäranalyse, bereits vorhandene Daten nach Jahren oder Jahrzehnten noch einmal mit innovativen Methoden und auf neue Fragestellungen hin zu untersuchen (siehe z.B. Mayer 2011) und die Robustheit publizierter Studienergebnisse kritisch zu überprüfen.

Für empirische Studien zur Wahlsoziologie rechter Flügelparteien werden Datensätze benötigt, die mindestens Angaben zu den gängigen sozio-demographischen Merkmalen (Alter, Geschlecht, formale Bildung, Beruf, Religion, Bundesland) sowie Angaben zur Wahlabsicht oder zu vergangenen Wahlentscheidungen enthalten. Darüber hinaus sollten auch Informationen zu politischen Einstellungen vorhanden sein. Da die Bandbreite potentiell relevanter Einstellungen sehr groß ist, findet sich in den meisten Datenquellen nur eine Teilmenge der gewünschten Informationen. Glücklicherweise wurden im Lauf der Zeit aber die entsprechenden Frageformulierungen weitgehend standardisiert (siehe dazu das Portal https://zis.gesis.org/). Deshalb ist es oft möglich, Einzelbefunde über heterogene Datensätze hinweg zu vergleichen oder sich aus mehreren Datensätzen einen Gesamteindruck zu verschaffen.

Zu den für die Wahlsoziologie der rechten Flügelparteien wichtigsten Einstellungen zählen die Parteiidentifikation, die allgemeine Links-Rechts-Selbsteinstufung, die Bewertung politischer KandidatInnen, die generalisierte Bewertung möglichst aller Parteien (Parteisympathie) sowie Einstellungen zu Zugewanderten, zur Zuwanderung und zu anderen politischen Themen. Hinzu kommen eine Reihe von Item-Batterien, die speziell entwickelt wurden, um die Wahl rechter Flügelparteien zu erklären. Zu diesen gehören verschiedene Skalen, die auf populistische Einstellungen abzielen (Silva et al. 2020), Skalen zur Messung von Rechtsautoritarismus (Altemeyer 1981) sowie Instrumente zur Messung von rechtsextremistischen Einstellungen (für einen Überblick siehe Arzheimer 2020). Im deutschen Kontext spielt der Bezug zum Nationalsozialismus dabei naturgemäß eine zentrale Rolle.

Erste Versuche, ein Standardinstrument zur Messung rechtsextremer Einstellungen zu entwickeln, gab es bereits seit Ende der 1960er Jahre (Klingemann und Pappi 1972; Herz 1975). Aufbauend auf diesen Arbeiten wurde dann Anfang der 1990er Jahre an der Universität Mainz eine Itembatterie entwickelt, die rund zehn Jahre später wiederum die Grundlage für die Arbeit der sogenannten “Konsensgruppe” bildete (Kreis 2007). Zum Kern der Mainzer Batterie zählten eine Reihe von Items, die Antisemitismus (u.a. “Auch heute noch ist der Einfluss der Juden zu groß”) und die Verharmlosung des Nationalsozialismus (u.a. “Ohne die Judenvernichtung würde man Hitler heute als einen großen Staatsmann ansehen”) erfassen sollten. Obwohl ein Konsens im Sinne eines universell akzeptierten Instruments nicht zustande kam, werden einige der damals entwickelten Items in ursprünglicher oder leicht veränderter Form bis heute genutzt.

Zu den wichtigsten Trendstudien, die für Sekundäranalysen zur Wahlsoziologie rechter Flügelparteien zur Verfügung stehen, zählen in Deutschland die Allgemeine Bevölkerungsumfrage der Sozialwissenschaften (ALLBUS), das deutsche Teilprojekt des European Social Survey (ESS) und die German Longitudinal Election Study (GLES). Alle drei Studien werden durch den Bund und die Länder finanziert, entsprechen höchsten methodologischen Standards und sind mittlerweile gemeinsam unter dem Dach des GESIS Leibniz-Instituts für Sozialwissenschaften untergebracht.

Der ALLBUS ist eine klassische, am Vorbild des US-amerikanischen General Social Survey orientierte Mehr-Themen-Befragung, die seit 1980 im Zwei-Jahres-Rhythmus wiederholt wird. Neben den sehr umfassenden sozio-demographischen Variablen werden in jeder Welle u.a. die Wahlabsicht sowie die Links-Rechts-Selbsteinstufung abgefragt. Hinzu kommen eine Reihe von Schwerpunkten, die für Wahlsoziologie rechter Flügelparteien besonders interessant sind. Dazu zählen u.a. die Themen “Ausländer, Immigration und ethnische Minderheiten” (1996, 2006, 2016) sowie “Nationalstolz und Rechtsextremismus” (2008, 2018). Durch die Replikation einzelner Fragebatterien lassen sich gesellschaftliche Entwicklungen nachvollziehen, die in diesem Bereich seit den 1990er Jahren stattgefunden haben.

Der European Social Survey ähnelt in seiner Struktur dem ALLBUS, ist aber als international vergleichende Studie im Zwei-Jahres-Abstand angelegt, an der seit 2002 mehr als 40 europäische Länder sporadisch oder regelmäßig teilgenommen haben. Deutschland hat sich an allen elf Erhebungsrunden beteiligt, so dass hier eine weitere sehr dichte Zeitreihe vorliegt. Neben den Basisinformationen zu Wahlabsicht und grundlegenden politischen Einstellungen enthält das Kernprogramm des ESS auch Fragen zu Gefühlen der kulturellen und ökonomischen Bedrohung durch Immigration. Hinzu kommen Schwerpunkte zu den Themen Migration (2002 und 2014) und Demokratieverständnis (2002 und 2020).

Die GLES schließlich ist die nationale Wahlstudie für Deutschland, die in ihrer heutigen Form seit 2009 betrieben wird. Nachdem ihre Struktur zwischenzeitlich etwas vereinfacht wurde, besteht sie aktuell aus fünf Komponenten: (1) zwei Querschnittsbefragungen, die in den Wochen vor und nach einer Bundestagswahl stattfinden, (2) einer rollierenden Querschnittsbefragung, bei der in den beiden Monaten vor einer Bundestagswahl täglich 100-120 Personen befragt werden, um kurzfristige Stimmungsänderungen im Wahlkampf abbilden zu können, (3) einer Panelstudie mit mehreren Befragungszeitpunkten zwischen 2016 und 2021, (4) eine Serie von kurzen, online-basierten Querschnittsbefragungen (Tracking) mit drei bis vier Befragungszeitpunkten pro Jahr seit 2009 und (5) einer Befragung von Kandidierenden zu jeder Bundestagswahl. Gegenüber ALLBUS und ESS hat die GLES den Vorteil, dass ihr ganzes Design auf die Erklärung von Wahlverhalten hin ausgelegt ist und aufgrund der insgesamt sehr großen Fallzahlen vor allem in der Tracking-Komponente auch die Wähler kleinerer Parteien gut erfasst werden können. Andererseits werden in der GLES nur wenige Einstellungen erhoben, die speziell für Erklärung von rechtsradikalem oder rechtsextremem Wahlverhalten von Interesse sind.

Neben ALLBUS, GLES und ESS ist das Sozio-Ökonomische Panel (SOEP) eine weitere öffentlich finanzierte Datenquelle, die für die Sozialforschung in Deutschland von zentraler Bedeutung ist. Allerdings wird im SOEP nicht die Wahlabsicht, sondern nur eine Form der Parteiidentifikation erhoben. Deshalb spielt es für die Wahlsoziologie keine große Rolle.

Indirekt öffentlich finanziert und ebenfalls über das Datenarchiv verfügbar sind außerdem das Politbarometer und der Deutschlandtrend. Dabei handelt es sich um zwei Trendstudien, die in meist monatlichem Abstand für die Politikberichterstattung von ZDF bzw. ARD erhoben werden. Beide enthalten vergleichsweise wenig kontinuierlich erhobene Fragen, sind aber wegen der großen Fallzahlen, der häufigen Befragungen und der sehr langen Zeitreihen von Interesse: der Deutschlandtrend reicht bis 1998, das Politbarometer sogar bis 1977 zurück.

Zuletzt müssen an dieser Stelle noch die “Mitte”-Studien erwähnt werden, die seit 2002 im Zwei-Jahres-Rhythmus durchgeführt und von verschiedenen Stiftungen finanziert wurden. 2014 kam es zu einer Spaltung: die von der ursprünglichen Gruppe an der Universität Leipzig koordinierte Studienserie firmiert jetzt als Leipziger Autoritarismusstudie, während die neue Mitte-Studie nun unter neuer Leitung an der Universität Bielefeld angesiedelt ist. Nicht zuletzt wegen der teils reißerischen Titel der zugehörigen Berichte werden die Ergebnisse dieser Studien kontrovers diskutiert, zugleich aber von einer viel breiteren Öffentlichkeit wahrgenommen, als dies bei Arbeiten mit dem ALLBUS, dem ESS oder der GLES normalerweise der Fall ist. Anders als die Daten aus diesen Befragungen sind die Ergebnisse der Mitte-Studien aber nicht für Sekundäranalysen zugänglich. Für die akademische Forschung sind sie deshalb von untergeordneter Bedeutung.

Trotz oder wegen ihrer zentralen Rolle für die Wahlsoziologie rechtsradikaler und rechtsextremistischer Parteien werden Umfragedaten in der Öffentlichkeit manchmal mit einer gewissen Skepsis betrachtet. Neben Zweifeln an der Repräsentativität wird dabei oft das Phänomen der “sozialen Erwünschtheit” (social-desirability bias) angesprochen. Zu einer solchen Verzerrung von Antworten in Richtung des sozial Erwünschten kann es kommen, weil es vielen Menschen unangenehm ist, sich gegenüber den InterviewerInnen zu Meinungen oder Verhaltensweisen zu bekennen, von denen sie annehmen, dass diese gesellschaftlich nicht akzeptiert sind. Dieser Effekt dürfte dazu beigetragen haben, dass in früheren Umfragen die Unterstützung für rechte Flügelparteien häufig unterschätzt wurde.

In persönlichen Befragungen kamen deshalb für solche heiklen Fragen Hilfsmittel wie Antwortlisten oder Kartenspiele zum Einsatz, die die Effekte der sozialen Erwünschtheit reduzieren sollten. Statt einer verbalen Antwort musste dann beispielsweise nur der Buchstabe genannt werden, der der entsprechenden Antwortvorgabe in nicht-alphabetischer Reihenfolge zugeordnet war.

In telefonischen Umfragen ist ein Rückgriff auf solche Hilfsmittel nicht möglich. Zugleich scheinen die Effekte sozialer Erwünschtheit hier aber deutlich schwächer zu sein als im persönlichen Interview. Dies gilt noch mehr für Online-Befragungen, bei denen es gar keine InterviewerInnen gibt. Durch die sinkende Bedeutung persönlicher Befragungen sollte sich das Problem der sozialen Erwünschtheit deshalb reduzieren.

Außerdem ist die aktuelle Situation in Deutschland nicht mit der vergangener Jahrzehnte vergleichbar, in der rechte Flügelparteien nur sporadische Erfolge erzielen konnten. So zeigen Bischof und Wagner (2019) mit Daten aus den Niederlanden, dass unmittelbar mit dem Einzug rechter Parteien ins Parlament die Bereitschaft der Befragten steigt, sich selbst als “rechts” einzustufen, da sie sich nun als weniger isoliert wahrnehmen. Seit den flächendeckenden Wahlerfolgen der AfD sind vergleichbare Effekte auch für Deutschland zu erwarten. Tatsächlich zeigt sich empirisch, dass die AfD anders als ihre Vorgängerparteien in Umfragen nicht unterschätzt wird. Deshalb ist davon auszugehen, dass die Wahlsoziologie rechter Flügelparteien nicht stärker vom Phänomen der sozialen Erwünschtheit betroffen ist als andere Bereich der empirischen Sozialforschung auch.

Meso- und Makro-Ebene: amtliche und andere Daten

Wie oben dargelegt beziehen sich Meso- und Makro-Daten auf Einheiten oberhalb der Individualebene. Aggregatdaten, die durch Mittelwertbildung oder Anteilsberechnung über Personengruppen hinweg zustande kommen, bilden eine wichtige Untergruppe von Meso- und Makro-Daten. Man muss sich jedoch klar machen, dass viele für die Wahlsoziologie interessante Meso- und Makro-Variablen nicht durch die Aggregation von Individualdaten zustande kommen, sondern Eigenschaften der höheren Ebene selbst beschreiben (Hox 2010). In der Wahlsoziologie ist das vielleicht bekannteste Beispiel für solche Variablen die Klassifikation des Wahlsystems eines Landes als listenbasiert, personenorientiert oder gemischt. Es handelt sich hier um eine Eigenschaft des politischen Systems selbst, also eine (globale) Makro-Variable, die nicht auf individuelle Eigenschaften der BürgerInnen zurückzuführen ist. Gleiches gilt auch für weitere institutionelle Variablen wie etwa die Einordnung des politischen Systems als parlamentarisch, präsidentiell oder semi-presidentiell (Shugart und Carey 1992). Bei anderen relevanten Makro-Variablen handelt es sich hingegen tatsächlich um Aggregatdaten. Das im Zusammenhang der Wahl rechter Flügelparteien vermutlich bekannteste Beispiel ist die nationale Arbeitslosenquote, die als Anteil der Arbeitssuchenden an der Erwerbsbevölkerung definiert ist. Auch der Stimmenanteil rechtsextremer und rechtsradikaler Parteien fällt in diese Kategorie.

Eine wichtige Quelle für aggregierte Makro-Daten bildet die amtliche Statistik. In praktisch allen europäischen Ländern gibt es hier eine große Vielfalt sehr genauer, über einen langen Zeitraum gesammelter Daten, die für wissenschaftliche Zwecke zugänglich, wenn auch nicht immer geeignet sind (Schoen 2014, S. 115–123). Makro-Daten, die sich auf das System selbst beziehen, müssen hingegen von den Forschenden mit teils erheblichem Aufwand selbst erhoben werden. Ähnlich wie im Bereich der Umfrageforschung gibt es deshalb einige größere Projekte, die ihre Datensätze als Kollektivgut zur Verfügung stellen. Die aktuell umfassendste Datensammlung ist dabei die des V-Dem Projektes (https://v-dem.net/).

Da sich Makro-Variablen per definitionem auf die System-Ebene beziehen, sind sie primär für ländervergleichende Analysen von Interesse. Denkbar ist aber auch ein Einsatz innerhalb eines Landes über einen längeren Zeitraum hinweg (Zeitreihenanalyse) oder eine Kombination von Ländervergleich und Zeitreihenanalyse (time-series cross-sectional design oder TSCS). Hierbei stellen sich allerdings mehrere Probleme. Erstens ist selbst mit einem TSCS-Design die Zahl der Beobachtungen relativ klein, während viele interessante institutionelle Variablen innerhalb der Länder kaum oder gar nicht über die Zeit variieren. Reine Makro-Datensätze sind deshalb ohnehin relativ “schwach” (Western und Jackman 1994, S. 414–415). Zweitens ist außerdem wegen der normalerweise großen Abstände zwischen einzelnen Wahlen die Zahl der Beobachtungen in der Wahlforschung besonders niedrig. Drittens ist die Wahlsoziologie primär an individuellem Verhalten interessiert. Dementsprechend sollten zu seiner Erklärung nach Möglichkeit Individualdaten vorliegen (Achen und Shively 1995): Weil ganz unterschiedliche Mechanismen auf der Individualebene für die beobachteten Aggregatmuster verantwortlich sein können (Schnell et al. 2018, S. 227), besteht bei der Übertragung von Aggregatzusammenhängen auf individuelles Verhalten stets die Gefahr eines “ökologischen Fehlschlusses” (siehe aber King 1997).

Beispielsweise ist für die 1990er Jahre auf der Kreisebene ein deutlicher Zusammenhang zwischen dem AusländerInnenanteil und dem Stimmenanteil rechtsextremer Parteien dokumentiert. Während hier schon aus Gründen des fehlenden Wahlrechts klar ist, dass dieser Zusammenhang nicht durch das Verhalten der AusländerInnen zustandekam, wurde ein vergleichbare Korrelation zwischen Arbeitslosenquote und rechtsextremen Wahlerfolgen oft als Beleg dafür interpretiert, dass Arbeitslose überdurchschnittlich häufig rechte Parteien unterstützen. Dies mag durchaus der Fall sein. Denkbar ist aber auch, dass Nicht-Arbeitslose sich als Reaktion auf die Arbeitslosigkeit in ihrer Umgebung den rechten Parteien zuwenden, dass es eine gemeinsame Ursache für Arbeitslosigkeit und Rechtswahl gibt (etwa die regionalen Auswirkungen der ökonomischen Globalisierung) oder dass diese und weitere Prozesse parallel ablaufen und so das Aggregatmuster hervorbringen.

Für sich genommen sind Aggregatdaten deshalb nicht gut für die Wahlsoziologie geeignet. Moderne Varianten der Regressionanalyse ermöglichen es jedoch, Mehr-Ebenen-Erklärungen des Wahlverhaltens abzubilden, indem sie abhängige und unabhängige Variablen auf der Mikro-Ebene gemeinsam mit zusätzlichen unabhängigen Variablen auf der Makro- und Meso-Ebene modellieren (Hox 2010). Auf diese Weise lassen sich beispielsweise die Effekte individueller und kollektiver Arbeitslosigkeit auf das individuelle Wahlverhalten schätzen, ohne dass die Gefahr eines Fehlschlusses besteht.

Als Meso-Daten werden die vielfältigen Variablen bezeichnet, die sich auf soziale Strukturen oder Personengruppen unterhalb der nationalen Ebene beziehen. Eine besonders wichtige Datenquelle ist auch hier die amtliche Statistik. Für die Wahlsoziologie der rechten Flügelparteien von Interesse sind hier u.a. Informationen zum Wahlverhalten, zur demographischen Struktur der Bevölkerung (Alter, Geschlecht, Bildung, ZuwanderInnen), zu regionalen Wirtschafts- und Sozialdaten (Wachstum, Arbeitslosigkeit, Sozialleistungen, Wirtschaftsstruktur) und zur Infra- und Siedlungsstruktur.

Wie in anderen Bereichen des öffentlichen Lebens auch ist die Nutzung der in Deutschland prinzipiell vorhandenen Informationen für die Forschung durch drei Faktoren beschränkt: den Datenschutz, den Föderalismus und die mangelhafte digitale Erschließung der Daten. Zumindest beim letzten Punkt hat sich die Situation in den letzten Jahren aber deutlich verbessert: Für die Ebene der Kreise und kreisfreien Städte steht ist eine Vielzahl von Informationen in maschinenlesbarer Form über die Portale https://www.regionalstatistik.de/ und https://www.inkar.de/ zur Verfügung. Einige Variablen sind auch für die Ebene der Städte und Gemeinden verfügbar. Da Größe, Zahl und Aufgaben der Gemeinden zwischen den Bundesländern aber sehr stark variieren, stellt sich hier die Frage nach der Vergleichbarkeit der Daten.

Ein Spezialfall der amtlichen Statistik ist die repräsentative Wahlstatistik (Schoen 2014, S. 123–125). Für diese Sonderauszählung werden in knapp drei Prozent aller Stimmbezirke die Wählerverzeichnisse nach Geschlecht und zehn Altersklassen aufgeteilt und die Stimmzettel entsprechend markiert, so dass diese nach Gruppen getrennt ausgezählt werden können. Auf diese Weise kann für jede der zwanzig Merkmalskombinationen die Wahlbeteiligung und das Wahlverhalten ermittelt werden. In den Berichten, die das Statistische Bundesamt zu jeder Wahl bereitstellt, werden diese Ergebnisse nicht nur insgesamt, sondern auch nach Bundesländern und Groß-Regionen (alte Länder plus West-Berlin vs neue Länder plus Ost-Berlin) getrennt ausgewiesen.

Da es sich nicht um eine Befragung handelt, sondern tatsächliches Wahlverhalten sowie die Eintragungen zu Alter und Geschlecht aus den Melderegistern erfasst werden, sind die Daten praktisch fehlerfrei. Zudem ist die Stichprobe mit 1,9 Millionen Wahlberechtigten (2021) so groß, dass selbst auf der Ebene einzelner Bundesländer Stichprobenfehler keine nennenswerte Rolle spielen. Deshalb lässt sich auf Grundlage der repräsentativen Wahlstatistik beispielsweise mit größter Sicherheit festhalten, dass die AfD bei der Bundestagswahl 2021 wie auch bei den vorangegangenen Wahlen in den mittleren Jahrgängen deutlich erfolgreicher war als bei jüngeren und älteren Wahlberechtigten und bei Männern weitaus besser abschnitt als bei Frauen. Weitergehende Aussagen zur Wirkung anderer sozio-demographischer Variablen oder zu den Motiven der AfD-WählerInnen sind auf dieser Grundlage jedoch nicht möglich. Zurecht bemerkt deshalb Schoen, dass das “analytische Potential … mit der Validität der Daten nicht Schritt halten” kann (2014, S. 125).

Jenseits dessen, was die amtliche Statistik zu bieten hat, sind viele Meso-Variablen für die Wahlsoziologie von theoretischem Interesse. Zu nennen wären hier etwa das Meinungsklima in der Umgebung (Rees et al. 2019; Assche et al. 2017), die organisatorische Stärke von Orts- und Kreisverbänden rechter Parteien (Loxbo und Bolin 2016), die Ausstattung der Wohnortgemeinde mit Sozialkapital (Fitzgerald und Lawrence 2011; Fitzgerald 2018) oder der politisch-historische Kontext (Hoerner et al. 2019; Haffert 2021). Diese Informationen müssen allerdings von den Forschenden selbst erhoben werden. Dies ist mit erheblichem Aufwand verbunden, zudem sind Variablen und Operationalisierungen zwischen einzelnen Studien nur schwer vergleichbar.

Auswertungsmethoden

Seit den 1990er Jahren kommen in der empirischen Sozialforschung und damit auch in der Rechtsextremismusforschung zusehends komplexere Analyseverfahren zum Einsatz, deren kompetenter Einsatz ein mehrjährige Aus- und Fortbildung erfordert. Zu jedem einzelnen Verfahren existiert neben der mathematisch-statistischen Grundlagenliteratur eine unübersehbare Menge von Lehr- und Einführungswerken. In diesem Abschnitt kann es deshalb nur darum gehen, einen ganz groben Überblick über die Analysemöglichkeiten zu vermitteln.

Zunächst muss man sich klar machen, dass die quantitative Rechtsextremismusforschung auf Stichproben basiert. Alle Werte, die auf Grundlage einer solchen Stichprobe berechnet werden, weichen mehr oder minder stark von den Verhältnissen in der Grundgesamtheit ab (Stichprobenfehler). Wenn es sich um eine Zufallsstichprobe handelt, folgen diese Stichprobenfehler einer bekannten Zufallsverteilung, und es lässt sich berechnen, wie wahrscheinlich Fehler in einer bestimmten Größenordnung sind. Mit den in der wissenschaftlichen und kommerziellen Forschung gängigen Stichproben von 1000 bis 2000 Fällen sind recht präzise Aussagen möglich. Dies lässt sich mit der Konstruktion von Konfidenzintervallen für Anteilswerte illustrieren. Wenn in einer einfachen Zufallsstichprobe von 1000 Personen 10 Prozent der Befragten angeben, die AfD wählen zu wollen, ergibt sich daraus ein sogenannter Standardfehler von $\sqrt(10 \times (100-10) / 1000) \approx 0,95$ Prozentpunkten. Nach einer gängigen Approximation kann man daraus ein 95-Prozent-Konfidenzintervall mit den Werten 10 ± 1, 96 × 0, 95 ableiten. Dies bedeutet: man kann mit großer (aber nicht absoluter) Sicherheit davon ausgehen, dass der wahre Wert der AfD-AnhängerInnen in der Grundgesamtheit in einem Bereich von etwa 8 bis 12 Prozent liegt.1

Neben der Berechnung von Anteils- und Mittelwerten mit ihren jeweiligen Konfidenzintervallen ist das Verfahren der multiplen Regression das wichtigste Analysewerkzeug der Wahlsoziologie. Die multiple Regression ist ein statistisches Modell, beim dem eine abhängige Variable als mathematische Funktion mehrere unabhängiger Variablen betrachtet wird. Am einfachsten lässt sich dies an einem Beispiel nachvollziehen:

$$\begin{aligned} \text{Wahrscheinlichkeit AfD-Wahl} = \beta_{0} + \beta_{1} \times \text{Mann} \\ + \beta_{2} \times \text{Ost} + \beta_{3} \times \text{Schuljahre} \\ + \beta_{4} \times \text{Bewertung NS}\end{aligned}$$

In diesem einfachen Modell der AfD-Wahl werden die Versuchspersonen zunächst gefragt, wie wahrscheinlich es ist, dass sie sich bei einer zukünftigen Wahl für die AfD entscheiden würden. Die Antwortvorgaben reichen dabei von “sehr unwahrscheinlich” (1) bis “sehr wahrscheinlich” (11). Mit den Zahlenwerten dazwischen kann die Antwort abgestuft werden. Diese auch als “subjektive Wahrscheinlichkeit” bezeichnete Verhaltensabsicht wird auf die Effekte einiger unabhängiger Variablen zurückgeführt: Geschlecht (Mann=1, Frau=0), Wohnort im alten Westen (0) oder im Beitrittsgebiet (1), Dauer der Schul- bzw. Hochschulausbildung in Jahren sowie Bewertung der Aussage “der Nationalsozialismus hatte auch gute Seiten” auf einer Skala von “stimme gar nicht zu” (0) bis “stimme voll zu” (4). Neben diesen erklärenden Variablen benötigt das Modell noch eine Konstante β0, die meist von geringem inhaltlichen Interesse ist.2

Alle diese Variablen wurden im ALLBUS 2018 tatsächlich erhoben, so dass die Parameter des Modells empirisch geschätzt werden können. Hier sind die resultierenden Werte:

$$\begin{aligned} \text{Wahrscheinlichkeit AfD-Wahl} = 1,73 + 0,53 \times \text{Mann} \\ + 0,58 \times \text{Ost} + -0,04 \times \text{Schuljahre} \\ + 0,68 \times \text{Bewertung NS}\end{aligned}$$

Aus den Koeffizienten lässt sich ablesen, dass unter Konstanthaltung der jeweils anderen Variablen (ceteris paribus) für Männer eine um etwa einen halben Skalenpunkt höhere subjektive Wahlwahrscheinlichkeit erwartet wird als für Frauen. Dies gilt sinngemäß auch für Befragte aus den neuen Bundesländern. Formale Bildung hat hingegen einen negativen Effekt: statistisch betrachtet sinkt mit jedem zusätzlichen Jahr die subjektive Wahlwahrscheinlichkeit um 0,04 Skalenpunkte. Sehr stark positiv wirkt sich hingegen die Bewertung des Nationalsozialismus aus: für jede zusätzliche Stufe der Zustimmung nimmt die erwartete subjektive Wahlwahrscheinlichkeit um 0,7 Skalenpunkte zu.

Ähnlich wie für Anteilswerte können auch für die Koeffizienten des Regressionsmodells Konfidenzintervalle berechnet werden. Für den Effekt der Bewertung des Nationalsozialismus beträgt das 95-Prozent-Konfidenzintervall 0,68 0,077, d.h. man kann mit großer Sicherheit davon ausgehen, dass in der Grundgesamtheit für eine Veränderung der Einstellung zum Nationalsozialismus um einen Skalenpunkt eine Zunahme der subjektiven Wahlwahrscheinlichkeit um 0,61 bis 0,76 Skalenpunkte zu erwarten ist.3 Inhaltlich bedeutet dies, dass der Effekt rechtsextremer Einstellungen mit großer Präzision geschätzt werden kann und von erheblicher politisch-praktischer Bedeutung ist. Dies ist umso bemerkenswerter, als die AfD 2013 als moderat euroskeptische, “liberal-konservative” Partei angetreten war.

Das hier beschriebene Modell ist “linear-additiv”. “Additiv” bedeutet, dass die Effekte der unabhängigen Variablen in einfacher und vom Niveau der anderen Variablen unabhängiger Weise zusammenwirken: Beispielsweise wird für einen ostdeutschen Mann über alle Ausprägungen von Bildungs- und ideologischer Variable hinweg stets eine um 0, 53 + 0, 58 = 1, 11 Punkte höhere subjektive Wahlwahrscheinlichkeit als für eine westdeutsche Frau erwartet. “Linear” meint, dass für eine Veränderung der unabhängigen Variablen um eine Einheit stets die gleiche Veränderung in der abhängigen Variablen erwartet wird. Dies bedeutet beispielsweise, dass die erwartete Differenz zwischen Befragten, die der NS-Aussage “gar nicht” zustimmen und denjenigen die ihr “eher nicht” zustimmen genau so groß sein sollte wie die zwischen Befragten, die “eher” zustimmen und denen, die “voll” zustimmen. Beide Annahmen mögen wenig realistisch erscheinen, sind aber oft ein guter Ausgangspunkt für eine Modellierung und können nötigenfalls aufgegeben werden, wenn theoretische Überlegungen eine spezifischere Form des Zusammenwirkens nahelegen.

Weitere Komplikationen ergeben sich, wenn die abhängige Variable anders als in diesem Beispiel nicht als kontinuierlich betrachtet werden kann, sondern in Form der Wahlabsicht für eine von mehreren Parteien vorliegt, denen kein numerischer Wert zugeordnet werden kann. Für diese Fälle existieren spezielle Erweiterungen des Regressionsmodells, die aber grundsätzlich der gleichen Logik folgen.

Unabhängig vom verwendeten Verfahren ist es wichtig, sich immer wieder in Erinnerung zu rufen, dass die Unterscheidung zwischen abhängiger und unabhängigen Variablen aufgrund theoretischer Überlegungen von den Forschenden getroffen wird, aber nicht statistisch überprüft werden kann. Im vorliegenden Fall ist es plausibel, dass das Niveau der formalen Bildung die Wahlwahrscheinlichkeit beeinflusst, aber nicht umgekehrt. Die Richtung einer möglichen Kausalität ist also klar. Denkbar wäre aber auch, dass es eine gemeinsame Hintergrundvariable (z.B. das Elternhaus) gibt, die beide Größen beeinflusst. Ob ein gefundener Zusammenhang kausal interpretiert werden kann, hängt deshalb letztlich immer vom Forschungsdesign ab.

Zusammenfassung und Ausblick

Die Wahlsoziologie rechtsextremer Parteien stützt sich primär auf die quantitative Analyse standardisierter Befragungen. Sie ist deshalb stark vom Strukturwandel in der Umfragepraxis betroffen: das klassische persönliche Interview ist sehr teuer geworden, und die Teilnahmebereitschaft sinkt selektiv.

Zugleich profitiert sie gerade in Deutschland von einer hervorragend ausgebauten Forschungsinfrastruktur. ALLBUS, GLES und ESS sind dauerhaft öffentlich finanziert und generieren unter Wahrung höchster Standards eine Vielzahl relevanter Datensätze, die der Fachöffentlichkeit sehr rasch zugänglich gemacht werden. Weitere, teils historische Datensätze werden über das Datenarchiv für Sekundäranalysen erschlossen.

Das wichtigste statistische Werkzeug zur Auswertung dieser Daten ist nach wie vor die Regressionsanalyse. Innovationen wie deren Erweiterung für nicht-kontinuierliche Variablen, für indirekt gemessene Variablen und für Mehr-Ebenen-Strukturen ermöglichen es, die theoretischen Ansätze der Wahlsoziologie adäquat zu modellieren.

Literatur

Achen, Christopher H., und W. Phillips Shively. 1995. Cross-Level Inference. Chicago: University of Chicago Press.

Altemeyer, Bob. 1981. Right-Wing Authoritarianism. Winnipeg: The University of Manitoba Press.

Arzheimer, Kai. 2018. Explaining Electoral Support for the Radical Right. in The Oxford Handbook of the Radical Right, Hrsg. Jens Rydgren, 143–165. Oxford University Press.

Arzheimer, Kai. 2020. Politischer Extremismus. in Politikwissenschaftliche Einstellungs- und Verhaltensforschung. Handbuch für Wissenschaft und Studium, Hrsg. Thorsten Faas, Oscar W. Gabriel, und Jürgen Maier, 296–308. Baden-Baden: Nomos.

Assche, Jasper van, Arne Roets, Jonas de Keersmaecker, und Alain van Hiel. 2017. The Mobilizing Effect of Right-Wing Ideological Climates: Cross-Level Interaction Effects on Different Types of Outgroup Attitudes. Political Psychology 38(5):757–776. DOI: https://doi.org/10.1111/pops.12359.

Bandilla, Wolfgang. 2015. Online-Befragungen. Mannheim: Gesis Leibniz-Institut für Sozialwissenschaften.

Beckmann, Katharina, Axel Glemser, Christiane Heckel, Christian von der Heyde, Jürgen H.P. Hoffmeyer-Zlotnik, Ute Hanefeld, Robert Herter-Eschweiler, und Carola Kühnen. 2016. Demographische Standards. Eine gemeinsame Empfehlung des ADM, Arbeitskreis Deutscher Markt- und Sozialforschungsinstitute e.V., der Arbeitsgemeinschaft Sozialwissenschaftlicher Institute e.V. (ASI) und des Statistischen Bundesamtes 6. Aufl. Wiesbaden: Statistisches Bundesamt.

Bischof, Daniel, und Markus Wagner. 2019. Do Voters Polarize When Radical Parties Enter Parliament? American Journal of Political Science 63(4):888–904. DOI: https://doi.org/10.1111/ajps.12449.

Bos, Linda, Christian Schemer, Nicoleta Corbu, Michael Hameleers, Ioannis Andreadis, Anne Schulz, Desirée Schmuck, Carsten Reinemann, und Nayla Fawzi. 2020. The Effects of Populism as a Social Identity Frame on Persuasion and Mobilisation: Evidence From a 15-country Experiment. European Journal of Political Research 59(1):3–24. DOI: https://doi.org/10.1111/1475-6765.12334.

Faas, Thorsten, und Sascha Huber. 2010. Experimente in der Politikwissenschaft: Vom Mauerblümchen zum Mainstream. Politische Vierteljahresschrift 51(4):721–749. DOI: https://doi.org/10.1007/s11615-010-0039-3.

Ferrín, Mónica, Moreno Mancosu, und Teresa M. Cappiali. 2019. Terrorist Attacks and Europeans’ Attitudes Towards Immigrants: An Experimental Approach. European Journal of Political Research:online first. DOI: https://doi.org/10.1111/1475-6765.12362.

Fitzgerald, Jennifer. 2018. Close to Home. Local Ties and Voting Radical Right in Europe. Cambridge: Cambridge University Press.

Fitzgerald, Jennifer, und Duncan Lawrence. 2011. Local Cohesion and Radical Right Support: The Case of the Swiss People’s Party. Electoral Studies 30(4):834–847. DOI: https://doi.org/10.1016/j.electstud.2011.08.004.

Haffert, Lukas. 2021. The Long-Term Effects of Oppression: Prussia, Political Catholicism, and the Alternative für Deutschland. American Political Science Review online first:1–20. DOI: https://doi.org/10.1017/s0003055421001040.

Herz, Thomas A. 1975. Soziale Bedingungen für Rechtsextremismus in der Bundesrepublik Deutschland und in den Vereinigten Staaten : eine vergleichende Analyse der Anhänger der Nationaldemokratischen Partei Deutschlands und der Anhänger von George C. Wallace. Meisenheim am Glan: Hain.

Hoerner, Julian M., Alexander Jaax, und Toni Rodon. 2019. The Long-Term Impact of the Location of Concentration Camps on Radical-Right Voting in Germany. Research & Politics 6(4):1–8. DOI: https://doi.org/10.1177/2053168019891376.

Hox, Joop J. 2010. Multilevel Analysis. Techniques and Applications 2. Aufl. New York: Routledge.

Kaufmann, Eric. 2019. Can Narratives of White Identity Reduce Opposition to Immigration and Support for Hard Brexit? A Survey Experiment. Political Studies 67(1):31–46. DOI: https://doi.org/10.1177/0032321717740489.

King, Gary. 1997. A Solution to the Ecological Inference Problem. Reconstructing Individual Behavior from Aggregate Data. Princeton: Princeton University Press.

Klingemann, Hans-Dieter, und Franz Urban Pappi. 1972. Politischer Radikalismus. Theoretische und methodische Probleme der Radikalismusforschung, dargestellt am Beispiel einer Studie anläßlich der Landtagswahl 1970 in Hessen. München, Wien: Oldenbourg.

Kreis, Joachim. 2007. Zur Messung von rechtsextremer Einstellung. Probleme und Kontroversen am Beispiel zweier Studien. Berlin: Freie Universität Berlin.

Loxbo, Karl, und Niklas Bolin. 2016. Party Organizational Development and the Electoral Performance of the Radical Right: Exploring the Role of Local Candidates in the Breakthrough Elections of the Sweden Democrats 2002-2014. Journal of Elections, Public Opinion and Parties 26(2):170–190. DOI: https://doi.org/10.1080/17457289.2016.1145685.

Marx, Paul, und Gijs Schumacher. 2018. Do Poor Citizens Vote for Redistribution, Against Immigration or Against the Establishment? A Conjoint Experiment in Denmark. Scandinavian Political Studies 41(3):263–282. DOI: https://doi.org/10.1111/1467-9477.12119.

Mayer, Sabrina. 2011. Die Wähler der NPD. Eine empirische Untersuchung der Einflussfaktoren auf die Wahl der NPD 1969. Wiesbaden: Drewipunkt.

Rees, Jonas H., Yann P. M. Rees, Jens H. Hellmann, und Andreas Zick. 2019. Climate of Hate: Similar Correlates of Far Right Electoral Support and Right-Wing Hate Crimes in Germany. Frontiers in Psychology 10:online first. DOI: https://doi.org/10.3389/fpsyg.2019.02328.

Schnell, Rainer. 2019. Survey-Interviews Methoden standardisierter Befragungen 2. Aufl. Wiesbaden: Springer VS.

Schnell, Rainer, Paul B. Hill, und Elke Esser. 2018. Methoden der empirischen Sozialforschung 11. Aufl. Berlin, Boston: De Gruyter Oldenbourg.

Schoen, Harald. 2014. Daten in der empirischen Wahlforschung. in Handbuch Wahlforschung, Hrsg. Jürgen W. Falter, und Harald Schoen, 109–131. Wiesbaden: Springer VS.

Schumann, Siegfried. 2001. Persönlichkeitsbedingte Einstellungen zu Parteien. Der Einfluß von Persönlichkeitseigenschaften auf Einstellungen zu politischen Parteien. München, Wien: Oldenbourg.

Schumann, Siegfried. 2005. Die ASKO-Skala. in Persönlichkeit. Eine vergessene Größe der empirischen Sozialforschung, Hrsg. Siegfried Schumann, und Harald Schoen, 41–57. Wiesbaden: VS Verlag für Sozialwissenschaften.

Schumann, Siegfried. 2019. Repräsentative Umfrage. Praxisorientierte Einführung in empirische Methoden und statistische Analyseverfahren 7. Aufl. Berlin, Boston: De Gruyter Oldenbourg.

Sekhon, Jasjeet S. 2009. Opiates for the Matches: Matching Methods for Causal Inference. Annual Review of Political Science 12:487–508. DOI: https://doi.org/10.1146/annurev.polisci.11.060606.135444.

Shugart, Matthew Søberg, und John M. Carey. 1992. Presidents and Assemblies. Constitutional Design and Electoral Dynamics. Cambridge: Cambridge University Press.

Silva, Bruno Castanho, Sebastian Jungkunz, Marc Helbling, und Levente Littvay. 2020. An Empirical Comparison of Seven Populist Attitudes Scales. Political Research Quarterly 73(2):409–424. DOI: https://doi.org/10.1177/1065912919833176.

Spanje, Joost van, und Till Weber. 2017. Does Ostracism Affect Party Support? Comparative Lessons and Experimental Evidence. Party Politics:online first. DOI: https://doi.org/10.1177/1354068817730722.

Titiunik, Rocío. 2021. Natural Experiments. in Advances in Experimental Political Science, Hrsg. James N. Druckman, und Donald P.Editors Green, 103–129. Cambridge University Press.

Turnbull-Dugarte, Stuart J., und José Rama. 2022. When the Us Far-right Sneezes, the European Far-right Catches a Cold. Quasi-experimental Evidence of Electoral Contagion From Spain. Electoral Studies 76:online first. DOI: https://doi.org/10.1016/j.electstud.2022.102443.

Western, Bruce, und Simon Jackman. 1994. Bayesian Inference for Comparative Research. American Political Science Review 88:412–423.


  1. Innerhalb des klassischen inferenzstatistischen Ansatzes ist die exakte Interpretation solcher Konfidenzintervalle wenig anschaulich: Wenn die Stichprobenziehung unter essentiell identischen Bedingungen sehr oft wiederholt würde, würden die Konfidenzintervalle, die um den Anteilswert in der jeweiligen Stichproben herum konstruiert werden, in 95 von 100 Fällen den unbekannten wahren Anteilswert in der Grundgesamtheit einschließen.
  2. Die Konstante entspricht dem Wert, der für eine Befragte erwarte würde, bei der alle unabhängigen Variablen den Wert 0 annehmen. Dies ist in manchen Konstellationen gar nicht möglich oder zumindest unwahrscheinlich. Im konkreten Fall ist β0 die subjektive Wahrscheinlichkeit, die für eine westdeutsche Frau erwartet wird, die den Nationalsozialismus stark negativ bewertet und keinerlei formale Schulbildung hat.
  3. Das Konfidenzintervall schließt außerdem den Wert von null nicht mit ein. Diese Information ist äquivalent zu einem Test auf statistische Signifikanz: Die Wahrscheinlichkeit, mit den Daten aus der Stichprobe einen so großen (oder noch größeren) Koeffizienten zu ermitteln, wenn dessen wahrer Wert in der Bevölkerung gleich null ist, ist (sehr viel) kleiner als fünf Prozent.