Demokratien analysieren mit V-DEM

Setup

Zu Beginn laden wir uns wieder die Pakete, die wir benötigen. Da wir noch am Anfang stehen, ist dies zunächst das tidyverse.

library(tidyverse)
## -- Attaching packages --------------------------------------------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.3     v purrr   0.3.4
## v tibble  3.1.0     v dplyr   1.0.5
## v tidyr   1.1.3     v stringr 1.4.0
## v readr   1.4.0     v forcats 0.5.1
## -- Conflicts ------------------------------------------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()

Der V-DEM Datensatz

“Varieties of Democracy”, kurz V-Dem ist das aktuell umfangreichste Forschungsprojekt, das die Demokratiequalität aller Länder erfasst. Im Gegensatz zu Freedom House oder Polity IV trifft V-Dem nicht nur allgemeine Aussagen über den Zustand demokratischer Institutionen und Freiheiten, sondern liefert sehr viele konkrete Variablen, die einen nuancierten Blick ermöglichen. So gibt V-Dem z. B. auch Aufschluss über die Wissenschaftsfreiheit oder Zensur im Internet. Für uns besonders interessant ist die Verbindung von politischen Variablen mit ökonomischen, geographischen und soziologischen Variablen. So lassen sich bekannte Theorien zur Demokratisierung untersuchen. Die Zeitreihe des Projekts ist ebenfalls beachtlich. Der Kern der Daten beginnt, wie so oft, nach dem zweiten Weltkrieg, doch die Forscherinnen und Forscher der Univeristät Göteborg haben für einige Länder den Grad der Demokratiserung bis 1789 ermittelt – da hatten wir uns auf dem heutigen Gebiet Deutschlands gerade langsam vom Absolutismus verabschiedet.

Laden Sie sich den Datensatz herunter (Nutzen Sie die
“Country-Year: V-Dem Full+Others”-Version für R).

Besonders bei solch großen Datensätzen ist das Codebuch ein wichtiger Begleiter, um alle Variablen identifizieren zu können und einen Überblick über den Datensatz zu bekommen. Der heruntergeladene Ordner enthält das Codebuch bereits. Den Datensatz aus dem entpackten Ordner speichern wir im Ordner für Datensätze /src. Danach laden wir den Datensatz in R:

# Daten laden -------------------------------------------------------------
V_Dem <- readRDS("src/V-Dem-CY-Full+Others-v10.rds") #V-Dem Daten laden
## Warning in readRDS("src/V-Dem-CY-Full+Others-v10.rds"): strings not representable in native encoding will be
## translated to UTF-8

Der Datensatz ist hhhuuuuge und er hat auch the best data. Schauen Sie ihn sich mal in der spread-sheet-Sicht an.

View(V_Dem)

Wir sehen, dass er nach Länderjahren aufgebaut ist, also jede Zeile beinhaltet Informationen (in den Spalten) über ein Land in einem bestimmten Jahr.

Zeitliche Entwicklung von Demokratien

Die Demokratieforschung fragt u.a., wie sich die Demokratie verbreitet und wo es zu Rückfällen in autokratische Systeme kommt. Machen wir uns mal selbst ein Bild über die Entwicklung von Demokratien über Zeit. Die Variable v2x_regime trifft darüber eine Aussage und unterteilt alle Länderjahre in closed autocracies, electoral autocracies, electoral democracies und liberal democracies.

Schauen wir uns die zeitliche Entwicklung mal graphisch an. Dazu müssen wir die Daten allerdings erst ein wenig bearbeiten – data wrangling mit dem tidyverse. Die einzelnen Befehle fügen wir wieder mit der pipe, %>%, zusammen. Für die Visualisierung nutzen wir das uns schon bekannte ggplot (Achtung: im Grafikbefehl werden die Elemente mit “+” aneinandergefügt):

V_Dem %>% 
  # Lösche alle Zeilen mit missings
  drop_na(v2x_regime) %>% 
  # Gruppiere nach Jahr
  group_by(year) %>% 
  # Zähle für jedes Jahr die Häufigkeit der einzelnen Regime-Types
  count(v2x_regime) %>% 
  # Schiebe die Daten in ein ggplot
  ggplot(
    # Schreibe die Jahre auf die x-Achse, die Häufigkeiten der regime-types auf die y-Achse
    aes(x = year, y = n,
        # färbe die Linien nach den unterschiedlichen Regime-Types
        color = factor(v2x_regime, levels = c(0, 1, 2, 3), 
                       labels = c("Closed autocracy", "Electoral autocracy", "Electoral democracy",
                                  "Liberal democracy")), na.rm = TRUE))+
  # Stelle die Daten als Linie dar
  geom_line() +
  # Füge eine vertikale Referenzlinie für das Ende der Weltkriege und
  # die Demokratisierung des Ostblocks ein
  geom_vline(xintercept = c(1918, 1945, 1989)) +
  # Beschrifte die Abbildung und die Achsen
  labs(title = "Entwicklung der Demokratie über Zeit",
       x = "Jahr", y = "Anzahl der Länder") +
  # Definiere die Legende
  guides(color=guide_legend("Regime types"))+
  # wähle das theme_minimal, damit Dich Deine R-buddies nicht mehr dissen, weil Du noch das
  # Standardtheme verwendest.
  theme_minimal()

plot of chunk unnamed-chunk-4

Sehr schick und aussagekräftig! Spielen Sie mal ausführlich mit diesem Befehl herum, um die einzelnen Teile besser zu verstehen. Markieren Sie nacheinander einzelne Zeilen und drücken Sie Strg+Enter: dann sehen Sie, was genau in der Kette der einzelnen Befehle passiert.

Im Datensatz sind die Regiemtypen für jedes Land und Jahr als kategoriale Variable (0 bis 3) aufgeführt. Um diese kummulierte Darstellung zu erreichen, müssen Sie zunächst die Summe der Regimetypen pro Jahr berechnen und dann differenziert nach Regiemtyp darstellen. Dies geschieht im Befehl in zwei Schritten. Zunächst wird mit group_by(year) spezifiziert, dass alle folgenden Befehle nach Jahren getrennt durchgeführt werden sollen. Sie wollen ja nicht die globale Summe berechnen, sondern für jedes Jahr. Mit count(v2x_regime) folgt ein Befehl ähnlich wie mutate(). count() erstellt eine Variable n, die die Summe der Ausprägungen darstellt. Dies hatten wir auch schon bei der Auswertung der Kursumfrage genutzt. Werfen wir einen genauen Blick auf den Befehl und sein Ergebnis:

V_Dem %>% 
  drop_na(v2x_regime) %>% 
  group_by(year) %>% 
  count(v2x_regime)
## # A tibble: 480 x 3
## # Groups:   year [120]
##     year v2x_regime     n
##    <dbl>      <dbl> <int>
##  1  1900          0    95
##  2  1900          1    15
##  3  1900          2     4
##  4  1900          3     1
##  5  1901          0    92
##  6  1901          1    20
##  7  1901          2     3
##  8  1901          3     2
##  9  1902          0    96
## 10  1902          1    18
## # ... with 470 more rows

Sie sehen übersichtlich die neue Datenstruktur aus der dann der Graph erstellt wird. Im Graphikbefehl wird dann mit der Option color = factor(v2x_regime, ...) zusätzlich festgelegt, dass farblich nach dem Wert der Variable v2x_regime, also dem Regimtyp, differenziert werden soll.

Mit diesen Befehlen haben wir nun die Entwicklung und Verteilung verschiedener Regimetypen nach dem V-Dem Datensatz visualisiert. Wichtige historische Entwicklungen, wie das Ende der Weltkriege oder der Zerfall der Sowjetunion sind gut in den Daten zu erkennen (Kommentieren Sie doch mal die Zeile der geom_vlineheraus, indem Sie ein “#” davorsetzen. Dann sehen Sie, dass die vertikalen Referenzlinien verschwinden). Ebenfalls sehen wir, dass seit ca. 2010 zum ersten Mal seit Jahrzehnten liberale Demokratien auf dem Rückzug sind und sich Autokratien ausbreiten.

Demokratie nach Dahl

Nach einem ersten Blick auf die V-Dem Daten gehen wir weiter in die Details der einzelnen Variablen. Die Variable v2x_polyarchy beschreibt den elektoralen Demokratieindex, der das Prinzip der elektoralen Demokratie misst. Eine ideale Umsetzung würde den Wert 1 annehmen, das Gegenteil den Wert 0. Damit können Sie bereits genenauere Aussagen über den Zustand von Demokratien im Vergleich und in ihrer Entwicklung treffen. Im nächsten Schritt wollen wir die Entwicklung dieses Indizes für Deutschland (von 1949 bis 1991 nur Westdeutschland), Polen, Ungarn und Tunesien visualisieren:

V_Dem %>% 
  filter(year > 1899) %>% 
  filter(country_name == "Germany" | country_name == "Poland" | country_name == "Hungary" | country_name == "Tunisia") %>% 
  ggplot() +
  geom_line(mapping = aes(x= year, y=v2x_polyarchy, color = country_name)) +
  theme_minimal()

plot of chunk unnamed-chunk-6
Gut zu erkennen ist die Demokratisierung Deutschlands mit der Weimarer Republik. Sie erinnern sich, 1919 haben wir den Kaiser davon gejagt und bis heute warten seine darbenden Nachkommen auf eine angemessene Entschädigung für das ihnen ergangene Unrecht. Ab 1933 erkennen wir den Aufstieg des Nationalsozialismus (dem die Hohenzollern nach herrschender Meinung erheblich Vorschub geleistet haben). Schließlich wird die Demokratie ab 1949 wieder in Deutschland etabliert. Für Ungarn und Polen erkennen Sie die Demokratisierung nach dem Fall des Eisernen Vorhangs und den bemerkenswerten Abstieg seit 2010. In Tunesien sind u.a. die Erfolge des arabischen Frühlings erkennbar.

Aus der Vorlesung wissen Sie, dass Dahl die ideale real existierende Demokratie als Polyarchie bezeichnet. Sein Konzept beinhaltet zwei Dimensionen: Inklusion und Wettbewerb (“inclusion open to contestation”). Die Konzeption Dahls hat auch Einzug in die Methodik des V-Dem gefunden, sodass wir Werte und Indizes vorliegen haben, mit wir die Länder in Dahls Konzept verorten können.

Als Inklusionswert einer Demokratie ziehen wir die Variable v2x_partipdem heran (Codebuch S. 43). Dies ist der Participatory democracy index, der erhebt inwieweit das Ideal der partizipativen Demokratie erreicht wird (Maximalwert 4). Um die Wettberwerbsdimension zu ermitteln, ziehen wir die Variable v2elfrfair, den clean election index (Codebuch S. 47), heran. Dieser ermittelt inwieweit Wahlen fair und frei sind. Dies gilt insbesondere für den Grad des fairen Wettbewerbs unter Parteien. Da die Variable v2elfrfair nur in Jahren von Wahlen erhoben wird, erstellen wir zunächst die Variable elecfair und übertragen bei fehlenden Werten die Werte der letzten Wahl.

#Lücken in v2elfrfair zu füllen. NAs werden durch Vorjahreswerte ersetzt
V_Dem  <- V_Dem %>% 
  mutate(elecfair = v2elfrfair) %>% 
  fill(elecfair, .direction = "down")

Danach bilden wir nun die beiden Dimensionen in einem Plot ab. Ausgewählt wurden folgende Länder:

  • Schweiz (CHE)
  • Deutschland (DEU)
  • Vereinigte Staaten (USA)
  • Russland (von 1919 bis 1990 Sovietunion) (RUS)
  • China (CHN)
  • Frankreich (FRA)
V_Dem %>%  #Graph Demokratie nach Dahl ausgewählte Länder 
  filter(country_name == "Switzerland" | country_name == "Germany" | country_name == "United States of America" |
           country_name == "Russia" | country_name == "China" | country_name == "France") %>% 
  filter(year == 1800 | year == 1900 | year == 1920 | year == 1939 | year == 1950 | year == 2010) %>% 
  ggplot()+
  geom_text(size = 3.5, aes(x=1, y=4, label = "Polyarchy"))+
  geom_point(aes(x=0, y=-4))+
  geom_text(size = 3.5, check_overlap = TRUE, aes(x=v2x_partipdem, y =elecfair, label = country_text_id, color = factor(year))) +
  theme_minimal()

plot of chunk unnamed-chunk-8

Für diese Darstellung wurde das Geom geom_text verwendet. Im Gegensatz zu bisher verwendeten Geomen gibt dieses Text als Punkte aus, sodass hier sehr einfach zwischen den Staaten unterschieden werden kann. Welchen Text das Geom anzeigt kann mit der Option label = Variable festgelegt werden. Versuchen Sie doch einmal andere Jahre darzustellen oder andere Länder.