Ziele des AppetizeRs

Dieser Online-Kurs möchte Ihren Appetit auf die eigenständige Datenanalyse mit R anregen, auf dass Sie sich selbständig in die weiteren Details hineinfuchsen. Daten selbst zu erheben und zu analysieren bzw. solche Analysen kritisch beurteilen zu können, nützt Ihnen nicht nur in der Politikwissenschaft, sondern auch in vielen anderen Lebenslagen. Der Online-Kurs bietet Ihnen unter den aktuellen Umständen (Corona…) die Möglichkeit, diese Fähigkeit (weiter) zu entwickeln – zu selbst gewählten Zeiten und in der selbst gewählten Geschwindigkeit. Die jeweiligen Inhalte sind an meine Lehrveranstaltungen an der TU Darmstadt (insbesondere die Vorlesung “Einführung in Analysen und Vergleich politischer Systeme” an der TU Darmstadt) angelehnt. Ungefähr alle 14 Tage werden neue Inhalte bereitgestellt.

Mit R wird es Ihnen in kurzer Zeit gelingen, sehr “mächtig” zu werden, also z. B. Tabellen aus Wikipedia zu “schürfen bzw. zu scrapen”, Daten zügig, systematisch und nachvollziehbar zu sammeln und zu analysieren oder ihre Ergebnisse in aussagekräftigen Grafiken zusammenzufassen. Beispielsweise haben wir diese Analyse über die AfD in den Landtagen vollständig in R geschrieben, ohne dass höhere Mathematik vonnöten gewesen wäre (zugegeben: die Datengenerierung ist in diesem Fall eine Wissenschaft bzw. ein Projekt für sich).

Ein Geheimnis der “Macht”, die mit R auch einfachen Nicht-Programmierern zuwächst, liegt in so genannten high-level-functions. Damit geben Sie R einige wenige (auch für Sie gut verständliche) Anweisungen und im Hintergrund dreht das Programm an vielen kleinen komplizierten Rädchen (z. B. Implementationen von Grafiken in java script). An diesen Rädchen musste man bis vor wenigen Jahren noch persönlich drehen und dafür musste man Programmierer sein.

Anders als Stata oder SPSS ist R zudem vollständig kostenlos – Sie müssen niemanden um Geld für Lizenzen anbetteln oder geraten auf die schiefe Bahn, da Sie für den Abschluss einer Hausarbeit noch schnell eine Raubkopie besorgen müssen.

R wird auch von einer riesigen Gemeinschaft stetig weiter entwickelt.

Vergessen Sie über all die Daten, Skripte und fancy Abbildungen aber nicht das intensive Lesen und Nachdenken, denn wie wir aus Shining wissen: “No read and all R makes Jack only half smart.“

Ressourcen

Im R-Universum finden sich extrem viele frei zugängliche Ressourcen, mit denen Sie sich neue Pakete/Fähigkeiten aneignen und ihre Probleme lösen können.
Empfehlen kann ich das (online frei verfügbare) Buch R for Data Science von Garrett Grolemund und Hadley Wickham (einem Superstar im R-Universum – ja, es gibt dort sogar Superstars!). Hilfreich sind die Ressourcen von RStudio. Blogs über einzelne, teils recht fortgeschrittene Methoden finden sich z. B. auf den Method Bites von Denis Cohen vom MZES oder bei R-bloggers. Auf zahlreichen Cheat Sheets sind die Befehle für einige populäre Pakete übersichtlich zusammengefasst,[z. B. für dplyr, das wir für das data wrangling vorwiegend benutzen werden(https://rstudio.com/wp-content/uploads/2015/02/data-wrangling-cheatsheet.pdf).) Außerdem gibt es einige kostenpflichtige Online-Lernportale, wie z.B. DataCamp.

Wenn Ihr Skript mal nicht das tut, was Sie möchten (das wird ständig vorkommen), dürfen Sie davon ausgehen, dass bereits mindestens 1000 Menschen vor Ihnen dasselbe Problem hatten und davon mindestens zehn eine sinnvolle Lösung z. B. auf stackoverflow veröffentlicht haben. Googeln Sie einfach Ihr konkretes Problem und fügen Sie “R” bzw. den entsprechenden Namen des Pakets z. B. “dplyr” in ihre Suche.

Mitarbeit

Dieser Kurs entsteht mit der tatkräftigen Unterstützung von Leon Heckmann, einem studentischen Mitarbeiter an der Universität Mannheim.

DataCamp Support