Zurück zum Vorlesungsverzeichnis
Uni-Siegen
14. März 2017

Korpus und Statistikworkshop

In diesem Methodenseminar für LinguistInnen wird in die Grundlagen der quantitativen empiri­schen Forschung kom­pakt und überblickshaft eingeführt. Der Schwerpunkt liegt auf der statisti­schen Analyse, als Daten werden Korpusdaten verwendet. Eine Einführung in die Arbeit mit Korpo­ra ist daher in das...

Erstelle deinen persönlichen Lernplan

Wir helfen dir, diesen Kurs optimal vorzubereiten — mit einem individuellen Lernplan, Tipps und passenden Ressourcen.

Jetzt Lernplan erstellen
In diesem Methodenseminar für LinguistInnen wird in die Grundlagen der quantitativen empiri­schen Forschung kom­pakt und überblickshaft eingeführt. Der Schwerpunkt liegt auf der statisti­schen Analyse, als Daten werden Korpusdaten verwendet. Eine Einführung in die Arbeit mit Korpo­ra ist daher in das Seminar integriert. Die statistischen Verfahren sind allerdings in gleichem Maß für andere Arten von Daten in der Linguistik anwendbar (z.B. Grammatikalitätsurteile, Lesezeiten). Vorkenntnisse sind nicht erforderlich. TeilnehmerInnen werden durch das Seminar vor allem in die Lage versetzt, sich selbständig in methodischen Fragen (insbesondere Statistik) weiterzubil­den. Methodisch wechseln sich Vorlesung und Übung ab, indem jeder der thematischen Blöcke (bis auf die ersten beiden) mit einem Vorlesungsteil beginnt und in einen Übungsabschnitt mündet. Es wird mit der freien Statistiksoftware R und der Benutzeroberfläche RStudio gearbeitet, Korpusanfragen erfolgen innerhalb von R mittels der Bibliothek rcqp, einer Anbindung von R an die IMS Open Corpus Work­bench (CWB). Teilnehmer erhalten vom Dozenten einen zeitlich begrenzten Zugang zu einer Server-Version von RStudio und benötigen daher nur einen aktuellen Browser und Internetzugang, um den Kurs zu absolvieren. Vor allem für Teilneh­mer, die im Anschluss an das Seminar autark weiterarbei­ten möchten, gibt es folgende alternative Mög­lichkeiten: 1. Eigene native Installation • Benutzer von GNU/Linux können R, RStudio und rcqp selber problemlos installieren. • Für OSX-Benutzer gilt (vermutlich) dasselbe. Der Dozent kann aber keinerlei spezifische Hilfestellung für OSX-Systeme (vulgo -Macintosh-) geben. • Windows-Benutzer können R und RStudio installieren. Allerdings funktioniert rcqp unter Windows nicht. Korpusanfragen müssen gesondert durchgeführt werden und die Ergebnisse in R im­portiert werden. Das ist allerdings problemlos möglich und wird im Seminar behan­delt. http://cran.r-project.org/ http://www.rstudio.com/ http://cran.r-project.org/package=rcqp 2. Virtuelle Maschine Auf leistungsfähigen PCs (egal welches Betriebssystem; im Fall von Windows wird allerdings dringend exakt die Version 7 empfohlen) kann die freie Software VirtualBox in­stalliert werden. Darin kann ein GNU/Linux mit R, RStu­dio und rcqp gestartet werden, das vom Dozenten fertig konfiguriert zur Verfügung gestellt wird. Der PC sollte bei dieser Variante mindestens einen Doppelkern-Pro­zessor und 4 GB RAM haben. Sie benötigen außerdem 15 GB freien Fest­plattenspeicher. Als einfache Leis­tungsmessung für Windows-Systeme gilt: Stoppen Sie die Bootzeit Ihres PCs (vom An­schalten bis der Desktop in einsatzfähigem Zustand ist). Dauert der Bootvorgang merk­lich län­ger als zwei Minuten, werden Sie mit VirtualBox nicht vernünftig ar­beiten können. http://www.virtualbox.org/ Struktur der Lehrveranstaltung (inkl. veranschlagter Stunden) 1 Wissenschaft und quantitative Forschung (1) 2 Prinzipien der Statistik (2) 3 Benutzung von R/RStudio und Korpora (CQP, Cosmas) (4) 4 Deskriptive Statistik (3) 5 Nichtparametrische Tests für Zähldaten (χ², Fisher, Chancenverhältnis) (3) 6 t-Test, ANOVA und Alternativen (Mann-Whitney, Kruskal-Wallis) (4) 7 Lineare Modelle (LM) und generalisierte lineare Modelle (GLM) (4) 8 Eigene Studie (5) Germanistik - Sprachwissenschaft II Universität Siegen SoSe 2014 Dr. Schäfer Roland