Zurück zum Vorlesungsverzeichnis
Uni-Düsseldorf
14. März 2017

Aufbauseminar Korpuserstellung und Annotation

Ein Korpus wird in der Linguistik verstanden als eine Sammlung von Texten oder Textteilen in (meist) elektronischer Form, die nach bestimmten Kriterien ausgewählt wurden. Es dient als Datenbasis für die linguistische Analyse von Merkmalen einer Sprache (vgl. Sinclair 2005, McEnery...

Erstelle deinen persönlichen Lernplan

Wir helfen dir, diesen Kurs optimal vorzubereiten — mit einem individuellen Lernplan, Tipps und passenden Ressourcen.

Jetzt Lernplan erstellen
Ein Korpus wird in der Linguistik verstanden als eine Sammlung von Texten oder Textteilen in (meist) elektronischer Form, die nach bestimmten Kriterien ausgewählt wurden. Es dient als Datenbasis für die linguistische Analyse von Merkmalen einer Sprache (vgl. Sinclair 2005, McEnery et al. 2006). Bei der Analyse von Korpora werden Klassifizierungen, Interpretationen und Anmerkungen schriftlich festgehalten (annotiert), sodass sie für eine systematische Auswertung zur Verfügung stehen.      Im ersten Teil des Kurses werden wir uns zunächst damit beschäftigen, wie man ein Korpus erstellt. Dazu diskutieren wir unter anderem folgende Fragen und Voraussetzungen: Was ist und wozu dient ein Korpus? Nach welchen Kriterien gestalte ich ein Korpus? Welche Textsorten sollte das Korpus umfassen? Wie gehe ich bei der Erstellung vor? Woher bekomme ich die Texte? Wo liegen die Möglichkeit und Grenzen der Aussagekraft korpusbasierter Ergebnisse? Im Anschluss diskutieren wir Annotationsverfahren und arbeiten heraus, wie sie gestaltet sind und wie man Kriterien zur Klassifikation selbstständig herleitet. Der Fokus liegt dabei auf Verfahren zur manuellen (d.h. menschlichen) Annotation; automatische Klassifikationsverfahren der Computerlinguistik werden nicht behandelt.    Im zweiten Teil bearbeiten die Teilnehmer in kleinen Teams ein eigenes kleines Projekt zu einem semantischen oder einem pragmatischen Phänomen. Dazu formulieren Sie jeweils eine eigene wissenschaftliche Fragestellung, konzipieren dazu ein passendes, limitiertes Korpus, entwickeln geeignete Annotationsrichtlinien und testen diese in einem zweistufigen Verfahren. Der Kurs findet als Blockseminar am 13.07., 14.07. und 12.09. von 9:30-17h statt, in der Zwischenzeit erfolgt intensive Projektarbeit in den Teams und im Austausch zwischen den Teams. Ferner werden an zwei Terminen im August, die im Kurs vereinbart werden, kurze Zwischenbesprechungen stattfinden. Da es sich um Projektarbeit handelt, ist die Anwesenheit an allen Terminen erforderlich. Linguistik (BA, PO 2013) integr. Universität Düsseldorf SoSe 2016 Horn Christian