arbeiten:extraktion_praegnanter_zitate_der_abgeordneten_des_oesterreichischen_nationalrats_aus_den_parlamentsprotokollen_der_24._und_25._gesetzgebungsperiode_anhand_von_n-gramm-ermittlung_und_sentiment-analyse

Eine kontrastive Diskursanalyse der Parlamentsreden von FPÖ und Grünen anhand textlinguistischer Datenverarbeitung

Thema:
Eine kontrastive Diskursanalyse der Parlamentsreden von FPÖ und Grünen anhand textlinguistischer Datenverarbeitung
Art:
BA
BetreuerIn:
Manuel Burghardt
BearbeiterIn:
Colin Sippl
ErstgutachterIn:
Christian Wolff
ZweitgutachterIn:
N.N.
Status:
abgeschlossen
Stichworte:
Digital Humanities, Korpuslinguistik, Sentiment Analysis
angelegt:
2015-06-23
Antrittsvortrag:
2015-07-06
Textlizenz:
Unbekannt
Codelizenz:
Unbekannt

Hintergrund

Mit der täglich zunehmenden Textmenge steigt die Bedeutung textlinguistischer Verfahren, die eine schnelle Kategorisierung und inhaltliche Erschließung der Textdaten ermöglichen. Vor diesem Hintergrund sollen in dieser Bachelorarbeit die Wortprotokolle parlamentarischer Reden anhand einiger ausgewählter Methoden der auf der Computerlinguistik basierenden Diskursanalyse näher zu betrachten.

Zielsetzung der Arbeit

Die Stenographischen Protokolle des Österreichischen Nationalrates sind im Internet als transkribierte Textdokumente für jedermann abrufbar und bilden ein umfassendes Korpus, das die parlamentarischen Debatten, die zumeist von außerordentlicher gesellschaftlicher Relevanz sind, über die Jahre hinweg abbildet. Gerade in diesen Debatten prallen meist unterschiedlichste Forderungen – um nicht zu sagen Welten – aufeinander. Dies gilt insbesondere für die FPÖ und die GRÜNEN, deren Vertreter in Fernsehsendungen recht häufig als unversöhnliche Kontrahenten gegenübersitzen (https://www.youtube.com/watch?v=53syy_amBg8). Gerade weil es sich um zwei Parteien handelt, die an den entgegengesetzten Enden des politischen Spektrums angesiedelt sind, gibt es große inhaltliche und sprachliche Unterschiede. Die Frage ist nun, ob sich diese hinlänglich bekannten Unterschiede im Diskurs dieser beiden Parteien auch mit den Methoden der Computerlinguistik aufzeigen und übersichtlich darstellen lassen.

Konkrete Aufgaben

1. Aufbereitung des Textmaterials (JAVA, Stanford NLP):

a) Extraktion der relevanten Redensabschnitte aus den Protokollen

b) Segmentierung und Tokenisierung

c) POS-Tagging, ggf. Chunking

  1. Analyse des Textmaterials (NLTK, Python):

a) Stoppwortermittlung

b) N-Gramm-Analyse

c) Wortkontextanalyse

d) Phrasenanalyse

⇒ Speicherung im CSV/JSON-Datenformat

  1. Deutung und Darstellung des gewonnenen Materials (Excel, D3.js)

a) Fehlerdiskussion

b) Gegenüberstellung

c) Interpretation

Erwartete Vorkenntnisse

XML, HTML, Python NLTK, Linguistik / Computerlinguistik

Weiterführende Quellen

Nach Absprache mit dem Betreuer.