arbeiten:extraktion_praegnanter_zitate_der_abgeordneten_des_oesterreichischen_nationalrats_aus_den_parlamentsprotokollen_der_24._und_25._gesetzgebungsperiode_anhand_von_n-gramm-ermittlung_und_sentiment-analyse

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Nächste Überarbeitung
Vorhergehende Überarbeitung
arbeiten:extraktion_praegnanter_zitate_der_abgeordneten_des_oesterreichischen_nationalrats_aus_den_parlamentsprotokollen_der_24._und_25._gesetzgebungsperiode_anhand_von_n-gramm-ermittlung_und_sentiment-analyse [23.06.2015 13:43] – Erstellt mit dem Formular arbeiten:anlegen Manuel Burghardtarbeiten:extraktion_praegnanter_zitate_der_abgeordneten_des_oesterreichischen_nationalrats_aus_den_parlamentsprotokollen_der_24._und_25._gesetzgebungsperiode_anhand_von_n-gramm-ermittlung_und_sentiment-analyse [01.10.2019 11:38] (aktuell) Alexander Bazo
Zeile 1: Zeile 1:
-====== Extraktion prägnanter Zitate der Abgeordneten des Österreichischen Nationalrats aus den Parlamentsprotokollen der 24. und 25. Gesetzgebungsperiode anhand von N-Gramm-Ermittlung und Sentiment-Analyse ======+====== Eine kontrastive Diskursanalyse der Parlamentsreden von FPÖ und Grünen anhand textlinguistischer Datenverarbeitung ======
  
 ---- dataentry StudentischeArbeit ---- ---- dataentry StudentischeArbeit ----
-Thema                Extraktion prägnanter Zitate der Abgeordneten des Österreichischen Nationalrats aus den Parlamentsprotokollen der 24. und 25. Gesetzgebungsperiode anhand von N-Gramm-Ermittlung und Sentiment-Analyse +Thema                     Eine kontrastive Diskursanalyse der Parlamentsreden von FPÖ und Grünen anhand textlinguistischer Datenverarbeitung #  
-Art_tags      : BA +Art_thesistypes           : BA  
-Betreuer_title        user:Manuel Burghardt|Manuel Burghardt +BetreuerIn_thesisadvisor    : Manuel Burghardt  
-Student_title        user:Colin Sippl|Colin Sippl +BearbeiterIn                   : Colin Sippl  
-Professor_title      user:Christian Wolff|Christian Wolff +ErstgutachterIn_thesisprofessor : Christian Wolff  
-Status_tag    in Bearbeitung +ZweitgutachterIn_secondthesisprofessor : N.N. 
-Stichworte_tags : Digital Humanities, Korpuslinguistik, Sentiment Analysis +Status_thesisstate        abgeschlossen #  
-angelegt_dt              : 2015-06-23 +Stichworte_thesiskeywords : Digital Humanities, Korpuslinguistik, Sentiment Analysis  
-Beginn_dt             :  +angelegt_dt               : 2015-06-23  
-Ende_dt            +Beginn_dt                 :  #  
 +Anmeldung_dt              :  
 +Antrittsvortrag_dt        : 2015-07-06 
 +Abschlussvortrag_dt       :  
 +Abgabe_dt                   :  #  
 +Textlizenz_textlicense Unbekannt 
 +Codelizenz_codelicense Unbekannt
 ---- ----
 +
 +
 +
  
 === Hintergrund === === Hintergrund ===
-kommt noch ...+Mit der täglich zunehmenden Textmenge steigt die Bedeutung textlinguistischer Verfahren, die eine schnelle Kategorisierung und inhaltliche Erschließung der Textdaten ermöglichenVor diesem Hintergrund sollen in dieser Bachelorarbeit die Wortprotokolle parlamentarischer Reden anhand einiger ausgewählter Methoden der auf der Computerlinguistik basierenden Diskursanalyse näher zu betrachten  
  
 === Zielsetzung der Arbeit === === Zielsetzung der Arbeit ===
-kommt noch ...+Die Stenographischen Protokolle des Österreichischen Nationalrates sind im Internet als transkribierte Textdokumente für jedermann abrufbar und bilden ein umfassendes Korpus, das die parlamentarischen Debatten, die zumeist von außerordentlicher gesellschaftlicher Relevanz sind, über die Jahre hinweg abbildetGerade in diesen Debatten prallen meist unterschiedlichste Forderungen – um nicht zu sagen Welten – aufeinanderDies gilt insbesondere für die FPÖ und die GRÜNEN, deren Vertreter in Fernsehsendungen recht häufig als unversöhnliche Kontrahenten gegenübersitzen (https://www.youtube.com/watch?v=53syy_amBg8). Gerade weil es sich um zwei Parteien handelt, die an den entgegengesetzten Enden des politischen Spektrums angesiedelt sind, gibt es große inhaltliche und sprachliche Unterschiede. Die Frage ist nun, ob sich diese hinlänglich bekannten Unterschiede im Diskurs dieser beiden Parteien auch mit den Methoden der Computerlinguistik aufzeigen und übersichtlich darstellen lassen
  
 === Konkrete Aufgaben === === Konkrete Aufgaben ===
-Nach Absprache mit dem Betreuer.+1Aufbereitung des Textmaterials (JAVA, Stanford NLP):  
 + 
 +a) Extraktion der relevanten Redensabschnitte aus den Protokollen 
 + 
 +b) Segmentierung und Tokenisierung 
 + 
 +c) POS-Tagging, ggf. Chunking 
 + 
 +2. Analyse des Textmaterials (NLTK, Python): 
 + 
 +a) Stoppwortermittlung  
 + 
 +b) N-Gramm-Analyse 
 + 
 +c) Wortkontextanalyse 
 + 
 +d) Phrasenanalyse 
 + 
 +=> Speicherung im CSV/JSON-Datenformat 
 + 
 +3. Deutung und Darstellung des gewonnenen Materials (Excel, D3.js) 
 + 
 +a) Fehlerdiskussion 
 + 
 +b) Gegenüberstellung 
 + 
 +c) Interpretation 
  
 === Erwartete Vorkenntnisse === === Erwartete Vorkenntnisse ===
-Keine+XML, HTML, Python NLTK, Linguistik / Computerlinguistik
  
 === Weiterführende Quellen === === Weiterführende Quellen ===