Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende ÜberarbeitungLetzte ÜberarbeitungBeide Seiten der Revision | ||
arbeiten:extraktion_praegnanter_zitate_der_abgeordneten_des_oesterreichischen_nationalrats_aus_den_parlamentsprotokollen_der_24._und_25._gesetzgebungsperiode_anhand_von_n-gramm-ermittlung_und_sentiment-analyse [30.08.2015 11:35] – mb Manuel Burghardt | arbeiten:extraktion_praegnanter_zitate_der_abgeordneten_des_oesterreichischen_nationalrats_aus_den_parlamentsprotokollen_der_24._und_25._gesetzgebungsperiode_anhand_von_n-gramm-ermittlung_und_sentiment-analyse [22.05.2016 18:37] – [Data-Entry] buk25587 | ||
---|---|---|---|
Zeile 2: | Zeile 2: | ||
---- dataentry StudentischeArbeit ---- | ---- dataentry StudentischeArbeit ---- | ||
- | Thema | + | Thema |
- | Art_tags | + | Art_thesistypes |
- | Betreuer_title | + | Betreuer_thesisadvisor |
- | Student_title | + | Student |
- | Professor_title | + | Professor_thesisprofessor |
- | Status_tag | + | Status_thesisstate |
- | Stichworte_tags | + | Stichworte_thesiskeywords |
- | angelegt_dt | + | angelegt_dt |
- | Beginn_dt | + | Beginn_dt |
- | Ende_dt | + | Anmeldung_dt |
+ | Antrittsvortrag_dt | ||
+ | Abschlussvortrag_dt | ||
+ | Ende_dt | ||
---- | ---- | ||
+ | |||
+ | |||
Zeile 24: | Zeile 29: | ||
=== Konkrete Aufgaben === | === Konkrete Aufgaben === | ||
1. Aufbereitung des Textmaterials (JAVA, Stanford NLP): | 1. Aufbereitung des Textmaterials (JAVA, Stanford NLP): | ||
+ | |||
a) Extraktion der relevanten Redensabschnitte aus den Protokollen | a) Extraktion der relevanten Redensabschnitte aus den Protokollen | ||
+ | |||
b) Segmentierung und Tokenisierung | b) Segmentierung und Tokenisierung | ||
+ | |||
c) POS-Tagging, | c) POS-Tagging, | ||
2. Analyse des Textmaterials (NLTK, Python): | 2. Analyse des Textmaterials (NLTK, Python): | ||
+ | |||
a) Stoppwortermittlung | a) Stoppwortermittlung | ||
+ | |||
b) N-Gramm-Analyse | b) N-Gramm-Analyse | ||
- | d) Wortkontextanalyse | + | |
+ | c) Wortkontextanalyse | ||
d) Phrasenanalyse | d) Phrasenanalyse | ||
+ | |||
=> Speicherung im CSV/ | => Speicherung im CSV/ | ||
3. Deutung und Darstellung des gewonnenen Materials (Excel, D3.js) | 3. Deutung und Darstellung des gewonnenen Materials (Excel, D3.js) | ||
+ | |||
a) Fehlerdiskussion | a) Fehlerdiskussion | ||
+ | |||
b) Gegenüberstellung | b) Gegenüberstellung | ||
+ | |||
c) Interpretation | c) Interpretation | ||