Workbench zur untertitelbasierten Sentimentanalyse von TV Serien
- Thema:
- Workbench zur untertitelbasierten Sentimentanalyse von TV Serien
- Art:
- MA
- BetreuerIn:
- Manuel Burghardt
- BearbeiterIn:
- Alexander Uitz
- ErstgutachterIn:
- Christian Wolff
- ZweitgutachterIn:
- N.N.
- Status:
- abgeschlossen
- Stichworte:
- Digital Humanities, Filmanalyse
- angelegt:
- 2016-10-24
- Beginn:
- 2016-09-01
- Antrittsvortrag:
- 2016-11-21
- Abschlussvortrag:
- 2017-03-30
- Textlizenz:
- Unbekannt
- Codelizenz:
- Unbekannt
Hintergrund
Aufbauend auf dem Projekt„„SAT - Series Analysis Tool“, welches im Digital Humanities-Seminar entwickelt wurde, soll diese Masterarbeit das Projekt erweitern und die Stabilität des Backends verbessern. In einem Vorgespräch mit einem Experten für Serienanalyse am Lehrstuhl für Medienwissenschaft wurde der bestehende SAT-Prototyp gut angenommen, und diverse Ideen zur Weiterentwicklung erarbeitet.
Die Probleme, mit welchen sich diese Masterarbeit beschäftigt, sind folgende: (1) die Menge der Daten sorgt dafür, dass das Backend (Phyton CGI, SQL Datenbank & CouchDB) sehr hohe Latenzzeiten hat (2) Die Features im Frontend sind noch sehr begrenzt nutzbar (3) Wissenschaftlicher Nutzen des Tools im Zusammenhang der Digital Humanities und Medienwissenschaft
Zielsetzung der Arbeit
Das Ziel der Arbeit ist den wissenschaftlichen Wert des Tools klar darzustellen und die oben genannten Probleme in der Praxis umzusetzen, sowie Anwendungsmöglichkeiten darzulegen.
Theorieteil:
Related Work Film/Serienanalyse
qualitative vs. Quantitative Serienanalyse (Distant Reading/Watching)
Bezug zur Informatik(DH)
Praxisteil:
Umbau des Backends und Feature Erweiterung des Frontends
Fallstudie: Anwendungsszenarien zur Nutzung des Tools
Konkrete Aufgaben
Literaturrecherche: Film- und Serienanalyse
Wissenschaftlichen Anspruch klar darlegen (Kontext Digital Humanities / Quant. Filmanalyse)
Umbau/Verbesserung/Umstruktierung des Backends (mit Benchmarking / Evaluation)
Feature Erweiterung des Frontends:
- Vergleich zweier TV Serien
- Nutzerkommentare ermöglichen
- Verbesserung der bestehenden Visualisierungen
Fallstudie: Konkrete Anwendungsszenarien zur richtigen Nutzung des Tools bereitstellen
Erwartete Vorkenntnisse
Python, Backendprogrammierung, Datenbanken, Sentiment Analyse
Weiterführende Quellen
Mohammad, S. M. (2010). Emotions evoked by common words and phrases: Using Mechanical Turk to create an emotion lexicon. Proceedings of the NAACL HLT 2010 Workshop on Computational Approaches to Analysis and Generation of Emotion in Text, (S. 26-34).
Nielsen, F. Å. (2011). A new ANEW: evaluation of a word list for sentiment analysis in microblogs. In M. R.-S. Hardey (Hrsg.), Proceedings of the ESWC2011 Workshop on 'Making Sense of Microposts': Big things come in small packages, (S. 93-98).
Smith, A. (2014). Breaking Bad: Extraction of Verb-Particle Constructions from a Parallel Subtitles Corpus. Proceedings of the 10th Workshop on Multiword Expressionss (MWE 2014), (S. 1-9).
Tiedemann, J. (2012). Parallel Data, Tools and Interfaces in OPUS. Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC 2012).
Howanitz, G., Distant Watching – Ein quantitativer Zugang zu YouTube-Videos
Moretti, F., Distant Reading
Boot, P. (2014). Review of Distant Reading.
Goodwin, J., & Holbo, J. (2011). Reading graphs, maps trees. Parlor Press.
Mikos, L., Film und Fernsehanalyse