Workbench zur untertitelbasierten Sentimentanalyse von TV Serien

Thema:: Workbench zur untertitelbasierten Sentimentanalyse von TV Serien
Art:: MA
BetreuerIn:: Manuel Burghardt
BearbeiterIn:: Alexander Uitz
ErstgutachterIn:: Christian Wolff
ZweitgutachterIn:: N.N.
Status:: abgeschlossen
Stichworte:: Digital Humanities, Filmanalyse
angelegt:: 2016-10-24
Beginn:: 2016-09-01
Antrittsvortrag:: 2016-11-21
Abschlussvortrag:: 2017-03-30
Textlizenz:: Unbekannt
Codelizenz:: Unbekannt

Hintergrund

Aufbauend auf dem Projekt„„SAT - Series Analysis Tool“, welches im Digital Humanities-Seminar entwickelt wurde, soll diese Masterarbeit das Projekt erweitern und die Stabilität des Backends verbessern. In einem Vorgespräch mit einem Experten für Serienanalyse am Lehrstuhl für Medienwissenschaft wurde der bestehende SAT-Prototyp gut angenommen, und diverse Ideen zur Weiterentwicklung erarbeitet.

Die Probleme, mit welchen sich diese Masterarbeit beschäftigt, sind folgende: (1) die Menge der Daten sorgt dafür, dass das Backend (Phyton CGI, SQL Datenbank & CouchDB) sehr hohe Latenzzeiten hat (2) Die Features im Frontend sind noch sehr begrenzt nutzbar (3) Wissenschaftlicher Nutzen des Tools im Zusammenhang der Digital Humanities und Medienwissenschaft

Zielsetzung der Arbeit

Das Ziel der Arbeit ist den wissenschaftlichen Wert des Tools klar darzustellen und die oben genannten Probleme in der Praxis umzusetzen, sowie Anwendungsmöglichkeiten darzulegen.

Theorieteil:

Related Work Film/Serienanalyse

qualitative vs. Quantitative Serienanalyse (Distant Reading/Watching)

Bezug zur Informatik(DH)

Praxisteil:

Umbau des Backends und Feature Erweiterung des Frontends

Fallstudie: Anwendungsszenarien zur Nutzung des Tools

Konkrete Aufgaben

Literaturrecherche: Film- und Serienanalyse

Wissenschaftlichen Anspruch klar darlegen (Kontext Digital Humanities / Quant. Filmanalyse)

Umbau/Verbesserung/Umstruktierung des Backends (mit Benchmarking / Evaluation)

Feature Erweiterung des Frontends:

Vergleich zweier TV Serien
Nutzerkommentare ermöglichen
Verbesserung der bestehenden Visualisierungen

Fallstudie: Konkrete Anwendungsszenarien zur richtigen Nutzung des Tools bereitstellen

Erwartete Vorkenntnisse

Python, Backendprogrammierung, Datenbanken, Sentiment Analyse

Weiterführende Quellen

Mohammad, S. M. (2010). Emotions evoked by common words and phrases: Using Mechanical Turk to create an emotion lexicon. Proceedings of the NAACL HLT 2010 Workshop on Computational Approaches to Analysis and Generation of Emotion in Text, (S. 26-34).

Nielsen, F. Å. (2011). A new ANEW: evaluation of a word list for sentiment analysis in microblogs. In M. R.-S. Hardey (Hrsg.), Proceedings of the ESWC2011 Workshop on 'Making Sense of Microposts': Big things come in small packages, (S. 93-98).

Smith, A. (2014). Breaking Bad: Extraction of Verb-Particle Constructions from a Parallel Subtitles Corpus. Proceedings of the 10th Workshop on Multiword Expressionss (MWE 2014), (S. 1-9).

Tiedemann, J. (2012). Parallel Data, Tools and Interfaces in OPUS. Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC 2012).

Howanitz, G., Distant Watching – Ein quantitativer Zugang zu YouTube-Videos

Moretti, F., Distant Reading

Boot, P. (2014). Review of Distant Reading.

Goodwin, J., & Holbo, J. (2011). Reading graphs, maps trees. Parlor Press.

Mikos, L., Film und Fernsehanalyse