Computergestützte Analyse von deutschsprachigen Memes auf Reddit

Thema:
Computergestütze Analyse von deutschsprachigen Memes auf Reddit
Art:
MA
BetreuerIn:
Thomas Schmidt
BearbeiterIn:
Laurin Rolny
ErstgutachterIn:
Christian Wolff
ZweitgutachterIn:
Jürgen Reischer
Status:
abgeschlossen
Stichworte:
Memes, NLP, Reddit, Digital Humanities, Internet Studies, Python, Scraping
angelegt:
2024-04-29
Antrittsvortrag:
2024-04-29
Abschlussvortrag:
2024-09-17

Hintergrund

Memes sind ein wichtiger Bestandteil der heutigen Internet-Kultur und spiegeln aktuelle Entwicklungen in Popkultur, Politik oder Sport wider. Die erste Beschreibung des Phänomens Meme entstammt dem Buch „The Selfish Gene“ von Richard Dawkins, in dem Memes als kulturelle Gene beschrieben werden, die sich durch komplexe Prozesse von Mutation und Vererbung verbreiten und entwickeln. Daher bietet die Computergestüzte Analyse von Memes eine gute Möglichkeit sich über die Themen und Meinungen, welche im Internet geteilt werden, einen Überblick zu verschaffen. Dies Spielt auch gesellschaftlich eine große Rolle, da der Politische Diskurs auch stark durch Meinungsaustausch im Internet geprägt wird.

Zielsetzung der Arbeit

Ziel der Arbeit ist es ein Korpus von Memes zu generieren welche auf den größten Deutschen Meme-Subreddits geteilt werden. Dabei werden nur Memes in das Korpus aufgenommen die als Bilddatei vorliegen, Videos werden von der Analyse ausgeschlossen. Daraufhin sollen die im Korpus enthaltenen Memes mithilfe von Computer-Vision-Methoden geclustert werden, um sie etwaigen gemeinsamen Templates zuordnen zu können. Auch soll Face-Recognition dabei helfen bekannte Persönlichkeiten, die in Memes eingearbeitet werden zu erkennen. Mithilfe von verschiedenen NLP-Methoden soll der Text, welcher aus den Memes extrahiert wurde, analysiert werden. Ziel der Arbeit ist es eine Datengrundlage über die Entwicklung der Themen in den einzelnen Subreddits über den zeitlichen Verlauf herzustellen. Zudem sollen die einzelnen Subreddits mit den gewonnenen Daten miteinander verglichen werden.

Konkrete Aufgaben

  • Sichtung der deutschen Meme Landschaft
  • Daten beschaffung (Bilder und Metadaten)
  • Extrahieren der Textbestandteile
  • Datenvorverarbeitung
  • Passende NLP Methoden heraussuchen und anwenden
  • Bilder clustern
  • Face recognition anwenden
  • Daten visualisieren

Erwartete Vorkenntnisse

  • Python
  • Scraping
  • NLP Grundlagen
  • DH Grundlagen

Weiterführende Quellen

Richard Dawkins. 1976. The selfish gene new york: Oxford university press. DawkinsThe Selfish Gene1976.

Patrick Davison. 2012. 9. the language of internet memes. In The social media reader, pages 120–134. New York University Press.