Inhaltsverzeichnis

Computergestützte Bildanalyse – Implementierung und Evaluation der automatisierten Klassifikation von “Bildtypen”

Thema:
Computergestützte Bildanalyse – Implementierung und Evaluation der automatisierten Klassifikation von “Bildtypen”
Art:
BA
BetreuerIn:
Michael Achmann
BearbeiterIn:
Samantha Geller
Status:
in Bearbeitung
Stichworte:
Computational Social Science, Image Classification, LLM, Annotation, Evaluation
angelegt:
2024-04-04

Hintergrund

Im Rahmen meiner Doktorarbeit beschäftige ich mich mit der computergestützten Analyse von multimedialen Social Media Daten. Multimodal heißt in diesem Kontext, dass es sich um Bild- und Videodateien handelt, die eine visuelle und bis zu zwei textuelle Inhaltsebenen aufweisen (Bildtext + Audio). Beim vorliegenden Abschlussarbeitsthema wollen wir uns auf die visuelle Ebene konzentrieren. Das Bildkorpus stammt aus dem Bundestagswahlkampf 2021 (oder Landtagswahlkampf Bayern 2023) und umfasst Posts und Stories, die von politischen Akteuren im Wahlkampf auf Instagram gepostet wurden. Zur Analyse der politischen Kommunikation gibt es bereits diverse Arbeiten [1]. Im Rahmen der Abschlussarbeit wollen wir einen Analyseansatz, die Bildytpen, computergestützt umsetzen und im Vergleich zu menschlichen Annotationen evaluieren, wie gut die automatisierte Klassifikation funktioniert. Die Bachelorarbeit fokussiert sich dabei auf methodisch-praktische Umsetzung. Literatur zu Bildtypen, das Bildkorpus, und Tutorials zur Umsetzung werden durch den Betreuer bereitgestellt. Es existieren auch erste Experimente zur konkreten Umsetzung der Bildtypenklassifikation, die gerne geteilt werden.

Die computergestützte Bildanalyse ist im Bereich der Geistes- und Sozialwissenschaft ein sehr aktuelles Thema und wird unter den Ideen des “Distant Viewings” (Arnold & Tilton), bzw. “Images as Data” (Peng et al.) vorangetrieben. Die Bildtypenklassifikation im Rahmen der politischen Kommunikation stellt somit ein sehr aktuelles Projekt dar. Dabei wollen wir wissen, wie gut automatisierter Verfahren auf Basis von großen Sprachmodellen oder Machine Learning Ansätzen zur Beantwortung geistes- und sozialwissenschaftlicher Fragestellungen geeignet sind.

Zielsetzung der Arbeit

Für eine erfolgreiche Bachelorarbeit sollen 1-2 Ansätze zur computergestützten Klassifikation von Bildkorpora getest, miteinander verglichen, und im Vergleich zu menschlichen Annotation evaluiert werden. Konkret gibt es also zwei Ziele: 1) Die Identifikation des besten Ansatzes zur computergestützten Bildtypenanalyse und 2) die Evaluation des Modells im Verlgeich zum Menschen.

Abhängig vom gewählten Klassifikationsansatz können entweder mehrere Varianten des gleichen Ansatzes (z. B. verschiedene Prompts) miteinander verglichen werden, oder verschiedene Modelle (z. B. LLM vs. Machine Learning). Basierend auf Ihren eigenen Interessen wählen wir die Ansätze / Modelle im Rahmen der Sprechstunden gemeinsam aus.

Bei den Bildtypen handelt es sich um eine Kategorisierungsschema für die Social Media Posts, die wir aus der Literaratur ableiten. Die Bildtypenanalyse ist ein Ansatz der visuellen Inhaltsanalyse, in weiteren Ausschreibungen nutzen wir andere Schemata um andere Fragestellungen zu beantworten. Bildtypen versuchen die Inhalte der jeweiligen Posts zu erfassen, also z. B. ob es sich um eine Politische Veranstaltung, Medienarbeit, oder die politische Positionierung geht.

Konkrete Aufgaben

  1. Selbstständige Einarbeitung in das Thema, unterstützt durch bereitgestellte Literatur zur Theorie (Bildtypen) und Praxis (Tutorials auf https://social-media-lab.net/). Auch der Datensatz wird bereitgestellt.
  2. Erstellen einer Annotationsstudie um einen Ground Truth (Gold Standard) Datensatz zu erstellen: Erarbeitung der Annotationsanleitung und softwaregestützte Sammlung der Annotationsdaten über das VP-Stunden-System.
  3. Kontrolle der Annotationsqualität und eventuelle Überarbeitung der Annotationsanleitung
  4. Implementierung des Klassifikationsmodells / Erarbeitung einer passenden Prompt. Modell- / Prompt-Design und Annotationsstudie müssen aufeinander abgestimmt werden!
  5. Kontrolle der Klassifikationsqualität und eventuelle Überarbeitung der Prompts / Modell.
  6. Bericht und Interpretation der Annotations- und Klassifikationsqualität (=Results). Einordnung der Ergebnisse in die bestehende Literatur (=Discussion).

Erwartete Vorkenntnisse

Weiterführende Quellen

Zu Bildtypen