Abschlussarbeiten im Bereich des Natural Language Processing im Kontext der Aspekt-basierten Sentiment Analyse

Thema:
Abschlussarbeiten im Bereich des Natural Language Processing im Kontext der Aspekt-basierten Sentiment Analyse
Art:
BA, MA
BetreuerIn:
Jakob Fehle
Status:
ausgeschrieben
Stichworte:
NLP, Sentiment Analyse, Data Augmentation, Machine Learning, Annotation
angelegt:
2024-04-14

Hintergrund

Die Aspektbasierte Sentiment Analyse (ABSA) ist eine Methode im Bereich des Natural Language Processing (NLP), die es ermöglicht, Meinungen und Stimmungen in Texten gegenüber spezifischen Aspekten zu identifizieren. Im Gegensatz zur herkömmlichen Sentiment Analyse, die lediglich das allgemeine Sentiment eines Textes ermittelt, fokussiert sich die ABSA auf einzelne Aspekte eines Produkts oder einer Dienstleistung. Dadurch können detaillierte Einblicke in das Feedback zu Produkten und Dienstleistungen gewonnen und gezielt auf die Bedürfnisse und Vorlieben eingegangen werden. Im deutschen Sprachraum stellt sich jedoch die Herausforderung, dass nur wenige ausreichend große und brauchbare Datensätze für die ABSA existieren. Zudem ist die manuelle Annotation neuer Datensätze zeit- und kostenintensiv. Das Methodenfeld der natürlichen Sprachverarbeitung bietet hierbei vielfältige Möglichkeiten, das bisher spärlich erfasste Forschungsfeld der ABSA im Deutschen aufzuarbeiten.

Zielsetzung der Arbeit

Beispielthemen, die NLP-Methoden im Kontext der ABSA einsetzen könnten:

  • Eine umfassende Analyse geeigneter Techniken zur Datenaugmentierung im Kontext der ABSA im Deutschen, um die bestehende Knappheit an Trainings- und Evaluationsdaten zu umgehen.
  • Der Einsatz von maschinellen Lernmethoden, welche mit geringen Mengen manuell annotierter Daten auskommen oder anderweitige Ressourcen (Datensätze, Lexika, …) intelligent in die Analyse integrieren (Reinforcement Learning, Human-in-the-Loop, ..).
  • Die Analyse möglicher Qualitätsunterschiede zwischen Annotationen unterschiedlich erfahrener Annotatoren (Experten, Studenten, Crowd-Sourcing) und deren Konsequenzen für die Leistungsfähigkeit von Machine Learning-Modellen.
  • Die Exploration von Techniken zur Domänen-Anpassung von Datensätzen, um Erkenntnisse und Annotationen aus anderen Sprachen und/oder Domänen in die ABSA zu integrieren (z. B. Englisch-sprachige Datensätze für die Deutsch-sprachige ABSA einzusetzen).

Der Fokus der Arbeit kann individuell abgesprochen werden. Bei Interesse bitte eine kurze Mail an mich :)

Konkrete Aufgaben

Nach Absprache mit dem Betreuer.

Erwartete Vorkenntnisse

Nach Absprache mit dem Betreuer.

Weiterführende Quellen

Nach Absprache mit dem Betreuer.