Annotation und Evaluation deutschsprachiger Hotelbewertungen für die Aspekt-basierte Sentiment Analyse

Thema:
Annotation und Evaluation deutschsprachiger Hotelbewertungen für die Aspekt-basierte Sentiment Analyse
Art:
BA
BetreuerIn:
Jakob Fehle
BearbeiterIn:
Leonie Münster
Status:
abgeschlossen
Stichworte:
Sentiment Analyse, Machine Learning, NLP
angelegt:
2022-12-14
Antrittsvortrag:
2023-01-16

Hintergrund

Sentiment Analysen extrahieren Meinungen und Emotionen aus Texten und gehören in den Bereich der natürlichen Sprachverarbeitung. Eine Weiterentwicklung ist die Aspekt-basierte Sentiment Analyse (ABSA). Sie beschäftigt sich genauer mit Bewertungen und Meinungen zu Aspekten eines Themas, wie beispielsweise dem Aspekt der Lage bei einem Hotel. Ziel der ABSA ist die Extraktion der Polarität dieser einzelnen Aspekte durch Methoden des Machine Learning. Deutsche Machine Learning-Methoden sind noch wenig erforscht und evaluiert.

Zielsetzung der Arbeit

Ziel der Arbeit ist die Annotation eines Datensatzes mit deutschsprachigen Hotelbewertungen und die Evaluation durch eine Machine Learning-Methode für die Aspekt-basierte Sentiment Analyse. Die Aspekte und Polaritäten werden mithilfe einer Studie annotiert, um sie anschließend als Trainingsdaten für die Klassifizierung verwenden zu können. Evaluiert wird die Performance eines Transformer(BERT)-Modells.

Konkrete Aufgaben

  • Literaturrecherche
  • Analyse und Vergleich von Aspekten englischer Hotelbewertungen
  • Analyse und Vergleich von Machine Learning-Methoden deutscher Datensätze
  • Annotationsanleitung
  • Design und Durchführung einer Studie zur Annotation des Datensatzes
  • Kuration der Studie und Berechnung des Inter annotator agreements
  • Klassifizierung und Evaluation des Transformermodells
  • Auswertung und Vergleich mit ähnlichen Ansätzen
  • Schriftliche Ausarbeitung

Erwartete Vorkenntnisse

  • Machine Learning, NLP
  • Python

Weiterführende Quellen

Corvonato, A. (2021, January). Re-Evaluating GermEval 2017: Document-Level and Aspect-Based Sentiment Using Pre-Trained Language Models. (pp.1-87) https://epub.ub.uni-muenchen.de/75190/1/MA_Corvonato.pdf https://github.com/ac74/reevaluating_germeval2017.

Moreno-Ortiz, A. et al. (2018, November). Design and validation of annotation schemas for aspct-based sentiment analysis in the tourism sector. In Information Technology& Tourism (2019). (pp.535-557). https://link.springer.com/content/pdf/10.1007/s40558-019-00155-0.pdf

Qiang, Y. et al. (2020, March). Toward Tag-free Aspect Based Sentiment Analysis: A Multiple Attention Network Approach. (pp.1-8). https://arxiv.org/pdf/2003.09986v1.pdf https://github.com/qiangyao1988/Toward-tag-free-ABSA.

Tran, T., Ba, H. & Huynh,V. (2019, March). Measuring Hotel Review Sentiment: An Aspect-Based Sentiment Analysis Approach. In IUKM 2019. (pp.393-405). https://link.springer.com/chapter/10.1007/978-3-030-14815-7_33.

Wojatzki, M. et al. (2017, September). Proceedings of the GermEval 2017: Shared Task on Aspect-based Sentiment in Social Media Customer Feedback. In Language Technologies for the Challenges of the Digital Age (GSCL 2017) (pp. 1-12). https://www.inf.uni-hamburg.de/en/inst/ab/lt/publications/2017-wojatzkietal-germeval2017-proceedings.pdf.