Implementierung und Evaluation verschiedener Machine Learning-Ansätze für die Sentiment-Analyse im Deutschen
- Thema:
- Implementierung und Evaluation verschiedener Machine Learning-Ansätze für die Sentiment-Analyse im Deutschen
- Art:
- BA
- BetreuerIn:
- Jakob Fehle
- BearbeiterIn:
- Niklas Donhauser
- ErstgutachterIn:
- Christian Wolff
- ZweitgutachterIn:
- Udo Kruschwitz
- Status:
- abgeschlossen
- Stichworte:
- Sentiment Analyse, Machine Learning, NLP
- angelegt:
- 2022-05-31
- Antrittsvortrag:
- 2022-06-27
Hintergrund
Die Sentiment-Analyse behandelt die Extraktion von Meinungen und Stimmungen aus geschriebenem Text und wird als Teilgebiet der natürlichen Sprachverarbeitung und des Text Mining angesehen. Wie in anderen Bereichen der Textverarbeitung haben auch in der Sentiment-Analyse die auf Machine Learning-basierenden Methoden über die letzten Jahrzehnte immer mehr an Relevanz gewonnen. Die eher klassischen Lexikon-basierten Methoden können in vielen Bereichen mit der Performance von Transformer-Modellen und Neuronalen Netzen kaum mithalten. Problematisch ist allerdings, dass viele Machine Learning-basierte Ansätze große Mengen annotierter Textdaten benötigen, um effektiv zu funktionieren. Diese sind aber in weniger erforschten Sprachen (wie dem Deutschen) oft nur unzureichend vorhanden und wenig evaluiert.
Zielsetzung der Arbeit
Das Ziel der Arbeit ist die Zusammenstellung und Evaluation Machine Learning-basierter Methoden zur Sentiment-Analyse im Deutschen. Dazu sollen verschiedene maschinelle Lernmethoden mit einem breiten Spektrum deutscher Korpora trainiert und deren Leistung evaluiert werden. Weiterhin soll untersucht werden, wie sich (vortrainierte) Transformer-basierte Modelle im Vergleich zu traditionellen Machine Learning-Methoden (SVM, NB, …) in Bezug auf die Vorhersagegenauigkeit unterscheiden.
Konkrete Aufgaben
- Einarbeitung in das Themenfeld
- Herausarbeiten gängiger Methoden im Deutschen
- Implementierung verschiedener maschineller Lernmethoden
- Auswertung der Ergebnisse
Weiterführende Quellen
- Liu, B. (2012). Sentiment analysis and opinion mining. Synthesis lectures on human language technologies, 5(1), 1-167.
- Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., … & Polosukhin, I. (2017). Attention is all you need. Advances in neural information processing systems, 30.
- Chan, B., Schweter, S., & Möller, T. (2020). German's next language model. arXiv preprint arXiv:2010.10906.
- Basarslan, M. S., & Kayaalp, F. (2020). Sentiment Analysis with Machine Learning Methods on Social Media.
- Zhang, L., Wang, S., & Liu, B. (2018). Deep learning for sentiment analysis: A survey. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 8(4), e1253.