Die Qualität von Annotationen und Datensätzen und deren Auswirkung auf die Performance maschineller Lernmethoden
- Thema:
- Die Qualität von Annotationen und Datensätzen und deren Auswirkung auf die Performance maschineller Lernmethoden
- Art:
- MA
- BetreuerIn:
- Jakob Fehle
- Status:
- Entwurf
- Stichworte:
- Data Science, Datensätze, Annotation
- angelegt:
- 2023-01-20
Hintergrund
Im Rahmen dieser Arbeit soll untersucht werden, wie die Qualität und Eignung von Datensätzen und deren manuellen Annotationen (z.B. für die Klassifizierung) kategorisch eingeordnet und unterschieden werden kann. Zudem soll auch evaluiert werden, in wie fern die eingeordnete Qualität von Datensätzen mit der Performance eines darauf trainierten Machine Learning-Modells korreliert.
Zielsetzung der Arbeit
tbd
Konkrete Aufgaben
tbd
Erwartete Vorkenntnisse
tbd
Weiterführende Quellen
- Mozetič, I., Grčar, M., & Smailović, J. (2016). Multilingual Twitter sentiment classification: The role of human annotators. PloS one, 11(5), e0155036.