arbeiten:die_qualitaet_von_annotationen_und_datensaetzen_und_deren_auswirkung_auf_die_performance_maschineller_lernmethoden

Die Qualität von Annotationen und Datensätzen und deren Auswirkung auf die Performance maschineller Lernmethoden

Thema:
Die Qualität von Annotationen und Datensätzen und deren Auswirkung auf die Performance maschineller Lernmethoden
Art:
MA
BetreuerIn:
Jakob Fehle
Status:
Entwurf
Stichworte:
Data Science, Datensätze, Annotation
angelegt:
2023-01-20

Hintergrund

Im Rahmen dieser Arbeit soll untersucht werden, wie die Qualität und Eignung von Datensätzen und deren manuellen Annotationen (z.B. für die Klassifizierung) kategorisch eingeordnet und unterschieden werden kann. Zudem soll auch evaluiert werden, in wie fern die eingeordnete Qualität von Datensätzen mit der Performance eines darauf trainierten Machine Learning-Modells korreliert.

Zielsetzung der Arbeit

tbd

Konkrete Aufgaben

tbd

Erwartete Vorkenntnisse

tbd

Weiterführende Quellen

  • Mozetič, I., Grčar, M., & Smailović, J. (2016). Multilingual Twitter sentiment classification: The role of human annotators. PloS one, 11(5), e0155036.