Verbesserung automatischer Annotationen durch manueller Korrekturen in Echtzeit
- Thema:
- Verbesserung automatischer Annotationen durch manueller Korrekturen in Echtzeit
- Art:
- BA, MA
- BetreuerIn:
- Lars Döhling
- ZweitgutachterIn:
- N.N.
- Status:
- Entwurf
- Stichworte:
- Natural language processing, Evaluation
- angelegt:
- 2017-07-18
- Textlizenz:
- Unbekannt
- Codelizenz:
- Unbekannt
Hintergrund
Traditionell werden Texte beim Erstellen annotierter Korpora einmalig automatisch vorannotiert und anschließend manuell korrigiert. Aus den korrigierten Texten wird anschließend ein neues Modell trainiert, welches der Vorannotation neuer Texte dient.
Zielsetzung der Arbeit
Ziel ist, zu prüfen, ob sich erfolgte Korrekturen in Echtzeit gewinnbringend auf die restliche Vorannotation propagieren lassen.
Konkrete Aufgaben
- Anpassen der Viterbi-ähnlichen Inferenz in MarMoT (ein CRF-basierter Taggers) und/oder eines anderen geeigneten (statistischen) Taggers
- Evaluation der Performanz und des erreichbaren Verbesserungspotenzials anhand lateinischer Texte
- Ggf. Einbindung der Echtzeitkorrektur in den Annotationsworkflow (z.Zt. MarMoT mit Excel)
Erwartete Vorkenntnisse
Java
Weiterführende Quellen
Nach Absprache mit dem Betreuer.