arbeiten:echtzeitannotationsverbesserung

Verbesserung automatischer Annotationen durch manueller Korrekturen in Echtzeit

Thema:
Verbesserung automatischer Annotationen durch manueller Korrekturen in Echtzeit
Art:
BA, MA
BetreuerIn:
Lars Döhling
ZweitgutachterIn:
N.N.
Status:
Entwurf
Stichworte:
Natural language processing, Evaluation
angelegt:
2017-07-18
Textlizenz:
Unbekannt
Codelizenz:
Unbekannt

Hintergrund

Traditionell werden Texte beim Erstellen annotierter Korpora einmalig automatisch vorannotiert und anschließend manuell korrigiert. Aus den korrigierten Texten wird anschließend ein neues Modell trainiert, welches der Vorannotation neuer Texte dient.

Zielsetzung der Arbeit

Ziel ist, zu prüfen, ob sich erfolgte Korrekturen in Echtzeit gewinnbringend auf die restliche Vorannotation propagieren lassen.

Konkrete Aufgaben

  • Anpassen der Viterbi-ähnlichen Inferenz in MarMoT (ein CRF-basierter Taggers) und/oder eines anderen geeigneten (statistischen) Taggers
  • Evaluation der Performanz und des erreichbaren Verbesserungspotenzials anhand lateinischer Texte
  • Ggf. Einbindung der Echtzeitkorrektur in den Annotationsworkflow (z.Zt. MarMoT mit Excel)

Erwartete Vorkenntnisse

Java

Weiterführende Quellen

Nach Absprache mit dem Betreuer.