arbeiten:entwicklung_einer_systaxkorrektur_im_sprachlichen_kontext_der_firma_horsch_gmbh

Entwicklung einer Syntaxkorrektur im sprachlichen Kontext der Firma Horsch GmbH

Thema:
Entwicklung einer Syntaxkorrektur im sprachlichen Kontext der Firma Horsch GmbH
Art:
BA
BetreuerIn:
Christian Wolff
BearbeiterIn:
Christoph Meyer
ErstgutachterIn:
Christian Wolff
Status:
abgeschlossen
Stichworte:
NLP, Syntax, Texttechnologie, Horsch GmbH
angelegt:
2021-02-15
Anmeldung:
2021-03-02
Antrittsvortrag:
2021-03-29

Hintergrund

Die Firma HORSCH GmbH möchte ihre Kunden eine Plattform bieten, auf der sie sich über Probleme mit den Maschinen austauschen können. Die Plattform soll auch dazu dienen, Lösungen zu präsentieren, die bereits von Kunden ausgearbeitet wurden.

Um die sprachliche Barriere zwischen Kunden aus aller Welt zu reduzieren, sollen Beiträge der Plattform automatisch übersetzt und einer Grammatikkorrektur unterzogen werden.

Zielsetzung der Arbeit

Für die besagte Plattform soll eine Grammatikkorrektor mittels neuronaler Netze in Python entwickelt werden. Diese soll (vermeintlich) unkorrekte, englische Sätze als Eingabe empfangen und diese in korrekte Sätze übersetzen.

Konkrete Aufgaben

  • Einarbeiten in die Themen Grammatikkorrektor und neuronale Netze
  • Literaturrecherche zum Aufbau eines geeigneten Modells
  • Erstellen/Beschaffen eines geeigneten Datensatzes
  • Vorverarbeitung der Daten
  • Entwicklung und Training des Modells
  • Literaturrecherche zu geeigneten Methoden zur Evaluation des Modells
  • Evaluieren des Modells anhand der recherchierten Methoden

Erwartete Vorkenntnisse

Empfohlene Grundkenntnisse: - Gute Kenntnisse in Python (u.a. NumPy, Pandas, Tensorflow, PyTorch, etc.) - Grundkenntnisse in der Entwicklung neuronaler Netze

Weiterführende Quellen

  • A Nested Attention Neural Hybrid Model for Grammatical Error Correction
  • Adapting Sequence to Sequence Models for Text Normalization in Social Media
  • Sentence-Level Grammatical Error Identification as Sequence-to-Sequence Correction
  • Natural Language Correction