arbeiten:implementierung_und_evaluation_von_speaker_recognition-systemen

Implementierung und Evaluation von Speaker Recognition-Systemen

Thema:
Implementierung und Evaluation von Speaker Recognition-Systemen
Art:
MA
Betreuer:
Bernd Ludwig
Student:
Tobias Hauser
Professor:
Bernd Ludwig
Status:
in Bearbeitung
Stichworte:
Speaker Recognition, machine learning, sprachbasierte Dialogsysteme
angelegt:
2019-05-27
Antrittsvortrag:
2019-10-21

Hintergrund

TBD

Zielsetzung der Arbeit

Ziel der Arbeit ist es, ein Speaker Recognition System (SR-System) zu implementieren und gegen bereits bestehende Systeme zu evaluieren. Dabei steht kein fertiges Produkt im Fokus der Arbeit, sondern wie sich ein embedded SR-System auf Basis von GMMs (Gaussian Mixture Models) von anderen Systemen hinsichtlich der Ergebnisse und Laufzeit unterscheidet. Zudem soll das SR-System ressourcenarm hinsichtlich der benötigten Datenmenge und ohne teures Setup (Microphone-Array) implementiert werden.

Konkrete Aufgaben

  • Implementierung eines Speaker Recognition Systems (x86/arm)
  • Implementierung der Scripte für die Evaluation des eigenen Systems und aller Provider auf Basis einer K-fold Cross Validation
  • Gesprochene Sprache als Datengrundlage erheben
  • Geräusche zum Mixen der gesprochenen Sprache erheben

Erwartete Vorkenntnisse

  • Machine Learning
  • Sound Processing

Weiterführende Quellen

  • Reynolds, D. A. (2002). An overview of automatic speaker recognition tech-nology. 2002 IEEE International Conference on Acoustics, Speech, and Signal Processing, 4, IV-4072-IV–4075.
  • Beigi, H. (2011). Fundamentals of speaker recognition. New York: Springer.
  • Nayana, P. K., Mathew, D., & Thomas, A. (2017). Comparison of Text Inde-pendent Speaker Identification Systems using GMM and i-Vector Me-thods. Procedia Computer Science, 115, 47–54.