Implementierung und Evaluation von Speaker Recognition-Systemen

Thema:: Implementierung und Evaluation von Speaker Recognition-Systemen
Art:: MA
Betreuer:: Bernd Ludwig
Student:: Tobias Hauser
Professor:: Bernd Ludwig
Status:: in Bearbeitung
Stichworte:: Speaker Recognition, machine learning, sprachbasierte Dialogsysteme
angelegt:: 2019-05-27
Antrittsvortrag:: 2019-10-21

Hintergrund

TBD

Zielsetzung der Arbeit

Ziel der Arbeit ist es, ein Speaker Recognition System (SR-System) zu implementieren und gegen bereits bestehende Systeme zu evaluieren. Dabei steht kein fertiges Produkt im Fokus der Arbeit, sondern wie sich ein embedded SR-System auf Basis von GMMs (Gaussian Mixture Models) von anderen Systemen hinsichtlich der Ergebnisse und Laufzeit unterscheidet. Zudem soll das SR-System ressourcenarm hinsichtlich der benötigten Datenmenge und ohne teures Setup (Microphone-Array) implementiert werden.

Konkrete Aufgaben

Implementierung eines Speaker Recognition Systems (x86/arm)
Implementierung der Scripte für die Evaluation des eigenen Systems und aller Provider auf Basis einer K-fold Cross Validation
Gesprochene Sprache als Datengrundlage erheben
Geräusche zum Mixen der gesprochenen Sprache erheben

Erwartete Vorkenntnisse

Machine Learning
Sound Processing

Weiterführende Quellen

Reynolds, D. A. (2002). An overview of automatic speaker recognition tech-nology. 2002 IEEE International Conference on Acoustics, Speech, and Signal Processing, 4, IV-4072-IV–4075.
Beigi, H. (2011). Fundamentals of speaker recognition. New York: Springer.
Nayana, P. K., Mathew, D., & Thomas, A. (2017). Comparison of Text Inde-pendent Speaker Identification Systems using GMM and i-Vector Me-thods. Procedia Computer Science, 115, 47–54.

Dies ist eine alte Version des Dokuments!

Implementierung und Evaluation von Speaker Recognition-Systemen

Hintergrund

Zielsetzung der Arbeit

Konkrete Aufgaben

Erwartete Vorkenntnisse

Weiterführende Quellen

MI Wiki

**Dies ist eine alte Version des Dokuments!**

Implementierung und Evaluation von Speaker Recognition-Systemen

Hintergrund

Zielsetzung der Arbeit

Konkrete Aufgaben

Erwartete Vorkenntnisse

Weiterführende Quellen

Dies ist eine alte Version des Dokuments!