**Dies ist eine alte Version des Dokuments!**
Implementierung und Evaluation von Speaker Recognition-Systemen
- Thema:
- Implementierung und Evaluation von Speaker Recognition-Systemen
- Art:
- MA
- Betreuer:
- Bernd Ludwig
- Student:
- Tobias Hauser
- Professor:
- Bernd Ludwig
- Status:
- in Bearbeitung
- Stichworte:
- Speaker Recognition, machine learning, sprachbasierte Dialogsysteme
- angelegt:
- 2019-05-27
- Antrittsvortrag:
- 2019-10-21
Hintergrund
TBD
Zielsetzung der Arbeit
Ziel der Arbeit ist es, ein Speaker Recognition System (SR-System) zu implementieren und gegen bereits bestehende Systeme zu evaluieren. Dabei steht kein fertiges Produkt im Fokus der Arbeit, sondern wie sich ein embedded SR-System auf Basis von GMMs (Gaussian Mixture Models) von anderen Systemen hinsichtlich der Ergebnisse und Laufzeit unterscheidet. Zudem soll das SR-System ressourcenarm hinsichtlich der benötigten Datenmenge und ohne teures Setup (Microphone-Array) implementiert werden.
Konkrete Aufgaben
- Implementierung eines Speaker Recognition Systems (x86/arm)
- Implementierung der Scripte für die Evaluation des eigenen Systems und aller Provider auf Basis einer K-fold Cross Validation
- Gesprochene Sprache als Datengrundlage erheben
- Geräusche zum Mixen der gesprochenen Sprache erheben
Erwartete Vorkenntnisse
- Machine Learning
- Sound Processing
Weiterführende Quellen
Reynolds, D. A. (2002). An overview of automatic speaker recognition tech-nology. 2002 IEEE International Conference on Acoustics, Speech, and Signal Processing, 4, IV-4072-IV–4075. Beigi, H. (2011). Fundamentals of speaker recognition. New York: Springer. Nayana, P. K., Mathew, D., & Thomas, A. (2017). Comparison of Text Inde-pendent Speaker Identification Systems using GMM and i-Vector Me-thods. Procedia Computer Science, 115, 47–54.