arbeiten:implementierung_und_evaluation_von_speaker_recognition-systemen

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen Revision Vorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
arbeiten:implementierung_und_evaluation_von_speaker_recognition-systemen [22.07.2019 11:50] – [Data-Entry] Florian Bockesarbeiten:implementierung_und_evaluation_von_speaker_recognition-systemen [16.09.2020 12:11] (aktuell) – [Data-Entry] wiv23079
Zeile 2: Zeile 2:
  
 ---- dataentry StudentischeArbeit ---- ---- dataentry StudentischeArbeit ----
-Thema                     : Implementierung und Evaluation von Speaker Recognition-Systemen +Thema                                  : Implementierung und Evaluation von Speaker Recognition-Systemen  
-Art_thesistypes           : MA +Art_thesistypes                        : MA  
-Betreuer_thesisadvisor    : Bernd Ludwig +BetreuerIn_thesisadvisor               : Bernd Ludwig  
-Student                   : Tobias  Hauser +BearbeiterIn                           : Tobias  Hauser  
-Professor_thesisprofessor : Bernd Ludwig +ErstgutachterIn_thesisprofessor        : Bernd Ludwig #  
-Status_thesisstate        in Bearbeitung +ZweitgutachterIn_secondthesisprofessor : Christian Wolff #  
-Stichworte_thesiskeywords : Speaker Recognition, machine learning, sprachbasierte Dialogsysteme +Status_thesisstate                     abgeschlossen #  
-angelegt_dt               : 2019-05-27 +Stichworte_thesiskeywords              : Speaker Recognition, machine learning, sprachbasierte Dialogsysteme  
-Beginn_dt                 :  +angelegt_dt                            : 2019-05-27  
-Anmeldung_dt              :  +Beginn_dt                               #  
-Antrittsvortrag_dt        : 2019-10-21 +Anmeldung_dt                           2019-07-11 #  
-Abschlussvortrag_dt       :  +Antrittsvortrag_dt                     : 2019-10-21  
-Ende_dt                   +Abschlussvortrag_dt                    2019-12-09 #  
 +Abgabe_dt                              :  #  
 +Textlizenz_textlicense                 : Unbekannt #  
 +Codelizenz_codelicense                 Unbekannt # 
 ---- ----
 +
 +
 +
  
  
Zeile 21: Zeile 27:
 === Hintergrund === === Hintergrund ===
  
-TBD+Die Sprache ist das Organ des individuellen Geistes (Heyse & Steinthal, 1856).  
 + 
 +Sprechererkennung dient der Identifikation und/oder der Verifikation von Personen. Daraus resultiert die Möglichkeit, dass Assistenzsysteme die Identität des Nutzers erkennen und so direkt auf spezielle Bedürfnisse reagieren können. Ein System, das den Nutzer erkennt, ihn beim Namen nennt und seine Vorlieben kennt, kann dazu beitragen, moderne Assistenzsystem in Privathaushalte zu bringen und deren Akzeptanz zu steigern. 
  
 === Zielsetzung der Arbeit === === Zielsetzung der Arbeit ===
  
-Ziel der Arbeit ist es, ein Speaker Recognition System (SR-System) zu implementieren und gegen bereits bestehende Systeme zu evaluieren.+Ziel der Arbeit ist es, ein Speaker Recognition System (SR-System) zu implementieren und gegen bereits bestehende Systeme zu evaluieren. Dabei steht kein fertiges Produkt im Fokus der Arbeit, sondern wie sich ein embedded SR-System auf Basis von GMMs (Gaussian Mixture Models) von anderen Systemen hinsichtlich der Ergebnisse und Laufzeit unterscheidet. Zudem soll das SR-System ressourcenarm hinsichtlich der benötigten Datenmenge und ohne teures Setup (Microphone-Array) implementiert werden.
  
 === Konkrete Aufgaben === === Konkrete Aufgaben ===
  
-Implementierung eines Speaker Recognition Systems (x86/arm) +Implementierung eines Speaker Recognition Systems (x86/arm) 
-Implementierung verschiedener Scripte für die Evaluation des eigenen Sytems und aller Provider auf Basis einer K-fold Cross Validation +Implementierung der Scripte für die Evaluation des eigenen Systems und aller Provider auf Basis einer K-fold Cross Validation 
-Gesprochene Sprache als Datengrundlage erheben+Gesprochene Sprache als Datengrundlage erheben 
 +- Geräusche zum Mixen der gesprochenen Sprache erheben
  
 === Erwartete Vorkenntnisse === === Erwartete Vorkenntnisse ===
  
-TBD+- Machine Learning 
 +- Sound Processing
  
 === Weiterführende Quellen === === Weiterführende Quellen ===
  
-TBD+- Beigi, H. (2011). Fundamentals of speaker recognition. New York: Springer. 
 +- Heyse, K. W. L., & Steinthal, H. (1856). System der Sprachwissenschaft. F. Dümmler. 
 +- Nayana, P. K., Mathew, D., & Thomas, A. (2017). Comparison of Text Inde-pendent Speaker Identification Systems using GMM and i-Vector Me-thods. Procedia Computer Science, 115, 47–54.  
 +- Reynolds, D. A. (2002). An overview of automatic speaker recognition tech-nology. 2002 IEEE International Conference on Acoustics, Speech, and Signal Processing, 4, IV-4072-IV–4075.  
 + 
 +