arbeiten:implementierung_und_evaluation_von_speaker_recognition-systemen

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen Revision Vorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
arbeiten:implementierung_und_evaluation_von_speaker_recognition-systemen [27.07.2019 08:07] hat05426arbeiten:implementierung_und_evaluation_von_speaker_recognition-systemen [16.09.2020 12:11] (aktuell) – [Data-Entry] wiv23079
Zeile 2: Zeile 2:
  
 ---- dataentry StudentischeArbeit ---- ---- dataentry StudentischeArbeit ----
-Thema                     : Implementierung und Evaluation von Speaker Recognition-Systemen +Thema                                  : Implementierung und Evaluation von Speaker Recognition-Systemen  
-Art_thesistypes           : MA +Art_thesistypes                        : MA  
-Betreuer_thesisadvisor    : Bernd Ludwig +BetreuerIn_thesisadvisor               : Bernd Ludwig  
-Student                   : Tobias  Hauser +BearbeiterIn                           : Tobias  Hauser  
-Professor_thesisprofessor : Bernd Ludwig +ErstgutachterIn_thesisprofessor        : Bernd Ludwig #  
-Status_thesisstate        in Bearbeitung +ZweitgutachterIn_secondthesisprofessor : Christian Wolff #  
-Stichworte_thesiskeywords : Speaker Recognition, machine learning, sprachbasierte Dialogsysteme +Status_thesisstate                     abgeschlossen #  
-angelegt_dt               : 2019-05-27 +Stichworte_thesiskeywords              : Speaker Recognition, machine learning, sprachbasierte Dialogsysteme  
-Beginn_dt                 :  +angelegt_dt                            : 2019-05-27  
-Anmeldung_dt              :  +Beginn_dt                               #  
-Antrittsvortrag_dt        : 2019-10-21 +Anmeldung_dt                           2019-07-11 #  
-Abschlussvortrag_dt       :  +Antrittsvortrag_dt                     : 2019-10-21  
-Ende_dt                   +Abschlussvortrag_dt                    2019-12-09 #  
 +Abgabe_dt                              :  #  
 +Textlizenz_textlicense                 : Unbekannt #  
 +Codelizenz_codelicense                 Unbekannt # 
 ---- ----
 +
 +
 +
  
  
Zeile 21: Zeile 27:
 === Hintergrund === === Hintergrund ===
  
-TBD+Die Sprache ist das Organ des individuellen Geistes (Heyse & Steinthal, 1856).  
 + 
 +Sprechererkennung dient der Identifikation und/oder der Verifikation von Personen. Daraus resultiert die Möglichkeit, dass Assistenzsysteme die Identität des Nutzers erkennen und so direkt auf spezielle Bedürfnisse reagieren können. Ein System, das den Nutzer erkennt, ihn beim Namen nennt und seine Vorlieben kennt, kann dazu beitragen, moderne Assistenzsystem in Privathaushalte zu bringen und deren Akzeptanz zu steigern. 
  
 === Zielsetzung der Arbeit === === Zielsetzung der Arbeit ===
Zeile 32: Zeile 40:
 - Implementierung der Scripte für die Evaluation des eigenen Systems und aller Provider auf Basis einer K-fold Cross Validation - Implementierung der Scripte für die Evaluation des eigenen Systems und aller Provider auf Basis einer K-fold Cross Validation
 - Gesprochene Sprache als Datengrundlage erheben - Gesprochene Sprache als Datengrundlage erheben
 +- Geräusche zum Mixen der gesprochenen Sprache erheben
  
 === Erwartete Vorkenntnisse === === Erwartete Vorkenntnisse ===
Zeile 40: Zeile 49:
 === Weiterführende Quellen === === Weiterführende Quellen ===
  
-TBD+- Beigi, H. (2011). Fundamentals of speaker recognition. New York: Springer. 
 +- Heyse, K. W. L., & Steinthal, H. (1856). System der Sprachwissenschaft. F. Dümmler. 
 +- Nayana, P. K., Mathew, D., & Thomas, A. (2017). Comparison of Text Inde-pendent Speaker Identification Systems using GMM and i-Vector Me-thods. Procedia Computer Science, 115, 47–54.  
 +- Reynolds, D. A. (2002). An overview of automatic speaker recognition tech-nology. 2002 IEEE International Conference on Acoustics, Speech, and Signal Processing, 4, IV-4072-IV–4075.  
 + 
 +