Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

--- arbeiten:implementierung_und_evaluation_von_speaker_recognition-systemen [01.07.2019 10:07] – hat05426
+++ arbeiten:implementierung_und_evaluation_von_speaker_recognition-systemen [16.09.2020 12:11] (aktuell) – [Data-Entry] wiv23079
@@ Zeile 2: / Zeile 2: @@
 ---- dataentry StudentischeArbeit ----
-Thema                       : Implementierung und Evaluation von Speaker Recognition-Systemen
+Thema                                  : Implementierung und Evaluation von Speaker Recognition-Systemen #
-Art_thesistypes             : MA
+Art_thesistypes                        : MA #
-Betreuer_thesisadvisor      : Bernd Ludwig
+BetreuerIn_thesisadvisor               : Bernd Ludwig #
-Student                     : Tobias  Hauser
+BearbeiterIn                           : Tobias  Hauser #
-Professor_thesisprofessor   : Bernd Ludwig
+ErstgutachterIn_thesisprofessor        : Bernd Ludwig #
-Status_thesisstate         : in Bearbeitung
+ZweitgutachterIn_secondthesisprofessor : Christian Wolff #
-Stichworte_thesiskeywords   : Speaker Recognition, machine learning, sprachbasierte Dialogsysteme
+Status_thesisstate                     : abgeschlossen #
-angelegt_dt                 : 2019-05-27
+Stichworte_thesiskeywords              : Speaker Recognition, machine learning, sprachbasierte Dialogsysteme #
-Beginn_dt                   :
+angelegt_dt                            : 2019-05-27 #
-Anmeldung_dt                :
+Beginn_dt                              :  #
-Antrittsvortrag_dt          :
+Anmeldung_dt                           : 2019-07-11 #
-Abschlussvortrag_dt         :
+Antrittsvortrag_dt                     : 2019-10-21 #
-Ende_dt                     :
+Abschlussvortrag_dt                    : 2019-12-09 #
+Abgabe_dt                              :  #
+Textlizenz_textlicense                 : Unbekannt #
+Codelizenz_codelicense                 : Unbekannt #
 ----
 === Hintergrund ===
-TBD
+Die Sprache ist das Organ des individuellen Geistes (Heyse & Steinthal, 1856).
+Sprechererkennung dient der Identifikation und/oder der Verifikation von Personen. Daraus resultiert die Möglichkeit, dass Assistenzsysteme die Identität des Nutzers erkennen und so direkt auf spezielle Bedürfnisse reagieren können. Ein System, das den Nutzer erkennt, ihn beim Namen nennt und seine Vorlieben kennt, kann dazu beitragen, moderne Assistenzsystem in Privathaushalte zu bringen und deren Akzeptanz zu steigern.
 === Zielsetzung der Arbeit ===
-Ziel der Arbeit ist es, ein Speaker Recognition System (SR-System) zu implementieren und gegen bereits bestehende Systeme zu evaluieren.
+Ziel der Arbeit ist es, ein Speaker Recognition System (SR-System) zu implementieren und gegen bereits bestehende Systeme zu evaluieren. Dabei steht kein fertiges Produkt im Fokus der Arbeit, sondern wie sich ein embedded SR-System auf Basis von GMMs (Gaussian Mixture Models) von anderen Systemen hinsichtlich der Ergebnisse und Laufzeit unterscheidet. Zudem soll das SR-System ressourcenarm hinsichtlich der benötigten Datenmenge und ohne teures Setup (Microphone-Array) implementiert werden.
 === Konkrete Aufgaben ===
-Implementierung eines Speaker Recognition Systems (x86/arm)
+- Implementierung eines Speaker Recognition Systems (x86/arm)
-Implementierung verschiedener Scripte für die Evaluation des eigenen Sytems und aller Provider auf Basis einer K-fold Cross Validation
+- Implementierung der Scripte für die Evaluation des eigenen Systems und aller Provider auf Basis einer K-fold Cross Validation
-Gesprochene Sprache als Datengrundlage erheben
+- Gesprochene Sprache als Datengrundlage erheben
+- Geräusche zum Mixen der gesprochenen Sprache erheben
 === Erwartete Vorkenntnisse ===
-TBD
+- Machine Learning
+- Sound Processing
 === Weiterführende Quellen ===
-TBD
+- Beigi, H. (2011). Fundamentals of speaker recognition. New York: Springer.
+- Heyse, K. W. L., & Steinthal, H. (1856). System der Sprachwissenschaft. F. Dümmler.
+- Nayana, P. K., Mathew, D., & Thomas, A. (2017). Comparison of Text Inde-pendent Speaker Identification Systems using GMM and i-Vector Me-thods. Procedia Computer Science, 115, 47–54.
+- Reynolds, D. A. (2002). An overview of automatic speaker recognition tech-nology. 2002 IEEE International Conference on Acoustics, Speech, and Signal Processing, 4, IV-4072-IV–4075.