Computergestützte Identifikation von Verwandschaftsbeziehungen in einer Personendatenbank

Thema:: Computergestützte Identifikation von Verwandschaftsbeziehungen in einer Personendatenbank
Art:: MA
BetreuerIn:: Manuel Burghardt
BearbeiterIn:: Johanna Mühlenfeld
ErstgutachterIn:: Christian Wolff
ZweitgutachterIn:: N.N.
Status:: abgeschlossen
Stichworte:: Digital Humanities, Datenbank
angelegt:: 2014-04-23
Antrittsvortrag:: 2015-09-17
Textlizenz:: Unbekannt
Codelizenz:: Unbekannt

Hintergrund

Die Erik-Amberger-Datenbank enthält ca. 100.000 Datensätze zu „Ausländern im vorrevolutionären Russland“ (http://dokumente.ios-regensburg.de/amburger/). Neben Namen, Beruf und Werdegang sind u.a. auch unsystematisch Verwandschaftsbeziehungen in der Datenbank eingetragen. In vielen Fällen kann man allerdings Verwandschaftsbeziehungen über Familien- und Ortsnamen herstellen.

Zielsetzung der Arbeit

Ziel der Arbeit ist die Entwicklung einer grafischen Benutzeroberfläche, die für einzelne Personen in der DB Vorschläge zu möglicherweise verwandten Personen macht. Die Vorschläge orientieren sich an gleich oder ähnlich geschriebenen Nachnamen und Ortsnamen. Wird ein Vorschlag ausgewählt, so wird dieser als explizite Verwandschaftsbeziehung zwischen zwei Personen in die DB mitaufgenommen. Die Anwendung sollte so konzipiert sein, dass sie auch in eine Crowdsourcing-Plattform wie etwa crowdflower.com integriert werden kann.

Die detaillierten Anforderungen an die Anwendung werden bei Bearbeitung des Themas mit Projektpartnern im „Institut für Ost- und Südosteuropaforschung“ (IOSSitz in Regensburg) abgestimmt.

Falls das Thema im Rahmen einer Masterarbeit bearbeitet wird, kommt als weitere Zielsetzung noch die prototypische Visualierung der Verwandschaftsbeziehungen (z.B. mit D3.js) hinzu.

Konkrete Aufgaben

Optimierung und Normalisierung der bestehenden MySQL-Datenbank (aktuell: viele NULL-Werte, Redundanzen, …)
Anforderungsanalyse (in Zusammenarbeit mit dem IOS)
Implementierung einer Anwendung zur semi-automatischen Erstellung von Verwandschaftsbeziehungen (Entwicklung eines einfachen „Recommenders“ sowie einer web-basierten GUI)
Evaluation der „Recommendations“ (in Zusammenarbeit mit dem IOS)
Integration der Anwendung in eine Crowdsourcing-Plattform

Erwartete Vorkenntnisse

Gute Kenntnisse im Bereich MySQL / PHP
Kenntnisse im Bereich XML / HTML
Idealerweise Kenntnisse in slavischer Sprachwissenschaft (keine zwingend notwendige Voraussetzung)
Idealerweise Kenntnisse im Bereich Recommender-Systeme

Weiterführende Quellen

Bei weiteren Fragen zur genauen Ausgestaltung des Themas können Sie sich gerne an manuel.burghardt@ur.de wenden.