Computergestützte Identifikation von Verwandschaftsbeziehungen in einer Personendatenbank
- Thema:
- Computergestützte Identifikation von Verwandschaftsbeziehungen in einer Personendatenbank
- Art:
- MA
- BetreuerIn:
- Manuel Burghardt
- BearbeiterIn:
- Johanna Mühlenfeld
- ErstgutachterIn:
- Christian Wolff
- ZweitgutachterIn:
- N.N.
- Status:
- abgeschlossen
- Stichworte:
- Digital Humanities, Datenbank
- angelegt:
- 2014-04-23
- Antrittsvortrag:
- 2015-09-17
- Textlizenz:
- Unbekannt
- Codelizenz:
- Unbekannt
Hintergrund
Die Erik-Amberger-Datenbank enthält ca. 100.000 Datensätze zu „Ausländern im vorrevolutionären Russland“ (http://dokumente.ios-regensburg.de/amburger/). Neben Namen, Beruf und Werdegang sind u.a. auch unsystematisch Verwandschaftsbeziehungen in der Datenbank eingetragen. In vielen Fällen kann man allerdings Verwandschaftsbeziehungen über Familien- und Ortsnamen herstellen.
Zielsetzung der Arbeit
Ziel der Arbeit ist die Entwicklung einer grafischen Benutzeroberfläche, die für einzelne Personen in der DB Vorschläge zu möglicherweise verwandten Personen macht. Die Vorschläge orientieren sich an gleich oder ähnlich geschriebenen Nachnamen und Ortsnamen. Wird ein Vorschlag ausgewählt, so wird dieser als explizite Verwandschaftsbeziehung zwischen zwei Personen in die DB mitaufgenommen. Die Anwendung sollte so konzipiert sein, dass sie auch in eine Crowdsourcing-Plattform wie etwa crowdflower.com integriert werden kann.
Die detaillierten Anforderungen an die Anwendung werden bei Bearbeitung des Themas mit Projektpartnern im „Institut für Ost- und Südosteuropaforschung“ (IOSSitz in Regensburg) abgestimmt.
Falls das Thema im Rahmen einer Masterarbeit bearbeitet wird, kommt als weitere Zielsetzung noch die prototypische Visualierung der Verwandschaftsbeziehungen (z.B. mit D3.js) hinzu.
Konkrete Aufgaben
- Optimierung und Normalisierung der bestehenden MySQL-Datenbank (aktuell: viele NULL-Werte, Redundanzen, …)
- Anforderungsanalyse (in Zusammenarbeit mit dem IOS)
- Implementierung einer Anwendung zur semi-automatischen Erstellung von Verwandschaftsbeziehungen (Entwicklung eines einfachen „Recommenders“ sowie einer web-basierten GUI)
- Evaluation der „Recommendations“ (in Zusammenarbeit mit dem IOS)
- Integration der Anwendung in eine Crowdsourcing-Plattform
Erwartete Vorkenntnisse
- Gute Kenntnisse im Bereich MySQL / PHP
- Kenntnisse im Bereich XML / HTML
- Idealerweise Kenntnisse in slavischer Sprachwissenschaft (keine zwingend notwendige Voraussetzung)
- Idealerweise Kenntnisse im Bereich Recommender-Systeme
Weiterführende Quellen
Bei weiteren Fragen zur genauen Ausgestaltung des Themas können Sie sich gerne an manuel.burghardt@ur.de wenden.