Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Nächste Überarbeitung | Vorhergehende ÜberarbeitungLetzte ÜberarbeitungBeide Seiten der Revision | ||
arbeiten:analyse_von_fahrzeugtraces_auf_hadoop [16.08.2016 11:02] – Erstellt mit dem Formular arbeiten:anlegen Christian Wolff | arbeiten:analyse_von_fahrzeugtraces_auf_hadoop [20.09.2017 08:57] – [Data-Entry] Christian Wolff | ||
---|---|---|---|
Zeile 2: | Zeile 2: | ||
---- dataentry StudentischeArbeit ---- | ---- dataentry StudentischeArbeit ---- | ||
- | Thema | + | Thema |
- | Art_thesistypes | + | Art_thesistypes |
- | Betreuer_thesisadvisor | + | Betreuer_thesisadvisor |
- | Student | + | Student |
- | Professor_thesisprofessor | + | Professor_thesisprofessor : Christian Wolff |
- | Status_thesisstate | + | Status_thesisstate |
- | Stichworte_thesiskeywords | + | Stichworte_thesiskeywords : Cloud, Hadoop, Analyse, Fahrzeug-Traces, |
- | angelegt_dt | + | angelegt_dt |
- | Beginn_dt | + | Beginn_dt |
- | Anmeldung_dt | + | Anmeldung_dt |
- | Antrittsvortrag_dt | + | Antrittsvortrag_dt |
- | Abschlussvortrag_dt | + | Abschlussvortrag_dt |
- | Ende_dt | + | Ende_dt |
---- | ---- | ||
+ | |||
+ | |||
+ | |||
+ | |||
=== Hintergrund === | === Hintergrund === | ||
Zeile 24: | Zeile 28: | ||
=== Konkrete Aufgaben === | === Konkrete Aufgaben === | ||
- | - | + | * Analyse vorhandener Technologien |
- | + | ||
- | - Konzeption: | + | |
- | + | ||
- | o | + | |
- | + | ||
- | o | + | |
- | + | ||
- | o | + | |
- | + | ||
- | - Umsetzung: | + | |
- | + | ||
- | o Setup der Infrastruktur Hadoop als Testumgebung während der Entwicklung | + | |
- | + | ||
- | o | + | |
- | + | ||
- | o | + | |
- | + | ||
- | o | + | |
- | + | ||
- | o | + | |
- | + | ||
- | o | + | |
- | - Evaluation: | + | * Konzeption: |
+ | * Parallelisierung der Datenvorverarbeitung | ||
+ | * Design Datenbankschema | ||
+ | * Parallelisierung der Analyse | ||
- | o | + | * Umsetzung: |
+ | * Setup der Infrastruktur | ||
+ | * Erstellung der Hive Datenbankschemata für Ein- und Ausgabedaten | ||
+ | * Parallelisierung der Datenvorverarbeitung | ||
+ | * Persistieren der Analyseergebnisse in der Hive Datenbank | ||
+ | * Parallelisierung des Analyse | ||
+ | * Kommandozeileninterface | ||
- | o Performancevergleich zu herkömmlicher Datenvorverarbeitung | + | * Evaluation: |
+ | * Performancetests spezifizierter Datenmengen auf Hadoop Cluster | ||
+ | * Performancevergleich zu herkömmlicher Datenvorverarbeitung | ||