Prototypische Umsetzung und Evaluierung einer cloudbasierten Applikation zur Analyse von Fahrzeugtraces auf Hadoop
- Thema:
- Prototypische Umsetzung und Evaluierung einer cloudbasierten Applikation zur Analyse von Fahrzeugtraces auf Hadoop
- Art:
- MA
- BetreuerIn:
- Christian Wolff
- BearbeiterIn:
- Theresa Reiml
- ErstgutachterIn:
- Christian Wolff
- ZweitgutachterIn:
- N.N.
- Status:
- abgeschlossen
- Stichworte:
- Cloud, Hadoop, Analyse, Fahrzeug-Traces, Automotive, Big Data
- angelegt:
- 2016-08-16
- Beginn:
- 2016-07-01
- Anmeldung:
- 2016-08-18
- Antrittsvortrag:
- 2016-09-29
- Abgabe:
- 2017-02-18
- Textlizenz:
- Unbekannt
- Codelizenz:
- Unbekannt
Hintergrund
Das Unternehmen iNTENCE automotive electronics GmbH entwickelte bereits eine Softwarekomponente zur Verwaltung, Steuerung und Analyse von Fahrzeugtraces auf Basis von Sollmodellen. Aufgrund der starken Vernetzung im Fahrzeug und den dadurch entstehenden Datenmengen (Big Data) kann eine Analyse sehr viel Zeit in Anspruch nehmen. Durch den Einsatz von Hadoop verspricht man sich eine erhebliche Optimierung der Analysezeit, da durch dieses Framework Verarbeitungsschritte stark parallelisiert werden können.
Zielsetzung der Arbeit
Im Rahmen dieser Arbeit soll mithilfe der bestehenden Funktionalitäten eine Applikation entwickelt werden, die die starke Parallelisierung von Hadoop für verschiedene Verarbeitungsschritte nutzt. Zur Steuerung der Anwendung soll eine Schnittstelle konzipiert und umgesetzt werden. Die Evaluation der Anwendung wird anschließend anhand von Performancetests durchgeführt und ist Basis für die weitere Vorgehensweise.
Konkrete Aufgaben
* Analyse vorhandener Technologien
- Konzeption:
- Parallelisierung der Datenvorverarbeitung
- Design Datenbankschema
- Parallelisierung der Analyse
- Umsetzung:
- Setup der Infrastruktur Hadoop als Testumgebung während der Entwicklung
- Erstellung der Hive Datenbankschemata für Ein- und Ausgabedaten
- Parallelisierung der Datenvorverarbeitung
- Persistieren der Analyseergebnisse in der Hive Datenbank
- Parallelisierung des Analyse
- Kommandozeileninterface
- Evaluation:
- Performancetests spezifizierter Datenmengen auf Hadoop Cluster
- Performancevergleich zu herkömmlicher Datenvorverarbeitung
Erwartete Vorkenntnisse
Solide Kenntnisse in Java-Programmierung und Datenbanken.
Weiterführende Quellen
TBD