Schwarmintelligenz im Finanzsektor - Optimierung von Börsenkursvorhersagen durch Reddit
- Thema:
- Schwarmintelligenz im Finanzsektor - Optimierung von Börsenkursvorhersagen durch Reddit
- Art:
- MA
- BetreuerIn:
- Sven Hilbert, Christian Wolff
- BearbeiterIn:
- Lucas Haberl
- ErstgutachterIn:
- Christian Wolff
- Status:
- abgeschlossen
- Stichworte:
- NLP, Machine Learning, Social Media, Stock Market
- angelegt:
- 2021-05-25
- Anmeldung:
- 2021-06-07
- Antrittsvortrag:
- 2021-06-14
- Abschlussvortrag:
- 2021-11-08
- Abgabe:
- 2021-11-29
Hintergrund
Vorhersage von Börsenkursen auf Basis bisheriger Kursentwicklungen ist ein viel beforschtes Problem. Inhalte von Nachrichtenartikeln korrelieren bekanntermaßen mit relevanten Börsenkursen. Des Weiteren kann man anhand von Sentiment Analysen von Social Media Daten Schlüsse auf zukünftige Ereignisse wie Sportveranstaltungen optimieren. Die Kombination aus Social Media und Trading stellt sich dabei als besonders interessant dar, da dort die Social Media Nutzer als Trader aktiv in das Geschehen eingreifen können, was mit guter Organisation zu faszinierenden Entwicklungen führen kann, wie unter anderem dem Short Squeeze der Gamestop Aktie. In dieser Arbeit soll untersucht werden, ob man die Genauigkeit von Börsenkursvorhersagen mit der Einbindung von Reddit Daten optimieren kann.
Zielsetzung der Arbeit
Es soll ein System entstehen, welches mit dem Input von Social Media und Börsendaten genauere Börsenkursvorhersagen trifft als ein vergleichbares System ohne Social Media Input.
Konkrete Aufgaben
- Erstellen eines Reddit Datensatzes (Fokus aus Subreddit Wallstreetbets)
- Pre-processing und NLP Sentiment Datenanalyse
- Akquise von Börsendaten
- Kombination von Börsen- und Sentimentdaten
- Erstellen, Optimieren und Vergleichen von verschiedenen Machine-Learning Systemen auf Basis bestehender Literatur
Erwartete Vorkenntnisse
- Python
- Tensorflow / Machine Learning
- Natural Language Processing
Weiterführende Quellen
- Wanjawa, B. W., & Muchemi, L. (2014). Ann model to predict stock prices at stock exchange markets. arXiv preprint arXiv:1502.06434.
- Kampakis, S., & Adamides, A. (2014). Using Twitter to predict football outcomes. arXiv preprint arXiv:1411.1243.
- Oliveira, N., Cortez, P., & Areal, N. (2017). The impact of microblogging data for stock market prediction: Using Twitter to predict returns, volatility, trading volume and survey sentiment indices. Expert Systems with Applications, 73, 125-144.
- Chohan, U. W. (2021). Counter-Hegemonic Finance: The Gamestop Short Squeeze. Available at SSRN.
- Brownlee, J. (2018). Deep learning for time series forecasting: predict the future with MLPs, CNNs and LSTMs in Python. Machine Learning Mastery.