arbeiten:schwarmintelligenz_im_finanzsektor_-_optimierung_von_boersenkursvorhersagen_durch_reddit

Schwarmintelligenz im Finanzsektor - Optimierung von Börsenkursvorhersagen durch Reddit

Thema:
Schwarmintelligenz im Finanzsektor - Optimierung von Börsenkursvorhersagen durch Reddit
Art:
MA
BetreuerIn:
Sven Hilbert, Christian Wolff
BearbeiterIn:
Lucas Haberl
ErstgutachterIn:
Christian Wolff
Status:
abgeschlossen
Stichworte:
NLP, Machine Learning, Social Media, Stock Market
angelegt:
2021-05-25
Anmeldung:
2021-06-07
Antrittsvortrag:
2021-06-14
Abschlussvortrag:
2021-11-08
Abgabe:
2021-11-29

Hintergrund

Vorhersage von Börsenkursen auf Basis bisheriger Kursentwicklungen ist ein viel beforschtes Problem. Inhalte von Nachrichtenartikeln korrelieren bekanntermaßen mit relevanten Börsenkursen. Des Weiteren kann man anhand von Sentiment Analysen von Social Media Daten Schlüsse auf zukünftige Ereignisse wie Sportveranstaltungen optimieren. Die Kombination aus Social Media und Trading stellt sich dabei als besonders interessant dar, da dort die Social Media Nutzer als Trader aktiv in das Geschehen eingreifen können, was mit guter Organisation zu faszinierenden Entwicklungen führen kann, wie unter anderem dem Short Squeeze der Gamestop Aktie. In dieser Arbeit soll untersucht werden, ob man die Genauigkeit von Börsenkursvorhersagen mit der Einbindung von Reddit Daten optimieren kann.

Zielsetzung der Arbeit

Es soll ein System entstehen, welches mit dem Input von Social Media und Börsendaten genauere Börsenkursvorhersagen trifft als ein vergleichbares System ohne Social Media Input.

Konkrete Aufgaben

  • Erstellen eines Reddit Datensatzes (Fokus aus Subreddit Wallstreetbets)
  • Pre-processing und NLP Sentiment Datenanalyse
  • Akquise von Börsendaten
  • Kombination von Börsen- und Sentimentdaten
  • Erstellen, Optimieren und Vergleichen von verschiedenen Machine-Learning Systemen auf Basis bestehender Literatur

Erwartete Vorkenntnisse

  • Python
  • Tensorflow / Machine Learning
  • Natural Language Processing

Weiterführende Quellen

  • Wanjawa, B. W., & Muchemi, L. (2014). Ann model to predict stock prices at stock exchange markets. arXiv preprint arXiv:1502.06434.
  • Kampakis, S., & Adamides, A. (2014). Using Twitter to predict football outcomes. arXiv preprint arXiv:1411.1243.
  • Oliveira, N., Cortez, P., & Areal, N. (2017). The impact of microblogging data for stock market prediction: Using Twitter to predict returns, volatility, trading volume and survey sentiment indices. Expert Systems with Applications, 73, 125-144.
  • Chohan, U. W. (2021). Counter-Hegemonic Finance: The Gamestop Short Squeeze. Available at SSRN.
  • Brownlee, J. (2018). Deep learning for time series forecasting: predict the future with MLPs, CNNs and LSTMs in Python. Machine Learning Mastery.