arbeiten:fake_news_in_social_traditional_media_in_the_context_of_covid-19

Identifying Fake news in social & traditional media

Thema:
Exploring automatic text summarizationfor Fake News detection
Art:
MA
BetreuerIn:
Udo Kruschwitz
BearbeiterIn:
Philipp Hartl
ErstgutachterIn:
Udo Kruschwitz
ZweitgutachterIn:
Christian Wolff
Status:
abgeschlossen
Stichworte:
NLP, fake news, detection, social network analysis, Sentiment Analysis, Twitter
angelegt:
2021-01-04
Antrittsvortrag:
2021-05-10
Abschlussvortrag:
2021-10-25

Hintergrund

Soziale Medien sind zu einem beliebten Kanal geworden, um Nachrichten zu konsumieren und zu verbreiten. Gleichzeitig haben sie allerdings auch die weite Verbreitungen von gefälschten Nachrichten (sogenannte 'Fake News') ermöglicht d.h Nachrichten mit absichtlich falschen Informationen, was zu erheblichen Verwirrungen und Verwerfungen in der Gesellschaft führt. Dementsprechend hat die Forschung zur computergestützten Erkennung von Fake News in letzter Zeit viel Aufmerksamkeit erhalten. Besonders während der amerikanischen Präsidentschaftswahl 2016, sowie aktuell wieder wegen COVID-19 und der Wahl zum amerikanischen Präsidenten 2020 sind Fake News in den Fokus der Gesellschaft gerückt. Sender wie Fox News oder hochrangige Politiker wie Donald Trump verbreiten aus politischen Motiven absichtlich Falschinformationen sowohl im traditionellen Nachrichtenbereich, aber vor allem in Social Media. Es gibt allerdings linguistische, netzwerktechnische sowie zeitkritische Unterschiede in der Verbreitung von gefälschten Nachrichten und realen Nachrichten. So ist z.B. bekannt, dass Fake News häufiger von Botaccounts erstellt und geteilt werden als reale Nachrichten.

Zielsetzung der Arbeit

Ziel der Arbeit ist, strukturelle Unterschiede zwischen Fake & Real News zu identifizieren und anhand dieser einen Klassifikator zu entwickeln, welcher anhand von linguistischen, sozialen sowie zeitlichen Kontext Fake News erkennen kann:

  • Inwiefern ist es möglich Fake News anhand ihrer stilistischen Merkmale zu erkennen?
  • Wie unterscheidet sich die Verbreitung von Fake News gegenüber Real News?
    • Gibt es hierarchische Unterschiede in den Netzwerken (z.B. entsteht eine Echokammer)?
    • Gibt es zeitliche Unterschiede in der Verbreitung (wie schnell verbreitet sich eine Nachricht)?
  • Kann man anhand der ursprünglichen Quelle verstellen, ob eine Aussage glaubwürdig ist oder nicht (z.B. @realdonaldtrump vs. @associatedPress)?
  • Unterscheidet sich das Diskussionsverhalten von Fake und Real News?
  • Behandeln Fake News und Real News andere Themengebiete?

Konkrete Aufgaben

Mögliche Methoden zur Untersuchung der Fragestellung sind:

  • quantitative Analyse
  • Social Network Analysis
  • Sentimentanalysis
  • Transfer-Learning (BERT, roBERTa etc.)
  • Stilometrie
  • Topic Modeling
  • Training eines supervised Maschine Learning Klassifikators
  • Weak social supervision (WSS)

Erwartete Vorkenntnisse

  • Python
  • Maschine Learning
  • NLP
  • Social Network Analysis
  • Sentiment Analysis
  • Twitter

Weiterführende Quellen

  • Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. ArXiv:1810.04805 [Cs]. http://arxiv.org/abs/1810.04805
  • Shu, K., Mahudeswaran, D., Wang, S., Lee, D., & Liu, H. (2020). FakeNewsNet: A Data Repository with News Content, Social Context, and Spatiotemporal Information for Studying Fake News on Social Media. Big Data, 8(3), 171–188. https://doi.org/10.1089/big.2020.0062
  • Shu, K., Sliva, A., Wang, S., Tang, J., & Liu, H. (2017). Fake News Detection on Social Media: A Data Mining Perspective. ArXiv:1708.01967 [Cs]. http://arxiv.org/abs/1708.01967
  • Shu, K., Wang, S., Lee, D., & Liu, H. (2020). Mining Disinformation and Fake News: Concepts, Methods, and Recent Advancements. ArXiv:2001.00623 [Cs]. http://arxiv.org/abs/2001.00623
  • Slovikovskaya, V., & Attardi, G. (n.d.). Transfer Learning from Transformers to Fake News Challenge Stance Detection (FNC-1) Task. 8.
  • Wang, W. Y. (2017). “Liar, Liar Pants on Fire”: A New Benchmark Dataset for Fake News Detection. Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers), 422–426. https://doi.org/10.18653/v1/P17-2067