arbeiten:fake_news_in_social_traditional_media_in_the_context_of_covid-19

Fake news in social & traditional media in the context of COVID-19

Thema:
Fake news in social & traditional media in the context of COVID-19
Art:
MA
BetreuerIn:
Udo Kruschwitz
BearbeiterIn:
Philipp Hartl
ErstgutachterIn:
Udo Kruschwitz
ZweitgutachterIn:
Christian Wolff
Status:
in Bearbeitung
Stichworte:
NLP, fake news, detection, social network analysis, Setniment Analysis, Twitter
angelegt:
2020-11-09

Hintergrund

Soziale Medien sind zu einem beliebten Kanal geworden, um Nachrichten zu konsumieren und zu verbreiten. Gleichzeitig haben sie allerdings auch die weite Verbreitungen von gefälschten Nachrichten (sogenannte 'Fake News') ermöglicht d.h Nachrichten mit absichtlich falschen Informationen, was zu erheblichen Verwirrungen und Verwerfungen in der Gesellschaft führt. Dementsprechend hat die Forschung zur computergestützten Erkennung von Fake News in letzter Zeit viel Aufmerksamkeit erhalten. Besonders während der amerikanischen Präsidentschaftswahl 2016, sowie aktuell wieder wegen COVID-19 und der Wahl zum amerikanischen Präsidenten 2020 sind Fake News in den Fokus der Gesellschaft gerückt. Sender wie Fox News oder hochrangige Politiker wie Donald Trump verbreiten aus politischen Motiven absichtlich Falschinformationen sowohl im traditionellen Nachrichtenbereich, aber vor allem in Social Media. Es gibt allerdings linguistische, netzwerktechnische sowie zeitkritische Unterschiede in der Verbreitung von gefälschten Nachrichten und realen Nachrichten. So ist z.B. bekannt, dass Fake News häufiger von Botaccounts erstellt und geteilt werden als reale Nachrichten.

Zielsetzung der Arbeit

Ziel der Arbeit ist, strukturelle Unterschiede zwischen Fake & Real News zu identifizieren und anhand dieser einen Klassifikator zu entwickeln, welcher anhand von linguistischen, sozialen sowie zeitlichen Kontext Fake News erkennen kann:

Inwiefern ist es möglich Fake News anhand ihrer stilistischen Merkmale zu erkennen?
Wie unterscheidet sich die Verbreitung von Fake News gegenüber Real News?
    Gibt es hierarchische Unterschiede in den Netzwerken (z.B. entsteht eine Echokammer)?
    Gibt es zeitliche Unterschiede in der Verbreitung (wie schnell verbreitet sich eine Nachricht)?
Kann man anhand der ursprünglichen Quelle verstellen, ob eine Aussage glaubwürdig ist oder nicht (z.B. @realdonaldtrump vs. @associatedPress)?
Unterscheidet sich das Diskussionsverhalten von Fake und Real News?
Behandeln Fake News und Real News andere Themengebiete?

Konkrete Aufgaben

Mögliche Methoden zur Untersuchung der Fragestellung sind:

quantitative Analyse
Social Network Analysis
Sentimentanalysis
Transfer-Learning (BERT, roBERTa etc.)
Stilometrie
Topic Modeling
Training eines supervised Maschine Learning Klassifikators
Weak social supervision (WSS)

Erwartete Vorkenntnisse

Python
Maschine Learning
NLP
Social Network Analysis
Sentiment Analysis
Twitter

Weiterführende Quellen

Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. ArXiv:1810.04805 [Cs]. http://arxiv.org/abs/1810.04805

  Shu, K., Mahudeswaran, D., Wang, S., Lee, D., & Liu, H. (2020). FakeNewsNet: A Data Repository with News Content, Social Context, and Spatiotemporal Information for Studying Fake News on Social Media. Big Data, 8(3), 171–188. https://doi.org/10.1089/big.2020.0062
  Shu, K., Sliva, A., Wang, S., Tang, J., & Liu, H. (2017). Fake News Detection on Social Media: A Data Mining Perspective. ArXiv:1708.01967 [Cs]. http://arxiv.org/abs/1708.01967
  Shu, K., Wang, S., Lee, D., & Liu, H. (2020). Mining Disinformation and Fake News: Concepts, Methods, and Recent Advancements. ArXiv:2001.00623 [Cs]. http://arxiv.org/abs/2001.00623
  Slovikovskaya, V., & Attardi, G. (n.d.). Transfer Learning from Transformers to Fake News Challenge Stance Detection (FNC-1) Task. 8.
  Wang, W. Y. (2017). “Liar, Liar Pants on Fire”: A New Benchmark Dataset for Fake News Detection. Proceedings of the 55th Annual Meeting of the Association for           Computational Linguistics (Volume 2: Short Papers), 422–426. https://doi.org/10.18653/v1/P17-2067