Design und Entwicklung eines Tools zur explorativen Visualisierung von Kommunikation auf „reddit“

Thema:
Design und Entwicklung eines Tools zur explorativen Visualisierung von Kommunikation auf „reddit“
Art:
BA
Betreuer:
Alexander Bazo
Student:
Fabian Schatz
Professor:
Bernd Ludwig
Status:
abgeschlossen
angelegt:
2016-12-22
Beginn:
2016-12-01
Anmeldung:
2016-12-22
Ende:
2017-02-22

Hintergrund

Die immer größer werdende Beliebtheit von Internetplattformen, wie beispielsweise „reddit“, „Digg“ oder „Stumbleupon“, ist nicht abzustreiten. Aufgrund dieser Tatsache sind immer mehr Daten bezüg- lich Kommunikation im Internet vorhanden, weshalb eine Analyse genau dieser, auf Internetplattfor- men stattfindenden, Kommunikation als sinnvoll erscheint. Da es die Untersuchung von Kommunika- tion im klassischen Sinne bereits seit geraumer Zeit in Fächern wie der Literaturwissenschaft gibt, sich diese Vorgehensweisen allerdings nur bedingt auf das Medium des Internets anwenden lassen, ist es an der Zeit ein Tool zur datengetriebenen Analyse und Visualisierung der Kommunikation im Internet zu entwickeln um neue Erkenntnisse und Forschungsfragen ans Licht zu bringen, welche in anderen Arbeiten genauer untersucht werden können. Dieser Bereich der Digital Humanities ist in der heutigen Zeit mit den immer größer werdenden tech- nischen Möglichkeiten und Datenmengen von sehr großer Bedeutung. Dies wird sehr anschaulich in „The Computational Turn: Thinking About The Digital Humanities“ von David M. Berry beschrieben. Ebenso gibt es ansprechende Literatur bezüglich der Aufbereitung von Kommunikation und Diskussio- nen. So zeigt beispielsweise der Artikel „Visualizing Conversation“ von J. Donath, K. Karahalios und F. Viégas einige Möglichkeiten und Herangehensweisen zur Visualisierung von Onlinekonversationen.

Zielsetzung der Arbeit

Ziel der Abschlussarbeit ist die Konzeption und Entwicklung eines Tools zur explorativen Visualisierung von Kommunikation auf der Internetplattform „reddit“. Der Grundgedanke des Tools ist, dass es als Werkzeug für Forschende dienen und für diese Fragestellungen generieren soll. Das Tool stellt an- schauliche Visualisierungen für beliebige Diskussionen dar. Die Datengrundlage hierfür sind alle öffent- lich zugänglichen Themen inklusive aller dazugehöriger Kommentare. Als Erstes werden die vorhandenen Daten aufbereitet. Hierfür steht zunächst ein Datensatz der Jahre 2006 bis Mitte 2015 bereit. Alle darüberhinausgehenden Daten werden über einen WebCrawler kon- tinuierlich in eine Datenbank eingepflegt um somit auch Zugriff auf neuere Daten zu haben. Zusätzlich soll ein Echtzeitzugriff über die Reddit-API möglich sein. Als nächster Schritt werden die vorhandenen Daten mit Hilfe von statistischen Maßzahlen untersucht um beispielsweise durchschnittliche Kommentaranzahl oder auch Anzahl der beteiligten Personen an einer Diskussion festzustellen. Diese statistische Exploration dient dazu, dass interessante und wich- tige Aspekte für die Visualisierung erkannt werden können. Nach Abschluss der Exploration und Analyse der Daten wird ein Tool mit Hilfe von verschiedenen Vi- sualisierungsframeworks zur interaktiven Visualisierung der Daten entwickelt und implementiert. Die- ses Tool soll die Möglichkeit geben explorativ in ausgewählten Daten zu arbeiten und diese mit Hilfe der bereitgestellten Visualisierungen zu verstehen und Auffälligkeiten zu entdecken. Dies soll im All- gemeinen neue Fragestellungen schaffen. Hier soll beispielsweise ein zeitliches Verlaufsdiagramm erstellt werden, welches vermehrte Kommu- nikation zu bestimmten Zeitpunkten auf einen Blick erkennbar macht. Ebenso ist eine Visualisierung der in einer Diskussion wichtigsten Beiträge mit Hilfe eines Rankings vorgesehen. So können Fragestel- lungen generiert werden, die sich damit beschäftigen, welcher Inhalt hoch bewertet wird, aber even- tuell inhaltlich gar nichts zur Diskussion beiträgt. Abschließend wird das entwickelte Tool validiert. Dieser Validierungsprozess wird in zwei Teile aufge- trennt. Zunächst wird das Tool an beliebigen Nutzern getestet um die Usability und Lauffähigkeit des Tools zu gewährleisten, bevor darauffolgend ein Expertentest bezüglich der tatsächlichen Einsatzfä- higkeit folgt.

Konkrete Aufgaben

Nach Absprache mit dem Betreuer.

Erwartete Vorkenntnisse

Keine

Weiterführende Quellen

  • Berry, D. M. (2011). The computatonal turn: Thinking about the digital humanities. Culture Machine, 12, 1–22. doi:10.1007/s12599-014-0342-4
  • Donath, J., Karahalios, K. and Viégas, F. (1999), Visualizing Conversation. Journal of Computer-Media- ted Communication, 4: 0. Doi: 10.1111/j.1083-6101.1999.tb00107.x
  • Hansen, D. L., Rotman, D., Bonsignore, E., Milic-Frayling, N., Rodrigues, E. M., Smith, M., & Shnei- derman, B. (2013). Do you know the way to SNA’: A process model for analyzing and visualizing social media network data. Proceedings of the 2012 ASE International Conference on Social In- formatics, SocialInformatics 2012, 304–313. doi:10.1109/SocialInformatics.2012.26
  • Hansen, D. L., Shneiderman, B., & Smith, M. (2010). Visualizing threaded conversation networks: Mi- ning message boards and email lists for actionable insights. Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 6335 LNCS, 47–62. doi:10.1007/978-3-642-15470-6_7
  • Singer, P., Flöck, F., Meinhart, C., Zeitfogel, E., & Strohmaier, M. (2014). Evolution of Reddit: From the Front Page of the Internet to a Self-referential Community? Proceedings of the Companion Publication of the 23rd International Conference on World Wide Web Companion, 1–6. doi:10.1145/2567948.2576943
LDAP: couldn't connect to LDAP server
arbeiten/design_und_entwicklung_eines_tools_zur_explorativen_visualisierung_von_kommunikation_auf_„reddit.txt · Zuletzt geändert: 08.03.2017 13:37 von baa56852
Recent changes RSS feed Debian Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki