Clustering von Log-Daten zur Charakterisierung von Twitter-Nutzungsverhalten
- Thema:
- Clustering von Log-Daten zur Charakterisierung von Twitter-Nutzungsverhalten
- Art:
- BA
- BetreuerIn:
- Florian Meier
- BearbeiterIn:
- Johannes Aigner
- ErstgutachterIn:
- Christian Wolff
- ZweitgutachterIn:
- N.N.
- Status:
- abgeschlossen
- angelegt:
- 2016-05-17
- Textlizenz:
- Unbekannt
- Codelizenz:
- Unbekannt
Hintergrund
Die Social Media-Plattform Twitter ist sowohl Datenquelle als auch Untersuchungsgegestand für eine bereits kaum noch fassbare Menge an Studien in den unterschiedlichsten Disziplinen. Es ist jedoch wenig darüber bekannt, wie gewöhnliches Twitternutzungsverhalten aussieht. Dabei spielen folgende Fragen eine Rolle:
- Wie lange sind Twitter-Sessions und welche Aktionen führen Nutzer in diesen Sitzungen durch?
- Lassen sich Twittersitzungen zu Gruppen zusammenfassen?
- Wodruch zeichnen sich diese Gruppen aus? Gibt es wiederkehrende Verhaltensmuster?
Ein besseres Verständnis darüber wie sich Nutzer auf Social Media-Plattformen verhalten eröffnet Möglichkeiten für ein besseres UI-Design, soziales Interaktionsverhalten und Informationsverbreitung auf diesen Plattformen.
Grundlage sind die Logdaten von 44 Probanden deren Twitternutzung über eine Google Chrome-Erweiterung für einen Zeitraum von 5 Monaten erhoben wurde.
Zielsetzung der Arbeit
- Vergleich von unüberwachten maschinellen Lernverfahren zur Identifikation von Nutzungscharakteristika bei Twittersitzungen
- Beschreibung und Interpretation der identifizierten Sessiongruppen
- Charakterisierung von Nutzergruppen basierend auf der Verteilung der Sessiongruppen
Konkrete Aufgaben
- Clustering von Twitter-Session-Daten mit unterschiedlichen Clustering-Verfahren in R
Erwartete Vorkenntnisse
- Statistische Programmierung in R
- Umgang mit Logdaten/Clickstreamdaten
- Grundwissen über maschinelle Lernverfahren