Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

--- lehre:ss12:v_mmisdb [11.09.2012 08:24] – Alexander Bazo
+++ lehre:ss12:v_mmisdb [11.09.2012 08:25] – Alexander Bazo
@@ Zeile 108: / Zeile 108: @@
 **Grundsätzliches zum Crawlen von Tweets**
-Twitter bietet großartige Möglichkeiten schnell und einfach an große Menge strukturierter, von Nutzern generierter Inhalte zu gelangen. Zu beachten sind bei der automatischen Verarbeitung von Tweets aber immer auch die [[https://dev.twitter.com/terms/api-terms|Developer Rules of the Road]] in denen Twitter festlegt, wer zu welchem Zweck und in welchem Umfang das API nutzen darf, eine kurze Zusammenfassung stellt Twitter [[https://dev.twitter.com/docs/terms/summary|hier]] zur Verfügung. Generell sollte es vermieden werden, Tweets zu crawlen, zu speichern und dann unabhängig vom eigentlichen Twitter-Service (kommerziell) zu veröffentlichen. Über das Online-Interface der Twitter Developer Page besteht die Möglichkeit, die meisten Funktionen des API (des [[https://dev.twitter.com/docs/api/1.1|Twitter REST PI]] zu nutzen, in dem über das ''OAuth tool'' ein String generiert wird, der über [[http://de.wikipedia.org/wiki/CURL|cURL]] genutzt werden kann. Auch damit ist crawlen möglich, für komplexere Anwendungen und die direkte Verarbeitung der gecrawlten Tweets empfiehlt sich die Nutzung einer der Programm-Bibliotheken, die Twitter für verschiedenen Programmier- und Skriptsprachen zugänglich machen. Für Java existiert beispielsweise [[http://twitter4j.org/en/index.html|twitter4j]].
+Twitter bietet großartige Möglichkeiten schnell und einfach an große Menge strukturierter, von Nutzern generierter Inhalte zu gelangen. Zu beachten sind bei der automatischen Verarbeitung von Tweets aber immer auch die [[https://dev.twitter.com/terms/api-terms|Developer Rules of the Road]] in denen Twitter festlegt, wer zu welchem Zweck und in welchem Umfang das API nutzen darf, eine kurze Zusammenfassung stellt Twitter [[https://dev.twitter.com/docs/terms/summary|hier]] zur Verfügung. Generell sollte es vermieden werden, Tweets zu crawlen, zu speichern und dann unabhängig vom eigentlichen Twitter-Service (kommerziell) zu veröffentlichen. Über das Online-Interface der Twitter Developer Page besteht die Möglichkeit, die meisten Funktionen des API (des [[https://dev.twitter.com/docs/api/1.1|Twitter REST PI]]) zu nutzen, in dem über das ''OAuth tool'' ein String generiert wird, der über [[http://de.wikipedia.org/wiki/CURL|cURL]] genutzt werden kann. Auch damit ist crawlen möglich, für komplexere Anwendungen und die direkte Verarbeitung der gecrawlten Tweets empfiehlt sich die Nutzung einer der Programm-Bibliotheken, die Twitter für verschiedenen Programmier- und Skriptsprachen zugänglich machen. Für Java existiert beispielsweise [[http://twitter4j.org/en/index.html|twitter4j]].
 **Crawlen mit Java & twitter4j**