US-Bibliothek sammelt alle Tweets

Die US-Bibliothek «Library of Congress» sammelt den kompletten öffentlichen Inhalt von Twitter. Täglich kommen 500 Millionen Tweets hinzu.

» Von Jens Stark , 09.01.2013 11:54.

weitere Artikel

Die Library of Congress, das US-Gegenstück zur Schweizerischen Nationalbibliothek und nach Anzahl Medien die zweitgrösste Bibliothek der Welt, sammelt nicht nur fleissig Schriften aller Art, sie will auch den Twitter-Kosmos einfangen. Zu diesem Zweck hat sie alle Tweets seit der Gründung des Dienstes 2006 gespeichert. Insgesamt umfasst die Sammlung derzeit 170 Milliarden der Kurzmitteilungen, wobei täglich eine halbe Milliarde Tweets hinzukommen.

In einem speziellen Projekt sollen die Daten der ersten vier Jahre des Dienstes nun Forschern zur Verfügung gestellt werden. Es handelt sich dabei um 20 Terabyte an Daten oder um 21 Milliarden Tweets. Die komplette Sammlung bis heute beläuft sich auf etwas über 133 Terabytes.

Eigenen Angaben zufolge habe die Bibliothek bereits 400 Anfragen von Wissenschaftlern erhalten. Diese wollen den Datensatz anzapfen, um die unterschiedlichsten Themen zu beackern: von «Bürger-Journalismus» über Impfraten bis hin zu Börsentrends, die sich im Fluss der Tweets wiederspiegeln.

Laut der Library of Congress unterhält die Institution weitere ausgiebige elektronische Datensammlungen, so ein Web-Archiv zu politischen Themen, das gut 300 Terabyte gross ist.

Werbung

KOMMENTARE

Markus Häfliger: 09-01-13 16:52

Schönes Beispiel für den Big-Data-Hype. Als nächstes speichert die Bibliothek dann das ganze Internet.

KOMMENTAR SCHREIBEN

*
*
*
*

Alles Pflichfelder, E-Mail-Adresse wird nicht angezeigt.

Die Redaktion hält sich vor, unangebrachte, rassistische oder ehrverletzende Kommentare zu löschen.
Die Verfasser von Leserkommentaren gewähren der NMGZ AG das unentgeltliche, zeitlich und räumlich unbegrenzte Recht, ihre Leserkommentare ganz oder teilweise auf dem Portal zu verwenden. Eingeschlossen ist zusätzlich das Recht, die Texte in andere Publikationsorgane, Medien oder Bücher zu übernehmen und zur Archivierung abzuspeichern.