09.01.2013, 11:54 Uhr

US-Bibliothek sammelt alle Tweets

Die US-Bibliothek «Library of Congress» sammelt den kompletten öffentlichen Inhalt von Twitter. Täglich kommen 500 Millionen Tweets hinzu.
Die Library of Congress sammelt fleissig Tweets
Die Library of Congress, das US-Gegenstück zur Schweizerischen Nationalbibliothek und nach Anzahl Medien die zweitgrösste Bibliothek der Welt, sammelt nicht nur fleissig Schriften aller Art, sie will auch den Twitter-Kosmos einfangen. Zu diesem Zweck hat sie alle Tweets seit der Gründung des Dienstes 2006 gespeichert. Insgesamt umfasst die Sammlung derzeit 170 Milliarden der Kurzmitteilungen, wobei täglich eine halbe Milliarde Tweets hinzukommen.
In einem speziellen Projekt sollen die Daten der ersten vier Jahre des Dienstes nun Forschern zur Verfügung gestellt werden. Es handelt sich dabei um 20 Terabyte an Daten oder um 21 Milliarden Tweets. Die komplette Sammlung bis heute beläuft sich auf etwas über 133 Terabytes.
Eigenen Angaben zufolge habe die Bibliothek bereits 400 Anfragen von Wissenschaftlern erhalten. Diese wollen den Datensatz anzapfen, um die unterschiedlichsten Themen zu beackern: von «Bürger-Journalismus» über Impfraten bis hin zu Börsentrends, die sich im Fluss der Tweets wiederspiegeln.
Laut der Library of Congress unterhält die Institution weitere ausgiebige elektronische Datensammlungen, so ein Web-Archiv zu politischen Themen, das gut 300 Terabyte gross ist.


Das könnte Sie auch interessieren