Big Data: ertrinken oder schwimmen lernen
Die Datenflut wird immer grösser - Unternehmen müssen lernen, wie man darin schwimmt.

» Von , 10.02.2012 09:11.
Daten speichern ist teuer. War es früher das Speichermedium selbst, ist es heute die schiere Menge, die zum Kostentreiber wird. Laut einer Studie von EMC und IDC verdoppeln sich die weltweiten Informationen alle zwei Jahre und haben 2011 1,8 Zettabyte erreicht – das sind 1,8 Trillionen Gigabyte. Um diese Zahl etwas anschaulicher zu machen: Das entspricht ungefähr der Speicherkapazität von 57,5 Billionen 32 GB iPads.
Die drei «grossen V» (Volume, Variety und Velocity) sind die Hauptursachen für das Datenwachstum. Immer mehr Transaktionen in Unternehmen generieren immer mehr Daten. Dabei entsteht aber nicht nur ein Aufbewahrungs- und Sicherungs-, sondern vor allem auch ein Analyseproblem. Gab es früher nur einfache Transaktionsdaten (z.B. aus Datenbanken), tragen heute auch Social Media, mobile Devices, Mails, Videos, hierarchische und Messdaten zum Gesamtbild bei.
Für grosse Unternehmen war und ist schon allein die schiere Datenmenge von jeher eine Herausforderung. Aber auch das Thema Geschwindigkeit ist ein wichtiger Punkt beim Datenmanagement. Wie schnell stehen diese riesigen Datenmengen zur Verfügung? Wie schnell können sie verarbeitet werden, um die erforderlichen Ergebnisse zu liefern? Eine Warnung zu bekommen, dass die Leitung gebrochen ist, bringt wenig, wenn einem das Wasser schon bis zum Hals steht. Der Alarm sollte schon dann losgehen, wenn die Leitung knackt.
Stellt man sich die Datenmengen vor, die bei Finanztransaktionen, im Börsenhandel, als Energieverbrauchsdaten, in der Wissenschaft oder im Gesundheitswesen so anfallen, beschleicht einen zudem der Verdacht, dass die Schätzungen zu den Datenbeständen und deren Wachstum eher konservativ sein könnten. Gleichzeitig ist dieser Datenbestand ein Schatz für das Unternehmen, der nur in den seltensten Fällen wirklich gehoben wird. Das liegt aber weniger am «nicht wollen», eher schon am «nicht können».
Schon heute sind Standard-Tools oft nicht mehr in der Lage, alle Daten adäquat zu erfassen, zu analysieren, zu verteilen, die Ergebnisse zu visualisieren und all das auch noch (revisions-)sicher und rückführbar aufzubewahren. Und es wird nicht besser. Hinzukommt, dass diese Daten häufig unter quantitativen Aspekten erhoben werden, statistische Grundprinzipien wie z.B. Repräsentativität stehen eher im Hintergrund. Die Folge: Die Daten bilden nicht die Wirklichkeit ab, es werden verfälschte Trends ausgeworfen – und auf der Grundlage dieser Aussagen dann (falsche) Entscheidungen getroffen.
Wo also anfangen, den Dschungel zu lichten? Die drei grossen Einfallstore – die Sammlung und Analyse der Daten, die Speicherung und Sicherung sowie der Umgang des Unternehmens mit dieser Flut – bieten einen guten Ansatz.
Nächste Seite: Sammlung und Analyse als Basis



KOMMENTARE
KOMMENTAR SCHREIBEN