Big Data 22.06.2012, 16:03 Uhr

Wissen als Wettbewerbsvorteil

Das exponentielle Wachstum von Daten stellt Organisationen vor grosse technische Herausforderungen. Mit herkömmlichen Verfahren können Datenmengen in Terabyte-Grösse kaum mehr verwaltet und schon gar nicht analysiert werden.
Das Know-How für Big-Data-Analytics wird aus mehreren Bereichen zusammengetragen.
Der Autor ist Senior Consultant Business Intelligence bei der Trivadis AG. Mit dem Etikett «Big Data» werden Datenmengen ab dem Terabyte-Bereich bezeichnet, Big Data Analytics sind die entsprechenden analytischen Verfahren zur Gewinnung von Wissen aus diesen grossen Datenbeständen. Dabei wird Know-how aus mehreren Disziplinen kombiniert. Aus der Mathematik fliesst beispielsweise die Statistik ein, aus dem Management das Marketing und aus der Informationstechnologie die Verfahren zum Speichern, Verwalten und Abfragen von Daten.

Einsatzgebiete

Das effiziente Management der Daten reicht heute als alleiniger Wettbewerbsvorteil nicht mehr aus. Big Data Analytics werden deshalb von führenden Unternehmen intensiv genutzt, um systematisch entscheidungsrelevantes Wissen zu gewinnen. So können beispielsweise der Umsatz gesteigert, die Kosten gesenkt, die Qualität erhöht und der Kundenservice verbessert werden. Grundsätzlich lassen sich Big-Data-Analyseverfahren in allen Branchen einsetzen. Die wichtigsten Anwendungsgebiete werden im Folgenden kurz vorgestellt. Datenintegration: Big Data Analytics setzen oft die Zusammenführung von Daten aus verschiedenen Systemen voraus. Alleine dadurch entstehen deutliche Vorteile, wie ein rascher Zugang für Kunden und Unternehmen auf aktuelle, feingranulare Daten sowie die Möglichkeit, erstmals aussagekräftige Analysen am gesamten Datenbestand durchzuführen. Mustererkennung: Die Analyseverfahren werden zudem zur systematischen Erkennung von Mustern in Datenbeständen eingesetzt. Damit lassen sich bislang unerkannte Abhängigkeiten zwischen Parametern aufdecken. Ab­weichungen in Zeitreihen oder Transaktionen, die auf Fehler oder Betrug hinweisen, können identifiziert werden. Wichtige Anwendungen sind die Erkennung von Kreditkartenbetrug sowie die Untersuchung von Steuererklärungen auf Steuerhinterziehung. Auch Frühwarn­systeme sind denkbar, so beispielsweise zur rechtzeitigen Erkennung der Ausbreitung von Epidemien. Experimentieren: Das Durchführen von Experimenten zur Verifizierung beziehungsweise Falsifizierung von Hypothesen ist eine der Hauptanwendungen von Big Data Analytics. Beispielsweise werden Hypothesen hinsichtlich des Kunden­verhaltens formuliert. Anschliessend werden sie aufgrund des Kundenverhaltens, das in den angesammelten Daten zum Ausdruck kommt, bestätigt oder widerlegt. Damit können kostspielige, zum Scheitern verurteilte Marketingaktivitäten vermieden werden. Segmentierung: Eine weitere Anwendung ist das Bilden von Kundensegmenten – sogar in Echtzeit – zum Anbieten von massgeschneiderten Produkten und Dienstleistungen. Eine noch stärkere Individualisierung ist durch die sogenannte Mikrosegmentierung möglich. Open Innovation: Dabei werden Anregungen von Kunden hinsichtlich neuer Produkte und Produktfunktionen in Webportalen gesammelt, ausgewertet und zur Entwicklung von neuen oder zur Verbesserung von bestehenden Produkten genutzt. Monitoring: Das Überwachen von komplexen Produkten oder Anlagen und Transportmitteln mit Sensoren erlaubt das rechtzeitige Erkennen von Problemen und Ergreifen von Korrekturmassnahmen wie den Einbau von Ersatzteilen. Das Monitoring von herz- oder diabeteskranken Patienten kann genutzt werden, um die Notwendigkeit medizinischer Eingriffe prompt zu erkennen. Empfehlungssysteme: Diese verfolgen den Zweck, den Umsatz aufgrund von Empfehlungen zu steigern. Das Stichwort dazu lautet Cross Selling. Bekannt ist das Empfehlungssystem von Amazon, das Kunden auf weitere interessante Artikel hinweist («Kunden, die diesen Artikel gekauft haben, kauften auch…» bzw. «Wird oft zusammen gekauft mit...»). Lesen Sie auf der nächsten Seite: Zum Beispiel Empfehlungssysteme

Zum Beispiel Empfehlungssysteme

Empfehlungssysteme basieren auf der Beobachtung, dass Individuen in der Regel positiv auf Empfehlungen reagieren. Beispiele dafür sind Empfehlungen durch ehemalige Arbeit­geber in Arbeitszeugnissen oder Kritiken von Filmen, Büchern oder Restaurants durch Freunde, Bekannte oder Presse. Die empfohlenen Artikel müssen sich dabei nicht zwingend ähnlich sein, können sich aber beispielsweise gut ergänzen. Empfohlen werden deshalb nicht nur einzelne Artikel, sondern auch – wie bei Amazon – «Körbe» von Artikeln, die zusammenpassen. Die zwei wichtigsten Kategorien von Empfehlungssystemen sind: Inhaltsbasierte Empfehlungssysteme, die auf der Ähnlichkeit der Attribute von Artikeln wie Bücher oder Musikstücke beruhen. Ein bekanntes Beispiel ist der Internetradiodienst Pandora.com. Er klassifiziert Musikstücke aufgrund von rund 400 Attributen, die pro Musikstück erfasst werden. Jedes Attribut erhält dabei eine numerische Bewertung. Zur Erarbeitung von Empfehlungen benutzt Pandora die erfassten Attributwerte. Der Aufwand ist enorm: Für die Erfassung eines Musikstücks benötigen engagierte Spezialisten rund 20 Minuten. Im Moment umfasst die Pandora-Datenbank, die in der Literatur unter dem Begriff «Music Genome Project» bekannt ist, rund 900000 Musikstücke von etwa 90000 Musikern. Die Empfehlungen werden durch Bewertungen weiter verfeinert, die von Kunden abgegeben werden. Aus lizenzrechtlichen Gründen ist Pandora zurzeit nur in den USA zugänglich. Kollaborativ filternde Empfehlungssysteme sammeln und analysieren Daten anhand von Verhalten und Präferenzen der Benutzer, um auf der Basis von Ähnlichkeitsvergleichen Empfehlungen abzugeben. Soziale Netzwerke wie Facebook und LinkedIn empfehlen Freunde auf diese Weise. Um den Nutzen von Empfehlungssystemen zu steigern, werden bei Bedarf verschiedene Kategorien von Empfehlungssystemen kom­biniert eingesetzt. Es entstehen sogenannte hybride Empfehlungssysteme. Lesen Sie auf der nächsten Seite: Sorgfältige Projektplanung

Sorgfältige Projektplanung

Aufgrund der Komplexität und der hohen Kosten sollte die Einführung von Big Data Analytics sorgfältig vorbereitet werden. Es empfiehlt sich, ein relevantes Problem zu identifizieren, das mit Big Data Analytics möglicherweise gewinnbringend gelöst werden kann. Die Lösung ist idealerweise in Form eines Prototyps oder Pilotprojekts zu realisieren. Damit können erste Erfahrungen gesammelt und die Tauglichkeit des gewählten Vorgehens in einem kontrollierten Umfeld verifiziert werden. Für das unternehmensweite Rollout der gewählten Lösung ist ein schrittweises Vorgehen sinnvoll. Zudem sollte die Komplexität der eingesetzten Verfahren, wie beispielsweise mathematische Algorithmen, sorgfältig validiert und nur bei nachgewiesenem Bedarf allmählich gesteigert werden. Rechtliche Vorgaben betreffend Datenschutz und Schutz des geistigen Eigentums müssen rechtzeitig erkannt und eingehalten werden. Daten und Systeme sind zudem vor unauthorisiertem oder böswilligem Zugriff zu schützen. Die Haftpflichtproblematik verdient besondere Beachtung, da es nicht auszuschlies­sen ist, dass Fehler in der Datenhaltung beispielsweise zu Schäden bei Dritten führen. Für die erfolgreiche Einführung von Big Data Analytics wird Know-how vorausgesetzt, das in Form von Schulungen durch Spezialisten, zum Beispiel Statistikern, zielgerichtet vermittelt wird. Ausserdem sollte das Projekt als Bestandteil der Unternehmensstrategie verankert und ein entsprechendes internes Kompetenzzentrum gebildet werden, um die Anwendung von Big Data Analytics unternehmensweit zu fördern.


Das könnte Sie auch interessieren