Datenanalyse ohne Direktzugriff

Blinded Analysis - ein Vorschlag, wie Big Data genutzt werden kann, ohne den Datenschutz und das Vertrauen der Nutzer zu gefährden.

» Von Luigi Scorzato & Stefan Rustler*, 29.03.2017 14:37.

weitere Artikel

Bildergalerie

Noch im 19. Jahrhundert betrug die Lebenserwartung eines Neugeborenen durchschnittlich 40 Jahre. Heute liegt sie in entwickelten Ländern bei etwa 80 Jahren. Der wissenschaftliche Fortschritt – v. a. in der Medizin – hat uns effektiv ein zweites Leben beschert. Ohne die systematische Analyse medizinischer und auch anderer sensibler Daten ­wäre diese Errungenschaft undenkbar. Daten bilden das Fundament für Medizin, Wissenschaft und Wohlstand.

In jüngerer Zeit haben neuartige Methoden und die stetig wachsende Rechenleistung uns befähigt, grosse Datenmengen in den verschiedensten Bereichen zu sammeln und auszuwerten. Die Folge sind entsprechende Verbesserungen beispielsweise in Gesundheit, Bildung, Kommunikation oder Transport.

Datenschutz vs. Datennutzung

Um weitere Verbesserungen zu erreichen, führt kein Weg an der Nutzung sensibler oder personenbezogener Daten vorbei. Und diese Verbesserungen sind nötig, denn eine funk­tionierende Welt mit 10 Milliarden Menschen, die nicht datengetrieben ist, ist kaum vorstellbar. Wir stossen schon jetzt an die Grenzen unserer Ressourcen, der Optimierungsdruck wächst weiter.

Allerdings gibt es legitime Bedenken zu Datenschutz und möglichem Missbrauch, wenn personenbezogene Daten involviert sind. Leider gehen viele Organisationen nicht adäquat mit solchen Bedenken um und die Gesetzgebung hinkt hinterher. Der Versuch, den Nutzer eines Services zu beschwichtigen, kann gar nach hinten losgehen: Viele Nutzungsvereinbarungen wirken schon durch ihren Umfang erschlagend. Erreicht man die Passagen, in denen andere Nutzungszwecke erläutert werden, sind sie schwammig formuliert. Auch der Ausschluss der Weitergabe der Daten an Dritte beruhigt nur bedingt: Was ist heute wirklich innerhalb und was ausserhalb grosser multinationaler Organisationen?

Selbst die Zusicherung, dass personenbezogene Daten anon­ymisiert werden, ist oft unzulänglich. Denn in vielen Fällen müsste man eigentlich von einer Pseudonymisierung sprechen: Offensichtlich sensible Felder wie Namen oder Adressen werden gelöscht oder durch Hilfsschlüssel ersetzt. In manchen Situationen reicht das aus, aber im Allgemeinen ist dies keine Garantie dafür, dass man individuelle Identitäten mit Daten, die zunächst unbedenklich scheinen, nicht rekons­truieren kann. Analysiert man zum Beispiel die Handy-Verbindungsdaten in einer dünn besiedelten Gegend, kann das Aggregationslevel bezüglich Lokation zu niedrig sein, um ausreichend Anonymisierung zu bieten.

Jedoch ist die vollkommene Anonymisierung auch keine universelle Lösung, da sehr granulare oder individuelle Informationen für eine bedeutsame Analyse manchmal eben gebraucht werden. Um beispielsweise das Elektrizitätsnetz einer Stadt zu optimieren, bedarf es der genauen Daten örtlicher und zeitlicher Nutzungsprofile. Dieses Dilemma zwischen wirklichem Datenschutz und nutzenstiftender Datenanalyse zu lösen, ist die Voraussetzung für den Weg in eine bessere Zukunft.

Nächste Seite: Gewaltentrennung für Daten

Werbung

KOMMENTARE

Keine Kommentare

KOMMENTAR SCHREIBEN

*
*
*
*

Alles Pflichfelder, E-Mail-Adresse wird nicht angezeigt.

Die Redaktion hält sich vor, unangebrachte, rassistische oder ehrverletzende Kommentare zu löschen.
Die Verfasser von Leserkommentaren gewähren der NMGZ AG das unentgeltliche, zeitlich und räumlich unbegrenzte Recht, ihre Leserkommentare ganz oder teilweise auf dem Portal zu verwenden. Eingeschlossen ist zusätzlich das Recht, die Texte in andere Publikationsorgane, Medien oder Bücher zu übernehmen und zur Archivierung abzuspeichern.