Anonymisierung von Daten

Alles nicht so schlimm, wollen uns diejenigen weismachen, die der Auffassung sind, das Volk müsse hierzulande nicht nur gezählt werden, sondern dazu auch noch Angaben zu anderen interessanten Dingen machen. Schließlich werde das ja alles anonymisiert und beim Umgang mit den Daten werde bestimmt nichts Böses mit ihnen gemacht. Und wie sagte schon Gutemine: „Milch, Zucker, Eier, Mehl und etwas Schweinefett, das macht bestimmt nicht dick!“
Abgesehen von zahlreichem inhaltlichen Unfug – über die Angaben zum religösen (Nicht-)Bekenntnis inklusive der Nichtberücksichtigung des Jediismus ist an verschiedenen Orten schon Diverses dazu geschrieben worden – lohnt ein Blick auf übliche Methoden der „Anonymisierung“ von Daten.
Das Beispiel ist vergleichsweise harmlos. In den Zeiten meines Geographiestudiums sollte ich mal eine Karte zur Herkunft der Greifswalder Studierenden erstellen, am besten noch unterschieden nach den fünf Fakultäten. Der zuständige Dozent bat die Universitätsverwaltung um eine „anonymisierte Liste“ mit den notwendigen Kategorien. Wir erwarteten eine zweispaltige Liste mit Fakultät und Stadt bzw. Kreis, in dem das Abitur abgelegt wurde, selbstverständlich neu sortiert, und rechneten ferner mit der Notwendigkeit eines Kompromisses für die Theologische Fakultät aufgrund der zu geringen Datenmenge.
Wir erhielten eine Liste mit den gewünschten Spalten, wohl ohne Namen, dazu aber auch einige Angaben, nach denen wir gar nicht gefragt hatten, unter anderem das genaue Geburtsdatum. Außerdem ergab die Suche nach dem eigenen Datensatz und denen der damaligen Mitbewohner_innen den Verdacht, dass die Liste weiterhin alphabetisch nach Namen sortiert war. Zur Überprüfung dieses Verdachtes führte ich die Suche im näheren und weiteren Bekanntenkreis weiter. Alsbald hatte ich über 200 Leute eindeutig identifiziert und hätte mir so leicht eine schöne Geburtstagsliste erstellen können.
Ich erstellte eine schöne Karte zur Herkunft der Greifswalder Studierenden.
Das alsbald passenderweise als „Giftliste“ benannte Exceldokument habe ich irgendwann zerstört, möglicherweise aus Versehen.
Bei der Volkszählung muss das nicht so glimpflich ausgehen. Vertrauen in die „Anonymisierung von Daten“ ist jedenfalls nicht angebracht, einen laxen Umgang mit Datenmengen für den Normalfall zu halten schon eher. Daher hier nochmal zur Erinnerung: Es können sehr wenige Angaben ausreichen, um einen Menschen innerhalb einer vermeintlich großen Menge eindeutig identifizieren zu können. Und es sind am Ende eben nicht nur harmlose Humangeographen, die für ihre wissenschaftlichen Arbeiten gerne zuverlässige Daten hätten, in deren Hände die Ergebnisse der staatlichen Zählerei am Ende gelangen.

Schreibe einen Kommentar

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.