Datenschutz: AOL veröffentlicht 20 Millionen persönliche Suchanfragen

Amazon: Bestseller , Preis-Hits , Suche nach Rasterfahndung

AOL präsentiert stolz Benutzerdaten für eine öffentliche Rasterfahndung

Die Sensibilität gegenüber persönlichen Daten scheint bei manchem AOL Mitarbeiter nicht sehr ausgeprägt zu sein. Auch eine interne AOL Kontrolle vor der Veröffentlichung von Benutzerdaten scheint nicht unbedingt üblich zu sein. Jedenfalls hat man bei AOL auf einer (derzeit nicht erreichbar) mal eben eine etwas größere Sammlung von persönlichen Benutzerdaten online gestellt: „This collection consists of ~20M web queries collected from ~500k users over three months.„. Das bedeutet, die Sammlung umfasst etwa 20 Millionen Suchanfragen von ca. 500.000 AOL-Benutzern. Die real durchgeführten Suchanfragen erfolgten im Laufe von drei Monaten. Laut konkreter Zahlen (s.u.) dann übrigens doch 658.000 Benutzer.

Suche: Amazon zu RasterfahndungRasterfahndung, Ebay zu RasterfahndungRasterfahndung

Erst wirft man ein Viertel der Belegschaft auf den Markt ( Entlassungen) und jetzt dieses Desaster. Als wollte AOL sich unbedingt gewaltsam vom Online Markt wegfegen.

AOL veröffentlicht 20 Millionen Suchanfragen

AOL hat am 1. August 2006 in Amerika ca. 658.000 Datensätze veröffentlicht, die die persönlichen Suchanfragen von amerikanischen AOL Benutzern zeigen. Die AOL Benutzerkennung (User ID) wurde zwar durch eine Zahl ersetzt, aber die Kombination der komplett ungefilterten Suchdaten erlaubt erhebliche und detaillierte persönliche Rückschlüsse, da viele Benutzer nach für sie persönlich interessanten Daten suchen wie z.B. der eigene Name, lokale Adressen, bekannte Firmen, die eigene Webseite oder die Namen von Familienangehörigen und Freunden. Befinden sich jetzt in der aufgezeichneten und von AOL veröffentlichten Suchhistorie auch so schöne Suchabfragen wie die konstruierten Beispiele „Wo kann man am Steindamm Drogen kaufen“ „Empfehlung Straßenstrich St. Georg“ oder eben auch andere nette , dann hat man sehr schnell ein persönliches Datenprofil des jeweiligen Benutzers mit evtl. strafrechtlich relevanten Rückschlüssen auf die einzelne Person, auch ohne den genauen AOL Benutzernamen zu kennen – zu mindestens ein Anfangsverdacht lässt sich flott beweisen.

AOL versucht eine Schadensbegrenzung, aber leider lässt sich da nicht viel begrenzen, weil die freigegebenen AOL Daten längst im Internet kursieren und bereits fleißig ausgewertet werden. Die quantitative Aussage, dass ja nur ein gewisser Anteil aller Suchanfragen veröffentlicht wurde, wischt die qualitativen Argumente (leider) nicht beiseite und kann auch den verursachten Schaden nicht mehr rückgängig machen.

AOL sagt es selber

Die Datensätze:

‘The data set includes {UserID, Query, QueryTime, ClickedRank, DestinationDomainUrl}.

und (Update) die genauen Zahlen

Basic Collection Statistics Dates: 01 March, 2006 – 31 May, 2006 Normalized queries: 19,076,613 queries total, 10,865,119 unique (normalized) queries, 658,086 unique user ID’s

und (Update) die Lizenz (geradezu ironisch)

This collection is distributed for non-commercial research use only.

und

The goal of this collection is to provide a real query log based on users. It could be used for personalization, query reformulation or other type of search research.

und

Please be aware that these queries are not filtered to remove any content.

Quelle: Google Speicherung (Cache) der Originalseite

Und hier ist der entscheidende Punkt, der offensichtlich übersehen wurde, obwohl das seit Herolds Allgemeingut sein sollte:

There was no personally identifiable data provided by AOL with those records, but search queries themselves can sometimes include such information.

Quelle: Techcrunch, eine große amerikanische Technologie Webseite : „This was a screw up“ (Zitat aus AOL Pressesprecher Kommentar)

AOL veröffentlicht ungefilterte Benutzerdaten. Was für ein herrliches Desaster.

Ich wundere mich ein wenig über den Veröffentlichungs-Ablauf. Mindestens ein Anwalt hätte doch automatisch hinzu geschaltet werden müssen, wenn ein solcher Artikel in der „fertig für Veröffentlichung“ Schlange auftaucht?

Oh, AOL verwendet ein einfaches -System. Das ist vielleicht nicht ganz die richtige Plattform für den Umgang mit sensiblen Benutzerdaten.

Links und Lesezeichen

Techcrunch: Proudly Releases Massive Amounts of Private Data
Google News Übersicht: Suchdaten oder Suchanfragen
Google Blog Suche: Suchdaten oder Suchanfragen

Veröffentlicht am 8. August 2006 von Markus Merz

Fügen Sie Ihren Kommentar hinzu:

Sie können textile in Ihrem Kommentar verwenden.
Hinweise: 1. Die Kommentare werden vor Freigabe geprüft und das Einstellen urheberrechtlich geschützter Werke ist verboten. 2. Mit dem Absenden Ihres Kommentars willigen Sie ein, dass der angegebene Name, Ihre E-Mail-Adresse und die IP-Adresse, die Ihrem Internetanschluss aktuell zugewiesen ist, von mir im Zusammenhang mit Ihrem Kommentar gespeichert werden.