Datenschutz: AOL veröffentlicht 20 Millionen persönliche Suchanfragen
Stichworte: america online, aol, benutzerdaten, datenschutz, desaster, rasterfahndung
Amazon:
Bestseller
, Preis-Hits
, Suche nach Rasterfahndung
AOL präsentiert stolz Benutzerdaten für eine öffentliche Rasterfahndung
Die Sensibilität gegenüber persönlichen Daten scheint bei manchem AOL Mitarbeiter nicht sehr ausgeprägt zu sein. Auch eine interne AOL Kontrolle vor der Veröffentlichung von Benutzerdaten scheint nicht unbedingt üblich zu sein. Jedenfalls hat man bei AOL auf einer Forschungsseite (derzeit nicht erreichbar) mal eben eine etwas größere Sammlung von persönlichen Benutzerdaten online gestellt: „This collection consists of ~20M web queries collected from ~500k users over three months.„. Das bedeutet, die Sammlung umfasst etwa 20 Millionen Suchanfragen von ca. 500.000 AOL-Benutzern. Die real durchgeführten Suchanfragen erfolgten im Laufe von drei Monaten. Laut konkreter Zahlen (s.u.) dann übrigens doch 658.000 Benutzer.
Suche: Amazon zu Rasterfahndung, Ebay zu Rasterfahndung
Erst wirft man ein Viertel der Belegschaft auf den Markt (AOL Entlassungen) und jetzt dieses Desaster. Als wollte AOL sich unbedingt gewaltsam vom Online Markt wegfegen.
AOL veröffentlicht 20 Millionen Suchanfragen
AOL hat am 1. August 2006 in Amerika ca. 658.000 Datensätze veröffentlicht, die die persönlichen Suchanfragen von amerikanischen AOL Benutzern zeigen. Die AOL Benutzerkennung (User ID) wurde zwar durch eine Zahl ersetzt, aber die Kombination der komplett ungefilterten Suchdaten erlaubt erhebliche und detaillierte persönliche Rückschlüsse, da viele Benutzer nach für sie persönlich interessanten Daten suchen wie z.B. der eigene Name, lokale Adressen, bekannte Firmen, die eigene Webseite oder die Namen von Familienangehörigen und Freunden. Befinden sich jetzt in der aufgezeichneten und von AOL veröffentlichten Suchhistorie auch so schöne Suchabfragen wie die konstruierten Beispiele „Wo kann man am Steindamm Drogen kaufen“ „Empfehlung Straßenstrich St. Georg“ oder eben auch andere nette Beispiele, dann hat man sehr schnell ein persönliches Datenprofil des jeweiligen Benutzers mit evtl. strafrechtlich relevanten Rückschlüssen auf die einzelne Person, auch ohne den genauen AOL Benutzernamen zu kennen – zu mindestens ein Anfangsverdacht lässt sich flott beweisen.
AOL versucht eine Schadensbegrenzung, aber leider lässt sich da nicht viel begrenzen, weil die freigegebenen AOL Daten längst im Internet kursieren und bereits fleißig ausgewertet werden. Die quantitative Aussage, dass ja nur ein gewisser Anteil aller Suchanfragen veröffentlicht wurde, wischt die qualitativen Argumente (leider) nicht beiseite und kann auch den verursachten Schaden nicht mehr rückgängig machen.
AOL sagt es selber
Die Datensätze:
‘The data set includes {UserID, Query, QueryTime, ClickedRank, DestinationDomainUrl}.
und (Update) die genauen Zahlen
Basic Collection Statistics Dates: 01 March, 2006 – 31 May, 2006 Normalized queries: 19,076,613 queries total, 10,865,119 unique (normalized) queries, 658,086 unique user ID’s
und (Update) die Lizenz (geradezu ironisch)
This collection is distributed for non-commercial research use only.
und
The goal of this collection is to provide a real query log based on users. It could be used for personalization, query reformulation or other type of search research.
und
Please be aware that these queries are not filtered to remove any content.
Quelle: Google Speicherung (Cache) der AOL Originalseite
Und hier ist der entscheidende Punkt, der offensichtlich übersehen wurde, obwohl das seit Herolds Rasterfahndung Allgemeingut sein sollte:
There was no personally identifiable data provided by AOL with those records, but search queries themselves can sometimes include such information.
Quelle: Techcrunch, eine große amerikanische Technologie Webseite AOL: „This was a screw up“ (Zitat aus AOL Pressesprecher Kommentar)
AOL veröffentlicht ungefilterte Benutzerdaten. Was für ein herrliches Desaster.
Ich wundere mich ein wenig über den Veröffentlichungs-Ablauf. Mindestens ein Anwalt hätte doch automatisch hinzu geschaltet werden müssen, wenn ein solcher Artikel in der „fertig für Veröffentlichung“ Schlange auftaucht?
Oh, AOL verwendet ein einfaches Wiki-System. Das ist vielleicht nicht ganz die richtige Plattform für den Umgang mit sensiblen Benutzerdaten.
Links und Lesezeichen
Techcrunch: AOL Proudly Releases Massive Amounts of Private Data
Google News Übersicht: AOL Suchdaten oder Suchanfragen
Google Blog Suche: AOL Suchdaten oder Suchanfragen
- Speichern?
- Mister Wong
- del.icio.us
- Technorati Favorites
Amazon:
Bestseller
, Preis-Hits
, Suche nach Rasterfahndung
Unterstützen Sie Sankt-Georg.Info - Bestellen Sie bei Amazon

