
Anfang 2014 fiel dem International Consortium of Investigative Journalists (ICIJ) ein extrem komplexer und zugleich extrem wertvoller Datenschatz in die Hände: Die Swiss-Leaks der Schweizer HSBC-Bank. Die insgesamt 60.000 Dateien von mehr als 100.000 Kunden aus 203 Ländern enthielten interne Dokumente zu potentiellen Steuerbetrügern. Konventionelle Analyse-Tools zur Auswertung des brisanten Materials waren hier überfordert. Das ICIJ machte sich daher mit Hilfe von Neo4j auf die Spur der Steuerbetrüger.

Netzwerke untersuchen, Storys entdecken
Graphdatenbanken wie Neo4j eignen sich ideal zur Untersuchung und Visualisierung, da sie nicht nur einzelne Personen, Konten oder Unternehmen (im Graphen Knoten genannt) darstellen, sondern auch deren Verbindungen abbilden. „Mit einem Klick können Journalisten so von einem beliebigen Ausganspunkt den Verzweigungen folgen und das komplexe Netzwerk um verdächtige Akteure herum einsehen,“ zeigt Holger Temme, Regional Director, EMEA, Neo Technology. „So lässt sich die Story hinter den Daten entdecken.“
Die Daten- und Rechercheeinheit des ICIJs bildete zunächst aus den vorliegenden Excel-Dateien die Datenbank der HSBC nach. Für eine länderspezifische Recherche wurde dabei jeder Name einem oderen mehreren Ländern zugeorndet. Zur Übertragung des Originaldatensatz in Neo4j nutzte ICIJ schließlich die Integrationssoftware-Lösungen von Talend. So enstand eine Graphdatenbank mit mehr als 275.000 Knoten und 400.000 Beziehungen. Journalisten konnten als Benutzerschnittstelle über eine Web-App von Linkurious auf die Graphdatenbank zugreifen. Neben der Aufdeckung von Steuerdelikten nutzten sie das Analysetool auch zur Faktenüberprüfung bei der Vorbereitung von Artikeln und Manuskripten.
Grenzenüberschreitende Visualisierung
Insgesamt arbeiteten über 150 Journalisten aus über 40 Ländern sechs Monate lang an der Swiss-Leak Berichterstattung. Das internationale Projekt gelang auch deshalb, da die Visualisierung des Graphmodells universell verstanden wird – über alle sprachlichen, kulturellen und technologischen Barrieren hinweg. „Die Lösung war so intuitiv, dass die Reporter bereits nach einer kurzen Einführung loslegen konnten. Eine große IT-Erfahrung war nicht notwendig“, betont Mar Cabra. „Auch konnten wir auf Unterstützung externer Datenwissenschaftler verzichten, was bei der Brisanz und Geheimhaltung der Daten enorm wichtig war. Das Tool hat unsere Abläufe im investigativen Journalismus revolutioniert.“
Inzwischen ist Neo4j Teil aller ICIJ Projekte mit großen Datenmengen. Im Fall Swiss-Leak unterstützte es Journalisten dabei, rohe, unstrukturierte Daten in handfeste und penibel recherchierte Berichte zu verwandeln und diese zu veröffentlichen. Im Februar 2015 enthüllten so mehr als 50 Medien weltweit, wie die HSBC-Bank Steuerbetrüger und Kriminielle dabei unterstütze, Konten in der Schweiz mit einem Gesamtwert von insgesamt 100 Milliarden US-Dollar zu verschleiern.
Weitere Informationen:
Sehen Sie auch das Video von ICIJ auf der GraphConnect SF 2015.