Mit Graphdatenbank auf den Spuren der Steuerbetrüger

LupeBei der Auswertung des Swiss-Leaks-Datensatz setzt das weltweite Konsortium von investigativen Journalisten (ICIJ) auf Neo4j.

Anfang 2014 fiel dem International Consortium of Investigative Journalists (ICIJ) ein extrem komplexer und zugleich extrem wertvoller Datenschatz in die Hände: Die Swiss-Leaks der Schweizer HSBC-Bank. Die insgesamt 60.000 Dateien von mehr als 100.000 Kunden aus 203 Ländern enthielten interne Dokumente zu potentiellen Steuerbetrügern. Konventionelle Analyse-Tools zur Auswertung des brisanten Materials waren hier überfordert. Das ICIJ machte sich daher mit Hilfe von Neo4j auf die Spur der Steuerbetrüger.

Anzeige

Swiss-Leaks AufdeckungDas ICIJ sah sich vor die Aufgabe gestellt, die komplexen Daten für die Recherche zu entschlüsseln und visuell aufzubereiten. Journalisten aus aller Welt sollten einfach und schnell in den Daten recherchieren können. „Bereits bei der Arbeit an den Offshore-Leaks haben wir festgestellt, dass sich in der Finanzkriminalität alles um Beziehungen dreht – Beziehungen zwischen den einzelnen Bankkonten, Kunden, Unternehmen, deren Anwälten und Mittelsmänner sowie den ausgeführten Transaktionen“, erklärt Mar Cabra, Redakteurin der Daten- und Rechercheeinheit des ICIJs. „Diese Beziehungen wollten wir unseren Journalisten auf die einfachste und anschaulichste Art und Weise zeigen, die wir kennen: Mit einem Graphmodell.“

Netzwerke untersuchen, Storys entdecken

Graphdatenbanken wie Neo4j eignen sich ideal zur Untersuchung und Visualisierung, da sie nicht nur einzelne Personen, Konten oder Unternehmen (im Graphen Knoten genannt) darstellen, sondern auch deren Verbindungen abbilden. „Mit einem Klick können Journalisten so von einem beliebigen Ausganspunkt den Verzweigungen folgen und das komplexe Netzwerk um verdächtige Akteure herum einsehen,“ zeigt Holger Temme, Regional Director, EMEA, Neo Technology. „So lässt sich die Story hinter den Daten entdecken.“

Die Daten- und Rechercheeinheit des ICIJs bildete zunächst aus den vorliegenden Excel-Dateien die Datenbank der HSBC nach. Für eine länderspezifische Recherche wurde dabei jeder Name einem oderen mehreren Ländern zugeorndet. Zur Übertragung des Originaldatensatz in Neo4j nutzte ICIJ schließlich die Integrationssoftware-Lösungen von Talend. So enstand eine Graphdatenbank mit mehr als 275.000 Knoten und 400.000 Beziehungen. Journalisten konnten als Benutzerschnittstelle über eine Web-App von Linkurious auf die Graphdatenbank zugreifen. Neben der Aufdeckung von Steuerdelikten nutzten sie das Analysetool auch zur Faktenüberprüfung bei der Vorbereitung von Artikeln und Manuskripten.

Grenzenüberschreitende Visualisierung

Insgesamt arbeiteten über 150 Journalisten aus über 40 Ländern sechs Monate lang an der Swiss-Leak Berichterstattung. Das internationale Projekt gelang auch deshalb, da die Visualisierung des Graphmodells universell verstanden wird – über alle sprachlichen, kulturellen und technologischen Barrieren hinweg. „Die Lösung war so intuitiv, dass die Reporter bereits nach einer kurzen Einführung loslegen konnten. Eine große IT-Erfahrung war nicht notwendig“, betont Mar Cabra. „Auch konnten wir auf Unterstützung externer Datenwissenschaftler verzichten, was bei der Brisanz und Geheimhaltung der Daten enorm wichtig war. Das Tool hat unsere Abläufe im investigativen Journalismus revolutioniert.“

Inzwischen ist Neo4j Teil aller ICIJ Projekte mit großen Datenmengen. Im Fall Swiss-Leak unterstützte es Journalisten dabei, rohe, unstrukturierte Daten in handfeste und penibel recherchierte Berichte zu verwandeln und diese zu veröffentlichen. Im Februar 2015 enthüllten so mehr als 50 Medien weltweit, wie die HSBC-Bank Steuerbetrüger und Kriminielle dabei unterstütze, Konten in der Schweiz mit einem Gesamtwert von insgesamt 100 Milliarden US-Dollar zu verschleiern.

Weitere Informationen:

Sehen Sie auch das Video von ICIJ auf der GraphConnect SF 2015.

www.neo4j.com

Anzeige

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.