Cloud Expo Europe
28.11.17 - 29.11.17
In Frankfurt

Data Centre World
28.11.17 - 29.11.17
In Frankfurt

IT-Tage 2017
11.12.17 - 14.12.17
In Frankfurt, Messe Kap Europa

Net.Law.S 2018
20.02.18 - 21.02.18
In Nürnberg, Messezentrum

CESIS 2018
20.02.18 - 21.02.18
In München

LupeBei der Auswertung des Swiss-Leaks-Datensatz setzt das weltweite Konsortium von investigativen Journalisten (ICIJ) auf Neo4j.

Anfang 2014 fiel dem International Consortium of Investigative Journalists (ICIJ) ein extrem komplexer und zugleich extrem wertvoller Datenschatz in die Hände: Die Swiss-Leaks der Schweizer HSBC-Bank. Die insgesamt 60.000 Dateien von mehr als 100.000 Kunden aus 203 Ländern enthielten interne Dokumente zu potentiellen Steuerbetrügern. Konventionelle Analyse-Tools zur Auswertung des brisanten Materials waren hier überfordert. Das ICIJ machte sich daher mit Hilfe von Neo4j auf die Spur der Steuerbetrüger.

Swiss-Leaks AufdeckungDas ICIJ sah sich vor die Aufgabe gestellt, die komplexen Daten für die Recherche zu entschlüsseln und visuell aufzubereiten. Journalisten aus aller Welt sollten einfach und schnell in den Daten recherchieren können. „Bereits bei der Arbeit an den Offshore-Leaks haben wir festgestellt, dass sich in der Finanzkriminalität alles um Beziehungen dreht – Beziehungen zwischen den einzelnen Bankkonten, Kunden, Unternehmen, deren Anwälten und Mittelsmänner sowie den ausgeführten Transaktionen“, erklärt Mar Cabra, Redakteurin der Daten- und Rechercheeinheit des ICIJs. „Diese Beziehungen wollten wir unseren Journalisten auf die einfachste und anschaulichste Art und Weise zeigen, die wir kennen: Mit einem Graphmodell.“

Netzwerke untersuchen, Storys entdecken

Graphdatenbanken wie Neo4j eignen sich ideal zur Untersuchung und Visualisierung, da sie nicht nur einzelne Personen, Konten oder Unternehmen (im Graphen Knoten genannt) darstellen, sondern auch deren Verbindungen abbilden. „Mit einem Klick können Journalisten so von einem beliebigen Ausganspunkt den Verzweigungen folgen und das komplexe Netzwerk um verdächtige Akteure herum einsehen,“ zeigt Holger Temme, Regional Director, EMEA, Neo Technology. „So lässt sich die Story hinter den Daten entdecken.“

Die Daten- und Rechercheeinheit des ICIJs bildete zunächst aus den vorliegenden Excel-Dateien die Datenbank der HSBC nach. Für eine länderspezifische Recherche wurde dabei jeder Name einem oderen mehreren Ländern zugeorndet. Zur Übertragung des Originaldatensatz in Neo4j nutzte ICIJ schließlich die Integrationssoftware-Lösungen von Talend. So enstand eine Graphdatenbank mit mehr als 275.000 Knoten und 400.000 Beziehungen. Journalisten konnten als Benutzerschnittstelle über eine Web-App von Linkurious auf die Graphdatenbank zugreifen. Neben der Aufdeckung von Steuerdelikten nutzten sie das Analysetool auch zur Faktenüberprüfung bei der Vorbereitung von Artikeln und Manuskripten.

Grenzenüberschreitende Visualisierung

Insgesamt arbeiteten über 150 Journalisten aus über 40 Ländern sechs Monate lang an der Swiss-Leak Berichterstattung. Das internationale Projekt gelang auch deshalb, da die Visualisierung des Graphmodells universell verstanden wird – über alle sprachlichen, kulturellen und technologischen Barrieren hinweg. „Die Lösung war so intuitiv, dass die Reporter bereits nach einer kurzen Einführung loslegen konnten. Eine große IT-Erfahrung war nicht notwendig“, betont Mar Cabra. „Auch konnten wir auf Unterstützung externer Datenwissenschaftler verzichten, was bei der Brisanz und Geheimhaltung der Daten enorm wichtig war. Das Tool hat unsere Abläufe im investigativen Journalismus revolutioniert.“

Inzwischen ist Neo4j Teil aller ICIJ Projekte mit großen Datenmengen. Im Fall Swiss-Leak unterstützte es Journalisten dabei, rohe, unstrukturierte Daten in handfeste und penibel recherchierte Berichte zu verwandeln und diese zu veröffentlichen. Im Februar 2015 enthüllten so mehr als 50 Medien weltweit, wie die HSBC-Bank Steuerbetrüger und Kriminielle dabei unterstütze, Konten in der Schweiz mit einem Gesamtwert von insgesamt 100 Milliarden US-Dollar zu verschleiern.

Weitere Informationen:

Sehen Sie auch das Video von ICIJ auf der GraphConnect SF 2015.

www.neo4j.com

GRID LIST
Tb W190 H80 Crop Int 74532d0eacb31d5d7ec7a54979240d99

Neue In-Memory-Datenbankplattform Terracotta DB

Die Software AG gab die Verfügbarkeit der In-Memory-Datenbank (IMDB) Terracotta DB…
Analytics Summit 2017

Google Analytics Konferenz in Deutschland

Bereits zum sechsten Mal veranstaltet der zertifizierte Google Analytics Partner Trakken…
Tb W190 H80 Crop Int 8934e8c1736b537d6fa8ae0594f8bc01

Digitale Signatur trotzt Quantencomputern

Die Kryptografie und die Rechenkraft von Computern sind in einem ständigen Wettlauf:…
Stefan Müller

Hitachi Vantara ein neuer Player entsteht auf dem Markt | Kommentar

Die Data Intelligence-Szene wurde aufgemischt: Hitachi gab die Fusion seiner Sparten…
Digitalisierung Auto

Datenmanagement: Die Autobranche sucht das Geschäft der Zukunft

Uber hat einen höheren Börsenwert als General Motors; Tesla verkauft seine…
Programmcode

Programmcode von Yago ist nun für jedermann nutzbar

Im Internet hat fast jedes Wort mehr als eine Bedeutung, was die Suche oft mühsam macht.…
Frische IT-News gefällig?
IT Newsletter Hier bestellen:

Newsletter IT-Management
Strategien verfeinert mit profunden Beiträgen und frischen Analysen

Newsletter IT-Security
Pikante Fachartikel gewürzt mit Shortnews in Whitepaper-Bouquet