Search + Graph: Auf der Suche nach neuen Antworten

14. November, 2016
13:17

Obwohl es Graphdatenbanken und Suchmaschinen schon eine ganze Weile gibt, ist die intelligente Kombination der beiden ein Novum in der Datenanalyse. Durch die Kombination der Graphenanalyse mit Suchverfahren kann die Relevanz genutzt werden, um die wichtigen Ergebnisse zu liefern und häufige Verknüpfungen zu vermeiden.

Erinnern Sie sich noch an den berühmten Slogan von Sun Microsystems: „Das Netzwerk ist der Computer“? Dasselbe gilt auch immer mehr für Daten, aber anstelle von Kabeln, die viele Geräte verbinden, erforschen und entdecken wir Beziehungen in unseren Daten. Der Großteil der Daten, die täglich erzeugt werden, enthält Beziehungen. Einige dieser Beziehungen sind explizit – beispielsweise, wenn jemand einer Person auf Twitter folgt oder Fremdschlüssel in relationalen Datenbanken verwendet werden. In anderen Fällen sind die Verknüpfungen weniger offensichtlich und strukturiert und daher schwieriger zu verarbeiten. Aber neue Technologien erschließen diesen neuen Datentyp und bereiten den Weg für vollkommen neue Anwendungsfälle.

Fortschritte bei der Suche und Datenanalyse haben uns neue Möglichkeiten zur Erforschung von Beziehungen in selbst größten Datensätzen verliehen. Die Analyse von „Big Data“ ist oft auf die Vorstellungskraft der Nutzer beschränkt, zum Beispiel die Fähigkeit, sich auszumalen, welche Beziehungen existieren, und zu verstehen, welche wichtig sind.

Die Graphenanalyse schafft eine weitere Möglichkeit, indem bisher unentdeckte Beziehungen in den Daten offengelegt werden. Mit Graph ist es einfach, komplexe Fragen zu beantworten und Anwendungsfälle wie Verhaltensanalyse, Betrug, Cybersecurity, Wirkstoffentdeckung und personalisierte Medizin zu bewältigen und individuelle Empfehlungen anhand fortlaufender Echtzeitdaten zu geben.

So funktioniert es

Um die Beziehungen in Ihren Daten zu erforschen und zu verstehen, müssen Sie diese erst einmal ermitteln. Alle Daten haben eine grundlegende Struktur, die das Fundament für die Beziehungsexploration bildet. Mit modernen Document Stores ist es einfach, strukturierte Dokumente zu speichern und abzufragen. Diese Dokumente können Informationen zu einem Benutzer wie Kaufhistorie oder Musikvorlieben zeigen oder Beobachtungen oder Ereignisse in der echten Welt wie zum Beispiel einen Tweet oder einzelne Käufe darstellen.

Bei der herkömmlichen Datenanalyse würden wir uns diese Daten ansehen und versuchen, sie zusammenzufassen und die Eigenschaften der kumulierten Daten zu verstehen: Welches Produkt haben wir am häufigsten verkauft? Wer sind unsere Top-Kunden? Welche Band ist am beliebtesten? Mit den Antworten auf diese Fragen können wir die Daten vielleicht noch detaillierter untersuchen und spezifischere Fragen stellen: Welches Produkt war in der jeweiligen Kategorie und in den einzelnen Regionen am beliebtesten? Welche Musik gefällt den Menschen unter 30 in Frankreich am besten? Selbst vor 5 Jahren waren das noch schwierige Fragen, wenn man große Datenmengen vor sich hatte. Wenn Sie heute nur diese Fragen stellen, verpassen Sie eine fantastische Gelegenheit, mehr Informationen aus Ihren Daten zu extrahieren.

Stellen Sie sich vor, Sie müssten Dokumente nicht mehr aggregieren, sondern könnten Ihre Daten auf andere Art visualisieren, um Beziehungen untereinander anhand der Verknüpfungen von Dokumenten oder Eigenschaften zu entdecken. Das bietet Ihnen Graph: Sie können Muster sehen, von denen Sie nicht einmal wussten, dass es sie gibt. Und nun stellen Sie sich vor, was Sie für Fragen stellen könnten, die auf den neu entdeckten Beziehungen fußen …

Fragen wie „Welche Künstler sind Mozart am ähnlichsten?“ oder sogar „Welche Produkte werden am häufigsten zusammen mit Windeln gekauft?“, vielleicht auch „Welche Gemeinsamkeiten bestehen zwischen den Personen in den Panama Papers?“.

Die Mozart-Frage ist das perfekte Beispiel dafür, warum die Relevanz – eine der größten Herausforderungen in der Graphenanalyse – so wichtig ist. Wenn eine Musikempfehlungs-Engine auf den Daten zu den Vorlieben von Tausenden oder Millionen Nutzern basiert, besteht die Gefahr, einfach nur die beliebtesten Bands auszugeben, unabhängig davon, ob sie relevant sind oder nicht. Sie würden zum Beispiel niemandem, der ähnliche Musik wie Mozart sucht, die Beatles empfehlen wollen (die aus gutem Grund allseits beliebt sind).

Die Häufigkeit dieser sogenannten „hypervernetzten Entitäten“ in den Wiedergabelisten der meisten Personen würde dazu führen, dass sie sogar für die obskursten Nischengenres als ähnlich angezeigt würden. Genauso würde bei einer Analyse der Lebensmitteleinkäufe Milch unter „Welche Produkte wurden am häufigsten zusammen mit … gekauft“ angezeigt werden, weil so viele Menschen jedes Mal Milch kaufen, wenn sie in den Supermarkt gehen.

Durch die Kombination der Graphenanalyse mit Suchverfahren kann die Relevanz genutzt werden, um die wichtigen Ergebnisse zu liefern und häufige Verknüpfungen zu vermeiden. Bedeutsamkeit kann durch die Korrelation der Signifikanz der jeweiligen Beziehung im Vergleich zu globalen Durchschnittswerten berechnet werden.

Die Idee, die Relevanz in der Welt der Graphen zu nutzen, hat den Weg für komplexere Fragen geebnet. Nehmen wir einmal an, Sie haben Log-Daten von Ihrem Webserver, Informationen zu den IP-Adressen eingehender Anfragen und die angeforderten URLs. Könnten Sie diese Informationen nutzen, um Angreifer aufzuspüren? Wenn Sie einen Angriffsvektor (Anfragen für /admin) kennen, können Sie diese Informationen nutzen, um böswillige Akteure und andere Angriffsvektoren zu finden? Mit Daten zu Musikvorlieben können Sie nun ein individuelles Empfehlungssystem entwickeln, das die relevantesten Bands anhand demografischer Daten und Vorlieben vorschlägt.

Obwohl es Graphdatenbanken und Suchmaschinen schon eine ganze Weile gibt, ist die intelligente Kombination der beiden ein Novum in der Datenanalyse. Unternehmen, die ihre Daten besser analysieren, können sich als Early Adopter dieser Technologie einen Vorteil verschaffen. Wenn Sie Suchrelevanz und Graphenanalyse kombinieren, können Sie Ihrem Unternehmen dabei helfen, schneller auf Veränderungen im Kundenverhalten und in den Marktverhältnissen zu reagieren, und komplexe Anwendungsfälle lösen, bei denen die Antworten auf Fragen in den Beziehungen der Daten verborgen sind.

Steve Kearns, Senior Director of Product Management, Elastic

www.elastic.co/de

Search + Graph: Auf der Suche nach neuen Antworten

So funktioniert es

Weitere Artikel

Meistgelesene Artikel

Discord down: Massive Störung legt Plattform lahm

Stryker-Hack: Mitarbeiter können weiterhin nicht arbeiten

Cyberangriff auf Stryker: Experte bezweifelt schnelle Eindämmung

Das Revival des Mac mini

Hacker-Angriff: IT-Totalausfall bei Medizintechnik-Riesen Stryker

IT Verlag

Wichtige Links

Kontakt