Sensible Daten schützen

Intelligente Datenklassifizierung

Bildquelle: Forcepoint

Unternehmen können nur schützen, was sie kennen. Aber wo liegen die sensiblen Daten, die keinesfalls in falsche Hände geraten dürfen, und über welche Kanäle werden sie geteilt?

Data Discovery und Datenklassifizierung liefern diese Informationen – sind bei den riesigen Datenmengen aber kaum noch manuell möglich. KI ist der entscheidende Helfer.

Anzeige

Eine der wichtigsten Aufgaben von Security- Teams ist es, die sensiblen Daten eines Unternehmens zuverlässig zu schützen. Das können personenbezogene Daten sein, die nicht auf Servern außerhalb der EU landen dürfen, interne Dokumente, die nur über freigegebene Cloud-Services ausgetauscht werden sollen, oder geistiges Eigentum wie Quellcode und Konstruktionsdaten, das ein Unternehmen keinesfalls verlassen darf – egal, auf welchem Wege.

Die große Herausforderung: Daten wachsen rasant und sind über Geräte, Server und Clouds verteilt – ihre Wege lassen sich kaum noch nachvollziehen. Selbst eine Kundenliste auf einem geschützten Server ist nicht automatisch sicher. Sie kann heruntergeladen, kopiert oder über verschiedene Kanäle weitergegeben werden.

Schulungen allein reichen nicht

Sensible Informationen verschwinden oft in Dark Data – Daten, die für Unternehmen unsichtbar bleiben und bis zu 80 Prozent des Datenbestandes ausmachen. Schulungen schärfen zwar das Bewusstsein, verhindern aber menschliche Fehler nicht. Zudem können die Daten auch über ein Datenleck abfließen – Unternehmen benötigen daher unbedingt technische Lösungen, um Richtlinien zum Schutz ihrer Daten durchsetzen zu können. Der Schlüssel dafür sind eine lückenlose Data Discovery und eine genaue Datenklassifizierung, denn erst wenn alle Daten korrekt erfasst und kategorisiert wurden, sind Sicherheitslösungen tatsächlich in der Lage, die Richtlinien auf alle Daten und Kanäle, über die sie fließen, anzuwenden.

Anzeige

Ein Überblick über den Datenbestand

Die Data Discovery spürt Daten über alle Speicherorte hinweg auf, erstellt einen Katalog und zeigt, wer auf welche Daten zugreifen kann. Dies hilft, Datenrisiken einzuschätzen und übermäßige Berechtigungen zu entziehen – ein wichtiger Schritt bei der Umsetzung von Zero Trust. Schließlich stellt eine Rechtevergabe nach dem Least-Privilege-Prinzip sicher, dass Mitarbeiter nur exakt die Berechtigungen erhalten, die sie für ihre Tätigkeiten benötigen.

Darüber hinaus werden durch die Data Discovery auch redundante, veraltete und überflüssige Daten sichtbar, die unnötig Speicherplatz belegen und die Storage-Kosten nach oben treiben.

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.

Automatische Klassifizierung mit KI

Erst der umfassende Überblick über den Datenbestand erlaubt es, alle Daten zuverlässig zu klassifizieren. In der Vergangenheit war das eine äußerst aufwendige Aufgabe, weil Daten manuell verschiedenen Kategorien zugeordnet werden mussten, doch inzwischen lässt sich der Vorgang mit KI weitgehend automatisieren. Dabei spielen je nach eingesetzter Lösung ganz unterschiedliche KI-Techniken zusammen – zusätzlich zu klassischen Regeln und Regular Expressions, die Inhalte filtern und damit die Klassifizierung effizienter machen.

Da wären vor allem Small Language Models (SLM), die wie Large Language Models (LLM) natürliche Sprache verarbeiten und die Inhalte von Dateien, Mails, Websites und Chats verstehen. SLMs besitzen anders als LLMs kein breites Allgemeinwissen, sondern sind hochspezialisiert – in diesem Fall auf Datenklassifizierungen. Dadurch liefern sie bessere Ergebnisse, haben nur einen Bruchteil der Größe von LLMs und sind viel ressourcenschonender.

Hinzu kommen sogenannte „Bag of Words“-Modelle, die die Häufigkeit von Wörtern in Dateien untersuchen, was bei der thematischen Einordnung hilft und die Genauigkeit der Klassifizierung verbessert. Deep Neuronal Network Classifiers helfen bei der qualitativen Bewertung der Inhalte und es kommen auch statistische Verfahren aus dem Bereich des Machine Learnings zum Einsatz, etwa Bayessches Lernen, die Vorhersagen treffen und die Klassifizierungsergebnisse verfeinern.

Dark Data Forcepoint

Data Discovery und Datenklassifizierung machen sensible Daten sichtbar, die sich in dem riesigen Berg an Dark Data verstecken, den die meisten Unternehmen angesammelt haben (Quelle: Forcepoint)

Richtlinien passend zum Risiko

All diese Klassifizierungsmechanismen sorgen dafür, dass der Datenbestand korrekt klassifiziert wird – und beispielsweise eine Produktnummer nicht mit einer Sozialversicherungsnummer verwechselt wird. Den einzelnen Datenmustern werden jeweils Kategorien und Unterkategorien zugewiesen und sie erhalten Tags, sodass Security-Teams sehr detaillierte Richtlinien erstellen können. Idealerweise bietet die eingesetzte Sicherheitslösung dabei mehr Möglichkeiten als „Erlauben“ und „Blockieren“, damit Unternehmen abgestuft auf leichte und schwere Sicherheitsverletzungen reagieren können. Beim Speichern einer Präsentation mit Finanzdaten genügt meist ein automatisches Aktivieren der Verschlüsselung.

In der Anfangsphase sollten Unternehmen die Richtlinien zudem nur für hochkritische Aktivitäten wie den Versand von Kundendaten an Empfänger außerhalb des Unternehmens oder den massenhaften Upload von Daten zu verdächtigen Zielen im Internet tatsächlich durchsetzen. Für andere Aktivitäten reicht ein Monitoring zunächst aus, um die Datenbewegungen im Unternehmen besser zu verstehen und die Auswirkungen der Richtlinien zu überprüfen. Möglicherweise zu strikte Richtlinien lassen sich dann noch anpassen, sodass sie Mitarbeiter nicht bei der Arbeit behindern.

Klassifizierung verfeinern

Eine gute Datenklassifizierung kommt ohne KI-optimierte Hardware aus und braucht auch auf Standardsystemen nur wenige Millisekunden für ihre Entscheidungen. Security-Teams können diese noch verbessern, indem sie korrekte Klassifizierungen bestätigen und falsch klassifizierte Daten mit zusätzlichen Informationen den Klassifizierungsprozess erneut durchlaufen lassen.

Unterstützt die eingesetzte Datensicherheitslösung dann noch ein sogenanntes Fingerprinting, lassen sich die wertvollsten Daten eines Unternehmens besonders einfach schützen. Fachbereiche stellen in diesem Fall ihre wichtigsten Dokumente wie Verträge, Personaldaten, Finanzinformationen oder Konstruktionszeichnungen bereit, damit Fingerabdrücke der Daten erstellt werden können, anhand derer sie an anderer Stelle wiedererkannt werden – etwa an neuen Speicherorten, beim Versenden via E-Mail oder beim Teilen mit einem KI-Tool. Selbst wenn nur ein Teil der Originaldokumente dort auftaucht oder sich ihre Inhalte in einem Screenshot verstecken, werden sie zuverlässig identifiziert und die entsprechenden Richtlinien aktiviert.

Um langfristig ein hohes Datensicherheitsniveau zu erreichen, dürfen Unternehmen die Data Discovery und Datenklassifizierung allerdings nicht als einmalige Aufgabe betrachten. Schließlich werden bestehende Daten kontinuierlich bearbeitet, kopiert und verschoben, und es kommen stetig neue Daten hin. Es handelt sich vielmehr um eine dauerhafte Aufgabe, weshalb Unternehmen auch eine Lösung auswählen sollten, bei der für die Discovery-Scans keine separaten Gebühren anfallen. Ansonsten können die regelmäßigen Scans zu einem großen Kostenfaktor werden und empfindliche Löcher ins Security-Budget reißen.

Fabian

Glöser

Team Leader Sales Engineering

Forcepoint

Foto: Stefan Winterstetter ⎮ winterstetter.de
Anzeige

Artikel zu diesem Thema

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.