In vier Schritten vom gefährlichen Daten-Wildwuchs zum wertvollen Informations-Pool

Unstrukturierte Daten bergen viele Chancen und mindestens ebenso viele Risiken. APARAVI zeigt, wie Unternehmen sich in wenigen Schritten der Gefahren entledigen und aus dem gigantischen Daten-Rohmaterial leicht nutzbare Informationen erzeugen.

Unstrukturierte Daten sind aus mehreren Gründen ein Problemfall: Erstens sind sie schwer zu finden, zu analysieren und zu verstehen, zweitens verursachen sie hohe Kosten und drittens bergen sie potenzielle Sicherheits- und Compliance-Risiken. Gleichzeitig aber stecken in ihnen viele wertvolle Informationen, die für die Wertschöpfung im Unternehmen genutzt werden können. APARAVI, Anbieter von Lösungen zur Verwaltung unstrukturierter Daten, erklärt, wie aus einer latenten Gefahrenquelle ein leicht nutzbarer, stets aktueller Informations-Pool wird.

Anzeige
  1. Daten finden und sammeln: Im ersten Schritt werden die unstrukturierten Daten in Form von Inhalten und Metadaten von einem sogenannten Collector gesucht und gesammelt, egal ob sie on-premises oder in der Cloud gespeichert sind. Dabei müssen Tausende von Dateiformaten berücksichtigt werden. Besonders interessant sind Dark Data und die redundanten, obsoleten und trivialen Daten (ROT).
  2. Daten speichern, Sicherheitsrisiken beseitigen: In einem Aggregator werden diese Daten dann gespeichert und analysiert. Gleichzeitig wird der Datenbestand von den nicht mehr benötigten ROT-Daten bereinigt. Sie sind damit kein Sicherheitsrisiko mehr. Wichtig ist, dass die verbleibenden wichtigen Daten dabei unverändert bleiben.
  3. Daten klassifizieren und indizieren: In einer Index-Datenbank werden die gefundenen Daten anschließend klassifiziert, indiziert und aufbereitet. Dieser aufgeräumte, auf die wesentlichen Informationen reduzierte Daten-Pool steht dann für Datenanalysen, Machine-Learning-Projekte, Automatisierungs-Initiativen oder die Cloud-Migration zur Verfügung.
  4. Prozesse automatisieren: Durch den laufenden Zufluss neuer unstrukturierter Daten muss der bereinigte Datenbestand ständig weiter gepflegt werden. Um den Aufwand dafür zu minimieren, erfolgt dieser Prozess idealweise automatisiert. So bleibt der Datenbestand stets aktuell, ohne Ressourcen dafür binden zu müssen.

Die Kosten für Storage und Administration werden dadurch meist deutlich gesenkt. Zudem können sich die teuren und händeringend gesuchten IT-Spezialisten mit den wirklich interessanten, motivierenden und wertschöpfenden IT-Projekten befassen, statt sich um ermüdende Datenmüll-Routine kümmern zu müssen. Security-Risiken, etwa durch Dark Data, kann besser vorgebeugt werden und die Vorgaben durch Compliance und Data Governance sind effizienter umsetzbar. Zudem können Datendiebstahl und -missbrauch (Data Breach) schneller festgestellt und bereinigt werden.


Das könnte Sie auch interessieren:

Storage

eBook: Innovationen im Storage-Bereich

Was sind die großen Trends in Sachen Storage in 2022?
Die Antwort hierzu finden Sie in diesem eBook.


„Unstrukturierte Daten sind in fast allen Unternehmen eine tickende Zeitbombe“, warnt Gregor Bieler, CEO EMEA bei APARAVI. „Sie wachsen im Schnitt fünfmal so schnell wie strukturierte Daten. Wer sie jetzt nicht in den Griff bekommt, geht unkalkulierbare Risiken ein.“

https://aparavi.eu/de

Anzeige

Weitere Artikel

Jetzt die smarten News aus der IT-Welt abonnieren! 💌

Mit Klick auf den Button “Zum Newsletter anmelden” stimme ich der Datenschutzerklärung zu.