Wie intelligente Dokumente für eine autonome Archivierung sorgen

Das intelligente Dokument

Es sind nicht die Straße oder der Zielort, die das Auto zum autonomen Fahren befähigen, sondern das Auto selbst. Wäre es beispielsweise die Straße, würde es sich wie beim Schienenverkehr verhalten und wäre weit weg von jeglicher freien Bewegung und Flexibilität. Genau dies lässt sich auch auf das Thema Dokumentenarchivierung übertragen: Weder die Software-Anwendung, in der das Dokument erstellt und bearbeitet wird, noch der Speicher, in dem das Dokument archiviert wird, können die Archivierung steuern. Eine dritte Ebene, so wie es häufig praktiziert wird – ein DMS (Dokumenten Management System) oder ECM (Enterprise Content Management System) – wäre ebenso eine übergeordnete Intelligenz. Diese bringt erstens weiteren „Systemballast“ mit sich und raubt zweitens ebenfalls Flexibilität. Der Grund: Systeme gehen, aber die Dokumente bleiben. Der Austausch einer Instanz wird häufig zum Großprojekt für die IT.

Das intelligente Dokument ist die neue Lösung für diesen Flickenteppich der Systeme. Dokumente tragen diverse Informationen in sich, wie beispielsweise den Content selbst, aber auch Meta- und Kontextbezogene Daten. Die Metadaten etwa stammen aus den führenden Anwendungen, werden dem Dokument sozusagen „aktiv“ mitgegeben. Beim Abschalten einer Anwendung, gehen diese Daten im Falle des intelligenten Dokuments nicht mehr verloren. Vielmehr machen sie das Dokument zu einer von der Anwendung unabhängigen, autonomen Instanz, die jederzeit in anderen Anwendungen angezeigt und bearbeitet werden kann.

Autopilot/Autopilotin

Wer macht das Dokument intelligent? Ein System, das die Daten des Dokuments an geeigneter Stelle erfasst, auslesen und weitergeben kann, um die „freien“ Dokumente sozusagen in die richtigen Bahnen zu lenken. Die Managerin oder Autopilotin, die diese Anforderungen realisiert, nennt KGS tia – the intelligent archive. Schnittstellentechnisch setzt das intelligente Archiv dabei auf den Content Management Interoperability Services-Standard (CMIS). Anders als etwa die SAP ArchiveLink-Schnittstelle ermöglicht er die Verwaltung von Metadaten; eine weitere dafür geeignete Schnittstelle ist OData, – verbreitet vor allem im SAP-Umfeld, aber auch bei Anwendungen wie MS SharePoint.

tia schafft über das intelligente Dokument in der Folge einen Single Point of Truth (SPoT) für Dokumente jeder Art. Ganz gleich, in welcher Anwendung gearbeitet wird – auf die Dokumente kann von überall zugegriffen werden.

Autonome Archivierung

Das Archiv der Zukunft muss Muster selbst erkennen und vorausschauend Optimierungsvorschläge bringen. Übervolle Archive sollten reorganisiert, Vorschläge zum Löschen gemacht, teure Speicherplätze entlastet und günstiger Speicher umfänglich genutzt werden. Dies alles jedoch nicht wahllos, sondern diversen Informationen des intelligenten Dokuments folgend. Ein rechtlich relevantes Dokument muss demnach anders „gelagert“ werden als eine Alltagsnotiz. Jedes Kriterium, jede Metainformation, jede Frist – das alles kann unmöglich jedem einzelnen Dokument „aktiv“ via Metadaten mitgegeben werden. Auf dem Weg zu einer vollständigen Automatisierung der Prozesse aber benötigt das intelligente Archiv genau diese Informationen, die es lernen lassen und Handlungen auslösen. Die spannendsten Informationen sind dabei häufig diejenigen, die das intelligente Dokument selbst sozusagen „inaktiv“ erlebt und die es inhaltlich ausmachen. Ein lernfähiges System kann diese Daten aufnehmen und auf deren Grundlage vielleicht sogar besser – sehr wahrscheinlich jedoch verlässlicher und unfehlbarer – handeln, als der Mensch.

Diese Fähigkeiten lassen sich über Statistics realisieren. Zunächst beschreibt Statistics nur die Disziplin, die die Erfassung, Organisation, Analyse, Interpretation und Darstellung von Daten betrifft. Es ist jedoch die Basis für regelbasierte Operationen und ebnet den Weg zu einem selbstlernenden System (Machine Learning) und den vorausschauenden Services.

Ordnung muss sein

Die Kontext- und Contentdaten sind das eigentliche Gold, nach dem ein intelligentes Archiv schürft. Ein Beispiel sind Nutzungsdaten, von wem, wann und wie oft wurde das Dokument zurück aus dem Archiv auf den Bildschirm geholt. Dokumente, die beispielsweise fünf Jahre nicht geöffnet wurden, können zum Löschen vorgeschlagen oder automatisch und transparent auf einen günstigeren Speicher umgezogen werden.

Technisch funktioniert dies über sogenannte Data-Lakes. Wie der Begriff schon andeutet, handelt es sich wahrlich um einen See von Daten, also einen sehr großen unstrukturierten Datenspeicher. Mit Zugriff auf diese Lakes können Analysen und diverse Operationen durchgeführt werden. Dabei werden Daten erst strukturiert oder gegebenenfalls umformatiert, wenn sie konkret benötigt werden. Neben text- oder zahlenbasierten Daten können Data-Lakes auch Bilder, Videos oder andere Datenformate aufnehmen. Ein Content bezogenes Beispiel aus dem Personalbereich und dem Datenschutz könnte demnach sein: Ex-Mitarbeiter X verlangt eine Löschung aller Fotos mit seinem Konterfei von Betriebsfeiern und offizieller Nutzung. Nun muss entsprechend auf Bilder- und Videodaten zurückgegriffen werden aus denen entsprechende Inhalte extrahiert werden.

Viele große und mittelständische Unternehmen haben bereits Data-Lakes beziehungsweise ganze Datensysteme für ihre Business Intelligenz Anforderungen aus anderen Bereichen im Einsatz. Die autonome Archivierung mit tia zeichnet sich dadurch aus, dass sich die Archiv-Management-Fähigkeiten auch flexibel in diese bestehenden Systeme von zum Beispiel Google, AWS und SAP einfügen lassen.

Johanna Zinn, Head of Marketing, KGS Software, www.kgs-software.com

Benjamin Schröder, Head of R&D, KGS Software, www.kgs-software.com

Wie intelligente Dokumente für eine autonome Archivierung sorgen

Das intelligente Dokument

Autopilot/Autopilotin

Autonome Archivierung

Ordnung muss sein

Artikel zu diesem Thema

Weitere Artikel

Veranstaltungen

Neueste Artikel

Gericht: Bei Facebook-Datenleck kein Anspruch auf Schadensersatz

IT-Event-Management als Ihr strategischer IT-Kompass!

ChatGPT für Ingenieure: KI verändert die Industrie

Bitdefender erweitert seine Managed-Detection-and-Response-Dienste

Netflix gewinnt mehr als 9 Mio. Abonnenten hinzu

Meistgelesene Artikel

Forrester: DeepL sorgt für Einsparungen in Höhe von 2,8 Millionen Euro

Digitale Bildung: Lehrkräfte sind die Treiber der Schuldigitalisierung

So funktioniert der Betrug mit Fake-Profilen von Führungskräften

Das sind die globalen Brennpunkte für Cyberkriminalität

Gericht: Bei Facebook-Datenleck kein Anspruch auf Schadensersatz