Anzeige

Datenanalyse

Durch die Kombination neuronaler Netze und verteilter Softwarearchitekturen entsteht die nächste Generation ECM-/EIM-Software (Enterprise Content Management, Enterprise Information Management) und hebt die Latte für smarte Lösungen auf ein neues Niveau.

Eine Menge Informationen schlummern in den Datenbeständen deutscher Unternehmen. Vor allem Archivsysteme, die seit vielen Jahren von unterschiedlichen Anwendungen bedient wer­den, enthalten Daten, deren Informationsgehalt nicht ansatzweise nutzenbringend ein­ge­setzt wird. Das liegt in erster Linie daran, dass klassische Archiv- oder auch ECM-Systeme Dokumentinformationen nur auf Kopfebene er­fas­sen. Detaillierte Inhalte sind im Normalfall nicht abrufbar oder nur durch ungenaue, teure und aufwendige Prozeduren wie beispiels­weise einer Volltextindizierung zu finden. Ganz zu schweigen von einer strukturierten Auf­be­reitung dieser Informationen zur weiterführenden Verarbeitung. Eine technische Lösung das künftig zu ändern, liefert das IT-Unternehmen Deepshore aus Hamburg.

Software wandelt Daten um

Die Hamburger Software-Ingenieure haben auf Basis von Open-Source-Projekten und Google-Technologien eine Software entwickelt, die in der Lage ist, auch unstrukturierte Bildformate wie beispielsweise TIFF oder BMP zunächst in les- und analysierbare Daten umzuwan­deln und damit Inhalte zu erkennen. Diese Informationen können dann mittels eines neuro­nalen Netzes automatisch analysiert und klassifiziert werden. Je nach Anforderung ist es möglich, auf diese Weise gewonnene Erkenntnisse auch so zu speichern, dass nicht auf die ge­wohnte Compliance-Fähigkeit klassischer ECM-Systeme verzichtet werden muss. Diesen Teil der Lösung ergänzt Deepshore mit seinem verteilten Cloud-Archiv auf Basis von Blockchaintechnologie. Deepshore arbeitet als Innovation Hub des ECM-Spezialisten nextevolution – ebenfalls aus Hamburg – und hat das verteilte Cloud-Archiv 2019 im Rahmen einer Forschungskooperation mit dem Handels­kon­zern METRO entwickelt.

Infrastrukturelle Flexibilität 

Einer der großen Vorteile gegenüber herkömmlichen technischen Ansätzen in diesem Bereich ist die infrastrukturelle Flexibilität der Lösung. Durch die eingesetzte Container­tech­no­logie kann Software vollständig als Service in einer Cloud, im eigenen Rechenzentrum oder auch hybrid als Mischung aus beidem, betrieben werden. Aufwendige Installationen werden dadurch überflüssig, und bei richtiger Konfiguration kann mit steigender Last der Ausbau eines Systems nahezu vollautomatisch skaliert werden.

Nach der Entwicklung kann das neuronale Netz nun mit Echtdaten trainiert werden. Deepshore verspricht sich durch das neue System im trainierten Zustand we­sent­lich bessere Erkennungsraten im Vergleich zu bisherigen Lösungen – wie etwa einer klassi­schen OCR (Optical Character Recognition – automatisierte Texterkennung in Bildern) in Kom­bination mit vordefinierten Suchmustern auf Basis von Regular Expressi­ons. Darüber hinaus werden in Zukunft die gesamten Betriebskosten der Dokumentenerken­nung und Klassifizierung signifikant geringer sein.

Neuronale Netze

Bild: Prinzip Neuronale Netze (Quelle Andreas Otto, sense:ability Berlin)
 

Trainingslager für künstliche Intelligenz

So avanciert zum Beispiel eine lästige Datenmigration zum Trainingslager für künstliche In­tel­ligenz. Durch die technische Ausprägung als Service kann das „Training“ dabei fast voll­ständig entkoppelt von einer Migrationsinfrastruktur laufen. Elegant ist dieser Ansatz vor allem deshalb, weil das System mit jedem Trainingseinsatz das Prinzip besser „versteht“, dazulernt und sich mit diesen Trainingsergebnissen weiter optimieren lässt. Wenn das System zum Beispiel mit den anonymisierten Daten verschiedener Unternehmen einer Branche „ge­füttert“ wird, entsteht eine Branchenoptimierung, die allen Anwenderunternehmen nützt. In der Frühphase des Trainings ist es wichtig, das Netz korrekt zu initialisieren. Das Konzept kann dabei mit dem Training einer Sportmannschaft verglichen werden. Auch hier ist ein Trainer gefragt, der mit der Grundaufstellung und dem Herstellen körper­li­cher Fitness die Basis für taktische Feinheiten und den weiteren Erfolg legt.

Das Einsatzgebiet dieser neuronalen Services ist nicht auf einzelne Branchen beschränkt. So kann quasi jeder Datenbestand oder jedes Archivsystem dazu genutzt werden, entspre­chen­de Informationen zu extrahieren und gewinnbringend einzusetzen.

Als Experte für die Verarbeitung von Compliance-Daten und als Thinktank des IBM Partners nextevolution hat Deepshore die eigene Lösung bereits heute vollständig in die neue IBM Automation Platform for Digital Business integriert. Damit können IBM-Kunden beispielsweise den IBM Business Automation Content Analyzer verbinden, um weiteren Mehr­wert aus vorhandenen Datenströmen nutzbar zu machen.

www.deepshore.de


Newsletter Anmeldung

Smarte News aus der IT-Welt

Sie möchten wöchentlich über die aktuellen Fachartikel auf it-daily.net informiert werden? Dann abonnieren Sie jetzt den Newsletter!

Newsletter eBook

Exklusiv für Sie

Als Newsletter-Abonnent erhalten Sie das Booklet „Social Engineering: High Noon“ mit zahlreichen Illustrationen exklusiv und kostenlos als PDF!

 

Artikel zu diesem Thema

KI Security
Mai 25, 2020

KI-getriebene Security: Automatisierte Bedrohungsanalyse in Sekundenbruchteilen

Unternehmen befinden sich in einem ständigen Kampf gegen immer raffinierter werdende…
Programmierer
Mär 13, 2020

Teilen statt besitzen - mit offenen Sourcecodes zum Erfolg

Es war ein mutiger Schritt, den in dieser Form zuvor noch keiner gewagt hat. Statt auf…

Weitere Artikel

Input und Output Management

In the loop: Input und Output Management ganzheitlich verknüpfen

In der Kommunikation gilt: Des einen Input ist des anderen Output – und umgekehrt. Im Sinne eines ganzheitlichen Informationsmanagements sollten dokumentenbasierte Prozesse allerdings als „Closed Loop“ technisch und organisatorisch verknüpft sein.
Datenmangement

Welcome in the data jungle

Trrotz steigender Datenflut sitzen viele Unternehmen aus informationstechnischer Sicht immer mehr auf dem Trockenen. Der Zugriff auf Inhalte in Dokumenten und auch unstrukturierten Daten stellt für sie eine große Herausforderung dar.
Dokumentenmanagement

Digitale Dokumentenerfassung mit Kontext für mehr Durchblick

Es wirkt unglaublich, dass im Jahr 2020 noch immer Papierdokumente aller Art vielen Finanz-Teams Kopfschmerzen bereiten. Aber die Realität ist, dass Unternehmen sämtlicher Branchen auch heutzutage mit dem Sortieren, Verarbeiten und Verwalten einer Flut von…
Digital Office

Wie realistisch ist der Weg zum Digital Office im Mittelstand?

Rechnungen werden digitalisiert, Akten elektronisch archiviert, Teams arbeiten von unterschiedlichen Standorten aus gemeinsam an Dokumenten: Das «Digital Office» erobert nun auch immer stärker den Mittelstand – wenngleich auch nicht unbedingt im Eiltempo.

Anzeige

Newsletter Anmeldung

Smarte News aus der IT-Welt

Sie möchten wöchentlich über die aktuellen Fachartikel auf it-daily.net informiert werden? Dann abonnieren Sie jetzt den Newsletter!

Newsletter eBook

Exklusiv für Sie

Als Newsletter-Abonnent erhalten Sie das Booklet „Social Engineering: High Noon“ mit zahlreichen Illustrationen exklusiv und kostenlos als PDF!