chevron_left
chevron_right
Start-up

Automatische Datenextraktion aus Dokumenten mittels KI

Automatische Datenextraktion aus Dokumenten mittels KI
Das Team von BLP Digital.
Bild: Stefan Weiss/ETH Zürich

Rechnungen und Spesenbelege erfassen oder Lieferscheine kontrollieren ist nicht nur mühsam für die beteiligten Mitarbeiter, sondern kostet Unternehmen eine Menge Geld. Mit Hilfe von künstlicher Intelligenz will das ETH-Spinoff-Unternehmen BLP Digital das zukünftig ändern.

Wer denkt, dass Computer heutzutage in der Lage sind, automatisch Daten aus Dokumenten auszulesen, liegt leider weit daneben. Immer noch müssen Büroangestellte Daten in Dokumenten in mühsamer und repetitiver Administrationsarbeit manuell suchen und in ein Computersystem eingeben.

Das Problem sind dabei Tabellen. Dem Menschen ermöglichen solche Strukturen zwar ein schnelles Verständnis über den Dokumenteninhalt. Bei Computern ist jedoch genau das Gegenteil der Fall. So verstehen bisherige Softwareprogramme nur rund 80 Prozent der Daten automatisch. 

Die Problematik ist in allen Branchen omnipräsent. Doch insbesondere in der produzierenden Industrie verschlingt sie enorm viele Ressourcen. Dort müssen Mitarbeitende eine Vielzahl von Lieferscheinen und Eingangsrechnungen aufwendig bearbeiten.

Die Brüder Tim und Sven Beck müssen es wissen. Sie stammen aus einer Unternehmerfamilie, welche eine ERP-Software für Unternehmen in genau dieser Branche herstellen. Mit ihrem Industriewissen und technologischem Know-how entschieden sie sich 2019 zusammen mit dem ehemaligen Google-Datenextraktionschef, Pedro Marques, BLP Digital zu gründen.

Machine Learning

Die Lösung, welche BLP Digital in enger Zusammenarbeit mit der ETH Zürich entwickelt hat, basiert auf Machine Learning: Mit Hilfe von grossen Datenmengen verbessert sie das System stetig selber und transferiert dabei das Wissen von bereits verarbeitenden Dokumenten auf neue. Das Jungunternehmen setzt dabei auf eine neuartige Kombination aus zwei Technologien: Bild- und Spracherkennung.

Während einige Algorithmen den Text analysieren, untersuchen andere das Dokumentenbild auf Pixelebene. «Damit können wir den Text in Bezug zu seiner Position im Dokument setzen, wie es ein Mensch tun würde», sagt Sven Beck, Co-CTO des Unternehmens. 

Momentan fokussiert sich das Unternehmen mit seinen zehn Mitarbeitenden auf die Automation des Prozesses von der Bestellung bis zur Eingangsrechnungsprüfung.  «Bis Ende dieses Jahr wollen wir auch die Auftragsanlage im Vertrieb automatisieren, bevor wir dann Anfang nächstes Jahr auf weitere Dokumententypen für neue Branchen expandieren», sagt CEO Tim Beck über die nächsten Meilensteine. 

Denn eines sind sich die Unternehmer sicher: Die Coronakrise birgt ein grosses Potenzial, jetzt administrative Prozesse zu digitalisieren und die richtigen Kosteneinspar-Potenziale zu erschliessen. Damit wappnen sich insbesondere KMUs rechtzeitig für das einsetzende Wirtschaftswachstum nach der Krise.

http://blp-digital.com