ETH-Spin-off 23.06.2020, 06:24 Uhr

Eine Software für alle Dokumente

Rechnungen erfassen, Lieferscheine kontrollieren, Spesenbelege prüfen: solch repetitive Aufgaben füllen die Tage vieler Büroangestellten. Das ETH-​Spin-off BLP Digital möchte sie entlasten – mit Hilfe von Algorithmen.
Das Team von BLP Digital mit den Brüdern Sven Beck (2.v.l.) und Tim Beck (2.v.r.)
(Quelle: Stefan Weiss/ETHZ)
Manchmal sind Computer auf einem Auge blind. Etwa dann, wenn sie Dokumente erkennen sollten, die nicht speziell für sie strukturiert sind. «Computer lesen von oben links nach unten rechts. Abstände oder Fettgedrucktes erkennen sie nicht», sagt Tim Beck, CEO des ETH-​Spin-offs BLP Digital.
Ein grosses Problem stellen für die Rechner Tabellen dar. Denn die darin enthaltenen Werte haben nur eine Bedeutung, wenn man ihre Position kennt – also in welcher Zeile und Spalte sie eingetragen sind. Beck und sein Team haben sich zum Ziel gesetzt, den Rechnern das Erkennen von Tabellen und allen anderen semi-​strukturierten Informationen in Dokumenten beizubringen.
Rechnungen, Lieferscheine, Spesenabrechnungen, Mietverträge, Lebensläufe, E-​Mails: Das mögliche Anwendungsgebiet einer solchen Software ist riesig, das Potenzial enorm, wie Beck vorrechnet: So bearbeitet ein grosser Schweizer Krankenversicherer 13 Millionen Rechnungen pro Jahr. Und wenn ein Händler Bananen in Südamerika bestellt, entstehen daraus 17 Dokumente, bis sie in der Schweiz im Laden liegen.

Software lernt dazu

«Solche Prozesse wollen wir zunehmend automatisieren und die Mitarbeiter dadurch entlasten», sagt Tim Beck. Als Fernziel hat der 28-​Jährige eine Rundum-​Software im Kopf, die es erlaubt, sämtliche gängigen Dokumente fehlerlos zu automatisieren. Die Basis dafür ist maschinelles Lernen: Die Software soll mit Hilfe grosser Datenmengen immer besser werden. Von diesem hoch gesteckten Ziel ist man natürlich noch ein Stück entfernt. Doch dieses Ziel im Kopf zu haben, sei wichtig, sagt sein zwei Jahre jüngerer Bruder und Mitgründer Sven Beck.
«Wir versuchen unsere Programmcodes von Anfang an generalisierend zu schreiben. So können wir die gleiche Software später für unterschiedliche Anwendungen benutzen», sagt Sven Beck, der sich in seinem Master an der ETH in Robotics, Systems and Control mit der Umgebungserkennung von mobilen Robotern beschäftigte.
Die der Software zu Grunde liegenden Algorithmen stammen aus zwei Masterarbeiten an der ETH. An diesen forschten die Brüder Beck zusammen mit dem erfahrenen ex-​Google-Manager Pedro Marques und ihrem Team von ETH-​ und EPFL-​Abgängern in der Folge weiter, ehe sie im Herbst 2019 eine Firma gründeten.
Die raffinierten Codes sind es, die das Startup von der Konkurrenz unterscheiden sollen. Denn die gibt es: alleine in der Schweiz haben sich zwei weitere Startups zum Ziel gesetzt, Dokumente automatisch zu erkennen. Was bis heute aber noch niemand ausreichend gelöst hat, ist das Erkennen von Tabellen, sozusagen die Königsdisziplin des Fachs.

Autor(in) Andres Eberhard, ETH-News



Das könnte Sie auch interessieren