Test OmniPage Ultimate
30.08.2013, 12:00 Uhr
erspart Strafarbeit
Texterkennungs-Software besitzt kaum noch Optimierungspotenzial. Auch OmniPage Ultimate liefert im Test nur marginal bessere Leistung. Für Strafarbeiten kann sich die Investition lohnen.
Unternehmen arbeiten heute vermehrt daran, ihre Papierarchive in maschinenlesbare Dokumente zu konvertieren. Eine OCR-Software (Optical Character Recognition) wie OmniPage wandelt die Scans in bearbeitbaren Text um. Dabei müssen die Originale nicht zwingend auf einem Flachbettscanner gelegen haben, ein Foto genügt oftmals auch. OmniPage-Hersteller Nuance verspricht, die Erkennungsgenauigkeit auf Digitalbildern um 25 Prozent verbessert zu haben. Der Test bestätigt dieses Versprechen annähernd. Die «Ultimate» genannte Version 19 ermittelt beim Einlesen der Vorlage, ob es sich um einen Scan, ein PDF oder ein Foto handelt. Anschliessend startet die Korrektur: Schief gescannte Originale werden automatisch gerade gerichtet, perspektivische Verzerrungen entfernt und der Kontrast erhöht. Bei einer Doppelseite wird erst die eine, dann die andere Hälfte verarbeitet. Diese Optimierungsschritte verbessern die Leistung bei der folgenden Texterkennung bei guten Vorlagen nur marginal, bei schlechten Fotos mit viel Schlagseite aber stark. Die Vorlagen mit niedriger Auflösung (bei Digitalbilder sind es meist 72 dpi) verarbeitet die Software ausserdem schneller als der Vorgänger. Nächste Seite: Strafarbeit und Hörbücher Beim Auslesen von Text auf qualitativ besseren Scans (300 dpi und mehr) lässt sich OmniPage mehr Zeit als bisher. Die Erkennungsleistung ist dabei jedoch nahezu identisch (hoch). Weiterhin Probleme bereiten der OCR Akzente bei mehrsprachigen Texten und hochgestellte Ziffern. Die Fehlerquote variiert zwischen 5 und 20 Prozent. Noch höher ist die Fehlerrate bei Fraktur und handgeschriebenen Druckbuchstaben. Bei allen Tests schlägt sich allerdings die Konkurrenz (Acrobat, FineReader, Readiris) nicht besser.
Wie die Wettbewerber fehlerlos arbeitet OmniPage bei Dokumenten, bei denen das manuelle Erfassen aufwendig wäre – Bilanztabellen oder Zahlenkolonnen sind Beispiele. Wenn der Scan-Operator die Originale mit hoher Qualität (300 dpi oder mehr) digitalisiert, erkennt die OCR im Test alle kryptischen Abkürzungen und Zahlenreihen. Statt Stunden fürs Abtippen benötigt die Software rund drei Sekunden pro A4-Seite. Auch ein kleingedrucktes Vertragsdokument ist innert 26 Sekunden nahezu fehlerfrei eingelesen. Für die manuelle Korrektur von verarbeiteten Dokumenten bringt OmniPage seit zehn Jahren eine Vorlesefunktion mit. Mittlerweile lassen sich gescannte Texte als MP3 abspeichern, so dass der Anwender per Mausklick ein persönliches Hörbuch generieren kann. Ausserdem neu gibt es einen Export für das ePub-Format, das von handelsüblichen eBook-Lesegeräten sowie dem iPad unterstützt wird. Wer sich beispielsweise ein umfangreiches PDF-Archiv als MP3-Hörbuch oder ePub konvertieren lassen will, kann dafür das neue Launchpad verwenden. Auf dieser Oberfläche klicken sich Anwender Workflows für wiederkehrende Arbeitsschritte zusammen, wie etwa die Abfolge: PDF laden, Texterkennung, speichern als MP3. Optional lädt OmniPage die fertige Datei auch in einen Cloud-Speicher wie Dropbox, Evernote oder Google Drive. Für das Unternehmensumfeld sind Schnittstellen zu HP (Autonomy), Microsoft sowie OpenText vorhanden. Fazit: Beim professionellen Erfassen von Papierarchiven in elektronischen Speichern leistet OmniPage schnelle und gute Dienste. Die geringen Leistungsverbesserungen und die wenigen neuen Funktionen rechtfertigen das Upgrade aber nicht.
! TABELLE !