Mit vertrauten Augen sehen – die Software lernt den Benutzer kennen
Ähnlich wie digitale Sprachassistenten sind auch gute OCR-Programme lernende Systeme: Manche verlangen vor der eigentlichen Erkennung einen Probelauf, bei dem Sie als Benutzer bestimmte Zeichenfolgen mit Ihrer Handschrift abschreiben sollen, damit das Programm Ihre graphischen Eigenarten kennenlernt. Für jeden neuen Benutzer wird dann ein weiterer Lern-Durchlauf benötigt.
0 oder O – für die Software kein Unterschied
Viele Schriftzeichen sehen sich im lateinischen Alphabet ähnlich, etwa das große „I“ und das kleine „l“ oder die Null und der Großbuchstabe „O“. Der Computer weiß nicht, ob in Zeichenfolgen wie „O2-Tank“ oder „H0-Maßstab“ die Ziffer oder der Buchstabe gemeint sind. Moderne OCR-Lösungen enthalten deshalb eine Wortliste aus der Muttersprache des Benutzers und wissen so, dass beispielsweise im Formelzeichen für Sauerstoff ein O stehen muss und keine Null.
Mit Fremdsprachen, die nicht speziell trainiert wurden, kommt die Software deshalb meist schlechter zurecht. Hier muss sie bei vielen Wörtern schlicht raten, was gemeint sein könnte.
Anschließende Grammatikprüfung
In einem weiteren Arbeitsschritt erkennt das OCR-Programm oder die nachgeschaltete Textverarbeitung auch Grammatik- oder Logikfehler im Text. Tauchen solche Fehler gehäuft auf, kann beispielsweise ein Positionierungsfehler vorliegen. Dieses Problem tritt meist dann auf, wenn etwa wenn Zeilen zweier benachbarter Textspalten vom Programm irrtümlich als ein fortlaufender Text angesehen und zusammengefügt wurden oder Fußnoten als Bestandteil des Fließtextes eingebaut werden.