Ocr

Aus Primatenwiki
Zur Navigation springen Zur Suche springen

Für die Texterkennung gibt es unter Linux unter anderem das Programm gocr. Ich weiss nicht, ob es bessere gibt, aber für meinen Gebrauch reicht dieses vollständig. Um Text aus einem jpg-Bild herauszubekommen ist djpeg und gocr folgendermassen aufzurufen:

# djpeg -pnm -gray <<file>> | gocr -c "0123456789+>"

Dies liest allen Text aus dem File <<file>> mit dem Alphabet "0123456789+>" aus.