Software Frage tesseract OCR

Dieses Thema im Forum "Tech & FAQ Forum" wurde erstellt von ATLAN, 8 Mai 2018.

  1. ATLAN

    ATLAN Bekanntes Mitglied

    Registriert seit:
    22 Juni 2001
    Beiträge:
    1.860
    Es gibt zu Tesseract OCR einige GUIs wie gimagereader.
    Dort lassen sich mit STRG und Maus eigene Bereiche definieren,
    wo nur der Text gescannt werden soll.

    Tesseract OCR selbst ist jedoch ein reines Command Line Programm
    und nicht so einfach zu verstehen, da die Dokumentation recht mager
    ausfällt.

    Ich frage mich momentan, wie die Befehle lauten oder wie man die Parametern
    für nur bestimmte Bereiche eines Bildes zum Scannen des Textes übergibt?

    Meistens findet man nur Angaben dazu, wie man eine gesamte Bilddatei übergibt
    und in eine Text Datei ausgibt und halt mit dem Parameter -l deu die Sprache angibt.
    Aber dabei würde die gesamte Bild automatisch analysiert, was ich nicht möchte.
    Ich möchte halt einen bestimmte Bereich anhand von Koordinaten im Bild festlegen,
    der nach Text untersucht wird.

    Auch würde mich interessieren, ob man vorab bestimmte Strukturen anhand
    von Farben bei Tesseract ausschließen kann? Also daß z.B. alles Rötliche generell
    bei der Erkennung ignoriert würde oder man mit einem Parameter festlegen kann,
    daß nur graue bzw. schwarze Elemente als Text auszuwerten sind und somit andere
    Farben ignoriert werden.

    Vielleicht hat jemand hier Erfahrung mit Tesseract OCR.
    Danke schon mal.

    Anmerkung:
    Das Bild möglicherweise vorab zu zerlegen und dann Tesseract zu übergeben,
    ist mir auch schon gekommen. Aber ich hätte gern den eleganteren Weg gewußt,
    ohne zusätzlichen Datenmüll Bilderschnipsel zu produzieren.
    Zuletzt bearbeitet: 8 Mai 2018
  2. eumel_1

    eumel_1 Der Reisende

    Registriert seit:
    2 Juni 2002
    Beiträge:
    9.288
  3. ibinsfei

    ibinsfei Team (Technik) Mitarbeiter

    Registriert seit:
    12 August 2001
    Beiträge:
    6.388
  4. ATLAN

    ATLAN Bekanntes Mitglied

    Registriert seit:
    22 Juni 2001
    Beiträge:
    1.860
    @eumel_1
    die Seite hatte ich auch schon gefunden und gelesen. Bin aber nicht konkret darin fündig geworden,
    da dort kein direkter Befehl aufgeführt wird, um einen Bereich festzulegen. Einzig weiter unten gibt
    es einen Hinweis auf ein TVS Config File, welches ich aber nicht so richtig durchschauen, wo aber
    scheinbar Zeilenwerte festgelegt werden können. So richtig erschließt sich mir das gerade nicht.

    Ich hätte gern einfach einen Befehl gehabt, wo man in der Kommandozeile
    einfach /x 5 /Y 20 /Width 200 /Height 100 anhängt. Doch dies scheint es so
    nicht zu geben.