OCR ist keine Magie

Vom Science-Fiction-Autor Arthur C. Clarke stammt das Zitat: „Jede hinreichend fortschrittliche Technologie ist von Magie nicht zu unterscheiden.“ Der Editiermodus für gescannte Dokumente unserer ScanSnap-Scanner hat natürlich nichts mit Magie zu tun, aber manchmal fragen sich Nutzer schon „Wie habe ich das jetzt eigentlich gemacht?“. Die Technologie, die hinter solchen kleinen „Wundern“ steckt, heißt OCR, Optical Character Recognition, auf Deutsch: Texterkennung. Das ist ein ziemlich nützliches Werkzeug, mit dem Sie Ihren Papierkram effizienter bearbeiten können, sobald Sie ihn in die digitale Welt entlassen haben.

Die elektronische Texterkennung hat eine überraschend lange Geschichte, die sich fast 80 Jahre in die Vergangenheit erstreckt. Entsprechend vielfältig sind ihre Anwendungsgebiete. Das ist auch bei unseren ScanSnap Scannern nicht anders. Die Texterkennung erfüllt dort folgende Zwecke:

  • Dokumente sind sofort nach dem Scannen durchsuchbar
  • Formulare und Tabellen auf Papier lassen sich direkt in digitale Excel-Tabellen oder Word-Dokumente umwandeln
  • Kontaktdaten auf Visitenkarten lassen sich schnell digitalisieren und weiterverarbeiten
  • Wichtige Schlüsselwörter werden automatisch in PDF-Dateien eingebettet

Die Texterkennung findet automatisch statt. Dies passiert gleichzeitig mit der Erstellung des digitalen Abbilds eines Dokuments. Dessen Text wird dabei analysiert und anschließend in Metadaten umgewandelt. Mit diesen Daten können Sie Ihre digitalen Unterlagen schnell, effizient und mit wenig Aufwand bearbeiten und verwalten. Und das bedeutet: Sie haben endlich Zeit für die wirklich wichtigen Dinge.

Das könnte dir auch gefallen Mehr vom Autor