Path:
Volume Heft 5

Full text: Bibliotheksdienst (Rights reserved) Issue38.2004 (Rights reserved)

NOTIZEN Da der Anwender die OCR-Engine selbst trainieren kann, hat er die Möglich- keit, seine eigene OCR-Bibliothek zu erstellen, diese auch bei späteren Pro- jekten wieder einzusetzen. Gelernte Zeichen werden unmittelbar bei allen Zei- chen des zu bearbeitenden Dokumentes berücksichtigt. Mit wachsender Komplexität der zu lesenden Zeichen oder Symbole wird die Leistungsfähig- keit dieser Technologie immer deutlicher: Firmenlogos, asiatische Schriftzei- chen, von Hand geschriebene Ziffern oder Buchstaben oder auch Unterschrif- ten ­ all dies kann gelesen werden. Ebenso Barcode, Dot-Code oder Data- Matrix-Code, der z. B. in der Halbleiter-Industrie zur Wafer-Identifikation ein- gesetzt wird. Darüber hinaus erfasst die Technologie von B.I.T. nicht nur die Koordinaten eines jeden Zeichens, sondern auch die Koordinaten der verschiedenen Bau- steine einer Seite (Tabellen, Bilder, Diagramme usw.), kann diese somit auch unterscheiden, ausschneiden und einer adäquaten Bearbeitung zuführen. An- schließend können diese Elemente wieder pixelgenau an der ursprünglichen Stelle in das Dokument eingefügt werden. Interessant u. a. für Internetpräsen- tationen. Aus obiger Beschreibung ergeben sich vielfältige Einsatzmöglichkeiten, ins- besondere in den Bereichen Verwaltung, Industrie und Medizin: · Bearbeiten von (Papier-)Formularen: Rechnungen, Lieferscheine, Schecks · Bearbeiten und Transferieren von Listen und Tabellen ­ in Teilen oder als Ganzes · Sicherer Datentransfer im Inter- und Intranet · Qualitätskontrolle · Therapeutisches Hilfsmittel in der Heilpädagogik und der Rehabilitation · Zugangs- und Zugriffskontrolle (vertrauliche Dateien / Laboratorien) Dies zeigt, dass die Technologie von B.I.T. höchst flexibel und in vielen Ar- beitsbereichen für unterschiedlichste Aufgabenstellungen einsetzbar ist. Im nächsten Kapitel wird aufgezeigt, wie auch heute nicht mehr übliche Schrift- typen gelesen werden können. III. Die Anwendung: BIT-Fraktur ­ OCR nicht nur für Fraktur BIT-Fraktur ist ausgelegt zum Lesen von Dokumenten in Fraktur. Fraktur- Dokumente sind häufig mit Qualitätsdefiziten behaftet: Zeichen sind in mehre- re Fragmente zerfallen oder sind unvollständig, benachbarte Zeichen einer Zeile berühren sich, benachbarte Zeilen überlappen, Zeichen aus benachbar- ten Zeilen berühren sich, Zeilen sind schief oder hängen durch, Absätze sind unterschiedlich ausgerichtet. Hinzu kommt die Vielzahl unterschiedlicher Aus- prägungen einzelner Zeichen. Schmutz und Flecken auf den Originalen er- BIBLIOTHEKSDIENST 38. Jg. (2004), H. 5 679
Top of page

Note to user

Dear user,

In response to current developments in the web technology used by the Goobi viewer, the software no longer supports your browser.

Please use one of the following browsers to display this page correctly.

Thank you.