Path:
Volume Heft 6

Full text: Bibliotheksdienst (Rights reserved) Issue 43.2009 (Rights reserved)

Themen Technik 640 Bibliotheksdienst 43. Jg. (2009), H. 6 Abb. 10: Ornamente, Abbreviaturen, Zierstriche etc. Was sind nun Ansätze zur Problemlösung und zur praktischen Umsetzung? Es stellt sich hierbei die Frage, welche Prozessmodelle für die OCR-Erschließung solcher historischer Dokumente bisher entwickelt wurden. Was sind die Charak- teristika der einzelnen Modelle? Um jedoch in die Thematik einzuführen, sollte zunächst hinterfragt werden, welche Komponenten eine OCR-Software grund- sätzlich enthalten muss. Zur Verdeutlichung kann folgendes abstrakte Modell für einen Texterkennungsprozess herangezogen werden: Abb. 11: Abstraktes Modell für einen Texterkennungsprozess Abstraktes Modell für einen Texterkennungsprozeß Erstellung einer Rastergraphik/ Binarisierung Segmentierung/ Strukturerkennung (Abbildungen, Linien etc.) OCR (Mustervergleich) Kontextanalyse (Intelligent Character Recognition) Lexikon Ausgabedatei XML etc. (Volltext)
Top of page

Note to user

Dear user,

In response to current developments in the web technology used by the Goobi viewer, the software no longer supports your browser.

Please use one of the following browsers to display this page correctly.

Thank you.