Path:
Volume Heft 6

Full text: Bibliotheksdienst (Rights reserved) Issue 43.2009 (Rights reserved)

Technik Themen Bibliotheksdienst 43. Jg. (2009), H. 6 631 16 Do sprach von Lamparten der künic Ortnit ‚nu bringet mich des inne, ob ir mir wiege sit. ich wil mich getroesten des künicriches min, ich muoz den lip Verliesen, mir enwerd diu künigm.‘ 17 Do sprach der künec von Riuzen ‚nu si ez gote gekleit, daz ich dir disiu maere hiute hän geseit, . diu nach dinem töde dir üf erstanden sint. /\ ich widerriete ez gerne: du bist miner swester kint.‘ 18 ‚Swer mir daz widerratet, dem wirde ich nimmer holt. ich hän geheien lauge silber unde golt: den hört wil ich nu bieten, ich gewinne ein kreftic her.17 Abb. 3: „schmutziges OCR“ von Editionstext: http://digi.ub.uni-heidelberg.de/diglit/ AmeldungJaenicke1871/0073/OCR?sid=5365390c14bcd030e202b00bc0f6764f] Für die Volltextpräsentation von Druckschriften verwendet man in Heidelberg allerdings sogenanntes „schmutziges OCR“, das heißt, die mit dem Abbyy Fine- Reader 8 erstellten Volltexte erheben keinen Anspruch auf Fehlerlosigkeit (Feh- lerquote 1% bis 2%), da eine manuelle Nachbearbeitung aus Kostengründen nicht erfolgte.18 Grundsätzlich ist aber auf diese Weise eine Volltextrecherche möglich, so dass das Image mit gekennzeichneter Fundstelle und der OCR-Text (XML) ge- meinsam angeboten werden. Als nachteilig kann beim „schmutzigen OCR“ mit einer nur mittelmäßigen Erkennungsrate eingewandt werden, dass diese Erschlie- ßungsprodukte in Zukunft, d.h. beim Fortschreiten der technischen Entwicklung, als zu unzulänglich beurteilt werden können: Wissenschaftlich nutzbares OCR er- hebt den Anspruch auf eine Reduzierung der Fehlerquote auf mindestens 99,5%. Betrachtet man die Digitalisierungslandschaft in anderen europäischen Biblio- theken, z.B. auch in Spanien, so zeigt sich ein ähnliches Bild: Die Bereitstellung von Images zusammen mit Metadaten ohne Volltextrecherchemöglichkeit scheint am weitesten verbreitet.19 Allerdings kann in diesem Kontext auf das Projekt Archivo Digital de Manuscritos y Textos Espa?oles (ADMYTE) aufmerksam gemacht wer- 17 Die beim „schmutzigen OCR“ noch vorhandenen Fehler werden hier kursiv und unterstrichen markiert. 18 http://www.ub.uni-heidelberg.de/helios/digi/tech_workflow.html (14.01.2009); http://www.ub.uni-heidelberg.de/helios/digi/ocr.html (14.01.2009) 19 José Luis Canet: Bibliotecas Digitales Espa?olas a Texto completo. In: Syntagma. Revista del Instituto de Historia del Libro y de la Lectura 1 (2005), S. 149–159.
Top of page

Note to user

Dear user,

In response to current developments in the web technology used by the Goobi viewer, the software no longer supports your browser.

Please use one of the following browsers to display this page correctly.

Thank you.