Path:
Volume Heft 12

Full text: Bibliotheksdienst (Rights reserved) Issue40.2006 (Rights reserved)

Technik Themen Bibliotheksdienst 40. Jg. (2006), H. 12 1439 6.4 Linguistische Indexierungsverfahren Linguistische Verfahren können Flexionsformen erkennen (Maskulinum, Femini- num, Neutrum, Singular, Plural). Eine Rechtschreibprüfung ermöglicht das Auffin- den eines Begriffs auch bei falscher oder abweichender Schreibung bei der Re- cherche oder im digitalen Dokument. Man unterscheidet folgende Fehlerarten: - die Auslassung eines Zeichens, das in den Begriff gehört - die Einfügung eines Zeichens, das nicht in den Begriff gehört - die Substitution, also die Ersetzung eines Zeichens, das in den Begriff gehört, durch ein anderes Zeichen, das nicht in den Begriff gehört - die Vertauschung von Zeichen in ihrer Reihenfolge. Bei der syntaktischen Analyse werden Begriffe auf ihre Grundformen reduziert. Für jeden Begriff muss festgelegt werden, wie weit er reduziert werden soll. Wird der Stamm zu weit belassen, können bei der Recherche viele irrelevante Treffer angezeigt werden (Overstemming). Wird der Stamm zu knapp bemessen, wer- den evtl. relevante Dokumente nicht gefunden (Understemming). Zudem dient die syntaktische Analyse der Erkennung von Homographen, indem sie Mehrwort- gruppen erkennt. Vor der Anwendung eines syntaktischen Verfahrens muss ein Wörterbuch erarbeitet werden.99 Informationslinguistische Indexsysteme werden in regelbasierte und wörterbuch- basierte Verfahren eingeteilt. Bei ersteren muss ein Regelwerk erstellt werden. Alle in den digitalisierten Dokumenten auftretenden Wörter werden gemäß die- sem Regelwerk analysiert und bearbeitet. Dieses Verfahren ist fehlerbehaftet. Das regelbasierte Verfahren ist mit einem verhältnismäßig geringen Aufwand verbun- den, da hierbei nicht jeder relevante Begriff einzeln bearbeitet wird. Wörterbuch- basierte Verfahren sind sehr zuverlässig. Sprachliche Unregelmäßigkeiten werden ausgeglichen. Die Erarbeitung von Wörterbüchern ist extrem arbeits-, zeit- und kostenaufwendig.100 Außerdem orientiert sich ein Wörterbuch zumeist an aktu- ellen sprachlichen und orthografischen Regelungen und erkennt alte Formen nicht.101 Morphologische Verfahren basieren auf den Gesetzmäßigkeiten von Wortstruk- turen und der Bildung von Wortklassen. Man unterscheidet Flexionsmorphologie und Derivationsmorphologie. Bei der Flexionsmorphologie werden Wörter um- gewandelt, um grammatikalische Kontraste innerhalb von Satzkonstruktionen auszudrücken. Die Derivationsmorphologie befasst sich mit Grundprinzipien der Konstruktion neuer Wörter.102 99 Nohr (2003, 47–52) 100 Nohr (2003, 55–56) 101 Fricke / Maier (2000, 221) 102 Nohr (2003, 54–55)
Top of page
Waiting...

Note to user

Dear user,

In response to current developments in the web technology used by the Goobi viewer, the software no longer supports your browser.

Please use one of the following browsers to display this page correctly.

Thank you.