Technik Themen
Bibliotheksdienst 40. Jg. (2006), H. 12 1439
6.4 Linguistische Indexierungsverfahren
Linguistische Verfahren können Flexionsformen erkennen (Maskulinum, Femini-
num, Neutrum, Singular, Plural). Eine Rechtschreibprüfung ermöglicht das Auffin-
den eines Begriffs auch bei falscher oder abweichender Schreibung bei der Re-
cherche oder im digitalen Dokument. Man unterscheidet folgende Fehlerarten:
- die Auslassung eines Zeichens, das in den Begriff gehört
- die Einfügung eines Zeichens, das nicht in den Begriff gehört
- die Substitution, also die Ersetzung eines Zeichens, das in den Begriff gehört,
durch ein anderes Zeichen, das nicht in den Begriff gehört
- die Vertauschung von Zeichen in ihrer Reihenfolge.
Bei der syntaktischen Analyse werden Begriffe auf ihre Grundformen reduziert.
Für jeden Begriff muss festgelegt werden, wie weit er reduziert werden soll. Wird
der Stamm zu weit belassen, können bei der Recherche viele irrelevante Treffer
angezeigt werden (Overstemming). Wird der Stamm zu knapp bemessen, wer-
den evtl. relevante Dokumente nicht gefunden (Understemming). Zudem dient
die syntaktische Analyse der Erkennung von Homographen, indem sie Mehrwort-
gruppen erkennt. Vor der Anwendung eines syntaktischen Verfahrens muss ein
Wörterbuch erarbeitet werden.99
Informationslinguistische Indexsysteme werden in regelbasierte und wörterbuch-
basierte Verfahren eingeteilt. Bei ersteren muss ein Regelwerk erstellt werden.
Alle in den digitalisierten Dokumenten auftretenden Wörter werden gemäß die-
sem Regelwerk analysiert und bearbeitet. Dieses Verfahren ist fehlerbehaftet. Das
regelbasierte Verfahren ist mit einem verhältnismäßig geringen Aufwand verbun-
den, da hierbei nicht jeder relevante Begriff einzeln bearbeitet wird. Wörterbuch-
basierte Verfahren sind sehr zuverlässig. Sprachliche Unregelmäßigkeiten werden
ausgeglichen. Die Erarbeitung von Wörterbüchern ist extrem arbeits-, zeit- und
kostenaufwendig.100 Außerdem orientiert sich ein Wörterbuch zumeist an aktu-
ellen sprachlichen und orthografischen Regelungen und erkennt alte Formen
nicht.101
Morphologische Verfahren basieren auf den Gesetzmäßigkeiten von Wortstruk-
turen und der Bildung von Wortklassen. Man unterscheidet Flexionsmorphologie
und Derivationsmorphologie. Bei der Flexionsmorphologie werden Wörter um-
gewandelt, um grammatikalische Kontraste innerhalb von Satzkonstruktionen
auszudrücken. Die Derivationsmorphologie befasst sich mit Grundprinzipien der
Konstruktion neuer Wörter.102
99 Nohr (2003, 47–52)
100 Nohr (2003, 55–56)
101 Fricke / Maier (2000, 221)
102 Nohr (2003, 54–55)