THEMEN Informationsvermittlung
1. Spezifische Suchbegriffe
Dokumente mit relevanter Information können auch bei Verwendung äu-
ßerst spezifischer Suchbegriffe aufgefunden werden. Mit der Suchfunktion
des Acrobat Reader ist die entsprechende Stelle im Inhaltsverzeichnis so-
fort lokalisierbar.
,,Elektronenspin-Resonanz" liefert in unserem Bestand 19 Treffer. Auch die
genauen Titel von literarischen Erzählungen, Gedichten etc. in Sammel-
bänden oder Werkausgaben sind direkt auffindbar, wie beispielsweise
,,Der Kluge baut vor", eine Erzählung von Jura Soyfer in ,,Österreichische
Erzählungen des 20. Jahrhunderts. Salzburg (u.a): Residenzverl. 1984.
2. Allgemeinere Suchbegriffe
Große Treffermengen in Verbindung mit allgemeineren Suchbegriffen wer-
den nach Relevanz gereiht, wobei insbesondere auch bibliographische In-
formationen wie Titel und Schlagwort, die ja den Gesamtkontext der Do-
kumentationseinheit beschreiben, in den Ranking-Algorithmus eingehen
und dafür sorgen, dass Dokumente, die den Suchbegriff in diesen Katego-
rien enthalten, top gereiht werden.
Besonders bei hochspezifischen Suchanfragen, die mittels boolscher Ver-
knüpfung allgemeinerer Begriffe formuliert sind (,,schwangerschaft AND
epilepsie"), kommt dies zum Tragen: Dokumente, die zumindest einen der
Suchbegriffe im Titel oder Schlagwort enthalten, werden vorne gelistet. In
diesen Dokumenten werden die verknüpften Suchbegriffe mit hoher Wahr-
scheinlichkeit im Kontext behandelt, resultieren also nicht aus Fehlver-
knüpfungen. Titel, insbesondere aber die intellektuell vergebenen Schlag-
wörter (engste umfassende Begriffe) repräsentieren in der Regel ja gerade
den Gesamtkontext.
Der Ranking-Algorithmus muss noch optimiert, die optimale Abstimmung
der Wertigkeit zwischen statistischen Gewichten und kategorialer Zugehö-
rigkeit der Suchbegriffe noch gefunden werden.
Basis dieses Relevance Retrievals ist die N.Gram Engine GTR von IBM.
Neben den üblichen Retrievaloperatoren, schneller Links- und Rechtstrun-
kierung ist darüberhinaus eine hochperformante ,,Fuzzy"-Suche möglich,
die auch verschiedene Wortvarianten wie Einzahl-, Mehrzahlformen und
Kasusendungen mitrecherchiert (Volltextindexierung der PDFs). Damit
können Tipp- aber auch OCR-Fehler bis zu einem gewissen Grade neutra-
lisiert werden.
932 BIBLIOTHEKSDIENST 38. Jg. (2004), H. 7/8