THEMEN_____________________________ Erschließung
standteile des homonymen Schlagwortes relationiert und bei der Treffer-
mengenbildung berücksichtigt wurden. Es darf vermutet werden, daß ein
erneuter Indexierungslauf mit zugeschalteter Mehrworterkennung eine
qualitative Verbesserung der Ergebnisse mit sich bringen würde.
2. Die Spracherkennung der Titel als Vorbereitung zur Indexierung weist
noch Schwächen auf, wodurch einige Titel nicht indexiert wurden. Es ist
eine Verbesserung des Spracherkennungsalgorithmus anzustreben.
3. Abkürzungen im Zusatz zum Hauptsachtitel bereiten Probleme (z.B. georg.
von georgisch). Hierbei wird in allen Datensätzen, in denen der Vorname
Georg enthalten ist, auf ,,Georgien" relationiert).
4. Es gibt Probleme mit Sachtiteln, die aufgrund ihrer Sprach- und Wortwahl
für eine maschinelle Indexierung nicht geeignet sind. Selbst der hier
durchgeführte Retrievaltest mit knapp 190.000 Dokumenten erlaubt aber
noch nicht die Ableitung präziser Folgerungen.
5. Die zweiseitige Berücksichtigung der Synonym-Relation der SWD, d.h. die
Indexierung auch mit Nicht-Ansetzungsformen für den Benutzerzugriff,
führte zu unverhältnismäßig vielen 'falschen' Indexierungsergebnissen.
Diese Problemstellung ist besser durch eine Aufgabenverteilung doku-
mentspezifisches Indexierungsvokabular auf der einen Seite und benutzer-
bezogenes Suchvokabular auf der anderen Seite zu lösen.
Maschinelle Indexierung kann nicht alle Eigenschaften aufweisen, die einer
differenzierten Inhaltsanalyse und nachfolgenden intellektuellen Indexierung
eigen sind und bedarf sicher noch der Verbesserung. Betrachtet man allein
die Retrievalsituation, so kann festgehalten werden: Eine die intellektuelle
Indexierung unterstützende maschinelle Indexierung muß so lange für das
Retrieval einer reinen intellektuellen Indexierung als überlegen betrachtet
werden, wie nicht Retrievalsysteme angeboten werden, die aufbauend auf der
intellektuellen Indexierung gleich gute Retrievaleigenschaften besitzen. Be-
kanntermaßen kranken die heute verbreiteten Retrievalumgebungen sowohl
häufig daran, daß die Zerschlagung von RSWK-Schlagwörtern Mehrdeutig-
keiten im Suchvokabular erzeugt (man vergleiche beispielsweise die im Test
ermittelte Präzision von 0,95 für die verstichworteten RSWK-Ketten) als auch
daran, daß die semantische Struktur des normierten Vokabulars nicht für
Suchabläufe genutzt werden kann (dies erklärt die vergleichsweise niedrige
Zahl der relevanten Treffer bei Suchen mit verstichworteten RSWK-Ketten).
Welcher der beiden Ansätze zum Aufbau befriedigender Retrievalsysteme den
höheren Ressourceneinsatz erfordert, muß durch andere Untersuchungen
geklärt werden.
Insofern kann nur empfohlen werden, die im MILOS Il-Projekt entwickelte
Methode zur maschinellen Indexierung für bibliographische Daten auf andere
66 BIBLIOTHEKSDIENST 31. Jg. (1997), H. 1