Path:
Volume Heft 12

Full text: Bibliotheksdienst (Rights reserved) Issue44.2010 (Rights reserved)

Themen Erschließung 1132 Bibliotheksdienst 44. Jg. (2010), H. 12 gestellt werden, dass die intellektuelle Methode die einzelnen Titel trennschärfer indexiert als das automatische Verfahren. Hierbei zeigt sich wiederum deutlich die unterschiedliche Funktionsweise beider Indexierungsverfahren.49 Die Indexierer nutzen einerseits die ganze Bandbreite des STW umfassender und vergeben an- dererseits die einzelnen Deskriptoren auch sparsamer. Das automatische Verfah- ren nutzt dagegen nur einen Bruchteil der STW-Begriffe und weist diese Begriffe dann auch noch „inflationär“ den einzelnen Titeln zu.50 Ein weiteres zentrales Ergebnis der Testläufe umfasst als fünftes und letztes Be- wertungskriterium die Belegungsbilanz des STW. Diese ist ein Maß der tatsäch- lichen Nutzung des zur Verfügung stehenden Vokabulars. Im Vergleich beider Indexierungsverfahren benutzen die intellektuell arbeitenden Sacherschließer 71% der zur Verfügung stehenden Begriffe, während die Automatik nur 29% aller möglichen STW-Schlagwörter verwendet. Hieran zeigt sich die mangelnde Trai- nierbarkeit aller zur Indexierung zur Verfügung stehenden STW-Begriffe aufgrund fehlenden Lernmaterials (digitale Dokumente). Zudem wird sich auch in Zukunft die wissenschaftliche Produktion in Form digitaler Publikationen nicht über alle Themengebiete (BWL, VWL) und Sprachen gleich verteilen und damit alle zur Ver- fügung stehenden Schlagwörter trainierbar machen.51 6. Erkenntnisse aus der Testphase – Ausblick & Fazit Mit dem eingesetzten und getesteten automatischen Indexierungssystem hat sich die ZBW das Ziel gesetzt, möglichst allen digitalen wirtschaftswissenschaft- lichen Dokumenten entsprechende inhaltsbeschreibende Metadaten (Deskripto- ren) über ein automatisches Verfahren zuzuweisen. Diese Metadaten sollen die einzelnen Titel nicht nur sprachoberflächig beschreiben, sondern durch die Ein- ordnung in ein ontologiebasiertes Begriffssystem (STW) auf die Bedeutungsebene (semantische Funktion) von Informationensressourcen abzielen. Die dargestellten Ergebnisse zeigen einerseits die Annäherung beider Verfahren; andererseits ver- 49 Der Mensch kann einen Text verstehen, d.h. ihn in einen übergeordneten Kontext einordnen, die Maschine kann nur auf Basis des jeweiligen Textes und anhand einer Vergleichsdatenmenge indexieren. 50 Zudem bereitet die Polyhierarchie des STW der Automatik Schwierigkeiten. Aufgrund der fehlenden Vorgaben von hierarchischen Beziehungen durch die Indexierer schafft es die Indexierungssoftware nicht, die an mehreren Stellen im STW-Baum aufgehäng- ten Begriffe fachspezifisch (BWL, VWL, Nachbahrwissenschaften) eindeutig zuzuord- nen. 51 Die rund 39.000 Dokumente des Testlaufes umfassten 5% deutsche und 86% englischsprachige Titel sowie überwiegend VWL-Dokumente. Anderssprachige Titel werden daher in absehbarer Zukunft nicht automatisch zu indexieren sein. Ein weiteres Problem stellt die Bilingualität (deutsch/englisch) des STW dar.
Top of page

Note to user

Dear user,

In response to current developments in the web technology used by the Goobi viewer, the software no longer supports your browser.

Please use one of the following browsers to display this page correctly.

Thank you.