Erschließung ----__________________________ THEMEN
Programmierung derjenigen Teile des CGI-Gateways, die den Datenbankin-
dex auswerten.
Diese Modifikationen konnten mit Hilfe der in ALLEGRO implementierten Da-
tenmanipulationssprache durchgeführt werden, deren Befehle in sogenannten
Parameterdateien gesammelt und von den eigentlichen ALLEGRO-Program-
men umgesetzt werden.
Das CGI-Gateway-Programm basiert auf einer Funktion des ALLEGRO-Fre/-
faxf-Suchprogramms SRCH, das durch sogenannte Nachladebefehle dazu
veranlaßt werden kann, den Index einer beim Programmaufruf spezifizierten
Datenbank auszuwerten. Zur Erstellung des Gateways muß der Aufruf des
ALLEGRO-Programms SRCH in ein spezielles Programm eingebunden wer-
den, das eine Umgebung generiert, in der SRCH sinnvoll arbeiten kann.
Dieses Programm wurde in der im Internet vielfach benutzten Skriptsprache
PERL geschrieben. Es könnten jedoch auch andere Programmiersprachen
verwendet werden. PERL-Skripten werden erst zur Laufzeit interpretiert und
teilweise kompiliert. Dies kostet Rechenzeit. Auf der anderen Seite unterstützt
PERL die Verarbeitung von Textdaten, die im ALLEGRO-Format vorliegen,
sehr gut. Es ist sowohl unter UNIX als auch unter MS-DOS verfügbar. Da-
durch können PERL-Skripten auf beiden Betriebssystemen genutzt werden.
Nicht zuletzt ist PERL leichter erlernbar als etwa C.
4. Eine Benutzeranfrage wird bearbeitet
Eine Benutzeranfrage an den WWW-Katalog wird vom WWW-Server an das
CGI-Gateway weitergeleitet. Das PERL-Programm extrahiert zunächst die
einzelnen Suchbegriffe und eventuell vorhandene andere Festlegungen (z. B.
die maximale Treffermenge) aus der übergebenen Zeichenkette.
Nun werden zwei temporäre Dateien erzeugt, die vom Programm SRCH aus-
gewertet werden und dessen Verhalten steuern. Eine Datei im ALLEGRO-
Datenformat enthält in einem einzigen Datensatz Informationen darüber, wel-
cher Suchbegriff zur Auswertung des Datenbankindexes herangezogen wer-
den soll und wieviele Suchbegriffe zu welchen Suchaspekten überhaupt exi-
stieren. Diese Datei wird von SRCH pro forma durchsucht, da es als Freitext-
Suchprogramm eine Datei benötigt, die durchsucht werden kann. De facto
werden jedoch über den festgelegten Suchbegriff Datensätze aus der Daten-
bank nachgeladen. Zum Nachladen werden zuerst Suchaspekte mit einer
durchschnittlich geringeren Treffermenge benutzt, also z. B. Autoren vor Ti-
telstichwörtern.
In einer zweiten Datei werden die variablen Teile einer Parameterdatei gene-
riert, die vom Programm SRCH für jeden gefundenen Datensatz abgearbeitet
BlBLIOTHEKSDIENST 30. Jg. (1996), H. 5 851