Themen Technik
688 Bibliotheksdienst 42. Jg. (2008), H. 6
- Startlink der zu downloadenten Homepage
- Tiefe des Downloads (maximaler Linkabstand von der Startseite)
- Art der herunterzuladenden Dateien (z.B. voreingestellte oder selbstdefi-
nierte Dateiformate)
- Größe der herunterzuladenden Dateien (Mindest-, Maximalgröße)
- Ablageort der heruntergeladenen Dateien.
Abbildung 1 zeigt einen Teil der Masken, über die die Downloadvorgaben einge-
geben werden können. Die Voreinstellungen sind z.T. frei wählbar. Die Tiefe des
Downloads und die Größe der herunterzuladenden Dateien sollten in der Praxis
ermittelt werden. Fasst man die Tiefe des Downloads z.B. zu eng, kann es passie-
ren, dass wichtige E-Publikationen nicht gesichert und recherchierbar werden.25
Andererseits bewirkt ein tieferer Download, dass – ergänzend zu den PDFs der
aus den Adressverzeichnissen vorausgewählten Institutionen – zusätzliche E-Pu-
blikationen weiterer relevanter Organisationen heruntergeladen werden. Dies
sorgt dafür, dass die Anzahl doppelt heruntergeladener Dateien wächst, was dazu
führt, dass wertvolle Recherchezeit aufgewendet werden müsste und mit der Re-
cherche Dateien doppelt angezeigt würden. So empfiehlt sich nach erfolgtem
Download die Löschung redundanter Dateien. Diese könnten sein:
- E-Publikationen, die sowohl von den Websites der herausgebenden Organi-
sationen, als auch über weitere downgeloadete Websites gesichert wurden;
- E-Publikationen von „fachfremden“ Sites (z.B. Adobe, Opera, Microsoft,
Google), die normalerweise nicht von Interesse sind;
- Dateien und Verzeichnisse, die nicht E-Publikationen sind (z.B. Unterverzeich-
nisse, die „.pdf“ im Namen haben, oder beispielsweise Dateien der Formate
„.cab“, „.swf“, „.mp3“).26
Solche redundanten Dateien können in der Logdatei von Teleport Pro identifi-
ziert, markiert und dann gelöscht werden; hilfreich für dieses Vorgehen ist die
Möglichkeit, die Teleport-Logdatei nach Links (wie auch nach Filename, Type, Size
oder Date) ordnen lassen zu können. Von Vorteil ist nun, dass diese gelöschten Da-
teien bei aktualisierenden Download-Vorgängen nicht erneut heruntergeladen
werden. Die Tabellen 1 und 2 zeigen weiterhin, dass 20–30 % der automatisch
heruntergeladenen Dateien später wieder gelöscht werden können und sollten;
25 Außer der Start-URL (www.spd.de) wurden Dateien von beispielsweise folgenden
URLs heruntergeladen: 2001.spd-parteitag.de, archiv.spd.de, eintreten.spd.de,
familienpolitik.spd.de, gute-arbeit.spd.de, programmdebatte.spd.de, stark-gegen-
rechts.spd.de, www.parteitag.spd.de. Die Beispiele zeigen, dass recht unterschiedliche
Sub-Domains unterhalb der Hauptdomain-Ebene bestehen, und zwar neben Dateien
von den genannten URLs auch PDFs von SPD-Landesorganisationen und der SPD-
Bundestagsfraktion. Würde man bei einer solchen Situation die Download-Schablone
zu eng fassen, fänden wichtige E-Publikationen keine Berücksichtigung.
26 Warum Unterverzeichnisse und Nicht-PDFs mit heruntergeladen wurden, ist zum Teil
nicht nachvollziehbar.