Überblick | Projektdetails | Team | Auszeichnungen | Testtag


Bei der Entwicklung von arbeiterzeitung.at wurde auch nach geeigneten Verfahren für die Volltextsuche in den Zeitungsseiten gesucht. Das Ergebnis wird hier an einer Ausgabe beispielhaft illustriert: Anhand der AZ vom 22.Juni 1978 mit der Berichterstattung nach Österreichs 3:2 Sieg über Deutschland bei der Fußball-WM.

Testen Sie selbst die Volltextsuche:

Oder sehen Sie sich eine bestimmte Seite direkt an:

Seite 01

Seite 02

Seite 03

Seite 04

Seite 05

Seite 06

Seite 07

Seite 09

Seite 10

Seite 11

Seite 12

Seite 13

Seite 14

Seite 15

Seite 16
Eine der relevantesten Fragen für gute Archivnutzbarkeit ist jene nach der Möglichkeit zur Volltextsuche durch OCR-Erkennung (Original Character Recogniton) digitalisierter Daten. Nachdem die digitalisierten Bilder in Text umgewandelt wurden, können anhand von Stich- und Suchworten und deren Kombinationen einzelne Artikel gesucht werden. Die Suchergebnisse sollten, so das Entwicklungsinteresse, direkt in den digitalisierten Originalseiten sichtbar gemacht werden.

Die Mitarbeiter von Kaltenbrunner Medienberatung und scharf_net haben dazu mehrere Versuchsprojekte beobachtet, mit internationalen Experten verschiedene Programme und Verfahren getestet. Das mögliche Ergebnis wird anhand der Ausgabe vom 22.6.1976 oben dargestellt. Mit etwa 95 prozentiger Sicherheit werden Suchworte in den digitalisierten Seiten tatsächlich erkannt. Eine Optimierung bestehender Software und die Entwicklung neuer Abläufe beschleunigt OCR, Korrekturen und die Bearbeitung der historischen Printmaterialien für derartige Volltextsuche.

Um die Arbeiter-Zeitung rückwirkend bis 1970 auch im Volltext durchsuchbar zu machen, wären in diesem Verfahren etwa fünf Mitarbeiter rund ein Jahr lang mit Nachbearbeitung der Zeitungen beschäftigt. Das ist viel Aufwand und zugleich - für alle Zeitungsausgaben aus rund zwei Jahrzehnten - sehr wenig. Zeit- und Kostenschätzungen in diesem Bereich tätiger internationaler Unternehmen lagen vor Projektstart weit höher.

Die Entwickler von Kaltenbrunner-Medienberatung und scharf_net sind nach den Tests überzeugt, dass mit dem beschriebenen Aufwand intelligente Volltextsuche in historischen Zeitungsbeständen möglich gemacht werden kann. Für die praktische Umsetzung anhand der Arbeiter-Zeitung in großem Umfang fehlt aber derzeit noch das Budget. Grundsätzlich sind die ganz neuen Erfahrungen und Verfahren aber für jede Nachbearbeitung von Printoriginalen (auch von Mikrofilm) anwendbar und können dabei die Produktionskosten drastisch reduzieren oder derartige Projekte überhaupt erst finanzierbar - und bei kommerzieller Anwendung rasch refinanzierbar - machen.