Philipp Mayr (2009)
Re-Ranking auf Basis von Bradfordizing für die verteilte Suche in Digitalen Bibliotheken
Dissertation, Humboldt-Universität zu Berlin - Institut für Bibliotheks- und Informationswissenschaft, Berlin.
"Trotz großer Dokumentmengen für
datenbankübergreifende Literaturrecherchen erwarten akademische Nutzer
einen möglichst hohen Anteil an relevanten und qualitativen Dokumenten
in den Trefferergebnissen. Insbesondere die Reihenfolge und Struktur der
gelisteten Ergebnisse (Ranking) spielt, neben dem direkten
Volltextzugriff auf die Dokumente, inzwischen eine entscheidende Rolle
beim Design von Suchsystemen. Nutzer erwarten weiterhin flexible
Informationssysteme, die es unter anderem zulassen, Einfluss auf das
Ranking der Dokumente zu nehmen bzw. alternative Rankingverfahren zu
verwenden.
In dieser Arbeit werden zwei Mehrwertverfahren für Suchsysteme
vorgestellt, die die typischen Probleme bei der Recherche nach
wissenschaftlicher Literatur behandeln und damit die Recherchesituation
messbar verbessern können. Die beiden Mehrwertdienste semantische
Heterogenitätsbehandlung am Beispiel Crosskonkordanzen und Re-Ranking
auf Basis von Bradfordizing, die in unterschiedlichen Phasen der Suche
zum Einsatz kommen, werden hier ausführlich beschrieben und im
empirischen Teil der Arbeit bzgl. der Effektivität für typische
fachbezogene Recherchen evaluiert.
Vorrangiges Ziel der Promotion ist es, zu untersuchen, ob das hier
vorgestellte alternative Re-Rankingverfahren Bradfordizing im
Anwendungsbereich bibliographischer Datenbanken zum einen operabel ist
und zum anderen voraussichtlich gewinnbringend in Informationssystemen
eingesetzt und dem Nutzer angeboten werden kann.
Für die Tests wurden Fragestellungen und Daten aus zwei
Evaluationsprojekten (CLEF und KoMoHe) verwendet. Die intellektuell
bewerteten Dokumente stammen aus insgesamt sieben wissenschaftlichen
Fachdatenbanken der Fächer Sozialwissenschaften, Politikwissenschaft,
Wirtschaftswissenschaften, Psychologie und Medizin.
Die Evaluation der Crosskonkordanzen (insgesamt 82 Fragestellungen)
zeigt, dass sich die Retrievalergebnisse signifikant für alle
Crosskonkordanzen verbessern; es zeigt sich zudem, dass
interdisziplinäre Crosskonkordanzen den stärksten (positiven) Effekt auf
die Suchergebnisse haben.
Die Evaluation des Re-Ranking nach Bradfordizing (insgesamt 164
Fragestellungen) zeigt, dass die Dokumente der Kernzone
(Kernzeitschriften) für die meisten Testreihen eine signifikant höhere
Precision als Dokumente der Zone 2 und Zone 3 (Peripheriezeitschriften)
ergeben. Sowohl für Zeitschriften als auch für Monographien kann dieser
Relevanzvorteil nach Bradfordizing auf einer sehr breiten Basis von
Themen und Fragestellungen an zwei unabhängigen Dokumentkorpora
empirisch nachgewiesen werden."
(Quelle: edoc-Server der HU)
(Quelle: edoc-Server der HU)