Humboldt-Universität zu Berlin - Institut für Bibliotheks- und Informations­wissen­schaft

Forschung

Die Arbeitsgruppe Information Processing and Analytics befasst sich mit Verfahren und Systemen zur Verarbeitung und Analyse von Information. Die computergestützte Informationsverarbeitung und die Analyse großer Datenmengen sowie deren Einfluss auf Informations- und Wissensprozesse stehen dabei im Mittelpunkt. Dazu gehört die Anwendung und Verbesserung von Verfahren aus den Bereichen Data Mining, maschinelles Lernen, Informationsextraktion sowie Natural Language Processing.

Eines der Forschungsziele ist, die ständig wachsende Menge an Forschungsergebnissen besser für Forschende und die Allgemeinheit nutzbar zu machen und das World Wide Web als Forschungsgegenstand zu erschließen. Anwendungsgebiete sind Empfehlungssysteme, kollaborative Verschlagwortungssysteme (wie beispielsweise unser eigenes System BibSonomy), Forschungsdatenmanagement, Web-Archivierung, die Digital Humanities, sowie das Social Web.


Projekte

AI-SKILLS

Im BMBF-geförderten Projekt AI-SKILLS entwickeln wir eine anwendungsorientierte Infrastruktur für KI-Communities in Lehr-Lern-Settings an der Humboldt-Universität zu Berlin.

image.png
Zentrale Aspekte des Projekts.


Unknown Data

Im DFG-geförderten Projekt Unknown Data entwickeln wir gemeinsam mit Schloss Dagstuhl – Leibniz-Zentrum für Informatik (Betreiber von DBLP) und GESIS – Leibniz-Institut für Sozialwissenschaften Verfahren zur Erfassung und Konsolidierung von Metadaten für Forschungsdaten aus dem Web.

unda_konzept-flow.png
Ein Überblick über das Zusammenwirken der Arbeitspakete des Projekts untereinander und mit weiteren Akteuren und Ressourcen.


Was ist wichtig? Schlüsselstellen in der Literatur

Als Teil des DFG-Schwerpunktprogramms Computational Literary Studies untersuchen wir im Projekt Was ist wichtig? Schlüsselstellen in der Literatur, wie Schlüsselstellen in der Literatur entdeckt werden können und durch welche Eigenschaften sich diese auszeichnen. Visualisierungen der Ergebnisse sind über QuidEx einsehbar, der zur Erkennung wörtlicher Zitate verwendete Code ist öffentlich einsehbar.

Das Bild zeigt ein Foto eines in einem Treppenhaus herabhängenden Banners. Es enthält einen kaum lesbaren Text, an dem einige Stellen durch größere und dickere Schreibung hervorgehoben sind

Ein Foto unseres Banners zur Visualisierung wichtiger Textstellen in "Die Judenbuche" von Annette von Droste-Hülshoff, ausgestellt im Institutsgebäude Dorotheenstraße 26 in Berlin Mitte.

 


Abgeschlossene Projekte

Uncovr

Im Industrie-finanzierten und am Forschungszentrum L3S angesiedelten Projekt Uncovr entwickeln wir Verfahren zur Identifikation und Verknüpfung von Musikwerken in Videos. Dazu werden Methoden der künstlichen und kollektiven Intelligenz angewendet und weiterentwickelt. So soll beispielsweise untersucht werden, welche Aufgabentypen und Anreizsysteme geeignet sind, um mit Hilfe von Serious Games oder Crowdsourcing qualitativ hochwertige Video-Werkzuordnungen zu erhalten. Ebenso wird untersucht, wie maschinelle Lernverfahren, zum Beispiel Meta-Learning- und Ähnlichkeitslernansätze, zur Lösung der Aufgabe geeignet sind.


REGIO

Das REGIO-Projekt wird vom BMBF im Rahmen der quantitativen Wissenschaftsforschung gefördert. Ziel ist die Kartierung der Entstehung und des Erfolgs von Kooperationsbeziehungen in regionalen Forschungsverbünden und Innovationsclustern. In unserem Teilprojekt untersuchen wir insbesondere, inwiefern sich Webseiten von Forschungseinrichtungen dafür eignen, regionale Kooperationsbeziehungen zu bewerten.


DESIR

Als technischer Partner in der EU CSA DESIR (DARIAH ERIC Sustainability Refined) entwickeln wir Verfahren und Systeme zum kollaborativen Wissensmanagement und zur Entitäts-basierten Suche.