Humboldt-Universität zu Berlin - Institut für Bibliotheks- und Informations­wissen­schaft

Humboldt-Universität zu Berlin | Institut für Bibliotheks- und Informations­wissen­schaft | Von Uns | BBK | Abstracts | WS 13/14 | Relationsextraktion aus Artikelvolltexten der Wikipedia: wiki2rdf und darüber hinaus

Relationsextraktion aus Artikelvolltexten der Wikipedia: wiki2rdf und darüber hinaus

Alexander Meyer, INRIA Institut National de Recherche en Informatique et en Automatique, Frankreich, und HU

22.10.2013

Aus technischen Gründen stehen leider nur die Vortragsfolien zur Verfügung.


Abstract:

wiki2rdf wurde 2012 im Rahmen einer Masterarbeit am IBI entwickelt und dient dazu, Relationen zwischen Begriffen aus Volltexten der Wikipedia zu extrahieren und als RDF-Tripel auszugeben. Das Tool arbeitet mithilfe von Regeln, die auf Syntaxbäume der Sätze angewandt werden, welche von einem Dependency-Parser erzeugt wurden. Der Vortrag stellt wiki2rdf vor, erläutert Vor- und Nachteile jener Vorgehensweise und zeigt andere Möglichkeiten im Umfeld von Relationsextraktion nach dem aktuellen Forschungsstand auf.