Main Page

From User-Guided Semantic Enrichment
Jump to: navigation, search

Contents

User Guided Semantic Content Enrichment

funded by:

IB-Logo-DLR ENG.png Rsnz-logo-bw.gif

Project Partners

Fu logo.gif Logo s.gif Coa red.gif

The project “User Guided Semantic Content Enrichment” developed methods and algorithms that have been studied and implemented in a software tool, called “loomp”[1], to semantically enrich and enhance given textual information in such a way that the data were available for structured re-use in new contexts. For example, documents available in Wikipedia were enhanced with a semantic mark-up to allow their usage in a mobile tourist information system. Blocks of text need to be identified within the documents so that they can be presented to the mobile users according their interests: e.g., texts details about the architecture, history, or landscape features of the Waikato or Berlin depending on the user's current location.

Compared to fully automated annotations the manual approach to semantic annotation offers much higher quality, but presents particular challenges to the understandability and usability of annotation process and annotation tools for non-semantic users. Although our studies mostly used the graphical interface of the loomp “One Click Annotator”, our results can be transferred to other editors for manually or semi-automatically annotating contents by non-experts:

  • Support for Task Experts: Current literature distinguishes between technical experts and domain experts. Based on our study observations, we additionally introduce the concept of task experts. Task experts are domain experts who conceptually understand the task of annotating texts and have insight into the characteristics of semantic annotations (e.g., semantic identity).
  • Semantic Identity: For high quality annotations, users need help in selecting appropriate resources for linking. The recommendation algorithm therefore plays an important role, and needs to be supported by an appropriate interface representation of recommended resources to users. In particular, these need to take into account that users have difficulties distinguishing between instances and classes of instances.
  • Guidelines: Guidelines illustrating the process of annotating texts and demonstrating the benefits of semantic annotations.
  • Quality Measures: Commonly accepted quality measures for manual semantic annotation and methodologies for evaluating the user aspects of Semantic Web applications.

Benutzer-geführte Semantische Anreicherung

Im Rahmen des Projekts „Benutzer-geführte Semantische Anreicherung“ wurden Methoden und Algorithmen in einem semantischen Annotationswerkzeug, genannt „loomp“, untersucht und weiterentwickelt, welches es Nutzern erlaubt textuelle Informationen hochqualitativ mit semantischen Hintergrundwissen anzureichern, so dass diese Daten automatisch verarbeitet und in neuen Anwendungskontexten miteinander verknüpft und wiederverwendet werden können. So wurden zum Beispiel Dokumente in Wikipedia in Nutzerstudien mit semantischen Annotationen angereichert, um ihre automatische Verwendung in einem mobilen Tourist-Information-System zu ermöglichen. Textblöcke müssen in den Dokumenten identifiziert werden, so dass sie zu den mobilen Anwender nach ihren Interessen dargestellt werden können: z.B. Textausschnitte über die Architektur, Geschichte, oder Landschaftsmerkmale der Stadt Waikato oder Berlin in Abhängigkeit vom aktuellen Standort des Benutzers.

Der manuelle Ansatz zur semantischen Annotation bietet dabei gegenüber vollautomatischen Annotationen eine wesentlich höhere Qualität, stellt aber besondere Herausforderungen an die Verständlichkeit und Verwendbarkeit der Annotationsmethoden und – Werkzeuge, da dies von „Nichtsemantiker“ benutzt werden müssen. Obwohl in unseren Untersuchungen zumeist die grafische Oberfläche des loomp „One Click Annotator“ verwendet wurde, können unsere Ergebnisse auf andere Editoren für die manuell oder halbautomatisch Annotation übertragen werden:

  • Werkzeugunterstützung für sogenannte „Annotations-Experten“: Aktuelle Literatur unterscheidet zwischen technischen Experten und Domänenexperten. Basierend auf Beobachtungen in unserer Studie haben wir zusätzlich das Konzept eines Task-Experten für die Annotation eingeführt. Task-Experten sind Domain-Experten, die konzeptionell die Aufgabe der Annotation von Texten verstehen und Einblick in die Eigenschaften der semantischen Annotationen (z.B. semantische Identität) haben.
  • Semantische Identität von Annotationen: Für hochwertige Annotationen, benötigen die Nutzer Unterstützung bei der Auswahl geeigneten semantischen Wissens für die Verknüpfungen. Ein automatischer Empfehlungsalgorithmus spielt daher eine wichtige Rolle und muss durch eine entsprechende Schnittstelle dem Benutzer entsprechende Vorschläge in geeigneter Darstellung unterbreiten. Insbesondere, gilt es dabei zu beachten, dass nicht-semantische „Task Experten“ Schwierigkeiten bei der Unterscheidung zwischen Instanzen und Klassen von Instanzen haben.
  • Richtlinien für die semantische Annotation: Allgemeine Richtlinien, welche den Prozess der Annotation von Texten beschreiben und die Vorteile von semantischen Annotationen demonstrieren.
  • Qualitätsmaßnahmen und –maße für semantische Annotation: allgemein anerkannte Qualitätsmaßstäbe für die manuelle semantische Annotation und Methoden zur Bewertung der Benutzeraspekte von Semantic Web Anwendungen.


Publications

  • Ralf Heese, Adrian Paschke, Annika Hinze, Alexa Schlegel: Semantische Annotationen verstehen - Ergebnisse zweier Nutzerstudien, Xinnovations 2012, Berlin, Sept. 2012 (presentation)
  • Annika Hinze, Ralf Heese, Markus Luczak-Rösch, Adrian Paschke: Semantic Enrichment by Non-experts: Usability of Manual Annotation Tools. International Semantic Web Conference (1) 2012: 165-181 (spotlight best paper at ISWC 2012, pdf)
  • Annika Hinze, Ralf Heese, Alexa Schlegel, Markus Luczak-Rösch: User-Defined Semantic Enrichment of Full-Text Documents: Experiences and Lessons Learned. TPDL 2012: 209-214
  • Alexa Schlegel, Ralf Heese, Annika Hinze: Visualisation of Semantic Enrichment. GI-Jahrestagung 2012: 1047-1058* Markus Luczak-Rösch, Ralf Heese, Adrian Paschke, "Future Content Authoring", In Nodilities – The Magazine of the Semantic Web, Issue 11, pp. 17-18, 2010.
  • Ralf Heese, Markus Luczak-Rösch, Adrian Paschke, Radoslaw Oldakowski and Olga Streibel, "One Click Annotation", 6th Workshop on Scripting and Development for the Semantic Web, colocated with ESWC 2010, Crete, Greece, May 31, 2010. (pdf)
  • Markus Luczak-Rösch, Ralf Heese, Adrian Paschke, "Menschen und das Datenweb: Semantische Textverarbeitung für Nicht-Experten Humans and the Web of Data", in i-com Volume 8, Issue 3, pp. 5-11, 2009.
  • Ralf Heese, Markus Luczak-Rösch, Adrian Paschke, Radoslaw Oldakowski and Olga Streibel, "One Click Annotation" (Poster), Workshop on Collaborative Construction, Management and Linking of Structured Knowledge (CK 2009) , colocated with ISWC 2009, Washington, DC., USA, October 25, 2009
  • Markus Luczak-Rösch and Ralf Heese, "Linked Data Authoring for Non-Experts", Linked Data on the Web Workshop at WWW2009, Madrid, Spain, April 20, 2009 (pdfpresentation)

Talks

  • Beyond Loomp by Ralf Heese, Corporate Semantic Web Project Workshop, 16th January, 2013, Freie Universitaet Berlin, 2013
  • Semantische Annotationen verstehen - Ergebnisse zweier Nutzerstudien by Ralf Heese and Adrian Paschke at Xinnovations 2012, September 2012
  • Research seminar presentation by Adrian Paschke and Ralf Heese at University of Waikato: Corporate Semantic Web, New Zealand, in March 2011 (slides)
  • Invited colloquium presentation by Adrian Paschke at Massey University: Corporate Semantic Web - The Semantic Web Meets the Enterprise, New Zealand, in March 2011
  • Seminar presentation (Informatikkolloquium) by Jens Dietrich at Freie Universität Berlin: Dynamic Component Composition – Vision vs Reality, July 7th, 2010
  • Seminar presentation (Informatikkolloquium) by Annika Hinze at Freie Universität Berlin: Mindspace and workspace: Human-centred access to digital and physical information , Dr. Annika Hinze, Sept 30th, 2011
  • Seminar presentation by Adrian Paschke and Ralf Heese at University of Waikato: Industry applications of the Semantic Web, New Zealand, in February 2012
  • Seminar presentation by Adrian Paschke at Massey University: (Semantic) Complex Event Processing – Reference Architectures and Design Patterns, New Zealand, in February 2012
  • Workshop presentation by Alexa Schlegel at Informatik workshop in Germany, September 2012
  • Conference presentation by Annika Hinze and Ralf Heese at TPDL conference in Cyprus, September 2012
  • Conference presentation by Annika Hinze and Ralf Heese at ISWC conference in Boston, November 2012
  • workshop presentation by Ralf Heese, Linked Data on the Web Workshop at WWW2009, Madrid, Spain, April 20, 2009

Research Visits

  • Visit of Prof. Dr. Jens Dietrich at Freie Universitaet Berlin (July 2010)
  • Visit of Dr. Annika Hinze at Freie Universitaet Berlin (August 2010)
  • Prof. Dr. Adrian Paschke as Visit Professor at University of Waikato (February-April 2011)
  • Visit of Ralf Heese at University of Waikato (March-April 2011)
  • Visit of Prof. Dr. Adrian Paschke at Massey University (March 2011)
  • Visit of Dr. Annika Hinze at Freie Universität Berlin (August and September 2011)
  • Prof. Dr. Adrian Paschke as Visit Professor at University of Waikato (February-April 2012)
  • Visit of Ralf Heese at University of Waikato (Feb-May 2012)
  • Visit of Prof. Dr. Adrian Paschke at Massey University (Feb-March 2012)
  • Visit of Dr. Annika Hinze at Freie Universitaet Berlin (July-August 2012)
  • Visit of Ines Moosdorf at Massey University (July 2012 - July 2013) (via DAAD Promos funding)

Theses

  • Alexa Schlegel: Visualisierung überlagernder Annotationen (Bachelor, FU Berlin)
  • Minh Tuan Nguyen: Implementing an Ontology Editor Following Usability Design Criteria for non-Experts (Bachelor, FU Berlin)
  • Selimkhan Achmerzaev: Suchen und Verlinken von bestehenden Ontologie-Instanzen für Nicht-Experten in loomp (Bachelor, FU Berlin)
  • Patrick Jungerman: Implementierung eines Semantic Web Annotation Recommender Services (Bachelor, FU Berlin)
  • Michael Pöhle: Semantische Annotation von digitalen Bildern (Master, FU Berlin)
  • Bistritsa Georgieva: Verbesserung der Videosuche mit Hilfe von ontologischen Annotationen und Linked Data (Bachelor, FU Berlin)
  • Hsieh, Ping-Ju: Administration Service for the Tourist Information System (TIP) (Master, University of Waikato)
  • Ines Moosdorf: A Novel Approach to Scalable Symbolic Machine Learning Based on Formal Concept Analysis (Master, FU Berlin)
Personal tools
Namespaces

Variants
Actions
Navigation
Toolbox