Automatische semantische Annotation multimodaler Produktbeschreibung

Ziel des Projektes bildete die Entwicklung von technologischen Grundlagen für die automatische Verarbeitung von handelsüblichen Produktbeschreibungen im Kontext von eCommerce Anwendungen. Dabei geht es zum einen um die automatische Zuordnung von Produktbeschreibungen zu Produktkategorien anhand von Text- und Bildinformationen, zum anderen um die Identifizierung spezifischer Hersteller­produkte entsprechend einer Differenzierung nach EAN-Codes. Der bisherige Stand der Technik in Suchmaschinen und Datenbankabfragen erlaubt nur einen weitgehend oberflächlichen Textvergleich, der vielfach zu unsicheren Ergebnissen führt und händische Nacharbeit erfordert. Durch Verwendung neuartiger Techniken aus dem Bereich der Wissens­repräsentation und des „Semantic Web", insbesondere durch die dort entwickelten Verfahren zum Einsatz von Ontologien und zur automatischen semantischen Annotation, werden in diesem Vorhaben Lösungen für die weitgehende automatische Produktkategorisierung und Produktidentifikation entwickelt, die bisherigen Verfahren an Zuverlässigkeit überlegen sind und deutlich weniger händische Nacharbeit erfordern. Damit werden effektivere Möglichkeiten für bestehende eCommerce Anwendungen geschaffen und neuartige Anwendungen ermöglicht. Das Projekt umfasst die Konzeption von Lösungsverfahren, ihre prototypische Implementierung sowie ihre Evaluierung an realistischen Datenbeständen. Das Projektziel der Entwicklung eines rechnerbasierten Verfahrens zur Überführung von Produktbeschreibungen in ein für eCommerce geeignetes Kategoriensystem wurde erreicht. Zum Einsatz kommt ein neuartiges Inferenzsystem, das - semantisch und logisch fundiert - differenzierte Definitionen von Kategorien und im Weiteren die Einordnung von Produktbeschreibungen erlaubt. Das entwickelte Verfahren wurde so konzipiert, dass 2 Mio. verschiedene Produkte identifiziert und kategorisiert werden können. Dabei wurde ein Durchsatz von 25.000 Produktbeschreibungen pro Stunde erreicht. Als Referenzanwendung wurden die Anforderungen des Online-Shops der Fa. Gimahhot analysiert. In Experimenten konnte der Nachweis für die praktische Verwendbarkeit erbracht werden. Weiterer Entwicklungsbedarf für die praktische Anwendung besteht in der Verfeinerung der sprachlichen Analyse durch den Ausbau der erweiterbar angelegten Grammatiken. Das Projekt wurde im Rahmen der RIS-Hamburg durch die EU gefördert.

Kooperationspartner

  • Gimahhot GmbH, Hamburg
  • Innovationsstiftung Hamburg

Mitarbeiter/innen