Im Seminar E-Commerce bei Prof. Holger Schneider, das dieses Wintersemester stattfindet, habe ich das Thema „Einsatz des Semantik Web zur Verbesserung der off-site Suchergebnisse im Kontext eines Modeunternehmens“ bearbeitet. Das Thema wurde durch das mit dem E-Commerce Studiengang kooperierende Unternehmen bonprix initiiert. Ziel war es, mit Hilfe des Semantik Web Möglichkeiten aufzuzeigen, um die off-site Suchergebnisse, z.B. bei Google und Bing, optisch sowie performanceseitig zu verbessern.
Was ist das Semantik Web?
Das Semantik Web ist eine Erweiterung des aktuell bestehenden Internets durch die Anreicherung der Dokumente im Internet mit einer Bedeutung. Die so angereicherten Dokumente werden kontextbezogen miteinander verknüpft und sollen dadurch die Kommunikation zwischen Computer und Mensch verbessern.
Warum ist die Weiterentwicklung des Web 2.0 überhaupt notwendig?
Es gibt zwei grundlegende Probleme im Web 2.0, die im Folgenden erklärt werden[1]:
1. Zugriff auf die Daten
Google indexiert Webseiten anhand des auf ihnen enthaltenen Textes. Wird in der Google Suche nach einer Phrase gesucht, wird diese mit dem Text der indexierten Dokumente verglichen. Gibt es eine Übereinstimmung, wird das Dokument dem Suchergebnis hinzugefügt. Die Semantik – also die Bedeutung – der gesuchten Wörter wird nicht betrachtet. Angenommen ein Benutzer sucht bei Google nach einem T-Shirt in kleinen Konfektionsgrößen und benutzt dafür die Suchphrase T-Shirt in kleinen Größen. Das gewünschte Ergebnis wären T-Shirts die z.B. in den Größen XS-M vorhanden sind und gekauft werden können. Google jedoch führt einen Abgleich der Suchphrase mit den Wörtern in den einzelnen indexierten Dokumenten durch. Dadurch werden Ergebnisse angezeigt, welche die Wörter T-Shirt in kleinen Größen komplett oder zumindest in Teilen enthalten und nicht automatisch das vom User gewünschte Ergebnis.
Des Weiteren ist in Datenbank enthaltene Information problematisch für Webcrawler zu erreichen, da die Daten im anfangs ausgelieferten HTML-Code nicht vorhanden sind. Dieses Problem tritt z.B. häufig bei Online-Bibliotheken auf, die ihre Bücher über eine on-site Suche
erreichbar machen. Auf der Suchseite der Bibliothek ist zunächst nur ein Eingabefeld verfügbar. Erst nachdem eine Suche durchgeführt wurde, werden die Informationen aus der Datenbank geladen und können verwendet werden.
2. Fehlende Delegation
Die Leistung der aktuellen Computer wird bei der Suche im Internet unzureichend benutzt. Alle komplexen Schlussfolgerungen und Verknüpfungen von Informationen werden durch den Benutzer selbst realisiert. Da die Datenmengen immer größer und die Verknüpfungen immer komplexer werden, wird der Aufwand hierfür in Zukunft höher werden. Um weiterhin einen effektiven Zugriff zu gewährleisten ist es wünschenswert, wenn Computer ein bereits höherwertiges Ergebnis liefern können, das dann vom Benutzer weiterverarbeitet wird.
Genau diese aufgezeigten Probleme sollen durch das Semantik Web gelöst werden!
Welche Technologien werden im Semantik Web eingesetzt?
Die die drei Standards microformat, RDFa und microdata zur Definition von Semantik in Webdokumenten existierten zunächst parallel. Im Jahr 2011 jedoch entstand durch die Zusammenarbeit von Google, Yahoo! und Microsoft der sich zurzeit durchsetzende Standard schema.org. Er basiert auf microdata und nutzt HTML-Attribute, die Bestandteil von HTML5 sind. Als Semantik Typen existieren z.B. Product, Event, Review, Video und Breadcrumb.
Wie werden die Suchergebnisse verbessert?
Google, Yahoo! und Microsoft verwenden so genannte Rich Snippets zur Aufwertung der Suchergebnisse. Dafür muss den Suchmaschinen bekannt gemacht werden, welche Bedeutung die Daten auf den Webseiten haben. Folgend werden die vier für den E-Commerce relevanten Rich Snippet Typen vorgestellt.
1. Breadcrumbs
Breadcrumbs helfen dem Benutzer die Navigation besser zu verstehen und sich im Webshop zurechtzufinden. Besonders in Google Suchergebnissen ist dies sinnvoll, da der Benutzer ansonsten nicht weiß, zu welcher Kategorie das Produkt gehört.
2. Produkte
Produkt Rich Snippets geben Informationen zu Produkten bekannt. Dazu gehören Bewertungen, Preis, Verfügbarkeit und viele weitere.
3. Beurteilungen
Beurteilungen sind sinnvoll, wenn z.B. nicht genügend Kundenbewertungen vorhanden sind. Dann können externe oder eigene Testberichte mit Produkten verknüpft werden, um die Besucher von der Qualität zu überzeugen.
4. Videos
Produktvideos werden eingesetzt, um das Einkaufserlebnis für den Besucher zu steigern. Es wird dadurch möglich zusätzliche Sinne, wie z.B. den Gehörsinn, anzusprechen. Ein Effekt wäre die leichtere Überzeugbarkeit des Besuchers von dem Produkt. Lascana verwendet diesen Ansatz bereits.
Gibt es generelle Nachteile des Semantik Web?
Es bestehen je nach Webshop mehrere Nachteile, die im Folgenden kurz erläutert werden:
1. Gefahr der Informationsfreigabe
Zurzeit dient Google als Intermediär zwischen Onlineshops und Konsumenten. Mit der Weitergabe detaillierter Produktdaten an Google werden jedoch viele Informationen freigegeben, die eine ideale Basis für den eigenen Verkauf von Produkten bieten können. Möglich wäre dies z.B. über Google Shopping. Vor allem für Webshops, die keine eigenen Produkte verkaufen, besteht dieses Risiko. Es muss somit immer der tatsächliche Nutzen der Datenweitergabe betrachtet werden.
2. Konsistenz zwischen Suchmaschine und Onlineshop
Suchmaschinen-Crawler besuchen Webshops in regelmäßigen Abständen. Zwischen diesen Abständen werden Änderungen der Daten im Webshop durch die Suchmaschine nicht erkannt und somit dem Suchenden auch nicht angezeigt. Gerade bei der Anzeige von Verfügbarkeiten kann dies zu Inkonsistenzen und unzufriedenen Besuchern führen, wenn Google anzeigt, dass eine Ware verfügbar ist, diese im Webshop jedoch schon ausverkauft ist.
3. Aufwand und Ausgereiftheit
Die Kennzeichnung von Produkten oder anderen Web-Elementen ist immer mit Aufwand verbunden. Deshalb sollte vorab ein Konzept erstellt werden, das die zu kennzeichnenden Elemente bestimmt und den Mehrwert aufzeigt.
In Bezug auf die Ausgereiftheit sollte beachtet werden, dass der schema.org Standard sich gerade erst durchgesetzt hat und dieser sich im Laufe der nächsten Jahre erst etablieren muss.
4. Verständnis der menschlichen Sprache
Die betrachteten Ansätze sind nur ein erster Schritt in Richtung eines semantischen Internets und lassen noch viele Aspekte unbeachtet. Die Darstellung der Webshopdaten für den Benutzer realisieren lediglich die unidirektionale Richtung vom Webshop zum User. Der Webshop ist dadurch immer noch nicht in der Lage, den Menschen besser zu verstehen und dadurch bessere Ergebnisse auf Suchanfragen zu liefern.
Wird das Ranking durch die Verwendung von Semantik Web verbessert?
Google gibt offiziell bekannt, dass Rich Snippets keinen Einfluss auf den Pagerank haben. Es ist jedoch nicht ausgeschlossen, dass der Rankingalgorithmus in nächster Zeit so modifiziert wird, dass semantische Auszeichnungen zur Berechnung einbezogen werden.
Viel spannender sind jedoch die Auswirkungen der Rich Snippets auf die Click-Through-Rate (CTR). Rich Snippets erzeugen aufgrund der aufwendigeren Darstellung in der Regel mehr Aufmerksamkeit als nicht angereicherte Suchergebniseinträge. Auf den Ranks 1-3 konnten Steigerungen von bis zu 100% und auf den Plätzen 3-5 sogar bis zu 200% gemessen werden. Wenn sich ein Onlineshop ohnehin weit vorne in den Suchergebnissen befindet, ist diese erhebliche Erhöhung der CTR um ein Vielfaches effizienter als der Gewinn von wenigen Ranks.
Fazit
Die Möglichkeiten des Semantik Web werden noch nicht voll ausgeschöpft. Lediglich die Anzeige von Informationen des Webshops in den Suchergebnissen wurde verbessert. Weiter bestehen Probleme, wenn der Suchende Suchbegriffe eintippt und erwartet, dass der Webshop diese tatsächlich semantisch verstehen soll. Der entwickelte Standard schema.org ist ein erster Schritt in die praxistaugliche Verwendung des Semantik Web und kann in Zukunft daher auch zum besseren Verständnis des Users seitens des Webshops führen.
[1] Domingue, John, Dieter Fensel und James A Hendler. Handbook of Semantic Web Technologies, Seite 9ff