Kriterien für eine gute interne Produktsuche

Shopanbieter.de interviewt Stefan Grimm, Geschäftsführer der GKS Handels GmbH

Mittlerweile hat sich ja breitflächig die Erkenntnis durchgesetzt, wie wichtig eine gute funktionierende interne Shopsuche ist. Insbesondere bei größeren Prodkutmengen. Auch die Zahl der Suchtechnlogieanbieter wird stetig größer. Aus gegebenen Anlass befragten wir Stefan Grimm, den Geschäftsführer vom B2B-Portal Restposten.de worauf es aus seiner Sicht bei dem Thema ankommt. Restposten.de verzeichnet zwischen 750.000 und 950.000 Besucher pro Monat. Vor der saisonalen Sommer-Abschwächung waren es laut Eigenaussage sogar knapp eine Million Besucher pro Monat.

1. Millionen von Suchtreffer als Testbasis

Da die Suche als Echtzeit Suche funktioniert, können die Requests nicht mehr in der Art validiert werden, wie bei einer Suche über die Enter Taste als Auslöser. Durch jeden neu eingegebenen Buchstaben in der Suche, wird das Suchergebnis neu verfeinert. Die Zahl dieser Aktualisierungen einer Suchergebnisliste würde aber nicht die Zahl der echten Suche wiedergeben, denn der Begriff „Damen Schuhe“ produziert alleine schon 10 Aktualisierungen / neue Suchen, während seiner Eingabe.

Was wir sagen können, wir liefern über die Echtzeit Suche jeden Monat viele Millionen Suchtreffer / Ergebnisse aus.

Aus den Suchergebnissen wird dann bei entsprechendem Interesse die Produkt Detailseiten aufgerufen, in denen der Nutzer z.B, auch die Adresse des Lieferanten erfährt. Nur aus der Echtzeitsuche heraus, werden jedem Monat Produktdetailseiten im deutlich sechsstelligen Bereich (mehr als eine viertel Millionen) aufgerufen.

Gleichzeitig wurden in diesem Bereich Testmessungen durchgeführt und übliche Suchbegriffe und den Klickpfad zu bestimmten Referenzprodukten nachgemessen.

Durch die Linguistik unserer Suche, die integrierten Wortvorschläge und die interaktiven Filter sind die User in der Lage die Ergebnismenge mit wenigen Klicks deutlich zu reduzieren.

Bei unseren Referenzmessungen ist die Zahl der nötigen Klicks bis zum gewünschten Ergebnis dramatisch gesunken bzw. kann die Ergebnismenge sofort so eingegrenzt werden, dass nur noch passende Ergebnisse ausgeliefert werden.

70 – 90% schneller zum Ziel

Unter 100 durchgeführten Referenzsuchen war das schlechteste Ergebnis ein gemessener Zeitvorteil von 50% der Suchzeit, in keinem Fall hat die Ergebnisfindung länger gebraucht. In der Regel erhält der User in 70-90% schnellerer Zeit eine hoch relevante Ergebnisliste ausgeliefert, in der er alle benötigten Angebotsdetails übersichtlich angezeigt bekommt.

Besonders durch die Ausgabe des Ergebnisses während des Tippens, werden die Schreibfehler, die unsere Suchengine selbst nicht kompensieren kann, in der Regel sofort erkannt und vom Nutzer korrigiert. Bei klassischen Suchsystemen erfolgt die „Fehlerausgabe“ erst nach dem Auslösen der Suche und stiftet zusätzlich unnötiges Frustrationspotential auf Seiten des Users.

Als harte Zahl aus zig Millionen Usern können wir mitteilen, dass die Absprungrate aus der Suchfunktion nach Einführung der neuen Suche um 25% gesunken ist. Dies ist für uns eines der wichtigsten Ergebnisse nach Umstellung auf die Echtzeit Suche.

2. Indizierungszeit der Datenbasis

Als Portalbetreiber müssen wir natürlich dafür Sorge tragen, dass die hohe Frequenz in der Aktualisierung und im Wechsel der Angebote in kürzester Zeit auch in der Echtzeitsuche abgebildet werden. Aus diesem Grund ist die schnelle Indizierungszeit der Datenbasis eine Entscheidungsgröße für die Hitengine der Firma Weitkämper Technology gewesen. Auf Restposten.de müssen wir täglich zwischen 15.000 und 50.000 Produktaktualisierungen verarbeiten, dafür muss die Indizierungsgeschwindigkeit der Suchmaschine sehr schnell sein.

3. Performance unter Volllast

Zweites Hauptkriterium, ist die Performance unter Last. Viele Suchfunktionen können in einer Testumgebung gute Ergebnisse in der Performance erreichen, worauf es jedoch tatsächlich ankommt ist die Frage, wie arbeitet die eingesetzte Engine in den Peak Zeiten. Also gerade in der Zeit, in der die meisten User etwas auf der Seite suchen, muss  die Ausgabegeschwindigkeit weiterhin extrem schnell sein. Hier kann die Entscheidung für die falsche Suchengine schnell dazu führen, dass extrem teure High-Performance Webserver für die Peaks in Betrieb genommen werden müssen, weil die eingesetzte Engine nicht sparsam genug mit den Hardware Ressourcen umgeht.

Dabei ist z.B. besonders zu beachten, wie die Suchengine reagiert, wenn einerseits gerade wieder eine neue Datenbasis auf den Server geschrieben wird, gleichzeitig aber viele Abfragen an das System gestellt werden. Gerade in dieser täglichen Praxissituation einer Handelsplattform zeigen viele Systeme große Schwächen. Denn wir können die neue Datenbasis natürlich nicht Nachts auf den Server schreiben, wenn wenig los ist, sondern müssen die Datenbasis alle paar Minuten aktualisieren.

4. Ergebnisqualität Tippfehler / Wortstammerkennung / Fehlertoleranz

Das immer gleiche Problem beim Aufsetzen einer Suche ist die Schärfe, in der die Ergebnisse gefiltert werden. Wird die Suche zu tolerant gestaltet, dann ist die Ergebnismenge zu groß und der User springt ab, weil er nicht gefunden hat, was er sucht. Ist die Toleranz zu gering, also die Suche zu scharf, dann werden unter Umständen passende Ergebnisse nicht ausgegeben und der User springt ab, weil das Angebot zu klein ist.

Insbesondere als Portalbetreiber standen wir vor der Aufgabe eine Suche zu integrieren, die der Tatsache gerecht wird, dass Nutzer aus aktuell 87 Ländern auf unserer Plattform suchen – und zwar alle in deutscher Sprache. Wir haben also einen hohen Anteil von Nutzern mit unterschiedlichsten sprachlichen Prägungen, die eins gemein haben, deutsch ist bei den meisten nicht ihre Muttersprache, aber sie suchen attraktive Produktangebote auf RESTPOSTEN.de.

Aber natürlich ist die Lösung dieses Problems auch eine riesige Aufgabe für jeden national agierenden Onlineshop, denn wer als Betreiber eines Online Dienstes nicht in der Lage ist ein verwendetes Synonym zum passenden Ergebnis zu führen oder Defizit in der Sprache auszugleichen, der verliert seine Kunden und produziert ein hohes Frustrationspotential, das den Nutzer davon abhält wieder zu kommen.

Die Pflege von Tippfehlern und Synonymen ist für einen Online-Shop mit begrenztem Angebot unter Umständen noch eine Aufgabe, die erfüllt werden kann. Doch selbst hier ist eine manuelle Pflege sehr aufwändig und muss von sehr gut ausgebildetem und damit auch teuren Mitarbeitern erledigt werden. Solche Pflege- und Optimierungsaufwendungen sind jedoch erst einmal „versteckte Kosten“, die in der Entscheidung für ein Suchsystem gerne unberücksichtigt bleiben.

Wir als Plattformbetreiber haben jedoch die Aufgabe die Fremdinhalte unserer Anbieter, die bereits unterschiedlichsten sprachlichen Prägungen unterliegen mit dem Suchverhalten einer großen Breite von Einkäufern zusammen zu führen.

Hier ist natürlich auch eine manuelle Pflege von Synonymen und Verweisen hilfreich und unverzichtbar, doch die Hauptarbeit muss von einer Suchengine erledigt werden, die im ersten Schritt fehlertolerant den Wortstamm des Suchbegriffes erkennt um dann das daraus resultierende scharfe Ergebnis über Singular- Plural und Synonymfilter mit zusätzlichen Ergebnissen anzureichern.

Wir haben vor unserer Entscheidung für die jetzt eingesetzte Suchtechnologie in einem Team mit einer Datenbasis von hunderttausenden Angeboten und abertausenden von archivierten Suchanfragen den Pflegeaufwand und die Ergebnisqualität unterschiedlicher Systeme ausgewertet und miteinander verglichen. Klarer Sieger war hier die Hitengine.

Besonders die manuelle Verarbeitung von Synonymlisten muss mit großer Sorgfalt erledigt werden, denn Zirkelverweise und explodierende Ergebnismengen müssen unbedingt vermieden werden.

5. Innovativ

Vor der Integration einer Suche in Echtzeit, ohne Enter-Taste, haben wir viel diskutiert. Nach annähernd zwei Jahren Betrieb (Start 17.12.2009) müssen wir jedoch sagen, die Entscheidung war goldrichtig. Dass Google mittlerweile auch die Echtzeitsuche eingeführt hat, hat es uns natürlich leichter gemacht, denn so wurden die User weltweit an diese Systematik gewöhnt und konnten die Suche auf unserer Plattform intuitiv richtig bedienen.

Eigenen Messungen nach, hat sich die Zeit bis zum Suchtreffer zwischen 50-90% verkürzt, bei gleichzeitig deutlich verbesserter Ergebnisqualität.

Oktober 2011