Bei der Fuzzy-Suche werden Übereinstimmungen gefunden, auch wenn die Suchanfrage nicht perfekt mit den entsprechenden Daten übereinstimmt. Dabei wird nicht nur die wortwörtliche Übereinstimmung von Zeichen geprüft, sondern auch Ergebnisse identifiziert, die der Suchanfrage in Bezug auf Rechtschreibung, Bedeutung oder andere Kriterien ähnlich sind. Das kann besonders nützlich sein, wenn es um Nutzereingaben geht, die Rechtschreibfehler, Variationen (Plural vs. Singular, Abkürzungen, Ableitungen und mehr) und andere Unstimmigkeiten enthalten können, die auf die verschiedenen Kommunikationsweisen von Nutzern zurückzuführen sind.
Stellen Sie sich vor, Sie suchen in einer Datenbank nach „Apfel“. Eine einfachere Suchmaschine liefert möglicherweise nur Einträge zurück, die exakt mit dem Wort „Apfel“ übereinstimmen. Eine Suchmaschine mit unscharfer Suche würde jedoch auch ähnliche Begriffe wie „Äpfel“, „Apfel“ oder sogar „Apel“ als mögliche Übereinstimmungen erkennen, trotz kleiner Rechtschreibfehler.
So kann der Suchumfang erweitert und die Wahrscheinlichkeit erhöht werden, relevante Informationen zu finden, auch wenn der Nutzer einen anderen Begriff verwendet. Es ist, als würde man ein breiteres Netz auswerfen, das nicht nur den genauen Fisch fängt, den man sucht, sondern auch solche, die ihm sehr ähnlich sind.
Eine Fuzzy-Suche kann sich in Situationen als nützlich erweisen, in denen Daten möglicherweise nicht konsistent sind oder Nutzer die genaue Schreibweise des gesuchten Begriffs nicht kennen. Das kann besonders im E-Commerce nützlich sein, um Produkte mit leichten Namensvariationen zu finden, oder in großen Datasets, bei denen eine manuelle Datenbereinigung unpraktisch ist.
Google Cloud-Produkte, die für die Erstellung und Ausführung von Fuzzy-Suchen verwendet werden können, sind Vertex AI, Cloud SQL und Cloud Spanner. Wenn Sie die Fuzzy-Suche für Ihre Anforderungen testen möchten, wenden Sie sich an unser Vertriebsteam oder starten Sie eine kostenlose Testversion.
Bei der Fuzzy-Suche werden verschiedene Algorithmen und Techniken verwendet, um die Ähnlichkeit zwischen zwei Textstrings, der Suchanfrage und dem möglichen Treffer in den Daten zu bestimmen. Diese Algorithmen basieren oft auf Konzepten wie:
Mithilfe dieser Konzepte können Fuzzy-Suchmaschinen mögliche Übereinstimmungen basierend auf ihrer Ähnlichkeit zur ursprünglichen Anfrage sortieren. So erhalten Nutzer eine Reihe relevanter Ergebnisse, auch wenn sie geringfügig von den Suchbegriffen abweichen.
Da Datasets immer größer werden und die Eingaben der Nutzer immer vielfältiger werden, bietet die Fuzzy-Suche einen wertvollen Ansatz, um Informationen effektiv abzurufen. Sie kann die Lücke zwischen den verschiedenen Möglichkeiten, wie Nutzer kommunizieren (oder suchen), und der Art, wie Daten möglicherweise strukturiert und gespeichert wurden, schließen.
Hier sind einige Gründe, warum die Fuzzy-Suche wichtig sein kann:
Der grundlegende Unterschied zwischen der exakten Suche und der Fuzzy-Suche liegt in der Art und Weise, wie sie mit Datenvariationen umgehen. Sehen wir uns die wichtigsten Unterschiede an:
Genaue Suche | Fuzzy-Suche | |
Übereinstimmungskriterien | Erfordert eine genaue Übereinstimmung mit allen Zeichen | Es sind auch Rechtschreibfehler, Varianten und teilweise Übereinstimmungen zulässig. |
Suchbereich | Eingeschränkter, liefert nur genaue Übereinstimmungen | Umfassender, ruft eine größere Bandbreite an Ergebnissen ab |
Anwendungsfälle | Situationen, in denen eine strenge Genauigkeit erforderlich ist, wie Produktkataloge oder Datenbanken in stark regulierten Branchen | Szenarien, in denen Flexibilität und Fehlertoleranz entscheidend sind, wie Suchfelder auf großen Websites |
Genaue Suche
Fuzzy-Suche
Übereinstimmungskriterien
Erfordert eine genaue Übereinstimmung mit allen Zeichen
Es sind auch Rechtschreibfehler, Varianten und teilweise Übereinstimmungen zulässig.
Suchbereich
Eingeschränkter, liefert nur genaue Übereinstimmungen
Umfassender, ruft eine größere Bandbreite an Ergebnissen ab
Anwendungsfälle
Situationen, in denen eine strenge Genauigkeit erforderlich ist, wie Produktkataloge oder Datenbanken in stark regulierten Branchen
Szenarien, in denen Flexibilität und Fehlertoleranz entscheidend sind, wie Suchfelder auf großen Websites
Um die praktischen Anwendungen zu veranschaulichen, sehen wir uns einige Beispiele an, wie die Fuzzy-Suche dabei helfen kann, die Nutzerabsicht hinter verschiedenen Suchanfragen mit relevanten Suchergebnissen abzugleichen.
In diesem Fall erkennt der Algorithmus für die Fuzzy-Suche die Absicht des Nutzers trotz des Tippfehlers und liefert das gewünschte Rezept für Apfelkuchen. Sie erkennt, dass „Afel“ wahrscheinlich eine falsche Schreibweise von „Apfel“ ist, und priorisiert das Ergebnis entsprechend.
Die Fuzzy-Suche berücksichtigt problemlos Pluralformen. Ganz gleich, ob Nutzer nach der Einzahl oder Mehrzahl suchen, die Suchmaschine liefert intelligente Ergebnisse, die der beabsichtigten Bedeutung entsprechen. So finden Nutzer Rezepte, unabhängig von ihrer grammatikalischen Herangehensweise.
Die Fähigkeit, Synonyme zu interpretieren, erweitert den Suchbereich. Die Suchmaschine erkennt, dass „schnelle Mahlzeiten“ und „einfache Abendessen“ konzeptionell ähnlich sind, und liefert relevante Ergebnisse für beide Suchanfragen. So werden die Möglichkeiten über die buchstäblich verwendeten Keywords hinaus erweitert.
Algorithmen verwenden oft Wortstammerkennung, bei der Wörter auf ihre Grundform reduziert werden. So werden beispielsweise „Laufschuhe“ und „Laufschuh“ als Treffer angezeigt, obwohl die Wörter grammatisch unterschiedlich sind. Nutzer können so relevante Produkte finden, auch wenn die Schreibweise leicht variiert.
Das System kann auch Abkürzungen verarbeiten und erkennt, dass „USA“ für „Vereinigte Staaten von Amerika“ steht. Diese Funktion ist besonders in Datenbanken und Suchmaschinen nützlich, in denen häufig Abkürzungen verwendet werden, um Platz zu sparen.
Die Implementierung der Fuzzy-Suche umfasst in der Regel die folgenden Schritte:
Die konkrete Umsetzung kann je nach Anwendung variieren. Vertex AI von Google Cloud kann in seinen Machine-Learning-Workflows Techniken für die Fuzzy-Suche nutzen, um die Genauigkeit des Modells zu verbessern und mit unvollständigen oder inkonsistenten Daten umzugehen. Mithilfe von Fuzzy-Matching können Sie beispielsweise das Feature-Engineering verbessern, indem Sie ähnliche Datenpunkte gruppieren oder Fehler in Trainingsdatensätzen erkennen und korrigieren.
Profitieren Sie von einem Guthaben über 300 $, um Google Cloud und mehr als 20 „Immer kostenlos“-Produkte kennenzulernen.