La recherche approximative est une technique de recherche qui trouve des correspondances même lorsque la requête de recherche ne correspond pas parfaitement aux données correspondantes. Elle ne se contente pas de rechercher des correspondances caractère par caractère, mais identifie les résultats qui sont similaires à la requête de recherche en termes de graphie, de sens ou d'autres critères. Cela peut être particulièrement utile lorsque vous traitez des données utilisateur, qui peuvent inclure des fautes de frappe, des variations (pluriel/singulier, abréviations, dérivation, etc.) et d'autres incohérences dues aux différentes façons dont les utilisateurs communiquent.
Imaginez que vous cherchez le mot "pomme" dans une base de données. Un moteur de recherche plus simple peut ne renvoyer que des entrées correspondant exactement au mot "pomme". Toutefois, un moteur de recherche approximative prendrait également en compte des termes similaires comme "pommes", "pome" ou même "poomme", et les reconnaîtrait comme des correspondances potentielles malgré des variations mineures d'orthographe.
Cette approche peut élargir la portée de la recherche et augmenter les chances de trouver des informations pertinentes, même si l'utilisateur a utilisé une orthographe différente dans sa requête. C'est comme lancer un filet plus large qui capture non seulement le poisson que vous recherchiez, mais aussi ceux qui lui ressemblent le plus.
La recherche approximative peut s'avérer utile dans les cas où les données sont incohérentes ou lorsque les utilisateurs ne connaissent pas l'orthographe exacte de ce qu'ils recherchent. Cette fonctionnalité peut être particulièrement utile dans le secteur de l'e-commerce pour trouver des produits dont le nom présente de légères variations, ou dans les ensembles de données volumineux où le nettoyage manuel des données est peu pratique.
Les produits Google Cloud qui peuvent être utilisés pour créer et exécuter une recherche approximative sont Vertex AI, Cloud SQL et Cloud Spanner. Pour découvrir les solutions de recherche approximative adaptées à vos besoins, contactez notre équipe commerciale ou lancez votre essai gratuit.
Les recherches approximatives utilisent divers algorithmes et techniques pour déterminer la similitude entre deux chaînes de texte, la requête de recherche et la correspondance potentielle dans les données. Ces algorithmes s'appuient souvent sur des concepts tels que :
Grâce à ces concepts, les moteurs de recherche de correspondance partielle peuvent classer les correspondances potentielles en fonction de leur proximité avec la requête d'origine. Les utilisateurs peuvent ainsi voir un éventail de résultats pertinents, même s'ils comportent des variations mineures par rapport à leurs termes de recherche.
À mesure que les ensembles de données s'étoffent et que les saisies des utilisateurs se diversifient, la recherche approximative offre une approche intéressante pour récupérer des informations efficacement. Elle peut aider à combler l'écart entre les différentes façons dont les utilisateurs communiquent (ou effectuent des recherches) et la façon dont les données ont pu être structurées et stockées.
Voici pourquoi la recherche approximative peut être importante :
La différence fondamentale entre la recherche exacte et la recherche approximative réside dans la façon dont elles gèrent les variations dans les données. Examinons les principales différences :
Recherche exacte | Recherche de correspondance partielle | |
Critères de correspondance | Nécessite une correspondance exacte, caractère pour caractère | Permet les fautes de frappe, les variations et les correspondances partielles |
Portée de la recherche | Plus restreint, renvoie uniquement les correspondances exactes | Plus large, il renvoie un plus grand nombre de résultats. |
Cas d'utilisation | Situations nécessitant une grande précision, comme les catalogues de produits ou les bases de données dans des secteurs très réglementés | Scénarios où la flexibilité et la tolérance aux erreurs sont essentielles, comme les barres de recherche sur les grands sites Web |
Recherche exacte
Recherche de correspondance partielle
Critères de correspondance
Nécessite une correspondance exacte, caractère pour caractère
Permet les fautes de frappe, les variations et les correspondances partielles
Portée de la recherche
Plus restreint, renvoie uniquement les correspondances exactes
Plus large, il renvoie un plus grand nombre de résultats.
Cas d'utilisation
Situations nécessitant une grande précision, comme les catalogues de produits ou les bases de données dans des secteurs très réglementés
Scénarios où la flexibilité et la tolérance aux erreurs sont essentielles, comme les barres de recherche sur les grands sites Web
Pour illustrer ses applications pratiques, voyons comment la recherche approximative peut aider à faire correspondre l'intention de l'utilisateur derrière différentes requêtes de recherche avec des résultats de recherche pertinents.
Dans ce cas, malgré la faute de frappe, l'algorithme de recherche approximative reconnaît l'intention de l'utilisateur et fournit la recette souhaitée pour la tarte aux pommes. Il comprend qu'il s'agit probablement d'une faute d'orthographe et donne la priorité au résultat correspondant.
La recherche approximative gère parfaitement les variations de pluriel. Que l'utilisateur recherche le singulier ou le pluriel, le moteur de recherche récupère intelligemment les résultats qui correspondent au sens voulu, ce qui permet aux utilisateurs de trouver des recettes quelle que soit leur approche grammaticale.
La capacité à interpréter les synonymes élargit le champ de recherche. Le moteur reconnaît que les expressions "idées de repas rapides" et "recettes faciles pour le dîner" sont conceptuellement similaires et fournit des résultats pertinents pour les deux, élargissant ainsi les possibilités au-delà des mots clés utilisés.
Les algorithmes utilisent souvent la dérivation, qui réduit les mots à leur forme de base ou racine. La recherche peut ainsi faire correspondre "chaussures de course" et "chaussures de course à pied", même si ces mots sont grammaticaux différents. Les utilisateurs trouvent ainsi des produits pertinents, quelles que soient les variantes mineures.
Le système gère efficacement les abréviations et reconnaît que "USA" fait référence aux "États-Unis d'Amérique". Cette fonctionnalité est particulièrement utile dans les bases de données et les moteurs de recherche, où les abréviations sont fréquemment utilisées pour gagner en concision.
L'implémentation d'une recherche approximative implique généralement les étapes suivantes :
L'implémentation spécifique peut varier en fonction de l'application, mais Vertex AI de Google Cloud peut exploiter les techniques de recherche floue dans ses workflows de machine learning pour améliorer la précision du modèle et gérer les données incohérentes ou bruitées. Par exemple, la correspondance approximative peut améliorer l'extraction de caractéristiques en regroupant des points de données similaires ou en identifiant et en corrigeant les erreurs dans les ensembles de données d'entraînement.
Profitez de 300 $ de crédits gratuits et de plus de 20 produits Always Free pour commencer à créer des applications sur Google Cloud.