Qu'est-ce que la recherche approximative ?

Dernière mise à jour : 14/1/2026

La recherche approximative est une technique de recherche qui trouve des correspondances même lorsque la requête de recherche ne correspond pas parfaitement aux données correspondantes. Elle ne se contente pas de rechercher des correspondances caractère par caractère, mais identifie les résultats qui sont similaires à la requête de recherche en termes de graphie, de sens ou d'autres critères. Cela peut être particulièrement utile lorsque vous traitez des données utilisateur, qui peuvent inclure des fautes de frappe, des variations (pluriel/singulier, abréviations, dérivation, etc.) et d'autres incohérences dues aux différentes façons dont les utilisateurs communiquent.

Imaginez que vous cherchez le mot "pomme" dans une base de données. Un moteur de recherche plus simple peut ne renvoyer que des entrées correspondant exactement au mot "pomme". Toutefois, un moteur de recherche approximative prendrait également en compte des termes similaires comme "pommes", "pome" ou même "poomme", et les reconnaîtrait comme des correspondances potentielles malgré des variations mineures d'orthographe.

Cette approche peut élargir la portée de la recherche et augmenter les chances de trouver des informations pertinentes, même si l'utilisateur a utilisé une orthographe différente dans sa requête. C'est comme lancer un filet plus large qui capture non seulement le poisson que vous recherchiez, mais aussi ceux qui lui ressemblent le plus.

La recherche approximative peut s'avérer utile dans les cas où les données sont incohérentes ou lorsque les utilisateurs ne connaissent pas l'orthographe exacte de ce qu'ils recherchent. Cette fonctionnalité peut être particulièrement utile dans le secteur de l'e-commerce pour trouver des produits dont le nom présente de légères variations, ou dans les ensembles de données volumineux où le nettoyage manuel des données est peu pratique.

Les produits Google Cloud qui peuvent être utilisés pour créer et exécuter une recherche approximative sont Vertex AI, Cloud SQL et Cloud Spanner. Pour découvrir les solutions de recherche approximative adaptées à vos besoins, contactez notre équipe commerciale ou lancez votre essai gratuit.

Comment fonctionnent les recherches approximatives ?

Les recherches approximatives utilisent divers algorithmes et techniques pour déterminer la similitude entre deux chaînes de texte, la requête de recherche et la correspondance potentielle dans les données. Ces algorithmes s'appuient souvent sur des concepts tels que :

Distance de Levenshtein : détermine le nombre minimal de modifications (insertions, suppressions ou substitutions) nécessaires pour transformer une chaîne en une autre. Plus la distance de Levenshtein est faible, plus la similarité est grande. Par exemple, les mots "kitten" et "sitting" ont une distance de Levenshtein de 3.
Similarité cosinus : cette méthode calcule le cosinus de l'angle entre deux vecteurs représentant les mots ou les chaînes. Une similarité cosinus de 1 représente une correspondance exacte, tandis que 0 indique l'absence de similarité. Cette méthode est souvent utilisée pour comparer des documents en fonction de leur contenu textuel.
Algorithmes phonétiques : ces techniques, comme Soundex ou Metaphone, encodent les mots en fonction de leur prononciation. Cela permet de trouver des mots qui se prononcent de la même façon, même s'ils s'écrivent différemment, comme "Smith" et "Smyth".

Grâce à ces concepts, les moteurs de recherche de correspondance partielle peuvent classer les correspondances potentielles en fonction de leur proximité avec la requête d'origine. Les utilisateurs peuvent ainsi voir un éventail de résultats pertinents, même s'ils comportent des variations mineures par rapport à leurs termes de recherche.

Pourquoi la recherche approximative est-elle importante ?

À mesure que les ensembles de données s'étoffent et que les saisies des utilisateurs se diversifient, la recherche approximative offre une approche intéressante pour récupérer des informations efficacement. Elle peut aider à combler l'écart entre les différentes façons dont les utilisateurs communiquent (ou effectuent des recherches) et la façon dont les données ont pu être structurées et stockées.

Voici pourquoi la recherche approximative peut être importante :

Facilité d'utilisation : la recherche approximative tient compte des fautes de frappe, des variantes de mots ou des erreurs d'orthographe. Les utilisateurs peuvent ainsi trouver plus facilement ce qu'ils recherchent sans avoir à connaître l'orthographe ou la formulation exacte. Cela peut rendre la recherche plus fluide et plus rapide.
Amélioration de la pertinence des recherches : en tenant compte des variantes et des synonymes, la recherche approximative permet de récupérer un plus grand nombre de résultats pertinents qui auraient pu être ignorés par les recherches exactes.
Amélioration de la visibilité des données : dans les ensembles de données volumineux comportant des incohérences ou des variations potentielles dans la saisie des données, la recherche approximative permet de découvrir des liens cachés et de récupérer des informations pertinentes qui auraient pu être ignorées.

Quelle est la différence entre la recherche exacte et la recherche approximative ?

La différence fondamentale entre la recherche exacte et la recherche approximative réside dans la façon dont elles gèrent les variations dans les données. Examinons les principales différences :

	Recherche exacte	Recherche de correspondance partielle
Critères de correspondance	Nécessite une correspondance exacte, caractère pour caractère	Permet les fautes de frappe, les variations et les correspondances partielles
Portée de la recherche	Plus précis, ne renvoie que les correspondances exactes	Plus large, il renvoie un plus grand nombre de résultats.
Cas d'utilisation	Situations nécessitant une grande précision, comme les catalogues de produits ou les bases de données dans des secteurs très réglementés	Scénarios où la flexibilité et la tolérance aux erreurs sont essentielles, comme les barres de recherche sur les grands sites Web

Recherche exacte

Recherche de correspondance partielle

Critères de correspondance

Nécessite une correspondance exacte, caractère pour caractère

Permet les fautes de frappe, les variations et les correspondances partielles

Portée de la recherche

Plus précis, ne renvoie que les correspondances exactes

Plus large, il renvoie un plus grand nombre de résultats.

Cas d'utilisation

Situations nécessitant une grande précision, comme les catalogues de produits ou les bases de données dans des secteurs très réglementés

Scénarios où la flexibilité et la tolérance aux erreurs sont essentielles, comme les barres de recherche sur les grands sites Web

Il est essentiel de comprendre les différences entre la recherche exacte et la recherche approximative pour sélectionner la technique appropriée à une tâche donnée. La recherche exacte est adaptée aux situations qui nécessitent une grande précision, tandis que la recherche approximative excelle dans la gestion des erreurs ou des variations de l'utilisateur, et dans la recherche d'informations pertinentes malgré les incohérences.

Exemples de recherche de correspondance partielle

Pour illustrer ses applications pratiques, voyons comment la recherche approximative peut aider à faire correspondre l'intention de l'utilisateur derrière différentes requêtes de recherche avec des résultats de recherche pertinents.

Typos

Recherche de l'utilisateur : "tarte aux pomes"
Résultats de la recherche approximative : "tarte aux pommes"

Dans ce cas, malgré la faute de frappe, l'algorithme de recherche approximative reconnaît l'intention de l'utilisateur et fournit la recette souhaitée pour la tarte aux pommes. Il comprend qu'il s'agit probablement d'une faute d'orthographe et donne la priorité au résultat correspondant.

Singuliers et pluriels

Recherche de l'utilisateur : "recette"
Résultats de la recherche approximative : "recettes"

La recherche approximative gère parfaitement les variations de pluriel. Que l'utilisateur recherche le singulier ou le pluriel, le moteur de recherche récupère intelligemment les résultats qui correspondent au sens voulu, ce qui permet aux utilisateurs de trouver des recettes quelle que soit leur approche grammaticale.

Synonymes

Recherches de l'utilisateur : "idées de repas rapides"
La recherche approximative trouve : "recettes faciles pour le dîner"

La capacité à interpréter les synonymes élargit le champ de recherche. Le moteur reconnaît que les expressions "idées de repas rapides" et "recettes faciles pour le dîner" sont conceptuellement similaires et fournit des résultats pertinents pour les deux, élargissant ainsi les possibilités au-delà des mots clés utilisés.

Recherche de radical

Recherches de l'utilisateur : "chaussures de course"
Résultats de la recherche approximative : "chaussure de course à pieds"

Les algorithmes utilisent souvent la dérivation, qui réduit les mots à leur forme de base ou racine. La recherche peut ainsi faire correspondre "chaussures de course" et "chaussures de course à pied", même si ces mots sont grammaticaux différents. Les utilisateurs trouvent ainsi des produits pertinents, quelles que soient les variantes mineures.

Abréviations

Recherches de l'utilisateur : "USA"
Résultats de la recherche approximative : "États-Unis d'Amérique"

Le système gère efficacement les abréviations et reconnaît que "USA" fait référence aux "États-Unis d'Amérique". Cette fonctionnalité est particulièrement utile dans les bases de données et les moteurs de recherche, où les abréviations sont fréquemment utilisées pour gagner en concision.

Comment la recherche approximative est-elle implémentée ?

L'implémentation d'une recherche approximative implique généralement les étapes suivantes :

Prétraitement des données : cette étape consiste à nettoyer et à normaliser les données dans une certaine mesure. Par exemple, vous pouvez convertir le texte en minuscules, supprimer les signes de ponctuation ou appliquer des techniques de dérivation. Même si la recherche approximative tolère les variations, un prétraitement de base peut améliorer son efficacité.
Indexation : les données prétraitées sont indexées, souvent à l'aide de structures de données spécialisées telles que des index inversés ou des structures de tri. Ces structures permettent de récupérer rapidement les correspondances potentielles pour une requête donnée.
Calcul de la similarité : lorsqu'un utilisateur envoie une requête, l'algorithme de recherche approximative calcule les scores de similarité entre la requête et les données indexées. Pour ce faire, nous utilisons des algorithmes tels que la distance de Levenshtein, la similarité cosinus ou des algorithmes de reconnaissance vocale afin de quantifier le degré de correspondance.
Classement et récupération : les correspondances potentielles sont classées en fonction de leur score de similarité. Les résultats les mieux classés sont récupérés et présentés à l'utilisateur.

Comment Vertex AI exploite-t-il la recherche approximative ?

L'implémentation spécifique peut varier en fonction de l'application, mais Vertex AI de Google Cloud peut exploiter les techniques de recherche floue dans ses workflows de machine learning pour améliorer la précision du modèle et gérer les données incohérentes ou bruitées. Par exemple, la correspondance approximative peut améliorer l'extraction de caractéristiques en regroupant des points de données similaires ou en identifiant et en corrigeant les erreurs dans les ensembles de données d'entraînement.

Passez à l'étape suivante

Commencez à créer des applications sur Google Cloud avec 300 $ de crédits inclus et plus de 20 produits toujours sans frais.

Vous avez besoin d'aide pour démarrer ?
Contacter le service commercial
Faites appel à un partenaire de confiance
Trouver un partenaire
Poursuivez vos recherches
Voir tous les produits