La búsqueda aproximada es una técnica de búsqueda que encuentra coincidencias incluso cuando la consulta de búsqueda no coincide exactamente con los datos correspondientes. No se limita a buscar coincidencias literales caracter a caracter, sino que identifica resultados similares a la consulta de búsqueda en cuanto a ortografía, significado u otros criterios. Esta opción puede ser especialmente útil cuando se trata de la entrada de los usuarios, que puede incluir cosas como errores tipográficos, variaciones (plural, singular, abreviaturas, términos derivados, etc.) y otras inconsistencias basadas en las diferentes formas en que los usuarios se comunican en general.
Imagina que buscas "manzana" en una base de datos. Un buscador más sencillo puede que solo devuelva entradas que coincidan exactamente con la palabra "manzana". Sin embargo, un buscador con búsqueda aproximada también tendría en cuenta términos similares, como "manzanas", "manzana" o incluso "manza", ya que los reconocería como posibles coincidencias a pesar de las pequeñas variaciones ortográficas.
Este enfoque puede ampliar el ámbito de búsqueda y aumentar las posibilidades de encontrar información pertinente, incluso si el usuario ha escrito la consulta con una ortografía diferente. Es como lanzar una red más grande que no solo capture el pez que estás buscando, sino también otros muy parecidos.
La búsqueda aproximada puede ser útil en situaciones en las que los datos no sean coherentes o cuando los usuarios no sepan cómo se escribe exactamente lo que buscan. Puede ser especialmente útil en el comercio electrónico para encontrar productos con ligeras variaciones en el nombre o en conjuntos de datos grandes en los que no sea práctico limpiar los datos manualmente.
Los productos de Google Cloud que se pueden usar para crear y ejecutar búsquedas aproximadas son Vertex AI, Cloud SQL y Cloud Spanner. Para descubrir la búsqueda aproximada que mejor se adapta a tus necesidades, ponte en contacto con nuestro equipo de Ventas o empieza tu prueba por 0 €.
Las búsquedas aproximadas utilizan varios algoritmos y técnicas para determinar la similitud entre dos cadenas de texto: la consulta de búsqueda y la coincidencia potencial en los datos. Estos algoritmos suelen basarse en conceptos como los siguientes:
Al utilizar este tipo de conceptos, los buscadores de búsqueda aproximada pueden clasificar las posibles coincidencias según su similitud con la consulta original, lo que ayuda a los usuarios a ver una serie de resultados relevantes, aunque contengan variaciones menores con respecto a los términos de búsqueda.
A medida que los conjuntos de datos crecen y las entradas de los usuarios se diversifican, la búsqueda aproximada ofrece un enfoque valioso para recuperar información de forma eficaz. Puede ayudar a salvar la brecha entre las diversas formas en que los usuarios se comunican (o buscan) y la forma en que los datos se han estructurado y almacenado.
Estos son los motivos por los que es importante la búsqueda aproximada:
La diferencia fundamental entre la búsqueda exacta y la búsqueda aproximada radica en cómo gestionan las variaciones en los datos. Veamos las principales diferencias:
Búsqueda exacta | Búsqueda aproximada | |
Criterios de concordancia | Requiere una coincidencia exacta carácter a carácter | Permite errores tipográficos, variaciones y coincidencias parciales |
Ámbito de búsqueda | Más restrictiva, devuelve solo coincidencias precisas | Más extensa, devuelve una gama más amplia de resultados |
Casos prácticos | Situaciones que requieren una precisión estricta, como catálogos de productos o bases de datos de sectores muy regulados | Situaciones en las que la flexibilidad y la tolerancia a los errores son fundamentales, como las barras de búsqueda de sitios web de gran tamaño |
Búsqueda exacta
Búsqueda aproximada
Criterios de concordancia
Requiere una coincidencia exacta carácter a carácter
Permite errores tipográficos, variaciones y coincidencias parciales
Ámbito de búsqueda
Más restrictiva, devuelve solo coincidencias precisas
Más extensa, devuelve una gama más amplia de resultados
Casos prácticos
Situaciones que requieren una precisión estricta, como catálogos de productos o bases de datos de sectores muy regulados
Situaciones en las que la flexibilidad y la tolerancia a los errores son fundamentales, como las barras de búsqueda de sitios web de gran tamaño
Para ilustrar sus aplicaciones prácticas, veamos algunos ejemplos de cómo la búsqueda aproximada puede ayudar a hacer coincidir la intención del usuario detrás de diferentes consultas de búsqueda con resultados de búsqueda relevantes.
En este caso, aunque haya un error tipográfico, el algoritmo de búsqueda aproximada reconoce la intención del usuario y le muestra la receta de tarta de manzana que busca. Entiende que "tart" es probablemente un error ortográfico de "tarta" y prioriza el resultado en consecuencia.
La búsqueda aproximada gestiona las variaciones en la forma plural de las palabras. Tanto si el usuario busca la forma singular como la plural, el buscador recupera de forma inteligente los resultados que coinciden con el significado que se pretende, lo que garantiza que los usuarios encuentren recetas independientemente de su enfoque gramatical.
La capacidad de interpretar sinónimos amplía el ámbito de búsqueda. El motor reconoce que "ideas para comidas rápidas" y "recetas para cenas fáciles" son conceptualmente similares y proporciona resultados relevantes para ambas, ampliando las posibilidades más allá de las palabras clave literales que se han usado.
Los algoritmos suelen emplear el procesamiento por lexemas, que reduce las palabras a su forma básica o raíz. De esta forma, la búsqueda puede hacer coincidir "zapatillas de correr" con "zapato correr", aunque las palabras sean gramaticalmente distintas, y así los usuarios encontrarán productos relevantes independientemente de las variaciones menores.
El sistema gestiona eficazmente las abreviaturas y reconoce que "EE. UU." se refiere a "Estados Unidos de América". Esta función es especialmente útil en bases de datos y buscadores, donde se utilizan con frecuencia abreviaturas para ahorrar espacio.
Implementar la búsqueda aproximada suele implicar los siguientes pasos:
Aunque la implementación concreta puede variar en función de la aplicación, Vertex AI de Google Cloud puede aprovechar las técnicas de búsqueda aproximada en sus flujos de trabajo de aprendizaje automático para mejorar la precisión de los modelos y gestionar datos inconsistentes o con ruido. Por ejemplo, la coincidencia aproximada puede mejorar la ingeniería de funciones agrupando puntos de datos similares o identificando y corrigiendo errores en los conjuntos de datos de entrenamiento.
Empieza a crear en Google Cloud con 300 USD en crédito gratis y más de 20 productos Always Free.