La búsqueda parcial es una técnica de búsqueda que encuentra coincidencias incluso cuando la búsqueda no coincide perfectamente con los datos correspondientes. Va más allá de la concordancia literal de carácter por carácter y, además, identifica resultados que son similares a la búsqueda en términos de ortografía, significado o cualquier otros criterios. Esto puede ser especialmente útil cuando se trata de la entrada del usuario, que puede incluir elementos como errores tipográficos, variaciones (plural frente a singular, abreviaturas, derivación y más) y otras inconsistencias basadas en las diferentes formas en que los usuarios se comunican en general.
Imagina que buscas “manzana” en una base de datos. Un motor de búsqueda más simple solo puede devolver entradas que coincidan exactamente con la palabra “manzana”. Sin embargo, un motor con búsqueda parcial también consideraría términos similares como “manzanas”, “manzana” o incluso “manzanas”, y los reconocería como posibles coincidencias a pesar de las variaciones ortográficas menores.
Este enfoque puede ampliar el alcance de la búsqueda y aumentar las posibilidades de encontrar información pertinente, incluso si el usuario escribe la consulta de forma diferente. Es como lanzar una red más amplia que captura no solo el pez exacto que buscabas, sino también aquellos que se parecen mucho a él.
La búsqueda parcial puede ser valiosa en situaciones en las que los datos pueden ser inconsistentes o cuando los usuarios no conocen la ortografía exacta de lo que buscan. Puede ser especialmente valioso en el comercio electrónico para encontrar productos con variaciones leves en el nombre o en conjuntos de datos grandes en los que la limpieza manual de datos no es práctica.
Los productos de Google Cloud que se pueden usar para crear y ejecutar la búsqueda parcial incluyen Vertex AI, Cloud SQL y Cloud Spanner. Para explorar la búsqueda parcial para tus necesidades, comunícate con nuestro equipo de ventas o comienza tu prueba gratuita.
Las búsquedas aproximadas emplean varios algoritmos y técnicas para determinar la similitud entre dos cadenas de texto, la búsqueda y la posible coincidencia en los datos. Estos algoritmos suelen basarse en conceptos como los siguientes:
Con este tipo de conceptos, los motores de búsqueda parcial pueden clasificar las posibles coincidencias según su similitud con la búsqueda original, lo que ayuda a los usuarios a ver una variedad de resultados pertinentes, incluso si contienen variaciones menores de sus términos de búsqueda.
A medida que los conjuntos de datos crecen y las entradas de los usuarios se vuelven más diversas, la búsqueda parcial ofrece un enfoque valioso para recuperar información de forma eficaz. Puede ayudar a cerrar la brecha entre las diversas formas en que los usuarios se comunican (o buscan) y la forma en que los datos pueden haberse estructurado y almacenado.
Estas son las razones por las que la búsqueda parcial puede ser importante:
La diferencia fundamental entre la búsqueda exacta y la búsqueda parcial radica en cómo manejan las variaciones en los datos. Veamos las diferencias clave:
Búsqueda exacta | Búsqueda parcial | |
Criterios de coincidencia | Requiere una concordancia exacta, carácter por carácter | Permite errores tipográficos, variaciones y concordancias parciales |
Alcance de la búsqueda | Más específico, devuelve solo concordancias precisas | Más amplia, recupera un rango más amplio de resultados |
Casos de uso | Situaciones que exigen una exactitud estricta, como catálogos de productos o bases de datos en industrias con una reglamentación estricta | Situaciones en las que la flexibilidad y la tolerancia a errores son fundamentales, como las barras de búsqueda en sitios web grandes |
Búsqueda exacta
Búsqueda parcial
Criterios de coincidencia
Requiere una concordancia exacta, carácter por carácter
Permite errores tipográficos, variaciones y concordancias parciales
Alcance de la búsqueda
Más específico, devuelve solo concordancias precisas
Más amplia, recupera un rango más amplio de resultados
Casos de uso
Situaciones que exigen una exactitud estricta, como catálogos de productos o bases de datos en industrias con una reglamentación estricta
Situaciones en las que la flexibilidad y la tolerancia a errores son fundamentales, como las barras de búsqueda en sitios web grandes
Para ilustrar sus aplicaciones prácticas, exploremos algunos ejemplos de cómo la búsqueda parcial puede ayudar a hacer coincidir la intención del usuario detrás de diferentes búsquedas con resultados de la búsqueda pertinentes.
En este caso, incluso con el error tipográfico, el algoritmo de búsqueda parcial reconoce la intención del usuario y entrega la receta deseada de pastel de manzana. Comprende que es probable que "aple" sea una ortografía incorrecta de "apple" y prioriza el resultado en consecuencia.
La búsqueda parcial maneja sin problemas las variaciones en la pluralidad. Ya sea que el usuario busque el singular o el plural, el motor de búsqueda recupera de forma inteligente los resultados que coinciden con el significado deseado, lo que garantiza que los usuarios encuentren recetas sin importar su enfoque gramatical.
La capacidad de interpretar sinónimos amplía el alcance de la búsqueda. El motor reconoce que las frases “ideas de comidas rápidas” y “recetas de cenas fáciles” son similares en el concepto y proporciona resultados pertinentes para ambas, lo que expande las posibilidades más allá de las palabras clave literales que se usan.
Los algoritmos suelen emplear la derivación, que reduce las palabras a su forma base o raíz. Esto permite que la búsqueda haga coincidir "zapatos para correr" con "calzado para correr", aunque las palabras sean gramaticalmente diferentes, lo que garantiza que los usuarios encuentren productos pertinentes sin importar las variaciones menores.
El sistema maneja de forma eficaz las abreviaturas, ya que reconoce que “USA” se refiere a “Estados Unidos de América”. Esta capacidad es particularmente útil en bases de datos y motores de búsqueda, en los que las abreviaturas se usan con frecuencia para acortar.
La implementación de la búsqueda parcial suele implicar los siguientes pasos:
Si bien la implementación específica puede variar según la aplicación, Vertex AI de Google Cloud puede aprovechar las técnicas de búsqueda parcial en sus flujos de trabajo de aprendizaje automático para mejorar la precisión del modelo y manejar datos ruidosos o inconsistentes. Por ejemplo, la concordancia parcial puede mejorar la ingeniería de atributos agrupando datos similares o identificando y corrigiendo errores en los conjuntos de datos de entrenamiento.
Comienza a desarrollar en Google Cloud con el crédito gratis de $300 y los más de 20 productos del nivel Siempre gratuito.