La ricerca approssimativa è una tecnica di ricerca che trova corrispondenze anche quando la query di ricerca non corrisponde perfettamente ai relativi dati. Non si limita a una corrispondenza letterale tra i caratteri, ma identifica i risultati simili alla query di ricerca in termini di ortografia, significato o altri criteri. Questo può essere particolarmente utile quando si ha a che fare con input utente, che possono includere errori di battitura, variazioni (plurale o singolare, abbreviazioni, stemming e altro) e altre incoerenze dovute ai diversi modi in cui gli utenti comunicano.
Immagina di cercare "frutta" in un database. Un motore di ricerca più semplice potrebbe restituire solo le voci che corrispondono esattamente alla parola "frutta". Tuttavia, un motore di ricerca con ricerca approssimativa considererebbe anche termini simili come "frutti", "frunta" o persino "fruuta", riconoscendoli come potenziali corrispondenze nonostante le variazioni ortografiche minori.
Questo approccio può ampliare l'ambito di ricerca e contribuire ad aumentare le probabilità di trovare informazioni pertinenti, anche se l'utente ha usato un'ortografia diversa nella query. È come gettare una rete più ampia che cattura non solo il pesce che stavi cercando, ma anche quelli che gli assomigliano molto.
La ricerca approssimativa può rivelarsi utile negli scenari in cui i dati potrebbero essere incoerenti o quando gli utenti potrebbero non conoscere l'ortografia esatta di ciò che stanno cercando. Può essere particolarmente utile nell'e-commerce per trovare prodotti con lievi variazioni di nome o in set di dati di grandi dimensioni in cui la pulizia manuale dei dati non è praticabile.
I prodotti Google Cloud che possono essere utilizzati per creare ed eseguire una ricerca approssimativa includono Vertex AI, Cloud SQL e Cloud Spanner. Per esplorare la ricerca approssimativa in base alle tue esigenze, contatta il nostro team di vendita o inizia la tua prova gratuita.
Le ricerche approssimative utilizzano vari algoritmi e tecniche per determinare la somiglianza tra due stringhe di testo, la query di ricerca e la potenziale corrispondenza nei dati. Questi algoritmi spesso si basano su concetti come:
Utilizzando questi tipi di concetti, i motori di ricerca approssimativa possono classificare le potenziali corrispondenze in base alla loro somiglianza con la query originale, aiutando gli utenti a visualizzare una serie di risultati pertinenti, anche se contengono variazioni minori rispetto ai termini di ricerca.
Man mano che le dimensioni dei set di dati aumentano e gli input degli utenti si diversificano, la ricerca approssimativa offre un approccio prezioso per il recupero di informazioni in modo efficace. Può aiutare a colmare il divario tra i diversi modi in cui gli utenti comunicano (o cercano) e il modo in cui i dati potrebbero essere stati strutturati e archiviati.
Ecco perché la ricerca approssimativa può essere importante:
La differenza fondamentale tra la ricerca esatta e quella approssimativa sta nel modo in cui gestiscono le variazioni dei dati. Analizziamo le differenze principali:
Ricerca esatta | Ricerca approssimativa | |
Criteri di corrispondenza | Richiede una corrispondenza esatta carattere per carattere | Consente errori di battitura, varianti e corrispondenze parziali |
Ambito di ricerca | Più specifica, restituisce solo corrispondenze precise | Più ampia, recupera una gamma più vasta di risultati |
Casi d'uso | Situazioni che richiedono un'accuratezza rigorosa, come database o cataloghi di prodotti in settori con una forte regolamentazione | Scenari in cui flessibilità e tolleranza agli errori sono cruciali, come le barre di ricerca su grandi siti web |
Ricerca esatta
Ricerca approssimativa
Criteri di corrispondenza
Richiede una corrispondenza esatta carattere per carattere
Consente errori di battitura, varianti e corrispondenze parziali
Ambito di ricerca
Più specifica, restituisce solo corrispondenze precise
Più ampia, recupera una gamma più vasta di risultati
Casi d'uso
Situazioni che richiedono un'accuratezza rigorosa, come database o cataloghi di prodotti in settori con una forte regolamentazione
Scenari in cui flessibilità e tolleranza agli errori sono cruciali, come le barre di ricerca su grandi siti web
Per illustrarne le applicazioni pratiche, diamo un'occhiata ad alcuni esempi di come la ricerca approssimativa può aiutare a far corrispondere l'intent dell'utente dietro diverse query di ricerca con risultati di ricerca pertinenti.
In questo caso, nonostante l'errore di battitura, l'algoritmo di ricerca approssimativa riconosce l'intenzione dell'utente e fornisce la ricetta desiderata per la torta di mele. Capisce che "tota" è probabilmente un errore di ortografia di "torta" e assegna la priorità al risultato di conseguenza.
La ricerca approssimativa gestisce senza problemi le variazioni della pluralità. Indipendentemente dal fatto che l'utente cerchi la forma singolare o plurale, il motore di ricerca recupera in modo intelligente i risultati che corrispondono al significato inteso, assicurando che gli utenti trovino le ricette indipendentemente dall'approccio grammaticale.
La capacità di interpretare i sinonimi amplia l'ambito di ricerca. Il motore riconosce che "idee per pasti veloci" e "ricette facili per cena" sono concettualmente simili e fornisce risultati pertinenti per entrambi, ampliando le possibilità andando oltre le parole chiave letterali usate.
Gli algoritmi spesso utilizzano lo stemming, che riduce le parole alla loro forma di base o radice. In questo modo, la ricerca può trovare corrispondenze tra "scarpe da corsa" e "correre scarpa", anche se le parole sono grammaticalmente diverse, e gli utenti possono trovare prodotti pertinenti indipendentemente dalle piccole variazioni.
Il sistema gestisce efficacemente le abbreviazioni, riconoscendo che "USA" si riferisce agli "Stati Uniti d'America". Questa funzionalità è particolarmente utile nei database e nei motori di ricerca, dove le abbreviazioni vengono spesso utilizzate per brevità.
L'implementazione della ricerca approssimativa prevede in genere i seguenti passaggi:
Sebbene l'implementazione specifica possa variare a seconda dell'applicazione, Vertex AI di Google Cloud può sfruttare le tecniche di ricerca approssimativa all'interno dei workflow di machine learning per migliorare l'accuratezza del modello e gestire dati rumorosi o incoerenti. Ad esempio, la corrispondenza approssimativa può migliorare il feature engineering raggruppando punti dati simili o identificando e correggendo errori nei set di dati di addestramento.
Inizia a creare su Google Cloud con 300 $ di crediti gratuiti e oltre 20 prodotti Always Free.