Informazioni su app e datastore

Questa pagina descrive le app e i datastore di Vertex AI Search.

Con Vertex AI Search, crei un'app di ricerca o di suggerimenti e la colleghi a un datastore. Un Google Cloud progetto può contenere più app.

Relazione tra app e datastore

La relazione tra app e datastore dipende dal tipo di app:

  • Le app di ricerca personalizzata hanno una relazione molti-a-molti con i datastore. Quando più datastore sono collegati a una singola app di ricerca personalizzata, si parla di ricerca combinata. Per informazioni sui limiti del collegamento di un'app di ricerca a più di un datastore, consulta Informazioni sulla ricerca combinata.

  • Un'app di consigli personalizzati ha una connessione one-to-one con il suo archivio dati.

  • Un'app multimediale ha una relazione molti-a-uno con il suo datastore. Un'app può connettersi a un solo datastore, mentre un determinato datastore può essere collegato a più app. Ad esempio, un'app di ricerca per contenuti multimediali e un'app di suggerimenti sui contenuti multimediali possono condividere un datastore.

  • Un'app di ricerca dei dati sanitari ha una relazione molti-a-uno con il suo datastore. Un'app può connettersi a un solo datastore, mentre un determinato datastore può essere collegato a più app. Ad esempio, un'app rivolta ai pazienti e un'app rivolta ai fornitori possono connettersi allo stesso datastore.

    Per l'importazione batch di dati sanitari, i dati vengono importati in un archivio dati all'interno di un'app. Per l'importazione di dati in streaming (anteprima) di dati sanitari, i dati vengono importati in un'entità, ovvero un tipo di archivio dati all'interno di un connettore dati. Un connettore dati è anche un tipo di datastore all'interno di un'app.

Una volta collegato a un'app, un datastore non può essere scollegato.

Metodo di creazione dell'app e importazione dati

Il modo in cui crei un'app e importi i dati dipende dal tipo di dati che hai:

  • Per i dati del sito web, puoi utilizzare la console Google Cloud o l'API. Per utilizzare i dati di un sito web creati con l'API, devi collegarli a un'app con le funzionalità Enterprise attivate nella console Google Cloud .

  • Per i dati strutturati o non strutturati, puoi utilizzare la consoleGoogle Cloud o l'API.

  • Per i dati sanitari, puoi utilizzare la console Google Cloud o l'API.

Documenti

Ogni datastore contiene uno o più record di dati, chiamati documenti. Ciò che rappresenta un documento varia a seconda del tipo di dati nel datastore:

  • Sito web. Un documento è una pagina web.

  • Dati strutturati. Un documento è una riga di una tabella o un record JSON che segue uno schema specifico. Puoi fornire questo schema autonomamente oppure puoi lasciare che AI Applications lo derivi dai dati inseriti.

  • Dati strutturati per i contenuti multimediali. Un documento è una riga di una tabella o un record JSON che segue uno schema specifico per i contenuti multimediali. I documenti sono registrazioni relative a contenuti multimediali, come video, articoli di notizie, file musicali e podcast. Un documento contiene informazioni che descrivono l'elemento multimediale, come minimo: titolo, URI della posizione dei contenuti, categorie, durata e data di disponibilità.

  • Dati non strutturati. Un documento è un file in formato HTML, PDF con testo incorporato o TXT. I formati PPTX e DOCX sono disponibili in anteprima.

  • Dati FHIR Healthcare. Un documento è una risorsa FHIR R4 supportata. Per un elenco delle risorse FHIR R4 supportate da Vertex AI Search, consulta Riferimento allo schema dei dati FHIR R4 per il settore sanitario.

Datastore e app

In AI Applications esistono vari tipi di data store. Un datastore può contenere un solo tipo di dati.

Dati sui siti web

Un datastore con dati del sito web utilizza i dati indicizzati dai siti web pubblici. Puoi fornire un insieme di pattern URL da includere nel datastore. Le pagine web che corrispondono ai pattern URL sono chiamate pagine web incluse. Puoi quindi configurare la ricerca nei dati sottoposti a crawling dalle pagine web incluse.

Ad esempio, puoi fornire pattern di URL come example.com/faq/* e example.com/events/* e attivare la ricerca nei dati di queste pagine web che corrispondono al pattern. Questi dati includono testo, immagini taggate con metadati e altri dati strutturati come tag meta, attributi PageMap e dati schema.org.

Puoi anche fornire pattern URL per le parti dei siti web che vuoi escludere, ad esempio example.com/events/members-only/* o example.com/events/past-*. Gli URL esclusi hanno la priorità su quelli inclusi.

Esistono due tipi di archivi di dati del sito web:

  • Ricerca di base su sito web:

    • Fornisce funzionalità di ricerca nell'indice della Ricerca Google esistente per i siti web inclusi.
    • Non richiede la verifica del dominio.
  • Indicizzazione avanzata dei siti web:

    • Fornisce funzionalità di ricerca avanzate su un indice generato in base a uno dei seguenti elementi:
      • I proprietari dell'app Vertex AI Search possono controllare quali pagine web vengono indicizzate inviando sitemap e gestendole. Per saperne di più, consulta Indicizzare e aggiornare le pagine web utilizzando le Sitemap. Questo processo mantiene aggiornato l'indice senza intervento manuale.
      • I proprietari dell'app Vertex AI Search possono eseguire un'indicizzazione iniziale che rispecchia l'indice della Ricerca Google e poi espandere la copertura dell'indice eseguendo nuovamente la scansione dei siti web ogni volta che è necessario, mantenendolo aggiornato. Per ulteriori informazioni, consulta Aggiornare le pagine web. Le funzionalità avanzate dell'indicizzazione avanzata dei siti web sono elencate nella sezione Indicizzazione avanzata dei siti web.
    • Richiede ai proprietari dei datastore di Vertex AI Search di verificare i domini a cui appartengono i siti web inclusi. Per ulteriori informazioni, vedi Verificare i domini dei siti web.
    • Offre la possibilità di aggiungere dati strutturati allo schema del datastore. Un sito web contiene dati non strutturati, ma puoi aggiungere dati strutturati sotto forma di tag meta, attributi PageMap e dati schema.org alle tue pagine web. Puoi quindi utilizzare questi dati strutturati per modificare lo schema del datastore come spiegato in Utilizzare i dati strutturati per l'indicizzazione avanzata dei siti web.

Passaggi successivi

Per la ricerca nel sito web:

Dati strutturati

Un datastore con dati strutturati consente la ricerca semantica o i consigli sui dati strutturati. Puoi importare i dati da BigQuery o Cloud Storage. Puoi anche caricare manualmente dati JSON strutturati tramite l'API.

Ad esempio, puoi attivare la ricerca o i consigli su un catalogo dei prodotti per la tua esperienza di e-commerce o una directory di medici per la ricerca di fornitori o consigli.

Le applicazioni AI rilevano automaticamente lo schema dai dati che importi. Se vuoi, puoi fornire uno schema per i tuoi dati. Fornire uno schema per i tuoi dati in genere migliora la qualità dei risultati.

Passaggi successivi

Per la ricerca personalizzata:

Per i consigli personalizzati:

Dati strutturati per i contenuti multimediali

Le app multimediali possono essere collegate solo a datastore di contenuti multimediali. Gli archivi di dati multimediali sono archivi di dati strutturati con uno schema definito da Google o con un tuo schema personalizzato che contiene un insieme specifico di cinque campi correlati ai contenuti multimediali. Per ulteriori informazioni sullo schema, consulta Informazioni su documenti multimediali e archivi di dati.

Ad esempio, puoi attivare i consigli creando un'app di suggerimenti sui contenuti multimediali per un catalogo di film o un sito di notizie, in modo che gli utenti ricevano suggerimenti adatti e personalizzati.

Oltre ai documenti multimediali, i datastore multimediali contengono anche le informazioni sugli eventi utente che consentono a Vertex AI Search di personalizzare i suggerimenti e la ricerca per i tuoi utenti. Gli eventi utente sono necessari per le app multimediali. Per informazioni sugli eventi utente, consulta Registrare gli eventi utente in tempo reale.

Passaggi successivi

Dati non strutturati

Un datastore non strutturati consente la ricerca semantica su dati come documenti e immagini.

I datastore non strutturati supportano documenti in formato HTML, PDF con testo incorporato e TXT. I formati PPTX e DOCX sono disponibili in anteprima.

La ricerca fornisce risultati sotto forma di 10 URL e risposte riepilogative per query in linguaggio naturale. I documenti devono essere caricati in un bucket Cloud Storage con le autorizzazioni di accesso appropriate. Ad esempio, un istituto finanziario può attivare la ricerca nel proprio corpus privato di pubblicazioni di ricerca finanziaria oppure un'azienda biotecnologica può attivare la ricerca o i consigli nel proprio repository privato di ricerche mediche.

Passaggi successivi

Per la ricerca:

Dati FHIR Healthcare

Un'app di ricerca sanitaria utilizza i dati FHIR R4 importati da un archivio FHIR dell'API Cloud Healthcare. Per un elenco delle risorse FHIR R4 supportate da Vertex AI Search, consulta Riferimento allo schema dei dati FHIR R4 per il settore sanitario. Un datastore FHIR R4 deve soddisfare alcuni requisiti prima di poter essere utilizzato come origine dati per il datastore Vertex AI Search. Per saperne di più, scopri come preparare i dati FHIR sanitari per l'importazione.

Passaggi successivi

Informazioni sulla ricerca combinata

Puoi creare un'app di ricerca combinata, in cui è possibile collegare più datastore a una singola app di ricerca personalizzata. Questa funzionalità ti consente di utilizzare un'unica app per eseguire ricerche in più origini e tipi di dati.

Per creare un'app di ricerca combinata, seleziona più datastore durante la creazione di una nuova app di ricerca personalizzata. Se non selezioni più datastore durante la creazione, non potrai aggiungerne altri in un secondo momento.

Quando ricevi i risultati di ricerca, puoi eseguire la ricerca in tutti i datastore o filtrare i risultati di un singolo datastore.

Si applicano le seguenti limitazioni:

  • Aggiunta e rimozione di data store:
    • Per attivare la ricerca combinata per un'app, devi collegare almeno due datastore durante la creazione dell'app.
    • Puoi aggiungere o rimuovere datastore da un'app di ricerca combinata, ma l'app non può avere meno di due datastore collegati in qualsiasi momento.
    • Se colleghi un singolo datastore a un'app di ricerca durante la creazione dell'app, non puoi aggiungere o rimuovere il datastore.
  • Per poter essere utilizzati per la ricerca combinata, i datastore dei siti web devono avere l'indicizzazione avanzata dei siti web attivata. Per ulteriori informazioni, consulta la sezione Indicizzazione avanzata dei siti web.
  • I datastore che contengono dati non strutturati importati utilizzando BigQuery non sono supportati.
  • La ricerca combinata consente i seguenti campi nelle richieste di ricerca:
    • boostSpec
    • contentSearchSpec
    • dataStoreSpecs
    • facetSpecs
    • filter
    • languageCode
    • offset
    • oneBoxPageSize
    • orderBy
    • query
    • pageSize
    • pageToken
    • relevanceScoreSpec
    • relevanceThreshold
    • session
    • sessionSpec
    • spellCorrectionSpec
    • userInfo
    • userPseudoId
  • La ricerca combinata consente di utilizzare i seguenti campi in dataStoreSpecs:
    • dataStore
    • boostSpec: se sono specificate le specifiche di boost sia per SearchRequest che per dataStoreSpecs, entrambe vengono applicate ai risultati di ricerca
    • filter: se sono specificati filtri sia per SearchRequest sia per dataStoreSpecs, entrambi i filtri vengono applicati ai risultati di ricerca
  • Le operazioni di creazione, lettura, aggiornamento ed eliminazione (CRUD) sulle configurazioni di pubblicazione sono supportate per le app ibride. Solo i seguenti campi possono essere aggiunti o aggiornati in una configurazione di pubblicazione:
    • boostControlIds
    • displayName
    • filterControlIds
    • genericConfig:
      • contentSearchSpec
    • name
    • solutionType
    • synonymsControlIds
  • Le operazioni CRUD sui seguenti controlli sono supportate per le app di ricerca ibrida:
    • boostAction
    • synonymAction
    • filterAction
  • Esiste un limite di 50 datastore per app di ricerca.
  • Se un datastore utilizza una configurazione CMEK, anche tutti gli altri datastore devono utilizzare la stessa configurazione CMEK.