Prima di iniziare a utilizzare Vector Search, devi scegliere un modello di incorporamento, preparare i dati e decidere il tipo di endpoint che utilizzerai. Questa pagina fornisce alcune informazioni su come eseguire queste operazioni.
Prepara gli incorporamenti
Per utilizzare la ricerca vettoriale, devi avere a portata di mano gli incorporamenti. Se hai già gli incorporamenti, vai a Scegli un endpoint.
Per creare gli incorporamenti:
Scegli un modello di incorporamento: sono disponibili molti modelli di incorporamento esterni che offrono caratteristiche diverse. A seconda del caso d'uso, scegli uno dei seguenti tipi di modello:
Pronto per l'uso: se vuoi abbinare semanticamente il testo al testo o il testo alle immagini in base alla pertinenza del testo o dell'immagine. Si tratta di un caso d'uso standard, quindi non è necessario addestrare o ottimizzare il modello. L'IA generativa su Vertex AI è un'opzione consigliata per questo caso d'uso.
Modello personalizzato per gli incorporamenti: se vuoi creare una corrispondenza semantica in base ai tuoi dati o a un caso d'uso specifico.
Prepara i dati: pulisci e pre-elabora i dati per assicurarti che siano in un formato utilizzabile dal modello di incorporamento.
Addestra il modello di incorporamento se utilizzi un modello personalizzato: se scegli di utilizzare un modello di incorporamenti personalizzato (ottimizzazione), devi addestrarlo sui tuoi dati. Questo può essere un processo dispendioso in termini di tempo, che dipende dalle dimensioni e dalla complessità dei dati. Se utilizzi un modello preaddestrato da Model Garden, puoi saltare questo passaggio.
Genera incorporamenti: dopo l'addestramento del modello, utilizzalo per generare incorporamenti per i tuoi dati.
Scegli un endpoint
Dopo aver creato l'indice, dovrai eseguirne il deployment in un endpoint. Per ulteriori informazioni, consulta Eseguire il deployment e gestire gli endpoint indice pubblici ed Eseguire il deployment e gestire gli endpoint indice in una rete VPC. È utile decidere di quale tipo di endpoint hai bisogno prima di creare l'indice.
Puoi eseguire il deployment dell'indice della query in uno dei seguenti modi:
Endpoint pubblico: se esegui il deployment su un endpoint pubblico, non è necessario configurare la rete. Le reti pubbliche hanno una latenza leggermente superiore, ma sono più veloci da configurare e più facili da gestire.
Endpoint privato: se vuoi utilizzare un VPC, devi prima configurare il networking. Vector Search supporta due tipi di reti private.
Connessione di peering di rete VPC per una latenza di rete ridotta.
I servizi privati si connettono per il consumo privato dei servizi su reti VPC che appartengono a gruppi, team, progetti od organizzazioni diversi.
Passaggi successivi
Dopo aver generato gli incorporamenti e aver deciso dove eseguire il deployment dell'indice, il passaggio successivo è configurare l'indice.
- Scopri come configurare il formato e la struttura dei dati di input
- Scopri come creare un indice di Vector Search utilizzando i tutorial sui blocchi note
- Scopri come gestire gli indici