Prima di iniziare

Prima di iniziare a utilizzare Vector Search, devi scegliere un modello di incorporamento, preparare i dati e decidere il tipo di endpoint che utilizzerai. Questa pagina fornisce alcune informazioni su come eseguire queste operazioni.

Prepara gli incorporamenti

Per utilizzare la ricerca vettoriale, devi avere a portata di mano gli incorporamenti. Se hai già gli incorporamenti, vai a Scegli un endpoint.

Per creare gli incorporamenti:

  1. Scegli un modello di incorporamento: sono disponibili molti modelli di incorporamento esterni che offrono caratteristiche diverse. A seconda del caso d'uso, scegli uno dei seguenti tipi di modello:

    • Pronto per l'uso: se vuoi abbinare semanticamente il testo al testo o il testo alle immagini in base alla pertinenza del testo o dell'immagine. Si tratta di un caso d'uso standard, quindi non è necessario addestrare o ottimizzare il modello. L'IA generativa su Vertex AI è un'opzione consigliata per questo caso d'uso.

    • Modello personalizzato per gli incorporamenti: se vuoi creare una corrispondenza semantica in base ai tuoi dati o a un caso d'uso specifico.

  2. Prepara i dati: pulisci e pre-elabora i dati per assicurarti che siano in un formato utilizzabile dal modello di incorporamento.

  3. Addestra il modello di incorporamento se utilizzi un modello personalizzato: se scegli di utilizzare un modello di incorporamenti personalizzato (ottimizzazione), devi addestrarlo sui tuoi dati. Questo può essere un processo dispendioso in termini di tempo, che dipende dalle dimensioni e dalla complessità dei dati. Se utilizzi un modello preaddestrato da Model Garden, puoi saltare questo passaggio.

  4. Genera incorporamenti: dopo l'addestramento del modello, utilizzalo per generare incorporamenti per i tuoi dati.

Scegli un endpoint

Dopo aver creato l'indice, dovrai eseguirne il deployment in un endpoint. Per ulteriori informazioni, consulta Eseguire il deployment e gestire gli endpoint indice pubblici ed Eseguire il deployment e gestire gli endpoint indice in una rete VPC. È utile decidere di quale tipo di endpoint hai bisogno prima di creare l'indice.

Puoi eseguire il deployment dell'indice della query in uno dei seguenti modi:

  • Endpoint pubblico: se esegui il deployment su un endpoint pubblico, non è necessario configurare la rete. Le reti pubbliche hanno una latenza leggermente superiore, ma sono più veloci da configurare e più facili da gestire.

  • Endpoint privato: se vuoi utilizzare un VPC, devi prima configurare il networking. Vector Search supporta due tipi di reti private.

Passaggi successivi

Dopo aver generato gli incorporamenti e aver deciso dove eseguire il deployment dell'indice, il passaggio successivo è configurare l'indice.