Incorporamenti per il testo (textembedding-gecko
) è il nome del modello che supporta gli incorporamenti di testo.
Gli incorporamenti di testo sono una tecnica NLP che converte i dati testuali in vettori numerici che possono essere elaborati dagli algoritmi di machine learning, in particolare dai modelli di grandi dimensioni. Queste rappresentazioni vettoriali sono progettate per acquisire il significato
e il contesto semantico delle parole che rappresentano.
Sono disponibili diverse versioni per gli incorporamenti. textembedding-gecko@003
è il
modello di incorporamento stabile più recente con qualità AI migliorata e textembedding-gecko-multilingual@001
è un modello ottimizzato per un'ampia gamma di lingue diverse dall'inglese.
Per esplorare questo modello nella console, consulta la scheda Incorporamenti per il modello di testo in Model Garden.
Vai a Model Garden
Casi d'uso
Ricerca semantica: gli incorporamenti di testo possono essere utilizzati per rappresentare sia la query dell'utente sia l'universo dei documenti in uno spazio vettoriale ad alta dimensione. I documenti più semanticamente simili alla query dell'utente avranno una distanza più breve nello spazio vettoriale e possono avere un ranking più alto nei risultati di ricerca.
Classificazione del testo: addestrare un modello che mappa gli incorporamenti di testo alle etichette di categoria corrette (ad es. gatto o cane, spam o non spam). Una volta addestrato il modello, può essere utilizzato per classificare nuovi input di testo in una o più categorie in base ai loro incorporamenti.
Richiesta HTTP
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/textembedding-gecko:predict
Versioni modello
Per utilizzare la versione più recente del modello, specifica con il suffisso @latest, ad esempio textembedding-gecko@latest
.
Per utilizzare una versione del modello stabile, specifica il numero di versione del modello, ad esempio textembedding-gecko@003
.
Ogni versione stabile è disponibile per sei mesi dopo la data di rilascio della
versione stabile successiva.
La seguente tabella contiene le versioni del modello stabile disponibili:
modello textembedding-gecko | Data di uscita | Data di interruzione |
---|---|---|
testoembedding-gecko@003 | 12 dicembre 2023 | Non applicabile |
testoembedding-gecko@002 | 2 novembre 2023 | 9 ottobre 2024 |
textembedding-gecko-multilingual@001 | 2 novembre 2023 | Non applicabile |
testoembedding-gecko@001 | 7 giugno 2023 | 9 ottobre 2024 |
text-embedding-preview-0409 | 9 aprile 2024 | Da aggiornare a una versione stabile. |
text-multilingual-embedding-preview-0409 | 9 aprile 2024 | Da aggiornare a una versione stabile. |
Per saperne di più, consulta Versioni e ciclo di vita dei modelli.
Corpo della richiesta
{
"instances": [
{
"task_type": "RETRIEVAL_DOCUMENT",
"title": "document title",
"content": "I would like embeddings for this text!"
},
]
}
L'API Vertex AI PaLM Embedding esegue previsioni online (in tempo reale) per ottenere incorporamenti dal testo di input.
L'API accetta un massimo di 3072 token di input e restituisce rappresentazioni distribuite di 768 dimensioni di vettori. Utilizza i seguenti parametri per il modello di incorporamenti di testo textembedding-gecko
.
Per maggiori informazioni, consulta la panoramica sugli incorporamenti di testo.
Parametro | Description | Valori accettati |
---|---|---|
|
Il testo per il quale vuoi generare gli incorporamenti. | Testo |
|
Il parametro "task_type" è definito come l'applicazione downstream prevista per aiutare il modello a produrre incorporamenti di qualità migliore. È una stringa che può assumere uno dei seguenti valori. | RETRIEVAL_QUERY , RETRIEVAL_DOCUMENT , SEMANTIC_SIMILARITY , CLASSIFICATION , CLUSTERING , QUESTION_ANSWERING e FACT_VERIFICATION .
|
|
Il titolo dell'incorporamento. | Testo |
Richiesta di esempio
REST
Per testare un prompt di testo utilizzando l'API Vertex AI, invia una richiesta POST all'endpoint del modello del publisher.
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- PROJECT_ID: il tuo ID progetto.
- TEXT: il testo per il quale vuoi generare incorporamenti.
Metodo HTTP e URL:
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/textembedding-gecko@003:predict
Corpo JSON della richiesta:
{ "instances": [ { "content": "TEXT"} ], }
Per inviare la richiesta, scegli una delle seguenti opzioni:
arricciatura
Salva il corpo della richiesta in un file denominato request.json
ed esegui questo comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/textembedding-gecko@003:predict"
PowerShell
Salva il corpo della richiesta in un file denominato request.json
ed esegui questo comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/textembedding-gecko@003:predict" | Select-Object -Expand Content
Dovresti ricevere una risposta in formato JSON simile alla risposta di esempio.
Python
Per scoprire come installare o aggiornare l'SDK Vertex AI per Python, consulta Installare l'SDK Vertex AI per Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.
Node.js
Prima di provare questo esempio, segui le istruzioni di configurazione di Node.js riportate nella guida rapida di Vertex AI sull'utilizzo delle librerie client. Per maggiori informazioni, consulta la documentazione di riferimento dell'API Node.js Vertex AI.
Per eseguire l'autenticazione in Vertex AI, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Java
Prima di provare questo esempio, segui le istruzioni di configurazione di Java riportate nella guida rapida di Vertex AI sull'utilizzo delle librerie client. Per maggiori informazioni, consulta la documentazione di riferimento dell'API Java Vertex AI.
Per eseguire l'autenticazione in Vertex AI, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Corpo della risposta
{
"predictions": [
{
"embeddings": {
"statistics": {
"truncated": boolean,
"token_count": integer
},
"values": [ number ]
}
}
]
}
Elemento risposta | Descrizione |
---|---|
embeddings |
Il risultato generato dal testo di input. |
statistics |
Le statistiche calcolate dal testo di input. |
truncated |
Indica se il testo di input era più lungo del numero massimo di token consentiti e se è stato troncato. |
tokenCount |
Numero di token del testo di input. |
values |
Il campo values contiene i vettori di incorporamento corrispondenti alle parole nel testo di input. |
Esempio di risposta
{
"predictions": [
{
"embeddings": {
"values": [
0.0058424929156899452,
0.011848051100969315,
0.032247550785541534,
-0.031829461455345154,
-0.055369812995195389,
...
],
"statistics": {
"token_count": 4,
"truncated": false
}
}
}
]
}