Questo documento descrive come installare e configurare l'SDK Vertex AI per ABAP nel tuo ambiente SAP.
Installazione
Versione on-premise o qualsiasi versione cloud
Quando installi la versione 1.8 della versione on-premise o di qualsiasi versione cloud dell'SDK ABAP per Google Cloud, l'SDK Vertex AI per ABAP viene installato automaticamente. Per informazioni sui passaggi di installazione, consulta Installare e configurare la versione on-premise o qualsiasi versione cloud di ABAP SDK for Google Cloud.
Se utilizzi già la versione 1.7 o precedenti dell'SDK ABAP on-premise o di qualsiasi versione cloud di ABAP SDK for Google Cloud, aggiorna l'SDK alla versione più recente per ottenere l'SDK Vertex AI per ABAP. Per ulteriori informazioni, consulta Aggiornare ABAP SDK per Google Cloud.
Versione SAP BTP
Quando installi la versione 1.1 dell'edizione SAP BTP dell'SDK ABAP per Google Cloud, l'SDK Vertex AI per ABAP viene installato automaticamente. Per informazioni sui passaggi di installazione, consulta Installare e configurare la versione SAP BTP di ABAP SDK for Google Cloud.
Siamo consapevoli che l'accesso a Vertex AI e alle risorse cloud potrebbe essere limitato per alcuni sviluppatori. Per abilitare la prototipazione e la sperimentazione con una configurazione minima, consulta Prototipazione rapida con Gemini.
Abilita l'API Vertex AI
Abilita l'API Vertex AI nel tuo progetto Google Cloud.
Per informazioni su come attivare le API di Google Cloud , vedi Attivare le API.
Autenticazione
Versione on-premise o qualsiasi versione cloud
Dopo aver configurato l'autenticazione per accedere alle API Google Cloud on-premise o a qualsiasi versione cloud dell'SDK ABAP per Google Cloud, l'SDK Vertex AI per ABAP utilizza lo stesso metodo di autenticazione per accedere all'API Vertex AI. Per informazioni su come configurare l'autenticazione nella versione on-premise o in qualsiasi versione cloud di ABAP SDK for Google Cloud, consulta la Panoramica dell'autenticazione.
Prendi nota della chiave client che hai creato nell'ambito della configurazione dell'autenticazione. Utilizza questa chiave client per configurare i parametri di generazione del modello di AI e i parametri di ricerca.
Versione SAP BTP
Dopo aver configurato l'autenticazione per accedere alle API Google Cloud nella versione SAP BTP dell'SDK ABAP per Google Cloud, l'SDK Vertex AI per ABAP utilizza lo stesso metodo di autenticazione per accedere all'API Vertex AI. Per informazioni su come configurare l'autenticazione nell'edizione SAP BTP di ABAP SDK for Google Cloud, consulta la Panoramica dell'autenticazione.
Prendi nota della chiave client che hai creato nell'ambito della configurazione dell'autenticazione. Utilizza questa chiave client per configurare i parametri di generazione del modello di AI e i parametri di ricerca.
Autorizzazioni IAM
Assicurati che l'account di servizio dedicato per l'accesso all'API che hai configurato nella tabella delle chiavi client abbia accesso alle risorse Vertex AI.
Vertex AI
Per utilizzare le risorse Vertex AI, devi concedere il ruolo
Utente Vertex AI (roles/aiplatform.user
)
all'account di servizio dedicato a cui hai concesso le autorizzazioni per accedere all'API Vertex AI.
Se devi fornire autorizzazioni specifiche per creare, modificare ed eseguire il deployment di elementi, concessi autorizzazioni IAM Vertex AI specifiche, a seconda dei casi.
Vertex AI Feature Store
Per utilizzare Vertex AI Feature Store, devi concedere i seguenti ruoli all'account di servizio:
Funzionalità di IA | Ruoli IAM richiesti |
---|---|
Vertex AI Feature Store |
Verificare l'aggiunta di app Fiori al Launchpad
Versione on-premise o qualsiasi versione cloud
Puoi saltare questa sezione perché non si applica alle versioni on-premise o cloud di ABAP SDK for Google Cloud.
Versione SAP BTP
Per consentire agli amministratori e agli sviluppatori di configurare i parametri di generazione del modello e i parametri di ricerca di vettori, la versione SAP BTP dell'SDK ABAP per Google Cloud fornisce app SAP Fiori. L'SDK fornisce inoltre app Fiori solo di visualizzazione per visualizzare i parametri gestiti.
Aggiungi queste app Fiori al tuo Launchpad durante l'installazione dell'edizione SAP BTP dell'SDK ABAP per Google Cloud. Verifica che queste app siano disponibili nel tuoaunchpad. Per ulteriori informazioni, consulta Aggiungere app Fiori al Launchpad.
Configura i parametri di generazione del modello
I modelli linguistici di grandi dimensioni (LLM) sono modelli di deep learning addestrati su enormi quantità di dati testuali. Un modello include valori parametro che controllano il modo in cui il modello genera una risposta. Puoi ottenere risultati diversi dal modello modificando i valori parametro.
Per definire i parametri di generazione
per un modello, l'SDK Vertex AI per ABAP utilizza la tabella /GOOG/AI_CONFIG
.
Per configurare i parametri di generazione di un modello, segui questi passaggi:
Versione on-premise o qualsiasi versione cloud
In SAP GUI, esegui il codice transazione
/GOOG/SDK_IMG
.In alternativa, esegui il codice transazione
SPRO
e poi fai clic su Immagine di riferimento SAP.Fai clic su ABAP SDK for Google Cloud > Impostazioni di base > SDK Vertex AI: configura i parametri di generazione del modello.
Fai clic su Nuove voci.
Inserisci i valori per i seguenti campi:
Campo Tipo di dati Descrizione Model Key Stringa Un nome univoco specificato per identificare la configurazione del modello, ad esempio
Gemini
.Utilizza questa chiave del modello durante l'inizializzazione della classe del modello generativo o della classe degli embedding per specificare la configurazione di generazione da applicare.
ID modello Stringa ID modello dell'LLM, ad esempio
gemini-1.5-flash-001
.Per informazioni sulle versioni dei modelli Vertex AI, consulta Versioni e ciclo di vita dei modelli.
Nome della chiave Google Cloud Stringa La chiave client che hai configurato per l'autenticazione a Google Cloud durante la configurazione dell'autenticazione. ID posizione della regione Google Cloud Stringa L'ID posizione della regione Google Cloud in cui sono disponibili le funzionalità di Vertex AI che vuoi utilizzare.
In genere, si utilizza la regione più vicina alla tua posizione fisica o alla posizione fisica dei tuoi utenti di destinazione. Per ulteriori informazioni, consulta le località di Vertex AI.
ID publisher del LLM Stringa Facoltativo. L'editore dell'LLM, ad esempio google
.Tipo MIME della risposta Stringa Facoltativo. Tipo MIME della risposta di output del testo candidato generato. Tipo MIME supportato: text/plain
: (valore predefinito) Output di testo.application/json
: risposta JSON nei candidati.
Temperatura della casualità Stringa Facoltativo. Controlla la casualità delle previsioni. Per ulteriori informazioni, vedi Temperatura.
Intervallo: [0,0, 1,0]
Campionamento Top-K Numero in virgola mobile Facoltativo. Top-K cambia il modo in cui il modello seleziona i token per l'output.
Specifica un valore più basso per risposte meno casuali e un valore più alto per risposte più casuali. Per ulteriori informazioni, consulta Top-K.
Intervallo: [1, 40]
Campionamento Top-P Numero in virgola mobile Facoltativo. Top-P cambia il modo in cui il modello seleziona i token per l'output.
Specifica un valore più basso per risposte meno casuali e un valore più alto per risposte più casuali. Per ulteriori informazioni, consulta Top-P.
Intervallo: [0,0, 1,0]
Numero massimo di token di output per messaggio Numero intero Facoltativo. Numero massimo di token che possono essere generati nella risposta. Un token equivale a circa quattro caratteri. 100 token corrispondono a circa 60-80 parole.
Specifica un valore più basso per risposte più brevi e un valore più alto per risposte potenzialmente più lunghe.
Penalità positive Numero in virgola mobile Facoltativo. I valori positivi penalizzano i token che sono comparsi nel testo generato, aumentando così la possibilità di generare argomenti più diversi.
Intervallo: [-2,0; 2,0]
Sanzioni per frequenza Numero in virgola mobile Facoltativo. I valori positivi penalizzano i token che appaiono ripetutamente nel testo generato, diminuendo così la possibilità di ripetere gli stessi contenuti.
Intervallo: [-2,0; 2,0]
Se non fornisci un valore per un parametro facoltativo, l'SDK utilizza il valore predefinito del parametro specifico per la versione del modello configurata in
Model ID
.Salva la nuova voce.
Versione SAP BTP
Accedi alla piattaforma di lancio SAP Fiori.
Vai allo spazio che contiene le app Fiori per la configurazione dell'SDK.
Apri l'app SDK Vertex AI: configura i parametri di generazione del modello.
Fai clic su Crea.
Nella finestra di dialogo Crea visualizzata, inserisci un valore per il campo Model Key (Chiave modello) e fai clic su Continua.
Inserisci i valori per i campi visualizzati.
La seguente tabella descrive i campi e la loro corrispondenza ai parametri di generazione del modello:
Campo Tipo di dati Descrizione Model Key Stringa Un nome univoco specificato per identificare la configurazione del modello, ad esempio
Gemini
.Utilizza questa chiave del modello durante l'inizializzazione della classe del modello generativo o della classe degli embedding per specificare la configurazione di generazione da applicare.
ID modello Stringa ID modello dell'LLM, ad esempio
gemini-1.5-flash-001
.Per informazioni sulle versioni dei modelli Vertex AI, consulta Versioni e ciclo di vita dei modelli.
Nome della chiave Google Cloud Stringa La chiave client che hai configurato per l'autenticazione a Google Cloud durante la configurazione dell'autenticazione. ID posizione della regione Google Cloud Stringa L'ID posizione della regione Google Cloud in cui sono disponibili le funzionalità di Vertex AI che vuoi utilizzare.
In genere, si utilizza la regione più vicina alla tua posizione fisica o alla posizione fisica dei tuoi utenti di destinazione. Per ulteriori informazioni, consulta le località di Vertex AI.
ID publisher del LLM Stringa Facoltativo. L'editore dell'LLM, ad esempio google
.Tipo MIME della risposta Stringa Facoltativo. Tipo MIME della risposta di output del testo candidato generato. Tipo MIME supportato: text/plain
: (valore predefinito) Output di testo.application/json
: risposta JSON nei candidati.
Temperatura della casualità Stringa Facoltativo. Controlla la casualità delle previsioni. Per ulteriori informazioni, vedi Temperatura.
Intervallo: [0,0, 1,0]
Campionamento Top-K Numero in virgola mobile Facoltativo. Top-K cambia il modo in cui il modello seleziona i token per l'output.
Specifica un valore più basso per risposte meno casuali e un valore più alto per risposte più casuali. Per ulteriori informazioni, consulta Top-K.
Intervallo: [1, 40]
Campionamento Top-P Numero in virgola mobile Facoltativo. Top-P cambia il modo in cui il modello seleziona i token per l'output.
Specifica un valore più basso per risposte meno casuali e un valore più alto per risposte più casuali. Per ulteriori informazioni, consulta Top-P.
Intervallo: [0,0, 1,0]
Numero massimo di token di output per messaggio Numero intero Facoltativo. Numero massimo di token che possono essere generati nella risposta. Un token equivale a circa quattro caratteri. 100 token corrispondono a circa 60-80 parole.
Specifica un valore più basso per risposte più brevi e un valore più alto per risposte potenzialmente più lunghe.
Penalità positive Numero in virgola mobile Facoltativo. I valori positivi penalizzano i token che sono comparsi nel testo generato, aumentando così la possibilità di generare argomenti più diversi.
Intervallo: [-2,0; 2,0]
Sanzioni per frequenza Numero in virgola mobile Facoltativo. I valori positivi penalizzano i token che appaiono ripetutamente nel testo generato, diminuendo così la possibilità di ripetere gli stessi contenuti.
Intervallo: [-2,0; 2,0]
Se non fornisci un valore per un parametro facoltativo, l'SDK utilizza il valore predefinito del parametro specifico per la versione del modello configurata in
Model ID
.Fai clic su Crea per salvare la voce.
Configurare i parametri di Vector Search
Per definire le configurazioni di Vector Search, l'SDK Vertex AI per ABAP
utilizza la tabella /GOOG/SEARCHCONF
.
Per configurare i parametri di ricerca vettoriale, svolgi i seguenti passaggi:
Versione on-premise o qualsiasi versione cloud
In SAP GUI, esegui il codice transazione
/GOOG/SDK_IMG
.In alternativa, esegui il codice transazione
SPRO
e poi fai clic su Immagine di riferimento SAP.Fai clic su ABAP SDK for Google Cloud > Impostazioni di base > SDK Vertex AI: configura i parametri di ricerca di vettori.
Fai clic su Nuove voci.
Inserisci i valori per i seguenti campi:
Campo Tipo di dati Descrizione Tasto per la ricerca Stringa Un nome univoco specificato per identificare la configurazione di ricerca. Nome della chiave Google Cloud Stringa La chiave client che hai configurato per l'autenticazione a Google Cloud durante la configurazione dell'autenticazione. ID posizione della regione Google Cloud Stringa L'ID posizione della regione Google Cloud in cui sono disponibili le funzionalità di Vertex AI che vuoi utilizzare.
In genere, si utilizza la regione più vicina alla tua sede fisica o alla sede fisica dei tuoi utenti di destinazione. Per ulteriori informazioni, consulta le località di Vertex AI.
ID deployment dell'indice vettore Stringa L'ID di deployment di un indice. Quando esegui il deployment di un indice in un endpoint, gli assegni un ID deployment univoco. Per informazioni sul deployment degli indici, vedi Eseguire il deployment di un indice vettoriale in un endpoint indice.
ID endpoint dell'indice di vettori Stringa L'ID dell'endpoint dell'indice in cui viene eseguito il deployment dell'indice.
Per informazioni sull'endpoint dell'indice, vedi Creare un endpoint dell'indice di vettori.
Salva la nuova voce.
Versione SAP BTP
Accedi alla piattaforma di lancio SAP Fiori.
Vai allo spazio che contiene le app Fiori per la configurazione dell'SDK.
Apri l'app SDK Vertex AI: configurazione di Vector Search.
Fai clic su Crea.
Nella finestra di dialogo Crea visualizzata, inserisci un valore per il campo Model Key (Chiave modello) e fai clic su Continua.
Inserisci i valori per i campi visualizzati.
La seguente tabella descrive i campi e la loro corrispondenza ai parametri di ricerca di vettori:
Campo Tipo di dati Descrizione Tasto per la ricerca Stringa Un nome univoco specificato per identificare la configurazione di ricerca. Nome della chiave Google Cloud Stringa La chiave client che hai configurato per l'autenticazione a Google Cloud durante la configurazione dell'autenticazione. ID posizione della regione Google Cloud Stringa L'ID posizione della regione Google Cloud in cui sono disponibili le funzionalità di Vertex AI che vuoi utilizzare.
In genere, si utilizza la regione più vicina alla tua sede fisica o alla sede fisica dei tuoi utenti di destinazione. Per ulteriori informazioni, consulta le località di Vertex AI.
ID deployment dell'indice vettore Stringa L'ID di deployment di un indice. Quando esegui il deployment di un indice in un endpoint, gli assegni un ID deployment univoco. Per informazioni sul deployment degli indici, vedi Eseguire il deployment di un indice vettoriale in un endpoint indice.
ID endpoint dell'indice di vettori Stringa L'ID dell'endpoint dell'indice in cui viene eseguito il deployment dell'indice.
Per informazioni sull'endpoint dell'indice, vedi Creare un endpoint dell'indice di vettori.
Fai clic su Crea per salvare la voce.
Passaggi successivi
- Esplora le demo sull'IA generativa per SAP integrate.
- Scopri di più sull'IA generativa su Vertex AI per SAP.