Installa e configura l'SDK Vertex AI per ABAP

Questo documento descrive come installare e configurare l'SDK Vertex AI per ABAP nel tuo ambiente SAP.

Installazione

Quando installi la versione 1.8 dell'SDK on-premise o qualsiasi versione cloud dell'SDK ABAP per Google Cloud, L'SDK Vertex AI per ABAP è installato automaticamente. Per informazioni sui passaggi di installazione, consulta Installare e configurare la versione on-premise o qualsiasi versione cloud di ABAP SDK for Google Cloud.

Se utilizzi già la versione 1.7 o precedente delle versioni on-premise o cloud dell'SDK ABAP per Google Cloud, aggiorna l'SDK in l'ultima versione per ottenere l'SDK Vertex AI per ABAP. Per maggiori informazioni vedi Aggiornare l'SDK ABAP per Google Cloud.

Sappiamo che l'accesso a Vertex AI e alle risorse cloud potrebbero essere limitate per alcuni sviluppatori. Per abilitare la prototipazione e la sperimentazione con una configurazione minima, consulta Prototipazione rapida con Gemini.

Abilita l'API Vertex AI

Abilita l'API Vertex AI nel tuo progetto Google Cloud.

API Vertex AI

Per informazioni su come abilitare le API Google Cloud, consulta Abilitazione delle API.

Autenticazione

Dopo aver configurato l'autenticazione per accedere alle API Google Cloud nella versione on-premise o in qualsiasi versione cloud dell'ABAP SDK per Google Cloud, l'SDK Vertex AI per ABAP utilizza lo stesso metodo di autenticazione per accedere all'API Vertex AI. Per informazioni su come configurare l'autenticazione nell'ambiente on-premise o in qualsiasi versione cloud dell'SDK ABAP per Google Cloud, consulta la Panoramica dell'autenticazione.

Prendi nota della chiave client che hai creato durante la configurazione dell'autenticazione. Utilizza questa chiave client per configurare i parametri di generazione del modello di IA e i parametri di ricerca.

Autorizzazioni IAM

Assicurati che l'account di servizio dedicato per l'accesso API che hai configurato nella chiave client ha accesso alle risorse di Vertex AI.

Vertex AI

Per utilizzare le risorse Vertex AI, devi concedere il ruolo Utente Vertex AI (roles/aiplatform.user) all'account di servizio dedicato a cui hai concesso le autorizzazioni per accedere all'API Vertex AI.

Se devi fornire autorizzazioni specifiche per creare, modificare ed eseguire il deployment di elementi, concessi autorizzazioni IAM Vertex AI specifiche, a seconda dei casi.

Vertex AI Feature Store

Per utilizzare Vertex AI Feature Store, devi concedere i seguenti ruoli all'account di servizio:

Funzionalità di IA Ruoli IAM richiesti
Vertex AI Feature Store

Configura i parametri di generazione del modello

I modelli linguistici di grandi dimensioni (LLM) sono modelli di deep learning addestrati su enormi quantità di dati di testo. Un modello include valori parametro che controllano come il modello genera una risposta. Puoi ottenere risultati diversi dal modello modificando i valori parametro.

a definire i parametri di generazione. per un modello, l'SDK Vertex AI per ABAP utilizza la tabella /GOOG/AI_CONFIG.

Per configurare i parametri di generazione per un modello, segui questi passaggi:

  1. In SAP GUI, esegui il codice transazione /GOOG/SDK_IMG.

    In alternativa, esegui il codice transazione SPRO e poi fai clic su Immagine di riferimento SAP.

  2. Fai clic su SDK ABAP per Google Cloud > Impostazioni di base > SDK Vertex AI: configura i parametri di generazione del modello.

  3. Fai clic su Nuove voci.

  4. Inserisci i valori nei seguenti campi:

    Campo Tipo di dati Descrizione
    Model Key Stringa

    Un nome univoco specificato per identificare la configurazione del modello, ad esempio Gemini.

    Usi questa chiave del modello mentre crei l'istanza del modello generativo o la classe Embeddings per specificare la configurazione di generazione da applicare.

    ID modello Stringa

    ID modello dell'LLM, ad esempio gemini-1.5-flash-001.

    Per informazioni sulle versioni dei modelli Vertex AI, consulta Versioni e ciclo di vita dei modelli.

    Nome della chiave Google Cloud Stringa La chiave client che hai configurato per l'autenticazione a Google Cloud durante la configurazione dell'autenticazione.
    ID località della regione Google Cloud Stringa

    L'ID località della regione Google Cloud in cui le caratteristiche di Vertex AI che vuoi usare.

    In genere, si utilizza la regione più vicina alla tua posizione fisica o alla posizione fisica dei tuoi utenti di destinazione. Per ulteriori informazioni, consulta le località di Vertex AI.

    ID publisher dell'LLM Stringa Facoltativo. Il publisher dell'LLM, ad esempio google.
    Tipo MIME della risposta Stringa Facoltativo. Tipo MIME della risposta di output del testo candidato generato. Tipo MIME supportato:
    • text/plain: (valore predefinito) Output di testo.
    • application/json: risposta JSON nei candidati.
    Al modello deve essere richiesto di restituire il tipo di risposta appropriato, altrimenti il comportamento è indefinito.
    Temperatura di casualità Stringa

    Facoltativo. Controlla la casualità delle previsioni. Per ulteriori informazioni, vedi Temperatura.

    Intervallo: [0,0, 1,0]

    Campionamento Top-K Numero in virgola mobile

    Facoltativo. Top-K cambia il modo in cui il modello seleziona i token per l'output.

    Specifica un valore più basso per risposte meno casuali e un valore più alto per risposte più casuali. Per ulteriori informazioni, vedi Top-K.

    Intervallo: [1, 40]

    Campionamento Top-P Numero in virgola mobile

    Facoltativo. Top-P cambia il modo in cui il modello seleziona i token per l'output.

    Specifica un valore più basso per risposte meno casuali e un valore più alto per risposte più casuali. Per ulteriori informazioni, vedi Top-P.

    Intervallo: [0,0, 1,0]

    Numero massimo di token di output per messaggio Numero intero

    Facoltativo. Numero massimo di token che possono essere generati nella risposta. R è di circa quattro caratteri. 100 token corrispondono a circa 60-80 parole.

    Specifica un valore più basso per risposte più brevi e un valore più alto per risposte potenzialmente più lunghe.

    Penalità positive Numero in virgola mobile

    Facoltativo. I valori positivi penalizzano i token che sono comparsi nel testo generato, aumentando così la possibilità di generare argomenti più diversi.

    Intervallo: [-2,0, 2,0]

    Sanzioni di frequenza Numero in virgola mobile

    Facoltativo. I valori positivi penalizzano i token che appaiono ripetutamente nel testo generato, diminuendo così la possibilità di ripetere gli stessi contenuti.

    Intervallo: [-2,0; 2,0]

    Se non fornisci un valore per un parametro facoltativo, l'SDK utilizza il valore predefinito del parametro specifico per la versione del modello configurata in Model ID.

  5. Salva la nuova voce.

Configurare i parametri della ricerca vettoriale

Per definire le configurazioni di Vector Search, l'SDK Vertex AI per ABAP utilizza la tabella /GOOG/SEARCHCONF.

Per configurare i parametri di Vector Search, segui questi passaggi:

  1. In SAP GUI, esegui il codice transazione /GOOG/SDK_IMG.

    In alternativa, esegui il codice transazione SPRO e poi fai clic su Immagine di riferimento SAP.

  2. Fai clic su SDK ABAP per Google Cloud > Impostazioni di base > SDK Vertex AI: configura i parametri di Vector Search.

  3. Fai clic su Nuove voci.

  4. Inserisci i valori nei seguenti campi:

    Campo Tipo di dati Descrizione
    Tasto per la ricerca Stringa Un nome univoco specificato per identificare la configurazione di ricerca.
    Nome della chiave Google Cloud Stringa La chiave client che hai configurato per l'autenticazione a Google Cloud durante la configurazione dell'autenticazione.
    ID posizione della regione Google Cloud Stringa

    L'ID località della regione Google Cloud in cui le caratteristiche di Vertex AI che vuoi usare.

    In genere, si utilizza la regione più vicina alla tua posizione fisica o alla posizione fisica dei tuoi utenti di destinazione. Per ulteriori informazioni, consulta le località di Vertex AI.

    ID deployment dell'indice vettoriale Stringa L'ID di deployment di un indice. Quando esegui il deployment di un indice in un endpoint, gli assegni un ID deployment univoco.

    Per informazioni sul deployment dell'indice, vedi Eseguire il deployment di un indice vettoriale in un endpoint indice.

    ID endpoint indice vettoriale Stringa

    L'ID dell'endpoint indice in cui viene eseguito il deployment dell'indice.

    Per informazioni sull'endpoint indice, vedi Creare un endpoint indice vettoriale.

  5. Salva la nuova voce.

Passaggi successivi