Instalar e configurar o SDK da Vertex AI para ABAP

Neste documento, descrevemos como instalar e configurar o SDK da Vertex AI para ABAP no seu ambiente SAP.

Instalação

No local ou qualquer edição na nuvem

Quando você instala a versão 1.8 do SDK do ABAP para Google Cloud no local ou em qualquer edição na nuvem, o SDK da Vertex AI para ABAP é instalado. Para informações sobre as etapas de instalação, consulte Instalar e configurar a edição local ou de qualquer nuvem do SDK do ABAP para Google Cloud.

Se você já estiver usando a versão 1.7 ou anterior do SDK do ABAP para Google Cloud no local ou em qualquer edição na nuvem, atualize o SDK para a versão mais recente e receba o SDK da Vertex AI para ABAP. Para mais informações, consulte Atualizar o SDK ABAP para Google Cloud.

Edição do SAP BTP

Quando você instala a versão 1.1 da edição SAP BTP do SDK do ABAP para Google Cloud, o SDK da Vertex AI para ABAP é instalado. Para informações sobre as etapas de instalação, consulte Instalar e configurar a edição SAP BTP do SDK do ABAP para Google Cloud.

Entendemos que o acesso à Vertex AI e aos recursos da nuvem pode ser limitado para alguns desenvolvedores. Para ativar a prototipagem e a experimentação com a configuração mínima, consulte Prototipagem rápida com o Gemini.

Ativar a API Vertex AI

  • Ative a API Vertex AI no seu Google Cloud projeto.

    API Vertex AI

    Para informações sobre como ativar as APIs Google Cloud , consulte Como ativar APIs.

Autenticação

No local ou qualquer edição na nuvem

Depois de configurar a autenticação para acessar as APIs Google Cloud na edição local ou na nuvem do SDK do ABAP para Google Cloud, o SDK da Vertex AI para ABAP usa o mesmo método de autenticação para acessar a API Vertex AI. Para saber como configurar a autenticação no local ou em qualquer edição na nuvem do SDK do ABAP para Google Cloud, consulte Visão geral da autenticação.

Anote a chave do cliente que você criou como parte da configuração de autenticação. Use essa chave de cliente ao configurar parâmetros de geração de modelos de IA e de pesquisa.

Edição do SAP BTP

Depois de configurar a autenticação para acessar as APIs Google Cloud na edição SAP BTP do SDK do ABAP para Google Cloud, o SDK da Vertex AI para ABAP usa o mesmo método de autenticação para acessar a API Vertex AI. Para saber como configurar a autenticação na edição SAP BTP do SDK do ABAP para Google Cloud, consulte Visão geral da autenticação.

Anote a chave do cliente que você criou como parte da configuração de autenticação. Use essa chave de cliente ao configurar parâmetros de geração de modelos de IA e de pesquisa.

Permissões do IAM

Verifique se a conta de serviço dedicada para acesso à API que você configurou na tabela de chaves do cliente tem acesso aos recursos da Vertex AI.

Vertex AI

Para usar os recursos da Vertex AI, conceda o papel de Usuário da Vertex AI (roles/aiplatform.user) à conta de serviço dedicada a que você concedeu permissões para acessar a API Vertex AI.

Se você precisar fornecer permissões específicas para criar, modificar e implantar artefatos, conceda as permissões do IAM da Vertex AI específicas.

Vertex AI Feature Store

Para usar o Feature Store da Vertex AI, é necessário conceder os seguintes papéis à conta de serviço:

Capacidade de IA Papéis do IAM obrigatórios
Vertex AI Feature Store

Verificar a adição de apps Fiori à plataforma de lançamento

No local ou qualquer edição na nuvem

Você pode pular esta seção porque ela não se aplica à edição local ou na nuvem do ABAP SDK for Google Cloud.

Edição do SAP BTP

Para permitir que administradores e desenvolvedores configurem os parâmetros de geração de modelo e de pesquisa de vetor, a edição SAP BTP do SDK do ABAP para Google Cloud fornece apps SAP Fiori. O SDK também fornece apps Fiori somente de exibição para visualizar os parâmetros mantidos.

Adicione esses apps Fiori à sua plataforma de lançamento enquanto instala a edição SAP BTP do SDK do ABAP para Google Cloud. Verifique se esses apps estão disponíveis no Launchpad. Para mais informações, consulte Adicionar apps Fiori à plataforma de lançamento.

Configurar os parâmetros de geração de modelos

Modelos de linguagem grandes (LLMs) são modelos de aprendizado profundo treinados com grandes quantidades de dados de texto. Um modelo inclui valores de parâmetros que controlam como ele gera uma resposta. É possível mudar os valores dos parâmetros para ter resultados diferentes do modelo.

Para definir os parâmetros de geração de um modelo, o SDK da Vertex AI para ABAP usa a tabela /GOOG/AI_CONFIG.

Para configurar os parâmetros de geração de um modelo, siga estas etapas:

No local ou qualquer edição na nuvem

  1. Na GUI do SAP, execute o código de transação /GOOG/SDK_IMG.

    Como alternativa, execute o código da transação SPRO e clique em IMG de referência do SAP.

  2. Clique em SDK do ABAP para Google Cloud > Configurações básicas > SDK da Vertex AI: configurar parâmetros de geração de modelos.

  3. Clique em Novas entradas.

  4. Insira valores nos campos a seguir:

    Campo Tipo de dado Descrição
    Chave do modelo String

    Um nome exclusivo que você especifica para identificar a configuração do modelo, como Gemini.

    Use essa chave ao instanciar a classe do modelo generativo ou a classe de embeddings para especificar a configuração de geração que vai entrar em vigor.

    ID do modelo String

    ID do modelo do LLM, como gemini-1.5-flash-001.

    Para informações sobre as versões de modelo da Vertex AI, consulte Versões e ciclo de vida do modelo.

    Nome da chave do Google Cloud String A chave de cliente configurada para autenticação no Google Cloud durante a configuração de autenticação.
    ID do local da região do Google Cloud String

    O ID de local da região do Google Cloud em que os recursos da Vertex AI que você quer usar estão disponíveis.

    Normalmente, você usa a região mais próxima da sua localização física ou da dos usuários pretendidos. Para mais informações, consulte Locais da Vertex AI.

    ID do editor do LLM String Opcional. O editor do LLM, como google.
    Tipo MIME da resposta String Opcional. Tipo MIME da resposta de saída do texto candidato gerado. Tipo MIME compatível:
    • text/plain (padrão): saída de texto.
    • application/json: resposta JSON nos candidatos.
    O modelo precisa ser solicitado a emitir o tipo de resposta apropriado. Caso contrário, o comportamento será indefinido.
    Temperatura de aleatoriedade String

    Opcional. Controla a aleatoriedade das previsões. Para mais informações, consulte Temperatura.

    Intervalo: [0.0, 1.0]

    Amostra Top-K Ponto flutuante

    Opcional. O Top-K muda a forma como o modelo seleciona tokens para saída.

    Especifique um valor mais baixo para respostas menos aleatórias e um valor mais alto para respostas mais aleatórias. Para mais informações, consulte Top-K.

    Intervalo: [1, 40]

    Amostragem de valores máximos Ponto flutuante

    Opcional. O Top-P muda a forma como o modelo seleciona tokens para saída.

    Especifique um valor mais baixo para respostas menos aleatórias e um valor mais alto para respostas mais aleatórias. Para mais informações, consulte Top-P.

    Intervalo: [0.0, 1.0]

    Número máximo de tokens de saída por msg Número inteiro

    Opcional. Número máximo de tokens que podem ser gerados na resposta. Um token tem cerca de quatro caracteres. 100 tokens correspondem a cerca de 60 a 80 palavras.

    Especifique um valor mais baixo para respostas mais curtas e um valor mais alto para respostas possivelmente mais longas.

    Penalidades positivas Ponto flutuante

    Opcional. Valores positivos penalizam tokens que apareceram no texto gerado, aumentando a possibilidade de gerar tópicos mais diversos.

    Intervalo: [-2.0, 2.0]

    Penalidades de frequência Ponto flutuante

    Opcional. Valores positivos penalizam tokens que aparecem repetidamente no texto gerado, diminuindo a possibilidade de repetir o mesmo conteúdo.

    Intervalo: [-2.0, 2.0]

    Se você não fornecer um valor para um parâmetro opcional, o SDK vai usar o valor padrão do parâmetro específico da versão do modelo configurada em Model ID.

  5. Salve a nova entrada.

Edição do SAP BTP

  1. Acesse a plataforma de lançamento do SAP Fiori.

  2. Acesse o espaço que contém os apps Fiori para configuração do SDK.

  3. Abra o app SDK da Vertex AI: configurar parâmetros de geração de modelos.

  4. Clique em Criar.

  5. Na caixa de diálogo Create que aparece, insira um valor para o campo Model Key e clique em Continue.

  6. Insira valores nos campos que aparecem.

    A tabela a seguir descreve os campos e como eles correspondem aos parâmetros de geração de modelos:

    Campo Tipo de dado Descrição
    Chave do modelo String

    Um nome exclusivo que você especifica para identificar a configuração do modelo, como Gemini.

    Use essa chave ao instanciar a classe do modelo generativo ou a classe de embeddings para especificar a configuração de geração que vai entrar em vigor.

    ID do modelo String

    ID do modelo do LLM, como gemini-1.5-flash-001.

    Para informações sobre as versões de modelo da Vertex AI, consulte Versões e ciclo de vida do modelo.

    Nome da chave do Google Cloud String A chave de cliente configurada para autenticação no Google Cloud durante a configuração de autenticação.
    ID do local da região do Google Cloud String

    O ID de local da região do Google Cloud em que os recursos da Vertex AI que você quer usar estão disponíveis.

    Normalmente, você usa a região mais próxima da sua localização física ou da dos usuários pretendidos. Para mais informações, consulte Locais da Vertex AI.

    ID do editor do LLM String Opcional. O editor do LLM, como google.
    Tipo MIME da resposta String Opcional. Tipo MIME da resposta de saída do texto candidato gerado. Tipo MIME compatível:
    • text/plain (padrão): saída de texto.
    • application/json: resposta JSON nos candidatos.
    O modelo precisa ser solicitado a emitir o tipo de resposta apropriado. Caso contrário, o comportamento será indefinido.
    Temperatura de aleatoriedade String

    Opcional. Controla a aleatoriedade das previsões. Para mais informações, consulte Temperatura.

    Intervalo: [0.0, 1.0]

    Amostra Top-K Ponto flutuante

    Opcional. O Top-K muda a forma como o modelo seleciona tokens para saída.

    Especifique um valor mais baixo para respostas menos aleatórias e um valor mais alto para respostas mais aleatórias. Para mais informações, consulte Top-K.

    Intervalo: [1, 40]

    Amostragem de valores máximos Ponto flutuante

    Opcional. O Top-P muda a forma como o modelo seleciona tokens para saída.

    Especifique um valor mais baixo para respostas menos aleatórias e um valor mais alto para respostas mais aleatórias. Para mais informações, consulte Top-P.

    Intervalo: [0.0, 1.0]

    Número máximo de tokens de saída por msg Número inteiro

    Opcional. Número máximo de tokens que podem ser gerados na resposta. Um token tem cerca de quatro caracteres. 100 tokens correspondem a cerca de 60 a 80 palavras.

    Especifique um valor mais baixo para respostas mais curtas e um valor mais alto para respostas possivelmente mais longas.

    Penalidades positivas Ponto flutuante

    Opcional. Valores positivos penalizam tokens que apareceram no texto gerado, aumentando a possibilidade de gerar tópicos mais diversos.

    Intervalo: [-2.0, 2.0]

    Penalidades de frequência Ponto flutuante

    Opcional. Valores positivos penalizam tokens que aparecem repetidamente no texto gerado, diminuindo a possibilidade de repetir o mesmo conteúdo.

    Intervalo: [-2.0, 2.0]

    Se você não fornecer um valor para um parâmetro opcional, o SDK vai usar o valor padrão do parâmetro específico da versão do modelo configurada em Model ID.

  7. Clique em Criar para salvar a entrada.

Configurar os parâmetros da pesquisa de vetor

Para definir as configurações da Pesquisa de vetor, o SDK da Vertex AI para ABAP usa a tabela /GOOG/SEARCHCONF.

Para configurar os parâmetros da pesquisa de vetor, siga estas etapas:

No local ou qualquer edição na nuvem

  1. Na GUI do SAP, execute o código de transação /GOOG/SDK_IMG.

    Como alternativa, execute o código da transação SPRO e clique em IMG de referência do SAP.

  2. Clique em SDK do ABAP para Google Cloud > Configurações básicas > SDK da Vertex AI: configurar parâmetros de pesquisa de vetor.

  3. Clique em Novas entradas.

  4. Insira valores nos campos a seguir:

    Campo Tipo de dado Descrição
    Chave de pesquisa String Um nome exclusivo especificado para identificar a configuração de pesquisa.
    Nome da chave do Google Cloud String A chave de cliente configurada para autenticação no Google Cloud durante a configuração de autenticação.
    ID do local da região do Google Cloud String

    O ID de local da região do Google Cloud em que os recursos da Vertex AI que você quer usar estão disponíveis.

    Normalmente, você usa a região mais próxima da sua localização física ou da dos usuários pretendidos. Para mais informações, consulte Locais da Vertex AI.

    ID de implantação do índice vetorial String O ID de implantação de um índice. Ao implantar um índice em um endpoint, você atribui a ele um ID de implantação exclusivo.

    Para informações sobre a implantação de índices, consulte Implantar um índice vetorial em um endpoint de índice.

    ID do endpoint do índice de vetor String

    O ID do endpoint do índice em que o índice é implantado.

    Para informações sobre o endpoint de índice, consulte Criar um endpoint de índice vetorial.

  5. Salve a nova entrada.

Edição do SAP BTP

  1. Acesse a plataforma de lançamento do SAP Fiori.

  2. Acesse o espaço que contém os apps Fiori para configuração do SDK.

  3. Abra o app SDK da Vertex AI: configuração da pesquisa de vetor.

  4. Clique em Criar.

  5. Na caixa de diálogo Create que aparece, insira um valor para o campo Model Key e clique em Continue.

  6. Insira valores nos campos que aparecem.

    A tabela a seguir descreve os campos e como eles correspondem aos parâmetros de pesquisa de vetor:

    Campo Tipo de dado Descrição
    Chave de pesquisa String Um nome exclusivo especificado para identificar a configuração de pesquisa.
    Nome da chave do Google Cloud String A chave de cliente configurada para autenticação no Google Cloud durante a configuração de autenticação.
    ID do local da região do Google Cloud String

    O ID de local da região do Google Cloud em que os recursos da Vertex AI que você quer usar estão disponíveis.

    Normalmente, você usa a região mais próxima da sua localização física ou da dos usuários pretendidos. Para mais informações, consulte Locais da Vertex AI.

    ID de implantação do índice vetorial String O ID de implantação de um índice. Ao implantar um índice em um endpoint, você atribui a ele um ID de implantação exclusivo.

    Para informações sobre a implantação de índices, consulte Implantar um índice vetorial em um endpoint de índice.

    ID do endpoint do índice de vetor String

    O ID do endpoint do índice em que o índice é implantado.

    Para informações sobre o endpoint de índice, consulte Criar um endpoint de índice vetorial.

  7. Clique em Criar para salvar a entrada.

A seguir