Esta página foi traduzida pela API Cloud Translation.

Aceda aos modelos Gemini a partir de um fluxo de trabalho com o Vertex AI

A IA generativa no Vertex AI (também conhecida como IA gen ou IA generativa) dá-lhe acesso aos modelos de IA generativa da Google para várias modalidades (texto, código, imagens e voz). Pode testar e otimizar estes modelos de linguagem (conteúdo extenso) (MDLs/CE) e, em seguida, implementá-los para utilização nas suas aplicações com tecnologia de IA. Para mais informações, consulte a vista geral da IA generativa no Vertex AI.

O Vertex AI tem uma variedade de modelos base da IA generativa que são acessíveis através de uma API, incluindo os modelos usados neste guia. Para mais informações sobre como escolher um modelo, consulte Modelos Google.

Cada modelo é exposto através de um ponto final do publicador específico do seu Google Cloud projeto, pelo que não é necessário implementar o modelo base, a menos que precise de o otimizar para um caso de utilização específico. Pode enviar um comando para o ponto final do publicador. Um comando é um pedido de linguagem natural enviado a um MDG para obter uma resposta.

Este tutorial demonstra fluxos de trabalho que geram respostas a partir de modelos da Vertex AI através do envio de comandos de texto para os pontos finais do publicador usando um conetor do Workflows ou um pedido HTTP POST. Para mais informações, consulte a vista geral do conetor da API Vertex AI e faça um pedido HTTP.

Tenha em atenção que pode implementar e executar cada fluxo de trabalho de forma independente.

Implemente um fluxo de trabalho que descreva uma imagem

Implemente um fluxo de trabalho que use um método de conector (generateContent) para fazer um pedido a um ponto final do publicador do modelo. O método oferece suporte para a geração de conteúdo com entradas multimodais.

O fluxo de trabalho fornece um comando de texto e o URI de uma imagem que está disponível publicamente num contentor do Cloud Storage. Pode ver a imagem e, na Google Cloud consola, pode ver os detalhes do objeto.

O fluxo de trabalho devolve uma descrição da imagem a partir da resposta gerada pelo modelo.

Para mais informações sobre os parâmetros do corpo do pedido HTTP usados quando pede ao MDG, e os elementos do corpo da resposta, consulte a referência da API Gemini.

Consola

Na Google Cloud consola, aceda à página Fluxos de trabalho.

Aceda a Fluxos de trabalho
Clique em Criar.
Introduza um nome para o novo fluxo de trabalho: describe-image.
Na lista Região, selecione us-central1 (Iowa).
Para a conta de serviço, selecione a conta de serviço que criou anteriormente.
Clicar em Seguinte.

No editor de fluxos de trabalho, introduza a seguinte definição para o seu fluxo de trabalho:

main:
    params: [args]
    steps:
    - init:
        assign:
            - project: ${sys.get_env("GOOGLE_CLOUD_PROJECT_ID")}
            - location: "us-central1"
            - model: "gemini-2.5-flash"
            - text_combined: ""
    - ask_llm:
        call: googleapis.aiplatform.v1.projects.locations.endpoints.generateContent
        args:
            model: ${"projects/" + project + "/locations/" + location + "/publishers/google/models/" + model}
            region: ${location}
            body:
                contents:
                    role: user
                    parts:
                    - fileData:
                        mimeType: image/jpeg
                        fileUri: ${args.image_url}
                    - text: Describe this picture in detail
                generation_config:
                    temperature: 0.4
                    max_output_tokens: 2048
                    top_p: 1
                    top_k: 32
        result: llm_response
    - return_result:
        return:
            image_url: ${args.image_url}
            image_description: ${llm_response.candidates[0].content.parts[0].text}

Clique em Implementar.

gcloud

Crie um ficheiro de código-fonte para o seu fluxo de trabalho:
```
touch describe-image.yaml
```

Num editor de texto, copie o seguinte fluxo de trabalho para o ficheiro de código-fonte:

main:
    params: [args]
    steps:
    - init:
        assign:
            - project: ${sys.get_env("GOOGLE_CLOUD_PROJECT_ID")}
            - location: "us-central1"
            - model: "gemini-2.5-flash"
            - text_combined: ""
    - ask_llm:
        call: googleapis.aiplatform.v1.projects.locations.endpoints.generateContent
        args:
            model: ${"projects/" + project + "/locations/" + location + "/publishers/google/models/" + model}
            region: ${location}
            body:
                contents:
                    role: user
                    parts:
                    - fileData:
                        mimeType: image/jpeg
                        fileUri: ${args.image_url}
                    - text: Describe this picture in detail
                generation_config:
                    temperature: 0.4
                    max_output_tokens: 2048
                    top_p: 1
                    top_k: 32
        result: llm_response
    - return_result:
        return:
            image_url: ${args.image_url}
            image_description: ${llm_response.candidates[0].content.parts[0].text}

Implemente o fluxo de trabalho introduzindo o seguinte comando:

gcloud workflows deploy describe-image \
    --source=describe-image.yaml \
    --location=us-central1 \
    --service-account=SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com

Execute o fluxo de trabalho

A execução de um fluxo de trabalho executa a definição do fluxo de trabalho atual associada ao fluxo de trabalho.

Consola

Na Google Cloud consola, aceda à página Fluxos de trabalho.

Aceda a Fluxos de trabalho
Na página Fluxos de trabalho, selecione o fluxo de trabalho describe-image para aceder à respetiva página de detalhes.
Na página Detalhes do fluxo de trabalho, clique em Executar.

Para a Entrada, introduza o seguinte:

{"image_url":"gs://generativeai-downloads/images/scones.jpg"}

Clique novamente em Executar.

Veja os resultados do fluxo de trabalho no painel Saída.

O resultado deve ser semelhante ao seguinte:

{
  "image_description": "There are three pink peony flowers on the right side of the picture[]...]There is a white napkin on the table.",
  "image_url": "gs://generativeai-downloads/images/scones.jpg"
}

gcloud

Abra um terminal.

Execute o fluxo de trabalho:

gcloud workflows run describe-image \
    --data='{"image_url":"gs://generativeai-downloads/images/scones.jpg"}'

Os resultados da execução devem ser semelhantes aos seguintes:

  Waiting for execution [258b530e-a093-46d7-a4ff-cbf5392273c0] to complete...done.
  argument: '{"image_url":"gs://generativeai-downloads/images/scones.jpg"}'
  createTime: '2024-02-09T13:59:32.166409938Z'
  duration: 4.174708484s
  endTime: '2024-02-09T13:59:36.341118422Z'
  name: projects/1051295516635/locations/us-central1/workflows/describe-image/executions/258b530e-a093-46d7-a4ff-cbf5392273c0
  result: "{\"image_description\":\"The picture shows a rustic table with a white surface,\
    \ on which there are several scones with blueberries, as well as two cups of coffee\
    [...]
    \ on the table. The background of the table is a dark blue color.\",\"image_url\"\
    :\"gs://generativeai-downloads/images/scones.jpg\"}"
  startTime: '2024-02-09T13:59:32.166409938Z'
  state: SUCCEEDED

Implemente um fluxo de trabalho que gere históricos de países

Implemente um fluxo de trabalho que percorre uma lista de entrada de países em paralelo e usa um método de conetor (generateContent) para fazer um pedido a um ponto final do publicador do modelo. O método oferece suporte para a geração de conteúdo com entradas multimodais.

O fluxo de trabalho devolve os históricos de países gerados pelo modelo, combinando-os num mapa.

Para mais informações sobre os parâmetros do corpo do pedido HTTP usados quando pede ao MDG, e os elementos do corpo da resposta, consulte a referência da API Gemini.

Consola

Na Google Cloud consola, aceda à página Fluxos de trabalho.

Aceda a Fluxos de trabalho
Clique em Criar.
Introduza um nome para o novo fluxo de trabalho: gemini-pro-country-histories.
Na lista Região, selecione us-central1 (Iowa).
Para a conta de serviço, selecione a conta de serviço que criou anteriormente.
Clicar em Seguinte.

No editor de fluxos de trabalho, introduza a seguinte definição para o seu fluxo de trabalho:

main:
    params: [args]
    steps:
    - init:
        assign:
            - project: ${sys.get_env("GOOGLE_CLOUD_PROJECT_ID")}
            - location: "us-central1"
            - model: "gemini-2.5-flash"
            - histories: {}
    - loop_over_countries:
        parallel:
            shared: [histories]
            for:
                value: country
                in: ${args.countries}
                steps:
                    - ask_llm:
                        call: googleapis.aiplatform.v1.projects.locations.endpoints.generateContent
                        args:
                            model: ${"projects/" + project + "/locations/" + location + "/publishers/google/models/" + model}
                            region: ${location}
                            body:
                                contents:
                                    role: "USER"
                                    parts:
                                        text: ${"Can you tell me about the history of " + country}
                                generation_config:
                                    temperature: 0.5
                                    max_output_tokens: 2048
                                    top_p: 0.8
                                    top_k: 40
                        result: llm_response
                    - add_to_histories:
                        assign:
                            - histories[country]: ${llm_response.candidates[0].content.parts[0].text}
    - return_result:
        return: ${histories}

Clique em Implementar.

gcloud

Crie um ficheiro de código-fonte para o seu fluxo de trabalho:
```
touch gemini-pro-country-histories.yaml
```

Num editor de texto, copie o seguinte fluxo de trabalho para o ficheiro de código-fonte:

main:
    params: [args]
    steps:
    - init:
        assign:
            - project: ${sys.get_env("GOOGLE_CLOUD_PROJECT_ID")}
            - location: "us-central1"
            - model: "gemini-2.5-flash"
            - histories: {}
    - loop_over_countries:
        parallel:
            shared: [histories]
            for:
                value: country
                in: ${args.countries}
                steps:
                    - ask_llm:
                        call: googleapis.aiplatform.v1.projects.locations.endpoints.generateContent
                        args:
                            model: ${"projects/" + project + "/locations/" + location + "/publishers/google/models/" + model}
                            region: ${location}
                            body:
                                contents:
                                    role: "USER"
                                    parts:
                                        text: ${"Can you tell me about the history of " + country}
                                generation_config:
                                    temperature: 0.5
                                    max_output_tokens: 2048
                                    top_p: 0.8
                                    top_k: 40
                        result: llm_response
                    - add_to_histories:
                        assign:
                            - histories[country]: ${llm_response.candidates[0].content.parts[0].text}
    - return_result:
        return: ${histories}

Implemente o fluxo de trabalho introduzindo o seguinte comando:

gcloud workflows deploy gemini-pro-country-histories \
    --source=gemini-pro-country-histories.yaml \
    --location=us-central1 \
    --service-account=SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com

Execute o fluxo de trabalho

A execução de um fluxo de trabalho executa a definição do fluxo de trabalho atual associada ao fluxo de trabalho.

Consola

Na Google Cloud consola, aceda à página Fluxos de trabalho.

Aceda a Fluxos de trabalho
Na página Fluxos de trabalho, selecione o fluxo de trabalho gemini-pro-country-histories para aceder à respetiva página de detalhes.
Na página Detalhes do fluxo de trabalho, clique em Executar.

Para a Entrada, introduza o seguinte:

{"countries":["Argentina", "Bhutan", "Cyprus", "Denmark", "Ethiopia"]}

Clique novamente em Executar.

Veja os resultados do fluxo de trabalho no painel Saída.

O resultado deve ser semelhante ao seguinte:

{
  "Argentina": "The history of Argentina is a complex and fascinating one, marked by periods of prosperity and decline, political [...]
  "Bhutan": "The history of Bhutan is a rich and fascinating one, dating back to the 7th century AD. Here is a brief overview: [...]
  "Cyprus": "The history of Cyprus is a long and complex one, spanning over 10,000 years. The island has been ruled by a succession [...]
  "Denmark": "1. **Prehistory and Early History (c. 12,000 BC - 800 AD)**\\n   - The earliest evidence of human habitation in Denmark [...]
  "Ethiopia": "The history of Ethiopia is a long and complex one, stretching back to the earliest human civilizations. The country is [...]
}

gcloud

Abra um terminal.

Execute o fluxo de trabalho:

gcloud workflows run gemini-pro-country-histories \
    --data='{"countries":["Argentina", "Bhutan", "Cyprus", "Denmark", "Ethiopia"]}' \
    --location=us-central1

Os resultados da execução devem ser semelhantes aos seguintes:

  Waiting for execution [7ae1ccf1-29b7-4c2c-99ec-7a12ae289391] to complete...done.
  argument: '{"countries":["Argentina","Bhutan","Cyprus","Denmark","Ethiopia"]}'
  createTime: '2024-02-09T16:25:16.742349156Z'
  duration: 12.075968673s
  endTime: '2024-02-09T16:25:28.818317829Z'
  name: projects/1051295516635/locations/us-central1/workflows/gemini-pro-country-histories/executions/7ae1ccf1-29b7-4c2c-99ec-7a12ae289391
  result: "{\"Argentina\":\"The history of Argentina can be traced back to the arrival\
    [...]
    n* 2015: Argentina elects Mauricio Macri as president.\",\"Bhutan\":\"The history\
    [...]
    \ natural beauty, ancient monasteries, and friendly people.\",\"Cyprus\":\"The history\
    [...]
    ,\"Denmark\":\"The history of Denmark can be traced back to the Stone Age, with\
    [...]
    \ a high standard of living.\",\"Ethiopia\":\"The history of Ethiopia is long and\
    [...]
  startTime: '2024-02-09T16:25:16.742349156Z'
  state: SUCCEEDED

Implemente um fluxo de trabalho que resuma um documento grande

Implemente um fluxo de trabalho que divida um documento grande em partes mais pequenas, fazendo pedidos http.post a um ponto final do publicador de modelos em paralelo para que o modelo possa resumir cada parte em simultâneo. Por fim, o fluxo de trabalho combina todos os resumos parciais num resumo completo.

Para mais informações sobre os parâmetros do corpo do pedido HTTP usados quando pede ao MDG, e os elementos do corpo da resposta, consulte a referência da API Gemini.

A definição do fluxo de trabalho pressupõe que criou um contentor do Cloud Storage para o qual pode carregar um ficheiro de texto. Para mais informações acerca do conetor Workflows (googleapis.storage.v1.objects.get) usado para obter objetos do contentor do Cloud Storage, consulte a referência de conetores.

Depois de implementar o fluxo de trabalho, pode executá-lo criando um acionador do Eventarc adequado e, em seguida, carregando um ficheiro para o contentor. Para mais informações, consulte o artigo Encaminhe eventos do Cloud Storage para fluxos de trabalho. Tenha em atenção que têm de ser ativadas APIs adicionais e concedidas funções adicionais, incluindo a concessão à sua conta de serviço da função de utilizador do objeto de armazenamento (roles/storage.objectUser) que suporta a utilização de objetos do Cloud Storage. Para mais informações, consulte a secção Prepare-se para criar um acionador.

Consola

Na Google Cloud consola, aceda à página Fluxos de trabalho.

Aceda a Fluxos de trabalho
Clique em Criar.
Introduza um nome para o novo fluxo de trabalho: gemini-pro-summaries.
Na lista Região, selecione us-central1 (Iowa).
Para a conta de serviço, selecione a conta de serviço que criou anteriormente.
Clicar em Seguinte.

No editor de fluxos de trabalho, introduza a seguinte definição para o seu fluxo de trabalho:

main:
    params: [input]
    steps:
    - assign_file_vars:
        assign:
            - file_size: ${int(input.data.size)}
            - chunk_size: 64000
            - n_chunks: ${int(file_size / chunk_size)}
            - summaries: []
            - all_summaries_concatenated: ""
    - loop_over_chunks:
        parallel:
            shared: [summaries]
            for:
                value: chunk_idx
                range: ${[0, n_chunks]}
                steps:
                    - assign_bounds:
                        assign:
                            - lower_bound: ${chunk_idx * chunk_size}
                            - upper_bound: ${(chunk_idx + 1) * chunk_size}
                            - summaries: ${list.concat(summaries, "")}
                    - dump_file_content:
                        call: http.get
                        args:
                            url: ${"https://storage.googleapis.com/storage/v1/b/" + input.data.bucket + "/o/" + input.data.name + "?alt=media"}
                            auth:
                                type: OAuth2
                            headers:
                                Range: ${"bytes=" + lower_bound + "-" + upper_bound}
                        result: file_content
                    - assign_chunk:
                        assign:
                            - chunk: ${file_content.body}
                    - generate_chunk_summary:
                        call: ask_gemini_for_summary
                        args:
                            textToSummarize: ${chunk}
                        result: summary
                    - assign_summary:
                        assign:
                            - summaries[chunk_idx]: ${summary}
    - concat_summaries:
        for:
            value: summary
            in: ${summaries}
            steps:
                - append_summaries:
                    assign:
                        - all_summaries_concatenated: ${all_summaries_concatenated + "\n" + summary}
    - reduce_summary:
        call: ask_gemini_for_summary
        args:
            textToSummarize: ${all_summaries_concatenated}
        result: final_summary
    - return_result:
        return:
            - summaries: ${summaries}
            - final_summary: ${final_summary}

ask_gemini_for_summary:
    params: [textToSummarize]
    steps:
        - init:
            assign:
                - project: ${sys.get_env("GOOGLE_CLOUD_PROJECT_ID")}
                - location: "us-central1"
                - model: "gemini-2.5-pro"
                - summary: ""
        - call_gemini:
            call: http.post
            args:
                url: ${"https://" + location + "-aiplatform.googleapis.com" + "/v1/projects/" + project + "/locations/" + location + "/publishers/google/models/" + model + ":generateContent"}
                auth:
                    type: OAuth2
                body:
                    contents:
                        role: user
                        parts:
                            - text: '${"Make a summary of the following text:\n\n" + textToSummarize}'
                    generation_config:
                        temperature: 0.2
                        maxOutputTokens: 2000
                        topK: 10
                        topP: 0.9
            result: gemini_response
        # Sometimes, there's no text, for example, due to safety settings
        - check_text_exists:
            switch:
            - condition: ${not("parts" in gemini_response.body.candidates[0].content)}
              next: return_summary
        - extract_text:
            assign:
                - summary: ${gemini_response.body.candidates[0].content.parts[0].text}
        - return_summary:
            return: ${summary}

Clique em Implementar.

gcloud

Crie um ficheiro de código-fonte para o seu fluxo de trabalho:
```
touch gemini-pro-summaries.yaml
```

Num editor de texto, copie o seguinte fluxo de trabalho para o ficheiro de código-fonte:

main:
    params: [input]
    steps:
    - assign_file_vars:
        assign:
            - file_size: ${int(input.data.size)}
            - chunk_size: 64000
            - n_chunks: ${int(file_size / chunk_size)}
            - summaries: []
            - all_summaries_concatenated: ""
    - loop_over_chunks:
        parallel:
            shared: [summaries]
            for:
                value: chunk_idx
                range: ${[0, n_chunks]}
                steps:
                    - assign_bounds:
                        assign:
                            - lower_bound: ${chunk_idx * chunk_size}
                            - upper_bound: ${(chunk_idx + 1) * chunk_size}
                            - summaries: ${list.concat(summaries, "")}
                    - dump_file_content:
                        call: http.get
                        args:
                            url: ${"https://storage.googleapis.com/storage/v1/b/" + input.data.bucket + "/o/" + input.data.name + "?alt=media"}
                            auth:
                                type: OAuth2
                            headers:
                                Range: ${"bytes=" + lower_bound + "-" + upper_bound}
                        result: file_content
                    - assign_chunk:
                        assign:
                            - chunk: ${file_content.body}
                    - generate_chunk_summary:
                        call: ask_gemini_for_summary
                        args:
                            textToSummarize: ${chunk}
                        result: summary
                    - assign_summary:
                        assign:
                            - summaries[chunk_idx]: ${summary}
    - concat_summaries:
        for:
            value: summary
            in: ${summaries}
            steps:
                - append_summaries:
                    assign:
                        - all_summaries_concatenated: ${all_summaries_concatenated + "\n" + summary}
    - reduce_summary:
        call: ask_gemini_for_summary
        args:
            textToSummarize: ${all_summaries_concatenated}
        result: final_summary
    - return_result:
        return:
            - summaries: ${summaries}
            - final_summary: ${final_summary}

ask_gemini_for_summary:
    params: [textToSummarize]
    steps:
        - init:
            assign:
                - project: ${sys.get_env("GOOGLE_CLOUD_PROJECT_ID")}
                - location: "us-central1"
                - model: "gemini-2.5-pro"
                - summary: ""
        - call_gemini:
            call: http.post
            args:
                url: ${"https://" + location + "-aiplatform.googleapis.com" + "/v1/projects/" + project + "/locations/" + location + "/publishers/google/models/" + model + ":generateContent"}
                auth:
                    type: OAuth2
                body:
                    contents:
                        role: user
                        parts:
                            - text: '${"Make a summary of the following text:\n\n" + textToSummarize}'
                    generation_config:
                        temperature: 0.2
                        maxOutputTokens: 2000
                        topK: 10
                        topP: 0.9
            result: gemini_response
        # Sometimes, there's no text, for example, due to safety settings
        - check_text_exists:
            switch:
            - condition: ${not("parts" in gemini_response.body.candidates[0].content)}
              next: return_summary
        - extract_text:
            assign:
                - summary: ${gemini_response.body.candidates[0].content.parts[0].text}
        - return_summary:
            return: ${summary}

Implemente o fluxo de trabalho introduzindo o seguinte comando:

gcloud workflows deploy gemini-pro-summaries \
    --source=gemini-pro-summaries.yaml \
    --location=us-central1 \
    --service-account=SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com