Visão geral da IA generativa na Vertex AI

A IA generativa na Vertex AI permite criar aplicativos prontos para produção que são alimentados por modelos de IA generativa de última geração hospedados na infraestrutura global avançada do Google.

Primeiros passos


Pronto para empresas

Pronto para empresas

Implante seus aplicativos de IA generativa em escala com segurança de nível empresarial, residência de dados, transparência de acesso e baixa latência.

Recursos de última geração

Recursos de última geração

Amplie os recursos dos seus aplicativos usando a janela de contexto de 2.000.000 de tokens aceita pelo Gemini 1.5 Pro.

Plataforma aberta

Plataforma aberta

A Vertex AI oferece acesso a mais de 100 modelos de empresas de IA terceirizadas, incluindo o Anthropic Claude 3.5 Sonnet, o Meta Llama 3 e o Mistral AI Mixtral 8x7B.

Recursos principais

  • Processamento multimodal

    Processe vários tipos de mídia de entrada ao mesmo tempo, como imagem, vídeo, áudio e documentos.

  • Geração de embeddings

    Gere embeddings para realizar tarefas como pesquisa, classificação, agrupamento e detecção de outliers.

  • Ajuste de modelos

    Adapte os modelos para realizar tarefas específicas com maior precisão.

  • Chamadas de função

    Conecte modelos a APIs externas para ampliar os recursos do modelo.

  • Embasamento

    Conecte modelos a fontes de dados externas para reduzir as alucinações nas respostas.

  • Geração de imagens

    Gere e edite imagens usando comandos de texto em linguagem natural.


Diferenças entre a Vertex AI e a IA do Google

A API Gemini na Vertex AI e na Google AI permitem incorporar os recursos dos modelos do Gemini aos seus aplicativos. A plataforma certa depende dos seus objetivos, conforme detalhado na tabela a seguir.

API Projetado para Recursos
API Gemini da Vertex AI
  • Implantações escalonadas
  • Empresa
  • Suporte técnico
  • Preços com base na modalidade
  • Proteção por indenização
  • Mais de 100 modelos no Model Garden
API Google AI Gemini
  • Experimentação
  • Prototipagem
  • Facilidade de uso
  • Nível gratuito
  • Preços baseados em token

Migrar da IA do Google para a Vertex AI

Criar usando SDKs da Vertex AI

A Vertex AI oferece SDKs nas seguintes linguagens:

Python

from vertexai.generative_models import GenerativeModel
model = GenerativeModel(model_name="gemini-1.5-flash")
response = model.generate_content([Part.from_uri(IMAGE_URI, mime_type="image/jpeg"),"What is this?"])

Node.js

const vertexAI = new VertexAI({project: projectId, location: location});
const generativeVisionModel = vertexAI.getGenerativeModel({ model: "gemini-1.5-flash"});

const result = await model.generateContent([
  "What is this?",
  {inlineData: {data: imgDataInBase64, mimeType: 'image/png'}}
]);

Java

public static void main(String[] args) throws Exception {
  try (VertexAI vertexAi = new VertexAI(PROJECT_ID, LOCATION); ) {
    GenerativeModel model = new GenerativeModel("gemini-1.5-flash", vertexAI);
  List<Content> contents = new ArrayList<>();
  contents.add(ContentMaker
                .fromMultiModalData(
                    "What is this?",
                    PartMaker.fromMimeTypeAndData("image/jpeg", IMAGE_URI)));
  GenerateContentResponse response = model.generateContent(contents);
  }
}

Go

model := client.GenerativeModel("gemini-1.5-flash", "us-central1")
img := genai.ImageData("jpeg", image_bytes)
prompt := genai.Text("What is this?")
resp, err := model.GenerateContent(ctx, img, prompt)

C#

var predictionServiceClient = new PredictionServiceClientBuilder {
  Endpoint = $"{location}-aiplatform.googleapis.com"
}.Build();

var generateContentRequest = new GenerateContentRequest {
  Model = $"projects/{projectId}/locations/{location}/publishers/google/models/gemini-1.5-flash",
  Contents = {
    new Content {
      Role = "USER",
      Parts = {
        new Part {Text = "What's in this?"},
        new Part {FileData = new() {MimeType = "image/jpeg", FileUri = fileUri}}
      }
    }
  }
};

GenerateContentResponse response = await predictionServiceClient.GenerateContentAsync(generateContentRequest);

Começar

Outras maneiras de começar