Esta página foi traduzida pela API Cloud Translation.

Modelos do Google

Modelos do Gemini em destaque

2.5 Pro

Nosso modelo de raciocínio mais avançado do Gemini, criado para resolver problemas complexos

Ideal para compreensão multimodal
Capaz de processar comandos complexos e fornecer respostas completas
Ideal para programação, principalmente desenvolvimento da Web

2.5 Flash

Nosso melhor modelo em termos de custo-benefício, oferecendo recursos abrangentes

Suporte para a API Live incluído em alguns endpoints
Confira o processo de pensamento do modelo como parte da resposta
Equilíbrio entre preço e desempenho

2.5 Flash-Lite

Nosso modelo mais econômico que oferece suporte a tarefas de alta capacidade

O modelo mais rápido da linha 2.5
Tem uma janela de contexto de 1 milhão de tokens e entrada multimodal, como o 2.5 Flash
Supera o 2.0 Flash na maioria dos comparativos de mercado de avaliação

Modelos do Gemini com disponibilidade geral

diamond Gemini 2.5 Pro Nosso modelo de raciocínio mais avançado até o momento

spark Gemini 2.5 Flash Nosso melhor modelo em termos de custo-benefício, oferecendo recursos abrangentes

performance_auto Gemini 2.5 Flash-Lite Nosso modelo mais econômico que oferece suporte a tarefas de alta taxa de transferência

spark Gemini 2.0 Flash Nosso mais novo modelo multimodal, com recursos de última geração e recursos aprimorados

performance_auto Gemini 2.0 Flash-Lite Um modelo do Gemini 2.0 Flash otimizado para eficiência de custos e baixa latência

Testar os modelos do Gemini

photo_spark Prévia de imagem do Gemini 2.5 Flash Nosso modelo padrão foi atualizado para fluxos de trabalho criativos rápidos com a geração de imagens e recursos de edição conversacional em várias etapas. Google Cloud.

Modelos Gemma

Gemma 3n Os modelos abertos mais recentes, projetados para execução eficiente em dispositivos com poucos recursos, capazes de entrada multimodal, processamento de texto, imagem, vídeo e áudio, além de geração de saídas de texto e treinamento com dados em mais de 140 idiomas falados

Gemma 3 A terceira geração dos nossos modelos abertos, com capacidade de resolver uma grande variedade de tarefas com entrada de texto e imagem, suporte para mais de 140 idiomas e uma longa janela de contexto de 128 mil tokens

Gemma 2 A segunda geração dos nossos modelos abertos com geração, resumo e extração de texto

Gemma Um modelo aberto pequeno e leve que oferece suporte à geração, resumo e extração de texto

ShieldGemma 2 Modelos ajustados por instrução para avaliar a segurança de textos e imagens em relação a um conjunto de políticas de segurança definidas

PaliGemma Nosso modelo aberto de linguagem de visão que combina SigLIP e Gemma

CodeGemma Modelo aberto leve e eficiente que pode realizar várias tarefas de programação, como preenchimento de código no meio, geração de código, compreensão de linguagem natural, raciocínio matemático e seguimento de instruções

TxGemma Gera previsões, classificações ou texto com base em dados terapêuticos relacionados e pode ser usado para criar modelos de IA eficientes para tarefas terapêuticas relacionadas com menos dados e menos computação

MedGemma Coleção de variantes do Gemma 3 treinadas para desempenho na compreensão de texto e imagens médicas

MedSigLIP Variante do SigLIP treinada para codificar imagens e textos médicos em um espaço de embedding comum

T5Gemma Uma família de modelos de pesquisa codificador-decodificador leves, mas poderosos, do Google

Modelos de embeddings

width_normal Embeddings para texto Converte dados de texto em representações vetoriais para pesquisa semântica, classificação, clustering e tarefas semelhantes

width_normal Embeddings multimodais Gera vetores com base em imagens, que podem ser usados para tarefas downstream, como classificação e pesquisa de imagens, entre outras

Modelos do Imagen com disponibilidade geral

photo_spark Imagen 4 para geração Use comandos de texto para gerar imagens novas com mais qualidade do que nossos modelos anteriores de geração de imagens

photo_spark Imagen 4 para geração rápida Use comandos de texto para gerar imagens novas com mais qualidade e menos latência do que nossos modelos anteriores de geração de imagens

photo_spark Imagen 4 para geração Ultra Use comandos de texto para gerar imagens novas com mais qualidade e melhor aderência ao comando do que nossos modelos anteriores de geração de imagens

photo_spark Imagen 3 para geração Use comandos de texto para gerar imagens novas

image_edit_auto Imagen 3 para edição e personalização Use comandos de texto para editar imagens de entrada ou partes de uma imagem com uma máscara ou gerar novas imagens com base no contexto fornecido pelas imagens de referência de entrada

photo_spark Imagen 3 para geração rápida Use comandos de texto para gerar imagens novas com menos latência do que nossos outros modelos de geração de imagens

subtitles Imagen para legendagem e VQA Use comandos de texto para gerar imagens novas, editar as atuais, editar partes de uma imagem com uma máscara e muito mais

Testar modelos do Imagen

photo_spark Provador Virtual Gere imagens de pessoas usando produtos de vestuário.

image_edit_auto Recontextualização de produtos do Imagen na Vertex AI Use comandos de texto para editar imagens de produtos em diferentes cenas ou planos de fundo.

Modelos do Veo

movie Veo 2 Use comandos de texto e imagens para gerar vídeos inéditos

movie Veo 3 Use comandos de texto e imagens para gerar vídeos inéditos com mais qualidade do que nosso modelo anterior de geração de vídeos

movie Veo 3 Fast Use comandos de texto e imagens para gerar vídeos inéditos com mais qualidade e menos latência do que nosso modelo anterior de geração de vídeos

Testar modelos do Veo

movie Prévia do Veo 3 Use comandos de texto e imagens para gerar vídeos inovadores com mais qualidade do que nosso modelo anterior de geração de vídeo

movie Prévia do Veo 3 Fast Use comandos de texto e imagens para gerar vídeos inovadores com mais qualidade e menos latência do que nosso modelo anterior de geração de vídeo

Modelos experimentais do Veo

filme Veo 2 Experimental Um modelo experimental com recursos em teste.

Modelos MedLM

medical_information MedLM-medium Conjunto de modelos ajustados para uso médico em conformidade com a HIPAA, projetado para ajudar profissionais de saúde com tarefas de perguntas e respostas médicas e de resumo para documentos médicos e de saúde

clinical_notes MedLM-large-large Conjunto de modelos ajustados para uso médico em conformidade com a HIPAA, projetado para ajudar profissionais de saúde com tarefas de perguntas e respostas médicas e de resumo para documentos médicos e de saúde

Suporte ao idioma

Gemini

Todos os modelos do Gemini podem entender e responder nos seguintes idiomas:

af, sq, am, ar, hy, as, az, eu, be, bn, bs, bg, ca, ceb, zh, co, hr, cs, da, dv, nl, en, eo, et, fil, fi, fr, fy, gl, ka, de, el, gu, ht, ha, haw, iw, hi, hmn, hu, is, ig, id, ga, it, ja, jv, kn, kk, km, ko, kri, ku, ky, lo, la, lv, lt, lb, mk, mg, ms, ml, mt, mi, mr, mni-Mtei, mn, my, ne, no, ny, or, ps, fa, pl, pt, pa, ro, ru, sm, gd, sr, st, nl, en, eo, et, fil, fi, fr, fy, gl, ka, de, el, gu, ht, ha, haw, hi, hmn, hu, is, ig, id, ga, it, ja, jv, kn, kk, km, ko, kri, ku, ky, lo, la, lv, lt, lb, mk, mg, ms, ml, mt, mi, mr, mni-Mtei, mn, my, ne, no, ny, or, ps, fa, pl, pt, pa, ro, ru, sm, gd, sr, st, sn, sd, si, sk, sl, so, es, su, sw, sv, tg, ta, te, th, tr, uk, ur, ug, uz, vi, cy, xh, yi, yo e zu.

Gemma

O Gemma e o Gemma 2 só oferecem suporte ao inglês (en). O Gemma 3 e o Gemma 3n oferecem suporte a mais de 140 idiomas.

Embeddings

Os modelos de embedding de texto multilíngues são compatíveis com os seguintes idiomas:

af, sq, am, ar, hy, az, eu, be, bn, bg, ca, ceb, zh, co, cs, da, nl, en, eo, et, fil, fi, fr, fy, gl, ka, de, el, gu, ht, ha, haw, iw, hi, hmn, hu, is, ig, id, ga, it, ja, jv, kn, kk, km, ko, ku, ky, lo, la, lv, lt, lb, mk, mg, ms, ml, mt, mi, mr, mn, my, ne, ny, no, ps, fa, pl, pt, pa, be, ru, sm, gd, sr, st, sn, sd, si, sk, sl, so, es, su, sw, sv, tg, ta, te, th, el, uk, ur, uz, vi, cy, xh, yi, yo e is.rotrzu

Imagen 3

O Imagen 3 está disponível nos seguintes idiomas:

inglês (en), chinês (simplificado e tradicional) (zh), hindi (hi), japonês (ja), coreano (ko), português (pt) e espanhol (es).

MedLM

O modelo MedLM oferece suporte ao idioma inglês (en).

Explorar todos os modelos no Model Garden

O Model Garden é uma plataforma que ajuda a descobrir, testar, personalizar e implantar a propriedade do Google e selecionar modelos e recursos de OSS. Para conferir os modelos de IA generativa e as APIs disponíveis na Vertex AI, acesse o Model Garden no console Google Cloud .

Acessar o Model Garden

Para saber mais sobre o Model Garden, incluindo modelos e recursos disponíveis, consulte Explorar modelos de IA no Model Garden.

Versões do modelo

Para conferir todas as versões de modelo, incluindo modelos legados e desativados, consulte Versões e ciclo de vida do modelo.

A seguir

Confira um tutorial de início rápido usando o Vertex AI Studio ou a API Vertex AI.
Confira modelos pré-treinados no Model Garden.
Saiba como controlar o acesso a modelos específicos no Model Garden usando uma política de organização do Model Garden.
Saiba mais sobre Preços.