Ajuste os MDIs com GPUs usando tarefas do Cloud Run

Pode otimizar um modelo Gemma 3 numa tarefa do Cloud Run e, em seguida, disponibilizar o modelo otimizado num serviço do Cloud Run através do vLLM.

Consulte um codelab com instruções passo a passo em Como otimizar um modelo usando tarefas do Cloud Run.