Esta página foi traduzida pela API Cloud Translation.

Use modelos do Hugging Face

A Hugging Face oferece modelos pré-preparados, scripts de ajuste e APIs de desenvolvimento que facilitam o processo de criação e descoberta de MDIs. O Model Garden pode fornecer modelos de incorporações de texto, texto para imagem, geração de texto e texto de imagem para texto no HuggingFace.

Opções de implementação para modelos do Hugging Face

Pode implementar modelos do Hugging Face suportados no Vertex AI ou no Google Kubernetes Engine (GKE). A opção de implementação que escolher pode depender do modelo que está a usar e do controlo que quer ter sobre as suas cargas de trabalho.

Implemente no Vertex AI

O Vertex AI oferece uma plataforma gerida para criar e dimensionar projetos de aprendizagem automática sem conhecimentos internos de MLOps. Pode usar o Vertex AI como a aplicação a jusante que apresenta os modelos do Hugging Face. Recomendamos que use a Vertex AI se quiser capacidades de MLOps completas, funcionalidades de ML de valor acrescentado e uma experiência sem servidor para um desenvolvimento simplificado.

Para implementar um modelo do Hugging Face suportado no Vertex AI, aceda ao Model Garden.

Aceda ao Model Garden
Aceda à secção Open models on Hugging Face e clique em Mostrar mais.
Encontre e selecione um modelo para implementar.
Opcional: para o Ambiente de implementação, selecione Vertex AI.
Opcional: especifique os detalhes da implementação.
Clique em Implementar.

Para começar, veja os seguintes exemplos:

Alguns modelos têm cartões de modelo detalhados e as definições de implementação são validadas pela Google, como google/gemma-3-27b-it, meta-llama/Llama-4-Scout-17B-16E-Instruct, Qwen/QwQ-32B, BAAI/bge-m3, intfloat/multilingual-e5-large-instruct, black-forest-labs/FLUX.1-dev e HuggingFaceFW/fineweb-edu-classifier.
Alguns modelos têm as definições de implementação validadas pela Google, mas não têm cartões de modelo detalhados, como NousResearch/Genstruct-7B.
Alguns modelos têm definições de implementação geradas automaticamente.
Alguns modelos têm definições de implementação geradas automaticamente com base nos metadados do modelo, como alguns dos modelos de tendências mais recentes em geração de texto, incorporações de texto, geração de texto para imagem e texto de imagem para texto.

Implemente no GKE

O Google Kubernetes Engine (GKE) é a Google Cloud solução para o Kubernetes gerido que oferece escalabilidade, segurança, resiliência e rentabilidade. Recomendamos esta opção se tiver investimentos existentes no Kubernetes, a sua organização tiver conhecimentos internos de MLOps ou se precisar de um controlo detalhado sobre cargas de trabalho de IA/ML complexas com requisitos exclusivos de segurança, pipeline de dados e gestão de recursos.

Para implementar um modelo do Hugging Face suportado no GKE, aceda ao Model Garden.

Aceda ao Model Garden
Aceda à secção Open models on Hugging Face e clique em Mostrar mais.
Encontre e selecione um modelo para implementar.
Para o Ambiente de implementação, selecione GKE.
Siga as instruções de implementação.

Para começar, veja os seguintes exemplos:

Alguns modelos têm cartões de modelo detalhados e definições de implementação validadas, como google/gemma-3-27b-it, meta-llama/Llama-4-Scout-17B-16E-Instruct e Qwen/QwQ-32B.
Alguns modelos têm definições de implementação validadas, mas não têm cartões de modelo detalhados, como o NousResearch/Genstruct-7B.

O que significa "Suportado pelo Vertex AI"?

Adicionamos automaticamente os modelos mais recentes e populares do Hugging Face ao Model Garden. Este processo inclui a geração automática de uma configuração de implementação para cada modelo.

Para resolver preocupações relativas a vulnerabilidades e código malicioso, usamos o analisador de software malicioso do Hugging Face para avaliar a segurança dos ficheiros em cada repositório de modelos do Hugging Face diariamente. Se um repositório de modelos for denunciado como contendo software malicioso, removemos imediatamente o modelo da página da galeria do Hugging Face.

Embora a designação de um modelo como suportado pela Vertex AI signifique que foi testado e é implementável na Vertex AI, não garantimos a ausência de vulnerabilidades ou código malicioso. Recomendamos que faça as suas próprias validações de segurança antes de implementar qualquer modelo no seu ambiente de produção.

Ajuste as configurações de implementação para exemplos de utilização específicos

A configuração de implementação predefinida fornecida com a opção de implementação com um clique não pode satisfazer todos os requisitos, dada a diversidade de exemplos de utilização e as diferentes prioridades com latência, débito, custo e precisão.

Por conseguinte, pode experimentar inicialmente a implementação com um clique para estabelecer uma base e, em seguida, ajustar as configurações de implementação usando o bloco de notas do Colab (vLLM, TGI, TEI, HF pytorch inference) ou o SDK Python. Esta abordagem iterativa permite-lhe personalizar a implementação de acordo com as suas necessidades precisas para obter o melhor desempenho possível para a sua aplicação específica.

O que deve fazer se o modelo que quer não estiver listado no Model Garden

Se estiver à procura de um modelo específico que não esteja listado no Model Garden, significa que o modelo não é suportado pelo Vertex AI. As secções seguintes descrevem o raciocínio e o que pode fazer.

Por que motivo o modelo não é apresentado?

Os seguintes motivos explicam por que motivo um modelo pode não estar no Model Garden:

Não é um modelo de tendências: muitas vezes, damos prioridade a modelos que são amplamente populares e têm um forte interesse da comunidade.
Ainda não é compatível: o modelo pode não funcionar com um contentor de publicação suportado. Por exemplo, o contentor vLLM para os modelos text-generation e image-text-to-text.
Tarefas de pipeline não suportadas: o modelo tem uma tarefa que ainda não suportamos totalmente. Suportamos as seguintes tarefas: text-generation, text2text-generation, text-to-image, feature-extraction, sentence-similarity, e image-text-to-text.

Quais são as suas opções?

Pode continuar a trabalhar com modelos disponíveis no Model Garden:

Implemente-o você mesmo através do bloco de notas do Colab: temos os seguintes blocos de notas do Colab: (vLLM, TGI, TEI, HF pytorch inference), que oferecem a flexibilidade de implementar modelos com configurações personalizadas. Isto dá-lhe controlo total sobre o processo.
Envie um pedido de funcionalidade: trabalhe com o seu engenheiro de apoio técnico e envie um pedido de funcionalidade através do Model Garden ou consulte o apoio técnico da IA generativa do Vertex para obter ajuda adicional.
Não perca as atualizações: adicionamos regularmente novos modelos ao Model Garden. O modelo que procura pode ficar disponível no futuro. Por isso, volte a consultar periodicamente!