O Model Garden é uma biblioteca de modelos de IA/ML que ajuda a descobrir, testar, personalizar e implementar modelos e recursos da Google e de parceiros da Google.
Vantagens do Model Garden
Quando trabalha com modelos de IA, o Model Garden oferece as seguintes vantagens:
- Os modelos disponíveis estão todos agrupados numa única localização
- O Model Garden oferece um padrão de implementação consistente para diferentes tipos de modelos
- O Model Garden oferece integração incorporada com outras partes do Vertex AI, como o aperfeiçoamento, a avaliação e a publicação de modelos
- A apresentação de modelos de IA generativa pode ser difícil. O Vertex AI processa a implementação e a apresentação de modelos por si
Explore modelos
Para ver a lista de modelos de base disponíveis da Vertex AI e de código aberto, ajustáveis e específicos de tarefas, aceda à página Model Garden naGoogle Cloud consola.
As categorias de modelos disponíveis no Model Garden são:
Categoria | Descrição |
---|---|
Modelos de base | Grandes modelos pré-preparados multitarefa que podem ser otimizados ou personalizados para tarefas específicas através do Vertex AI Studio, da Vertex AI API e do Vertex AI SDK para Python. |
Modelos ajustáveis | Modelos que pode otimizar com um bloco de notas personalizado ou um pipeline. |
Soluções específicas para tarefas | A maioria destes modelos pré-criados está pronta a ser usada. Muitos podem ser personalizados com os seus próprios dados. |
Para filtrar modelos no painel de filtros, especifique o seguinte:
- Tarefas: clique na tarefa que quer que o modelo execute.
- Coleções de modelos: clique para escolher modelos geridos pela Google, por parceiros ou por si.
- Fornecedores: clique no fornecedor do modelo.
- Funcionalidades: clique nas funcionalidades que quer no modelo.
Para saber mais sobre cada modelo, clique no respetivo cartão de modelo.
Para ver uma lista de modelos disponíveis no Model Garden, consulte o artigo Modelos disponíveis no Model Garden.
Análise de segurança do modelo
A Google realiza testes e testes de referência exaustivos nos contentores de publicação e otimização que fornecemos. A análise de vulnerabilidades ativa também é aplicada a artefactos de contentores.
Os modelos de terceiros de parceiros em destaque são submetidos a análises de pontos de verificação de modelos para garantir a autenticidade. Os modelos de terceiros do HuggingFace Hub são verificados diretamente pelo HuggingFace e pelo respetivo scanner de terceiros quanto à existência de software malicioso, ficheiros pickle, camadas Keras Lambda e segredos. Os modelos considerados inseguros a partir destas análises são sinalizados pela HuggingFace e o respetivo implemento é bloqueado no Model Garden. Os modelos considerados suspeitos ou que têm a capacidade de executar potencialmente código remoto são indicados no Model Garden, mas podem continuar a ser implementados. Recomendamos que faça uma revisão detalhada de qualquer modelo suspeito antes de o implementar no Model Garden.
Preços
Para os modelos de código aberto no Model Garden, é-lhe cobrado o uso do seguinte no Vertex AI:
- Ajuste do modelo: são-lhe cobrados os recursos de computação usados à mesma taxa que a preparação personalizada. Consulte os preços da formação personalizada.
- Implementação do modelo: são-lhe cobrados os recursos de computação usados para implementar o modelo num ponto final. Consulte os preços das previsões.
- Colab Enterprise: consulte os preços do Colab Enterprise.
Controle o acesso a modelos específicos
Pode definir uma política da organização do Model Garden ao nível da organização, da pasta ou do projeto para controlar o acesso a modelos específicos no Model Garden. Por exemplo, pode permitir o acesso a modelos específicos que validou e negar o acesso a todos os outros.
Saiba mais sobre o Model Garden
Para mais informações sobre as opções de implementação e as personalizações que pode fazer com os modelos no Model Garden, consulte os recursos nas secções seguintes, que incluem links para tutoriais, referências, blocos de notas e vídeos do YouTube.
Implemente e publique
Saiba mais sobre a personalização de implementações e funcionalidades de publicação avançadas.
- Implemente e publique um modelo de código aberto através do SDK Python, da CLI, da API REST ou da consola
- Implementar e otimizar o Gemma 3 no vídeo do YouTube do Model Garden
- Implementar o Gemma e fazer previsões
- Publique modelos abertos com um contentor Hex-LLM em TPUs da Cloud
- Implementar modelos Llama através do notebook do tutorial Hex-LLM
- Use o armazenamento em cache de prefixos e a descodificação especulativa com o notebook do tutorial Hex-LLM ou vLLM
- Use o vLLM para publicar modelos de linguagem apenas de texto e multimodelos em GPUs do Google Cloud
- Use o contentor de publicação de GPU xDiT para a geração de imagens e vídeos
- Publicação de Gemma 2 com vários adaptadores LoRA com o DLC HuggingFace para o tutorial de inferência do PyTorch no Medium
- Use identificadores personalizados para publicar o PaliGemma para legendagem de imagens com o DLC HuggingFace para o tutorial de inferência do PyTorch no LinkedIn
- Implemente e publique um modelo que use VMs do Spot ou um bloco de notas do tutorial de reserva do Compute Engine
- Implemente e publique um modelo do HuggingFace
Conformidade do contentor
O Model Garden oferece os seguintes contentores em conformidade com o FedRAMP High para a publicação de modelos.
Afinação
Saiba como otimizar modelos para personalizar respostas para exemplos de utilização específicos.
- Notebook do tutorial de ajuste preciso do Workbench
- Notebook do tutorial de ajuste preciso e avaliação
- Implementar e otimizar o Gemma 3 no vídeo do YouTube do Model Garden
Avaliação
Saiba mais sobre a avaliação das respostas do modelo com o Vertex AI
Recursos adicionais
- Modelos e blocos de notas do Model Garden específicos do percurso do utilizador
- Notebooks de apresentação, ajuste e avaliação de modelos abertos do Vertex AI