Nesta página, você encontra uma visão geral dos modelos do Gemini no Google Distributed Cloud (GDC) isolado por air-gap. Esses modelos de linguagem grandes (LLMs) projetados pelo Google estão disponíveis para uso nas organizações do Distributed Cloud. Eles oferecem recursos avançados de processamento de texto e arquivos de mídia, respeitando os requisitos rigorosos de segurança e isolamento das implantações isoladas. Devido à natureza isolada desses ambientes, alguns recursos do Gemini que dependem da conectividade de rede externa não estão disponíveis ou exigem uma configuração específica. Consulte a documentação do produto para mais detalhes sobre as configurações e limitações do Distributed Cloud.
Modelos
O GDC oferece modelos do Gemini para processamento de linguagem natural e criação de conteúdo em ambientes isolados. O Gemini faz parte de uma família maior de modelos de IA generativa disponíveis como parte das soluções da Vertex AI na Distributed Cloud por APIs que podem ser ativadas na sua organização. Para mais informações sobre os recursos e as funcionalidades da IA generativa no GDC, consulte a Visão geral da IA generativa.
Para ver uma lista dos modelos do Gemini compatíveis e suas especificações no GDC, consulte modelos do Gemini disponíveis.
Recursos
O Gemini Flash é otimizado para velocidade e eficiência, o que o torna ideal para tarefas de processamento de texto de alto volume e baixa latência. Por outro lado, o Gemini Pro oferece recursos aprimorados para tarefas mais complexas de processamento de dados.
A tabela a seguir oferece uma visão geral dos recursos do Gemini disponíveis no GDC.
| Recurso | Descrição | Gemini Flash | Gemini Pro |
|---|---|---|---|
| Inferência otimizada | Projetado para processamento rápido em hardware com recursos restritos em ambientes isolados. | Sim | |
| Integração com serviços do GDC | Integração perfeita com outros serviços para armazenamento, processamento e gerenciamento de dados. | Sim | Sim |
| Implantação segura | Operar totalmente no ambiente isolado, garantindo a segurança e a conformidade dos dados. | Sim | Sim |
| Capacidades de raciocínio avançadas | Lidar com tarefas complexas de linguagem que exigem compreensão e raciocínio profundos. | Sim | |
| Ampla janela de contexto | Processar segmentos de texto longos para compreensão contextual. | Sim | Sim |
Casos de uso
Os modelos do Gemini no GDC são compatíveis com os mesmos casos de uso, mas o Pro é maior e geralmente mais preparado para dar respostas melhores. Portanto, use o Gemini Pro para ter insights melhores dos dados em comparação com o Gemini Flash. No entanto, se você quiser priorizar a velocidade e a eficiência mantendo respostas de boa qualidade, use o Gemini Flash.
A tabela a seguir oferece uma visão geral dos casos de uso dos modelos do Gemini disponíveis no GDC.
| Modelos do Gemini no GDC | |
|---|---|
| Caso de uso | Descrição |
| Classificação de texto | Categorize textos em categorias predefinidas para tarefas como detecção de spam, análise de sentimento ou identificação de tópicos. Treinar e implantar modelos personalizados em ambientes isolados. |
| Extração de informações | Identifique e extraia informações importantes, como entidades, datas e locais, para mineração de dados, construção de grafos de conhecimento e entrada de dados automatizada. |
| Resumo | Gerar resumos concisos de textos mais longos para facilitar a compreensão. Útil para análise de inteligência e geração de relatórios. |
| Respostas a perguntas | Responda a perguntas com base no contexto fornecido. Consultar repositórios de documentos locais e bases de conhecimento em implantações isoladas. |
| Geração de texto | Gerar textos com qualidade humana, como artigos, histórias e códigos. Use esse recurso para criar conteúdo, escrever relatórios e gerar código. |
| Tradução | Traduza texto entre vários idiomas. Embora a Vertex AI Translation esteja disponível no GDC, o Gemini também processa tarefas de linguagem natural, como tradução. |
| Compreensão multimodal | Analisar arquivos, incluindo imagens, vídeos, áudios e documentos, gerando texto ou respostas com base nesses dados. Use esse recurso para gerar insights e organizar informações de fontes de dados em ambientes isolados. |
| Raciocínio e planejamento | Enfrente tarefas complexas de raciocínio, como resolver quebra-cabeças lógicos e gerar planos. Use esse recurso para resolver problemas e embasar decisões. |
Considerações de uso
Ao usar modelos do Gemini no GDC, considere os seguintes aspectos para suas implantações e uso da API:
- Disponibilidade de recursos: ambientes isolados têm recursos limitados. Planeje e aloque recursos com cuidado para implantações bem-sucedidas.
- Gerenciamento de dados: mecanismos seguros de armazenamento de dados e controle de acesso são cruciais. Gerenciar dados para treinamento e inferência no ambiente isolado.
- Atualizações de modelo: atualizar modelos em um ambiente isolado requer um processo específico. Consulte o guia de implantação para mais detalhes.
- Restrições de conectividade: os recursos que exigem conectividade de rede externa não estão disponíveis ou exigem uma configuração específica no ambiente isolado.