Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
O dispositivo isolado da Vertex AI no Google Distributed Cloud (GDC) traz o poder de uma plataforma de machine learning (ML) e inteligência artificial (IA) para seu dispositivo portátil seguro. O dispositivo isolado do GDC oferece acesso a um conjunto selecionado de APIs pré-treinadas da Vertex AI, permitindo recursos de IA na sua solução de nuvem privada.
Principais recursos
A Vertex AI no dispositivo isolado do GDC oferece os seguintes recursos:
Implantação isolada: execute os serviços da Vertex AI totalmente no seu dispositivo portátil, garantindo a soberania e a conformidade dos dados.
Experiência familiar da Vertex AI: aproveite as mesmas ferramentas e APIs do Google Cloud, simplificando o desenvolvimento e o gerenciamento.
Modelos e algoritmos pré-criados: acesse uma variedade de modelos pré-treinados para tarefas comuns de machine learning, acelerando seu tempo de retorno.
Serviços disponíveis
A Vertex AI no dispositivo isolado do GDC oferece os seguintes serviços pré-treinados:
Planejamento de capacidade e requisitos de computação
Cada serviço da Vertex AI exige recursos de computação diferentes. A tabela a seguir mostra os requisitos de cada modelo pré-treinado:
API pré-treinada
Recursos de computação
Requisitos de contagem de GPU
Requisitos de memória da GPU
Reconhecimento ótico de caracteres (OCR)
GPU
Uma única GPU A100 de 80 GB
40 GB
Speech-to-Text
CPU
Não aplicável (somente CPU)
Não aplicável (somente CPU)
Vertex AI Translation
GPU
Uma única GPU A100 de 80 GB
50 GB
O dispositivo isolado do GDC inclui uma única GPU NVIDIA A100 de 80 GB. Isso limita o dispositivo a executar apenas uma API pré-treinada da Vertex AI dependente de GPU por vez. Se você tentar ativar a Vertex AI Translation
e o OCR, a segunda API não será ativada e vai mostrar uma mensagem
de erro indicando recursos de GPU insuficientes. No entanto, é possível executar
Speech-to-Text com a tradução da Vertex AI ou o OCR,
já que o Speech-to-Text só exige recursos de CPU.
Para ajudar você a determinar o número de unidades de appliance necessárias para suas cargas de trabalho de IA/ML, consulte os seguintes limites de capacidade para cada API pré-treinada da Vertex AI:
API pré-treinada
Capacidade por unidade do appliance
Reconhecimento ótico de caracteres (OCR)
Até 30 imagens por minuto (uma imagem a cada dois segundos).
Speech-to-Text
Até sete minutos de áudio transcritos por minuto (sete segundos de áudio transcritos por segundo).
Vertex AI Translation
Até 61.000 caracteres por minuto (1.024 caracteres por segundo).
Ao planejar a implantação, considere as seguintes orientações:
Os limites de capacidade são aproximados e não garantidos. A capacidade real pode variar dependendo de fatores como:
Complexidade dos dados de entrada (por exemplo, idioma para tradução, qualidade da imagem para OCR e clareza do áudio para Speech-to-Text).
Configuração específica do appliance.
Uso simultâneo de outros serviços no dispositivo.
Apenas uma API que exige muito da GPU (Vertex AI Translation ou OCR) pode estar ativa por vez, porque o appliance isolado do GDC é limitado a uma única GPU A100 de 80 GB.
Estime seu uso máximo e o possível crescimento futuro.
Para cargas de trabalho exigentes que precisam de maior capacidade de processamento, considere implantar várias unidades do appliance.
A tabela a seguir descreve os requisitos de armazenamento para cada serviço da Vertex AI no dispositivo isolado do GDC:
Componente
Requisitos de armazenamento
Front-end de OCR
0,1 GB
Back-end de OCR
5 GB
Extrator de OCR
0,1 GB
Front-end do Speech-to-Text
0,1 GB
Back-end da Speech-to-Text
1,5 GB
Front-end da Vertex AI Translation
0,7 GB
Back-end da Vertex AI Translation
61,4 GB
Verifique se o dispositivo tem capacidade de armazenamento suficiente para acomodar os
serviços da Vertex AI que você pretende usar.
Vantagens
O appliance isolado da Vertex AI no GDC oferece os seguintes benefícios:
Experiência de desenvolvimento perfeita: use as mesmas ferramentas, APIs e fluxos de trabalho
da Vertex AI no Google Cloud, tornando o desenvolvimento e o gerenciamento
intuitivos e eficientes.
Segurança e privacidade aprimoradas: mantenha o controle total dos seus dados
e cumpra os requisitos regulamentares.
Tempo de valorização acelerado: use modelos pré-treinados para tarefas comuns de machine learning.
MLOps simplificadas: aproveite recursos robustos de operação de machine learning para integrações de IA perfeitas no seu ambiente isolado.
Primeiros passos
Para começar a usar a Vertex AI no dispositivo isolado do GDC, faça o seguinte:
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-09-04 UTC."],[],[],null,["# Vertex AI overview\n\nVertex AI on Google Distributed Cloud (GDC) air-gapped appliance brings the power of a\nmachine learning (ML) and artificial intelligence (AI) platform to your secure\nportable device. GDC air-gapped appliance provides access to a select set of\npre-trained Vertex AI APIs, enabling AI capabilities in your private\ncloud solution.\n\nKey features\n------------\n\nVertex AI on GDC air-gapped appliance offers you the following features:\n\n- **Air-gapped deployment**: Run Vertex AI services entirely within your portable device, ensuring data sovereignty and compliance.\n- **Familiar Vertex AI experience**: Take advantage of the same tools and APIs from Google Cloud, simplifying development and management.\n- **Pre-built models and algorithms**: Access a range of pre-trained models for common machine learning tasks, accelerating your time to value.\n\nAvailable services\n------------------\n\nVertex AI on GDC air-gapped appliance offers the following pre-trained\nservices:\n\n- [**Optical Character Recognition (OCR)**](/distributed-cloud/hosted/docs/latest/appliance/application/ao-user/vertex-ai-ocr): Extract text from images and files.\n- [**Speech-to-Text**](/distributed-cloud/hosted/docs/latest/appliance/application/ao-user/vertex-ai-stt): Convert spoken language into written text.\n- [**Vertex AI Translation**](/distributed-cloud/hosted/docs/latest/appliance/application/ao-user/vertex-ai-translation): Translate text between multiple languages.\n\n| **Caution:** GDC air-gapped appliance includes a single NVIDIA A100 80 GB GPU. This limits the device to running only *one* GPU-dependent Vertex AI pre-trained API at a time. For more information, see [Capacity planning and computing requirements](#capacity).\n\nCapacity planning and computing requirements\n--------------------------------------------\n\nEach Vertex AI service requires different computing resources. The\nfollowing table provides the requirements for each pre-trained model:\n\nGDC air-gapped appliance includes a single NVIDIA A100 80 GB GPU. This\nlimits the device to running only *one* GPU-dependent Vertex AI\npre-trained API at a time. If you attempt to enable both Vertex AI Translation\nand OCR, the second API will fail to enable with an error\nmessage indicating insufficient GPU resources. You can, however, run\nSpeech-to-Text alongside either Vertex AI Translation or OCR,\nas Speech-to-Text only requires CPU resources.\n\nTo help you determine the number of appliance units needed for your AI/ML\nworkloads, review the following capacity limits for each Vertex AI\npre-trained API:\n\nWhen you plan your deployment, consider the following guidance:\n\n- The capacity limits are approximate and not guaranteed. Actual capacity might\n vary depending on factors such as the following:\n\n - Complexity of the input data (for example, language for translation, image quality for OCR, and audio clarity for Speech-to-Text).\n - Specific configuration of the appliance.\n - Concurrent usage of other services on the appliance.\n- Only one GPU-intensive API (Vertex AI Translation or OCR) can\n be active at a time because GDC air-gapped appliance is limited to a single\n A100 80 GB GPU.\n\n- Estimate your peak usage and potential future growth.\n\n- For demanding workloads requiring higher throughput, consider deploying\n multiple appliance units.\n\nThe following table outlines the storage requirements for each\nVertex AI service on GDC air-gapped appliance:\n\nEnsure that your appliance has sufficient storage capacity to accommodate the\nVertex AI services you intend to use.\n\nBenefits\n--------\n\nVertex AI on GDC air-gapped appliance offers the following benefits:\n\n- **Seamless development experience**: Use the same tools, APIs, and workflows of Vertex AI on Google Cloud, making development and management intuitive and efficient.\n- **Enhanced security and privacy**: Maintain complete control over your data and comply with regulatory requirements.\n- **Accelerated time to value**: Use pre-trained models for common machine learning tasks.\n- **Streamlined MLOps**: Benefit from robust machine learning operation capabilities for seamless AI integrations within your air-gapped environment.\n\nGetting started\n---------------\n\nTo get started with Vertex AI on GDC air-gapped appliance, do the\nfollowing:\n\n- [Learn about essential roles and permissions for available services](/distributed-cloud/hosted/docs/latest/appliance/application/ao-user/vertex-ai-ao-permissions).\n- [Set up a project for your AI and machine learning workloads](/distributed-cloud/hosted/docs/latest/appliance/application/ao-user/vertex-ai-set-up-project).\n- [Provision GPUs and enable the Vertex AI services](/distributed-cloud/hosted/docs/latest/appliance/application/ao-user/vertex-ai-enable-pre-trained-apis).\n- [Install the Vertex AI client libraries](/distributed-cloud/hosted/docs/latest/appliance/application/ao-user/vertex-ai-install-libraries)."]]