Google Distributed Cloud (GDC) 오프라인 어플라이언스의 Vertex AI는 머신러닝 (ML) 및 인공지능 (AI) 플랫폼의 기능을 안전한 휴대용 기기에 제공합니다. GDC 에어갭 어플라이언스는 사전 학습된 Vertex AI API의 일부에 대한 액세스를 제공하여 비공개 클라우드 솔루션에서 AI 기능을 지원합니다.
주요 특징
GDC 에어갭 어플라이언스의 Vertex AI는 다음과 같은 기능을 제공합니다.
오프라인 배포: 휴대용 기기 내에서 Vertex AI 서비스를 완전히 실행하여 데이터 주권 및 규정 준수를 보장합니다.
익숙한 Vertex AI 환경: Google Cloud의 동일한 도구와 API를 활용하여 개발과 관리를 간소화합니다.
사전 빌드된 모델 및 알고리즘: 일반적인 머신러닝 작업을 위한 다양한 선행 학습된 모델에 액세스하여 가치 창출 시간을 단축합니다.
사용 가능한 서비스
GDC 에어갭 어플라이언스의 Vertex AI는 다음과 같은 사전 학습된 서비스를 제공합니다.
각 Vertex AI 서비스에는 서로 다른 컴퓨팅 리소스가 필요합니다. 다음 표에는 각 사전 학습된 모델의 요구사항이 나와 있습니다.
사전 학습된 API
컴퓨팅 리소스
GPU 수 요구사항
GPU 메모리 요구사항
광학 문자 인식(OCR)
GPU
A100 80GB GPU 1개
40 GB
Speech-to-Text
CPU
해당 없음 (CPU만)
해당 없음 (CPU만)
Vertex AI Translation
GPU
A100 80GB GPU 1개
50GB
GDC 에어갭 어플라이언스에는 단일 NVIDIA A100 80GB GPU가 포함됩니다. 이로 인해 기기는 한 번에 GPU 종속 Vertex AI 사전 학습 API를 하나만 실행할 수 있습니다. Vertex AI Translation과 OCR을 모두 사용 설정하려고 하면 GPU 리소스가 부족하다는 오류 메시지와 함께 두 번째 API가 사용 설정되지 않습니다. 하지만 Speech-to-Text는 CPU 리소스만 필요하므로 Vertex AI Translation 또는 OCR과 함께 실행할 수 있습니다.
AI/ML 워크로드에 필요한 어플라이언스 단위 수를 결정하려면 각 Vertex AI 사전 학습된 API의 다음 용량 제한을 검토하세요.
사전 학습된 API
어플라이언스 단위당 용량
광학 문자 인식(OCR)
분당 최대 30장 (2초마다 1장)
Speech-to-Text
분당 최대 7분의 오디오가 텍스트로 변환됩니다 (초당 7초의 오디오가 텍스트로 변환됨).
Vertex AI Translation
분당 최대 61,000자 (초당 1,024자)
배포를 계획할 때는 다음 안내를 고려하세요.
용량 한도는 대략적인 수치이며 보장되지 않습니다. 실제 용량은 다음과 같은 요인에 따라 달라질 수 있습니다.
입력 데이터의 복잡성 (예: 번역을 위한 언어, OCR을 위한 이미지 품질, Speech-to-Text를 위한 오디오 선명도)
어플라이언스의 특정 구성입니다.
어플라이언스에서 다른 서비스의 동시 사용
GDC 에어갭 어플라이언스는 단일 A100 80GB GPU로 제한되므로 GPU 집약적인 API (Vertex AI Translation 또는 OCR)는 한 번에 하나만 활성화할 수 있습니다.
최대 사용량과 향후 성장 가능성을 추정합니다.
처리량이 더 높은 것이 필요한 까다로운 워크로드의 경우 어플라이언스 단위를 여러 개 배포하는 것이 좋습니다.
다음 표에는 GDC 에어갭 어플라이언스에서 각 Vertex AI 서비스의 스토리지 요구사항이 나와 있습니다.
구성요소
스토리지 요구사항
OCR 프런트엔드
0.1 GB
OCR 백엔드
5GB
OCR 추출기
0.1 GB
Speech-to-Text 프런트엔드
0.1 GB
Speech-to-Text 백엔드
1.5GB
Vertex AI Translation 프런트엔드
0.7 GB
Vertex AI Translation 백엔드
61.4 GB
어플라이언스에 사용하려는 Vertex AI 서비스를 수용할 수 있는 충분한 스토리지 용량이 있는지 확인합니다.
이점
GDC 에어갭 어플라이언스의 Vertex AI는 다음과 같은 이점을 제공합니다.
원활한 개발 환경: Google Cloud에서 Vertex AI의 동일한 도구, API, 워크플로를 사용하여 개발 및 관리를 직관적이고 효율적으로 진행할 수 있습니다.
보안 및 개인 정보 보호 강화: 데이터를 완전히 제어하고 규제 요구사항을 준수합니다.
가치 창출 시간 단축: 일반적인 머신러닝 작업에 선행 학습된 모델을 사용합니다.
간소화된 MLOps: 에어갭 환경 내에서 원활한 AI 통합을 위해 강력한 머신러닝 작업 기능을 활용하세요.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-09-04(UTC)"],[],[],null,["# Vertex AI overview\n\nVertex AI on Google Distributed Cloud (GDC) air-gapped appliance brings the power of a\nmachine learning (ML) and artificial intelligence (AI) platform to your secure\nportable device. GDC air-gapped appliance provides access to a select set of\npre-trained Vertex AI APIs, enabling AI capabilities in your private\ncloud solution.\n\nKey features\n------------\n\nVertex AI on GDC air-gapped appliance offers you the following features:\n\n- **Air-gapped deployment**: Run Vertex AI services entirely within your portable device, ensuring data sovereignty and compliance.\n- **Familiar Vertex AI experience**: Take advantage of the same tools and APIs from Google Cloud, simplifying development and management.\n- **Pre-built models and algorithms**: Access a range of pre-trained models for common machine learning tasks, accelerating your time to value.\n\nAvailable services\n------------------\n\nVertex AI on GDC air-gapped appliance offers the following pre-trained\nservices:\n\n- [**Optical Character Recognition (OCR)**](/distributed-cloud/hosted/docs/latest/appliance/application/ao-user/vertex-ai-ocr): Extract text from images and files.\n- [**Speech-to-Text**](/distributed-cloud/hosted/docs/latest/appliance/application/ao-user/vertex-ai-stt): Convert spoken language into written text.\n- [**Vertex AI Translation**](/distributed-cloud/hosted/docs/latest/appliance/application/ao-user/vertex-ai-translation): Translate text between multiple languages.\n\n| **Caution:** GDC air-gapped appliance includes a single NVIDIA A100 80 GB GPU. This limits the device to running only *one* GPU-dependent Vertex AI pre-trained API at a time. For more information, see [Capacity planning and computing requirements](#capacity).\n\nCapacity planning and computing requirements\n--------------------------------------------\n\nEach Vertex AI service requires different computing resources. The\nfollowing table provides the requirements for each pre-trained model:\n\nGDC air-gapped appliance includes a single NVIDIA A100 80 GB GPU. This\nlimits the device to running only *one* GPU-dependent Vertex AI\npre-trained API at a time. If you attempt to enable both Vertex AI Translation\nand OCR, the second API will fail to enable with an error\nmessage indicating insufficient GPU resources. You can, however, run\nSpeech-to-Text alongside either Vertex AI Translation or OCR,\nas Speech-to-Text only requires CPU resources.\n\nTo help you determine the number of appliance units needed for your AI/ML\nworkloads, review the following capacity limits for each Vertex AI\npre-trained API:\n\nWhen you plan your deployment, consider the following guidance:\n\n- The capacity limits are approximate and not guaranteed. Actual capacity might\n vary depending on factors such as the following:\n\n - Complexity of the input data (for example, language for translation, image quality for OCR, and audio clarity for Speech-to-Text).\n - Specific configuration of the appliance.\n - Concurrent usage of other services on the appliance.\n- Only one GPU-intensive API (Vertex AI Translation or OCR) can\n be active at a time because GDC air-gapped appliance is limited to a single\n A100 80 GB GPU.\n\n- Estimate your peak usage and potential future growth.\n\n- For demanding workloads requiring higher throughput, consider deploying\n multiple appliance units.\n\nThe following table outlines the storage requirements for each\nVertex AI service on GDC air-gapped appliance:\n\nEnsure that your appliance has sufficient storage capacity to accommodate the\nVertex AI services you intend to use.\n\nBenefits\n--------\n\nVertex AI on GDC air-gapped appliance offers the following benefits:\n\n- **Seamless development experience**: Use the same tools, APIs, and workflows of Vertex AI on Google Cloud, making development and management intuitive and efficient.\n- **Enhanced security and privacy**: Maintain complete control over your data and comply with regulatory requirements.\n- **Accelerated time to value**: Use pre-trained models for common machine learning tasks.\n- **Streamlined MLOps**: Benefit from robust machine learning operation capabilities for seamless AI integrations within your air-gapped environment.\n\nGetting started\n---------------\n\nTo get started with Vertex AI on GDC air-gapped appliance, do the\nfollowing:\n\n- [Learn about essential roles and permissions for available services](/distributed-cloud/hosted/docs/latest/appliance/application/ao-user/vertex-ai-ao-permissions).\n- [Set up a project for your AI and machine learning workloads](/distributed-cloud/hosted/docs/latest/appliance/application/ao-user/vertex-ai-set-up-project).\n- [Provision GPUs and enable the Vertex AI services](/distributed-cloud/hosted/docs/latest/appliance/application/ao-user/vertex-ai-enable-pre-trained-apis).\n- [Install the Vertex AI client libraries](/distributed-cloud/hosted/docs/latest/appliance/application/ao-user/vertex-ai-install-libraries)."]]