Google Distributed Cloud Connected API에서 Gemini를 주문하려면 이 문서에 설명된 설치 요구사항을 충족해야 합니다. 자세한 내용은 지원 받기를 참고하세요.
인증된 하드웨어
GDC 연결 API에서 Gemini를 주문하기 전에 이 섹션에 설명된 정확한 구성과 일치하는 인증된 하드웨어를 조달해야 합니다. 이 구성은 단일 Google 인증 기기용입니다.
항목 | Dell SKU | 수량 |
---|---|---|
PowerEdge XE9680, DSS 제한됨 | 210-BHYV | 1 |
2.5 섀시 | 379-BDTF | 1 |
신뢰 플랫폼 모듈 2.0 V3 | 461-AAIG | 1 |
GPU 8개, 2.5 NVMe만 8개인 XE9680 6U 섀시 | 321-BIEK | 1 |
Intel Xeon Platinum 8592+ 1.9G, 64C/128T, 20GT/s, 320M Cache, Turbo, HT (350W) DDR5-5600 | 338-CPBP | 1 |
Intel Xeon Platinum 8592+ 1.9G, 64C/128T, 20GT/s, 320M Cache, Turbo, HT (350W) DDR5-5600 | 338-CPBP | 1 |
추가 프로세서 선택됨 | 379-BDCO | 1 |
라이저 구성 2 | 330-BCHH | 1 |
2 CPU 구성용 히트싱크 | 412-BBCN | 1 |
성능 최적화 | 370-AAIP | 1 |
5600MT/s RDIMM | 370-BBRX | 1 |
C30, NVME 섀시의 RAID 없음 | 780-BCDO | 1 |
컨트롤러 없음 | 405-AACD | 1 |
성능 BIOS 설정 | 384-BBBL | 1 |
GPT 파티션이 있는 UEFI BIOS 부팅 모드 | 800-BBDM | 1 |
매우 고성능 팬 x6 | 750-ADGJ | 1 |
3+3 FTR (GPU 전원 브레이크 사용 설정), 핫플러그 PSU, 2800W MM HLAC (200~240Vac) 티타늄, C22 커넥터 | 450-AMMN | 1 |
XE9680 시스템 마더보드, MX, MLK | 338-CPWL | 1 |
PowerEdge 2U LCD 베젤 | 325-BETK | 1 |
NVIDIA HGX H200 8-GPU SXM 141GB 700W GPU 어셈블리 | 490-BKHF | 1 |
BOSS-N1 컨트롤러 카드 + 2개의 FIPS M.2 960GB (RAID 1) | 403-BCVH | 1 |
XE9680 BOSS 케이블 | 470-AFNO | 1 |
OCP 3.0 메자닌 NIC 카드가 없음 | 412-AASK | 1 |
운영체제 없음, 유틸리티 파티션 없음 | 611-BBBG | 1 |
iDRAC9, Datacenter 16G | 528-CTID | 1 |
iDRAC Secure Enterprise Key Manager License 2.0 | 634-BZIL | 1 |
보안 구성요소 확인 | 528-COYT | 1 |
iDRAC,공장에서 생성된 비밀번호 | 379-BCSF | 1 |
iDRAC 서비스 모듈 (ISM)이 설치되지 않음 | 379-BCQX | 1 |
iDRAC 그룹 관리자, 사용 중지됨 | 379-BCQY | 1 |
XE9680 랙 레일 케이블 관리 암 | 770-BEPB | 1 |
XE9680 슬라이딩 지원 레일 (B28) | 770-BEPC | 1 |
PowerEdge XE9680, 배송 | 340-DDBX | 1 |
PowerEdge XE9680 CE 마킹, CCC 마킹 없음 | 389-EFKE | 1 |
XE9680 배송 재료 | 343-BBXC | 1 |
엔터프라이즈 프로그램 관리 지원 | 973-3700 | 1 |
Basic Next Business Day 36 Months | 709-BFTF | 1 |
제한됨:ProSupport One 데이터 센터 및 익일 현장 서비스 볼륨 낮음 Ext, 24개월 | 199-BTKS | 1 |
제한됨:ProSupport One 데이터 센터 및 익일 현장 서비스 볼륨 낮음 초기화, 36개월 | 199-BTKT | 1 |
Keep Your Hard Drive For Enterprise, 60 Month(s)(엔터프라이즈용 하드 드라이브 유지, 60개월) | 711-BCXN | 1 |
ProDeploy Plus PowerEdge XE 시리즈 5U6U | 683-BDSB | 1 |
인프라 배포 선택됨 | 701-6538 | 1 |
128GB RDIMM, 5600MT/s, 쿼드 랭크 | 370-BBQY | 16 |
800G 데이터 센터 NVMe 혼합 사용 AG 드라이브 U2 Gen4(캐리어 포함) | 400-BRPJ | 1 |
C20-C21, PDU 스타일, 16AMP, 8피트, 전원 코드 | 450-AGXK | 6 |
Broadcom 5720 Dual Port 1GbE LOM | 540-BDKD | 1 |
Mellanox ConnectX-6 DX 듀얼 포트 100GbE QSFP56 네트워크 어댑터, 전체 높이 | 540-BCXO | 2 |
크기 및 무게
Google 인증 머신은 높이가 6U이며 다음과 같은 크기입니다.
- 높이: 263.2mm (10.36인치)
- 너비: 482.0mm (18.97인치)
- 깊이: 전면 베젤 포함 1008.77mm (39.71인치)
Google 인증 머신의 무게는 각각 113.3kg입니다.
전원 및 냉각
각 Google 인증 기기에는 다음과 같은 전기 사양이 있습니다.
- 전압: 100~240V AC, 50/60Hz
- 전원: 최대 11,000W
시설에는 GDC 연결 API에 Gemini를 배포할 때마다 Google 인증 머신 1대를 지원할 수 있는 적절한 냉각 장치가 있어야 합니다.
네트워킹
이 섹션에서는 GDC 연결 API에 Gemini를 배포하기 위한 네트워킹 요구사항을 설명합니다.
네트워크 연결
그림 1은 GDC에 연결된 API 네트워킹의 Gemini를 보여줍니다.
GDC 연결 API에 Gemini를 배포하려면 다음 네트워크 연결 요구사항을 충족해야 합니다.
쿼드 소형 폼 팩터 플러그형 (QFSP) 100기가비트 광 연결을 지원하는 Top-of-Rack (ToR) 스위치를 준비합니다.
Google 인증 머신당 ToR 스위치에 최소 1개의 QFSP 100기가비트 광 포트를 할당합니다. 하지만 고가용성을 위해 머신당 2개의 QFSP 100G 광 포트를 할당하는 것이 좋습니다. 이러한 각 포트에는 QSFP-100G-SR4-S 케이블 연결이 필요합니다.
머신당 포트 2개를 할당하는 경우 각 머신에서 두 ToR 스위치 포트를 동일한 Mellanox CX-6 네트워크 어댑터에 연결합니다.
다운스트림 최소 대역폭이 1Gbps이고 업스트림 최소 대역폭이 100Mbps인 인터넷 연결
Google 인증 머신마다 다음 네트워크 연결을 만듭니다.
머신에 있는 Mellanox CX-6 네트워크 어댑터의 QFSP 100기가비트 포트 하나 또는 두 개를 ToR 스위치에 연결합니다. 이러한 포트는 GDC 연결 API 및 Distributed Cloud 연결 소프트웨어의 Gemini에 대한 고속 트래픽을 처리합니다.
머신의 통합 Dell 원격 액세스 컨트롤러 (iDRAC) 포트를 별도의 레이어 2 스위치에 연결합니다. 이는 머신 관리에 필요합니다.
관리 스위치와 ToR 스위치를 레이어 2에서 연결합니다.
네트워크 구성
GDC 연결 API에 Gemini를 배포하려면 다음과 같이 로컬 네트워크를 구성하세요.
- 최대 전송 단위 (MTU) 크기가 1,500바이트로 구성된 전용 태그가 지정되지 않은 VLAN을 할당합니다.
- 워크로드 연결을 위해 비공개 /26 IPv4 CIDR 주소 블록을 할당합니다.
- BGP 피어링을 사용하여 VLAN의 업스트림 연결을 구성하고 할당된 /26 CIDR 블록을 업스트림 네트워크에 공지합니다.
- 업스트림 네트워크 및 인터넷으로 연결되는 기본 경로를 사용하여 VLAN을 프로비저닝합니다.
- 부트스트랩을 위해 Google 인증 머신에 IPv4 주소를 할당할 수 있는 동적 호스트 구성 프로토콜 (DHCP) 서버 이 DHCP 블록의 주소는 워크로드 연결 IPv4 CIDR 주소 블록의 마지막 /29 섹션이어야 합니다.
ToR 스위치 구성
다음과 같이 ToR 스위치를 구성합니다.
- GDC 연결 API 머신에서 Gemini에 할당된 포트에서 DHCPv4 및 DNS 지원을 사용 설정합니다.
- MTU가 1, 500바이트인 전용 태그가 지정되지 않은 VLAN에서 비공개 /26 IPv4 CIDR 블록을 구성합니다.
- CIDR 블록의 첫 번째 IPv4 주소를 네트워크 게이트웨이로 할당합니다.
- CIDR 블록의 나머지 IPv4 주소가 비어 있는지 확인합니다. GDC 연결 API의 Gemini는 시스템 기능, 서비스, 로컬 모델 엔드포인트에 자동으로 할당합니다.
DHCP 서버 구성
GDC 연결 API 머신에서 Gemini의 DHCP 서버를 다음과 같이 구성합니다.
- DHCP 서버는 GDC 연결 API 머신에서 Gemini에 연결된 모든 ToR 스위치 포트에서 연결할 수 있어야 합니다.
- GDC 연결 API 머신에서 Gemini에 할당한 /26 IPv4 CIDR 블록의 마지막 /29 세그먼트를 DHCP 할당용으로 예약하고 이 /29 세그먼트를 DHCP 주소 풀로 사용하도록 DHCP 서버를 구성합니다.
방화벽 구성
다음과 같이 GDC 연결 API 트래픽에서 Gemini를 허용하도록 로컬 방화벽을 구성합니다.
이름 | 소스 IP 주소 | 대상 애니캐스트 IP 주소 | 프로토콜 | 포트 |
---|---|---|---|---|
GDC 연결 관리 (TCP), 증명 서비스, 암송 확인 서비스, 모델 다운로드 | GDCc 영역 CIDR (/26) | Google IP 범위 | TCP | 443 |
GDC 연결 관리 (UDP) | GDCc 영역 CIDR (/26) | Google IP 범위 | UDP | 443 |
도메인 이름 서비스 (DNS) | GDCc 영역 CIDR (/26) | Google DNS: 8.8.8.8 , 8.8.4.4 |
UDP | 53 |
네트워크 시간 프로토콜 (NTP) | GDCc 영역 CIDR (/26) | Google NTP: 216.239.35.{0,4,8,12} |
UDP | 123 |
Intel TDX 원격 증명 | GDCc 영역 CIDR (/26) | 4.255.75.174/32 |
TCP | 443 |
Intel TDX 원격 증명 API 키
GDC 연결 API 엔드포인트에서 Gemini를 제공하는 컨피덴셜 가상 머신의 증명을 사용 설정하려면 Intel TDX 원격 증명 API 키를 획득하여 Google에 제공해야 합니다. API 키를 가져오려면 이 섹션의 단계를 완료하세요.
PCK 인증서 가져오기 섹션에서 구독을 클릭합니다.
표시된 안내에 따라 계정을 만들고 Intel® SGX 프로비저닝 인증 서비스 구독을 설정합니다.
계정의 내 구독 섹션에서 Intel® SGX 프로비저닝 인증 서비스 구독의 기본 API 키를 찾아 기록해 둡니다.
Google에 제공할 정보
Google에 다음 정보를 제공하세요.
Google 인증 기기를 조달하고 배포하는 담당자의 연락처 정보입니다.
Google 인증 머신에 할당한 /26 IPv4 CIDR 블록입니다.
Intel® SGX 프로비저닝 인증 서비스 구독의 기본 및 보조 API 키입니다.
GDC 연결 API 머신의 Gemini 서비스 태그입니다. 자세한 내용은 Express 서비스 코드 및 서비스 태그 찾기를 참고하세요.
Google 인증 머신의 비부팅 디스크 드라이브의 물리적 보안 식별자 (PSID)입니다.
GDC 연결 API의 Gemini용 Distributed Cloud 연결 영역을 호스팅하는 Google Cloud 프로젝트의 프로젝트 ID입니다.
인증된 하드웨어 검증
Google 기술자의 방문을 예약하기 전에 다음과 같이 인증된 하드웨어를 검증해야 합니다.
Google 담당자로부터 하드웨어 검증 스크립트를 받습니다.
인증된 머신에 Ubuntu Linux를 설치하거나 라이브 부팅합니다.
인증된 머신에서 하드웨어 유효성 검사 스크립트를 실행합니다.
스크립트의 출력을 Google 담당자에게 제공합니다.
다음 단계
GDC 연결 API 배포에서 Gemini를 온라인으로 전환하려면 다음 단계를 따르세요.
타겟 위치에서 GDC 연결 API 인증 하드웨어를 수신하고 설치합니다.
이 문서의 앞부분에 설명된 대로 GDC 연결 API 환경에서 Gemini를 구성합니다.
이 문서의 앞부분에 설명된 대로 인증된 하드웨어를 검증합니다.
Google 담당자와 협의하여 Google 기술자의 방문 일정을 예약합니다.
Google 기술자의 방문을 완료하여 GDC 연결 API 소프트웨어에 Gemini를 설치하고 구성합니다.
엔드포인트 만들기 및 관리의 단계를 완료합니다.