Antes de pedir o Gemini na API conectada do Google Distributed Cloud, você precisa atender aos requisitos de instalação descritos neste documento. Para mais informações, consulte Como receber suporte.
Hardware certificado
Antes de pedir o Gemini na API conectada do GDC, você precisa adquirir hardware certificado que corresponda à configuração exata descrita nesta seção. Essa configuração é para uma única máquina certificada pelo Google.
Item | SKU da Dell | Quantidade |
---|---|---|
PowerEdge XE9680, DSS RESTRICTED | 210-BHYV | 1 |
Chassi de 2,5 polegadas | 379-BDTF | 1 |
Trusted Platform Module 2.0 V3 | 461-AAIG | 1 |
Chassi XE9680 6U com 8 GPUs 8 x 2,5 NVMe somente | 321-BIEK | 1 |
Intel Xeon Platinum 8592+ 1.9G, 64C/128T, 20GT/s, 320M Cache, Turbo, HT (350W) DDR5-5600 | 338: CPBP | 1 |
Intel Xeon Platinum 8592+ 1.9G, 64C/128T, 20GT/s, 320M Cache, Turbo, HT (350W) DDR5-5600 | 338: CPBP | 1 |
Processador adicional selecionado | 379-BDCO | 1 |
Configuração de altura ajustável 2 | 330-BCHH | 1 |
Dissipador de calor para configuração de duas CPUs | 412-BBCN | 1 |
Desempenho otimizado | 370-AAIP | 1 |
RDIMMs de 5.600 MT/s | 370-BBRX | 1 |
C30, sem RAID para chassi NVME | 780-BCDO | 1 |
Sem controle | 405-AACD | 1 |
Configurações de performance da BIOS | 384-BBBL | 1 |
Modo de inicialização do BIOS UEFI com partição GPT | 800-BBDM | 1 |
Ventilador de desempenho muito alto x6 | 750-ADGJ | 1 |
3+3 FTR (freio de energia da GPU ativado), PSU hot-plug, 2.800 W MM HLAC (200-240 VCA) Titanium, conector C22 | 450-AMMN | 1 |
Placa-mãe do sistema XE9680, MX, MLK | 338-CPWL | 1 |
Painel LCD 2U do PowerEdge | 325-BETK | 1 |
Conjunto de GPUs NVIDIA HGX H200 de 8 GPUs SXM 141 GB 700 W | 490-BKHF | 1 |
Placa controladora BOSS-N1 + com 2 FIPS M.2 de 960 GB (RAID 1) | 403-BCVH | 1 |
Cabo BOSS XE9680 | 470-AFNO | 1 |
Nenhuma placa de rede mezzanine OCP 3.0 | 412-AASK | 1 |
Nenhum sistema operacional, nenhuma partição de utilitário | 611-BBBG | 1 |
iDRAC9, Datacenter 16G | 528-CTID | 1 |
Licença do iDRAC Secure Enterprise Key Manager 2.0 | 634-BZIL | 1 |
Verificação de componentes seguros | 528-COYT | 1 |
iDRAC,senha gerada de fábrica | 379-BCSF | 1 |
Módulo de serviço iDRAC (ISM), NÃO instalado | 379-BCQX | 1 |
Gerenciador de grupos do iDRAC, desativado | 379-BCQY | 1 |
Braço organizador de cabos para trilho de rack XE9680 | 770-BEPB | 1 |
Trilho deslizante pronto XE9680 (B28) | 770-BEPC | 1 |
PowerEdge XE9680, envio | 340-DDBX | 1 |
Marcação CE do PowerEdge XE9680, sem marcação CCC | 389-EFKE | 1 |
Material de envio XE9680 | 343-BBXC | 1 |
Suporte ao gerenciamento de programas empresariais | 973-3700 | 1 |
Basic Next Business Day 36 Months | 709-BFTF | 1 |
RESTRICTED:ProSupport One Data Center and Next Business Day Onsite Service Vol Low Ext, 24 Month(s) | 199-BTKS | 1 |
RESTRICTED:ProSupport One Data Center and Next Business Day Onsite Service Vol Low Init, 36 Month(s) | 199-BTKT | 1 |
Keep Your Hard Drive For Enterprise, 60 Month(s) | 711-BCXN | 1 |
ProDeploy Plus PowerEdge XE Series 5U6U | 683-BDSB | 1 |
Implantação de infraestrutura selecionada | 701-6538 | 1 |
RDIMM de 128 GB, 5.600 MT/s, Quad Rank | 370-BBQY | 16 |
Unidade AG de uso misto NVMe de data center de 800 G U2 Gen4 com suporte | 400-BRPJ | 1 |
C20 para C21, estilo PDU, 16 AMP, 2,4 metros, cabo de alimentação | 450-AGXK | 6 |
Broadcom 5720 Dual Port 1GbE LOM | 540-BDKD | 1 |
Adaptador de rede Mellanox ConnectX-6 DX de porta dupla 100GbE QSFP56, altura total | 540-BCXO | 2 |
Tamanho e peso
Cada máquina certificada pelo Google tem 6U de altura e as seguintes dimensões:
- Altura: 263,2 mm (10,36")
- Largura: 482 mm (18,97")
- Profundidade: 1008,77 mm (39,71") incluindo o painel frontal
Cada máquina certificada pelo Google pesa 113,3 kg.
Alimentação e resfriamento
Cada máquina certificada pelo Google tem as seguintes especificações elétricas:
- Tensão:100 V a 240 V CA, 50/60 Hz
- Energia:11.000 W no máximo
Sua instalação precisa ter resfriamento adequado para oferecer suporte a uma (1) máquina certificada pelo Google para cada implantação do Gemini na API conectada ao GDC.
Rede
Nesta seção, descrevemos os requisitos de rede para implantar o Gemini na API conectada do GDC. Além da máquina certificada pelo Google com a API conectada do Gemini no GDC, você precisa fornecer sua própria máquina local, como um laptop, para usar apenas durante a ativação. Essa é a máquina de aumento na figura 1.
Conectividade de rede
A Figura 1 ilustra a rede de APIs conectadas do Gemini no GDC.
Você precisa atender aos seguintes requisitos de conectividade de rede para implantar o Gemini na API conectada do GDC:
Prepare um switch de topo de rack (ToR) que ofereça suporte à conectividade óptica de 100 gigabits com plug-in de formato pequeno quádruplo (QSFP).
Alocar um mínimo de uma porta óptica QFSP de 100 gigabits no switch ToR por máquina certificada pelo Google. No entanto, o Google recomenda alocar duas portas ópticas QFSP de 100G por máquina para alta disponibilidade. Cada uma dessas portas requer cabeamento QSFP-100G-SR4-S.
Se você estiver alocando duas portas por máquina, conecte as duas portas do switch ToR ao mesmo adaptador de rede Mellanox CX-6 em cada máquina.
Uma conexão de Internet com largura de banda mínima de 1 Gbps downstream e 100 Mbps upstream.
Faça as seguintes conexões de rede para cada máquina certificada pelo Google:
Conecte uma ou as duas portas de 100 gigabits QFSP no adaptador de rede Mellanox CX-6 na máquina ao switch ToR. Essas portas processam o tráfego de alta velocidade da API conectada do Gemini no GDC e do software conectado do Distributed Cloud.
Conecte a porta do Integrated Dell Remote Access Controller (iDRAC) na máquina a um switch de camada 2 separado. Isso é necessário para o gerenciamento de máquinas.
Apenas para ativação:
Atribua um endereço IP à porta iDRAC que não faça parte do bloco CIDR da zona conectada do Distributed Cloud de destino.
Estabeleça a conectividade de rede entre o iDRAC e a máquina de ativação, conforme mostrado na Figura 1.
Configuração de rede
Configure sua rede local da seguinte maneira para implantar o Gemini na API conectada ao GDC:
- Alocar uma VLAN dedicada sem tag configurada com uma unidade de transmissão máxima (MTU) de 1.500 bytes.
- Aloque um bloco de endereços CIDR IPv4 /26 particular para conectividade de carga de trabalho.
- Configure a conectividade de saída para a VLAN usando o peering do BGP e divulgue o bloco CIDR /26 atribuído para a rede upstream.
- Provisione a VLAN com uma rota padrão para a rede upstream e a Internet.
- Um servidor de protocolo de configuração de host dinâmico (DHCP) que pode atribuir endereços IPv4 às máquinas certificadas pelo Google para inicialização. Os endereços nesse bloco DHCP precisam ser a última seção /29 do bloco de endereços CIDR IPv4 de conectividade da carga de trabalho.
Configuração do switch ToR
Configure o switch ToR da seguinte maneira:
- Ative o suporte a DHCPv4 e DNS nas portas alocadas ao Gemini em máquinas de API conectadas ao GDC.
- Configure um bloco CIDR IPv4 /26 particular na VLAN dedicada e sem tag com uma MTU de 1.500 bytes.
- Alocar o primeiro endereço IPv4 no bloco CIDR como o gateway de rede.
- Verifique se o restante dos endereços IPv4 no bloco CIDR está livre. A API Gemini no GDC conectado os aloca automaticamente para funções, serviços e endpoints de modelos locais do sistema.
Configuração do servidor DHCP
Configure o servidor DHCP para o Gemini em máquinas de API conectadas ao GDC da seguinte maneira:
- O servidor DHCP precisa ser acessível de todas as portas do switch ToR conectadas ao Gemini em máquinas de API conectadas ao GDC.
- Reserve o último segmento /29 do bloco CIDR IPv4 /26 alocado ao Gemini em máquinas de API conectadas ao GDC para atribuições de DHCP e configure o servidor DHCP para usar esse segmento /29 como um pool de endereços DHCP.
Configuração do firewall
Configure seu firewall local para permitir o tráfego da API conectada do Gemini no GDC da seguinte maneira:
Nome | Endereço IP de origem | Endereço IP anycast de destino | Protocolo | Porta |
---|---|---|---|---|
Inicializar | CIDR da zona do GDCc (/26) | 192.178.76.0/23 |
TCP | 80 |
Gerenciamento conectado do GDC (TCP), serviço de comprovação, serviço de verificação de recitação, downloads de modelos | CIDR da zona do GDCc (/26) | 216.239.{32,34,36,38}.223 , 192.178.76.0/23 |
TCP | 443 |
Gerenciamento de GDC conectado (gRPC, HTTPS) | CIDR da zona do GDCc (/26) | 192.178.76.0/23 |
TCP | 444 |
Gerenciamento do GDC conectado (QUIC) | CIDR da zona do GDCc (/26) | 192.178.18.0/23 |
UDP | 443 |
Serviço de nomes de domínio (DNS) | CIDR da zona do GDCc (/26) | DNS do Google: 8.8.8.8 , 8.8.4.4 |
TCP, UDP | 53 |
Network Time Protocol (NTP) | CIDR da zona do GDCc (/26) | NTP do Google: 216.239.35.{0,4,8,12} |
UDP | 123 |
Declaração remota do Intel TDX | CIDR da zona do GDCc (/26) | 4.255.75.174 |
TCP | 443 |
Chave de API de comprovação remota do Intel TDX
Para ativar o atestado das máquinas virtuais confidenciais que atendem aos endpoints de API conectados do Gemini no GDC, é necessário obter uma chave de API de atestado remoto do Intel TDX e fornecê-la ao Google. Para conseguir a chave de API, siga as etapas desta seção.
Acesse a página Intel® Provisioning Certification Service for ECDSA Attestation (em inglês).
Na seção Receber certificados PCK, clique em Inscrever-se.
Siga as instruções exibidas para criar uma conta e estabelecer uma assinatura do serviço de certificação de provisionamento do Intel® SGX.
Na seção Suas assinaturas da sua conta, encontre e anote a chave de API principal da sua assinatura do Intel® SGX Provisioning Certification Service.
Informações a serem fornecidas ao Google
Forneça as seguintes informações ao Google:
Dados de contato de uma pessoa responsável por adquirir e implantar as máquinas certificadas pelo Google.
O bloco CIDR IPv4 /26 alocado para suas máquinas certificadas pelo Google.
As chaves de API principal e secundária da sua assinatura do serviço de certificação de provisionamento do Intel® SGX.
As tags de serviço para suas máquinas de API conectadas ao Gemini no GDC. Para instruções, consulte Como localizar o código e a tag de serviço do Express.
Os identificadores de segurança física (PSIDs, na sigla em inglês) de unidades de disco não inicializáveis em máquinas certificadas pelo Google.
O ID do projeto do Google Cloud que hospeda sua zona conectada do Distributed Cloud para o Gemini na API conectada do GDC.
Validar o hardware certificado
Antes de agendar uma visita de um técnico do Google, valide seu hardware certificado da seguinte forma:
Receba a imagem do Docker de validação de hardware do seu representante do Google.
Instale ou inicialize o Ubuntu Linux na máquina certificada. Essa instalação é usada apenas para tarefas de pré-teste. O Google a substitui pelo software da API conectada do Gemini no GDC assim que o pré-teste é concluído.
Instale os seguintes pacotes:
Carregue a imagem do Docker do validador de hardware:
docker load -i gdc_hw_validator.tar
Especifique o bloco CIDR da zona conectada do Distributed Cloud:
export IP_CIDR="ZONE_CIDR"
Substitua
ZONE_CIDR
pelo bloco CIDR da zona.Execute o script de validação de hardware na máquina certificada como
root
:docker run --rm -t --privileged -v "$(pwd)":/output -v /sys/fs/cgroup:/sys/fs/cgroup:rw \ --cgroupns=host --network=host -v /lib/modules:/lib/modules:ro -v /dev:/dev \ -e IP_CIDR="$IP_CIDR" gdc_hw_validator
Forneça o arquivo JSON gerado pelo script ao seu representante do Google.
Ative as APIs necessárias
Ative as seguintes APIs no projeto de destino Google Cloud :
aiplatform.googleapis.com
anthos.googleapis.com
anthosaudit.googleapis.com
anthosgke.googleapis.com
cloudresourcemanager.googleapis.com
connectgateway.googleapis.com
compute.googleapis.com
container.googleapis.com
edgecontainer.googleapis.com
gdchardwaremanagement.googleapis.com
gkeconnect.googleapis.com
gkehub.googleapis.com
gkeonprem.googleapis.com
iam.googleapis.com
iamcredentials.googleapis.com
kubernetesmetadata.googleapis.com
logging.googleapis.com
monitoring.googleapis.com
multiclustermetering.googleapis.com
opsconfigmonitoring.googleapis.com
oslogin.googleapis.com
serviceusage.googleapis.com
stackdriver.googleapis.com
storage.googleapis.com
sts.googleapis.com
Para informações sobre como ativar APIs, consulte Como ativar serviços.
Configurar uma conta de faturamento
Configure uma conta de faturamento para seu projeto de destino Google Cloud , conforme descrito em Criar uma conta de autoatendimento do Cloud Billing.
A seguir
Para colocar sua implantação de API conectada do Gemini no GDC on-line, faça o seguinte:
Receba e instale o hardware certificado da API conectada ao Gemini no GDC no local de destino.
Configure seu ambiente de API conectada do Gemini no GDC conforme descrito anteriormente neste documento.
Valide o hardware certificado conforme descrito anteriormente neste documento.
Coordene com seu representante do Google para agendar uma visita de um técnico do Google.
Conclua a visita do técnico do Google para instalar e configurar o software da API conectada do Gemini no GDC.
Conclua as etapas em Criar e gerenciar endpoints.