En esta página, se detalla cómo implementar Inference Gateway en la organización del cliente. Para obtener más información sobre este componente, consulta Componentes clave.
Antes de comenzar
Para implementar componentes clave en la organización del cliente, debes tener lo siguiente:
- Anula la puerta de la función del componente operable
AICSen la organización del cliente. - Verifica que las organizaciones del cliente y de Gemini estén en funcionamiento.
- Verifica que el enrutador de IA generativa en la organización de Gemini esté en funcionamiento.
Implementa la puerta de enlace de inferencia
Para implementar Inference Gateway en la organización del cliente, sigue estos pasos:
Aplica el recurso personalizado
AICSPackageal servidor de la API de administración de la organización del cliente:CUS_ORG_MGMT_KUBECONFIG=CUS_ORG_MGMT_KUBECONFIG_PATH kubectl apply --kubeconfig ${CUS_ORG_MGMT_KUBECONFIG:?} -f << EOF apiVersion: aics.gdc.goog/v1 kind: AICSPackage metadata: name: aics-l1opr-cr namespace: aics-system spec: applications: - name: inference-gateway path: inference-gateway - name: l2crd path: vai-l2crd - name: l2opr path: aics-l2operator EOFReemplaza
CUS_ORG_MGMT_KUBECONFIG_PATHpor la ruta de acceso al archivo kubeconfig del servidor de la API de administración de la organización del cliente.Recupera el nombre de dominio completamente calificado (FQDN) del enrutador de IA generativa:
GEM_ORG_MGMT_KUBECONFIG=GEM_ORG_MGMT_KUBECONFIG_PATH GEN_AI_ROUTER_FQDN=$(kubectl --kubeconfig ${GEM_ORG_MGMT_KUBECONFIG:?} \ get dnsregistrations.network.private.gdc.goog/genai-router \ -n gemini-system -o json | jq '.status.fqdn') echo $GEN_AI_ROUTER_FQDNReemplaza
GEM_ORG_MGMT_KUBECONFIG_PATHpor la ruta de acceso al archivo kubeconfig del servidor de la API de administración de la organización de Gemini.El resultado se ve como en el siguiente ejemplo:
"genai-router.org-1.zone1.google.gdch.test"Crea un archivo
ConfigMapque contenga el FQDN del enrutador de IA generativa en el clúster de infraestructura de la organización del cliente:CUS_ORG_CP_KUBECONFIG=CUS_ORG_CP_KUBECONFIG_PATH kubectl --kubeconfig ${CUS_ORG_CP_KUBECONFIG:?} apply -f - << EOF apiVersion: v1 kind: ConfigMap metadata: name: inference-gateway-config namespace: aics-system data: GEMINI_ADDRESS: $GEN_AI_ROUTER_FQDN EOFReemplaza
CUS_ORG_CP_KUBECONFIG_PATHpor la ruta de acceso al archivo kubeconfig del clúster de infraestructura de la organización para la organización del cliente.Copia el paquete de confianza del clúster de infraestructura de la organización de Gemini al clúster de infraestructura de la organización del cliente:
GEM_ORG_CP_KUBECONFIG=GEM_ORG_CP_KUBECONFIG_PATH CUS_ORG_CP_KUBECONFIG=CUS_ORG_CP_KUBECONFIG_PATH kubectl --kubeconfig=${GEM_ORG_CP_KUBECONFIG:?} get configMap trust-store-root-ext -n istio-system -o yaml | yq .data > genai-istio-ca-crt.yaml (echo "apiVersion: v1"; echo "kind: ConfigMap"; echo "metadata:"; echo " name: genai-isito-ca"; \ echo " namespace: aics-system"; echo "data:"; sed 's/^/ /' genai-istio-ca-crt.yaml | cat -) > genai-istio-ca.yaml kubectl --kubeconfig=${CUS_ORG_CP_KUBECONFIG:?} apply -f genai-istio-ca.yamlReemplaza lo siguiente:
GEM_ORG_CP_KUBECONFIG_PATH: Es la ruta al archivo kubeconfig del clúster de infraestructura de la organización para la organización de Gemini.CUS_ORG_CP_KUBECONFIG_PATH: Es la ruta al archivo kubeconfig del clúster de infraestructura de la organización para la organización del cliente.