このページでは、Inference Gateway を顧客組織にデプロイする方法について詳しく説明します。このコンポーネントの詳細については、主要コンポーネントをご覧ください。
始める前に
お客様の組織に主要なコンポーネントをデプロイするには、次のものが必要です。
- お客様の組織で
AICS操作可能なコンポーネントの機能ゲートをオーバーライドします。 - お客様と Gemini の組織が稼働していることを確認します。
- Gemini 組織の GenAI Router が稼働していることを確認します。
推論 Gateway をデプロイする
お客様の組織に Inference Gateway をデプロイする手順は次のとおりです。
お客様の組織から管理 API サーバーに
AICSPackageカスタム リソースを適用します。CUS_ORG_MGMT_KUBECONFIG=CUS_ORG_MGMT_KUBECONFIG_PATH kubectl apply --kubeconfig ${CUS_ORG_MGMT_KUBECONFIG:?} -f << EOF apiVersion: aics.gdc.goog/v1 kind: AICSPackage metadata: name: aics-l1opr-cr namespace: aics-system spec: applications: - name: inference-gateway path: inference-gateway - name: l2crd path: vai-l2crd - name: l2opr path: aics-l2operator EOFCUS_ORG_MGMT_KUBECONFIG_PATHは、顧客組織の管理 API サーバーの kubeconfig ファイルのパスに置き換えます。GenAI Router の完全修飾ドメイン名(FQDN)を取得します。
GEM_ORG_MGMT_KUBECONFIG=GEM_ORG_MGMT_KUBECONFIG_PATH GEN_AI_ROUTER_FQDN=$(kubectl --kubeconfig ${GEM_ORG_MGMT_KUBECONFIG:?} \ get dnsregistrations.network.private.gdc.goog/genai-router \ -n gemini-system -o json | jq '.status.fqdn') echo $GEN_AI_ROUTER_FQDNGEM_ORG_MGMT_KUBECONFIG_PATHは、Gemini 組織の管理 API サーバーの kubeconfig ファイルのパスに置き換えます。出力は、次の例のようになります。
"genai-router.org-1.zone1.google.gdch.test"顧客組織の組織インフラストラクチャ クラスタに GenAI Router FQDN を含む
ConfigMapを作成します。CUS_ORG_CP_KUBECONFIG=CUS_ORG_CP_KUBECONFIG_PATH kubectl --kubeconfig ${CUS_ORG_CP_KUBECONFIG:?} apply -f - << EOF apiVersion: v1 kind: ConfigMap metadata: name: inference-gateway-config namespace: aics-system data: GEMINI_ADDRESS: $GEN_AI_ROUTER_FQDN EOFCUS_ORG_CP_KUBECONFIG_PATHは、顧客組織の組織インフラストラクチャ クラスタの kubeconfig ファイルのパスに置き換えます。Gemini 組織の組織インフラストラクチャ クラスタから、顧客組織の組織インフラストラクチャ クラスタに信頼バンドルをコピーします。
GEM_ORG_CP_KUBECONFIG=GEM_ORG_CP_KUBECONFIG_PATH CUS_ORG_CP_KUBECONFIG=CUS_ORG_CP_KUBECONFIG_PATH kubectl --kubeconfig=${GEM_ORG_CP_KUBECONFIG:?} get configMap trust-store-root-ext -n istio-system -o yaml | yq .data > genai-istio-ca-crt.yaml (echo "apiVersion: v1"; echo "kind: ConfigMap"; echo "metadata:"; echo " name: genai-isito-ca"; \ echo " namespace: aics-system"; echo "data:"; sed 's/^/ /' genai-istio-ca-crt.yaml | cat -) > genai-istio-ca.yaml kubectl --kubeconfig=${CUS_ORG_CP_KUBECONFIG:?} apply -f genai-istio-ca.yaml次のように置き換えます。
GEM_ORG_CP_KUBECONFIG_PATH: Gemini 組織の組織インフラストラクチャ クラスタの kubeconfig ファイルのパス。CUS_ORG_CP_KUBECONFIG_PATH: お客様の組織の組織インフラストラクチャ クラスタの kubeconfig ファイルのパス。