Google DeepMind의 새로운 개방형 모델 제품군인 Gemma를 GKE에서 사용할 수 있습니다.
컬렉션을 사용해 정리하기
내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.
Google Kubernetes Engine(GKE) 플랫폼 조정 기능으로 최적화된 AI/ML 워크로드를 실행하세요. Google Kubernetes Engine(GKE)을 사용하면 관리형 Kubernetes의 모든 이점과 다음 기능을 활용하여 프로덕션에 즉시 사용 가능한 강력한 AI/ML 플랫폼을 구현할 수 있습니다.
- 규모에 맞게 워크로드를 학습시키고 제공할 수 있도록 GPU 및 TPU를 지원하는 인프라 조정
- 분산형 계산 및 데이터 처리 프레임워크를 지원하는 유연한 통합
- 동일한 인프라에서 여러 팀을 지원하여 리소스 활용 극대화
이 페이지에서는 GKE의 AI/ML 기능에 대한 개요를 설명하고 GPU, TPU 및 Hugging Face TGI, vLLM, JetStream과 같은 프레임워크를 사용하여 GKE에서 최적화된 AI/ML 워크로드를 실행하는 방법을 보여줍니다.
달리 명시되지 않는 한 이 페이지의 콘텐츠에는 Creative Commons Attribution 4.0 라이선스에 따라 라이선스가 부여되며, 코드 샘플에는 Apache 2.0 라이선스에 따라 라이선스가 부여됩니다. 자세한 내용은 Google Developers 사이트 정책을 참조하세요. 자바는 Oracle 및/또는 Oracle 계열사의 등록 상표입니다.
최종 업데이트: 2024-12-19(UTC)
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2024-12-19(UTC)"],[],[]]