Cloud Run 작업에서 GPU를 사용하여 일괄 추론 실행

Cloud Run 작업에서 Meta의 Llama 3.2-1b LLMvLLM을 사용하여 일괄 추론을 실행한 다음 Cloud Run 볼륨 마운트를 사용하여 결과를 Cloud Storage에 직접 쓸 수 있습니다.

Cloud Run 작업에서 일괄 추론을 실행하는 방법에서 단계별 안내 Codelab을 참조하세요.