Hugging Face Transformers.js(서비스)를 사용하여 Cloud Run GPU에서 LLM 추론 실행

다음 Codelab에서는 Transformers.js 패키지를 실행하는 백엔드 서비스를 실행하는 방법을 보여줍니다. Transformers.js 패키지는 Google의 Gemma 2 모델과 함께 Hugging Face Transformers Python 라이브러리와 기능적으로 동일합니다.

Cloud Run GPU에서 Transformers.js를 실행하는 방법에서 전체 Codelab을 확인하세요.