Hugging Face Transformers.js を使用して Cloud Run GPU で LLM 推論を実行する(サービス)

次の Codelab では、Transformers.js パッケージを実行するバックエンド サービスを実行する方法について説明します。Transformers.js パッケージは、Google の Gemma 2 モデルとともに、Hugging Face transformers Python ライブラリと同等の機能を備えています。

Codelab 全体については、Cloud Run GPU で Transformers.js を実行する方法をご覧ください。