您可以在 Cloud Run 工作上,使用 Meta 的 Llama 3.2-1b LLM 和 vLLM 執行批次推論,然後使用 Cloud Run 磁碟區掛接,將結果直接寫入 Cloud Storage。
如需逐步操作說明,請參閱「How to run batch inference on Cloud Run jobs」程式碼研究室。
您可以在 Cloud Run 工作上,使用 Meta 的 Llama 3.2-1b LLM 和 vLLM 執行批次推論,然後使用 Cloud Run 磁碟區掛接,將結果直接寫入 Cloud Storage。
如需逐步操作說明,請參閱「How to run batch inference on Cloud Run jobs」程式碼研究室。
除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權,程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。
上次更新時間:2025-08-08 (世界標準時間)。