Google Cloud 利用 Cloud TPU v4,打造出全世界規模最大且開放大眾使用的機器學習中樞,採用的無碳能源占比達到 90%瞭解詳情。

Cloud TPU

影片內容說明。

運用 Google Cloud AI 提升企業實力

機器學習技術在網路安全到醫療診斷等各個層面,都能帶來業務和研究上的重大突破。我們打造 Tensor Processing Unit (TPU) 的目標,是要讓每個人都有機會獲得這樣的成就。Cloud TPU 是客製化設計的機器學習 ASIC,主要為 Google 翻譯、Google 相簿、Google 搜尋、Google 助理或 Gmail 等 Google 產品提供技術支援。以下說明如何結合 TPU 與機器學習技術,幫助企業快速達成目標,特別是大規模的工作,更能因此受惠。
Cloud AI TPU 基礎架構的圖片。

依據 Google Cloud 的 AI 技術量身打造

Cloud TPU 可搭配 AI 服務在 Google Cloud 中使用,是專為執行先進的機器學習模型而設計。其中的自訂高速網路甚至能在單一 pod 中提供每秒超過 100 千兆次浮點的運算能力,如此卓越效能足以推動貴公司轉型,或是帶來後續的研究突破。

快速疊代圖片

加快機器學習解決方案的疊代速度

訓練機器學習模型與編譯程式碼類似,兩者都需要以最有效率的方式頻繁更新。機器學習模型必須隨著建構、部署和改善應用程式的過程不斷反覆訓練。Cloud TPU 效能強大、成本低廉,非常適合想要在其解決方案頻繁進行快速疊代的機器學習團隊。

確實有效的先進模型

您可以針對各種實際用途建構採用機器學習技術的自訂解決方案。您只需要提供資料並下載經 Google 最佳化的參考模型,接著開始訓練作業,一切就大功告成。

客戶與合作夥伴

「在 Cohere,我們開發了先進的自然語言處理 (NLP) 服務,包括用於產生、分類及搜尋語言的 API。這些工具是以一組語言模型為基礎打造而成,Cohere 會透過 JAX 在 Cloud TPU 上從頭開始訓練。從 Cloud TPU v3 Pod 改用 Cloud TPU v4 Pod 後,我們訓練最大模型的時間縮短了 70%,方便研究人員加快疊代作業,進而為客戶呈現更優質的成果。此外,Cloud TPU v4 Pod 極低的碳足跡對我們來說也是一大關鍵因素」

執行長暨共同創辦人 Aidan Gomez

lg ai research 標誌

「TPU v4 是 Google 最新的機器學習超級電腦,而 LG AI Research 身為策略研究合作夥伴,在 TPU v4 商業化前參與測試,並用來訓練 LG EXAONE,這是一項擁有超過 3,000 億個參數規模的超大型 AI。有了多模型功能後,LG EXAONE 就開始透過 TPU v4,以及超過 6,000 億筆符記的文字語料庫和超過 2.5 億張圖片等大量資料來進行訓練,目的是在通訊、工作效率、創造力等不同領域上超越人類專家。TPU v4 不僅在效能方面超越其他業界一流的運算架構,在客戶支援方面也超乎我們的期待。我們非常高興能夠與 Google 合作,並希望強化策略合作夥伴關係以達成最終願景,進而讓 AI 技術更臻完善。」

LG AI 研究部主管 Kyunghoon Bae 博士

salesforce 標誌

「TPU v4 的搶先體驗機會讓我們能透過 CodeGen 專案,在對話式 AI 程式編寫上取得重大突破。這項專案擁有 160 億個參數自動迴歸語言模型,可以將簡單的英語提示轉換成可執行的程式碼。這個大型模型是由經驗觀測所驅動,根據訓練樣本比例來調整模型參數的數量,這對於模型效能有極大的提升。這就是所謂的資源調度法。對於這類向外擴充機器學習訓練模型來說,TPU v4 是相當出色的平台,提供了卓越的效能優勢,遠勝於其他同類型的 AI 硬體選擇。」

Salesforce 研究科學家 Erik Nijkamp

IDC 標誌

「我們針對 2000 名 IT 決策者最近所做的問卷調查發現,基礎架構功能不足通常是 AI 專案無法運作的根本原因。為因應日漸增加的企業專用 AI 基礎架構的重要性,Google 已在奧克拉荷馬州成立了新的機器學習叢集,共有 900 萬兆次浮點的匯總運算。我們相信這是規模最大的公開機器學習中樞,其中有 90% 的運作電力是由無碳能源供應。這展現了 Google 持續以 AI 基礎架構進行創新的承諾,並秉持永續發展的理念。」

IDC 企業基礎架構、雲端、電信、安全性、開發人員、管道和技術啟用部門資深副總裁 Matt Eastwood

功能與特色

模型資料庫

您可以從我們專為 Cloud TPU 提供的最佳化模型資料庫開始著手;這套資料庫的內容將持續成長,其中的模型可在圖片分類、物件偵測、語言模型建構、語音辨識等作業中,帶來最佳化的效能、準確率及品質。

將 Cloud TPU 與自訂機器類型連結

您可以透過自訂 深度學習 VM 映像檔類型連結到 Cloud TPU,這樣就能針對個別工作負載以最佳方式平衡處理器速度、記憶體和高效能儲存空間資源。

與 Google Cloud 完全整合

Cloud TPU 和 Google Cloud 的資料與分析服務已在核心層面與 Google Kubernetes Engine (GKE) 等其他 Google Cloud 產品完全整合。因此,您在 Cloud TPU 上處理機器學習工作負載時,可以充分運用 Google Cloud 領先業界的儲存空間網路資料分析技術。

先占 Cloud TPU

對於容錯機器學習工作負載 (例如針對大型資料集執行含檢查點或批次預測的長時間訓練) 而言,使用先占 Cloud TPU 可節省費用。先占 Cloud TPU 的費用較隨選執行個體低 70%,因此無論是初期實驗或大規模超參數搜尋作業,您都能比以往省下更多費用。

後續行動

運用價值 $300 美元的免費抵免額和超過 20 項一律免費的產品,開始在 Google Cloud 中建構產品與服務。

需要入門協助嗎?
與值得信賴的夥伴合作
繼續瀏覽

後續步驟

展開下一項專案、探索互動式教學課程及管理帳戶。

需要入門協助嗎?
與值得信賴的夥伴合作
查看提示和最佳做法

Cloud AI 產品符合 Google Cloud 服務水準協議政策。這些產品的延遲時間或可用性保證可能與其他 Google Cloud 服務不同。