這份Google Cloud Well-Architected Framework:金融服務業觀點文件概略說明瞭相關原則和建議,可協助您在 Google Cloud中最佳化金融服務業 (FSI) 工作負載的成本。本文中的建議與良好架構架構的成本最佳化支柱一致。
如要為金融服務工作負載進行完善的成本最佳化,需要下列基本要素:
- 能夠找出浪費的資源使用量,以及有助於提升價值的資源使用量。
- 培養財務責任感。
如要盡量節省成本,您必須全面瞭解貴機構的成本驅動因素和資源需求。在某些大型機構中,尤其是處於雲端轉型初期的機構,通常由單一團隊負責在大量網域中盡量節省支出。這個方法假設中央團隊最適合找出高價值商機,進而提高效率。
在雲端採用初期或處理非重要工作負載時,集中式方法或許能帶來一些成效。不過,單一團隊無法在整個機構中推動成本最佳化。當資源用量或監管審查程度增加時,集中式方法就無法持續運作。集中式團隊在處理大量金融產品和服務時,尤其會面臨擴充性方面的挑戰。擁有產品和服務的專案團隊可能會抗拒外部團隊所做的變更。
如要有效最佳化成本,必須清楚顯示支出相關資料,並激勵工程師和其他雲端使用者 (他們與工作負載密切相關) 採取行動,以最佳化成本。從組織的角度來看,成本最佳化面臨的挑戰是找出應最佳化的領域、負責這些領域的工程師,然後說服他們採取必要的最佳化行動。本文提供相關建議,協助您應對這項挑戰。
本文中的成本最佳化建議會對應至下列核心原則:
使用 Google Cloud 工具找出浪費的費用
Google Cloud 提供多項產品、工具和功能,協助您找出浪費的資源。請參考下列建議。
運用自動化和 AI 系統性地找出最佳化目標
Active Assist 可針對金融服務業的重要服務提供智慧建議,例如微服務適用的 Cloud Run、資料分析適用的 BigQuery、核心應用程式適用的 Compute Engine,以及關聯式資料庫適用的 Cloud SQL。Active Assist 建議免費提供,您不必進行任何設定。這些建議有助於找出閒置資源和未充分利用的承諾。
透過統一介面集中監控及控管 FinOps
您可以透過 Cloud Billing 報表和 FinOps 中心,全面監控成本。財務稽核人員和內部財務團隊需要這個全面檢視畫面,才能追蹤雲端支出、評估財務狀況、評估各業務部門或成本中心的 FinOps 成熟度,並提供一致的財務敘述。
分析及擴增支出資料,找出價值所在
Active Assist 能夠有效找出明顯的浪費情況,不過,要找出價值可能比較困難,特別是當工作負載位於不適合的產品上,或是工作負載與業務價值缺乏明確的關聯時。對於金融服務業工作負載,業務價值不僅限於降低成本,價值包括降低風險、遵守法規,以及取得競爭優勢。
如要全面瞭解雲端支出和價值,您需要從多個層面完整掌握資訊:支出來源、支出帶動的業務功能,以及重構或最佳化相關工作負載的技術可行性。
下圖說明如何運用資料-資訊-知識-智慧 (DIKW) 金字塔和工具,全面瞭解雲端費用和價值。 Google Cloud
上圖說明如何運用 DIKW 方法,將原始雲端支出資料精煉為可做為決策依據的洞察資料,進而提升業務價值。
- 資料:在這個層級,您可以收集雲端資源的原始用量和費用資料串流,並進行處理。中央 FinOps 團隊會使用 Cloud Billing 月結單、帳單匯出和 Cloud Monitoring 等工具,取得精細的詳細資料。舉例來說,資料點可能是指名為
app1-test-vmA
的 VM 在us-central1
區域執行了 730 小時,費用為 $70 美元。 - 資訊:在這個層級,中央 FinOps 團隊會使用 Cloud Billing 報表和 FinOps Hub 等工具,整理原始資料,協助回答「使用者在哪些類別的資源上花費最多?」等問題。舉例來說,您可能會發現在美國兩個區域中,機器類型為 n4-standard-2 的 VM 總共花費了 $1,050 美元。
- 知識:在這個層級,中央 FinOps 團隊會提供適當的業務背景資訊,豐富資訊內容,說明誰花費了資金,以及用途為何。您可以使用標記、標籤、資源階層、帳單帳戶和自訂 Looker 資訊主頁等機制。舉例來說,您可能會發現美國的
app1
測試團隊在 7 月第二週的壓力測試中,花費了 $650 美元。 - 智慧:在這個層級,產品和應用程式團隊會運用情境化知識評估雲端支出的業務價值,並做出明智的策略決策。您的團隊可能會回答下列問題:
- 花費在資料分析管道的 $5,000 美元是否能創造商業價值?
- 我們能否重新設計管道架構,在不降低效能的情況下提高效率?
以下是分析雲端支出資料的建議。
分析由 Google Cloud
首先,請將詳細的 Cloud 帳單資料匯出至 BigQuery,並使用 Monitoring 記錄檔中的資料。如要取得可做為行動依據的洞察資料並做出決策,您需要建構這類資料,並加入業務背景資訊。
透過可用工具以視覺化方式呈現資料
使用 Looker Studio 等工具,根據 BigQuery 匯出資料建立自訂報表,進一步擴充內建 Google Cloud 資訊主頁。財務團隊可以建構自訂資訊主頁,根據財務指標、法規報表要求和業務部門獲利能力,瞭解雲端支出。然後為高階利害關係人提供清楚的財務敘述,以利分析和決策。
分配支出,推動當責文化
瞭解雲端支出背後的原因後,您需要找出支出者和支出原因。如要達到這種程度的瞭解,需要健全的成本分配做法,也就是將與業務相關的中繼資料附加至雲端資源。舉例來說,如果 Banking-AppDev 團隊使用特定資源,您可以將 team=banking_appdev
等標記附加至該資源,追蹤該團隊在該資源上產生的費用。理想情況下,您應將 100% 的雲端費用分配給支出來源。實務上,您可能會先設定較低的目標,因為建立元資料結構來支援 100% 的費用分配,是一項複雜的工作。
請參考下列建議,制定中繼資料策略,以支援成本分配:
- 有效性:確保代碼有助於找出與業務相關的主要成效指標 (KPI) 和法規要求。這項關聯對於內部退款、法規報告,以及根據業務部門目標調整雲端支出至關重要。舉例來說,下列標記清楚指出支出團隊、所在區域和負責的產品:
team=banking_appdev
、region=emea
、product=frontend
。 - 自動化:如要達到高標記法規遵循程度,請透過自動化功能強制執行標記。手動標記容易出錯且不一致,這在金融服務業環境中是無法接受的,因為可稽核性和財務準確度至關重要。自動標記功能可確保資源在建立時正確分類。
- 簡單易用:評估簡單且不相關的因素。金融服務業環境十分複雜。為確保這類環境中的成本分配規則容易瞭解及執行,規則必須盡可能簡單。避免針對高度特定的極端情況過度設計規則。複雜的規則可能會造成營運團隊的困惑和抗拒。
使用標記定義分配策略後,您需要決定策略的實作精細程度。所需精細程度取決於您的業務需求。舉例來說,有些機構可能需要追蹤產品層級的費用,有些機構可能需要每個成本中心的費用資料,其他機構則可能需要每個環境 (開發、測試和生產) 的費用資料。
如要為貴機構達到適當的成本分配精細程度,請考慮下列做法:
- 使用 Google Cloud 專案階層做為費用分配的自然起點。專案代表 Google Cloud中的政策執行點。根據預設,IAM 權限、安全性政策和費用會歸給專案和資料夾。查看從 Cloud Billing 匯出的費用資料時,您可以一覽資料夾階層,以及與費用資料相關聯的專案。如果您的Google Cloud 資源階層反映貴機構的支出責任結構,這是最簡單的費用分配實作方式。
- 使用標記和標籤可提供更精細的資源定義。可彈性分類帳單匯出內容中的資源。標記和標籤可協助您依應用程式和環境細分費用。
通常您可能需要搭配專案階層結構、標記和標籤,才能有效分配費用。無論選擇哪種費用分配方式,請按照先前所述的最佳化建議,制定完善的中繼資料策略:驗證、自動化和簡化。
推動當責文化,激勵工程師採取行動
雲端 FinOps 團隊負責引導機構重視成本和價值。個別產品團隊和工程團隊必須採取必要行動,才能達到成本最佳化。這些團隊也負責金融服務工作負載的成本行為,並確保工作負載提供必要的業務價值。
請參考下列建議,落實問責制並激勵團隊提高成本效益。
建立集中式 FinOps 團隊,負責管理
雲端 FinOps 做法不會自然而然地成長。專責 FinOps 團隊必須定義並建立 FinOps 做法,方法如下:
- 建構必要的程序、工具和指引。
- 制定、傳達及強制執行必要政策,例如強制標記、預算審查和最佳化程序。
- 鼓勵工程團隊負責控管費用。
- 如果工程團隊未承擔費用責任,請介入處理。
取得高階主管支持和授權
包括技術長、財務長和資訊長在內的高階領導人,必須積極提倡全組織轉向 FinOps 文化。他們的支持至關重要,有助於優先處理成本責任、為 FinOps 計畫分配資源、確保跨職能參與,以及推動 FinOps 需求合規。
鼓勵團隊提高成本效益
工程師和工程團隊可能不會主動專注於成本最佳化。請務必實施下列獎勵措施,讓團隊和個人目標與成本效益保持一致:
- 將成本最佳化節省的部分金額,重新投入到達成最佳化的團隊。
- 公開表揚並慶祝成本最佳化工作和成就。
- 運用遊戲化技巧,獎勵有效節省成本的團隊。
- 將效益指標納入成效目標。
實作成本分攤和交易退單技術
確保團隊清楚掌握自己擁有的雲端資源和費用。將財務責任指派給團隊中適當的個人。使用正式機制強制執行嚴格的標記作業,並實作透明的規則來分配共用費用。
著重於價值和 TCO,而非成本
評估雲端解決方案時,請考量長期總持有成本 (TCO)。舉例來說,為應用程式自行代管資料庫,可能比使用 Cloud SQL 等代管資料庫服務便宜。不過,如要評估長期價值和總擁有成本,您必須考量與自行代管資料庫相關的隱藏成本。這類成本包括專門用於修補、擴充、強化安全性和災難復原的工程工作,這些都是 FSI 工作負載的重要需求。代管服務可提供顯著更高的長期價值,抵銷基礎架構成本。代管服務提供強大的法規遵循功能、內建可靠性功能,並有助於減少營運負擔。
請參考下列建議,著重於價值和總持有成本。
使用產品專屬的技術和工具,最佳化資源
善用產品提供的成本最佳化工具和功能,例如: Google Cloud
- Compute Engine: 自動調整規模、 自訂機器類型、 和 現成 VM
- GKE:叢集自動配置器和節點自動佈建
- Cloud Storage:物件生命週期管理和自動調整級別
- BigQuery: 以容量為準的價格和 成本最佳化技術
- Google Cloud VMware Engine:承諾使用折扣 (CUD)、最佳化儲存空間和其他成本最佳化策略
可享折扣優惠
請使用 Google 提供的折扣,盡可能降低雲端資源的計費費率。個別產品和工程團隊通常會負責管理資源最佳化作業。中央 FinOps 團隊負責最佳化帳單費率,因為他們掌握整個機構的資源需求。因此可以彙整需求,盡量爭取承諾用量折扣。
您可以享有下列類型的Google Cloud 資源折扣:
- 企業折扣是根據貴機構在 Google Cloud 以較低的帳單費率承諾的最低總支出金額,所協商的折扣。
- 依資源計算的 CUD:只要承諾在一年或三年內使用一定數量的 Compute Engine 資源,即可獲得這類 CUD。依資源計算的 CUD 適用於特定專案和區域中的資源。如要在多個專案之間共用承諾使用折扣,請啟用折扣共用。
- 依支出計算的 CUD:只要承諾在一年或三年內,為特定產品支出達到特定金額,即可獲得這類 CUD。依支出計算的折扣適用於帳單帳戶層級。折扣適用於特定區域或全球,視產品而定。
除了企業折扣外,您還可使用 CUD,進一步節省費用。
除了承諾使用折扣,您也可以採取下列方法降低帳單費率:
- 使用Spot VM 處理容錯和彈性工作負載。Spot VM 比一般 VM 便宜 80% 以上。
- BigQuery 提供多種計費模式,包括以量計價和版本計價,後者會根據承諾和自動調度資源需求計費。如果您使用大量 BigQuery 資源,請選擇適當版本,以降低分析工作負載的每項時段費用。
- 請仔細評估您需要使用的服務適用的區域 Google Cloud 。選擇符合成本目標的區域,並考量延遲時間和法規遵循需求等因素。如要瞭解成本、永續性和延遲之間的取捨,請使用Google Cloud 區域挑選器。