生成式 AI 資訊摘要

本文說明 BigQuery ML 支援的生成式人工智慧 (AI) 功能。您可以使用預先訓練的 Vertex AI 模型和內建的 BigQuery ML 模型,在 BigQuery ML 中執行 AI 工作。

支援的任務包括:

如要存取 Vertex AI 模型來執行上述其中一項函式,請在 BigQuery ML 中建立遠端模型,代表 Vertex AI 模型的端點。針對要使用的 Vertex AI 模型建立遠端模型後,只要對遠端模型執行 BigQuery ML 函式,即可存取該模型的功能。

您可以使用這種方法,在 SQL 查詢中運用這些 Vertex AI 模型的功能,分析 BigQuery 資料。

工作流程

您可以搭配使用 Vertex AI 模型上的遠端模型 和 Cloud AI 服務上的遠端模型 與 BigQuery ML 函式,完成複雜的資料分析和生成式 AI 工作。

下圖顯示一些常見工作流程,您可能會一起使用這些功能:

這張圖顯示使用 Vertex AI 模型或 Cloud AI 服務的遠端模型常見工作流程。

生成文字

文字生成是生成式 AI 的一種形式,可根據提示或資料分析結果生成文字。您可以使用文字和多模態資料生成文字。

以下是文字生成的一些常見用途:

  • 生成創意內容。
  • 正在生成程式碼。
  • 生成即時通訊或電子郵件回覆。
  • 腦力激盪,例如建議未來產品或服務的發展方向。
  • 個人化內容,例如產品建議。
  • 為內容套用一或多個標籤,將資料分類。
  • 找出內容中表達的主要情緒。
  • 歸納內容傳達的主要想法或印象。
  • 識別文字或視覺資料中的一或多個顯著實體。
  • 將文字或音訊資料的內容翻譯成其他語言。
  • 根據音訊資料中的口語內容生成文字。
  • 為圖像資料加上說明文字或進行問答。

文字生成後,通常會進行資料擴充,也就是結合其他資料,擴充初始分析的洞察資料。舉例來說,您可以分析居家擺設的圖片,為 design_type 欄生成文字,讓擺設 SKU 具有相關聯的說明,例如 mid-century modernfarmhouse

支援的模型

如要執行生成式 AI 工作,您可以在 BigQuery ML 中使用遠端模型,參照部署至或託管於 Vertex AI 的模型。您可以建立下列類型的遠端模型

使用文字生成模型

建立遠端模型後,您可以使用 ML.GENERATE_TEXT 函式與該模型互動:

  • 如果是以 Gemini 模型為基礎的遠端模型,您可以執行下列操作:

    • 使用 ML.GENERATE_TEXT 函式,根據您在查詢中指定的提示或從標準資料表欄位擷取的提示,生成文字。在查詢中指定提示時,您可以在提示中參照下列類型的資料表欄:

    • 使用 ML.GENERATE_TEXT 函式分析物件表格中的文字、圖片、音訊、影片或 PDF 內容,並以您提供的提示做為函式引數。

  • 如果是其他類型的遠端模型,您可以使用 ML.GENERATE_TEXT 函式,並在查詢中或標準資料表的資料欄中提供提示。

如要在 BigQuery ML 中試用文字生成功能,請參閱下列主題:

基礎和安全屬性

使用 ML.GENERATE_TEXT 函式搭配 Gemini 模型時,您可以運用基礎安全屬性,前提是您使用標準表格做為輸入內容。有了基礎功能,Gemini 模型就能使用網路上其他資訊,生成更具體且符合事實的回覆。Gemini 模型可根據您指定的屬性,透過安全屬性篩選回覆。

監督式調整

建立參照下列任一模型的遠端模型時,您可以選擇同時設定監督式微調

  • gemini-2.0-flash-001
  • gemini-2.0-flash-lite-001
  • gemini-1.5-pro-002
  • gemini-1.5-flash-002

所有推論作業都會在 Vertex AI 中進行。結果會儲存在 BigQuery 中。

Vertex AI 佈建處理量

對於支援的 Gemini 模型,您可以搭配使用 Vertex AI 佈建處理量ML.GENERATE_TEXT 函式,為要求提供一致的高處理量。詳情請參閱「使用透過 Vertex AI 佈建的輸送量」。

產生結構化資料

生成結構化資料與生成文字非常相似,但您可以指定 SQL 結構定義,進一步設定模型回覆的格式。

如要生成結構化資料,請透過正式推出搶先體驗的 Gemini 模型建立遠端模型。然後使用 AI.GENERATE_TABLE 函式與該模型互動。如要試著建立結構化資料,請參閱使用 AI.GENERATE_TABLE 函式產生結構化資料

使用 AI.GENERATE_TABLE 函式時,您可以指定安全屬性,藉此篩選模型的回覆。

依資料列產生特定類型的值

您可以使用 Gemini 模型搭配純量生成式 AI 函式,分析 BigQuery 標準資料表中的資料。資料包括文字資料,以及含有 ObjectRef 值的資料欄中的非結構化資料。這些函式會為資料表中的每一列產生包含特定類型的輸出內容。

可用的 AI 函式如下:

搭配支援的 Gemini 模型使用 AI.GENERATE 函式時,可以透過 Vertex AI 佈建處理量,為要求提供一致的高處理量。詳情請參閱「使用透過 Vertex AI 佈建的輸送量」。

生成嵌入項目

嵌入是高維度數值向量,代表特定實體,例如一段文字或音訊檔案。生成嵌入內容可擷取資料的語意,方便您推論及比較資料。

以下是生成嵌入內容的一些常見用途:

  • 使用檢索增強生成 (RAG) 技術,從可信來源參照額外資料,增強模型對使用者查詢的回覆。RAG 可提供更準確的事實和一致的回覆,還能存取比模型訓練資料更新的資料。
  • 執行多模態搜尋。例如,使用文字輸入搜尋圖片。
  • 執行語意搜尋,找出類似項目,用於推薦、替代和記錄重複資料刪除。
  • 建立嵌入,以便搭配 k-means 模型進行分群。

支援的模型

支援的機型如下:

  • 如要建立文字嵌入,可以使用 Vertex AI text-embeddingtext-multilingual-embedding 模型。
  • 如要建立多模態嵌入,將文字、圖片和影片嵌入至相同語意空間,可以使用 Vertex AI multimodalembedding 模型。
  • 如要為結構化獨立且相同分布 (IID) 隨機變數資料建立嵌入內容,可以使用 BigQuery ML 主成分分析 (PCA) 模型或自動編碼器模型。
  • 如要為使用者或項目資料建立嵌入,可以使用 BigQuery ML 矩陣因式分解模型。

如要使用較小型的輕量文字嵌入,請嘗試使用預先訓練的 TensorFlow 模型,例如 NNLM、SWIVEL 或 BERT。

使用嵌入生成模型

建立模型後,您可以使用 ML.GENERATE_EMBEDDING 函式與模型互動。對於所有類型的支援模型,ML.GENERATE_EMBEDDING 都會使用標準資料表中的結構化資料。如果是多模態嵌入模型,ML.GENERATE_EMBEDDING 也適用於標準資料表中包含 ObjectRef 值的資料欄,或是物件資料表中的視覺內容。

如果是遠端模型,所有推論作業都會在 Vertex AI 中進行。如果是其他模型類型,所有推論作業都會在 BigQuery 中進行。結果會儲存在 BigQuery 中。

如要在 BigQuery ML 中試用文字生成功能,請參閱下列主題:

預測

預測是一種技術,可讓您分析歷來時間序列資料,然後據以預測未來趨勢。您可以使用 BigQuery ML 的內建 TimesFM 時間序列模型 (預覽版) 執行預測,不必自行建立模型。內建的 TimesFM 模型會搭配 AI.FORECAST 函式,根據您的資料產生預測。

位置

文字生成和嵌入模型支援的位置會因您使用的模型類型和版本而異。詳情請參閱「位置」。與其他生成式 AI 模型不同,位置支援不適用於內建的 TimesFM 時間序列模型。所有 BigQuery 支援的區域都提供 TimesFM 模型。

定價

系統會根據您用來對模型執行查詢的運算資源向您收費。遠端模型會呼叫 Vertex AI 模型,因此對遠端模型發出的查詢也會產生 Vertex AI 費用。

詳情請參閱 BigQuery ML 定價

後續步驟