查詢精靈

您可以從資料集裡的一組值查詢另一個資料集裡的另一組值。查詢會對選取資料欄中的每個值與目標資料集裡選取資料欄中的值進行比較。當找到相符項目時,就會在執行查詢的來源資料集裡建立新的資料欄,並在其中插入目標資料集裡其他資料欄的值。

例如,您的企業打算變更所有產品名稱。無需執行一組複雜的取代轉換指令,您可以直接從 productName 資料欄裡查詢由兩個資料欄組成的資料集,該資料集的兩個資料欄分別含有原始名稱和新名稱。透過查詢在來源資料集裡插入新名稱時,您可以刪除來源資料欄並使用新名稱繼續轉換資料。

  • 您不能對物件或陣列資料類型的資料欄執行查詢。
  • 查詢基本上會對第一個資料集和第二個資料集執行左聯結。但查詢在定義和編輯資料集方面,比較沒有彈性。

    注意:如果資料欄值重複,則產生的資料集規模會比原始資料集大許多。

以下範例是這個工作流程的最佳示範。在此案例中,您的原始銷售資料會以內部數字 ID 來記錄產品資訊。為了進行分析,您可以依據內部 ID 來整合產品主要資料,這樣您的資料集就可以含有產品說明及其他有用資訊。

若要執行查詢,請選取資料欄標題旁的脫字符號,然後選取 [查詢...]

查詢精靈 - 步驟 1

在第一個步驟中,請選取要執行查詢的資料集,以便找出與 Item_Nbr 資料欄相符的資料。在此範例中,選取產品資料集,因為其中含有已辨識完成的產品清單。

提示:您可以搜尋可用的流程和資料集。搜尋流程時,系統會比對該流程中所有的資料集。

圖:查詢精靈 - 步驟 1

查詢精靈 - 步驟 2

選取要執行查詢的資料集後,請選取目標資料集裡的欄位作為查詢鍵。查詢鍵會提供一組 ID,您可以試著在來源資料欄中查詢每一個值以找出符合該組 ID 的值。在此案例中,查詢鍵資料欄的名稱與來源資料欄相同:ITEM_NBR

圖:查詢精靈 - 步驟 2

資料欄清除

執行查詢時,若來源 item_nbr 資料欄中的每一個值都能在目標資料集的 ITEM_NBR 資料欄中找到,則第二個資料集裡對應資料列的所有其他的資料欄就會以獨立的資料欄插入第一個資料集裡。這些資料欄會插入用於查詢的資料欄的正右方:

圖:查詢精靈 - 結果

注意:如果第二個資料集中含有多個與第一個資料集中個別查詢鍵值相符的項目,第一個資料集的資料列會在結果裡重複出現。

注意:您可能需要刪除一些已匯入資料集的資料欄。

自動更新查詢

將查詢加入方案之後,該參照資料的後續變更也會自動反映在資料集裡。

提示:如果您必須凍結用於查詢的資料集資料,則應以快照建立資料集的複本。請參閱資料集詳細資料頁面一文。

若要使用複本,請刪除查詢,然後使用複製的版本重新建立查詢。請參閱修正相依性問題

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁