轉換

注意:轉換屬於基礎程式語言的一部分,使用者無法直接存取。本篇文章的內容僅供參考。

在 Wrangle 中,轉換是在您的資料集中套用的動作。您的方案的每個步驟都對應著一個完整指定的轉換。

提示:若要按類別查看轉換,請在線上說明文件中點選「類別」標題的排序按鈕。

轉換指令類別說明
Case 轉換其他對資料集中的資料列執行 if/then/else 或 case 邏輯。
Comment 轉換其他插入非函式留言做為方案步驟。
Countpattern 轉換搜尋與取代計算資料欄中指定模式的例項數,並將該值寫入新產生的資料欄。來源資料欄不變。
Deduplicate 轉換管理列從資料集中移除確切的重複資料列。系統會以精確的方式比對各個值,藉此找出重複的資料列。舉例來說,如果兩個字串的大小寫不同,則不相符。
Delete 轉換管理列依據 row 運算式中指定的條件,刪除資料集中的一組資料列。如果條件運算式的結果為 true,則會刪除資料列。
Derive 轉換管理欄產生新資料欄,其中的值為 value 運算式的輸出內容。運算式可依據 group 參數的指定值進行計算。您可視需要為輸出資料欄命名。
Drop 轉換管理欄將指定欄或多個資料欄從資料集中永久移除。
Extract 轉換搜尋與取代依據指定的字串或模式,從資料欄中擷取資料子集,然後插入新資料欄。來源資料欄維持未修改狀態。
Extractkv 轉換搜尋與取代

從來源資料欄擷取鍵/值組合,然後將它們寫入新的資料欄。來源資料欄的類型必須是「字串」,雖然資料可以格式化為為其他資料類型。

Extractlist 轉換搜尋與取代根據任何資料類型的來源資料欄指定格式,擷取一組值。產生的資料欄會包含指定模式發生情況的陣列。雖然新資料欄包含陣列資料,但系統有時會將新資料欄的資料類型推測為字串。
Filter 轉換管理列依據定義的篩選器類型,在資料集中刪除或保留資料列。
Flatten 轉換巢狀資料為每個值將陣列資料拆分至不同的資料列。
Header 轉換初始剖析使用資料集中的一個資料列做為資料表的標頭列。這一列中的每個值都會變成所在資料欄的名稱。
Keep 轉換管理列保留資料集中的一組資料列,這些資料列是由 row 運算式中的條件式所指定。系統會移除資料集中的所有其他資料列。
Merge 轉換管理欄合併資料集中的兩個或多個資料欄,以建立字串類型的新資料欄。您可以選擇在合併的值之間插入分隔符號。
Move 轉換管理欄在資料集中,將一或多個指定的資料欄移至另一資料欄之前或之後。
Nest 轉換巢狀資料使用資料欄名稱及其值做為一或多個資料欄的鍵/值組合,以建立值的物件或陣列。產生的資料欄類型是由 into 參數決定。
Pivot 轉換巢狀資料

pivot 轉換可用來將資料匯總或轉移到資料欄中,並匯總其結果。將資料集重塑為匯總資訊。

匯總資料時,將對資料欄的值執行計算,然後根據指定的參數進行分組和排序。

當您透視資料時,所選資料欄中的值將成為資料集中的新資料欄,每個資料欄都包含您指定的摘要計算。此計算可根據資料集中總計的所有資料列,或是根據您在轉換中定義的資料列群組進行。

Rename 轉換管理欄以指定名稱重新命名一或多個資料欄,或將指定值置於資料欄名稱前。
Replace 轉換搜尋與取代依照轉換中的指定內容,根據儲存格資料值中的字串常值、模式或是位置替換一或多個指定資料欄中的值。
Set 轉換搜尋與取代將指定資料欄中的所有值替換成指定值,指定值可以是常值或運算式。您可以指定一個包含條件測試的選用 row: 參數,該測試用來識別資料列,其中的替代值是在資料欄中產生。
Settype 轉換管理欄設定指定資料欄的資料類型。這個轉換不會修改來源值。系統會依據指定資料類型重新推測資料欄的資料,資料欄剖析結果會隨推測作業而改變。
Split 轉換初始剖析依據轉換指令中的分隔符號將特定欄位分割為不同的資料欄。您可以透過如下所述的幾個方法指定分隔符號。
Splitrows 轉換初始剖析依據您指定的分隔符號將資料值欄位分割為不同的資料列。不過請注意,只有包含字串常值的資料列才能分割,這項指令無法分割模式資料列。
Unnest 轉換巢狀資料

在來源資料中,依據索引鍵拆分來自陣列或物件欄的巢狀資料,以便建立新資料列或欄。這種轉換在陣列或物件類型的資料欄上的運作方式不同。

Unpivot 轉換巢狀資料將一或多個資料欄合併至索引鍵和值資料欄,將資料重新塑形。索引鍵是輸入資料欄的名稱,而值資料欄是來源中的儲存格值。資料列可以重複,一列代表一個輸入資料欄。
Valuestocols 轉換管理欄針對資料欄中的每個不重複值,系統會建立不同的資料欄。對於來源資料欄中包含值的每個資料列,系統會在新資料欄中插入指標值。這個值可以是常值或是函式的輸出。如未產生指標值,則會寫入空值。
Window 轉換匯總window 轉換可讓您依據現行資料列相關資料的累計範圍,執行加總和計算。舉例來說,您可以計算指定資料欄的現行資料列和前九列的累計平均值。此轉換步驟特別適合用於處理時間或序列資料。

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁