範例 - Quote 參數

此範例說明如何在 split 轉換指令中使用 quote 參數,以更精細的方式分割資料欄。

來源:

在這個範例中,系統會將以下含有聯絡資訊的 CSV 資料匯入應用程式:

LastName,FirstName,Role,Company,Address,Status
Wagner,Melody,VP of Engineering,Example.com,"123 Main Street, Oakland, CA 94601",Prospect
Gruber,Hans,"Director, IT",Example.com,"456 Broadway, Burlingame, CA, 94401",Customer
Franks,Mandy,"Sr. Manager, Analytics",Tricorp,"789 Market Street, San Francisco, CA, 94105",Customer

轉換:

將這筆資料擷取至應用程式時,系統會自動執行幾項初始剖析作業:

column2column3column4column5column6column7
LastNameFirstNameRoleCompanyAddressStatus
WagnerMelodyVP of EngineeringExample.com"123 Main Street, Oakland, CA 94601"Prospect
GruberHans"Director, IT"Example.com"456 Broadway, Burlingame, CA, 94401"Customer
FranksMandy"Sr. Manager, Analytics"Tricorp"789 Market Street, San Francisco, CA, 94105"Customer

開啟「方案」面板時,您應該會看見下列轉換指令:

splitrows col: column1 on: '\r' quote: '"'

split col: column1 on: ',' limit: 5 quote: '"'

第一個轉換指令會依據回車字元 (\r) 將原始來源資料分割為不同的資料列,同時忽略雙引號字元之間的所有資料值。請注意必須將這個值逸出。但雙引號字元不需要逸出。雖然實際資料中沒有任何回車字元,不過應用程式不僅辨識出這些雙引號指定了多個單一資料值,也同時新增了 quote 值。

第二個轉換指令則會將每個資料列分割為不同的欄位。由於這是以逗號分隔的資料,應用程式可識別出這個值為資料欄分隔符號,因此系統會將 on 值設為逗號字元 (,)。在這個範例中,由於 column4column6 的資料值中都有逗號,因此您必須加上引號,以便進行後續的清理作業。

如要完成資料集清理作業,請將第一個資料列抬升為資料欄標頭:

header

您現在即可移除引號。不過請注意,下列指令會套用到兩個資料欄:

replace col: Role, Address with: '' on: `"` global: true

您現在即可分割 Address 資料欄。您可以醒目提示資料欄內的其中一個逗號和其後方的空格,但請確保最終陳述式會如下所示:

split col: Address on: ', ' limit: 2

您應該會發現,系統產生的 Address3 資料欄含有多餘的內容:

Address3
CA 94601
CA, 94401
CA, 94105

請使用下列指令來移除逗號。在這個範例中,您必須保留資料欄中兩個值之間的空格,因此 on 值只能包含一個逗號。在下列指令中,width 值為兩個單引號:

replace col: Address3 with: '' on: `,` global: true

您現在可以依據空格分隔符號分割 Address3 資料欄:

split col: Address3 on: `{delim}`

由於資料會定期格式化,因此您可以使用 Cloud Dataprep 模式 {delim}。

結果:

重新命名資料欄名稱之後,您應該會看見下列資訊:

LastNameFirstNameRoleCompanyAddressCityStateZipcodeStatus
WagnerMelodyVP of EngineeringExample.com123 Main StreetOaklandCA94601Prospect
GruberHansDirector, ITExample.com456 BroadwayBurlingameCA94401Customer
FranksMandySr. Manager, AnalyticsTricorp789 Market StreetSan FranciscoCA94105Customer
本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁