LEN 函式

傳回指定字串的字元數。字串值可以是資料欄參照或字串常值。

基本用法

資料欄參照範例:

derive type:single value:LEN(MyName)

輸出:MyName 資料欄值所含的字元數寫入新的資料欄。

字串常值範例:

derive type:single value:LEN('Hello, World')

輸出:在新資料欄中寫入 12 這個值。

語法

derive type:single value:LEN(column_string)

引數是否必要?資料類型說明
column_string字串要套用於函式的資料欄名稱或字串常值

如要進一步瞭解語法標準,請參閱語言文件語法附註

column_string

待搜尋的資料欄名稱或字串常數。

  • 如果系統找不到字串或資料欄值,則產生的結果也會遺漏該值。
  • 字串常數必須以引號括住 ('Hello, World')。
  • 不支援多個資料欄和萬用字元。

使用須知:

是否必要?資料類型示例值
字串常值或資料欄參照myColumn

範例

範例 - 固定長度字串

來源:

產品 ID 符合您要在方案中驗證的特定結構。在以下範例資料中,productId 資料欄值的長度應為 6

您會發現範例中有一個資料欄已經含有 ProductName 資料欄的驗證錯誤數。系統應該會在新的資料欄標示出 ProductId 資料欄中長度不是 6 的值。然後,您可以將這兩個資料欄合併在一起以建立 ValidationError 資料欄。

ProductNameProductIdErrProductName
Chocolate Bunnie123456Error-ProductName
Chocolate Squirl88442286Error-ProductName
Chocolate Gopher12345

轉換:

若要驗證 ProductId 中值的長度,請輸入下列轉換指令。請注意,as 參數可讓您在轉換指令執行過程中重新命名資料欄。

derive type:single value: IF(LEN(ProductId) <> 6, 'Error-length-ProductId','') '' as: 'ErrProductIdLength'

資料集現在應如下所示:

ProductNameProductIdErrProductNameErrProductIdLength
Chocolate Bunnie123456Error-ProductName
Chocolate Squirrel88442286Error-ProductNameError-length-ProductId
Chocolate Gopher12345 Error-length-ProductId

您可以使用下列 merge 轉換指令,將兩個錯誤資料欄合併成一個 DataValidationErrors 錯誤資料欄。請再次注意 as 參數的用法:

merge col:ErrProductName,ErrProductIdlength with:' ' as:'DataValidationErrors'

若要清理資料,您可以執行下列指令,以刪除 DataValidationErrors 資料欄中的空格字元,然後移除兩個個別的錯誤資料欄:

set col:DataValidationErrors value:TRIM(DataValidationErrors)

drop col:ErrProductName

drop col:ErrProductIdLength

結果:

最終的資料集應如下所示:

ProductNameProductIdDataValidationErrors
Chocolate Bunnie123456Error-ProductName
Chocolate Squirrel88442286Error-ProductName Error-length-ProductId
Chocolate Gopher12345Error-length-ProductId

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁