管理空值

一般而言,空值是一種表示沒有內容的定義。雖然存在用於包含值的容器 (例如資料列-資料欄組合或變數),但該容器並沒有表示任何實際值。

空值的重要注意事項

附註:空值在平台中為標示遺漏值的種類子集。然而,基於技術上的原因,Cloud Dataprep by TRIFACTA® 會將空值顯示為遺漏值,並在視覺上以相同方式表現兩者。但系統內部會將它們解讀為不同的值。

注意事項:

  • 空值在視覺上以遺漏值表示。
    • 在資料品質長條圖中,空值和遺漏值均以黑色長條 (遺漏值) 表示。
  • 在運算時,它們是不同類型的值。
    • 大部分套用空值和遺漏值的函式均會傳回相同的結果。
      • 例如,ISMISSING 函式均會針對空值和遺漏值傳回 true
      • 然而,ISNULL 函式會針對空值傳回 true,並針對遺漏值傳回 false。請見以下說明。
    • 如果您使用函式產生空值,雖然系統記錄為空值,但畫面上會顯示為遺漏值。
      • 例如,下列轉換指令會產生帶有空值的資料欄,但在資料品質長條圖中會以遺漏值表示。

        轉換名稱 New formula
        參數:公式 NULL()
        參數:新資料欄名稱 nulls
  • 產生一組結果時,除非輸出格式具有相關聯的特定結構定義,否則空值和遺漏值均會寫為遺漏值。

尋找空值

空值會在資料品質長條圖的「遺漏值」種類中顯示為遺漏值 (黑色長條)。

您可以透過下列轉換來區別空值和遺漏值。這個轉換指令會產生新資料欄,如果 isActive 中的值是空值,則新資料欄的值會設為 true

轉換名稱 New formula
參數:公式 ISNULL(isActive)
參數:新資料欄名稱 nulls2

空值百分比過高

匯入時,如果資料欄空值所佔的百分比達到一定程度,平台可能會將資料欄的類型重設為 String 資料欄。除了匯入空值時產生的遺漏值外,也可能會因此而產生不相符值。

修正空值

請參閱尋找遺失資料一文。

轉換時的空值

函式:

  • 將空值作為純量函式的輸入值,將傳回及傳播空值。
  • 在匯總或窗型函式中,已忽略空值,因為一個空值可能會損毀整個資料欄的計算。

轉換:

  • 在彙整中,某資料集中的空值永遠不會與另一個資料集的空值相配,在彙整鍵資料欄中,含有空值的資料列永遠不會併入輸出中。請參閱彙整類型一文。

寫入空值

必要時,您可以將空值寫入一組資料中。以下範例使用 NULL 函式,將資料欄中的所有遺漏值取代為空值。

附註:NULL 函式通常是用來將空值傳送至專門處理空值的函式。

以下範例會測試介於 column1column255 之間的所有資料欄,偵測是否有遺漏值。如果有,則會寫入空值。如果沒有,則將資料欄的值寫回至資料欄:

轉換名稱 Edit column with formula
參數:資料欄 column1~column255
參數:公式 IF(ISMISSING([$col]), null(), $col)

上述的轉換會寫入空值,但這些值在匯出時會轉換成遺漏值。

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁