資料品質長條

資料格線的資料欄名稱下方會顯示水平長條,可用來辨識資料欄樣本值的資料品質問題。

圖:資料品質長條

可透過各種顏色的長條辨識出符合以下資料品質定義的相對記錄量:

顏色類型說明
綠色有效適用目前所選資料類型的有效值。
紅色不相符

不符合所列資料類型的值。例如若某個資料欄的 Zip 類型包含 MISSING,就會被視為值不相符。

詳情請參閱找出無效資料

黑色遺漏

值為空白或空值。如需詳細資訊,請參閱管理空值

您可以使用資料欄的資料品質長條,建構出可用來處理選取資料的方案步驟。舉例而言,在資料品質長條中按一下一組紅色的值,即會產生一組建議資訊卡,可用來處理資料欄中不相符的值。

提示:直方圖可能也會顯示出在您的值中非必要的變異值。例如,如果資料欄儲存的是緯度資料,也許精確度會過於冗長 (例如 37.76401337.7602237.76)。您可以使用方案步驟將資料四捨五入為更加實用的精準度,如此一來,就能減少資料欄中不重複值的數量,讓資料更易於管理。請參閱 ROUND 函式

詳情請參閱支援的資料類型

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁