資料欄直方圖

每個資料欄頂端都有稱為直方圖的長條圖,可讓您瞭解該資料欄中資料的特性。資料欄直方圖會顯示資料欄中各個偵測值的計數 (適用於字串資料) 或特定數字範圍內的值計數 (適用於數字資料)。

您可以使用這個直方圖找出應移除或修正的異常值或離群值。

注意:資料欄直方圖中的計數只會反映資料格線中樣本的資料。整個資料集的計數可能有所不同。

圖:資料欄直方圖

提示:如果您調整資料欄的寬度,資料欄直方圖中顯示的長條數量也會隨之改變。您可以使用這項動態大小調整功能變更直方圖中資料的精細程度。

資料欄直方圖的內容會因資料欄的資料類型而有所不同,例如:

  • 如果是數字類型 (整數或小數類型),每個長條會涵蓋特定範圍的值,並依數字順序排列。
    • 如果某個數字範圍長條的值與其他長條的值重疊,則該長條會包含範圍下界的值,而不包含範圍上界的值。舉例來說,如果某個直方圖長條代表介於 0 到 10 之間的值,則會包含 0 的例項計數,而不包含 10 的例項計數。10 的例項計數會包含在直方圖內相鄰的長條中。
    • 只有在不同資料範圍的值重疊時,才會發生上述情況。如果沒有重疊的值,則資料範圍會包含下界和上界的值。
  • 如果是非數字 (即「類別」) 類型,每個垂直長條分別會涵蓋一個值,並依值出現頻率最高到最低的順序排列。

提示:只要將游標移到直方圖中的長條上,即可查看特定值、該值的計數,以及該值在資料欄中的值總數中所佔的百分比。

選取值後會發生下列情形:

  • 針對所選長條所代表的值,系統會醒目顯示包含這些值的資料列,並顯示建議資訊卡,供您處理這些值。
  • 其他資料欄中的長條可能會部分變色。這項功能稱為「刷選與連結」,可呈現出其他資料欄中與所選值對應的長條值部分。「刷選與連結」很適合用來找出資料中的關聯。
如何選取值:
  • 使用 CTRL 鍵並點選可選取多個不同的值。
  • 按住並拖曳可選取特定範圍的值。
本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁