新增查詢資料

其他來源的資料能整合到現行資料集中。根據您在查詢資料集中所指定的索引鍵欄位,您可以插入查詢資料集其他資料欄中的對應值,做為來源資料集中的新資料欄。

提示:根據資料欄的值新增參照資料時,資料欄查詢便相當實用。

例如,您的資料含有代表美國各州的雙字母縮寫,但目標系統期望的卻是每一州的完整名稱。在這種情況下,您必須使用各州的完整名稱取代每一列的 XY 州名縮寫。

設定查詢資料

您的資料表應該如下所示:

State-2LetterState
ALAlabama
AKAlaska
AZArizona
ARArkansas
CACalifornia
COColorado
CTConnecticut
DEDelaware
DCDistrict of Columbia
FLFlorida
GAGeorgia
HIHawaii
IDIdaho
ILIllinois
INIndiana
IAIowa
KSKansas
KYKentucky
LALouisiana
MEMaine
MDMaryland
MAMassachusetts
MIMichigan
MNMinnesota
MSMississippi
MOMissouri
MTMontana
NENebraska
NVNevada
NHNew Hampshire
NJNew Jersey
NMNew Mexico
NYNew York
NCNorth Carolina
NDNorth Dakota
OHOhio
OKOklahoma
OROregon
PAPennsylvania
RIRhode Island
SCSouth Carolina
SDSouth Dakota
TNTennessee
TXTexas
UTUtah
VTVermont
VAVirginia
WAWashington
WVWest Virginia
WIWisconsin
WYWyoming

此資料表必須做為新資料集上傳,詳情請參閱匯入資料頁面

執行查詢

步驟:

  1. 前往轉換頁面,在含有雙字母州名縮寫的資料欄上,點選下拉式選單並選取 [查詢...]
  2. 在「查詢精靈」中,選取要用於查詢的資料集。
  3. 針對查詢索引鍵,請選取資料集中的資料欄以做為鍵值。在上述的範例中,此資料欄為 State_2Letter
  4. 按一下 [執行查詢]
  5. 系統會使用此查詢鍵值在參照資料集中尋找所有其他資料欄值。這些值會直接插入來源資料欄右側的個別資料欄中。
  6. 您可能需要刪除部分已匯入的資料欄。在上述範例中,由於雙字母的州 ID 資料欄已由完整的州名取代,您可能會決定刪除該資料欄。

請參閱查詢精靈

範例 - 查詢時區

上方連結的 CSV 也包含各州的時區資訊,可以用來提供更精確的時間戳記資訊。

美國時區並非都按州界線劃分。有些州會分成多個時區。如需更精確地呈現時區,您應下載並使用郵遞區號資料集,網路上有提供許多免費版本。這個 CSV 僅供示範使用。

在此範例中,您使用的資料集含有時間戳記,且時間戳記是按事件或交易發生的位置儲存在不同時區中。然而,時間戳記並沒有包含任何時區資訊。

您可以使用外部的時區資訊來源,將時區插入您的資料集。在下列範例中,時區是依照美國州名的雙字母縮寫所衍生,更精確的表示方法是按郵遞區號資料顯示。

步驟:

  1. 完成上一節中的步驟 1-5。
  2. 刪除所有資料欄,但含有時區資訊的資料欄除外。Time Offsets 資料欄會將各州的主要時區識別為 UTC 時區 (格林威治標準時間) 的偏移量。
  3. 將此資料欄移至時間戳記所在資料欄的右側。

注意:視目標系統的需求而定,您可以使用 split 轉換來拆解資料欄資料,只留下數字偏移量 (例如 -6:00)。然後,您可以使用 DATEDIF 函式將時區偏移量套用至時間戳記。您可以透過此方式先將時間戳記轉換為來源時區,然後再提供給目標系統使用。

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁