Countpattern 轉換

注意:轉換屬於基礎程式語言的一部分,使用者無法直接存取。本篇文章的內容僅供參考。

計算資料欄中指定模式的例項數量,並將該值寫入新產生的資料欄。來源資料欄則不會有任何改變。

基本用法

countpattern col: myCol on: 'honda'

輸出:產生新的資料欄,其中包含在 honda 資料欄的每一列中出現 myCol 字串的例項數量。

參數

countpattern col:column_ref [ignoreCase:true|false] [after:start_point | from: start_point] [before:end_point | to:end_point] [on:'exact_match']

符記是否必要?資料類型說明
countpattern轉換轉換名稱
col字串來源資料欄名稱
ignoreCase布林值如為 true,則比對時不區分大小寫

比對參數:

附註:至少必須加入下列其中一項參數,以指定要計算的模式:afterbeforefromonto

符記是否必要?資料類型說明
after字串待比對模式前的字串文字或模式
before字串待比對模式後的字串常值或模式
from字串識別待比對模式開頭的字串常值或模式
on字串識別待比對模式的字串常值或模式
to字串識別待比對模式結尾的字串常值或模式

如要進一步瞭解語法標準,請參閱語言文件語法附註

col

找出要套用轉換指令的資料欄 您只能指定一個資料欄。

countpattern col: MyCol on: 'MyString'

輸出:計算 MyString 資料欄中 MyCol 這個值的例項數量,並將此值寫入新資料欄。

使用須知:

是否必要?資料類型
字串 (資料欄名稱)

after

countpattern col: MyCol after: 'Important:'

輸出:如果在 MyCol 中,字串 Important: 後面有一個相符值,則計數為 1。如果資料欄中沒有 after 值,則輸出值是 0

待比對值或模式前的模式 ID。您可以使用字串常值、規則運算式或 Cloud Dataprep 模式來定義 after 參數值。

使用須知:

是否必要?資料類型
字串 (字串文字或模式)
  • afterfrom 參數非常類似,不過 from 會包含可用作擷取字串的比對值。
  • after 可以與 toonbefore 搭配使用,請參閱模式子句位置比對

before

待比對值或模式後的模式 ID。您可以使用字串常值、規則運算式或 Cloud Dataprep 模式來定義模式。

countpattern col: MyCol before: '|'

輸出:

  • 如果在 MyCol 資料欄中的直立線字元 (|) 前有一個相符值,且沒有指定其他的模式參數,則計數為 1。如果資料欄中沒有 before 值,則輸出值是 0
  • 如果有指定其他模式參數 (例如 after),則例項的總數量會寫入新資料欄。

使用須知:

是否必要?資料類型
字串或模式
  • beforeto 參數非常類似,不過 to 會包含可作為部分擷取字串的比對值。
  • before 可以與 fromonafter 搭配使用。請參閱模式 Clause Position 比對

from

識別標示待比對值開頭的模式,模式可以是字串常值、Cloud Dataprep 模式或規則運算式。from 值會包含在比對項目中。

countpattern col: MyCol from: 'go:'

輸出:

  • 如果在 MyCol 中,從 go: 開始到儲存格尾端有相符內容,且沒有指定其他的模式參數,則計數為 1。如果資料欄中沒有 go:,則輸出值為空白。
  • 如果有指定其他模式參數 (例如 to),則例項的總數量會寫入新資料欄。

使用須知:

是否必要?資料類型
字串或模式
  • afterfrom 參數非常類似,不過 from 會包含可作為部分擷取字串的比對值。
  • from 可以與 tobefore 搭配使用。請參閱模式 Clause Position 比對

on

識別待比對的模式。模式可以是字串常值、Cloud Dataprep 模式或規則運算式模式。

countpattern col: MyCol on: `###ERROR`

提示:您可以使用 /\uHHHH/ 格式的規則運算式,插入這項參數值的 Unicode 對應字元。舉例來說,/\u0013/ 代表 Unicode 字元 0013 (回車字元)。詳情請參閱系統支援的特殊規則運算式字元

使用須知:

是否必要?資料類型

字串 (文字、規則運算式或 Cloud Dataprep 模式)

to

識別標示待比對值結尾的模式,模式可以是字串常值、Cloud Dataprep 模式或規則運算式。提醒您,to 值會包含在比對項目中。

countpattern col:MyCol from:'note:' to: `/`

輸出:

  • 計算 MyCol 資料欄中從 note: 開始一直到反斜線字元的所有值的例項數量。
  • 如果沒有指定第二個模式參數,則此值為 01

使用須知:

是否必要?資料類型
字串或模式
  • beforeto 參數非常類似,不過 to 會包含可作為部分擷取字串的比對值。
  • to 可以與 fromafter 搭配使用。請參閱模式子句位置比對

ignoreCase

指出比對項目是否應忽略大小寫。

  • 設為 true 表示不區分大小寫。
  • (預設) 設為 false 表示必須區分大小寫。

countpattern col: MyCol on: 'My String' ignoreCase: true

輸出:如果下列值出現在 MyCol 資料欄中,則計算這些值的例項數量:My Stringmy stringMy string 等。

使用須知:

是否必要?資料類型
布林值

範例

範例 - 計算推文中的模式數

來源:

下面的資料集含有應用程式「Myco ExampleApp」發佈後不久的虛構推文訊息。

DatetwitterIdisEmployeetweet
11/5/15lawrencetlu38141FALSEJust downloaded Myco ExampleApp! Transforming data in 5 mins!
11/5/15petramktng024TRUETry Myco ExampleApp, our new free data wrangling app! See www.example.com.
11/5/15joetri221TRUEProud to announce the release of Myco ExampleApp, the free version of our enterprise product. Check it out at www.example.com.
11/5/15datadaemon994FALSEGreat start with Myco ExampleApp. Super easy to use, and actually fun.
11/5/1599redballoons99FALSELiking this new ExampleApp! Good job, guys!
11/5/15bigdatadan7182FALSE@support, how can I find example datasets for use with your product?

分析報告中包含兩個部分:

  • 針對非員工,您想知道他們是否提到新產品的名稱。
  • 針對員工,您想知道他們是否在推文中加入了網站的交叉參照。

轉換:

下列指令會計算 tweet 資料欄中 ExampleApp 字串的出現次數。請注意如何使用 ignoreCase 參數分辨大寫字體差異:

countpattern col:tweet on:'ExampleApp' ignoreCase:true

針對非員工,您想要追蹤他們是否在推文中提到產品:

derive type:single value:IF(isEmployee=='FALSE' && countpattern_tweet=='1',true,false) as:'nonEmployeeExampleAppMentions'

以下指令計算非員工推文中,example.com 的出現次數:

countpattern col:tweet on:'example.com' ignoreCase:true

針對員工,您想要追蹤他們是否在推文中加入上述的交叉參照:

derive type:single value:IF(isEmployee=='TRUE' && countpattern_tweet1 == 1, true, false) as:'employeeWebsiteCrossRefs'

結果:

將顯示計數的兩個資料欄刪除後,會得出以下結果:

DatetwitterIdisEmployeetweetemployeeWebsiteCrossRefsnonEmployeeExampleAppMentions
11/5/15lawrencetlu38141FALSEJust downloaded Myco ExampleApp! Transforming data in 5 mins!falsetrue
11/5/15petramktng024TRUETry Myco ExampleApp, our new free data wrangling app! See www.example.com.truefalse
11/5/15joetri221TRUEProud to announce the release of Myco ExampleApp, the free version of our enterprise product. Check it out at www.example.com.truefalse
11/5/15datadaemon994FALSEGreat start with Myco ExampleApp. Super easy to use, and actually fun.falsetrue
11/5/1599redballoons99FALSELiking this new ExampleApp! Good job, guys!falsetrue
11/5/15bigdatadan7182FALSE@support, how can I find example datasets for use with your product?falsefalse

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁