Neste documento, descrevemos os métodos, as propriedades e as opções de configuração do Dataform Core. É possível usar o Dataform Core em arquivos SQLX e JavaScript.
assert()
assert
|
(name: string, query?: AContextable
|
Adiciona uma asserção do Dataform ao gráfico compilado. Disponível apenas no diretório |
Exemplo:
// definitions/file.js
assert("name").query(ctx => "select 1");
CommonContext
Os métodos de contexto estão disponíveis ao avaliar código SQL contextualizável,
como em arquivos SQLX, ou ao usar um argumento
Contextable
com o Dataform Core.
database
|
() => string
|
Retorna o banco de dados deste conjunto de dados, se aplicável. | |
name
|
() => string
|
Retorna o nome desta tabela. | |
ref
|
(ref: Resolvable | string[], rest: string[]) => string
|
Faz referência a outra ação, adicionando-a como uma dependência a esta ação,
retornando um SQL válido para ser usado em uma expressão from .
Essa função pode ser chamada com um objeto
Essa função também pode ser chamada usando argumentos individuais para os valores ${ref("database", "schema", "name")}
${ref("schema", "name")}
${ref("name")}
|
|
resolve
|
(ref: Resolvable | string[], rest: string[]) => string
|
Semelhante a ref , mas não adiciona a ação referenciada como uma dependência a essa ação.
|
|
self
|
() => string
|
Equivale a resolve(name()) .
Retorna uma string SQL válida que pode ser usada para referenciar a tabela produzida por essa ação. |
|
schema
|
() => string
|
Retorna o esquema deste conjunto de dados. |
Contextable
Os argumentos contextuais podem transmitir um valor simples para o tipo genérico T
ou uma função chamada com o objeto de contexto para esse tipo de operação.
T | (ctx: Context) => T
Dataform
Variável global que contém o objeto IProjectConfig.
Obrigatório para receber propriedades IProjectConfig
, por exemplo:
dataform.projectConfig.vars.myVariableName === "myVariableValue"
declare()
declare
|
(dataset: dataform.ITarget)
|
Declara o conjunto de dados como uma fonte de dados do Dataform. Disponível apenas no diretório |
Exemplo:
// definitions/file.js
declare({name: "a-declaration"})
IActionConfig
Define tags do Dataform e dependências aplicadas a uma ação de fluxo de trabalho.
tags
|
string[]
|
Uma lista de tags definidas pelo usuário com que a ação deve ser rotulada. |
|
dependencies
|
Resolvable| Resolvable[]
|
Dependências da ação. |
|
disabled
|
boolean
|
Se definido como "true", essa ação não será executada. No entanto, ainda é possível depender da ação. Útil para desativar temporariamente ações com falha. |
IAssertionConfig
Opções de configuração para tipos de ação assertion
.
database
|
string
|
O banco de dados (ID do projetoGoogle Cloud ) em que a visualização correspondente para essa declaração será criada. | |
description
|
string
|
Uma descrição dessa declaração. | |
disabled
|
boolean
|
Se for definida como true , a ação não será executada.
Ainda é possível depender da ação. Útil para desativar temporariamente
ações com falha.
|
|
hermetic
|
boolean
|
Declara se esta ação é hermética. Uma ação é hermética
se todas as dependências dela forem declaradas explicitamente.
Se essa ação depender de dados de uma fonte que não foi declarada
como uma dependência, defina |
|
schema
|
string
|
O esquema (conjunto de dados do BigQuery) em que a visualização correspondente para esta asserção será criada. | |
tags
|
string[]
|
Uma lista de tags definidas pelo usuário aplicadas a essa ação. |
IBigQueryOptions
Opções de data warehouse específicas do BigQuery.
additionalOptions
|
|
Pares de chave-valor para as opções tabela, visualização e visualização materializada.
Algumas opções, como
Os valores de string precisam estar entre aspas duplas, por exemplo:
Se o nome da opção tiver caracteres especiais, coloque-o entre aspas, por exemplo: |
|
clusterBy
|
string[]
|
As chaves para agrupar partições por. | |
labels
|
|
Pares de chave-valor para rótulos do BigQuery.
Se o nome do rótulo tiver caracteres especiais, como hífens, coloque o nome entre aspas, por exemplo, |
|
partitionBy
|
string
|
A chave para particionar a tabela. Normalmente, o nome de um carimbo de data/hora ou da coluna de data. | |
partitionExpirationDays
|
number
|
O número de dias em que o BigQuery armazena dados em cada partição. A configuração se aplica a todas as partições de uma tabela, mas é calculada de maneira independente para cada partição com base no tempo de partição. | |
requirePartitionFilter
|
boolean
|
Declara se a tabela particionada exige um filtro de predicado de cláusula WHERE que filtre a coluna de particionamento.
|
|
updatePartitionFilter
|
string
|
Filtro baseado em SQL para quando as atualizações incrementais são aplicadas. |
IColumnsDescriptor
Descreve as colunas em uma tabela.
{ [name]: string | IRecordDescriptor }
IDeclarationConfig
Opções de configuração para tipos de ação declaration
.
columns
|
IColumnsDescriptor
|
Uma descrição das colunas na tabela. | |
database
|
string
|
O banco de dados (ID do projetoGoogle Cloud ) em que a tabela de origem será criada existe. | |
description
|
string
|
Uma descrição da tabela. | |
schema
|
string
|
O esquema (conjunto de dados do BigQuery) em que a tabela de origem está. |
IDependenciesConfig
Define as dependências de uma ação de fluxo de trabalho.
dependencies
|
Resolvable| Resolvable[]
|
Uma ou mais dependências explícitas para essa ação. As ações de dependência
serão executadas antes das ações dependentes.
Normalmente, isso permanece indefinido porque a maioria das dependências é declarada
como um subproduto do uso da função |
|
hermetic
|
boolean
|
Declara se a ação é hermética ou não. Uma ação é hermética se todas as dependências dela forem declaradas explicitamente. Se essa ação depender de dados de uma fonte que não foi declarada como uma dependência, |
IDocumentableConfig
Define descrições de um conjunto de dados e das colunas dele.
columns
|
IColumnsDescriptor
|
Uma descrição das colunas no conjunto de dados. |
|
description
|
string
|
Uma descrição do conjunto de dados. |
INamedConfig
Define o tipo e o nome de uma ação de fluxo de trabalho.
type
|
string
|
O tipo da ação. |
|
name
|
string
|
O nome da ação. |
IOperationConfig
Opções de configuração para tipos de ação operations
.
columns
|
IColumnsDescriptor
|
Uma descrição das colunas na tabela. | |
database
|
string
|
O banco de dados (ID do projetoGoogle Cloud ) em que a saída desta ação será criada. | |
description
|
string
|
Uma descrição da tabela. | |
disabled
|
boolean
|
Se for definida como true , a ação não será executada.
Ainda é possível depender da ação.
Útil para desativar temporariamente ações com falha.
|
|
hasOutput
|
boolean
|
Declara que esta ação operations cria uma tabela
que pode ser referenciada usando a função ref .
Se definido como create or replace table ${self()} as select ...
|
|
hermetic
|
boolean
|
Declara se esta ação é hermética. Uma ação é hermética
se todas as dependências dela forem declaradas explicitamente.
Se essa ação depender de dados de uma fonte que não foi declarada
como uma dependência, defina |
|
schema
|
string
|
O esquema (conjunto de dados do BigQuery) em que criar a saída desta ação. | |
tags
|
string[]
|
Uma lista de tags definidas pelo usuário aplicadas a essa ação. |
IProjectConfig
Contém as configurações de compilação de um repositório do Dataform.
defaultDatabase
|
string
|
Obrigatório. O banco de dados padrão (ID do projetoGoogle Cloud ). | |
defaultSchema
|
string
|
Obrigatório. O esquema padrão (ID do conjunto de dados do BigQuery). | |
defaultLocation
|
string
|
Obrigatório. O local padrão do BigQuery a ser usado. Para mais informações sobre locais do BigQuery, consulte https://cloud.google.com/bigquery/docs/locations. | |
assertionSchema
|
string
|
Obrigatório. O esquema padrão (ID do conjunto de dados do BigQuery) para asserções. | |
vars
|
map (key: string, value: string)
|
Opcional. Variáveis definidas pelo usuário que são disponibilizadas
ao código do projeto durante a compilação.
Um objeto com uma lista de pares "key": value .
Exemplo: { "name": "wrench", "mass": "1.3kg", "count": "3" } .
|
|
databaseSuffix
|
string
|
Opcional. O sufixo que deve ser adicionado a todos os nomes de banco de dados (ID do projetoGoogle Cloud ). | |
schemaSuffix
|
string
|
Opcional. O sufixo que deve ser anexado a todos os nomes de esquema (ID do conjunto de dados do BigQuery). | |
tablePrefix
|
string
|
Opcional. O prefixo que deve ser adicionado a todos os nomes de tabelas. | |
warehouse
|
string
|
Obrigatório. Precisa ser definido como bigquery .
|
É possível definir propriedades IProjectConfig
nas configurações de fluxo de trabalho no nível do repositório.
É possível substituir as propriedades defaultSchema
e defaultDatabase
para tabelas individuais.
Você pode acessar todas as propriedades IProjectConfig
em uma instrução SELECT
SQL
em um arquivo SQLX ou JavaScript.
O exemplo de código a seguir mostra a variável de compilação personalizada myVariableName
definida nas
configurações de fluxo de trabalho
com a propriedade projectConfig.vars
, acessada em uma instrução SELECT
em um
arquivo SQLX:
config { type: "view" }
SELECT ${when(
dataform.projectConfig.vars.myVariableName === "myVariableValue",
"myVariableName is set to myVariableValue!",
"myVariableName is not set to myVariableValue!"
)}
Para mais informações sobre como substituir as configurações de configuração do projeto
para resultados de compilação individuais, consulte o recurso REST
projects.locations.repositories.compilationResults#CodeCompilationConfig
na
API Dataform.
IRecordDescriptor
Descreve uma struct, um objeto ou um registro em uma tabela com colunas aninhadas.
bigqueryPolicyTags
|
string | string[]
|
Identificadores completos das tags de política do BigQuery aplicadas a esta coluna. Um identificador completo de uma tag de política do BigQuery
inclui o nome do projeto, o local e a taxonomia.
Por exemplo: |
|
columns
|
IColumnsDescriptor
|
Uma descrição das colunas dentro da struct, do objeto ou do registro. | |
description
|
string
|
Uma descrição da struct, do objeto ou do registro. |
ITableAssertions
Opções para criar declarações como parte de uma definição de tabela.
nonNull
|
string | string[]
|
Colunas que nunca podem ser NULL .
Se definido, a declaração correspondente vai falhar se alguma linha contiver valores |
|
rowConditions
|
string[]
|
Condições gerais que precisam ser válidas para todas as linhas da tabela.
Se definido, a declaração correspondente falhará se alguma linha violar alguma dessas condições. |
|
uniqueKey
|
string | string[]
|
Colunas que constituem o índice de chave exclusiva da tabela.
Se definido, a declaração resultante vai falhar se houver mais de uma linha na tabela com os mesmos valores para todas essas colunas. |
|
uniqueKeys
|
[]
|
Combinações de colunas, cada uma constituindo um índice de chave exclusivo da tabela.
Se definido, a declaração resultante falhará se houver mais de uma linha na tabela com os mesmos valores para todas as colunas nas chaves exclusivas. |
ITableConfig
Opções de configuração para ações table
, incluindo tipos de tabela table
, view
e incremental
.
Estende IActionConfig, IDependenciesConfig, IDocumentableConfig, INamedConfig e ITargetableConfig.
assertions
|
ITableAssertions
|
Declarações a serem executadas na tabela.
Se configuradas, as declarações relevantes serão criadas e executadas automaticamente como uma dependência dessa tabela. |
|
bigquery
|
IBigQueryOptions
|
Opções de data warehouse específicas do BigQuery. | |
columns
|
IColumnsDescriptor
|
Uma descrição das colunas na tabela. | |
database
|
string
|
O banco de dados (ID do projetoGoogle Cloud ) em que a saída dessa ação será criada. | |
description
|
string
|
Uma descrição da tabela. | |
disabled
|
boolean
|
Se for definida como true , a ação não será executada.
Ainda é possível depender da ação.
Útil para desativar temporariamente ações com falha.
|
|
hermetic
|
boolean
|
Declara se esta ação é hermética. Uma ação é hermética se todas as dependências dela forem declaradas explicitamente.
Se essa ação depender de dados de uma fonte que não foi declarada
como uma dependência, defina |
|
materialized
|
boolean
|
Válido apenas quando o tipo de tabela é view .
Se for definido como "true", uma visualização materializada será criada. |
|
protected
|
boolean
|
Permitido apenas para o tipo de tabela incremental .
Se definido como verdadeiro, a execução dessa ação vai ignorar a opção |
|
schema
|
string
|
O esquema (conjunto de dados do BigQuery) em que criar a saída dessa ação. | |
tags
|
string[]
|
Uma lista de tags definidas pelo usuário aplicadas a essa ação. | |
type
|
TableType
|
O tipo da tabela. | |
uniqueKey
|
string[]
|
Chaves exclusivas para critérios de mesclagem de tabelas incrementais.
Se configurado, os registros com chaves exclusivas correspondentes serão atualizados em vez de novas linhas serem inseridas. |
ITableContext
Os métodos de contexto estão disponíveis ao avaliar código SQL contextualizável,
como em arquivos SQLX, ou ao usar um argumento Contextable
com o Dataform Core.
incremental
|
() => boolean
|
Retorna "true" quando o contexto atual indica que a tabela será criada de forma incremental. | |
name
|
() => string
|
Retorna o nome totalmente qualificado desta tabela. | |
ref
|
(ref: Resolvable | string[], rest: string[]) => string
|
Faz referência a outra ação, adicionando-a como uma dependência a esta ação,
retornando SQL válido para ser usado em uma expressão "from".
Essa função pode ser chamada com um objeto ${ref({ name: "name", schema: "schema", database: "database" })}
Essa função também pode ser chamada usando argumentos individuais para os valores
Quando apenas dois valores são fornecidos, o banco de dados padrão é usado e os valores são interpretados como Quando apenas um valor é fornecido, o esquema de banco de dados padrão é usado, com o valor fornecido interpretado como"name". ${ref("database", "schema", "name")}
${ref("schema", "name")}
${ref("name")}
|
|
resolve
|
(ref: Resolvable | string[], rest: string[]) => string
|
Semelhante a ref , mas, em vez de adicionar uma dependência,
resolve a referência fornecida para que ela possa ser usada em SQL,
por exemplo, em uma expressão "from".
|
|
self
|
() => string
|
Equivale a resolve(name()) .
Retorna uma string SQL válida que pode ser usada para referenciar a tabela produzida por essa ação. |
|
when
|
(cond: boolean, trueCase: string, falseCase: string) => string
|
Abreviação de uma condição if .
É equivalente a cond ? trueCase : falseCase .
|
ITarget
Uma referência a uma tabela no BigQuery.
database
|
string
|
name
|
string
|
schema
|
string
|
ITargetableConfig
Define o banco de dados e o esquema de destino de uma ação de fluxo de trabalho.
database
|
string
|
O banco de dados em que a saída dessa ação deve ser criada. Precisa ser definido como BigQuery. |
|
schema
|
string
|
O esquema em que a saída dessa ação deve ser criada. |
operate()
operate
|
(name: string, queries?: Contextable
|
Define uma operação SQL. Disponível apenas no diretório |
Exemplo:
// definitions/file.js
operate("an-operation", ["SELECT 1", "SELECT 2"])
publish()
publish
|
(name: string, queryOrConfig?: Contextable
|
Cria uma tabela ou visualização. Disponível apenas no diretório |
Exemplo:
// definitions/file.js
publish("published-table", {
type: "table",
dependencies: ["a-declaration"],
}).query(ctx => "SELECT 1 AS test");
Resolvable
Um elemento resolvable pode ser o nome de uma tabela como string
ou o objeto que descreve o caminho completo para a relação.
string | ITarget
TableType
Tipos de ações de tabela compatíveis.
As tabelas do tipo view
serão criadas como visualizações.
As tabelas do tipo table
serão criadas como tabelas.
As tabelas do tipo incremental
precisam incluir uma cláusula where
.
Para mais informações, consulte
Configurar uma tabela incremental.