Esta página foi traduzida pela API Cloud Translation.
Switch to English

Ler pelo BigQuery

Além de ler arquivos JSON no Google Cloud Storage, a API Inference também é compatível com a leitura da tabela do BigQuery.

Preparar a Tabela do BigQuery

A tabela do BigQuery a ser processada pela API Inference precisa ter as seguintes colunas:

  1. group_id no tipo INTEGER
  2. data_name no tipo STRING
  3. data_value no tipo STRING
  4. start_time no tipo TIMESTAMP
  5. end_time (opcional) no tipo TIMESTAMP

É possível gerar a tabela do BigQuery a partir de qualquer tabela atual com uma consulta do BigQuery.

Veja como exportar o resultado da consulta para uma nova tabela neste link.

Crie o conjunto de dados

Assim como no exemplo de início rápido, você criará um conjunto de dados da API Cloud Inference usando o método REST createdataset.

  1. Crie um arquivo de solicitação JSON com o seguinte texto e salve-o como um arquivo de texto simples create-gdelt-dataset.json:

    {
      "name":"gdelt_bq_2018_04_data",
      "data_names": [
        "PageURL",
        "PageDomain",
        "PageCountry",
        "PageLanguage",
        "PageTextTheme",
        "PageTextGeo",
        "ImageURL",
        "ImagePopularityRawScore",
        "ImagePopularity",
        "ImageSafeSearch",
        "ImageLabel",
        "ImageWebEntity",
        "ImageWebEntityBestGuessLabel",
        "ImageGeoLandmark",
        "ImageFaceToneHas"
      ],
      "data_sources": [
        { "uri":"infer-test:gdelt_demo.inference_gdelt_demo" },
      ]
    }
    

    Essa tabela do BigQuery contém os mesmos dados com a entrada de demonstração do guia de início rápido. A tabela é de acesso público. Portanto, você não precisará de credenciais de autenticação para acessá-las.

  2. Verifique se você tem um token de autorização:

    gcloud auth application-default print-access-token
      
  3. Use curl para fazer uma solicitação createdataset, passando o token de acesso para ela e o nome do arquivo da solicitação JSON configurada na etapa 1:

    curl -s -H "Content-Type: application/json" \
      -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
      https://infer.googleapis.com/v1/projects/PROJECT_NUMBER/datasets \
      -d @create-gdelt-dataset.json
      

    Para passar o nome do arquivo ao curl use a opção -d (de "dados") e coloque o sinal @ na frente do nome do arquivo. Este arquivo deve estar no mesmo diretório em que você executa o comando curl.

    Uma resposta semelhante a esta será exibida:

    {
      "name": "gdelt_bq_2018_04_data",
      "state": "STATE_PENDING"
    }
    

Em seguida, consulte o conjunto de dados depois que o conjunto de dados for carregado.

Para usar sua própria tabela do BigQuery, é necessário fornecer o código completo da tabela no formato <project id>:<dataset name>.<table name>. A conta usada para chamar a API Inference também precisa ser um visualizador de dados do BigQuery da tabela.

Acessar ID da tabela