Formatta l'output dal interfaccia a riga di comando cbt

Questo documento descrive come formattare tipi specifici di dati archiviati nelle righe di Bigtable quando vengono visualizzati dall'interfaccia a riga di comando cbt.

Esempi di formattazione

A partire dalla versione 0.12.0, Interfaccia a riga di comando cbt possono formattare determinati tipi complessi di dati archiviati nelle righe della tabella. Quando utilizzi il comando cbt read o cbt lookup, la cbt CLI può "stampare in un formato gradevole" i valori memorizzati nelle righe.

L'esempio seguente mostra un output di dati Interfaccia a riga di comando cbt senza formattazione.

----------------------------------------
r1
  fam1:col1                                 @ 2022/03/09-11:19:45.966000
    "\n\x05Brave\x10\x02"
  fam1:col2                                 @ 2022/03/14-11:17:20.014000
    "{\"name\": \"Brave\", \"age\": 2}"

L'esempio seguente mostra un output di dati Interfaccia a riga di comando cbt con formattazione.

r1
  fam1:col1                                 @ 2022/03/09-11:19:45.966000
    name: "Brave"
    age: 2
  fam1:col2                                 @ 2022/03/14-11:17:20.014000
    age:     2.00
    name:   "Brave"

Per formattare una colonna o una famiglia di colonne, devi fornire un file YAML che specifica la formattazione della colonna. Quando chiami cbt lookup o cbt read, devi passare il percorso del file YAML con l'argomento format-file. Il seguente snippet mostra un esempio di chiamata a cbt lookup con dall'argomento format-file fornito.

cbt lookup my-table r1 format-file=/path/to/formatting.yml

Definire i formati dei dati delle colonne in YAML

Il file YAML di formattazione deve connettere i nomi delle colonne o i nomi famiglia di colonne con i tipi di dati archiviati al loro interno. Lo snippet che segue mostra un esempio di un file di formattazione YAML.

protocol_buffer_definitions:
  - cat.proto
protocol_buffer_paths:
  - testdata/


columns:
  col1:
    encoding: ProtocolBuffer
    type: Cat

  col2:
    encoding: json

Lo snippet seguente mostra i contenuti di "cat.proto".

syntax = "proto3";
package cats;

option go_package = "github.com/protocolbuffers/protobuf/examples/go/tutorialpb";

message Cat {
  string name = 1;
  int32 age = 2;
}

Osservando l'esempio:

  • Il campo protocol_buffer_definitions fornisce un elenco di file .proto che possono contenere tipi di messaggi del buffer di protocollo da utilizzare per decodifica i dati protobuf.
  • Il campo protocol_buffer_paths fornisce un elenco di percorsi locali che possono contenere file .proto per la decodifica dei tipi di buffer del protocollo. Non è necessario specificare le posizioni delle importazioni del buffer del protocollo standard, ad esempio i messaggi nel pacchetto google/protobuf.
  • Il campo columns contiene un elenco di nomi di colonna con le tipi di dati per ogni colonna:

    • La colonna protobuf ha encoding impostato su "ProtocolBuffer" e type impostato su "Cat". La Interfaccia a riga di comando cbt interpreta e formatta tutti i valori archiviati in questa colonna come tipo di messaggio di protocollo Cat. Il tipo deve corrispondere a un tipo di messaggio definito in uno dei file .proto forniti per il campo protocol_buffer_definition.
    • Il campo encoding della colonna json è impostato su "json". cbtinterpreta e formatta tutti i valori memorizzati in questa colonna come struttura JSON.

Altri campi che puoi fornire:

  • default_encoding: questo campo definisce una formattazione predefinita per tutti tutte le colonne di una tabella o tutte le colonne di una famiglia di colonne.
  • default_type: questo campo definisce un tipo di dati predefinito per il buffer di protocollo, le colonne con codifica big-endian e small-endian.
  • families: questo campo definisce le codifiche e i tipi per tutte le colonne all'interno di una famiglia di colonne. Puoi fornire un default_encoding e un default_type per una famiglia di colonne. Puoi anche sostituire queste codifiche nella colonna fornendo un campo columns che elenca le colonne per nome con la codifica e i tipi di dati appropriati, come mostrato nello snippet seguente:

    families:
      family1:
        default_encoding: BigEndian
        default_type: INT64
        columns:
          address:
            encoding: PROTO
            type: tutorial.Person
    

Tipi di dati supportati

La Interfaccia a riga di comando cbt supporta la formattazione per diversi tipi di dati complessi. Le seguenti che elenca le stringhe e i tipi di dati supportati da fornire nel file YAML per ogni tipo di elenco. I valori delle stringhe non sono sensibili alle maiuscole.

Tipo di dati Valore di formattazione per YAML
Esadecimale Hex, H
Big endian BigEndian, B
Little-endian LittleEndian, L
Buffer di protocollo ProtocolBuffer, P, PROTO
JSON JSON, J

Tabella 1. Tipi di dati supportati per la formattazione nell'output cbt.

  • La codifica esadecimale è indipendente dal tipo. I dati vengono visualizzati come rappresentazione esadecimale non elaborata dei dati archiviati.
  • I tipi disponibili per le codifiche big-endian e little-endian sono int8, int16, int32, int64, uint8, uint16, uint32, uint64, float32 e float64. La lunghezza dei dati archiviati deve essere un multiplo del dimensione del tipo, in byte. I dati vengono visualizzati come scalari se la lunghezza memorizzata corrisponde alla dimensione del tipo oppure come array in caso contrario. I nomi dei tipi non sono sensibile alle maiuscole.
  • I tipi specificati per la codifica protocol-buffer devono corrispondere ai tipi di messaggio definiti nei file di definizione del protocollo-buffer forniti. I tipi non sono sensibili alle maiuscole. Se non viene specificato alcun tipo, il valore predefinito è il nome della colonna per i dati della colonna visualizzati.
  • I valori di formattazione per YAML non sono sensibili alle maiuscole.