Questa pagina è stata tradotta dall'API Cloud Translation.

Modello Pub/Sub to Redis

Il modello Pub/Sub a Redis è una pipeline di streaming che legge i messaggi da una sottoscrizione Pub/Sub e scrive il payload dei messaggi in Redis. Il caso d'uso più comune di questo modello è l'esportazione dei log in Redis Enterprise per un'analisi avanzata dei log basata sulla ricerca in tempo reale.

Prima di scrivere su Redis, puoi applicare una funzione definita dall'utente JavaScript al payload del messaggio.
I messaggi che presentano errori di elaborazione vengono inoltrati a un argomento Pub/Sub non elaborato per un'ulteriore risoluzione dei problemi e rielaborazione.
Per una maggiore sicurezza, attiva una connessione SSL durante la configurazione della connessione dell'endpoint del database. Questo modello non supporta TLS reciproco.

Requisiti della pipeline

La sottoscrizione Pub/Sub di origine deve esistere prima dell'esecuzione della pipeline.
L'argomento Pub/Sub non elaborato deve esistere prima dell'esecuzione della pipeline.
L'endpoint del database Redis deve essere accessibile dalla subnet dei worker Dataflow.

Parametri del modello

Parametri obbligatori

inputSubscription: la sottoscrizione Pub/Sub da cui leggere l'input. Ad esempio, projects/<PROJECT_ID>/subscriptions/<SUBSCRIPTION_ID>.
redisHost: l'host del database Redis. Ad esempio, your.cloud.db.redislabs.com. Il valore predefinito è 127.0.0.1.
redisPort: la porta del database Redis. Ad esempio, 12345. Il valore predefinito è 6379.
redisPassword: la password del database Redis. Il valore predefinito è empty.

Parametri facoltativi

sslEnabled: il parametro SSL del database Redis. Il valore predefinito è false.
redisSinkType: il sink Redis. I valori supportati sono STRING_SINK, HASH_SINK, STREAMS_SINK, and LOGGING_SINK. Ad esempio: STRING_SINK. Il valore predefinito è: STRING_SINK.
connectionTimeout: il timeout della connessione Redis in millisecondi. Ad esempio, 2000. Il valore predefinito è 2000.
ttl: il tempo di scadenza della chiave in secondi. Il valore predefinito di ttl per HASH_SINK è -1, il che significa che non scade mai.
javascriptTextTransformGcsPath: l'URI Cloud Storage del file .js che definisce la funzione definita dall'utente (UDF) JavaScript da utilizzare. Ad esempio, gs://my-bucket/my-udfs/my_file.js.
javascriptTextTransformFunctionName: il nome della funzione definita dall'utente (UDF) JavaScript da utilizzare. Ad esempio, se il codice della funzione JavaScript è myTransform(inJson) { /*...do stuff...*/ }, il nome della funzione è myTransform. Per esempi di funzioni JavaScript definite dall'utente, vedi Esempi di UDF (https://github.com/GoogleCloudPlatform/DataflowTemplates#udf-examples).
javascriptTextTransformReloadIntervalMinutes: specifica la frequenza con cui ricaricare la funzione definita dall'utente, in minuti. Se il valore è maggiore di 0, Dataflow controlla periodicamente il file UDF in Cloud Storage e ricarica la UDF se il file viene modificato. Questo parametro ti consente di aggiornare la UDF mentre la pipeline è in esecuzione, senza dover riavviare il job. Se il valore è 0, il ricaricamento delle funzioni definite dall'utente è disattivato. Il valore predefinito è 0.

Funzione definita dall'utente

Se vuoi, puoi estendere questo modello scrivendo una funzione definita dall'utente (UDF). Il modello chiama la UDF per ogni elemento di input. I payload degli elementi vengono serializzati come stringhe JSON. Per saperne di più, consulta Creare funzioni definite dall'utente per i modelli Dataflow.

Specifiche della funzione

La UDF ha le seguenti specifiche:

Input: stringa JSON
Output: una stringa o un oggetto JSON convertito in stringa

Esegui il modello

Console

Vai alla pagina Crea job da modello di Dataflow.

Vai a Crea job da modello

Nel campo Nome job, inserisci un nome univoco per il job.
(Facoltativo) Per Endpoint a livello di regione, seleziona un valore dal menu a discesa. La regione predefinita è us-central1.
Per un elenco delle regioni in cui puoi eseguire un job Dataflow, consulta Località di Dataflow.
Dal menu a discesa Modello Dataflow, seleziona the Pub/Sub to Redis template.
Nei campi dei parametri forniti, inserisci i valori dei parametri.
Fai clic su Esegui job.

gcloud

Nella shell o nel terminale, esegui il modello:

gcloud dataflow flex-template run JOB_NAME \
    --template-file-gcs-location=gs://dataflow-templates-REGION_NAME/VERSION/flex/Cloud_PubSub_to_Redis \
    --project=PROJECT_ID \
    --region=REGION_NAME \
    --parameters \
       inputSubscription=INPUT_SUBSCRIPTION,\
       redisHost=REDIS_HOST,\
       redisPort=REDIS_PORT,\
       redisPassword=REDIS_PASSWORD,\

Sostituisci quanto segue:

JOB_NAME: un nome univoco del job a tua scelta
VERSION: la versione del modello che vuoi utilizzare
Puoi utilizzare i seguenti valori:
- latest per utilizzare l'ultima versione del modello, disponibile nella cartella principale senza data nel bucket: gs://dataflow-templates-REGION_NAME/latest/
- il nome della versione, ad esempio 2023-09-12-00_RC00, per utilizzare una versione specifica del modello, che si trova nidificata nella rispettiva cartella principale con data nel bucket: gs://dataflow-templates-REGION_NAME/
Attenzione:l'ultima versione dei modelli potrebbe essere aggiornata con modifiche che causano interruzioni. Gli ambienti di produzione devono utilizzare i modelli conservati nella cartella principale con data più recente per evitare che queste modifiche che causano interruzioni influiscano sui workflow di produzione.
REGION_NAME: la regione in cui vuoi eseguire il deployment del job Dataflow, ad esempio us-central1
INPUT_SUBSCRIPTION: la sottoscrizione Pub/Sub di input
REDIS_HOST: l'host del database Redis
REDIS_PORT: la porta del database Redis
REDIS_PASSWORD: la password del database Redis

API

Per eseguire il modello utilizzando l'API REST, invia una richiesta POST HTTP. Per ulteriori informazioni sull'API e sui relativi ambiti di autorizzazione, consulta projects.templates.launch.

POST https://dataflow.googleapis.com/v1b3/projects/PROJECT_ID/locations/LOCATION/flexTemplates:launch
{
   "launchParameter": {
     "jobName": "JOB_NAME",
     "parameters": {
       "inputSubscription": "INPUT_SUBSCRIPTION",
       "redisHost": "REDIS_HOST",
       "redisPort": "REDIS_PORT",
       "redisPassword": "REDIS_PASSWORD",
     },
     "containerSpecGcsPath": "gs://dataflow-templates-LOCATION/VERSION/flex/Cloud_PubSub_to_Redis",
     "environment": { "maxWorkers": "10" }
  }
}