Database SQL Server di origine

Questa pagina contiene informazioni su:

  • Il comportamento di Datastream per la gestione dei dati estratti da un database SQL Server di origine.
  • Le versioni dei database SQL Server supportate da Datastream.
  • Limitazioni note per l'utilizzo del database SQL Server come origine.

Comportamento

Datastream monitora le modifiche data manipulation language (DML) utilizzando uno tra i seguenti metodi CDC:

Modifica tabelle

Il metodo CDC delle tabelle di variazione consente agli utenti di conservare i log per un periodo di tempo più breve e quindi di risparmiare spazio di archiviazione, ma supporta un throughput inferiore rispetto al metodo dei log delle transazioni. Il metodo presenta meno limitazioni rispetto ai log delle transazioni. Ad esempio, elimina il rischio di troncamento dei log che porta a errori permanenti negli stream e supporta la replica delle tabelle criptate. Per ulteriori informazioni, consulta Limitazioni note.

Quando utilizzi questo metodo CDC, le modifiche all'origine vengono monitorate utilizzando tabelle delle modifiche dedicate. I log delle transazioni vengono ancora utilizzati, ma in misura limitata e non è necessario conservarli per periodi più lunghi. Quando gli eventi DML vengono applicati alle tabelle di origine, le modifiche vengono replicate nelle tabelle delle modifiche corrispondenti. Le tabelle delle modifiche hanno la stessa struttura delle tabelle di origine, ma con colonne aggiuntive per includere i metadati delle modifiche. Solo le transazioni committate vengono aggiunte alle tabelle delle modifiche, insieme al numero di sequenza del log (LSN) dell'operazione di commit.

Log delle transazioni

Quando utilizzi questo metodo CDC, Datastream legge le modifiche nell'origine direttamente dai log delle transazioni. Questo metodo richiede meno risorse e consente un recupero più rapido dei dati, ma presenta più limitazioni.

Per evitare la perdita di dati, è importante che i log non vengano troncati prima che Datastream li legga. D'altra parte, se mantieni i file di log per troppo tempo, occupano spazio di archiviazione, il che potrebbe alla fine causare il passaggio dell'istanza del database in modalità di sola lettura.

Per assicurarti che il lettore CDC abbia tempo sufficiente per leggere i log e al contempo consenta il troncamento dei log per liberare spazio di archiviazione, devi applicare ulteriori passaggi di configurazione, ad esempio modificare gli intervalli di polling e impostare un'azione di salvaguardia per il troncamento. Questi passaggi forniscono un ulteriore livello di protezione per garantire che Datastream possa leggere i dati anche in caso di tempi di riposo lato Datastream o di un problema di connettività tra il database di origine e Datastream.

Per istruzioni dettagliate su come applicare queste misure aggiuntive, consulta la pagina Configurare un database SQL Server di origine e seleziona il tipo di database.

Versioni

Datastream supporta le seguenti versioni ed edizioni dei database SQL Server:

  • Self-managed (on-premise o ospitato sul cloud) con le seguenti versioni:
    • Enterprise: 2008 e versioni successive
    • Standard: 2016 SP1 e versioni successive
    • Sviluppatore: 2008 e versioni successive
  • Amazon RDS per SQL Server
  • Azure SQL Database (livello S3 e versioni successive).

  • Cloud SQL per SQL Server

Datastream non supporta le seguenti versioni dei database SQL Server:

  • SQL Server Standard Edition dalla versione 2008 alla 2014
  • SQL Server Express
  • SQL Server Web

Limitazioni note

Le limitazioni note per l'utilizzo del database SQL Server come origine includono:

  • Gli stream sono limitati a 10.000 tabelle.
  • Non è possibile eseguire il backfill di una tabella con più di 500 milioni di righe, a meno che non siano soddisfatte le seguenti condizioni:
    1. La tabella ha un indice univoco.
    2. Nessuna delle colonne dell'indice può ammettere valori nulli.
    3. Tutte le colonne dell'indice sono incluse nello stream.
  • I database con durabilità ritardata o con il recupero accelerato del database (ADR) abilitato non sono supportati.
  • Le modifiche in streaming alle tabelle di sistema non sono supportate.
  • L'autenticazione Windows Active Directory (AD) non è supportata.
  • I seguenti tipi di dati non sono supportati e non vengono replicati nella destinazione:
    • SQL_VARIANT
    • HIERARCHYID
    • GEOMETRY
    • GEOGRAPHY
  • Datastream replica i tipi di dati definiti dall'utente, ma è il tipo di dato di base da cui derivi il tipo definito dall'utente che viene archiviato nella destinazione. Ad esempio, se definisci un tipo di dati USERNAME in base al tipo di dati VARCHAR(50), i dati vengono archiviati nella destinazione come VARCHAR(50).
  • Datastream non supporta CDC per le colonne di oggetti di grandi dimensioni (TEXT, NTEXT, XML, IMAGE) e le colonne con lunghezza massima variabile (VARCHAR(MAX), VARBINARY(MAX), NVARCHAR(MAX)) nelle tabelle senza un indice univoco.

    Se le colonne di oggetti di grandi dimensioni non sono incluse nello stream, la funzionalità CDC è supportata.

  • Datastream non supporta la replica delle modifiche dello schema di origine quando si utilizza il metodo CDC delle tabelle delle modifiche. Le seguenti modifiche allo schema potrebbero causare la corruzione dei dati o l'errore di elaborazione degli eventi:

    • Aggiunta di colonne: le nuove colonne non vengono replicate nella destinazione.
    • Rimozione di colonne: i dati in queste colonne vengono sostituiti con valori NULL.
    • Modifica dei tipi di dati: Datastream tenta di inserire i dati nella destinazione e genera un errore se i dati vengono rifiutati.
    • Rinomina delle colonne: non supportata per SQL Server quando la CDC è abilitata.
  • Datastream non supporta il mascheramento dei dati. I dati vengono replicati senza mascheramento.

  • Datastream non supporta la replica delle modifiche applicate al database utilizzando il pacchetto DACPAC (Data Tier Application Package).

  • Datastream non replica le modifiche apportate utilizzando le istruzioni WRITETEXT o UPDATETEXT.

  • Datastream non supporta la replica delle colonne calcolate, a meno che la colonna non sia contrassegnata come PERSISTED.

  • Datastream non supporta i tipi di compressione PAGE, COLUMNSTORE o COLUMNSTORE ARCHIVE.

Limitazioni aggiuntive quando si utilizza il metodo dei log delle transazioni

Se utilizzi il metodo CDC dei log delle transazioni, si applicano le seguenti limitazioni aggiuntive:

  • La crittografia TDE (Transparent Data Encryption) non è supportata.
  • La crittografia a livello di colonna non è supportata. I dati in queste colonne vengono sostituiti con valori NULL.
  • Datastream non supporta l'istruzione ROLLBACK TO SAVEPOINT. Questi eventi di rollback vengono ignorati e non vengono replicati nella destinazione.
  • Datastream non supporta CDC per le righe di dimensioni superiori a 8 KB nei seguenti tipi di tabelle:
    • Tabelle senza un indice univoco
    • Tabelle contenenti un solo indice univoco non cluster con una o più colonne di lunghezza variabile (VARCHAR, VARBINARY, NVARCHAR)
  • Datastream non supporta CDC per le colonne di oggetti di grandi dimensioni (TEXT, NTEXT, XML, IMAGE) nei seguenti tipi di tabelle:

    • Tabelle senza un indice univoco
    • Tabelle contenenti solo un indice univoco non cluster con una o più colonne di lunghezza variabile (VARCHAR, VARBINARY, NVARCHAR)

    Se le colonne di oggetti di grandi dimensioni non sono incluse nello stream, CDC è supportata solo per queste tabelle se dispongono di indici validi.

Passaggi successivi