Cloud SQL for SQL Server-Datenbank konfigurieren

In den folgenden Schritten wird beschrieben, wie Sie eine Cloud SQL for SQL Server-Datenbank für mit Datastream verwenden:

  1. eine Verbindung zur Cloud SQL-Instanz herstellen Sie können dazu die gcloud sql connect-Befehl im Cloud Shell-Eingabeaufforderung.

  2. Aktivieren Sie CDC für die Datenbank mit dem folgenden Befehl:

    EXEC msdb.dbo.gcloudsql_cdc_enable_db 'DATABASE_NAME'
    

    Ersetzen Sie DATABASE_NAME durch den Namen Ihrer Quelldatenbank.

  3. Aktivieren Sie CDC für die Tabellen, für die Sie Änderungen erfassen müssen:

    USE [DATABASE_NAME]
    EXEC sys.sp_cdc_enable_table
    @source_schema = N'SCHEMA_NAME',
    @source_name = N'TABLE_NAME',
    @role_name = NULL
    GO
    
  4. Starten Sie den SQL Server-Agent und stellen Sie sicher, dass er immer ausgeführt wird. Wenn die Der SQL Server-Agent bleibt für längere Zeit nicht verfügbar, die Logs werden möglicherweise abgeschnitten, die nicht von Datastream gelesen wurden, was zu einem dauerhaften Verlust der Änderungsdaten führte.

    Informationen zum Ausführen des SQL Server-Agents finden Sie unter Eine Instanz des SQL Server-Agents starten, stoppen oder neu starten

  5. Snapshot-Isolation aktivieren.

    Beim Backfill von Daten aus Ihrer SQL Server-Datenbank ist es wichtig, konsistente Snapshots erstellt werden. Falls Sie die hier beschriebenen Einstellungen nicht anwenden, können während des Backfill-Prozesses an der Datenbank vorgenommene Änderungen Duplikate oder falsche Ergebnisse, insbesondere bei Tabellen ohne Primärschlüssel.

    Wenn Sie die Snapshot-Isolation aktivieren, wird zu Beginn eine temporäre Ansicht der Datenbank erstellt des Backfill-Prozesses. Dadurch wird sichergestellt, dass die kopierten Daten einheitlich bleiben, auch wenn andere Nutzende gleichzeitig Änderungen an den Live-Tabellen vornehmen. Das Aktivieren der Snapshot-Isolierung kann sich für eine zuverlässige Datenextraktion.

    So aktivieren Sie die Snapshot-Isolation:

    1. Stellen Sie eine Verbindung zu Ihrer Datenbank über einen SQL Server-Client her.
    2. Führen Sie dazu diesen Befehl aus:
    ALTER DATABASE DATABASE_NAME SET ALLOW_SNAPSHOT_ISOLATION ON;
    

    Ersetzen Sie DATABASE_NAME durch den Namen Ihrer Datenbank.

  6. Erstellen Sie einen Datastream-Nutzer:

    1. Wechseln Sie in der Google Cloud Console zur Seite Cloud SQL-Instanzen.

      Cloud SQL-Instanzen aufrufen

    2. Erstelle einen Log-in.

    3. Erstellen Sie einen Nutzer und weisen Sie ihm die Rollen db_owner und db_denydatawriter zu:

    CREATE USER USER_NAME FOR LOGIN YOUR_LOGIN;
    
    EXEC sp_addrolemember 'db_owner', 'USER_NAME';
    EXEC sp_addrolemember 'db_denydatawriter', 'USER_NAME';
    

Zusätzliche erforderliche Schritte für die CDC-Methode der Transaktionslogs

Die in diesem Abschnitt beschriebenen Schritte sind nur erforderlich, wenn Sie Ihr SQL Server-Quelldatenbank zur Verwendung mit der CDC-Methode für Transaktionslogs.

  1. Legen Sie die Aufbewahrungsdauer fest, für die die Änderungen in Ihrem Quelle.

    USE [DATABASE_NAME]
    EXEC sys.sp_cdc_change_job @job_type = 'capture' , @pollinginterval = 86399
    EXEC sp_cdc_stop_job 'capture'
    EXEC sp_cdc_start_job 'capture'
    

    Der Parameter @pollinginterval wird in Sekunden mit einem empfohlenen Wert gemessen auf 86399 festgelegt. Das bedeutet,dass Änderungen im Transaktions-Log für 86.399 Sekunden (ein Tag). Durch die Ausführung der Prozedur sp_cdc_start_job 'capture wird die Einstellungen ändern.

  2. Richten Sie einen Schutz vor abgeschnittenen Logs ein.

    Um sicherzustellen, dass der CDC-Leser genügend Zeit hat, um die Protokolle zu lesen, während Kürzung von Protokollen, um zu verhindern, dass Speicherplatz belegt wird, können Sie diese Kürzung einrichten. Absicherung:

    1. Stellen Sie eine Verbindung zur Datenbank über einen SQL Server-Client her.
    2. Erstellen Sie eine Dummy-Tabelle in der Datenbank:

      USE [DATABASE_NAME];
      CREATE TABLE dbo.gcp_datastream_truncation_safeguard (
        [id] INT IDENTITY(1,1) PRIMARY KEY,
        CreatedDate DATETIME DEFAULT GETDATE(),
        [char_column] CHAR(8)
        );
      
    3. Erstellen Sie eine gespeicherte Prozedur, die eine aktive Transaktion für einen Zeitraum ausführt, um das Abschneiden des Logs zu verhindern:

      CREATE PROCEDURE [dbo].[DatastreamLogTruncationSafeguard] @transaction_logs_retention_time INT
      AS
      BEGIN
        -- Start a new transaction
        BEGIN TRANSACTION;
        INSERT INTO dbo.gcp_datastream_truncation_safeguard (char_column) VALUES ('a')
      
      DECLARE @formatted_time VARCHAR(5)
      SET @formatted_time = CONVERT(VARCHAR(5), DATEADD(MINUTE, @transaction_logs_retention_time, 0), 108);
        -- Wait for X minutes before ending the transaction
        WAITFOR DELAY @formatted_time;
        -- Commit the transaction
        COMMIT TRANSACTION;
      END;
      
    4. Erstellen Sie eine weitere gespeicherte Prozedur. Dieses Mal erstellen Sie einen Job, der die gespeicherte Prozedur, die Sie im vorherigen Schritt gemäß einem Kadenz:

      CREATE PROCEDURE [dbo].[SetUpDatastreamJob] @transaction_logs_retention_time INT
      AS
      BEGIN
        DECLARE @database_name VARCHAR(MAX)
        SET @database_name =  (SELECT DB_NAME());;
      
        DECLARE @command_str VARCHAR(MAX);
        SET @command_str = CONCAT('Use ', @database_name,'; exec dbo.DatastreamLogTruncationSafeguard @transaction_logs_retention_time = ' + CAST(@transaction_logs_retention_time AS VARCHAR(10)));
      
        DECLARE @job_name VARCHAR(MAX);
      SET @job_name =
        CONCAT(@database_name, '_', 'DatastreamLogTruncationSafeguardJob1')
      
          -- Add 3 schedules to the job to run again after specified time.
          IF
            NOT EXISTS(
              SELECT *
              FROM msdb.dbo.sysjobs
              WHERE name = @job_name
            )
              BEGIN
                EXEC
                  msdb.dbo.sp_add_job
                    @job_name
        = @job_name,
        @enabled = 1,
        @description = N'Execute the procedure to run an active transaction for x minutes.';
      
      EXEC msdb.dbo.sp_add_jobstep @job_name = @job_name,
      @step_name = N'Execute_DatastreamLogTruncationSafeguard',
      @subsystem = N'TSQL',
      @command = @command_str;
      
        -- Add a schedule that runs the stored procedure every given minutes starting now.
        DECLARE @schedule_name_1 VARCHAR(MAX);
        SET @schedule_name_1 = CONCAT(@database_name, '_', 'DatastreamEveryGivenMinutesFromNow')
      
        DECLARE @start_time_1 time;
        SET @start_time_1 = DATEADD(SECOND, 1, GETDATE());
        DECLARE @formatted_start_time_1 INT;
        SET @formatted_start_time_1 = CONVERT(INT, REPLACE(CONVERT(VARCHAR(8), @start_time_1, 114), ':' ,''));
      
        EXEC msdb.dbo.sp_add_schedule
        @schedule_name = @schedule_name_1,
        @freq_type = 4,  -- daily start
        @freq_subday_type = 4,  -- every X minutes daily
        @freq_interval = 1,
        @freq_subday_interval = @transaction_logs_retention_time,
        @active_start_time = @formatted_start_time_1;
      
        EXEC msdb.dbo.sp_attach_schedule
        @job_name = @job_name,
        @schedule_name = @schedule_name_1 ;
      
        -- Add a schedule that runs the stored procedure after every given minutes starting after some delay.
        DECLARE @schedule_name_2 VARCHAR(MAX);
        Set @schedule_name_2 = CONCAT(@database_name, '_', 'DatastreamEveryGivenMinutesAfterDelay');
      
        DECLARE @start_time_2 time;
        SET @start_time_2 = DATEADD(MINUTE, @transaction_logs_retention_time / 2, GETDATE());
      
        DECLARE @formatted_start_time_2 INT;
        SET @formatted_start_time_2 = CONVERT(INT, REPLACE(CONVERT(VARCHAR(8), @start_time_2, 114), ':' ,''));
      
        EXEC msdb.dbo.sp_add_schedule
        @schedule_name = @schedule_name_2,
        @freq_type = 4,  -- daily start
        @freq_subday_type = 4,  -- every x minutes daily
        @freq_interval = 1,
        @freq_subday_interval = @transaction_logs_retention_time,
        @active_start_time = @formatted_start_time_2;
      
        EXEC msdb.dbo.sp_attach_schedule
        @job_name = @job_name,
        @schedule_name = @schedule_name_2 ;
      
        -- Add a schedule that runs the stored procedure on the SQL Server Agent startup.
        DECLARE @schedule_name_agent_startup VARCHAR(MAX);
        Set @schedule_name_agent_startup = CONCAT(@database_name, '_', 'DatastreamSqlServerAgentStartupSchedule')
      
        EXEC msdb.dbo.sp_add_schedule
        @schedule_name = @schedule_name_agent_startup,
        @freq_type = 64,  -- start on SQL Server Agent startup
        @active_start_time = @formatted_start_time_1;
      
        EXEC msdb.dbo.sp_attach_schedule
        @job_name = @job_name,
        @schedule_name = @schedule_name_agent_startup ;
      
        EXEC msdb.dbo.sp_add_jobserver
        @job_name = @job_name,
        @server_name = @@servername ;
        END
      END;
      
    5. Führen Sie die gespeicherte Prozedur aus, die den Datastream-Job erstellt.

      DECLARE @transaction_logs_retention_time INT = (INT)
      EXEC [dbo].[SetUpDatastreamJob] @transaction_logs_retention_time
      

      Ersetzen Sie INT durch die Anzahl der Minuten, die Sie um die Protokolle aufzubewahren. Beispiel:

      • Der Wert von 60 legt die Aufbewahrungsdauer auf 1 Stunde fest
      • Der Wert von 24 * 60 legt die Aufbewahrungsdauer auf 1 Tag fest.
      • Der Wert von 3 * 24 * 60 legt die Aufbewahrungsdauer auf 3 Tage fest.