来源 Oracle 数据库

本部分包含有关以下内容的信息:

  • Datastream 如何处理从来源 Oracle 数据库中拉取的数据的行为
  • Datastream 支持的 Oracle 数据库版本
  • 如何设置来源 Oracle 数据库以便将数据从该数据库流式传输到目标位置的概述
  • 将 Oracle 数据库用作来源的已知限制

行为

来源 Oracle 数据库依靠其 Oracle Logminer 功能来公开数据变更。

  • 可以选择给定数据库中的所有架构或特定架构,以及架构或特定表中的所有表。
  • 复制所有历史数据。
  • 所有数据操纵语言 (DML) 更改(例如从指定数据库和表进行的插入、更新和删除操作)都会复制。
  • Datastream 将已提交和(在某些情况下)未提交的变更复制到目标位置。Datastream 读取未提交的变更。如果回滚,则 Datastream 输出记录还包括相反的操作。例如,如果存在回滚的 INSERT 操作,则输出记录也将包含相应的 DELETE 操作。在这种情况下,该事件将显示为仅包含 ROWIDDELETE 事件。

版本

Datastream 支持以下版本的 Oracle 数据库:

  • Oracle 11g,版本 11.2.0.4
  • Oracle 12c,12.1.0.2 版
  • Oracle 12c,12.2.0.1 版
  • Oracle 18c
  • Oracle 19c
  • Oracle 21c

Datastream 支持以下类型的 Oracle 数据库:

  • 在本地或任何云服务提供商自托管
  • Amazon RDS for Oracle
  • Oracle Cloud
  • Oracle Exadata
  • Oracle RAC

设置

要设置来源 Oracle 数据库,以便将来自该数据库的数据流式传输到目标位置,您必须配置数据库以授予访问权限、设置日志记录、定义保留政策等。

请参阅配置 Oracle 源数据库,了解如何配置此数据库,以便 Datastream 能够将数据从该数据库拉取到目标数据库。

已知限制

将 Oracle 数据库用作来源的已知限制包括:

  • 除非满足以下条件,否则无法回填包含超过 5 亿行的表:
    1. 该表具有唯一索引。
    2. 此索引还必须是 B 树,后者是默认索引。索引可以是复合型。
    3. 索引不可反转。
    4. 索引不能包含基于函数的列。
    5. 索引的所有列都不是可为 null。
    6. 索引不包含 DATE 类型且值中包含负数日期的列。
    7. 流中包含索引的所有列。
  • 数据流限 10,000 个表。
  • Datastream 支持 Oracle 多租户架构 (CDB/PDB),但您只能在数据流中复制单个可插入数据库。
  • 不支持 Oracle 自治数据库。
  • 对于没有主键的表,Datastream 会使用该行的 ROWID 在使用方端执行合并操作。请注意,ROWID 可能不是唯一的。例如,如果您使用 Oracle 的导出/导入实用程序删除并重新插入某行,则该行的 ROWID 可能会更改。如果您删除一行,则 Oracle 可将其 ROWID 重新分配给稍后插入的新行。
  • 不支持索引整理表 (IOT)。
  • 不支持临时表。
  • 对于 BFILE 类型的列,仅复制文件的路径。系统不会复制该文件的内容。
  • 数据类型为 ANYDATAINTERVAL DAY TO SECONDINTERVAL YEAR TO MONTHLONG/LONG RAWSDO_GEOMETRYUDTUROWIDXMLTYPE 的列不受支持,它们会替换为 NULL 值。
  • 如需流式传输大型对象数据类型(例如二进制大型对象 (BLOB)、字符大型对象 (CLOB) 和国家字符大型对象 (NCLOB))的列,您需要在数据流配置中添加 streamLargeObjects 标志。如果您不添加此标志,Datastream 不会流式传输此类列,并且会在目标位置将其替换为 NULL 值。如需了解详情,请参阅为 Oracle 来源启用大型对象的流式传输
  • 对于 Oracle 11g,不支持列的数据类型为 ANYDATAUDT 的表,并且不会复制整个表。
  • 不复制 Oracle 标签安全 (OLS)。
  • Datastream 在处理事件时定期从来源提取最新的架构。如果架构发生更改,则在仍然应用旧架构的同时,系统可能会读取新架构中的某些事件。在这种情况下,Datastream 会检测架构更改,触发架构提取,并重新处理失败的事件。
  • 并非所有对源架构的更改都可以自动检测到,在这种情况下可能会发生数据损坏。以下架构更改可能会导致数据损坏或无法处理下游事件:
    • 删除列
    • 在表中间添加列
    • 更改列的数据类型
    • 对列重新排序
    • 删除表(如果同一表被重新创建并添加了新的数据,则与此相关)
    • 截断表
  • Datastream 不支持复制视图。
  • Datastream 支持具体化视图。但是,在直播过程中创建的新视图不会自动回填。
  • SAVEPOINT 语句不受支持,在回滚时可能会导致数据差异。
  • Datastream 支持 Oracle 数据库的以下字符集编码:
    • AL16UTF16
    • AL32UTF8
    • IN8ISCII
    • JA16SJIS
    • US7ASCII
    • UTF8
    • WE8ISO8859P1
    • WE8ISO8859P9
    • WE8ISO8859P15
    • WE8MSWIN1252
    • ZHT16BIG5
  • Datastream 不支持复制零日期值。此类日期会替换为 NULL 值。
  • 生成非常大的日志文件可能会导致 Datastream 超时,进而导致数据流失败。建议的重做日志文件大小小于 1GB。
  • 在 Oracle 实时应用集群 (RAC) 环境中,Datastream 不支持使用单客户端访问名称 (SCAN) 功能直接连接到数据库。如需了解潜在解决方案,请参阅 Oracle 源行为和限制