在添加、删除或更新表行时,列式引擎不会立即更新列存储区中的数据。相反,它会将列存储区中受影响的内容标记为无效,并使用来自列存储区的面向列的数据及来自行缓存和数据库存储的面向行的数据,来规划和执行查询。
随着时间的推移,随着越来越多的数据块变为无效,列式引擎提供的查询性能改进会降低到需要刷新列式数据才能重新获得查询性能改进的程度。达到此刷新阈值后,列式引擎会使用后台作业刷新列存储区中的无效数据。默认情况下,列式引擎使用的刷新阈值为 50,这表示当列存储区中 50% 的内容变为无效时,系统会将该存储区中的给定内容标记为需要刷新。您可以更改此刷新阈值,以调整自动刷新的开销,并可能针对您的应用工作负载获得更好的持续查询性能。
此外,您还可以随时手动刷新列存储区中的表数据。通常,当您希望在对表进行更改后尽快在列存储区中反映相应更改时,可以执行手动刷新。
更改列式引擎的刷新阈值
修改 google_columnar_engine.refresh_threshold_percentage
数据库标志的值,以更改列式引擎的刷新阈值。
ALTER SYSTEM SET google_columnar_engine.refresh_threshold_percentage=THRESHOLD;
THRESHOLD
:介于 1
到 100
之间的整数值。此值指定内容中必须有相应百分比的数据块变为无效,才会将内容标记为需要刷新。
在列存储区中手动刷新表的数据
执行 google_columnar_engine_refresh
SQL 函数以手动刷新内存中列存储区中表的数据。
SELECT google_columnar_engine_refresh(TABLE_NAME);
TABLE_NAME
:包含表或物化视图名称的字符串。如果表或视图处于 public
以外的架构中,请使用 SCHEMA_NAME.TABLE_NAME
格式指定架构名称,例如 myschema.mytable
。