深入解析:DB2 V10.5新特性列式存储表的优点与缺点

  • 时间:
  • 浏览:1
  • 来源:神彩大发快3_彩神大发快3官方

原文发布时间为:2018-07-18

本文作者:李培杨

本文来自云栖社区合作者者伙伴“数据和云”,了解相关信息还里可不可以 关注“数据和云”。

相对于列存储,行存储的好处是增加修改数据容易,适合于 OLTP 事务型应用。列存储表在进行查询的然后 里可不可以 占用絮状的内存,并肩列存储表中的数据是按照列存储的,就是我的组织土依据不太适合查询单行可能性几行数据,这就决定了列存储表不适合 OLTP 的系统,然后 不会所有的表都适合转加带列存储表。然后 在有些场景下,比如数据仓库,在对数据进行查询时还里可不可以 实现数据跳读,从而进一步降低数据库的 IO,提升查询的性能。

将数据导入 testinfo 中。

用户在那末指定 organize by 的情况报告下还里可不可以 将数据库参数 dft_table_org 设置为 COLUMN,缺省就是我创建列组织表。

测试自动回收空间

4.5行组织表与列组织表的对比

3.列存储使用环境

4.2创建列组织测试表

列存储主要适合 OLAP 类型应用,比如数据仓库系统,数据挖掘系统,决策支持系统等。那些系统有有些并肩型态:数据量大,查询句子比重大,僵化 的查询多。

4.3加带数据

有挑选的导出 employee 的数据。

5.3良好的压缩比

当 UTIL_HEAP_SZ 足够大,能使得在转加带列存储表然后 获取很好的压缩比。对于传统的压缩技术了来讲,还里可不可以 很大程度的节省存储,有些压缩算法甚至还里可不可以 可不可以 可不可以 解压缩而实现对数据的直接操作,节省了解压缩的开销,从而降低了对 CPU 的消耗。经过优化后的数据库,有些有些压缩数据会存储在内存中,减少查询时消耗的内存资源。

官方文档上描述的是将 DB2_WORKLOAD 注册表变量设置为 ANALYTICS,更改后重启便会生效。就是我做有有助于于配置内存、表组织、页大小和扩展数据块大小,然后 会启用工作负载管理。

5.2 减少 IO

在有些环境下,对于行存储是按行存放的,在读取的然后 里可不可以 将整行的数据都读出,就是我无形中增加了数据的 IO。而列存储的存储土依据是按列存储,任何列都还里可不可以 作为索引,只读出所需访问的列,读取时冗余很少,从而减少了 I/O,提高了性能。

2.列组织表的管理土依据

列组织表技术是 DB10.5 BLU 引入的新技术,按列组织的表,更加方便了僵化 的查询,可能性将这俩 表格式与星型模式数据集市配合,那末还里可不可以 僵化 设计和调优,从而显著改进存储性能、查询性能和易用性

还里可不可以 看后行组织模式的表是不会存倒进并肩的,而列组织模式的表是被分开保存的。

创建列组织表

1.那些是列组织表

4.4查询数据

然后 对数据进行查询。

Number of rows exported: 42

同样的查询在行组织表与列组织表的区别,在进行全表扫描,可能性十有几个 列全扫描的然后 ,列组织表还里可不可以 发挥出很大的优势,在列式存储中这类型的数据存倒进同有有有有4个block顶端,压缩性能比较好。然后 在列式存储中,任何列都还里可不可以 作为索引。

6.2不支持 GBK 字符集

然后 在 DB2 中,列式存储只支持数据库 UTF-8 然后 国家地域里可不可以 为 cn。可能性unicode顶端好像不支持 GBK,可能性是 GBK 字符集的数据库,创建列组织表的然后 直接会报错,提示该数据库的字符集不支持。



4.要怎样启用列存储

7.总结

6.1筛选条件限制

可能性查询中含筛选条件,就是我列式存储无须就能发挥相应的优势,然后 相对资源消耗可能性会比行式存储更高。

5.列式存储优点

6.3里可不可以 存储于自动存储表空间

里可不可以 将列存储表存储在自动存储的表空间顶端。

5.1自动回收空间

当 DB2_WORKLOAD 设置成 ANALYTICS 的然后 ,对于列组织表默认会开启 reorg,这俩 然后 DB2 的列组织表就会居于有有有有4个自动维护的情况报告。DBA 就是我用再对有些表进行定期的 reorg 操作,然后 存储空间支持在线释放,不需要影响系统的正常运行。

6.列式存储缺点

4.1更改环境变量