问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

ClickHouse数据压缩

发布网友 发布时间:2022-10-07 18:15

我来回答

1个回答

热心网友 时间:2023-10-28 23:58

ClickHouse支持多种方式的数据压缩:LZ4和ZSTD。
关于压缩算法的测试,见 这篇文章 。简而言之,LZ4在速度上会更快,但是压缩率较低,ZSTD正好相反。尽管ZSTD比LZ4慢,但是相比传统的压缩方式Zlib,无论是在压缩效率还是速度上,都可以作为Zlib的替代品。
下面我们对比一下这两种压缩方式。压缩测试所用的表(lineorder)结构和数据来自 这里 。未压缩的数据集是680GB。
把上述数据加载到ClickHouse后,默认的LZ4压缩算法下,数据容量是184G(压缩到27%),而ZSTD达到了135GB(压缩到20%)。
如果想要使用ZSTD压缩方式,修改为如下配置即可:

压缩比率对比

压缩后的查询性能如何,我们来跑如下查询看看:

为了保持客观,查询测试会跑两次,第一次是冷数据请求,这次的数据没有被操作系统缓存,第二次是热数据情求,这次的数据已经被操作系统的内存缓存了。
LZ4的性能如下:

ZSTD性能如下:

冷数据查询情况下,两者区别不大,因为消耗在IO方面的时间,远大于消耗在数据解压缩上面的时间。
热数据请求下,LZ4会更快,此时IO代价小,数据解压缩成为性能瓶颈。
综上所述,默认的LZ4压缩方式,会给我们提供更快的执行效率,但是同时需要占用较多的磁盘容量。
ClickHouse抛开高效的SQL执行效率,数据压缩比率也是一个非常喜人的地方。使用Hadoop Node低配置服务器,再加上ClickHouse优秀的压缩性能,单机容量轻松可达几十T,推荐直接使用默认的LZ4压缩方式,用可以接受的少量空间来换查询执行效率的提升。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
单位高温防护欠缺致员工中暑如何对待 狗狗为什么爱看视频 360浏览器怎么设置倍速播放 ...先讲女主的灵魂飘荡了一段时间,然后重生,请问是那本? 拯救者散热器怎么开 电脑如何一键还原系统电脑一键还原怎么操作 神舟笔记本电脑怎么重新设置神舟战神bios恢复出厂设置 神舟电脑恢复出厂设置神舟战神怎么恢复原厂系统 水泥楼梯如何铺木楼梯 家里面楼梯是水泥的不想铺地毯或者地砖还能铺什么 克服用日语怎么说 问:只有克服困难,才能成功 日语怎么说 问:只有不断克服困难,每天坚持不懈的努力,才能获得成功 日语怎么说 张祜《何满子》全文及赏析 宫词选一唐诗原文 中国银行信用卡邮递查询 华为荣耀盒子和小米盒子哪个好 详细解析 android 修改系统设置页面 WOW 巨魔LR,为什么我做抓宠物那个第2个任务时候,总是说无效的目标? 怎么拒消息但不拉黑 冰雪运动手抄报 未来手机3.5mm耳机孔将成为历史吗? 为什么天猫退款成功,但没收到退款 蛋糕机做cb认证有哪些申请流程,cb认证怎么查询 企鹅萌萌app怎么用不了 东北平原的平原介绍 关系较好的朋友对自己有意见,我该怎么处理呢? 和平精英走着不回头怎么看到后面的人? 当一个人对你有意见后,你应该跟他说明嘛? 一个人对你有意见,你应该怎样去面对? 茶叶铁盒内涂层有毒吗? 科西破壁机有假货吗 如何使用voiceover 器怎么读 汉字器怎么读 初次性生活进不去怎么办? 阳历328生日阴历是几号 手游版英雄杀虞姬在商城里有点买么,三星的。。还是说只能买皮肤获得呢,买皮肤获得值得么 活烧饼面的配方? ip是指什么技术? 如何在EXCEL表格中:A1是时间,B1就显示“时间”;如果A1是日期,B1就显示“日期”;否则就显示空白? 手游英雄杀虞姬皮肤可以免费领吗 ip与atm技术为什么要进行融合 QQ自由幻想的各职业的属性点和技能点咋加? 英雄杀虞姬睡衣动态值不值得买 孩子初中记忆力差怎么办 怎么快速提高记忆力方法 医用面罩怎样清洗的更明亮 在回忆也没有用是哪首歌的歌词? 有首歌的一句歌词是连个借口都没有 歌曲 连借口都没有 是什么时候出的. 有句歌词叫就连转身都不回头对不起是什么歌曲