问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

Kafka升级v1.1的错误以及性能总结

发布网友 发布时间:2023-05-26 02:10

我来回答

1个回答

热心网友 时间:2024-10-21 23:25

最近部门使用的Kafka从v0.8.2升级到v1.1.1,遇到了几个错误,记录一下。

在灰度procer的时候,遇到了这个问题。
[org.apache.kafka.common.errors.TimeoutException](http://org.apache.kafka.common.errors.timeoutexception/): Failed to update metadata after 60000 ms.
以为是哪里配置问题,百思不得其解。因为我们业务会比较特殊,会在procer端cache数据到一定量级再send,以为是msg过大导致的,调试了许多参数都不见效。后面查阅github上相关问题看到一个说发送到错误的topic的时候会报错。会去查看的时候才我们集群的自动创建topic功能关了,我们是手动上去创建的,创建错了导致metadata一致获取不到。
竟然没有明显的提示,只是提示metadata获取超时,也是很坑。

灰度完procer以后,在灰度consumer的时候,发现对应的数据偶尔会由突刺现象,上去consumer端看日志的时候,发现了对应的error log
[2020-04-07 22:56:35] [ERROR][org.apache.kafka.clients.consumer.internals.ConsumerCoordinator:... Offset commit failed on partition [topic-partition] at offset 277387: The request timed out.]
[2020-04-07 22:43:58] [WARN] [org.apache.kafka.clients.consumer.internals.ConsumerCoordinator:... failed: Commit cannot be completed since the group has already rebalanced and assigned the partitions to another member. This means that the time between subsequent calls to poll() was longer than the configured max.poll.interval.ms, which typically implies that the poll loop is spending too much time message processing. You can address this either by increasing the session timeout or by recing the maximum size of batches returned in poll() with max.poll.records.]
根据log提示,加大了 max.poll.interval.ms 以及降低了 max.poll.records 的值,只有好转但是没有彻底的变好。翻阅官方日志发现 max.poll.interval.ms 的默认值已经很大了是5min,不可能是配置的问题导致的。由于有了procer灰度时遇到的事情的经历,我猜想是不是哪里又遇到什么幺蛾子了,于是上去看broker端log,只有consumer离开集群的这种日志。迫不得已去跟组内运维同学请教,他上去看了才发现一台机器的磁盘有问题,导致offset偶尔提交会失败。

我们升级v1.1是为了使用LZ4的压缩算法。通过前后比较,发现对于broker端的流量流入能少50%以上,理论上可以只使用一半的机器就可以应付之前的数据量级了。对于procer端以及consumer端,procer没看到明显的吞吐下降,倒是由于consumer端需要解压,poll的耗时加了不少,但是我们consumer在没增加的情况下依旧抗下了之前的数据量级。总体来说提升还是很大的。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
怎么养好四季海棠? 西安财神庙攻略,西安旅游攻略财神庙路线 漯河食品职业学院是几本 漯河食品职业学院是985还是211 做无痛人流的危害 地暖水压能保持多久 地暖水压维持时间有多长 海棠花开完花后该怎么处理 漯河食品职业学院为什么能升本 漯河食品职业学院质量检验系培养目标 漯河食品职业学院是谁建的 直接税和间接税的划分依据是( )。 数字俗语填词 三个数字俗语 火影忍者羁绊6.92伤害最高的英雄 火影忍者羁绊6.95哪个英雄厉害 联通炫铃是干嘛的 梦见能力前妻跟我一起吃饭的预兆 老公的前妻来我家饭店吃饭、我真是服了 老公的前妻约他吃饭,我要去吗 短视频与运营去哪里学好? 实际推广效果与短视频质量有关4-24次是啥意思 在大城市生活有哪些利好? 兴福的诗句兴福的诗句是什么 门“臻”百福是什么意思? eccp是什么组织? dlvlded什么牌子衣服 dlvldcd是哪个国家的牌子什么价位的? 潜在义务是什么意思 ...或有事项只可能是潜在义务,不可能是现时义务吗?还有“ 高校会计教育数字化转型背景和意义 何谓「众生,本来成佛」 佛本是我,我本是佛!何解? 一切众生本来是佛,为什么又堕入人道? 唐陂的解释唐陂的解释是什么 两个人名字相差数字看感情 名字29画是什么命运? 取姓名女孩名字 女孩总格29画的名字好不好? 名字与财运 产品原理图是什么 卡诗洗发水怎么打开瓶盖 卡诗洗发水可以天天用吗 支撑的诗句支撑的诗句是什么 索尼微单6300可以连领夹麦吗 三国杀OL怎么玩 常见套路解析 村级报账员如何当好参谋助手 侍从的反义词 侍从的反义词是什么 cdr一个图形在两个框中间,如何导出另一个框的内容 冬小_的结构冬小_的结构是什么 什么是中国历史上现存的第一部最系统完整的兵书 中立是什么意思 绝对中立是什么意思 我看网上有恶搞图片上写着守序邪恶,绝对中立,混乱善良等等词语... 如何理解公务员的“中立”原则