kafka高吞吐量之消息壓縮_ _ 頭條網

背景

保證kafka高吞吐量的另外一大利器就是消息壓縮。就像上圖中的壓縮餅乾。

壓縮即空間換時間，通過空間的壓縮帶來速度的提升，即通過少量的cpu消耗來減少磁盤和網絡傳輸的io。

消息壓縮模型

消息格式V1

kafka不會直接操作單條消息，而是直接操作一個消息集合。

消息格式V2:

1, 抽取了消息的公共部分放到消息集合中；去掉每條消息的公共部分，減少了總體積。

2，消息的CRC校驗由對每一條消息，移動到了對消息集合進行校驗，減少了校驗次數，節省了cpu;

3, 對單個消息進行壓縮，放到消息的body字段 pk 對消息集合整個進行壓縮更好的壓縮效果；

壓縮過程模型

壓縮算法比較

如何衡量一個壓縮算法的好壞。

常見的壓縮算法對比：

Zstandard 算法（簡寫為 zstd）。它是 Facebook 開源的一個壓縮算法，能夠提供超高的壓縮比

啟用壓縮場景

如果cpu負載比較高，不適合啟用壓縮；

如果帶寬不足，而cpu負載不高，最適合啟用壓縮，節約大量的帶寬；

儘量避免消息格式不一致帶來的解壓縮消耗。

小結

壓縮的目的是較少空間佔用，帶來傳輸速度的提升，但是需要消耗一定的cpu ；

是一種提高kafka消息吞吐量的有效辦法。

本節回顧了新版的kafka是如何對消息進行壓縮的，壓縮和解壓縮的流程是怎樣的，

然後對比了常見的4種壓縮算法，根據具體的使用場景來選擇是否啟用壓縮，以及選擇合適的壓縮算法。

然後給出了壓縮的配置參數，在producer和borker端都可以使用compression.type來設置。

我會持續分享Java軟件編程知識和程序員發展職業之路，歡迎關注！原創不易，點贊關注支持一下吧！轉載請註明出處，讓我們互通有無，共同進步，歡迎溝通交流。

背景

消息壓縮模型

壓縮算法比較

小結

相關文章:

潛逃壓力過大暴瘦40多斤，一涉黑A級通緝犯在河北投案自首

當我們在談 SaaS 的時候，在談什麼？

合同詐騙的類型有哪些？企業無力償還借款是否構成合同詐騙罪？

5月西安招聘會時間安排來了！找工作的別錯過

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

全球鬧「美元荒」帶動穩定幣需求暴增！以太坊交易量創近兩年新高

“幫助當地居民解決用水難題”-今日頭條-手機光明網

灌籃高手無水印壁紙，每一張都是回憶

通遼藍天救援隊成功解救遼河公園水上被困群眾

5月6日·武漢要聞及抗擊肺炎快報

肖副省長等省市領導到孝感市楚澴中學調研九年級復學暨疫情防控常態化工作

相聲界的顏值擔當張雲雷稱號大揭祕

美國百年薅羊毛攻略

《全職高手》：一口氣刷了10集，對楊洋路轉粉了

共同承擔責任！Rookie談BP問題：輸了是我們打得太臭

LOL"中韓對抗賽"遭選手反對？Zoom直言不想打，Doinb的回答太真實

李亞鵬攜李嫣出席慈善晚會，李嫣手上鑽戒搶鏡，1個動作獲誇讚！

53歲郭富城再度升級當爸，方媛懷二胎，Chant要做姐姐了

那些拼命的演員：王寶強喝了一大桶牛奶，孫儷吃10斤瓜子

賈乃亮用上了“一米陽光”這個詞，他依然渴望擁有美麗的愛情！

搞笑GIF開心一刻：我的老家農村，有妹子願意嫁給我嗎？

為什麼只有edg賺錢？

程瀟身材多好？雙腿劈叉才明白，這才是“腿精”

張柏芝承認三胎產子，否認小夥的老爸是孫東海，看來她選擇保密

T1戰隊搶注Faker商標，“囊括多個領域產品，商業潛力媲美喬丹”

雲頂之弈“最不平衡的版本”誕生，全員搶一費卡，運氣成吃雞關鍵

LPL春季賽"6宗最"：Uzi最遺憾，阿水最驚喜，V5最離譜

雷佳音被問：跟佟麗婭拍那麼多親熱戲是啥感受？他的回答笑翻眾人

JDG成最“慘”冠軍戰隊？拿到LPL冠軍人氣依舊低迷，TES成贏家！

#戰疫必勝#“症和狀”都有了，我與新冠擦肩而過

T1提議中韓友誼賽，但LPL隊伍都不想參加？理由其實很簡單

網友投稿：光山縣潑陂河鎮至白雀園鎮的X015縣道德兩座壞橋經過5個月的等待終於開修啦#光山 #信陽

2020最佳韓劇追起來~《愛的迫降》僅排名第二，TOP 1絕對實至名歸

搞笑GIF開心一刻：我正在睡覺，誰敢打擾我

備考消防的幾大錯覺，你有這個情況嗎？

“頂流”李敏鎬啞火，渣男出軌劇出圈，韓劇觀眾也長大了？

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

應急科普丨“五一” 期間氣溫回升 謹防森林火災隱患

搞笑GIF開心一刻：拍照啦，趕緊看鏡頭

工程發承包、工程造價條款，或迎來大調整

應急科普丨“五一” 期間氣溫回升謹防森林火災隱患