前言
Apache Kafka是由Apache软件基金会开发的一款开源消息系统项目,主要使用Scala语言编写。该项目旨在为处理实时数据提供一个统一、高通量、低等待的平台。Kafka作为一种分布式的、分区的、多复本的日志提交服务,凭借其独特的设计提供了丰富的消息系统功能。
特点
- 高吞吐量:同时为发布和订阅提供高吞吐量,每秒可以生产约25万消息(50 MB),每秒处理55万消息(110 MB)。
- 数据持久化:Kafka支持将消息持久化到磁盘,因此可用于批量消费,例如ETL,以及实时应用程序。通过将数据持久化到硬盘以及replication防止数据丢失。
- 分布式系统:Kafka是分布式系统,易于向外扩展。所有的producer、broker和consumer都会有多个,均为分布式的。消息被处理的状态是在consumer端维护,而不是由server端维护。
- 可靠性:Kafka的分布式结构使其能够存储数据并构建多台Kafka Server集群。在生产数据时,这些数据会被分布式存放。每个主题Topic都可以有多个分区,当生产者往主题中生产数据时,会写入不同的分区,每个分区存储在不同的机器上。
- 可扩展性:Kafka支持横向扩展,如果需要更多的处理能力,只需增加更多的机器即可。
- 耐用性:Kafka中的数据分区存储在每台机器的磁盘上,因此数据存储在Kafka中不易丢失。
- 性能:Kafka采用顺序读写硬盘的策略,不使用寻址磁盘的策略,这使得它在处理大量数据时性能出色。
现在,让我们深入了解Apache Kafka的实战操作!
由于整个PDF文档比较全面,内容比较多,篇幅不允许,下面以截图方式展示 。如有需要获取资料文档的朋友可以在文章末尾获取
第1章 认识Apache Kafka
1.1 Kafka快速入门
1.2 消息引擎系统
1.3 Kafka概要设计
1.4 Kafka基本概念与术语
1.5 Kafka使用场景
第2章 Kafka发展历史
2.1 Kafka的历史
2.2 Kafka版本变迁
2.3 如何选择Kafka版本
2.4 Kafka与Confluent
第3章 Kafka线上环境部署
3.1 集群环境规划
3.2 伪分布式环境安装
3.3 多节点环境安装
3.4 验证部署
3.5 参数设置
第4章 producer开发
4.1 producer概览
4.2 构造producer
4.3 消息分区机制
4.4 消息序列化
4.5 producer拦截器
4.6 无消息丢失配置
4.7 消息压缩
4.8 多线程处理
第5章 consumer开发
5.1 consumer概览
5.2 构建consumer
5.3 订阅topic
5.4 消息轮询
5.5 位移管理
5.6 重平衡(rebalance)
5.7 解序列化
5.8 多线程消费实例
5.9 独立consumer
第6章 Kafka设计原理
6.1 broker端设计架构
6.2 producer端设计
6.3 consumer端设计
6.4 实现精确一次处理语义
第7章 管理Kafka集群
7.1 集群管理
7.2 topic管理
7.3 topic动态配置管理
7.4 consumer相关管理
7.5 topic分区管理
7.6 Kafka常见脚本工具
7.7 API方式管理集群
7.8 MirrorMaker
7.9 Kafka安全
第8章 监控Kafka集群
8.1 集群健康度检查
8.2 MBean监控
8.3 broker端JMX监控
8.4 clients端JMX监控
8.5 JVM监控
8.6 OS监控
8.7 主流监控框架
第9章 调优Kafka集群
9.1 引言
9.2 确定调优目标
9.3 集群基础调优
9.4 调优吞吐量
9.5 调优延时
9.6 调优持久性
9.7 调优可用性
第10章 Kafka Connect与Kafka Streams
10.1 引言
10.2 Kafka Connect
10.3 Kafka Streams
文末
Kafka是一个分布式的、分区的、多复本的日志提交服务。它通过独特的设计,提供了一系列消息系统的功能。现在,让我们深入了解Apache Kafka的实战操作!
如果你需要完整版PDF学习资源请扫描下方名片100%获取免费下载方式!
👇👇点击下方名片👇👇
猜你喜欢
网友评论
- 搜索
- 最新文章
- 热门文章