博客 Docker搭建Kafka集群

Docker搭建Kafka集群

数栈君发表于 2023-08-03 10:33 887 0

对于个人开发者而言，一般手头上没有多台服务器，有人可能会有云服务器，不过一般也只会买一台来用用就好；有人可能更习惯将本机当作服务器来玩。都可以。那么如何通过一台服务器或本机来搭建Kafka集群呢？

无外乎两种方式，一是通过docker来搭建，每台kafka broker用不同的端口来启动，即可组成集群；二是通过虚拟机来搭建，即用VMware在服务器或本机上启动多台虚拟机，每台虚拟机都安装一个kafka broker。笔者采用的是第一种方式。

1、环境说明及架构说明

Linux系统：centos 8

Zookeeper：wurstmeister/zookeeper

Kafka：wurstmeister/kafka

如下图，笔者准备搭建一台Zookeeper以及三个Kafka broker组成的Kafka Cluster。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/96f8a401e95bf75445cc50d8a7fe8df4..png

2、docker搭建Zookeeper

（1）查看镜像

首先用docker search命令来查找docker上有哪些可用的Zookeeper镜像。

docker search zookeeper

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/a84cfdb8ebeb23f2dca0d56d9d90a611..png

照理说，镜像最好选择官方镜像，也就是上图中的第一个。但是笔者这里选择第二个镜像wurstmeister/zookeeper，那是因为我发现用docker查找Kafka的镜像时是没有官方镜像的，而Kafka镜像中排在第一的也是以wurstmeister为开头的。也就是说，这两个镜像是出自同一家机构或个人的。

（2）拉取镜像

然后拉取镜像，默认拉取最新版本的。

docker pull wurstmeister/zookeeper

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/214abe5063ff113d813cb3d9b41f5260..png

（3）启动镜像

docker run -d --name zookeeper -p 2181:2181 -t wurstmeister/zookeeper

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/8bdd7eaaa73737c210a1df747973b71f..png

3、docker搭建Kafka Cluster

启动好了Zookeeper服务之后，来开始搭建Kafka Cluster了。

（1）查找镜像

同样用docker search命令来查找Kafka的镜像，这里有个小插曲，笔者发现个问题。

直接用docker search查找，结果集中并未有wurstmeister/kafka，而用

docker search kafka --limit=50

这条命令查找，结果集的第一条就是wurstmeister/kafka，且收藏数最多。也就是说，docker search这条命令返回的结果集在默认情况下是有条数限制的。但奇怪的是，就算有条数限制，为什么不按照收藏量（STARS）优先返回镜像的结果集呢？这个疑惑暂且放下，知道的同学麻烦在评论区告知一下哈。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/0e633fccd69030fa419425d5b41c308b..png

（2）拉取镜像

docker pull wurstmeister/kafka

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/08a418fae777156ec6dcd8b198da9572..png

（3）启动三个broker

命名为：kafka0 端口：9092 brokerId: 0

docker run -d --name kafka0 -p 9092:9092 -e KAFKA_BROKER_ID=0 -e KAFKA_ZOOKEEPER_CONNECT=xxx:2181 -e KAFKA_ADVERTISED_LISTENERS=PLAINTEXT://xxx:9092 -e KAFKA_LISTENERS=PLAINTEXT://0.0.0.0:9092 -t wurstmeister/kafka

命名为：kafka1 端口：9093 brokerId: 1

docker run -d --name kafka1 -p 9093:9093 -e KAFKA_BROKER_ID=1 -e KAFKA_ZOOKEEPER_CONNECT=xxx:2181 -e KAFKA_ADVERTISED_LISTENERS=PLAINTEXT://xxx:9093 -e KAFKA_LISTENERS=PLAINTEXT://0.0.0.0:9093 -t wurstmeister/kafka

命名为：kafka2 端口：9094 brokerId: 2

docker run -d --name kafka2 -p 9094:9094 -e KAFKA_BROKER_ID=2 -e KAFKA_ZOOKEEPER_CONNECT=xxx:2181 -e KAFKA_ADVERTISED_LISTENERS=PLAINTEXT://xxx:9094 -e KAFKA_LISTENERS=PLAINTEXT://0.0.0.0:9094 -t wurstmeister/kafka

【Attention：以上三条命令中的xxx用自己的服务器ip替换】

执行上面三条命令后，分别在9092 / 9093 / 9094三个端口启动了kafka broker，执行docker ps查看结果。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/b1b6a7c6c9b8b1948d043641e402ccac..png

至此，三个broker节点的Kafka集群搭建完成。

（4）小插曲：kafka启动失败

笔者一开始在启动kafka的时候，一直启动失败。报错如下：

kafka.zookeeper.ZooKeeperClientTimeoutException: Timed out waiting for connection while in state: CONNECTING

大概翻译过来就是kafka服务在启动的时候连接Zookeeper服务超时，说白了，就是连不上。

btw，如果容器没起来的话，无法通过docker exec进入容器查看容器日志，此时可以用

docker logs 容器id 查看docker容器的日志（注意是容器id，并不是镜像id）。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/5f4ebe63a4353f6e69f0f78f75a0b110..png

笔者在这个问题上搞了将近一个小时，才想起来是云服务器的网络安全组的规则忘记配置了。

于是立马登上云服务器配置了一下，然后kafka就能启动成功了。

4、效果测试

执行docker exec命令随意进入一个broker的容器内，再进入opt目录。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/b593001773b8fa948ee270064685e7d7..png

进入opt目录后发现有两个kafka，对比了一下，两个kafka目录差不多，都有bin下的各种可执行脚本，都有config下的各种properties配置文件。这里，笔者选择了kafka_2.13-2.8.1目录。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/6ddb8c54f52c37de18e43c1f6b9e5c14..png

笔者创建了一个名为 topic-demo 的主题，该主题有3个分区，3个副本因子。

从 describe 命令可以看到3个分区均匀地分布在三个broker中。可见，这三个broker已经成功地组成了Kafka集群了。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/5958b382a78d2607ce8c2e17d524db8b..png

免责申明：

本文系转载，版权归原作者所有，如若侵权请联系我们进行删除！

《数据治理行业实践白皮书》下载地址：https://fs80.cn/4w2atu

《数栈V6.0产品白皮书》下载地址：https://fs80.cn/cw0iw1

想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友，浏览袋鼠云官网：https://www.dtstack.com/?src=bbs

同时，欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」，交流最新开源技术信息，群号码：30537511，项目地址：https://github.com/DTStack

0条评论

上一篇：浅析百万级分布式调度引擎——DAGScheduleX能做...

下一篇：kafka发送数据报错： Error connectin...

我要提问

分享经验

社区公告

大数据领域最专业的产品&技术交流社区，专注于探讨与分享大数据领域有趣又火热的信息，专业又专注的数据人园地

最新活动更多

Docker搭建Kafka集群

1、环境说明及架构说明

2、docker搭建Zookeeper

（1）查看镜像

（2）拉取镜像

（3）启动镜像

3、docker搭建Kafka Cluster

（1）查找镜像

（2）拉取镜像

（3）启动三个broker

（4）小插曲：kafka启动失败

4、效果测试

我要提问

分享经验

微信扫码获取数字化转型资料