FlinkX是一个基于Flink的批流统一的数据同步工具,既可以采集静态的数据,比如MySQL,HDFS等,也可以采集实时变化的数据,比如MySQL binlog,Kafka等。同时,FlinkX也是支持原生FlinkSql所有语法和特性的计算框架,并且提供了大量案例。FlinkX目前包含下面这些特性:1)大部分插件支持并发读写数据,可以大幅度提高读写速度;2)部分插件支持失败恢复的功能,可以从失败的位置恢复任务,节约运行时间;3)关系数据库的Source插件支持间隔轮询功能,可以持续不断的采集变化的数据;4)部分数据库支持开启Kerberos安全认证;5)可以限制source的读取速度,降低对业务数据库的影响;6)可以记录sink插件写数据时产生的脏数据;7)可以限制脏数据的最大数量;8)支持多种运行模式;9)同步任务支持执行flinksql语法的transformer操作;10)sql任务支持和flinkSql自带connectors共用
第一节讲师:江博丨袋鼠云数栈高级大数据运维工程师