日常生产中 HDFS 上小文件产生是一个很正常的事情,同时小文件也是 Hadoop 集群运维中的常见挑战,尤其对于大规模运行的集群来说可谓至关重要。数据地图是离线开发产品的基本使用单位,包含全部表和项目的相关信息,可以对表做相关的权限管理和脱敏管理操作,以及可以展示对应项目占用情况和其表的占用情况。数据地图可以帮助用户更好地查找、理解和使用数据。本文将结合两者,和大家聊聊数据地图中的小文件治理应该...
本月ChunJun 开始规划新一期的迭代内容。大家在过去使用过程中遇到哪些场景是急需解决的?哪些使用起来是不易用的?只要有想法,都可以发出来。我们一起来把ChunJun 完善起来