你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!
首页
问答
博客
课程
活动
资料中心
注册/登录
IO开销
全部内容
精华
推荐
我的收藏
关于话题
没有找到相关结果
Spark小文件合并优化参数详解与实现技巧
知识百科
•
数栈君
发表了文章 • 0 个评论 • 3 次浏览 • 1 天前
• 来自相关话题
在使用 Apache Spark 处理大规模数据时,小文件(small files)问题是一个常见的挑战。小文件通常指的是大小远小于 Hadoop 分块大小(默认 128MB)的文件,这些文件会导致 Spark 作业的性能下降,增加 IO 开销,并影响集群资源... ...
查看全部
Spark小文件合并优化参数详解与实现技巧
知识百科
•
数栈君
发表了文章 • 0 个评论 • 3 次浏览 • 1 天前
• 来自相关话题
在使用 Apache Spark 处理大规模数据时,小文件(small files)问题是一个常见的挑战。小文件通常指的是大小远小于 Hadoop 分块大小(默认 128MB)的文件,这些文件会导致 Spark 作业的性能下降,增加 IO 开销,并影响集群资源... ...
查看全部
更多...
话题描述
相关话题
0 人关注该话题