大数据处理技术(第4版)。本书以“大信息”为视角,从大数据处理的基本原理、数据预处理到基于Hadoop平台的大数据分析,全面介绍和阐述了当前主流的数据挖掘算法。
全书共分11章,包括大数据的概述、数据的采集与存储、数据的组织与管理、数据库系统与数据仓库、分布式文件系统和HDFS技术基础等。本书可作为计算机相关专业本科生和研究生的教材或教学参考书;也可作为从事大数据分析相关工作人员的参考用书。
《高等学校教材:大数据处理技术(第4版)》是普通高等教育“十一五”国家级规划教材。
全书共分11章,包括大数据的概述、数据库系统的设计与实现、数据仓库设计与应用开发工具以及Hadoop平台应用等。第1章介绍了大数据的基本概念及特点;第2章和第3章分别介绍了关系型数据和非结构化数据的相关知识及其管理方法;第4~6章分别介绍了数据挖掘的基础知识和大数据分析的方法和技术等内容;第7~9章节分别讲述了如何构建一个简单的Hadoop集群和利用MapReduce框架进行大规模的数据处理与分析过程;最后通过综合案例对以上内容进行了总结和应用拓展。
《高等学校教材:大数据处理技术(第4版)》可作为高等院校计算机及相关专业的本科高年级学生和研究生的教学用书或教学参考书,也可以作为广大科技工作者学习使用该课程的参考资料。