整专业资料
自媒体账号群
微信小程序

账号名:自慧考题库

扫二维码刷题搜题

微信服务号

微信号:zikaosw

账号名:考生学习网

网课试听在线模考

微信订阅号

微信号:zikaosw-cn

账号名:zikao资料库

自考考试动态资讯

微信群

1、扫描左侧二维码
2、加群领自考资料

QQ群

群号:892287306

扫二维码加群

小红书号

账号名:自考生网

扫二维码关注

登录 | 注册
登录/注册后,可享受
  • 课程免费试听
  • 试做在线题库
  • 学习提升指导
自考生网
当前位置 自学考试 > 自考教材 > 北京自考教材 > 文章详情

2024年北京成人自考专科新教材《大数据技术基础(实践)14899》在哪买

来源:自考生网 时间:2025-09-03 09:00:00 编辑:自考生网编辑
2024年北京成人自考专科新教材《大数据技术基础(实践)14899》封面图

2024年北京成人自考专科新教材《大数据技术基础(实践)14899》在哪买

教材版本:大数据导论 北京邮电大学出版社 2019年版 李建伟

教材说明:本教材为北京教育考试院指定教材版本

购买提示:请认真核对2024年北京自考教材版本目录再购买。

温馨提示:北京自考本科与专科考试课程代码及名称若相同,则教材通用。

2024年北京自考《大数据技术基础(实践)14899》指定教材购买方式

考生自行确认考试科目及所需教材版本后,可直接点击上方“立即购买”链接,进入自考生网商城网站进行购买。 关于教材版本的查询,考生可点击“北京自考教材”栏目查看2024年北京自考专升本(本科)与自考大专指定教材版本目录,本文均以北京教育考试院最新发布的自考教材版本为准,进行及时更新。

2024年北京自考《大数据技术基础(实践)14899》教材信息

商品详情

书名:大数据导论

定价:42.00元

作者:李建伟编

出版社:北京邮电大学出版社

出版日期:2019-09-01

ISBN:9787563558810

版次:1

装帧:平装

开本:16开


内容简介

本书系统地介绍了大数据技术的基础知识。本书实战环节的知识是在大数据培训的基础上总结提炼出来的,案例都为企业实际开发中的案例,所以内容的科学性和有效性已经被证实过,期望读者通过对本书的学习和对本书案例的实践,理解大数据技术的概念和原理,掌握Hadoop大数据技术中*基础和*重要的知识和实践。

本书的主要内容包括大数据的概念及价值,Hadoop2.0介绍,分布式文件系统HDFS的原理、常用命令操作和编程实践,分布式计算框架MapReduce的原理、基础编程和高级编程,分布式资源管理系统YARN平台,分布式锁服务ZooKeeper,Hadoop高可用集群搭建和Hadoop实战项目。

本书可作为高等院校成人教育数据科学与大数据技术、计算机科学与技术和软件工程等专业的大数据课程教材,也可作为相关技术人员的参考书。


作者简介

李建伟,2005年毕业于北京邮电大学,美国Marist College访问学者,主要研究方向:智能自适应学习系统和大数据学习分析,曾主持研发了北京邮电大学网络教育学院远程教育平台。主要参与的、省部级科研项目有国家“十五”重大科技攻关计划“网络教育关键技术及示范工程项目”,国家科技支撑计划项目“虚拟实验智能指导与管理系统的研发”,国家科技重大专项“宽带无线校园创新实验网体系架构与关键技术研究”等,已发表论文19篇,获得国家发明专利2项,获得北京市教学成果二等奖1次。


目录

第1章大数据概述1

1.1大数据概念及价值1

1.2大数据数据源4

1.3大数据技术应用场景5

1.4大数据处理流程及技术7

1.5大数据与云计算的关系9

1.6大数据与人工智能的关系10

本章小结11

习题一11

第2章Hadoop介绍12

2.1Hadoop简介12

2.1.1Hadoop由来12

2.1.2Hadoop发展历程12

2.1.3Hadoop生态系统14

2.2Hadoop的体系架构17

2.2.1分布式文件系统HDFS17

2.2.2分布式计算框架MapReduce18

2.2.3分布式资源调度系统YARN18

2.3Hadoop依赖的技术基础19

2.3.1Java编程基础19

2.3.2Web可视化技术基础27

2.3.3关系数据库基础30

2.3.4Linux基础31

2.4Hadoop2.0集群搭建69

2.4.1伪分布式安装部署69

2.4.2全分布式安装部署74

本章小结80

习题二80

第3章分布式文件系统HDFS81

3.1HDFS简介81

3.2HDFS的设计目标81

3.3HDFS的体系架构82

3.3.1主从架构83

3.3.2HDFS高可用性架构84

3.4HDFS的核心设计87

3.4.1数据复制87

3.4.2健壮性设计90

3.4.3数据组织91

3.4.4存储空间回收机制91

3.4.5可访问性92

3.5HDFS中数据流的读写93

3.5.1RPC实现流程93

3.5.2文件的读取94

3.5.3文件的写入95

3.5.4一致性模型97

3.6HDFS的联邦机制98

本章小结99

习题三100

第4章访问HDFS的常用接口101

4.1HDFS常用命令接口101

4.2HDFS编程环境准备105

4.2.1IDEA的安装配置及特性105

4.2.2Maven的安装配置114

4.3Java接口119

4.3.1在本地Windows机器上配置Hadoop环境变量121

4.3.2编写Java客户端程序122

本章小结130

习题四130

第5章分布式计算框架MapReduce131

5.1MapReduce编程模型简介131

5.1.1产生背景131

5.1.2MapReduce编程模型133

5.1.3MapReduce工作流程134

5.1.4MapReduce两个版本比较139

5.2MapReduce入门编程140

5.2.1认识Map和Reduce140

5.2.2MapTask阶段140

5.2.3ReduceTask阶段145

本章小结147

习题五148

第6章MapReduce基础编程149

6.1MapReduce编程设计149

6.1.1MapReduce分布式计算模型149

6.1.2MapReduce分布式编程框架150

6.2MapReduce编程实例wordcount151

6.2.1wordcount开发需求分析151

6.2.2编程环境准备152

6.2.3编写Mapper类152

6.2.4编写Reducer类154

6.2.5MapReduce程序在YARN集群的运行机制155

6.2.6编写YARN的客户端156

6.2.7YARN集群的配置、作业打包和启动161

本章小结163

习题六163

第7章分布式资源管理系统YARN165

7.1YARN简介165

7.2发展史165

7.2.1Hadoop1.0165

7.2.2Hadoop2.0和Hadoop1.0的区别166

7.2.3MapReduce计算框架的演变166

7.3YARN的架构167

7.4YARN集群执行应用程序的工作流程169

7.5Hadoop如何使用YARN运行一个Job170

7.6YARN的调度策略173

7.7YARN的重要概念总结176

本章小结176

习题七177

第8章MapReduce高级编程178

8.1Combiner178

8.2Partitioner179

8.3计数器180

8.4排序188

8.5Join连接197

8.6倒排索引205

8.7求平均值和数据去重210

本章小结215

习题八216

第9章分布式锁服务ZooKeeper217

9.1ZooKeeper基本概念介绍217

9.1.1ZooKeeper的定义217

9.1.2ZooKeeper的基本原理和应用场景217

9.1.3ZooKeeper的选举机制218

9.1.4ZooKeeper的存储机制220

9.2ZooKeeper集群部署220

9.3ZooKeeper编程实例222

9.3.1ZooKeeper API基础知识222

9.3.2ZooKeeper API介绍及编程实例222

本章小结229

习题九229

第10章Hadoop高可用集群搭建230

10.1HDFS高可用的工作机制230

10.2集群规划231

10.3Hadoop HA集群搭建232

10.3.1前期准备232

10.3.2安装ZooKeeper集群233

10.3.3安装Hadoop集群234

10.3.4启动集群242

10.3.5测试245

本章小结247

习题十247

参考文献248


《大数据技术基础(实践)14899》考试资料相关推荐

温馨提示:本网站所提供的考试信息仅供考生参考,考试政策请以权威部门公布的正式信息为准。
更多优惠课程课程推荐

自考生题库

专业智能,巩固提分

微信公众号

网课试听

教材大全

做题闯关

扫描二维码 关注公众号

微信小程序

资料大全

免费题库

无需下载

扫描小程序码 领免费题库

资料套餐 关闭