大数据工程师面试笔试宝典 数据库 杨俊,姜伟,许朋举 编 新华正版
¥
63.25
7.1折
¥
89
全新
库存33件
作者杨俊,姜伟,许朋举 编
出版社机械工业出版社
ISBN9787111753872
出版时间2024-07
版次1
装帧平装
开本16
页数252页
字数385千字
定价89元
货号xhwx_1203348344
上书时间2024-12-18
商品详情
- 品相描述:全新
-
正版特价新书
- 商品描述
-
主编:
大数据工程师面试笔试宝典系统覆盖大数据工程师岗位需要掌握的重要概念、技术和工具,包括hadoop、park、flink、hive、hbae、kafka等,以及大数据与人工智能的交点。
精讲:68个大数据核心知识点分享
真题全解:提供超200页大数据面试笔试真题及
目录:
前言
章 面试笔试心得交流
1.1 摆正求职心态/1
1.2 求职前准备/2
1.3 做好自我介绍/4
1.4 职业规划是什么/5
1.5 为什么离开上一家公司/6
1.6 被面试官否定怎么办/6
1.7 加分项要呈现出来/7
1.8 面试禁忌/8
1.9 面试会有哪些“坑”/8
1.10 如何应对自己不会回答的问题/9
1.11 如何应对某一次面试失败/10
1.12 面试成功是否高枕无忧/11
第2章 大数据工程师面试笔试攻略
2.1 大数据职业的岗位划分/12
2.2 典型大数据工程师的职业发展路径/13
2.3 公司大数据部门划分与人员编制/15
2.4 大数据工程师的工作职责/16
2.5 大数据工程师简历如何编写/17
2.6 缺少大数据项目经验如何应对/18
2.7 大数据面试笔试需要掌握哪些技能/19
2.8 如何把握大数据工程师的面试笔试重点/24
2.9 引导面试官提问自己擅长的技术/25
第3章 大数据基础应用
3.1 大数据基础知识/27
3.1.1 大数据生态体系/27
3.1.2 大数据基石—云计算/29
3.1.3 大数据核心—海量数据/30
3.1.4 大数据灵魂—大数据技术/31
3.1.5 大数据价值—商业应用/32
3.2 大数据算法/32
3.2.1 如何从海量数据中找出高频词/32
3.2.2 如何找出访问百度次数多的ip地址/34
3.2.3 如何从2.5亿个整数中找出不重复的整数/36
3.2.4 判断一个数在40亿数据中是否存在/38
3.2.5 如何找出csdn热门的搜索关键词/39
3.2.6 如何从大量数据中统计不同手机号的个数/41
3.2.7 如何从大量数据中找出重复次数多的一条数据/42
3.2.8 如何对大量数据按照query的频度排序/43
3.2.9 如何从大量的url中找出相同的url/44
3.2.10 如何从5亿个数中找出中位数/46
第4章 zookeeper分布式协调服务
4.1 简述zookeeper包含哪些重要特/48
4.2 简述zookeeper包含哪些应用场景/49
4.3 简述zookeeper包含哪几种znode节点类型/51
4.4 请问zookeeper对znode的是的吗/52
4.5 请问zookeeper集群包含多少节点合适/52
4.6 简述zookeeper集群节点包含哪些角/53
4.7 简述zookeeper集群节点有哪几种工作/54
4.8 请问zookeeper节点宕机后如何处理/54
4.9 请问zookeeper集群是否支持动态添加机器/55
4.10 简述zookeeper集群的数据读写流程/56
4.11 简述zookeeper的器/57
4.12 谈谈你对cap原则的理解/58
4.13 谈谈zab协议在zookeeper中的作用/59
4.14 谈谈你对zookeeper选举机制的理解/60
4.15 阐述zookeeper如何保证事务的顺序一致/62
4.16 阐述如何迁移zookeeper集群/62
第5章 hadoop大数据台
5.1 hadoop分布式文件系统(hdfs)/64
5.1.1 阐述hdfs中的数据块大小设置/64
5.1.2 简述hdfs的副本存放策略/65
5.1.3 阐述如何处理hdfs大量小文件问题/65
5.1.4 简述namenode元数据存储在什么位置/67
5.1.5 阐述如何解决edits文件过大的问题/67
5.1.6 简述hdfs读数据流程/68
5.1.7 简述hdfs写数据流程/69
5.1.8 简述namenode ha的运行机制/71
5.1.9 简述hdfs联邦机制/71
5.1.10 阐述如何处理namenode宕机问题/72
5.1.11 阐述如何处理datanode宕机问题/73
5.1.12 简述hdfs支持哪些存储格式与压缩算法/73
5.2 hadoop资源管理系统(yarn)/75
5.2.1 简述yarn应用的运行机制/75
5.2.2 阐述yarn与mapreduce1的异同/76
5.2.3 简述yarn 高可用/77
5.2.4 简述yarn的容错机制/78
5.2.5 简述yarn调度器的工作/79
5.2.6 阐述yarn的任务提交流程/81
5.3 hadoop分布式计算框架(mapreduce)/82
5.3.1 简述mapreduce作业运行机制/82
5.3.2 简述mapreduce shuffle过程/85
5.3.3 简述mapreduce作业失败与容错机制/87
5.3.4 阐述如何解决mapreduce数据倾斜问题/89
5.3.5 简述mapreduce二次排序/90
5.3.6 简述mapreduce join实现/91
第6章 hive数据仓库工具
6.1 简述hive与传统数据库的异同/93
6.2 简述hive与hbase的异同/94
6.3 简述hive包含哪些建表方式/94
6.4 简述hive表与外部表的区别/95
6.5 简述hive分区表与分桶表的区别/96
6.6 简述hive包含哪些表连接方式/97
6.7 简述collect_list()与collect_set()函数的区别/98
6.8 简述order by、distribute by、sort by和
cluster by的区别与联系/99
6.9 谈谈如何hive查询全表扫描/100
6.10 简述hive包含哪些自定义函数/101
6.11 阐述如何解决hive数据倾斜问题/101
6.12 阐述hive有哪些能调优手段/104
第7章 hbase分布式数据库
7.1 简述hbase的应用场景/106
7.2 简述hbase读数据流程/107
7.3 简述hbase写数据流程/108
7.4 阐述hbase region如何定位/109
7.5 简述hbase region的合并与分裂过程/110
7.6 阐述hbase如何设计rowkey/112
7.7 阐述hbase如何实现预分区/112
7.8 谈谈你对hbase二级索引的理解/113
7.9 阐述hbase如何降低磁盘io/114
……
内容简介:
本书全面讲解了大数据的核心技术及如何解答大数据工程师面试笔试中的常见问题,还引入了相关知识点辅以说明,让读者对所学知识进行查漏补缺,帮助读者顺利通过大数据工程师面试笔试。
本书的题目均来自一线互联网公司面试笔试真题,涵盖大数据基础、大数据生态圈技术组件以及大数据不同岗位的面试笔试题。~2章主要介绍了职业道路如何选择、面试笔试前如何准备、面试笔试过程中如何应对,以及面试经常遇到的“坑”。第3章介绍了大数据基础面试笔试题,让读者学会利用大数据思维解决常见应用场景;第4~10章重点介绍了大数据生态圈核心技术的面试笔试题,让读者加强对大数据技术组件的理解;1~13章介绍了大数据仓库、大数据项目、大数据运维方向的常见面试笔试题;4章探讨了大数据与人工智能的交点,让读者可以轻松应对大数据工程师的面试笔试。
本书内容的深度和广度贴近实际,将帮助大数据领域的求职者为面试笔试做好充分的准备,提高面试成功率,同时,本书也可作为从业者的实用工具书,以加深对大数据技术和实践的理解。无论是初学者还是有经验的专业人士,都将从本书提供的详实信息和实用建议中受益。
— 没有更多了 —
以下为对购买帮助不大的评价