• 大数据测试技术与实践
21年品牌 40万+商家 超1.5亿件商品

大数据测试技术与实践

正版现货 可开具图书发票 下单后当天即可发货

83.01 7.0折 118 全新

库存24件

山西太原
认证卖家担保交易快速发货售后保障

作者艾辉主编

出版社人民邮电出版社

ISBN9787115571861

出版时间2021-10

装帧平装

开本16开

定价118元

货号11267438

上书时间2024-09-08

A365书库

七年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介
艾辉,中国人民大学概率论与数理统计专业硕士,《机器学习测试入门与实践》作者之一。目前,担任融360技术总监,主要负责AI风控产品、用户产品和基础架构的质量保障工作。曾在阿里本地生活担任不错技术经理,负责用户产品、新零售产品的质量保障工作。拥有9年多的测试开发工作经验,曾多次受邀在行业技术大会(如MTSC、GITC、靠前00、TiD、A2M和TICA等)上做主题分享。对大数据、机器学习测试技术有深刻理解,并长期专注于质量保障与工程效能领域。 陈高飞,东北大学计算机技术专业硕士,《机器学习测试入门与实践》作者之一。目前,担任融360测试开发工程师,主要从事机器学习方向的测试开发工作。擅长白盒测试、大数据测试和模型测试,在工具平台开发方面有丰富的实践经验。 郝嵘,北京信息科技大学自动化专业硕士,《机器学习测试入门与实践》作者之一。目前,担任融360不错测试开发工程师,主要负责大数据方向的测试开发工作。擅长Python开发、大数据测试和机器学习测试,了多个工具平台的开发,在大数据质量保障方面有丰富的实践经验。 雷天鸣,哈尔滨理工大学计算机科学与技术专业硕士,《机器学习测试入门与实践》作者之一。目前,担任融360测试开发工程师,主要从事机器学习方向的测试开发工作。擅长大数据测试、特征测试和模型算法评测等,对金融风控业务有深刻理解。 李曼曼,融360不错测试开发工程师,《机器学习测试入门与实践》作者之一。拥有近11年的测试开发工作经验,了多个工具平台的开发和大型项目的测试工作。擅长白盒测试、性能测试、自动化测试、持续集成和工程效能,在大数据和特征模型测试方面有丰富的实践经验。 马绵,陕西科技大学网络工程专业学士,融360测试开发工程师。目前主要从事服务端测试开发工作,擅长自动化测试、安全测试,在服务稳定性保障方面有丰富的实践经验。 孙冰妍,东北大学通信与信息系统专业硕士,融360测试开发工程师。目前主要从事服务端测试开发工作,擅长白盒测试、自动化测试、性能测试、安全测试和持续集成。参与了多个工具平台的开发,并了多个大型项目的测试工作。对大数据测试技术有深刻理解。 孙金娟,山西财经大学计算机科学与技术专业学士,《机器学习测试入门与实践》作者之一。目前,担任融360测试开发工程师,有近9年的Java开发、测试开发工作经验。擅长大数据测试和工具平台开发,对机器学习、特征模型测试有深刻理解。 张咪,北京交通大学通信与信息系统专业硕士,《机器学习测试入门与实践》作者之一。目前,担任融360测试经理,主要负责用户产品的质量保障工作,曾负责基础架构、SRE(Site Reliability Engineering,网站可靠性工程)等方面的测试开发工作。在自动化测试、服务稳定性、专项测试和工程效能等方面有丰富的实践经验,曾受邀在行业技术大会(如MTSC、A2M等)做主题分享。对大数据、机器学习测试有深刻的理解,并在这些领域拥有丰富的实践经验。 张朋周,中国地质大学计算机科学与技术专业硕士,《机器学习测试入门与实践》作者之一。目前,担任融360不错测试开发工程师,曾在百度从事搜索业务测试开发,有近9年的开发测试工作经验。目前,主要负责机器学习方向的测试开发工作,了多个工具平台的开发,在数据质量保障、模型评估平台方面有丰富的实践经验。

目录
第1章 认识大数据/11.1 大数据概述/11.2 大数据的发展/21.3 大数据的应用/41.3.1 互联网领域/41.3.2 物流领域/51.3.3 教育领域/61.3.4 金融领域/71.3.5 电信领域/71.4 本章小结/8第2章 大数据技术生态/92.1 大数据技术生态总览/92.2 大数据采集技术/102.3 大数据存储技术/102.3.1 分布式文件系统:HDFS/102.3.2 海量数据列式存储: HBase/132.3.3 其他数据存储技术/182.4 大数据计算分析技术/192.4.1 批处理计算的基石:MapReduce/192.4.2 流计算的代表:Storm、Spark Streaming和Flink/212.4.3 OLAP引擎:Hive、Impala和Presto/242.5 大数据管理调度技术/302.5.1 分布式集群资源调度框架:YARN/302.5.2 容器集群管理系统:Kubernetes/322.5.3 大数据的“动物园管理员”:ZooKeeper/332.5.4 常用的工作流调度平台:Azkaban、Oozie和Airflow/342.6 大数据商业产品/362.7 本章小结/38第3章 数据仓库的设计与构建/393.1 数据仓库概述/393.1.1 什么是数据仓库/393.1.2 数据仓库的发展过程/413.1.3 数据仓库与数据集市、数据湖、数据中台的区别/433.2 数据仓库设计/443.2.1 架构分层设计/443.2.2 数据模型设计/463.3 数据仓库构建/503.3.1 数据仓库的构建方法与评价标准/503.3.2 数据仓库实例/513.4 本章小结/58第4章 大数据项目开发流程/594.1 大数据项目开发概览/594.2 数据的采集与存储/604.2.1 服务端日志采集/614.2.2 客户端日志采集/624.2.3 数据同步/644.2.4 大数据存储/664.3 大数据计算/674.4 大数据监控/714.4.1 数据监控/714.4.2 运维监控/724.5 大数据项目开发案例/734.5.1 项目背景介绍/744.5.2 项目需求分析/744.5.3 项目开发流程/764.6 本章小结/83第5章 大数据测试方法/845.1 大数据测试概述/845.1.1 什么是大数据测试/845.1.2 大数据测试与传统数据测试/845.2 大数据测试类型/855.2.1 功能测试/855.2.2 性能测试/895.2.3 其他非功能性测试/935.3 大数据测试流程/945.4 大数据基准测试/965.4.1 大数据基准测试简介/975.4.2 大数据基准测试的步骤/975.4.3 大数据基准测试工具/985.5 大数据ETL测试/1005.5.1 大数据ETL测试类型/1005.5.2 大数据ETL测试场景/1035.5.3 大数据ETL测试工具/1075.6 大数据测试总结/1085.6.1 大数据测试中的典型问题/1085.6.2 大数据测试经验总结/1125.6.3 大数据测试面临的挑战/1135.7 本章小结/113第6章 大数据测试实践/1146.1 BI报表测试/1146.1.1 BI工具简介/1146.1.2 Tableau简介/1156.1.3 BI报表测试实践/1206.2 数据挖掘产品测试/1286.2.1 数据挖掘的定义和流程/1286.2.2 数据挖掘产品简介/1296.2.3 数据挖掘产品测试实践/1306.3 用户行为分析平台测试/1396.3.1 用户行为分析平台测试概览/1396.3.2 数据采集阶段测试/1406.3.3 实时数据处理阶段测试/1406.3.4 离线数据处理阶段测试/1536.3.5 数据查询展示阶段测试/1536.4 本章小结/156第7章 数据质量管理/1577.1 数据质量管理概述/1577.2 数据质量管理流程/1587.2.1 建立数据质量管理办法/1597.2.2 制定数据标准/1617.2.3 数据质量自查评估/1627.2.4 数据质量问题修复/1707.3 本章小结/173第8章 大数据测试平台实践/1748.1 大数据测试平台背景/1748.2 大数据测试的开源技术调研/1758.2.1 great_expectations/1768.2.2 WeBankFinTech Qualitis/1788.3 大数据测试的商业方案分析/1818.3.1 QuerySurge/1828.3.2 RightData/1848.4 从零开始搭建大数据测试平台/1868.4.1 需求分析/1878.4.2 架构设计/1878.4.3 功能实现/1898.4.4 页面演示/1968.4.5 总结和展望/2018.5 本章小结/203第9章 数据治理平台建设/2049.1 数据治理概述/2049.1.1 数据治理的基本概念/2049.1.2 数据治理的重要意义/2059.1.3 数据治理面临的主要挑战/2069.1.4 如何开展数据治理/2069.2 数据治理平台体系/2079.3 元数据管理平台/2089.3.1 平台产生背景/2089.3.2 平台架构/2089.3.3 模块设计:数据采集/2099.3.4 模块设计:数据查询/2129.3.5 模块设计:数据分析/2149.4 数据质量监控平台/2199.4.1 平台产生背景/2199.4.2 平台架构/2209.4.3 模块设计:规则引擎/2219.4.4 模块设计:任务中心/2309.4.5 模块设计:报警系统 /2309.5 本章小结/232第10章 DataOps的理念与实践/23310.1 DataOps概述/23310.1.1 什么是DataOps/23310.1.2 为什么需要DataOps/23510.1.3 DataOps与DevOps、MLOps的联系和区别/23710.2 DataOps的能力与特性/23910.2.1 数据工程/23910.2.2 数据集成/24010.2.3 数据安全和数据隐私保护/24110.2.4 数据质量/24210.2.5 DataOps的4个特性/24310.3 DataOps技术实践/24410.3.1 DataOps技术工具/24510.3.2 数据管道技术示例/24610.4 本章小结/253第11章 大数据测试的学习路线和发展趋势/25411.1 为什么学习大数据测试/25411.2 如何学习大数据测试/25511.2.1 大数据测试的学习路线/25511.2.2 大数据测试的技能图谱/25911.3 大数据测试的发展趋势/26911.4 本章小结/270附录 大数据技术经典面试题/271参考文献/276

主编推荐
36位来自阿里、腾讯、百度、京东、字节跳动、网易、小米、奇虎360、贝壳、顺丰等大厂工程师和技术管理者联袂推荐。 通俗易懂,精选23个大数据测试要点,从零入手,多角度讲解大数据测试。 内容丰富,涵盖4大技术主题,大数据开发、大数据测试、数据质量与数据治理。 场景典型,深度剖析3个主流数据应用场景,BI报表、风控模型和数据分析平台的技术原理、工程架构,并输出了全链路的质量保障方案。

精彩内容
本书全面系统地介绍了大数据的测试技术与质量体系建设。本书共11章,第1~4章涵盖认识大数据,大数据技术生态,数据仓库的设计与构建,以及大数据项目开发流程;第5~7章讲解大数据测试方法、大数据测试实践和数据质量管理;第8~10章介绍大数据测试平台实践、数据治理平台建设,以及DataOps的理念与实践;第11章提供大数据测试学习路线。附录列出了大数据技术经典面试题。

 本书适合想要了解大数据技术的读者,以及想要学习和掌握大数据测试与大数据开发的从业者。通过阅读本书,测试工程师可以系统地学习大数据技术基础、大数据开发和大数据测试等知识;大数据开发工程师可以借鉴大数据质量保障的方法,拓宽数据工程实践的思路;技术专家和技术管理者可以了解大数据质量保障体系、数据治理建设和DataOps实践等内容。

媒体评论
大数据测试实践秘籍36位来自字节跳动、知乎、阿里、百度、腾讯、、奇虎360、小米、网易等大厂专业技术人员联袂推荐。通俗易懂,精选22个大数据测试要点,从零入手,系统讲解大数据测试。内容丰富,涵盖6大技术主题,大数据技术生态、数据仓库、大数据开发、大数据测试、数据治理、DataOps。场景典型,详细解释3个主流数据应用场景问题,数据分析、数据挖掘、数据可视化。深度剖析BI报表、风控模型产品、用户行为分析平台的技术原理、工程架构,并输出了全链路的质量保障方案。
随着互联网公司的崛起,大数据技术快速应用于互联网行业、金融业、电信业、甚至诸多传统行业。如何将沉淀下来的海量的原始数据做适当的存储、加工、价值挖掘,驱动了大数据技术的演进发展。在数据来源多样且异构、数据类型多样、数据量达到一定规模,数据仓库的设计、数据血缘关系、数据的正确性和即时性、指标口径一致性都会变成极为挑战的技术问题。本书从大数据质量保障的角度介绍了如何应用测试环节提升数据质量,并对数仓设计、数据开发、数据管理平台等前置数据研发工作做深入浅出的介绍,适合大数据技术人员了解数据研发的整体流程

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP