• 腾讯大数据构建之道
21年品牌 40万+商家 超1.5亿件商品

腾讯大数据构建之道

正版保障 假一赔十 可开发票

95.66 6.4折 149 全新

库存148件

广东广州
认证卖家担保交易快速发货售后保障

作者蒋杰,刘煜宏,陈鹏 等

出版社机械工业出版社

ISBN9787111710769

出版时间2021-05

装帧精装

开本16开

定价149元

货号11675558

上书时间2024-08-29

灵感书店

三年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介
核心团队 腾讯数据平台部致力于为腾讯集团旗下业务提供专业、可靠的大数据平台及机器学习平台服务,并依托腾讯云将大数据与AI能力对外输出。团队专注于大数据、云原生、机器学习、图计算、AI视觉和推荐技术等核心技术,并在重量比赛屡获奖项。同时,团队全面拥抱开源并持续贡献社区,自主研发的分布式机器学习平台Angel和大数据集成平台InLong分别从Linux和Apache很好项目毕业,具有重量的技术影响力。 核心作者 蒋杰,北京大学博士,腾讯公司副总裁,中国人工智能产业发展联盟(AIIA)副理事长,中国计算机学会(CCF)大数据专家委员会委员。 2012年起在腾讯负责大数据平台建设,主导研发了离线计算、实时计算、机器学习、数智融合四代腾讯大数据平台,并推动大数据技术开源。 带领腾讯完成了腾讯广告投放端整合,实现了腾讯全流量的一站式投放。在人工智能领域,打造了腾讯AI学习平台,获得多项很好赛事奖项。

目录
前言 第1章  打造腾讯大数据平台1 1.1  腾讯大数据的缘起3 1.2  腾讯大数据的构建理念5 1.3  腾讯大数据的总体架构7 第2章  数据实时采集平台11 2.1  接入层挑战12 2.2  接入管理层TDManager14 2.3  数据采集17 2.4  数据总线23 2.5  消息中间件30 2.6  数据分拣40 2.7  接入层展望44 第3章  分布式存储平台46 3.1  文件存储HDFS47 3.2  统一存储Ceph62 3.3  下一代大数据存储Ozone77 3.4  KV存储HBase88 第4章  分布式计算平台99 4.1  批处理MapReduce100 4.2  批处理Spark107 4.3  批处理漂移计算SuperSQL123 4.4  流处理Flink146 4.5  SQL数据仓库Hive165 4.6  任务调度175 第5章  数据分析引擎184 5.1  关系型OLAP:腾讯实时多维分析平台185 5.2  关系型OLAP:ClickHouse200 5.3  多维OLAP:Kylin211 5.4  多维OLAP:Druid222 第6章  资源调度平台234 6.1  Yarn项目背景235 6.2  调度器性能优化241 6.3  集群的高可用性244 6.4  多资源维度弹性管理254 第7章  数据治理体系261 7.1  元数据262 7.2  数据资产管理271 7.3  大数据安全283 第8章  机器学习平台298 8.1  图智能平台299 8.2  Angel310 8.3  联邦学习333 第9章  数据内容挖掘350 9.1  概览351 9.2  广告内容挖掘352 9.3  用户画像数据体系365 9.4  用户画像构建方法366 9.5  数据内容挖掘与推荐379 9.6  数据内容挖掘与AI创作380 第10章  大数据平台运营384 10.1  大数据服务规划385 10.2  大数据平台治理393 10.3  自动化运维体系构建397 10.4  平台运营成本优化404 10.5  大数据运营分析与应用体系408 第11章  大数据平台产品设计410 11.1  TBDS大数据处理套件411 11.2  Oceanus实时流式数据处理平台419 11.3  ideX数据分析与探索挖掘工具425 11.4  智能钛TI机器学习平台429 第12章  企业级容器云平台GaiaStack438 12.1  GaiaStack产品背景和目标439 12.2  GaiaStack架构和技术特点446 12.3  GaiaStack核心技术454 第13章  大数据应用服务503 13.1  智能客服机器人504 13.2  移动推送526 13.3  数据可视化产品小马BI535 参考文献549

内容摘要

“大数据”这个词最早是什么时候出现的?有人说是著名未来学家托夫勒在他1980年出版的《第三次浪潮》中提出的,他把“大数据”称颂为“第三次浪潮的华彩乐章”。《自然》于2008年9月推出了“大数据”的封面专栏,帮助“大数据”成为热词。从技术层面上讲,2003年谷歌发表了“谷歌文件系统”GFS的论文,随后在2004年和2006年又陆续发表了MapReduce 和BigTable的论文,这“三驾马车”奠定了大数据技术的基石,开启了大数据技术发展的大幕。随后,Doug Cutting和Mike Cafarella实现了开源版的Hadoop。Doug Cutting于2006年入职雅虎,在雅虎的支持下,Hadoop发展迅猛,进而带动了整个大数据开源社区的快速发展。

而国内,大概是从2009年开始,大数据才变得热门起来。十几年前,少有人听说过大数据;时至今日,大数据已不再是一个遥远的概念,而是与我们每个人的生活和工作都息息相关,须臾难离了。我们每天看天气、读新闻、刷视频、看财经、网上购物、打车出行,等等,大数据始终就在身边,虽然你看不到它,但它默默地改善着我们阅读、购物、出行、理财等的体验,并带给大家诸多便捷。

发展至今,数据已经成为国家的基础性战略资源,是21世纪的“钻石矿”,发展大数据也成为国家战略。早在2015年,党的十八届五中全会就明确提出“实施国家大数据战略”,国务院印发《促进大数据发展行动纲要》,全面推进大数据发展,加快建设数据强国。在2021年3月11日,十三届全国人大四次会议表决通过的《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》(简称“十四五”规划)中,也将大数据列为数字经济重点产业之一。

腾讯作为国内体量最大的互联网公司之一,业务涵盖用户日常生活的方方面面,主要的业务板块包括社交、娱乐、金融、资讯、工具和流量平台等,每天都有大量的业务数据,例如用户每天在微信朋友圈和O0空间上传的图片超过10亿张,腾讯视频每天播放量超过20亿次,除夕当天红包支付超过25亿笔,每天移动支付超过5亿笔,这些数据都在国内居行业前列。业务数据量如此巨大,如果不能对数据进行专业化处理并高效有序地存、管、用,如果不能使数据产生应有的价值,那么数据资产将会成为数据垃圾,成为社会和企业的负担。

大数据平台作为腾讯底层的基础设施之一,每天必须处理千万级规模的离线数据任务及十万亿级别的实时计算,否则无法满足业务每天数以亿计的数据分析计算的需求。腾讯大数据平台,截至2019年年底,日实时计算次数已经超过40万亿次,每天有超过45万亿条数据,资源调度系统为了支撑离线任务每天要启动2.5亿次的容器,数据总量超过1500PB。为了支撑这样的数据总量,腾讯大数据平台的机器规模达到5~6万台。但最开始的时候,机器规模只有30台。

1.1腾讯大数据的缘起

腾讯大数据的起点在2008年年底。

2008年的时候,腾讯已经发展了十年,是国内最大的互联网企业,QQ、QZone、财付通、游戏、新闻等业务的用户量级在国内甚至全球范围内都是数一数二的,后端有着非常强大的业务在线系统支撑,有着自己的海量服务之道,有着自己特有的构建海量服务平台的架构方法论。但是在数据分析、商业智能(Business Intelligence,BI)分析方面,跟很多电信、金融行业一样,一直在使用传统的数据库来支撑。

不管是公司运营分析的报表,还是产品的指标计算,或者是用户数据的挖掘分析,腾讯的数据仓库平台的支撑,在2008年之前,可以说是差强人意。但在2008年底到2009年初,以QQ农场为首的产品出现爆发,业务量短期内连续出现翻番,用户量暴涨,导致需要分析的数据暴增,数据仓库就出现了瓶颈:以前每天5点就能计算出来的报表,经常9点都没算完;以前算一周、一个月的数据,性能都没问题,但现在计算任务根本跑不完,频繁出错。数据仓库几经扩容,还是后继无力,该是转向新技术新架构的时候了。

当时Hadoop在国内已经出现一些小规模的试用,腾讯也在2008年底开始转向Hadoop,从不同部门抽调了几个人,申请了一间会议室来封闭开发,在……



主编推荐
(1)腾讯官方出品!腾讯大数据构建之道首次对外披露!腾讯大数据平台十年磨一剑,践行“科技向善”落地方案。 (2)本书由腾讯数据平台部组织,腾讯公司副总裁蒋杰领衔撰写,首次对外详细阐述了腾讯大数据平台系统架构,以及多年来平台建设的思考与沉淀。

精彩内容
本书详细阐述了腾讯大数据平台系统架构,以及多年来平台建设的思考与沉淀,涵盖腾讯大数据的起源、技术理念及发展历程、开源路线选择的思考以及三代大数据平台架构的技术演进,涉及数据实时采集平台、下一代分布式存储平台、分布式计算平台、资源调度平台、机器学习平台、数据内容挖掘、大数据平台的运营、大数据套件TBDS、一站式机器学习平台智能钛TI等核心技术内容。大数据生态发展与演进需要各界数据人的共同努力,相信本书中详尽的大数据平台案例与建设思路可以给各位同行朋友带来很大的启发并提供借鉴。本书适合大数据从业人员、大数据技术爱好者、相关专业院校学生阅读。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP