基于鲲鹏的大数据挖掘算法实战
¥
56.09
6.3折
¥
89
全新
库存9件
作者袁春,刘婧,王工艺
出版社机械工业出版社
出版时间2022-10
版次1
装帧其他
货号607 11-28
上书时间2024-11-28
商品详情
- 品相描述:全新
图书标准信息
-
作者
袁春,刘婧,王工艺
-
出版社
机械工业出版社
-
出版时间
2022-10
-
版次
1
-
ISBN
9787111713180
-
定价
89.00元
-
装帧
其他
-
开本
32开
-
页数
231页
-
字数
220千字
- 【内容简介】
-
本书结合主流分布式计算框架、国产芯片,介绍算法很好能优化实践,开发面向企业级应用的高能数据挖掘算法,剖析数据挖掘算法的典型应用案例,帮助读者在面向数据挖掘算法科研问题、企业应用时快速构建应用。本书具体介绍了机器学和数据挖掘的方法在大数据环境下的具体算法与流程,以及在华为鲲鹏台的具体实现,是本贯穿分布式计算框架、底层芯片的,指导面向企业级应用的数据挖掘算法的书籍,适合作为高校、科研机构中需要对大规模数据进行挖掘和分析的、科研人员以及企业中大数据分析应用研发人员的参用书。
- 【作者简介】
-
:
王工艺,长期从事机器学习/AI、数据挖掘、数据存储等相关理论和算法的研究,对行业有深入理解,在算法设计、优化和实现上有丰富经验;曾在存储领域实现多个算法的技术突破,并将其广泛应用到产品上。现任华为计算产品线机器学习算法专家,拥有超过50项的国内外专利。
- 【目录】
-
丛书序
前言
章 大数据挖掘技术概述
1.1 大数据技术重要
1.2 大数据概念和类型
1.3 大数据挖掘技术
1.3.1 大数据采集技术
1.3.2 大数据预处理技术
1.3.3 大数据分析和挖掘技术
1.3.4 大数据可视化技术
1.3.5 大数据应用
1.4 大数据挖掘系统架构
1.4.1 大数据存储系统
1.4.2 大数据处理系统
1.4.3 大数据可视化和应用系统
1.5 大数据挖掘技术的特
1.6 新技术浪潮下的大数据挖掘技术
参文献
第2章 分布式开发框架
2.1 分布式并行策略
2.1.1 数据并行
2.1.2 模型并行
2.2 分布式协调
2.2.1 zookeeper简介
2.2.2 数据模型
2.2.3 zookeeper体系结构
2.2.4 分布式锁
2.3 分布式通信
2.3.1 分布式通信机制
2.3.2 分布式通信拓扑
2.4 分布式一致算法
2.4.1 一致哈希
2.4.2 paxos算法
2.4.3 raft算法
2.5 分布式计算框架
2.5.1 hadoop
2.5.2 spark
2.5.3 flink
2.5.4 ray
参文献
第3章 经典挖掘算法
3.1 主成分分析
3.1.1 算法介绍
3.1.2 算法推导
3.2 线回归
3.2.1 线回归的损失函数
3.2.2 优化求解方法
3.2.3 正则化
3.3 逻辑回归
3.3.1 logistic函数
3.3.2 逻辑回归的损失函数
3.3.3 多分类问题
3.4 线支持向量机
3.4.1 支持向量机的基本概念
3.4.2 线支持向量机的损失函数
3.5 决策树
3.5.1 决策树算法概述
3.5.2 id3决策树算法
3.5.3 c4.5算法
3.5.4 分类回归树(cart)
3.6 森林
3.7 梯度提升决策树
3.7.1 负梯度与残差
3.7.2 gbdt的计算
3.7.3 gbdt常用的损失函数
3.8 xgboost
3.8.1 xgboost预测模型
3.8.2 目标函数
3.8.3 xgboost算法分析
3.9 交替小二乘法
3.9.1 显式反馈
3.9.2 隐式反馈
参文献
第4章 鲲鹏boostkit大数据挖掘
4.1 鲲鹏芯片
4.1.1 鲲鹏芯片的发展
4.1.2 鲲鹏920处理器
4.1.3 鲲鹏920处理器的特点
4.2 鲲鹏boostkit使能大数据场景
4.2.1 鲲鹏应用使能套件boostkit
4.2.2 鲲鹏boostkit大数据使能套件
4.3 鲲鹏boostkit大数据机器学算法库
4.3.1 算法介绍
4.3.2 机器学算法库的使用方法
第5章 数据挖掘算法在鲲鹏的优化实践
5.1 主成分分析
5.1.1 covariance方法实现
5.1.2 svd方法实现
5.1.3 鲲鹏boostkit算法api介绍
5.2 逻辑回归
5.2.1 概念回顾
5.2.2 优化求解
5.2.3 分布式实现
5.2.4 鲲鹏boostkit算法api介绍
5.3 森林
5.3.1 森林基础回顾
5.3.2 森林分布式实现与优化
5.3.3 鲲鹏boostkit算法api介绍
5.4 xgboost
5.4.1 xgboost的基础回顾
5.4.2 xgboost4j-spark实现详解
5.4.3 xgboost单轮分布式训练实现详解
5.4.4 鲲鹏boostkit算法api介绍
5.5 交替小二乘法
5.5.1 分布式实现流程
5.5.2 分布式实现详解
5.5.3 鲲鹏boostkit算法api介绍
参文献
第6章 数据挖掘算法应用案例
6.1 商品案例
6.1.1 场景介绍
6.1.2 整体方案
6.1.3 关键步骤
6.1.4 小结
6.2 房价预测案例
6.2.1 场景介绍
6.2.2 整体方案
6.2.3 关键步骤
6.2.4 小结
6.3 客户细分案例
6.3.1 场景介绍
6.3.2 整体方案
6.3.3 关键步骤
6.3.4 小结
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价