白话大数据与机器学习
¥
51.75
7.5折
¥
69
全新
库存8件
作者高扬 等 著
出版社机械工业出版社
ISBN9787111538479
出版时间2016-06
装帧平装
开本16开
定价69元
货号1201319806
上书时间2024-11-04
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
高扬,金山软件西山居资历大数据架构师与大数据专家,有多年编程经验(多年日本和澳洲工作经验)和多年大数据架构设计与数据分析、处理经验,目前负责西山居大数据产品的市场战略。专注于大数据系统架构以及变现研究。擅长数据挖掘、数据建模、关系型数据库应用以及大数据框架HadooD、Spark、Cassandra、PrestoDB等的应用。负责西山居紫霞系统——大数据日志处理系统的系统架构与设计工作。
目录
第1章大数据产业
1.1大数据产业现状
1.2对大数据产业的理解
1.3大数据人才
1.3.1供需失衡
1.3.2人才方向
1.3.3环节和工具
1.3.4门槛障碍
1.4小结
第2章步入数据之门
2.1什么是数据
2.2什么是信息
2.3什么是算法
2.4统计、概率和数据挖掘
2.5什么是商业智能
2.6小结
第3章排列组合与古典概型
3.1排列组合的概念
3.1.1公平的决断——扔硬币
3.1.2非古典概型
3.2排列组合的应用示例
3.2.1双色球彩票
3.2.2购车摇号
3.2.3德州扑克
3.3小结
第4章统计与分布
4.1加和值、平均值和标准差
4.1.1加和值
4.1.2平均值
4.1.3标准差
4.2加权均值
4.2.1混合物定价
4.2.2决策权衡
4.3众数、中位数
4.3.1众数
4.3.2中位数
4.4欧氏距离
4.5曼哈顿距离
4.6同比和环比
4.7抽样
4.8高斯分布
4.9泊松分布
4.10伯努利分布
4.11小结
第5章指标
5.1什么是指标
5.2指标化运营
5.2.1指标的选择
5.2.2指标体系的构建
5.3小结
第6章信息论
6.1信息的定义
6.2信息量
6.2.1信息量的计算
6.2.2信息量的理解
6.3香农公式
6.4熵
6.4.1热力熵
6.4.2信息熵
6.5小结
第7章多维向量空间
7.1向量和维度
7.1.1信息冗余
7.1.2维度
7.2矩阵和矩阵计算
7.3数据立方体
7.4上卷和下钻
7.5小结
第8章回归
8.1线性回归
8.2拟合
8.3残差分析
8.4过拟合
8.5欠拟合
8.6曲线拟合转化为线性拟合
8.7小结
第9章聚类
第10章分类
第11章关联分析
第12章用户画像
第13章推荐算法
第14章文本挖掘
第15章人工神经网络
第16章大数据框架简介
第17章系统架构和调优
第18章数据解读与数据的价值
附录AVMwareWorkstation的安装
附录BCentOS虚拟机的安装方法
附录CPython语言简介
附录DScikit-learn库简介
附录EFANNforPython安装
附录F群众眼中的大数据
写作花絮
参考文献
内容摘要
本书将涵盖以下比较重要的挖掘和分析知识点:概率、统计和分布、多维向量空间、回归、聚类、分类、关联分析、协同过滤、文本挖掘、神经网络。同时,讲解了大数据相关的人才需求、行业情况、大数据变现与产品发布、系统调优等读者需要了解的内容。
— 没有更多了 —
以下为对购买帮助不大的评价