• 数据分析实战 (美)托马兹·卓巴斯(TomaszDrabas) 机械工业出版
21年品牌 40万+商家 超1.5亿件商品

数据分析实战 (美)托马兹·卓巴斯(TomaszDrabas) 机械工业出版

二手书,无附赠品,择优发货

15.86 2.0折 79 八五品

仅1件

浙江杭州
认证卖家担保交易快速发货售后保障

作者(美)托马兹·卓巴斯(TomaszDrabas)

出版社机械工业出版社

ISBN9787111597797

出版时间2018-06

版次1

装帧平装

开本16开

纸张胶版纸

定价79元

货号9787111597797

上书时间2024-08-11

现货12小时发货书店

三年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:八五品
商品描述
基本信息
书名:数据分析实战
定价:79.00元
作者:(美)托马兹·卓巴斯(TomaszDrabas)
出版社:机械工业出版社
出版日期:2018-06-01
ISBN:9787111597797
字数:
页码:
版次:
装帧:平装
开本:16开
商品重量:
编辑推荐
本书深入数据分析与建模的世界,使用多种方法、工具及算法,提供了丰富的技巧。本书部分会讲授一些实战技巧,用于读取、写入、清洗、格式化、探索与理解数据;第二部分由一些较深入的主题组成,比如分类、聚类和预测等。第三部分介绍更高深的主题,从图论到自然语言处理,到离散选择模型,再到模拟。通过阅读本书,你将学到:  - 使用Pandas与OpenRefine读取、清洗、转换与存储数据  - 使用Pandas与D3.js理解数据,探索变量间的关系  - 使用Pandas、mlpy、NumPy与Statsmodels,应用多种技法,分类、聚类银行的营销电话  - 使用Pandas、NumPy与mlpy减少数据集的维度,提取重要的特征  - 使用NetworkX和Gephi探索社交网络的交互,用图论的概念识别出欺诈行为  - 通过加油站的例子,学习代理人基建模的模拟技术
内容提要
本书分为三大部分。部分会讲授一些实战技巧,用于读取、写入、清洗、格式化、探索与理解数据;第二部分由一些较深入的主题组成,比如分类、聚类和预测等;第三部分介绍更高深的主题,从图论到自然语言处理,到离散选择模型,再到模拟。
目录
Contents  目  录推荐序译者序前言致谢关于作者关于审稿人第1章 准备数据11.1 导论11.2 使用Python读写CSV/TSV文件21.3 使用Python读写JSON文件61.4 使用Python读写Excel文件71.5 使用Python读写XML文件101.6 使用pandas检索HTML页面131.7 存储并检索关系数据库151.8 存储并检索MongoDB181.9 使用OpenRefine打开并转换数据201.10 使用OpenRefine探索数据231.11 排重251.12 使用正则表达式与GREL清理数据271.13 插补缺失值281.14 将特征规范化、标准化291.15 分级数据301.16 编码分类变量32第2章 探索数据342.1 导论342.2 生成描述性的统计数据342.3 探索特征之间的相关性372.4 可视化特征之间的相互作用382.5 生成直方图432.6 创建多变量的图表462.7 数据取样492.8 将数据集拆分成训练集、交叉验证集和测试集51第3章 分类技巧533.1 导论533.2 测试并比较模型533.3 朴素贝叶斯分类器563.4 将逻辑回归作为通用分类器使用583.5 将支持向量机用作分类引擎613.6 使用决策树进行分类653.7 使用随机森林预测订阅者693.8 使用神经网络对呼叫进行分类72第4章 聚类技巧794.1 导论794.2 评估聚类方法的表现794.3 用k均值算法聚类数据824.4 为k均值算法找到的聚类数844.5 使用mean shift聚类模型发现聚类904.6 使用c均值构建模糊聚类模型914.7 使用层次模型聚类数据934.8 使用DBSCAN和BIRCH算法发现潜在的订阅者96第5章 降维995.1 导论995.2 创建三维散点图,显示主成分995.3 使用核PCA降维1025.4 用主成分分析找到关键因素1055.5 使用随机PCA在数据中寻找主成分1095.6 使用线性判别分析提取有用的维度1145.7 用kNN分类模型给电话分类时使用多种降维技巧117第6章 回归模型1226.1 导论1226.2 识别并解决数据中的多重共线性1246.3 构建线性回归模型1286.4 使用OLS预测生产的电量1346.5 使用CART估算发电厂生产的电量1386.6 将kNN模型用于回归问题1416.7 将随机森林模型用于回归分析1436.8 使用SVM预测发电厂生产的电量1456.9 训练神经网络,预测发电厂生产的电量151第7章 时间序列技术1547.1 导论1547.2 在Python中如何处理日期对象1557.3 理解时间序列数据1597.4 平滑并转换观测值1637.5 过滤时间序列数据1667.6 移除趋势和季节性1697.7 使用ARMA和ARIMA模型预测未来173第8章 图1818.1 导论1818.2 使用NetworkX在Python中处理图对象1828.3 使用Gephi将图可视化1908.4 识别信用卡信息被盗的用户2008.5 识别谁盗窃了信用卡204第9章 自然语言处理2079.1 导论2079.2 从网络读入原始文本2089.3 标记化和标准化2129.4 识别词类,处理n-gram,识别命名实体2189.5 识别文章主题2249.6 识别句子结构2269.7 根据评论给影片归类229第10章 离散选择模型23310.1 导论23310.2 准备数据集以估算离散选择模型23510.3 估算知名的多项Logit模型23910.4 测试来自无关选项的独立性冲突24410.5 用巢式Logit模型处理IIA冲突24910.6 用混合Logit模型处理复杂的替代模式251第11章 模拟25411.1 导论25411.2 使用SimPy模拟加油站的加油过程25511.3 模拟电动车耗尽电量的场景26411.4 判断羊群面对群狼时是否有团灭的风险269
作者介绍
作者简介托马兹·卓巴斯(Tomasz Drabas)微软数据科学家,致力于解决高维特征空间的问题。他有超过13年的数据分析和数据科学经验:在欧洲、澳大利亚和北美洲三大洲期间,工作领域遍及高新技术、航空、电信、金融和咨询。他曾担任Beyond Analysis Australia的数据分析师和Vodafone Hutchison Australia的高级数据分析师/数据科学家等。
序言

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP