Python预测分析与机器学习
全新正版 假一赔十 可开发票
¥
64.19
7.2折
¥
89
全新
库存3件
作者王沁晨
出版社清华大学出版社
ISBN9787302592549
出版时间2022-05
装帧平装
开本16开
定价89元
货号1202651805
上书时间2024-12-29
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
王沁晨,多伦多大学圣乔治校区计算机专业,曾在加拿大零售企业Loblaw Companies担任机器学习数据分析师,从公司传统的大型数据库中筛选有效信息、清理数据、人工数据挖掘、视化,到基础建模、模型优化、数据再筛选,再到结合商业需求创造扩展性强的实用管线,让项目从理论性的头脑风暴变现为商业价值。
目录
第1章预测分析与机器学习的实用价值
1.1人工智能、机器学习与数据分析的关系
1.2什么是预测分析
1.3预测分析在各行业中的应用
1.4预测分析流程概览
1.5小结
第2章数据清理
2.1建立编程环境
2.1.1Anaconda简介及安装
2.1.2Jupyter Notebook简介及安装
2.1.3Pandas简介及安装
2.1.4scikit-learn简介及安装
2.1.5XGBoost、LightGBM、CatBoost简介及安装
2.1.6TensorFlow简介及安装
2.2面对异构数据如何下手
2.2.1什么是异构数据
2.2.2如何处理异构数据
2.3数据误差
2.3.1各类数据误差及其影响
2.3.2如何处理数据误差
2.4数据重新格式化
……
内容摘要
本书从理解问题定义、了解数据内的高层信息、数据清理、视化数据,到基础建模、模型优化,分享一个数据分析师的视角与思路。在预测分析的流程中,一步步用详细的图文代码讲解使用到的库,如何正确使用各个库中的方法和函数,以及在遇到类似的问题时如何套用学过的知识。本书共8章。第1章对预测分析的流程进行一个高层次的概述。第2章介绍本书需要安装使用的库,并讲解数据清理步骤的执行。第3章讲解基础建模需考虑的细节,结合第4章的模型选择,可以搭建一个基础的预测管道。第5章和第6章分别从模型和数据的角度讲解如何优化预测表现。第7章讲解时间序列这一特殊数据的预测方法。最后,第8章总结全书学习到的内容,解决一个实战问题。本书面向3类读者。第1类,有编程基础但毫无数据科学背景,有意入门的读者;第2类,有数据科学理论基础,有意进入实操的读者,如刚毕业没有业界经验的学生;第3类,有数据科学理论基础与实操经验,但日常工作集中在数据分析管道中的数据分析师。
主编推荐
本书的着重点在于机器学习与预测分析的实战思路,其中加入算法或模型的理论知识介绍,让读者在学习如何进行运用的同时,更加深入的学习到为何在该实践场景下使用特定算法或模型。书中侧重讲解实操中常用、回报率高的算法。内容明了易懂,图文搭配,借鉴实际例子让学习过程更具实用感。
— 没有更多了 —
以下为对购买帮助不大的评价