正版保证 新华库房直发 可开电子发票 七天无理由退货让您购物无忧
¥ 72.2 6.6折 ¥ 110 全新
库存2件
作者杨年华
出版社清华大学出版社
ISBN9787302611516
出版时间2023-01
装帧平装
开本16开
定价110元
货号31613842
上书时间2024-10-12
在大数据和人工智能时代,数据是各企事业单位的重要资产。数据分析和机器学习是寻找数据之间关系、预测趋势的重要手段,是智能决策的重要方法之一。通过数据分析和机器学习知识体系的培养,结合各学科的应用,可以为各学科的人才培养注入新的动力。Python语言入门简单,已经得到广泛的应用,也是当前大数据和人工智能领域最常用的程序设计语言之一。我们在相关课程建设的基础上编写了本书。
本书共14章。第1~4章主要介绍Python语法的基础知识,为后面内容的学习提供基础。第5~7章主要介绍数据分析和可视化方法,同时也为后面的机器学习部分提供基础。第8~14章主要介绍机器学习及数据预处理和模型评估方法。各章节的主要内容如下。
第1章主要阐述Python语言的特点、模块的概念、帮助的使用方法及开发环境的安装与使用方法。
第2章主要介绍Python语言的语法基础,包括标识符、表达式、常用数据类型、分支与循环结构、常用组合类型等。本章部分内容由柳青、张晓黎、郑戟明编写。
第3章主要介绍自定义函数以及类型注解、lambda表达式和函数式编程的常用类与函数。本章部分内容由柳青编写。
第4章主要介绍类与对象的关系、自定义类和类的继承。本章4.1节和4.2节中的部分内容由柳青编写。
第5章主要介绍NumPy数据处理基础。NumPy是学习Matplotlib、Pandas、scikitlearn等内容的基础。
第6章主要介绍Matplotlib数据可视化基础,介绍了多种数据展示方法。
第7章主要介绍Pandas数据处理与分析技术,包括Series和DataFrame两种对象的用法及在数据库和文件中的存取方法、常用函数与方法、数据清洗与处理方法、时间处理、统计分析、Pandas中的绘图方法。这些处理步骤为后续章节中的机器学习提供了数据预处理的技术。
第8章是对机器学习方法的概述,并介绍了一些常用实验数据的获取与加载方法,最后给出了使用scikitlearn实现机器学习的基本步骤。
第9章介绍将数据集用于模型训练前的常用预处理方法,主要包括特征的离散化、标准化、正则化和编码。
第10章主要介绍机器学习模型的常用评估方法和scikitlearn中连接系列操作的轨道使用方法。
第11章主要介绍有监督学习中的经典算法及scikitlearn中对应类的用法。
第12章主要介绍几种常用的集成学习方法及scikitlearn中对应类的用法。
第13章主要介绍基于无监督学习的聚类和降维。
第14章主要介绍如何利用网格搜索进行超参数调优和算法选择。
全书除了第2~4章提到的编写人员外,其他章节均由杨年华编写。
本书案例中使用的实验数据主要来自scikitlearn自带数据集和UCI机器学习库(UCI Machine Learning Repository),另外用到了部分从雅虎财经频道下载的股票交易数据。在此,我们对数据集的分享者表示感谢。
本书案例在Python 3.10、NumPy 1.22.1、Matplotlib 3.5.1、Pandas 1.4、scikitlearn 1.0.2下通过测试。读者也可以在更高版本的配置上运行本书的源代码。
本书提供配套的源代码,并为教师提供课件和教学大纲等资料。这些资料可以在清华大学出版社官方网站下载。本书的第3章和第5~7章配套了微课视频,读者可先扫描封底刮刮卡内的二维码,获得权限后,再扫描正文中的二维码,即可观看视频。
由于作者水平有限,书中难免存在疏漏和不妥之处,敬请批评指正,并将意见反馈给我们。
作者
2022年3月
本书首先简要介绍Python语言的基础知识,为后续内容的学习提供基础,接着介绍NumPy、Matplotlib和Pandas三个数据分析基础模块的用法,同时也为后面基于scikitlearn的机器学习提供基础,最后介绍基于scikitlearn机器学习及其模型的评价方法、超参数调优方法。全书通过大量案例,希望能让读者快速提高实践能力。 本书适合作为高校本科生或研究生数据分析、机器学习等相关课程的教材或参考书,也可作为数据分析和机器学习爱好者的自学教程,还可以作为相关科研工作者与工程实践者的参考书。
顺序渐进地从Python基础知识、数据分析与可视化基础到机器学习进行讲解。案例丰富、结构清晰、简单明了。适合作为本科高年级或研究生相关课程的教材,也适合作为工程技术人员的参考书。配套微课视频、教学课件、源代码等资源。
— 没有更多了 —
以下为对购买帮助不大的评价