• 数据科学导论(Python语言原书第3版)/数据科学与工程技术丛书 (意)阿尔贝托·博斯凯蒂//卢卡·马萨罗|责编:罗丹琪|译者:于俊伟 机械工业 正版新书
21年品牌 40万+商家 超1.5亿件商品

数据科学导论(Python语言原书第3版)/数据科学与工程技术丛书 (意)阿尔贝托·博斯凯蒂//卢卡·马萨罗|责编:罗丹琪|译者:于俊伟 机械工业 正版新书

正版新书 16点前订购当日发出 支持7天无理由 开电子发票

61.16 7.7折 79 全新

库存2件

浙江杭州
认证卖家担保交易快速发货售后保障

作者(意)阿尔贝托·博斯凯蒂//卢卡·马萨罗|责编:罗丹琪|译者:于俊伟

出版社机械工业

ISBN9787111646693

出版时间2020-03

装帧其他

开本其他

定价79元

货号30857440

上书时间2024-07-03

安轩图书专营店

四年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
目录
译者序
前言
作者简介
审阅者简介
第1章  新手上路
  1.1  数据科学与Python简介
  1.2  Python的安装
    1.2.1  Python 2还是Python
    1.2.2  分步安装
    1.2.3  安装必要的工具包
    1.2.4  工具包升级
  1.3  科学计算发行版
    1.3.1  Anaconda
    1.3.2  使用conda安装工具包
    1.3.3  Enthought Canopy
    1.3.4  WinPython
  1.4  虚拟环境
  1.5  核心工具包一瞥
  1.6  Jupyter简介
    1.6.1  快速安装与初次使用
    1.6.2  Jupyter魔术命令
    1.6.3  直接从Jupyter Notebook安装软件包
    1.6.4  查看新的JupyterLab环境
    1.6.5  Jupyter Notebook怎样帮助数据科学家
    1.6.6  Jupyter的替代版本
  1.7  本书使用的数据集和代码
    1.7.1  Scikit-learn小规模数据集
    1.7.2  MLdata.org和其他公共资源库
    1.7.3  LIBSVM Data样本
    1.7.4  直接从CSV或文本文件加载数据
    1.7.5  Scikit-learn样本生成器
  1.8  小结
第2章  数据改写
  2.1  数据科学过程
  2.2  使用pandas进行数据加载与预处理
    2.2.1  数据快捷加载
    2.2.2  处理问题数据
    2.2.3  处理大数据集
    2.2.4  访问其他的数据格式
    2.2.5  合并数据
    2.2.6  数据预处理
    2.2.7  数据选择
  2.3  使用分类数据和文本数据
    2.3.1  特殊的数据类型—文本
    2.3.2  使用Beautiful Soup抓取网页
  2.4  使用Numpy进行数据处理
    2.4.1  NmuPy中的N维数组
    2.4.2  NmuPy ndarray对象基础
  2.5  创建Numpy数组
    2.5.1  从列表到一维数组
    2.5.2  控制内存大小
    2.5.3  异构列表
    2.5.4  从列表到多维数组
    2.5.5  改变数组大小
    2.5.6  利用NumPy函数生成数组
    2.5.7  直接从文件中获得数组
    2.5.8  从pandas提取数据
  2.6  NumPy快速操作和计算
    2.6.1  矩阵运算
    2.6.2  NumPy数组切片和索引
    2.6.3  NumPy数组堆叠
    2.6.4  使用稀疏数组
  2.7  小结
第3章  数据科学流程
  3.1  EDA简介
  3.2  创建新特征
  3.3  维数约简
    3.3.1  协方差矩阵
    3.3.2  主成分分析
    3.3.3  一种用于大数据的PCA变型—RandomizedPCA
    3.3.4  潜在因素分析
    3.3.5  线性判别分析
    3.3.6  潜在语义分析
    3.3.7  独立成分分析
    3.3.8  核主成分分析
    3.3.9  T-分布邻域嵌入算法
    3.3.10  受限波尔兹曼机
  3.4  异常检测和处理
    3.4.1  单变量异常检测
    3.4.2  EllipticEnvelope
    3.4.3  OneClassSVM
  3.5  验证指标
    3.5.1  多标号分类
    3.5.2  二值分类
    3.5.3  回归
  3.6  测试和验证
  3.7  交叉验证
    3.7.1  使用交叉验证迭代器
    3.7.2  采样和自举方法
  3.8  超参数优化
    3.8.1  建立自定义评分函数
    3.8.2  减少网格搜索时间
  3.9  特征选择
    3.9.1  基于方差的特征选择
    3.9.2  单变量选择
    3.9.3  递归消除
    3.9.4  稳定性选择与基于L1的选择
  3.10  将所有操作包装成工作流程
    3.10.1  特征组合和转换链接
    3.10.2  构建自定义转换函数
  3.11  小结
第4章  机器学习
  4.1  准备工具和数据集
  4.2  线性和逻辑回归
  4.3  朴素贝叶斯
  4.4  K近邻
  4.5  非线性算法
    4.5.1  基于SVM的分类算法
    4.5.2  基于SVM的回归算法
    4.5.3  调整SVM(优化)
  4.6  组合策略
    4.6.1  基于随机样本的粘贴策略
    4.6.2  基于弱分类器的Bagging策略
    4.6.3  随机子空间和随机分片
    4.6.4  随机森林和Extra-Trees
    4.6.5  从组合估计概率
    4.6.6  模型序列—AdaBoost
    4.6.7  梯度树提升
    4.6.8  XGBoost
    4.6.9  LightGBM
    4.6.10  CatBoost
  4.7  处理大数据
    4.7.1  作为范例创建一些大数据集
    4.7.2  对容量的可扩展性
    4.7.3  保持速度
    4.7.4  处理多样性
    4.7.5  随机梯度下降概述
  4.8  自然语言处理一瞥
    4.8.1  词语分词
    4.8.2  词干提取
    4.8.3  词性标注
    4.8.4  命名实体识别
    4.8.5  停止词
    4.8.6  一个完整的数据科学例子—文本分类
  4.9  无监督学习概览
    4.9.1  K均值算法
    4.9.2  基于密度的聚类技术—DBSCAN
    4.9.3  隐含狄利克雷分布
  4.10  小结
第5章  可视化、发现和结果
  5.1  matplotlib基础介绍
    5.1.1  曲线绘图
    5.1.2  绘制分块图
    5.1.3  数据中的关系散点图
    5.1.4  直方图
    5.1.5  柱状图
    5.1.6  图像可视化
    5.1.7  pandas的几个图形示例
    5.1.8  通过平行坐标发现模式
  5.2  封装matplotlib命令
    5.2.1  Seaborn简介
    5.2.2  增强EDA性能
  5.3  高级数据学习表示
    5.3.1  学习曲线
    5.3.2  确认曲线
    5.3.3  随机

内容摘要
 本书是作者多年数据科学实践经验的总结,第3版通过对上一版内容的更新和扩展,以新版的JupyterNotebook和JupyterLab界面为基础,涵盖Numpy、
pandas和Scikit-learn等库的所有主要更新,全面又系统地讲解了数据科学分析和开发的相关工具、最佳实践以及简单示例。通过阅读本书,你将深入了解Python核心概念,成为高效数据科学实践者。
本书共8章,第1章介绍JupyterNotebook的使用方法;第2章介绍所有关键的数据操作和转换技术,重点介绍数据改写的最佳实践;第3章讨论有可能改进数据科学项目结果的数据操作技术;第4章深入研究Scikit-learn中的主要机器学习算法;第5章介绍基础
和中高级图形表示技术;第6章介绍一些实用且有效的社交关系和交互数据处理技术;第7章深入介绍深度学习原理,结合Keras库便捷地搭建各种深度学习网络,并通过示例演示深度学习在交通标志分类和电影评论情感预测中的应用;第8章介绍一种处理数据的新方法——水平缩放大数据。附录则是一些Python示例和说明,重点介绍Python语言的主要特点。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP