• 数据采集与预处理
21年品牌 40万+商家 超1.5亿件商品

数据采集与预处理

全新正版 可开发票 极速发货

16.34 3.9折 42 全新

库存22件

广东广州
认证卖家担保交易快速发货售后保障

作者周勇编;杨倩编;廖宁编;余秋莲编

出版社西安电子科技大学出版社

ISBN9787560663562

出版时间2022-02

装帧平装

开本16开

定价42元

货号31386602

上书时间2024-05-15

谢岳书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
目录
第1章  概述
  1.1  大数据采集
    1.1.1  大数据来源
    1.1.2  大数据采集方式
    1.1.3  数据预处理
  1.2  网络爬虫原理和分类
    1.2.1  爬虫原理
    1.2.2  爬虫分类
    1.2.3  常用爬虫工具
  1.3  网络爬虫法律规范
    1.3.1  数据隐私保护
    1.3.2  Robots协议
    1.3.3  法律法规
  本章小结
  本章习题
第2章  Python基础
2,1 Python环境搭建
    2.1.1  Python解释器
    2.1.2  PyCharm的安装
  2.2  Python基础
    2.2.1  Python语法基础
    2.2.2  数据类型
    2.2.3  程序结构
    2.2.4  函数
    2.2.5  面向对象
  本章小结
  本章习题
第3章  静态网页爬取
  3.1  HTTP协议概述
    3.1.1  请求响应模型
    3.1.2  请求报文
    3.1.3  响应报文
  3.2  使用Requests库提取网页数据
    3.2.1  Requests库的安装
    3.2.2  Requests库的请求方法
    3.2.3  使用Requests库发送GET请求
    3.2.4  使用Requests库发送POST请求
    3.2.5  Requests库的响应对象
    3.2.6  HTTP状态码
    3.2.7  定制请求头
    3.2.8  Requests库发送GET请求的通用代码
  3.3  使用urllib库提取网页数据
    3.3.1  使用urllib库发送GET请求
    3.3.2  使用urllib库发送POST请求
    3.3.3 urllib库的用户代理
  3.4  案例1  QQ表情包图片爬取
    3.4.1  任务描述
    3.4.2  任务分析
    3.4.3  任务实现
  3.5  案例  2手机号码归属地查询

内容摘要
 随着国家大数据相关政策、规划的密集出台,大数据、人工智能商业落地速度加快,其在各个领域
的应用也越来越广泛,其中面向企业服务、金融、
医疗健康、电子政务、电子商务等细分领域的大数据应用展现出巨大的潜力。
大数据是需要新处理模式才能适应的海量、高增长率和多样化的信息资产,被誉为“未来的新石油”,以至于数据的获取、存储、搜索、共享、分析以及可视化呈现都成为当前重要的研究课题。
本书重点讲述数据采集与预处理的相关内容,并以真实案例介绍不同数据源的采集方式及基本的数据预处理方法。全书共lO章。其中,第1章为概述,第2~5章介绍静态网页数据爬取,第6章介绍动态网页数据爬取,第7、8章介绍爬虫(Scrapy)框架应用,第9章介绍数据预处理,第10章给出了一个综合项目实训。
本书可作为高校数据科学与大数据技术专业相关课程的教材或教学参考书,也可作为人工智能、大数据领域从业者的自学参
考书。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP