• R语言数据分析
21年品牌 40万+商家 超1.5亿件商品

R语言数据分析

正版新书 新华官方库房直发 可开电子发票

44.16 6.4折 69 全新

仅1件

江苏南京
认证卖家担保交易快速发货售后保障

作者(美)盖尔盖伊·道罗齐(Gergely Daroczi) 著;潘怡 译

出版社机械工业出版社

ISBN9787111547952

出版时间2016-10

版次1

装帧平装

开本16开

纸张胶版纸

页数279页

定价69元

货号SC:9787111547952

上书时间2024-12-14

问典书店

四年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
全新正版 提供发票
商品描述
作者简介:
盖尔盖伊·道罗齐(GergelyDar6czi),统计学副教授,社会学专业博士。他是一位狂热的R包开发者,也rapporter.net网站的创始人及CTO,该网站为人们提供基于R的报表和Web应用程序。他现在就职于洛杉矶网站,担任首席R语言开发及研究的数据专家。
精彩内容:
Preface?前    言自20多年前发源于学术界以来,R语言已经成为统计分析的通用语言,活跃于众多产业领域。目前,越来越多的商业项目开始使用R,兼之R用户开发了数以千计易于上手的开发包,都使得R成为数据分析工程师及科学家最常用的工具。
    本书将帮助读者熟悉R语言这一开源生态系统,并介绍一些基本的统计背景知识,以及一小部分相关的数学知识。我们将着重探讨使用R语言解决实际的问题。
    由于数据科学家在数据的采集、清洗及重构上将耗费大量时间,因此本书首先将通过第一手实例来重点探讨从文件、数据库以及在线资源中导入数据的方法,然后再介绍数据的重构和清洗——不包含实际的数据分析,最后几章将对一些特殊的数据类型以及经典的统计模型和部分机器学习算法进行说明。
    本书主要内容第1章从与所有数据相关项目都有关的关键性的第一步——从文本文件和数据库中导入数据开始。重点探讨使用优化的CSV分析器把数据载入R,预筛选数据,并对不同数据库后台对R的支持能力进行比较。
    第2章介绍如何使用面向Web服务和API通信的包实现数据的导入,包括如何从主页上整理和抽取数据。还将对处理XML和JSON格式数据进行概括性说明。
    第3章继续介绍基础的数据处理知识,包括多种数据筛选和聚集,并对data.table和dplyr这两个常见开发包在性能和使用语法方面进行比较。
    第4章介绍更多有关复杂数据类型的转换方法,相关函数包括处理数据子集、数据合并、长宽表数
...
内容简介:
本书共分为14章,重点探讨了数据预处理的方法,包括数据获取、筛选、重构、建模、平滑以及降维,本书还介绍了分类和聚类等几种主要的数据分析方法,很后探讨了网络数据、时序数据、空间数据及社交媒体数据等一些特殊类型数据的分析处理。
目录:
译者序
前言
第1章你好,数据!1
1.1导入一个大小合适的文本文件2
1.2文本文件编译测试平台5
1.3导入文本文件的子集6
1.4从数据库中导入数据8
1.4.1搭建测试环境9
1.4.2MySQL和MariaDB11
1.4.3PostgreSQL15
1.4.4Oracle数据库17
1.4.5访问ODBC数据库22
1.4.6使用图形化用户面连接数据库23
1.4.7其他数据库后台24
1.5从其他统计系统导入数据25
1.6导入Excel电子表格26
1.7小结26
第2章从Web获取数据28
2.1从Internet导入数据集29
2.2其他流行的在线数据格式32
2.3从HTML表中读取数据37
2.4从其他在线来源获取数据39
2.5使用R包与数据源API交互42
2.5.1Socrata的开源数据API43
2.5.2金融API44
2.5.3使用Quandl获取时序数据45
2.5.4Google文档和统计数据46
2.5.5在线搜索的发展趋势47
2.5.6天气历史数据48
2.5.7其他在线数据源49
2.6小结49
第3章数据筛选和汇总50
3.1去掉多余的数据50
3.1.1快速去掉多余数据52
3.1.2快速去掉多余数据的其他方法53
3.2聚集54
3.2.1使用基础的R命令实现快速聚集55
3.2.2方便的辅助函数56
3.2.3高性能的辅助函数57
3.2.4使用data.table完成聚集59
3.3测试59

...

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

全新正版 提供发票
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP