数据分析与预测算法:基于R语言9787111746782
全新正版 新华集团直发 开票请联系
¥
160.16
8.0折
¥
199
全新
库存2件
作者[美]拉斐尔·A. 伊里萨里(Rafael A.Irizarry)
出版社机械工业
ISBN9787111746782
出版时间2024-04
装帧其他
开本其他
定价199元
货号32055310
上书时间2024-12-29
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
拉斐尔·A·伊里萨里(RafaelA.Irizarry)是达纳-法伯癌症研究所(Dana-FarberCancerInstitute)的数据科学教授、哈佛大学(Harvard)生物统计学教授、美国统计协会(AmericanStatisticalAssociation)会员。伊里萨里博士是一名应用统计学家,在过去的20年里,他在不同的领域工作,包括基因组学、声音工程和公共卫生。他将数据分析的解决方案作为开源软件发布,这些工具被广泛下载和使用。伊里萨里教授还在哈佛大学开发并教授了几门数据科学课程,以及一些受欢迎的在线课程。
目录
目 录 Contents<br />前言<br />致谢<br />第1章 R和RStudio入门1<br />1.1 为什么是R1<br />1.2 R控制台2<br />1.3 脚本2<br />1.4 RStudio3<br />1.4.1 窗格3<br />1.4.2 按键绑定4<br />1.4.3 编辑脚本时运行命令5<br />1.4.4 更改全局选项7<br />1.5 安装R包8<br />第一部分 R语言<br />第2章 R基础知识10<br />2.1 案例研究:美国枪杀人数10<br />2.2 非常基础的知识11<br />2.2.1 对象11<br />2.2.2 工作区12<br /><br /><br /><br />2.2.3 函数13<br />2.2.4 其他预构建对象14<br />2.2.5 变量名15<br />2.2.6 保存工作区15<br />2.2.7 启发性脚本15<br />2.2.8 注释代码16<br />2.3 练习16<br />2.4 数据类型17<br />2.4.1 数据帧17<br />2.4.2 检查对象17<br />2.4.3 访问器:$18<br />2.4.4 向量:数值型、字符型和<br />逻辑型18<br />2.4.5 因子19<br />2.4.6 列表20<br />2.4.7 矩阵21<br />2.5 练习22<br />2.6 向量23<br />2.6.1 创建向量23<br />2.6.2 命名24<br />2.6.3 序列24<br />2.6.4 子集25<br />2.7 强制转换25<br />2.8 练习26<br />2.9 排序27<br />2.9.1 sort27<br />2.9.2 order27<br />2.9.3 max和which.max28<br />2.9.4 rank29<br />2.9.5 注意循环使用29<br />2.10 练习29<br />2.11 向量运算30<br />2.11.1 重新缩放向量31<br />2.11.2 两个向量31<br />2.12 练习32<br />2.13 索引32<br />2.13.1 逻辑子集32<br />2.13.2 逻辑运算符33<br />2.13.3 which33<br />2.13.4 match33<br />2.13.5 %in%34<br />2.14 练习34<br />2.15 基本图35<br />2.15.1 plot 35<br />2.15.2 hist35<br />2.15.3 boxplot36<br />2.15.4 image36<br />2.16 练习36<br />第3章 编程基础38<br />3.1 条件表达式38<br />3.2 函数40<br />3.3 命名空间41<br />3.4 for循环42<br />3.5 向量化和泛函43<br />3.6 练习43<br />第4章 tidyverse45<br />4.1 tidy数据45<br />4.2 练习46<br />4.3 操作数据帧47<br />4.3.1 使用mutate添加列47<br />4.3.2 使用filter构造子集48<br />4.3.3 使用select选择列 48<br />4.4 练习48<br />4.5 管道:%>%50<br />4.6 练习51<br />4.7 汇总数据51<br />4.7.1 summarize52<br />4.7.2 pull53<br />4.7.3 group_by54<br />4.8 数据帧排序55<br />4.8.1 嵌套排序55<br />4.8.2 top_n56<br />4.9 练习56<br />4.10 tibble57<br />4.10.1 tibble展示效果更好58<br />4.10.2 tibble的子集仍是tibble58<br />4.10.3 tibble可以有复杂的条目59<br />4.10.4 tibble可以分组59<br />4.10.5 使用tibble代替data.frame59<br />4.11 点运算符60<br />4.12 do60<br />4.13 purrr包62<br />4.14 tidyverse条件63<br />4.14.1 case_when63<br />4.14.2 between63<br />4.15 练习64<br />第5章 导入数据65<br />5.1 路径和工作目录66<br />5.1.1 文件系统66<br />5.1.2 相对路径和完整路径67<br />5.1.3 工作目录67<br />5.1.4 生成路径名67<br />5.1.5 使用路径复制文件68<br />5.2 readr和readxl包68<br />5.2.1 readr68<br />5.2.2 readxl69<br />5.3 练习70<br />5.4 下载文件70<br />5.5 R-base导入函数71<br />5.6 文本与二进制文件72<br />5.7 Unicode与ASCII72<br />5.8 用电子表格组织数据73<br />5.9 练习74<br />第二部分 数据可视化<br />第6章 数据可视化导论76<br />第7章 ggplot280<br />7.1 图的组件81<br />7.2 ggplot对象82<br />7.3 几何图形82<br />7.4 美学映射83<br />7.5 图层集合84<br />7.6 全局与局部美学映射85<br />7.7 尺度86<br />7.8 标签和标题86<br />7.9 类别的颜色87<br />7.10 注释、形状和调整88<br />7.11 附加组件包89<br />7.12 综合90<br />7.13 用qplot快速绘图91<br />7.14 绘图网格91<br />7.15 练习92<br />第8章 可视化数据分布94<br />8.1 变量类型94<br />8.2 案例研究:描述学生的身高95<br />8.3 分布函数95<br />8.4 累积分布函数96<br />8.5 直方图97<br />8.6 平滑密度图97<br />8.6.1 解读y轴100<br />8.6.2 密度容许分层100<br />8.7 练习101<br />8.8 正态分布103<br />8.9 标准单位104<br />8.10 分位数图105<br />8.11 百分位数106<br />8.12 箱线图107<br />8.13 分层法108<br />8.14 案例研究:描述学生的<br />身高(续)108<br />8.15 练习109<br />8.16 ggplot2几何图形111<br />8.16.1 条形图111<br />8.16.2 直方图112<br />8.16.3 密度图113<br />8.16.4 箱线图113<br />8.16.5 QQ图114<br />8.16.6 图像114<br />8.16.7 快速绘图115<br />8.17 练习116<br />第9章 实践中的数据可视化118<br />9.1 案例研究:对贫困的新见解118<br />9.2 散点图120<br />9.3 分面121<br />9.3.1 facet_wrap 123<br />9.3.2 采用固定尺度以更好地<br />进行比较123<br />9.4 时间序列图124<br />9.5 数据转换127<br />9.5.1 对数转换127<br />9.5.2 使用哪一个底数128<br />9.5.3 转换值还是标记尺度129<br >9.6 可视化多峰分布130<br />9.7 用箱线图和脊线图比较多种分布130<br />9.7.1 箱线图131<br />9.7.2 脊线图132<br />9.7.3 示例:1970年和2010年的<br />收入分布134<br />9.7.4 访问计算变量139<br />9.7.5 加权密度142<br />9.8 生态谬误和显示数据的重要性143<br />9.8.1 逻辑转换143<br />9.8.2 显示数据144<br />第10章 数据可视化原则145<br />10.1 使用视觉线索编码数据145<br />10.2 知道什么时候包含0148<br />10.3 不要扭曲数量150<br />10.4 按有意义的值对类别排序150<br />10.5 显示数据152<br />10.6 简单的比较153<br />10.6.1 使用公共的轴153<br />10.6.2 垂直对齐图可以看到<br />水平变化,水平对齐图<br />可以看到垂直变化154<br />10.6.3 考虑数据转换155<br />10.6.4 比较相邻视觉线索157<br />10.6.5 使用颜色157<br />10.7 考虑色盲158<br />10.8 两个变量的图158<br />10.8.1 斜率图158<br />10.8.2 Bland-Altman图159<br />10.9 编码第三个变量160<br />10.10 避免拟三维图161<br />10.11 避免使用过多有效数字162<br />10.12 了解你的读者163<br />10.13 练习164<br />10.14 案例研究:疫苗和传染病167<br />10.15 练习170<br />第11章 鲁棒的汇总171<br />11.1 离群值171<br />11.2 中值172<br />11.3 四分位距172<br />11.4 Tukey对离群值的定义173<br />11.5 绝对中位差173<br />11.6 练习174<br />11.7 案例研究:学生报告的身高175<br />第三部分 R语言统计学<br />第12章 R语言统计学导论178<br />第13章 概率179<br />13.1 离散概率179<br />13.1.1 相对频率179<br />13.1.2 符号180<br />13.1.3 概率分布180<br />13.2 分类数据的蒙特卡罗模拟180<br />13.2.1 设置随机种子181<br />13.2.2 有无放回182<br />13.3 独立性182<br />13.4 条件概率183<br />13.5 加法和乘法法则183<br />13.5.1 乘法法则183<br />13.5.2 独立条件下的乘法法则184<br />13.5.3 加法法则184<br />13.6 排列组合184<br />13.7 示例188<br />13.7.1 蒙提·霍尔问题188<br />13.7.2 生日问题189<br />13.8 无限实验191<br />13.9 练习191<br />13.10 连续概率193<br />13.11 理论连续分布194<br />13.11.1 近似理论分布194<br />13.11.2 概率密度195<br />13.12 连续变量的蒙特卡罗模拟196<br />13.13 连续分布197<br />13.14 练习197<br />第14章 随机变量199<br />14.1 生成随机变量199<br />14.2 抽样模型200<br />14.3 随机变量的概率分布201<br />14.4 分布与概率分布202<br />14.5 随机变量符号203<br />14.6 期望值和标准误差203<br />14.7 中心极限定理205<br />14.8 平均值统计特性206<br />14.9 大数定律208<br />14.10 练习208<br />14.11 案例研究:大空头209<br />14.11.1 利率解释与机会模型209<br />14.11.2 大空头212<br />14.12 练习215<br />第15章 统计推断216<br />15.1 民意调查216<br />15.2 总体、样本、参数和估计218<br />15.2.1 样本平均值219<br />15.2.2 参数220<br />15.2.3 民意调查与预测220<br />15.2.4 估计值的性质:期望值和<br />标准误差220<br />15.3 练习221<br />15.4 实践中的中心极限定理222<br />15.4.1 蒙特卡罗模拟224<br />15.4.2 差值225<br />15.4.3 偏差:为什么不进行一次<br />大规模的民意调查呢225<br />15.5 练习226<br />15.6 置信区间227<br />15.6.1 蒙特卡罗模拟229<br />15.6.2 正确的语言230<br />15.7 练习231<br />15.8 幂232<br />15.9 p值232<br />15.10 联合检验233<br />15.10.1 女士品茶234<br />15.10.2 二乘二表234<br />15.10.3 卡方检验235<br />15.10.4 比值比236<br />15.10.5 比值比的置信区间237<br />15.10.6 小计数校正237<br />15.10.7 样本大,p值小238<br />15.11 练习238<br />第16章 统计模型239<br />16.1 民意调查聚合器240<br />16.1.1 民意调查数据242<br />16.1.2 民意调查机构偏差243<br />16.2 数据驱动模型244<br />16.3 练习245<br />16.4 贝叶斯统计248<br />16.5 贝叶斯定理模拟249<br />16.6 层次模型251<br />16.7 练习253<br />16.8 案例研究:选举预测255<br />16.8.1 贝叶斯方法255<br />16.8.2 一般偏差256<br />16.8.3 模型的数学表示256<br />16.8.4 预测选举团259<br />16.8.5 预测263<br />16.9 练习264<br />16.10 t分布266<br />第17章 回归268<br />17.1 案例研究:身高是遗传的吗268<br />17.2 相关系数269<br />17.2.1 样本相关系数是一个<br />随机变量271<br />17.2.2 相关系数并不总是有用272<br />17.3 条件期望272<br />17.4 回归线274<br />17.4.1 回归提高精度275<br />17.4.2 二元正态分布(高级)276<br />17.4.3 可释方差278<br />17.4.4 警告:有两条回归线278<br />17.5 练习279<br />第18章 线性模型280<br />18.1 案例研究:《点球成金》280<br
— 没有更多了 —
以下为对购买帮助不大的评价