R语言商务数据分析实战
全新正版 极速发货
¥
24.18
5.4折
¥
45
全新
仅1件
作者韩宝国,张良均 主编
出版社人民邮电出版社
ISBN9787115474483
出版时间2018-04
装帧平装
开本16开
定价45元
货号1201681880
上书时间2024-11-25
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
张良均,高 级信息系统项目管理师,泰迪杯全国大学生数据挖掘竞赛(www.tipdm.org)发起人。华南师范大学、广东工业大学兼职教授,广东省工业与应用数学学会理事。兼有大型高科技企业和高校的工作经历,主要从事大数据挖掘及其应用的策划、研发及咨询培训。全国计算机技术与软件专业技术资格(水平)考试继续教育和CDA数据分析师培训讲师。发表数据挖掘相关论文数二十余篇,已取得国家发明12项,主编《Hadoop大数据分析与挖掘实战》《Python数据分析与挖掘实战》《R语言数据分析与挖掘实战》等多本畅销图书,主持并完成科技项目9项。获得SAS、SPSS数据挖掘认证及Hadoop开发工程师证书,具有电力、电信、银行、制造企业、电子商务和电子政务的项目经验和行业背景。行、制造企业、电子商务和电子政务的项目经验和行业背景。
目录
第 1章 R语言数据分析概述 1任务1.1 认识数据分析 11.1.1 掌握数据分析的概念 11.1.2 熟悉数据分析的流程 21.1.3 了解数据分析应用场景 4任务1.2 熟悉R语言数据分析工具 51.2.1 了解数据分析常用工具 61.2.2 了解R语言数据分析的优势 61.2.3 了解R语言数据分析常用的Packages 7小结 10课后习题 10第 2章 商品零售购物篮分析 12任务2.1 了解购物篮分析 122.1.1 分析商品零售企业现状 122.1.2 了解某商品零售企业基本数据情况 132.1.3 熟悉购物篮分析的步骤与流程 13任务2.2 分析商品销售状况 142.2.1 分析热销商品 142.2.2 分析商品结构 152.2.3 任务实现 17任务2.3 使用Apriori关联规则构建购物篮分析模型 182.3.1 了解Apriori算法的基本原理与使用方法 182.3.2 分析结果 232.3.3 任务实现 24小结 24实训 使用Apriori算法对西饼屋订单进行关联分析 25课后习题 25第3章 航空公司客户价值分析 28任务3.1 了解航空公司现状与客户价值分析 283.1.1 了解航空公司现状 283.1.2 了解客户价值分析 303.1.3 熟悉航空客户价值分析的步骤与流程 30任务3.2 预处理航空客户数据 313.2.1 处理数据缺失值与异常值 313.2.2 构建航空客户价值分析的关键特征 313.2.3 标准化LRFMC的5个特征 353.2.4 任务实现 36任务3.3 使用K-Means算法进行客户分群 373.3.1 了解K-Means聚类算法 373.3.2 分析聚类结果 383.3.3 模型应用 413.3.4 任务实现 42小结 43实训 43实训1 处理信用卡数据异常值 43实训2 构造信用卡客户风险评价关键特征 45实训3 构建K-Means聚类模型 45课后习题 46第4章 财政收入预测分析 48任务4.1 了解财政收入预测的背景与方法 484.1.1 分析财政收入预测背景 484.1.2 了解财政收入预测的方法 504.1.3 熟悉财政收入预测的步骤与流程 51任务4.2 分析财政收入数据特征的相关性 514.2.1 了解相关性分析 514.2.2 分析计算结果 524.2.3 任务实现 53任务4.3 使用Lasso回归方法选取财政收入预测的关键特征 534.3.1 了解Lasso回归方法 534.3.2 分析Lasso回归结果 544.3.3 任务实现 54任务4.4 使用灰色预测和SVR构建财政收入预测模型 554.4.1 了解灰色预测算法 554.4.2 了解SVR算法 564.4.3 分析预测结果 584.4.4 任务实现 60小结 61实训 61实训1 求取企业所得税各特征间的相关系数 61实训2 选取企业所得税预测关键特征 62实训3 构建企业所得税预测模型 62课后习题 62第5章 金融服务机构资金流量预测 64任务5.1 了解金融服务机构现状与资金流量预测 645.1.1 分析金融服务机构现状 645.1.2 认识资金流量预测 655.1.3 熟悉金融服务机构资金流量预测的步骤与流程 66任务5.2 检验数据的平稳性 675.2.1 检验平稳性 675.2.2 处理非平稳序列 695.2.3 任务实现 71任务5.3 检验数据的纯随机性 725.3.1 了解纯随机性检验 735.3.2 检验纯随机性 735.3.3 任务实现 74任务5.4 建立ARIMA模型 745.4.1 了解ARIMA模型 745.4.2 识别模型阶数 755.4.3 建立ARIMA模型 765.4.4 任务实现 81小结 83实训 83实训1 检验资金赎回数据的平稳性与纯随机性 83实训2 识别资金赎回数据集的阶数 83实训3 构建ARIMA模型 83课后习题 84第6章 P2P信用贷款风险控制 85任务6.1 认识P2P信贷行业的风险控制 856.1.1 分析P2P信贷行业的现状 866.1.2 了解某P2P平台数据情况 866.1.3 熟悉用户逾期预测的步骤与流程 87任务6.2 探索P2P信贷用户逾期的相关因素 886.2.1 分析用户信息完善程度与逾期率的关系 886.2.2 分析用户信息修改情况与逾期率的关系 896.2.3 分析用户所在区域经济发展情况与逾期率的关系 906.2.4 分析借款月份与逾期率的关系 916.2.5 任务实现 92任务6.3 预处理P2P信贷用户数据 956.3.1 使用第三方平台信息构建新特征 956.3.2 对登录信息表与更新信息表进行长宽表转换 956.3.3 清洗P2P信贷数据 976.3.4 任务实现 98任务6.4 构建用户逾期还款概率预测模型 1076.4.1 了解GBM算法 1076.4.2 评价GBM模型 1086.4.3 分析结果 1096.4.4 任务实现 109小结 111实训 111实训1 探索某银行贷款数据规律 111实训2 预处理某银行贷款数据 111实训3 使用GBM算法构建信贷审批模型 111课后习题 112第7章 电子商务网站智能推荐服务 113任务7.1 了解某网站现状与智能推荐系统 1137.1.1 分析某网站现状 1137.1.2 了解智能推荐服务 1157.1.3 熟悉网站智能推荐的步骤与流程 116任务7.2 使用R连接数据库并提取数据 1177.2.1 访问数据库 1177.2.2 任务实现 118任务7.3 统计网页整体流量状况 1187.3.1 分析网页类型 1197.3.2 分析网页点击次数 1227.3.3 分析网页排名 1237.3.4 任务实现 124任务7.4 预处理网页浏览数据 1307.4.1 删除不符合规则的网页 1307.4.2 还原翻页网址 1317.4.3 划分正确的网页类别 1317.4.4 选择用户和用户访问网页记录 1327.4.5 任务实现 133任务7.5 构建智能推荐模型 1367.5.1 了解协同过滤算法 1367.5.2 评价智能推荐模型 1397.5.3 分析模型结果 1427.5.4 任务实现 142小结 144实训 实现MovieLense电影数据的智能推荐 144实训1 清洗MovieLense原始数据 144实训2 构建MovieLense智能推荐模型 144实训3 评估推荐系统模型 145课后习题 145第8章 电商产品评论数据情感分析 147任务8.1 了解电商企业现状与文本情感分析流程 1478.1.1 分析电商企业现状 1478.1.2 了解电商产品评论数据 1488.1.3 实现电商评论数据情感分析的步骤与流程 149任务8.2 获取电商产品评论数据 1498.2.1 了解R语言获取网络数据的方法 1498.2.2 了解数据获取的方法 1518.2.3 任务实现 153任务8.3 对电商产品评论数据进行预处理 1568.3.1 去除评论数据中的重复数据 1568.3.2 清洗评论数据 1568.3.3 对评论数据进行分词 1578.3.4 去除停用词 1588.3.5 提取有意义的评论 1598.3.6 绘制词云查看分词效果 1608.3.7 任务实现 162任务8.4 评论数据情感倾向分析 1638.4.1 匹配情感词 1648.4.2 修正情感倾向 1648.4.3 检验情感分析效果 1648.4.4 任务实现 165任务8.5 使用LDA模型进行主题分析 1698.5.1 了解LDA主题模型 1698.5.2 寻找最 优主题数 1718.5.3 进行LDA主题分析 1718.5.4 评价主题分析结果 1728.5.5 任务实现 173小结 176实训 176实训1 清洗酒店评论原始数据 176实训2 对酒店评论数据进行预处理 176实训3 使用LDA模型建模并分析酒店评论 177课后习题 177第9章 餐饮企业综合分析 179任务9.1 了解餐饮企业分析需求 1799.1.1 分析餐饮企业现状与需求 1809.1.2 了解餐饮企业数据基本状况 1819.1.3 熟悉餐饮企业数据分析的步骤与流程 183任务9.2 统计餐饮菜品数据 1849.2.1 统计每日用餐人数与销售额 1849.2.2 统计菜品热销度 1909.2.3 统计菜品的毛利率 1919.2.4 任务实现 192任务9.3 使用ARIMA算法预测销售额 1949.3.1 检验平稳性和纯随机性 1949.3.2 构建ARIMA模型 1969.3.3 任务实现 198任务9.4 使用协同过滤算法实现菜品的智能推荐 2019.4.1 选取特征 2029.4.2 使用基于物品的智能推荐算法进行推荐 2029.4.3 了解基于用户的智能推荐算法 2039.4.4 分析协同过滤结果 2039.4.5 任务实现 204任务9.5 使用Apriori算法实现菜品的关联分析 2079.5.1 构建Apriori模型 2079.5.2 分析关联规则结果 2099.5.3 任务实现 210任务9.6 使用K-Means算法进行客户价值分析 2149.6.1 构建关键特征 2149.6.2 构建K-Means模型 2149.6.3 分析K-Means模型结果 2159.6.4 任务实现 217任务9.7 用决策树算法实现餐饮客户流失预测 2199.7.1 了解客户流失 2199.7.2 了解决策树算法 2209.7.3 构建客户流失特征 2219.7.4 分析决策树模型结果 2239.7.5 任务实现 223小结 226实训 226实训1 使用ARIMA模型预测网站访问量 226实训2 使用决策树算法实现运营商客户流失预测 227实训3 使用协同过滤算法实现网站的智能推荐 227实训4 使用Apriori算法实现网站的关联分析 227实训5 使用K-Means算法实现运营商客户价值分析 228课后习题 228
内容摘要
本书以任务为导向,较为全面地介绍了商务领域中R语言数据分析的应用。全书共9章,介绍商务领域不同方向项目的数据分析方法,具体内容包括R语言数据分析概述、商品零售购物篮分析、航空公司客户价本书以任务为导向,较为全面地介绍了商务领域中R语言数据分析的应用。全书共9章,介绍商务领域不同方向项目的数据分析方法,具体内容包括R语言数据分析概述、商品零售购物篮分析、航空公司客户价值分析、财政收入预测分析、金融服务机构资金流量预测、P2P信用贷款风险控制、电子商务网站智能推荐服务、电商产品评论数据情感分析、餐饮企业综合分析。除第 1章外,本书各章都包含了实训与课后习题,通过练习和操作实践,帮助读者巩固所学的内容。值分析、财政收入预测分析、金融服务机构资金流量预测、P2P信用贷款风险控制、电子商务网站智能推荐服务、电商产品评论数据情感分析、餐饮企业综合分析。本书的每个章节都包含了实训与课后习题,通过练习和操作实践,帮助读者巩固所学的内容。
主编推荐
大数据专家张良均领衔畅销书作者团队,教育部长江学者特聘教授、国家杰出青年基金获得者、IEEE Fellow、华南理工大学计算机与工程学院院长张军倾力推荐。本书采用了以任务为导向的教学模式,按照解决实际任务的工作流程路线,逐步展开介绍相关的理论知识点,推导生成可行的解决方案,落实在任务实现环节。全书大部分章节紧扣任务需求展开,不堆积知识点,着重于解决问题时思路的启发与方案
— 没有更多了 —
以下为对购买帮助不大的评价