正版保障 假一赔十 电子发票
¥ 62.08 7.0折 ¥ 89 全新
库存4件
作者(印)苏巴西尼·夏玛·特里帕蒂
出版社清华大学出版社
ISBN9787302570806
出版时间2021-02
装帧平装
开本16开
定价89元
货号1202306873
上书时间2024-12-25
在过去的10年中,分析和数据科学作为业务决策的支持功能而走在技术发展的前沿,业务分析师还是鲜为人知的职业选择。随着数据存储成本的急剧下降和数据量的蓬勃增 长,首席经验官(Chief eXperience Officer,CXO)和现代经理人都迫切需要掌握分析和数据科学,以便在企业经营的每个点上做出明智的决策。
如何开始分析和数据科学职业生涯?
本书将告诉你如何通过定义、收集、组织、可视化、分析和见解(DCOVA&I)过程执行数据分析并解决问题。这是一个非常完整而严密的过程,因此,即使数据非常新颖或你对问题不太熟悉,也可以通过使用逐步检查表进行推论来解决问题。*后,为了实现分析输出,需要以简单的业务术语来理解结论或见解。
本书将介绍如何使用两种流行的软件工具SAS和R对业务数据进行分析,SAS是收费软件,它是受监管部门(如银行、临床研究、保险等)数据分析领域的领导者。R是开源软件,它在没有监管机构的行业中很流行,如零售、技术(包括ITES)、商务流程外包(Business Process Outsourcing,BPO)等。因此,无论你从事哪个行业,本书都将为你提供更快地做出更好决策所需的知识和技能。
在阅读本书时,不需要在两个*受欢迎的软件工具之间做出选择,因为我们为这两个软件提供了一致的研究案例。
企业如何在合理时间内将自己的数据转换为有用的信息?
这个问题对于成功开展业务至关重要。仅当信息在正确的时间可供管理层使用时,企业才能做出正确的决定。为此,需要进行业务分析(简单地说,就是对大量数据进行统计),以得出有助于业务决策的结论和模型。
统计技术可分为描述统计、推断统计、差异统计、关联统计和预测统计5个主要类型。本书将着重于DCOVA&I过程在SAS和R中的应用,并介绍如何解释与描述性、差异性和关联性统计技术有关的统计信息。
内容介绍
本书共分为9章,内容如下:
第1章“分析的过程”,介绍数据分析的定义、简单的分析示例、数据分析师的日常工作、从事该项工作应具备的一些特质以及分析和统计的历史等。
第2章“了解SAS和R”,详细说明了本书选择SAS和R作为分析平台的原因,并介绍这两款软件的安装方式。
第3章“使用SAS和R进行数据处理”,提出DCOVA&I框架,并阐释定义阶段的重要意义、常见业务问题的基本理解、从ERP到业务分析SaaS的数据流、数据完整性检查等。
第4章“使用SAS和R发现有关数据的基本信息”,介绍描述性统计的意义,并阐释集中趋势的度量、散布的度量、频率分布、差异分析和方差等概念。
第5章“可视化”,介绍数据可视化技术,包括可视化的定义、进行可视化的理由、常见图表类型和相关案例研究等。
第6章“概率”,解释独立事件的概率和条件事件的概率、贝叶斯定理、计算概率的频率,并提供相应的SAS和R案例研究。
第7章“样本和抽样分布”,详细介绍抽样方法、抽样分布类型、中心极限定理、大数定律、参数检验和非参数检验等。
第8章“分析的置信区间和正确性”,阐述置信区间和P值的概念,并讨论假设检验中的错误。
第9章“结论和见解”,介绍描述统计、图表、推断统计、差异统计和见解生成之间的关系,了解这些有助于数据分析师解释SAS和R生成的结果。
本书约定
在本书中有许多区分不同类型信息的文本样式,以下是这些样式的一些示例以及对它们的含义的解释。
(1)在界面词汇后面使用括号附加对应的中文含义,方便读者对照查看。以下段落是一个示例:
要创建箱形图,可以选择Tasks(任务)| Graph(图形)| Box Plot(箱形图)命令,如 图6-9所示。
(2)代码块显示如下:
/* 删除RESOLUTION TIME中的1个观察值,因为它包含缺失值 */
DATA WORK.RESOLUTION;
SET WORK.RESOLUTION;
WHERE RESOLUTION_TIME NE.; RUN;
PROC MEANS DATA= WORK.RESOLUTION;
VAR RESOLUTION_TIME; RUN;
(3)新术语和重要单词以中英文对照的形式表示,中文在前,如下所示:
当要查看连续变量(如时间、年龄、收入)出现的概率分布时,获得的将是一条连续曲线,因为这些变量可以具有许多值,包括小数值。连续变量的分布称为连续分布的概率密度(Continuous Distributions,Probability Densities)。当此概率密度曲线的形状像钟形时,称为正态分布(Normal Distribution)。自然发生的现象遵循正态分布。
关于作者
Subhashini Sharma Tripathi是一位数据分析专家,在与GE Money、渣打银行、Tata Motors Finance和Citi GDM合作10年后,于2012年开始从事教学、撰写博客和提供咨询等工作。在工作期间,她坚信数据科学和分析技术有助于减少对个体经验的依赖。此外,她认为,这为现代经理人提供了一种决定性的方法,可以更快、更准确地解决许多现实问题。在这个不断发展的业务环境中,它还有助于定义长期战略并提供更好的选择。换句话说,借助大数据分析,企业管理者可以获得更有价值的经营指导。
Subhashini是pexitics.com的创始人,她的*个产品是Pexitics Talent Score。该公司可提供有效的人力资源管理工具,并提供分析咨询服务。
作者致谢
这是我的*本书,写作的经历像是一次激动人心但又坎坷不平的旅行。本书的写作过程也与pexitics.com的创建和发布紧密联系在一起。
没有家人和Apress编辑团队的大力支持和鼓励,尤其是Celestin Suresh John的帮助,本书的写作旅程就不可能抵达终点。衷心感谢我的母亲—M. Tripathi博士给予我的从语言到行动的无微不至的支持和帮助。
Mark L. Berenson、David M. Levine和Timothy C. Krehbiel所著的Basic Business Statistics(12th Edition)(《基础商业统计(第12版)》)对我的思考过程和本书的写作产生了重大影响。我在该书中学习了DCOVA流程。在处理该过程时,我添加了另一个阶段,称为见解生成(Insight Generation),现在我使用的就是DCOVA&I过程。
当我在2002年开始进行基于数字的决策时,缺乏结构化和系统性的指导,很多事情都是自我发现和自学的。我写这本书的目的是让从事分析和数据科学的有志之士能够以结构化的方式充满信心地解决实际业务问题,从而踏上成功之路。
《循序渐进学习商业分析:使用SAS与R语言》详细阐述了与SAS和R语言商业分析相关的解决方案,主要内容包括了解SAS和R、使用SAS和R进行数据处理、使用SAS和R发现有关数据的基本信息、可视化、概率、样本和抽样分布、分析的置信区间和正确性等。此外,本书还提供了丰富的示例及代码,以帮助读者进一步理解相关方案的实现过程。 本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学教材和参考手册。
循序渐进学习商业分析:使用SAS与R语言
全新广州
¥ 55.12
循序渐进学习商业分析:使用SAS与R语言
全新广州
¥ 55.13
循序渐进学习商业分析:使用SAS与R语言
全新广州
¥ 55.13
循序渐进学习商业分析:使用SAS与R语言
全新保定
¥ 38.27
循序渐进学习商业分析:使用SAS与R语言
全新广州
¥ 59.81
循序渐进学习商业分析:使用SAS与R语言
全新保定
¥ 36.49
循序渐进学习商业分析:使用SAS与R语言
全新成都
¥ 61.93
循序渐进学习商业分析:使用SAS与R语言
全新成都
¥ 62.60
循序渐进学习商业分析:使用SAS与R语言
全新保定
¥ 45.39
循序渐进学习商业分析:使用SAS与R语言
全新北京
¥ 45.00
— 没有更多了 —
以下为对购买帮助不大的评价