全新正版现货,以书名为准,放心购买,购书咨询18515909251朱老师
¥ 10.47 1.9折 ¥ 56 全新
库存82件
作者中国国防科学技术信息学会[编]
出版社国防工业出版社
ISBN9787118117158
出版时间2018-09
装帧其他
定价56元
货号10568185
上书时间2026-01-30
大数据分析:认识、方法与案例
数据科学及其对情报学的影响
引文分析研究与进展
近五年来国内外“五计学”研究进展……文庭孝(81)
智能信息技术发展现状、趋势与影响透视
地平线扫描的概念及案例研究…
国内外信息源选择研究进展……王芳,张鑫(192)
支撑创新的情报保障研究进展
…储节旺,吴川徽,陈善姗,是 沁,李章超(217)
信息偶遇研究综述……刘春茂,袁敬芸,杜雪(248)
社交网络用户信息行为研究进展
iSchool运动发展综述
大数据分析:认识、方法与案例
曾忠禄
(澳门理工学院)
摘要:随着信息通信技术的发展,社会的数据大量增加,大数据分析的重要性日益显现。企业利用大数据分析可以降低成本,提高效益;研究人员利用大数据分析,能完成过去难以想象的分析,使研究进入崭新的领域;政府利用大数据分析,可以更好地预防犯罪,提高公共管理绩效。但大数据也有局限性。大数据并不等于更客观的数据,数据也不是越大越好。大数据分析,需要掌握数据的背景,需要有假设的指引,需要专业知识。大数据分析首先是确定要解决的问题或分析的方向,然后根据需求获取数据,清洁数据,加载数据。大数据分析的内容,目前正往实时预测分析和快速循环评估方向发展。大数据分析的软件和工具,因不同的公司,不同的分析任务,不同的复杂性而不同。简单分析靠电子表格就可以完成,但大型的复杂的分析常常需要多种软件和工具的结合使用。大数据分析常常需要涉及三种专业知识:领域(行业)知识、计算机编程和数据处理知识,以及系统管理知识。
关键词:大数据;大数据分析;流程;发展趋势;分析工具;案例研究
在人类历史上,相当长的时间里,信息都是稀缺的。由于社会经济发展缓慢,地区分隔和封闭,信息来源少;又由于制作和复制信息的成本高,信息的传播受到限制,因此信息的供给长期以来都增长缓慢。但在过去几十年里,这一切都发生了变化。首先是信息创造过程发生了变化。过去由专业人员(记者、作者)创造的信息今天是由用户创造的,比如每个写微信的人都是信息创造者。过去企业的信息是由人工创造的,今天大量的信息是由机器创造的:企业的作业、制造、供应链管理、客户行为、工作流程等都是机器留下的数据;政府部门在不同地方安装的摄像头记录的信息(比如,我国政府和私人安装的摄像头已达1.76亿个,到2020年还会增加4.5亿个11),出人境关口自动通关系统留下的信息,等等。由于上述变化,信息的数量呈几何级增长。其次,信息交换方式也发生了变化。过去需要通过电话、邮件等昂贵方式传递的信息,今天可以通过互联网、移动通信设备低成本地获取和交换,能得到的信息几乎是无限的。这一切变化使我们进入了大数据时代。大数据是指大量可以获得、交流、整合、储存和分析的数据3。未来相当长时间里大数据仍然会呈几何级别增长,大数据的储存能力也会继续增加。如何从这些数据中获得有用的信息和知识是企业、研究机构、政府乃至个人都需要密切关注的问题。
1大数据的重要性及挑战
不管是对企业、研究机构还是政府,大数据都具有重要价值。利用大数据,企业可以增强对自己的运营和利益相关者的了解,从而对经营环境获得新的洞察力;可以发现新的关联和模式,从而发现新的市场机会;可以识别例外情况、意外行为和异常值,从而及早发现问题和采取应对措施。大数据为企业预测未来的发展提供了新的可能性,因为更多的数据来源意味着有可能在新的领域做预测;大数据加机器学习技术可大幅提高预测模型的准确性。谷歌、百度等搜索引擎都利用它们掌握的用户在网上搜索的行为,包括使用的搜索词、相关的其他链接等,来预测每个用户最需要什么信息。它们还可以根据个人的位置、性别、年龄和以前的搜索历史提供个性化设置。用户搜索越多,搜索引擎越能预测他要搜索的内容。企业使用大数据,可以降低成本、增加及时性和提高精确度[3]。利用大数据预测有关资产的磨损趋势,企业可以更有效地安排维修和维护,从而减少故障并延长资产的使用寿命。互联网零售企业可以利用大数据发现新的市场机会。比如桂格和京东合作,利用大数据分析,发现了过去从没有有效利用的细分市场,于是针对该市场开发出了一款高能燕麦饮品c0。研究显示,数据驱动型企业比没有采用数据驱动的竞争对手的生产力要高5%,利润水平要高6%560。
对于研究人员,大数据对科研有重大的促进作用。比如,过去要靠调查、实验等方法来得出结论和预测,如今通过对大数据的分析就能获得有关的远见和洞察[7]。过去要10年才能完成的基因分析,现在一周就可以完成[]。过去完全不可能取得的重大医学发现和科学突破,现在利用大数据就可以完成,比如发现遗传与疾病之间的联系、疾病与疾病之间的相关性、疾病的导因和潜在的治疗方法,扫描人类基因组[9等。
……
本书收录了《数据科学及其对情报学的影响》《引文分析研究与进展》《近五年来国内外“五计学”研究进展》《地平线扫描的概念及案例研究》《国内外信息源选择研究进展》《支撑创新的情报保障研究进展》《信息偶遇研究综述》《社交网络用户信息行为研究进展》等文章。
以下为对购买帮助不大的评价