• 大数据处理技术:R语言分析方法与应用
21年品牌 40万+商家 超1.5亿件商品

大数据处理技术:R语言分析方法与应用

全新正版 极速发货

34.28 5.9折 58 全新

库存5件

广东广州
认证卖家担保交易快速发货售后保障

作者屠忻主编

出版社知识产权出版社

ISBN9787513064347

出版时间2019-09

装帧平装

开本16开

定价58元

货号1201959313

上书时间2024-06-28

曲奇书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介
屠忻:毕业于南京大学,2002年起在国家知识产权局局工作。现就职于国家知识产权局局审查协作江苏中心光电部,副研究员,国家知识产权局高层次人才,靠前型审查专家,局级教师。  李立功:毕业于中国科学院半导体研究所,工学博士。现就职于国家知识产权局局审查协作江苏中心,副研究员,国家知识产权局骨干人才,参与过多项分析与预警项目,在知识产权类刊物上发表多篇学术论文。 左良军:国家知识产权局局审查协作江苏中心审查员,工学硕士,助理研究员,参与编写教科书《分析数据处理实务手册》,参与过多项分析与导航项目,在知识产权类刊物上发表多篇学术论文。 杨爽:曾任企业软件研发工程师,现就职于国家知识产权局局审查协作江苏中心,审查员,工学硕士,参与过多项分析与导航项目。 高慧霞:国家知识产权局局审查协作江苏中心审查员,理学博士,助理研究员,国家知识产权局骨干人才,参与过多项分析与预警项目,发表过多篇学术论文。 黄煜:国家知识产权局局审查协作江苏中心审查员,工程硕士,助理研究员,熟悉分析实务,参与过高价值培育项目,在知识产权类刊物上发表过多篇文章。 蒋帆:国家知识产权局局审查协作江苏中心审查员,工学硕士,助理研究员,从事电、磁测试领域发明实质审查工作,著有《Arduino探究实验》。

目录
章 简 介0011.1 关于本书 0011.1.1 为什么要撰写本书 0011.1.2 本书的撰写原则 0021.1.3 本书的读者对象 0031.1.4 本书的使用方法 0041.2 分析概论 0041.2.1 分析基本流程 0041.2.2 当前分析基本方法 0101.2.3 分析的发展方向 0111.3 数据科学概论 0121.3.1 数据取样与探索 0121.3.2 数据预处理与可视化 0131.3.3 数据挖掘与建模 0141.4 小结 014第2章 R语言入门0162.1 本章概述 0162.2 R语言简介与安装 0172.2.1 R语言简介 0172.2.2 R安装及RStudio简介 0182.3 R包的使用 0212.3.1 R包的介绍 0212.3.2 R包的安装和载入 0222.4 常用R包及函数使用介绍 0232.4.1 数据整理——tidyr 0232.4.2 表格操纵——dplyr 0272.4.3 字符处理——stringr 0312.4.4 时间处理——lubridate 0342.4.5 数据导入导出——openxlsx 0362.5 R语言数据结构 0372.5.1 向量 0372.5.2 矩阵 0382.5.3 数组 0392.5.4 数据框 0402.5.5 因子 0422.5.6 列表 0432.6 小结 044第3章 数据处理0453.1 本章概述 0453.2 申请年份统计 0463.2.1 年份申请量统计 0473.2.2 年份国内外申请量统计 0503.2.3 年份国别申请量统计 0523.3 申请人统计 0553.3.1 申请人数量统计 0563.3.2 标准申请人清洗 0583.3.3 申请人合作关系统计 0623.4 技术主题统计 0693.4.1 技术主题分布统计 0693.4.2 技术主题占比统计 0723.5 同族数据统计 0733.5.1 同族数据拆分为多列 0733.5.2 同族数据拆分为多行 0763.6 多维数据联合统计 0803.6.1 三维数据的联合统计 0803.6.2 四维数据的联合统计 0853.7 小结 086第4章 数据可视化0874.1 本章概述 0874.2 利用ggplot2包制图 0884.2.1 柱形(条形)图 0884.2.2 折线(路径)图 0984.2.3 散点(气泡)图 1034.3 利用Highcharter包制图 1084.3.1 圆环类图 1094.3.2 极坐标图 1134.3.3 矩形树图及热力图 1184.4 利用Dygraphs包绘制交互式时序图 1214.4.1 折线时序图 1224.4.2 折线+条形时序图 1234.4.3 堆叠条形+折线时序图 1244.5 利用Circlelize包制图 1264.5.1 申请人合作关系弦图 1264.5.2 五局技术流向弦图 1284.5.3 条形跑道图 1324.6 地图的绘制 1344.6.1 基于baidumap和Remap包绘制地图 1354.6.2 地图与其他图表的结合 1404.7 利用NetworkD3包制图 1454.7.1 力导图 1454.7.2 网络图 1524.8 小结 155第5章 数据挖掘与建模1565.1 本章概述 1565.2 数据挖掘基础 1575.2.1 数据挖掘的基本任务 1575.2.2 数据挖掘建模的过程 1585.3 变量主成分分析 1595.3.1 问题背景 1595.3.2 主成分分析方法 1605.4 聚类分析 1665.4.1 问题背景 1665.4.2 K-means聚类分析 1665.5 分类与预测分析 1735.5.1 问题背景 1735.5.2 人工神经网络算法 1745.5.3 支持向量机算法 1815.5.4 朴素贝叶斯算法 1855.6 小结 189附录A 本书代码索引190附录B 本书用到的扩展包192附录C R语言学习资源195参考文献198

内容摘要
本书是一本关于大数据处理技术的图书,主要研究R语言在分析领域的应用方法。全书从四个方面展开:首先给出R语言快速入门需要掌握的基本知识;然后从分析数据处理角度出发,总结归纳用R语言处理数据的几种常用场景;接着结合分析中的数据可视化给出常用分析图表的R语言制图方法;很后结合数据挖掘算法介绍了利用R语言进行数据挖掘与建模的几种常见任务。

主编推荐
分析、大数据处理、R语言

精彩内容
随着我国供给侧结构性改革地不断推进,具有制度供给和技术供给双重属性的知识产权,尤其是对供给侧结构性改革的支撑和保障作用不断增强,信息利用也越来越被社会各界所重视,在政府决策支撑、行业发展和企业创新等方面越来越发挥着重要作用。分析作为信息挖掘的核心手段之一,是充分挖掘数据背后隐藏的高价值情报信息的重要支撑。分析涉及多个环节,包括数据处理、数据可视化、数据挖掘与建模等。虽然目前分析方法很多,但大多是针对不同环节采用不同的处理方式,仍然缺少能够实现多个环节有效衔接、统一处理的模式,这使分析的准确性和效率难以保障。随着全球数量地不断提升,分析的难度大大增加,这在各个环节中均有所体现。其中,数据处理是分析的重中之重,是分析工作者获取规范化样本数据的主要途径,数据处理的质量是彰显分析成果准确性的核心指标之一。虽然格式统一、规范,但不同数据库对数据的收录范围、收录方式千差万别,这加大了各数据汇总后处理成规范化数据的难度,而且数据量的增加,也超出了常规数据处理方式的处理能力。因此,提升海量数据处理的质量和效率,是做好大数据时代下分析工作的重要基石,更是必然要求。数据量的不断提升导致数据的可读性不断下降,海量混杂的数据信息交织在一起使数据更难于被理解,这不仅需要我们以更细化、更全面的形式来展示数据,还需要我们与数据进行更多的交互,以加强数据的理解,而传统的静态数据可视化形式显然不能满足目前的需求,开发针对海量数据的动态可视化方式是解决目前困境的必经之路。同时,数据量地不断提升导致数据类型的不断扩展,数据量及类型的变化也对数据的挖掘和建模方式提出了更高的要求。针对特定的应用场景,建立合适的模型来挖掘海量数据背后隐藏的高价值信息,是传统的统计分析工具所不能胜任的。利用深度学习算法进行数据挖掘已经在多个领域展现了巨大的优势,而在分析领域尚属空白。因此,探索研究基于深度学习的人工智能数据挖掘和建模方法,以满足海量数据的要求,势在必行,时不我待。本书主要从四个方面展开:一是给出R语言快速入门需要掌握的基本知识;二是从分析数据处理角度出发,总结归纳用R语言处理数据的几种常用场景;三是结合分析中的数据可视化给出常用分析图表的R语言制图方法;四是结合数据挖掘算法介绍利用R语言进行数据挖掘的几种常见任务。本书由国家知识产权局局审查协作江苏中心光电技术发明审查部组织编写,具体撰写分工如下:屠忻,参与撰写前言、章、第2章、第3章第3.1~3.2节;李立功,参与撰写第3章第3.3~3.7节、第4章第4.1~4.3.1节;高慧霞,参与撰写第4章第4.3.2节、第4章第4.4~4.5节;杨爽,参与撰写第4章第4.3.3节、第4.6节;蒋帆,参与撰写第4章第4.7节~4.8节、第5章第5.1~5.2节;黄煜,参与撰写第5章第5.3~5.4节;左良军,参与撰写第5章第5.5~5.6节、本书附录A~C、参考文献。全书由李立功、左良军负责统稿、校对。本书内容为编者在分析工作中的经验总结,希望能为提升从业者的数据处理、数据可视化及信息挖掘的能力起到一定的积极作用。由于时间仓促,加之编者水平所限,部分成果还需要在实际应用中不断丰富和完善,应用效果也需要经过实践的进一步检验。本书中的观点和内容如若存在偏差和不足之处,敬请广大读者批评指正。

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP