大数据分析方法与应用
【正版新书】 大数据分析方法与应用 耿秀丽 编 机械工业出版社 9
¥
50.2
8.5折
¥
59
全新
库存98件
作者 耿秀丽 编
出版社 机械工业出版社
出版时间 2024-10
版次 1
装帧 平装
货号 WX1203430499
上书时间 2026-06-03
商品详情
品相描述:全新
图书标准信息
作者
耿秀丽 编
出版社
机械工业出版社
出版时间
2024-10
版次
1
ISBN
9787111763550
定价
59.00元
装帧
平装
开本
16开
页数
220页
字数
304千字
【内容简介】
本书将理论与应用结合,介绍了大数据技术、大数据分析方法以及大数据伦理规范等基础知识,可供读者入门学使用。本书共9章,包括大数据概述、数据分析基础、回归分析、聚类算法、算法、文本挖掘、启发式算法、支持向量机和神经网络。各章都附有对应案例和题,以帮助读者理解和应用。本书作为大数据公共通识课程的导论教材,为高校选修大数据课程编写,主要面向大数据应用型人才培养,也可供相关技术人员参。
【作者简介】
耿秀丽,教授,博士生导师,上海市(第三期)重点学科、上海市一流学科、上海市高原学科“管理科学与工程”成员,上海市高水平学科创新团队成员,上海市工程管理学会秘书长,美国北卡罗莱纳州立大学工业与系统工程系访问学者。主要从事产品服务工程,质量管理,决策理论与方法等方向研究。主持国家自然科学基金、工信部民机重大专项及其他省部级项目5项,出版专著1本,发表SCI论文20余篇,中文核心期刊80余篇,以主要完成人获得上海市科技进步奖二等奖1项、三等奖1项。在Comput Ind Eng、Expert Syst Appl、《中国管理科学》、《计算机集成制造系统》等国内外核心期刊上发表论文100余篇,以主要完成人获得上海市科技进步奖二等奖1项、三等奖1项。
【目录】
前言 章大数据概述 1.1大数据的相关概念 1.1.1大数据的背景与来源 1.1.2大数据的概念与特征 1.1.3大数据的数据类型 1.1.4《“十四五”大数据产业发展规划》与“5v” 1.2对科学研究和经济社会的影响 1.2.1对科学研究的影响 1.2.2对经济社会的影响 1.2.3大数据技术发展趋势 1.3大数据的研究现状 1.4大数据发展的机遇与挑战 1.4.1机遇 1.4.2挑战 1.5大数据分析的相关概念 1.5.1大数据分析的概念 1.5.2大数据分析与传统数据分析的比较 1.5.3大数据分析的流程 1.5.4大数据分析的基础模型 1.6大数据的应用 题 参文献 第2章数据分析基础 2.1数据的类型与分布 2.1.1体和样本 2.1.2定数据和定量数据 2.1.3截面数据和时间序列数据 2.2变量之间的关系 2.2.1协方差 2.2.2相关系数 2.3数据的可视化——基于excel的应用 2.3.1散点图 2.3.2柱形图和折线图 2.3.3数据透视表 2.4数据的输入 2.4.1数据的输入方法 2.4.2数据有效 2.4.3条件函数if 2.4.4函数vlookup 题 第3章回归分析 3.1线和非线回归 3.1.1线回归及其excel中的实现 3.1.2小二乘回归 3.1.3非线回归及其excel中的实现 3.2多元回归 3.2.1多元回归的概念 3.2.2多重共线 3.2.3多元回归及其ss中的实现 3.2.4居民存款影响因素多元回归案例分析 3.3岭回归 3.3.1岭回归的概念 3.3.2岭回归及其在ss中的实现 3.3.3居民存款影响因素岭回归案例分析 3.4lasso回归 3.4.1lasso回归的概念 3.4.2lasso回归及其ss中的 实现 3.4.3居民存款影响因素lasso回归案例分析 题 参文献 第4章聚类算法 4.1聚类的 4.2k-means聚类 4.2.1k-means聚类算法的 4.2.2k-means聚类算法在matlab中的实现 4.3k近邻算法 4.3.1k近邻算法的 4.3.2k近邻算法在matlab中的实现 4.3.3鸢尾花分类案例分析 4.4模糊c-均值算法 4.4.1模糊c-均值算法的 4.4.2模糊c-均值算法在matlab中的实现 4.4.3用户需求聚类案例分析 题 参文献 第5章算法 5.1协同过滤算法 5.1.1基于用户的协同过滤算法 5.1.2基于商品的协同过滤算法 5.1.3案例分析1:汽车交易台 5.1.4案例分析2:电影 5.2协同过滤算法常见的问题以及对策 5.2.1冷启动问题及对策 5.2.2稀疏问题及对策 5.3基于内容的算法 5.3.1基于结构化内容的 5.3.2基于非结构化内容的 5.4基于模型的算法 5.5基于关联规则的算法 5.6信息隐私与基于隐私保护的方案方法 5.6.1信息隐私 5.6.2基于隐私保护的方案方法 5.7信息污染与信任算法 5.7.1信息污染 5.7.2信任算法 5.8信息茧房 题 参文献 第6章文本挖掘 6.1文本挖掘的应用价值 6.2文本挖掘的流程 6.2.1文本挖掘的关键技术 6.2.2文档收集方法 6.2.3分词技术 6.2.4词的表示形式 6.2.5文本特征属处理 6.3lda主题模型 6.3.1lda主题模型介绍 6.3.2吉布斯采样 6.3.3lda主题模型训练过程 6.4基于lda主题模型的客户需求挖掘案例分析 题 参文献 第7章启发式算法 7.1启发式算法的基本 7.1.1启发式函数 7.1.2搜索策略 7.2启发式算法的类型 7.2.1仿动物类启发式算法 7.2.2仿植物类启发式算法 7.3遗传算法及其实现 7.3.1遗传算法的 7.3.2遗传算法的步骤 7.3.3遗传算法的计算机实现 7.4粒子群算法及其实现 7.4.1粒子群算法的 7.4.2粒子群算法的步骤 7.4.3粒子群算法的计算机实现 7.5物流配送中心选址案例分析 题 参文献 第8章支持向量机 8.1支持向量机的 8.1.1支持向量机的由来 8.1.2支持向量机的发展 8.2支持向量机算法 8.2.1支持向量机的模型算法 8.2.2支持向量机模型优化算法 8.2.3核函数 8.2.4支持向量机算法的计算机实现 8.3支持向量机算法参数优化 8.3.1模糊支持向量机 8.3.2小二乘支持向量机 8.3.3粒子群算法优化支持向量机 8.4算法应用及案例分析 题 参文献 第9章神经网络 9.1发展历程 9.2基础模型 9.2.1神经元 9.2.2网络结构 9.3典型神经网络 9.3.1反向传播神经网络 9.3.2卷积神经网络 9.3.3长短期记忆网络 9.4人工智能的中立 9.5信息不公 9.6应用案例 9.6.1卷积用于情感分析 9.6.2lstm用于预测:滑坡位移预测 9.7数字技术伦理规范 题 参文献
点击展开
点击收起
以下为对购买帮助不大的评价