全新正版 数据分析之图算法基于Spark和Neo4j 马克·尼达姆 9787115546678 人民邮电出版社
本店所售图书,保证正版新书,有个别图片和实书封面不一样,以实书封面为准,最快当天,一般隔天发货。支持7天无理由退换货.开票联系客服
¥
54.75
6.9折
¥
79
全新
库存2件
作者马克·尼达姆
出版社人民邮电出版社
ISBN9787115546678
出版时间2020-09
装帧平装
开本16开
定价79元
货号30971070
上书时间2023-04-15
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
马克·尼达姆(Mark Needham) Neo4j公司开发者关系工程师,Neo4j认证专家,曾深度参与Neo4j因果集群的开发工作。马克致力于帮助客户运用图数据库,善于针对富有挑战性的数据问题构建综合的解决方案。 埃米·E. 霍德勒(Amy E. Hodler) Neo4j公司图分析与人工智能项目总监,热爱网络科学,在图分析项目的开发和运营方面有着丰富的经验,曾成功带领团队为EDS、微软、惠普等公司创造新的商机。
目录
序xi
前言xiii
章导论1
1.1何谓图1
1.2何谓图分析和图算法3
1.3图处理、图数据库、图查询和图算法5
1.4为何要关心图算法6
1.5图分析用例9
1.6小结10
第2章图论及其概念11
2.1术语11
2.2图的类型和结构12
2.3图的种类14
2.3.1连通图与非连通图14
2.3.2无权图与加权图15
2.3.3无向图与有向图16
2.3.4无环图与有环图17
2.3.5稀疏图与稠密图18
2.3.6单部图、二部图和k部图19
2.4图算法的类型21
2.4.1路径查找21
2.4.2中心性21
2.4.3社团发现22
2.5小结22
第3章图平台和图处理23
3.1图平台和图处理的注意事项23
3.1.1平台注意事项23
3.1.2处理注意事项24
3.2典型平台25
3.2.1选择平台25
3.2.2ApacheSpark26
3.2.3Neo4j图平台28
3.3小结30
第4章路径查找算法和图搜索算法31
4.1示例数据:交通图33
4.1.1将数据导入Spark35
4.1.2将数据导入Neo4j36
4.2广度优先搜索36
4.3深度优先搜索38
4.4最短路径算法40
4.4.1何时使用最短路径算法41
4.4.2使用Neo4j实现最短路径算法41
4.4.3使用Neo4j实现加权最短路径算法43
4.4.4使用Spark实现加权最短路径算法44
4.4.5最短路径算法的变体:A*算法46
4.4.6最短路径算法的变体:Yen的k最短路径算法48
4.5所有点对最短路径算法49
4.5.1近观所有点对最短路径算法50
4.5.2何时使用所有点对最短路径算法51
4.5.3使用Spark实现所有点对最短路径算法51
4.5.4使用Neo4j实现所有点对最短路径算法52
4.6单源最短路径算法53
4.6.1何时使用单源最短路径算法54
4.6.2使用Spark实现单源最短路径算法55
4.6.3使用Neo4j实现单源最短路径算法57
4.7最小生成树算法57
4.7.1何时使用最小生成树算法58
4.7.2使用Neo4j实现最小生成树算法59
4.8随机游走算法61
4.8.1何时使用随机游走算法61
4.8.2使用Neo4j实现随机游走算法61
4.9小结63
第5章中心性算法64
5.1示例数据:社交图66
5.1.1将数据导入Spark67
5.1.2将数据导入Neo4j67
5.2度中心性算法68
5.2.1可达性68
5.2.2何时使用度中心性算法69
5.2.3使用Spark实现度中心性算法69
5.3接近中心性算法70
5.3.1何时使用接近中心性算法71
5.3.2使用Spark实现接近中心性算法72
5.3.3使用Neo4j实现接近中心性算法74
5.3.4接近中心性算法变体:Wasserman&Faust算法75
5.3.5接近中心性算法变体:调和中心性算法77
5.4中间中心性算法78
5.4.1桥与控制点78
5.4.2计算中间中心性得分79
5.4.3何时使用中间中心性算法79
5.4.4使用Neo4j实现中间中心性算法80
5.4.5中间中心性算法变体:RA-Brandes算法82
5.5PageRank算法83
5.5.1影响力84
5.5.2PageRank算法公式84
5.5.3迭代、随机冲浪者和等级沉没85
5.5.4何时使用PageRank算法86
5.5.5使用Spark实现PageRank算法87
5.5.6使用Neo4j实现PageRank算法88
5.5.7PageRank算法变体:个性化PageRank算法90
5.6小结91
第6章社团发现算法92
6.1示例数据:软件依赖图94
6.1.1将数据导入Spark96
6.1.2将数据导入Neo4j97
6.2三角形计数和聚类系数97
6.2.1局部聚类系数97
6.2.2全局聚类系数98
6.2.3何时使用三角形计数和聚类系数98
6.2.4使用Spark实现三角形计数算法99
6.2.5使用Neo4j实现三角形计数算法99
6.2.6使用Neo4j计算局部聚类系数100
6.3强连通分量算法101
6.3.1何时使用强连通分量算法102
6.3.2使用Spark实现强连通分量算法102
6.3.3使用Neo4j实现强连通分量算法103
6.4连通分量算法106
6.4.1何时使用连通分量算法106
6.4.2使用Spark实现连通分量算法106
6.4.3使用Neo4j实现连通分量算法107
6.5标签传播算法108
6.5.1半监督学习和种子标签110
6.5.2何时使用标签传播算法110
6.5.3使用Spark实现标签传播算法110
6.5.4使用Neo4j实现标签传播算法111
6.6Louvain模块度算法113
6.6.1通过模块度进行基于质量的分组114
6.6.2何时使用Louvain模块度算法117
6.6.3使用Neo4j实现Louvain模块度算法118
6.7验证社团122
6.8小结122
第7章图算法实战123
7.1使用Neo4j分析Yelp数据123
7.1.1Yelp社交网络124
7.1.2导入数据124
7.1.3图模型125
7.1.4Yelp数据概览125
7.1.5行程规划应用程序129
7.1.6旅游商务咨询134
7.1.7查找相似类别138
7.2使用Spark分析航班数据142
7.2.1探索性分析144
7.2.2热门机场144
7.2.3源自ORD的延误145
7.2.4SFO的糟糕一天147
7.2.5通过航空公司互连的机场149
7.3小结154
第8章使用图算法增强机器学习155
8.1机器学习和上下文的重要性155
8.2关联特征提取与特征选择157
8.2.1图特征158
8.2.2图算法特征158
8.3图与机器学习实践:链接预测160
8.3.1工具和数据161
8.3.2将数据导入Neo4j162
8.3.3合著者关系图163
8.3.4创建均衡的训练数据集和测试数据集164
8.3.5如何预测缺失链接169
8.3.6创建机器学习管道170
8.3.7预测链接:基本图特征171
8.3.8预测链接:三角形和聚类系数181
8.3.9预测链接:社团发现184
8.4小结190
8.5总结190
附录额外信息及资料191
关于作者195
关于封面195
— 没有更多了 —
以下为对购买帮助不大的评价