实用系统 数据库 (丹)金·福尔克 新华正版
全书以作者自建的电影moviegeeks作为完整案例介绍系统,涵盖从数据收集到生成的全过程,提供详细的python代码及注释
¥
61.3
5.2折
¥
119
全新
仅1件
作者(丹)金·福尔克
出版社电子工业出版社
ISBN9787121420788
出版时间2021-10
版次1
装帧平装
开本16开
页数436页
字数487千字
定价119元
货号xhwx_1202502785
上书时间2023-11-18
商品详情
- 品相描述:全新
-
正版特价新书
- 商品描述
-
主编:
"介绍系统和关键算,配备大量代码,适合入门对于书中所涉及的数学和统计学知识,均提供示例图和代码,直观易懂涵盖从数据收集到生成的全过程,提供详细的python代码及注释,代码可在github上下载剖析流行的算在和flix上的应用"
目录:
部分系统的准备工作
章什么是.3
1.1现实生活中的.3
1.1.1系统在互联网上大显身手.5
1.1.2长尾.5
1.1.3flix的系统.6
1.1.4系统的定义.13
1.2系统的分类.15
1.2.1域.16
1.2.2目的.16
1.2.3上下文.17
1.2.4个化级别.17
1.2.5专家意见.19
1.2.6隐私与可信度.19
1.2.7接.20
1.2.8算.23
1.3机器学与flixprize.24
1.4moviegeeks.25
1.4.1设计与规范.27
1.4.2架构.27
1.5构建一个系统.29
小结.31
第2章用户行为以及如何收集用户行为数据.32
2.1在浏览时flix如何收集证据.33
2.1.1flix收集的证据.35
2.2寻找有用的用户行为.37
2.2.1捕获访客印象.38
2.2.2可以从浏览者身上学到什么.38
2.2.3购买行为.43
2.2.4消费商品.44
2.2.5访客评分.45
2.2.6以(旧的)flix方式了解你的用户.48
2.3识别用户.49
2.4从其他途径获取访客数据.50
2.5收集器.50
2.5.1构建项目文件.52
2.5.2数据模型.52
2.5.3告密者(snitch):客户端证据收集器.53
2.5.4将收集器集成到moviegeeks中.54
2.6系统中的用户是谁以及如何对其进行建模.57
小结.60
第3章监控系统.61
3.1为什么添加仪表盘是个好主意.62
3.1.1回答“我们做得怎么样?”.62
3.2执行分析.64
3.2.1分析.64
3.2.2基本统据.64
3.2.3转化.65
3.2.4分析转化路径.69
3.2.5转化路径.70
3.3角.73
3.4moviegeeks仪表盘.76
3.4.1自动生成志数据.76
3.4.2分析仪表盘的规范和设计.77
3.4.3分析仪表盘示意图.77
3.4.4架构.78
小结.81
第4章评分及其计算方.82
4.1用户-商品喜好.83
4.1.1什么是评分.83
4.1.2用户-商品矩阵.84
4.2显式评分和隐式评分.86
4.2.1如何选择可靠的来源.87
4.3重温显式评分.88
4.4什么是隐式评分.88
4.4.1与人相关的.90
4.4.2关于计算评分的思.90
4.5计算隐式评分.93
4.5.1看看行为数据.94
4.5.2一个有关机器学的问题.98
4.6如何计算隐式评分.99
4.6.1添加时间因素.102
4.7低频商品更有价值.105
小结.107
第5章非个化.108
5.1什么是非个化.109
5.1.1什么是广告.109
5.1.2有什么作用.110
5.2当没有数据的时候如何做.111
5.2.1商品的十大排行榜.113
5.3榜单的实现以及系统组件的准备工作.114
5.3.1系统组件.114
5.3.2github上的moviegeeks代码.116
5.3.3系统.116
5.3.4为moviegeeks添加一个榜单.116
5.3.5使内容看起来更具吸引力.117
5.4种子.119
5.4.1频繁购买的商品与你正在查看的商品很相似.120
5.4.2关联规则.121
5.4.3实现关联规则.126
5.4.4在数据库中存储关联规则.130
5.4.5计算关联规则.131
5.4.6运用不同的事件来创建关联规则.133
小结.133
第6章冷用户(冷商品).135
6.1什么是冷启动.135
6.1.1冷商品.137
6.1.2冷用户.137
6.1.3灰羊.139
6.1.4现实生活中的例子.139
6.1.5面对冷启动你能做什么.140
6.2追踪访客.141
6.2.1执着于匿名用户.141
6.3用算来解决冷启动问题.141
6.3.1使用关联规则为冷用户创建信息.142
6.3.2使用领域知识和业务规则.143
6.3.3使用分组.144
6.3.4使用类别来避灰羊问题以及如何介绍冷商品.146
6.4那些不询问很难被发现的人.147
6.4.1当访客数据不够新时.148
6.5使用关联规则快速进行.148
6.5.1收集数据项.149
6.5.2检索关联规则并根据置信度对其排序.150
6.5.3显示内容.151
6.5.4评估.154
小结.154
第2部分算
第7章找出用户之间和商品之间的相似之处.157
7.1什么是相似度.158
7.1.1什么是相似度函数.159
7.2基本的相似度函数.160
7.2.1jaccard距离.161
7.2.2使用lp-norm测量距离.162
7.2.3cosine相似度.165
7.2.4通过pearson相关系数查找相似度.167
7.2.5运行pearson相似度.169
7.2.6pearson相关系数与cosine相似度类似.171
7.3k-means聚类.171
7.3.1k-means聚类算.172
7.3.2使用python实现k-means聚类算.174
7.4实现相似度.178
7.4.1在moviegeeks上实现相似度.181
7.4.2在moviegeeks上实现聚类.183
小结.187
第8章邻域协同过滤.188
8.1协同过滤:一节历史课.190
8.1.1当信息被协同过滤时.190
8.1.2互帮互助.190
8.1.3评分矩阵.192
8.1.4协同过滤管道.193
8.1.5应该使用用户-用户还是物品-物品的协同过滤.194
8.1.6数据要求.195
8.2的计算.195
8.3相似度的计算.196
8.4预测物品相似度的算.196
8.5选择邻域的方.201
8.6找到正确的邻域.203
8.7计算预测评分的方.204
8.8使用基于物品的过滤进行预测.206
8.8.1计算物品的预测评分.206
8.9冷启动问题.207
8.10机器学术语简介.208
8.11moviegeeks上的协同过滤.209
8.11.1基于物品的过滤.209
8.12关联规则和协同之间有什么区别.215
8.13用于协同过滤的工具.215
8.14协同过滤的优缺点.217
小结.218
第9章评估系统.219
9.1系统的评估周期.220
9.2为什么评估很重要.221
9.3如何解释用户行为.222
9.4测量什么.223
9.4.1了解我的喜好,尽量减少预测错误.223
9.4.2多样.224
9.4.3覆盖率.225
9.4.4惊喜度.227
9.5在实现之前.228
9.5.1验证算.228
9.5.2回归测试.229
9.6评估的类型.230
9.7离线评估.231
9.7.1当算不产生任何时该怎么办.231
9.8离线实验.232
9.8.1准备实验数据.237
9.9在moviegeeks中实现这个实验.244
9.9.1待办任务清单.244
9.10评估测试集.248
9.10.1从基线预测器开始.248
9.10.2找到正确的参数.251
9.11在线评估.252
9.11.1对照实验.252
9.11.2a/b测试.253
9.12利用exploit/explore持续测试.254
9.12.1反馈循环.255
小结.256
0章基于内容的过滤.257
10.1举例说明.258
10.2什么是基于内容的过滤.261
10.3内容分析器.262
10.3.1从物品配置文件提取特征.262
10.3.2数量较少的分类数据.265
10.3.3将年份转换为可比较的特征.265
10.4从描述中提取元数据.266
10.4.1准备描述.266
10.5使用tf-idf查找重要单词.270
10.6使用lda进行主题建模.272
10.6.1有什么方可以调整lda.279
10.7查找相似内容.282
10.8如何创建用户配置文件.283
10.8.1使用lda创建用户配置文件.283
10.8.2使用tf-idf创建用户配置文件.283
10.9moviegeeks中基于内容的.286
10.9.1加载数据.286
10.9.2训练模型.287
10.9.3创建物品配置文件.288
10.9.4创建用户配置文件.289
10.9.5展示.291
10.10评估基于内容的系统.292
10.11基于内容过滤的优缺点.293
小结.294
1章用矩阵分解寻找隐藏特征.295
11.1有时减少数据量是好事.296
11.2你想要解决的问题的例子.298
11.3谈一点线代数.301
11.3.1矩阵.301
11.3.2什么是因子分解.303
11.4使用svd构造因子分解.304
11.4.1通过分组加入添加新用户.310
11.4.2如何使用svd进行.313
11.4.3基线预测.313
11.4.4时间动态.316
11.5使用funksvd构造因子分解.317
11.5.1均方根误差.317
11.5.2梯度下降.318
11.5.3梯度下降.321
11.5.4后是因子分解.322
11.5.5增加偏差.323
11.5.6如何开始,何时结束.324
11.6用funksvd进行.328
11.7moviegeeks中的funksvd实现.331
11.7.1如何处理异常值.335
11.7.2保持模型的更新.336
11.7.3更快的实施方.337
11.8显式数据与隐式数据.337
11.估.337
11.10用于funksvd的参数.339
小结.341
2章运用很好算来实现混合.342
12.1混合系统的困惑世界.343
12.2单体.344
12.2.1将基于内容的特征与行为数据混合,以改进协同过滤系统.345
12.3掺杂式混合.346
12.4集成.347
12.4.1可切换的集成.348
12.4.2加权式集成.349
12.4.3线回归.350
12.5特征加权线叠加(fwls).351
12.5.1元特征:权重作为函数.352
12.5.2算.353
12.6实现.360
小结.370
3章排序和排序学.371
13.1foursquare的排序学例子.372
13.2重新排序.376
13.3什么是排序学.377
13.3.1三种类型的ltr算.377
13.4贝叶斯个化排序.379
13.4.1bpr排序.381
13.4.2数学魔术(巫术).383
13.4.3bpr算.386
13.4.4具有矩阵分解的bpr.387
13.5bpr的实现.388
13.5.1执行.393
13.6评估.394
13.7用于bpr的参数.397
小结.398
4章系统的未来.399
14.1本书内容结.400
14.2接下来要学的主题.403
14.2.1延伸阅读.403
14.2.2算.404
14.2.3所处环境.404
14.2.4人机交互.405
14.2.5选择一个好的架构.405
14.3系统的未来是什么.406
14.4后的想.411
内容简介:
要构建一个实用的“智能”系统,不仅需要有好的算,还需要了解接收的用户。本书分为两部分,部分侧重于基础架构,主要介绍系统的工作,展示如何创建系统,以及给应用程序增加系统时,应该如何收集和应用数据;第二部分侧重于算,介绍系统算,以及如何使用系统收集的数据来计算向用户什么内容。作者还教授了如何使用流行的算,并剖析它们在和flix等上的实际应用。本书适合对系统感兴趣的开发人员阅读,从事数据科学行业的读者也能从书中获得启发。
作者简介:
"kimfalk是一位数据科学家,他在构建数据驱动的应用程序方面有着丰富的经验。他对系统和机器学很感兴趣。他所训练的系统,为用户合适的电影,为人们推送广告,甚至帮助律师找到判例的内容。自2010年以来,他一直从事大数据解决方案和机器学方面的工作。kim经常参与有关系统的演讲和写作。当kim不工作的时候,他是一个居家男人,是一位父亲,会带着他的德国短毛指示犬进行越野跑。"
精彩书评:
"“这本书涵盖了技术背景知识,并以清晰简短的python代码演示了实现。”——andrewcollier,exegetic公司“你有没有想过和flix是如何了解你对产品和电影的喜好,并提供相关的?这本书会告诉你它们是如何做到的!”——amitlamba,techoverture公司“这本书讲了关于系统的,从入门到概念。”——jaromird.b.nemec,dbn公司“这是一本实用的深入了解系统的图书!”——peterhampton,阿尔斯特大学"
— 没有更多了 —
以下为对购买帮助不大的评价