• 实用系统 数据库 (丹)金·福尔克 新华正版
21年品牌 40万+商家 超1.5亿件商品

实用系统 数据库 (丹)金·福尔克 新华正版

全书以作者自建的电影moviegeeks作为完整案例介绍系统,涵盖从数据收集到生成的全过程,提供详细的python代码及注释

61.3 5.2折 119 全新

仅1件

江苏无锡
认证卖家担保交易快速发货售后保障

作者(丹)金·福尔克

出版社电子工业出版社

ISBN9787121420788

出版时间2021-10

版次1

装帧平装

开本16开

页数436页

字数487千字

定价119元

货号xhwx_1202502785

上书时间2023-11-18

翰林文轩旗舰店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
正版特价新书
商品描述
主编:

"介绍系统和关键算,配备大量代码,适合入门对于书中所涉及的数学和统计学知识,均提供示例图和代码,直观易懂涵盖从数据收集到生成的全过程,提供详细的python代码及注释,代码可在github上下载剖析流行的算在和flix上的应用"

目录:

部分系统的准备工作

章什么是.3

1.1现实生活中的.3

1.1.1系统在互联网上大显身手.5

1.1.2长尾.5

1.1.3flix的系统.6

1.1.4系统的定义.13

1.2系统的分类.15

1.2.1域.16

1.2.2目的.16

1.2.3上下文.17

1.2.4个化级别.17

1.2.5专家意见.19

1.2.6隐私与可信度.19

1.2.7接.20

1.2.8算.23

1.3机器学与flixprize.24

1.4moviegeeks.25

1.4.1设计与规范.27

1.4.2架构.27

1.5构建一个系统.29

小结.31

第2章用户行为以及如何收集用户行为数据.32

2.1在浏览时flix如何收集证据.33

2.1.1flix收集的证据.35

2.2寻找有用的用户行为.37

2.2.1捕获访客印象.38

2.2.2可以从浏览者身上学到什么.38

2.2.3购买行为.43

2.2.4消费商品.44

2.2.5访客评分.45

2.2.6以(旧的)flix方式了解你的用户.48

2.3识别用户.49

2.4从其他途径获取访客数据.50

2.5收集器.50

2.5.1构建项目文件.52

2.5.2数据模型.52

2.5.3告密者(snitch):客户端证据收集器.53

2.5.4将收集器集成到moviegeeks中.54

2.6系统中的用户是谁以及如何对其进行建模.57

小结.60

第3章监控系统.61

3.1为什么添加仪表盘是个好主意.62

3.1.1回答“我们做得怎么样?”.62

3.2执行分析.64

3.2.1分析.64

3.2.2基本统据.64

3.2.3转化.65

3.2.4分析转化路径.69

3.2.5转化路径.70

3.3角.73

3.4moviegeeks仪表盘.76

3.4.1自动生成志数据.76

3.4.2分析仪表盘的规范和设计.77

3.4.3分析仪表盘示意图.77

3.4.4架构.78

小结.81

第4章评分及其计算方.82

4.1用户-商品喜好.83

4.1.1什么是评分.83

4.1.2用户-商品矩阵.84

4.2显式评分和隐式评分.86

4.2.1如何选择可靠的来源.87

4.3重温显式评分.88

4.4什么是隐式评分.88

4.4.1与人相关的.90

4.4.2关于计算评分的思.90

4.5计算隐式评分.93

4.5.1看看行为数据.94

4.5.2一个有关机器学的问题.98

4.6如何计算隐式评分.99

4.6.1添加时间因素.102

4.7低频商品更有价值.105

小结.107

第5章非个化.108

5.1什么是非个化.109

5.1.1什么是广告.109

5.1.2有什么作用.110

5.2当没有数据的时候如何做.111

5.2.1商品的十大排行榜.113

5.3榜单的实现以及系统组件的准备工作.114

5.3.1系统组件.114

5.3.2github上的moviegeeks代码.116

5.3.3系统.116

5.3.4为moviegeeks添加一个榜单.116

5.3.5使内容看起来更具吸引力.117

5.4种子.119

5.4.1频繁购买的商品与你正在查看的商品很相似.120

5.4.2关联规则.121

5.4.3实现关联规则.126

5.4.4在数据库中存储关联规则.130

5.4.5计算关联规则.131

5.4.6运用不同的事件来创建关联规则.133

小结.133

第6章冷用户(冷商品).135

6.1什么是冷启动.135

6.1.1冷商品.137

6.1.2冷用户.137

6.1.3灰羊.139

6.1.4现实生活中的例子.139

6.1.5面对冷启动你能做什么.140

6.2追踪访客.141

6.2.1执着于匿名用户.141

6.3用算来解决冷启动问题.141

6.3.1使用关联规则为冷用户创建信息.142

6.3.2使用领域知识和业务规则.143

6.3.3使用分组.144

6.3.4使用类别来避灰羊问题以及如何介绍冷商品.146

6.4那些不询问很难被发现的人.147

6.4.1当访客数据不够新时.148

6.5使用关联规则快速进行.148

6.5.1收集数据项.149

6.5.2检索关联规则并根据置信度对其排序.150

6.5.3显示内容.151

6.5.4评估.154

小结.154

第2部分算

第7章找出用户之间和商品之间的相似之处.157

7.1什么是相似度.158

7.1.1什么是相似度函数.159

7.2基本的相似度函数.160

7.2.1jaccard距离.161

7.2.2使用lp-norm测量距离.162

7.2.3cosine相似度.165

7.2.4通过pearson相关系数查找相似度.167

7.2.5运行pearson相似度.169

7.2.6pearson相关系数与cosine相似度类似.171

7.3k-means聚类.171

7.3.1k-means聚类算.172

7.3.2使用python实现k-means聚类算.174

7.4实现相似度.178

7.4.1在moviegeeks上实现相似度.181

7.4.2在moviegeeks上实现聚类.183

小结.187

第8章邻域协同过滤.188

8.1协同过滤:一节历史课.190

8.1.1当信息被协同过滤时.190

8.1.2互帮互助.190

8.1.3评分矩阵.192

8.1.4协同过滤管道.193

8.1.5应该使用用户-用户还是物品-物品的协同过滤.194

8.1.6数据要求.195

8.2的计算.195

8.3相似度的计算.196

8.4预测物品相似度的算.196

8.5选择邻域的方.201

8.6找到正确的邻域.203

8.7计算预测评分的方.204

8.8使用基于物品的过滤进行预测.206

8.8.1计算物品的预测评分.206

8.9冷启动问题.207

8.10机器学术语简介.208

8.11moviegeeks上的协同过滤.209

8.11.1基于物品的过滤.209

8.12关联规则和协同之间有什么区别.215

8.13用于协同过滤的工具.215

8.14协同过滤的优缺点.217

小结.218

第9章评估系统.219

9.1系统的评估周期.220

9.2为什么评估很重要.221

9.3如何解释用户行为.222

9.4测量什么.223

9.4.1了解我的喜好,尽量减少预测错误.223

9.4.2多样.224

9.4.3覆盖率.225

9.4.4惊喜度.227

9.5在实现之前.228

9.5.1验证算.228

9.5.2回归测试.229

9.6评估的类型.230

9.7离线评估.231

9.7.1当算不产生任何时该怎么办.231

9.8离线实验.232

9.8.1准备实验数据.237

9.9在moviegeeks中实现这个实验.244

9.9.1待办任务清单.244

9.10评估测试集.248

9.10.1从基线预测器开始.248

9.10.2找到正确的参数.251

9.11在线评估.252

9.11.1对照实验.252

9.11.2a/b测试.253

9.12利用exploit/explore持续测试.254

9.12.1反馈循环.255

小结.256

0章基于内容的过滤.257

10.1举例说明.258

10.2什么是基于内容的过滤.261

10.3内容分析器.262

10.3.1从物品配置文件提取特征.262

10.3.2数量较少的分类数据.265

10.3.3将年份转换为可比较的特征.265

10.4从描述中提取元数据.266

10.4.1准备描述.266

10.5使用tf-idf查找重要单词.270

10.6使用lda进行主题建模.272

10.6.1有什么方可以调整lda.279

10.7查找相似内容.282

10.8如何创建用户配置文件.283

10.8.1使用lda创建用户配置文件.283

10.8.2使用tf-idf创建用户配置文件.283

10.9moviegeeks中基于内容的.286

10.9.1加载数据.286

10.9.2训练模型.287

10.9.3创建物品配置文件.288

10.9.4创建用户配置文件.289

10.9.5展示.291

10.10评估基于内容的系统.292

10.11基于内容过滤的优缺点.293

小结.294

1章用矩阵分解寻找隐藏特征.295

11.1有时减少数据量是好事.296

11.2你想要解决的问题的例子.298

11.3谈一点线代数.301

11.3.1矩阵.301

11.3.2什么是因子分解.303

11.4使用svd构造因子分解.304

11.4.1通过分组加入添加新用户.310

11.4.2如何使用svd进行.313

11.4.3基线预测.313

11.4.4时间动态.316

11.5使用funksvd构造因子分解.317

11.5.1均方根误差.317

11.5.2梯度下降.318

11.5.3梯度下降.321

11.5.4后是因子分解.322

11.5.5增加偏差.323

11.5.6如何开始,何时结束.324

11.6用funksvd进行.328

11.7moviegeeks中的funksvd实现.331

11.7.1如何处理异常值.335

11.7.2保持模型的更新.336

11.7.3更快的实施方.337

11.8显式数据与隐式数据.337

11.估.337

11.10用于funksvd的参数.339

小结.341

2章运用很好算来实现混合.342

12.1混合系统的困惑世界.343

12.2单体.344

12.2.1将基于内容的特征与行为数据混合,以改进协同过滤系统.345

12.3掺杂式混合.346

12.4集成.347

12.4.1可切换的集成.348

12.4.2加权式集成.349

12.4.3线回归.350

12.5特征加权线叠加(fwls).351

12.5.1元特征:权重作为函数.352

12.5.2算.353

12.6实现.360

小结.370

3章排序和排序学.371

13.1foursquare的排序学例子.372

13.2重新排序.376

13.3什么是排序学.377

13.3.1三种类型的ltr算.377

13.4贝叶斯个化排序.379

13.4.1bpr排序.381

13.4.2数学魔术(巫术).383

13.4.3bpr算.386

13.4.4具有矩阵分解的bpr.387

13.5bpr的实现.388

13.5.1执行.393

13.6评估.394

13.7用于bpr的参数.397

小结.398

4章系统的未来.399

14.1本书内容结.400

14.2接下来要学的主题.403

14.2.1延伸阅读.403

14.2.2算.404

14.2.3所处环境.404

14.2.4人机交互.405

14.2.5选择一个好的架构.405

14.3系统的未来是什么.406

14.4后的想.411

内容简介:

要构建一个实用的“智能”系统,不仅需要有好的算,还需要了解接收的用户。本书分为两部分,部分侧重于基础架构,主要介绍系统的工作,展示如何创建系统,以及给应用程序增加系统时,应该如何收集和应用数据;第二部分侧重于算,介绍系统算,以及如何使用系统收集的数据来计算向用户什么内容。作者还教授了如何使用流行的算,并剖析它们在和flix等上的实际应用。本书适合对系统感兴趣的开发人员阅读,从事数据科学行业的读者也能从书中获得启发。

作者简介:

"kimfalk是一位数据科学家,他在构建数据驱动的应用程序方面有着丰富的经验。他对系统和机器学很感兴趣。他所训练的系统,为用户合适的电影,为人们推送广告,甚至帮助律师找到判例的内容。自2010年以来,他一直从事大数据解决方案和机器学方面的工作。kim经常参与有关系统的演讲和写作。当kim不工作的时候,他是一个居家男人,是一位父亲,会带着他的德国短毛指示犬进行越野跑。"

精彩书评:

"“这本书涵盖了技术背景知识,并以清晰简短的python代码演示了实现。”——andrewcollier,exegetic公司“你有没有想过和flix是如何了解你对产品和电影的喜好,并提供相关的?这本书会告诉你它们是如何做到的!”——amitlamba,techoverture公司“这本书讲了关于系统的,从入门到概念。”——jaromird.b.nemec,dbn公司“这是一本实用的深入了解系统的图书!”——peterhampton,阿尔斯特大学"

—  没有更多了  —

以下为对购买帮助不大的评价

正版特价新书
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP