• 系统开发实战 数据库 高阳团 新华正版
  • 系统开发实战 数据库 高阳团 新华正版
21年品牌 40万+商家 超1.5亿件商品

系统开发实战 数据库 高阳团 新华正版

49.5 6.3折 79 全新

库存4件

河北保定
认证卖家担保交易快速发货售后保障

作者高阳团

出版社电子工业出版社

ISBN9787121365201

出版时间2019-07

版次1

装帧平装

开本16

页数345页

字数582千字

定价79元

货号xhwx_1201920531

上书时间2024-12-14

浩子书屋

九年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
正版特价新书
商品描述
主编:

"我看程序员都是在实践中学,是先有一个什么需求,现用现学。
——万维纲

你为什么要买一本系统的书,你是想终开发出真正的系统。
你并不是想学各种、算法,这些都是手段而不是目的。
本书可以满足你。

本书终是带你开发出三个真正的系统——新闻系统、音乐系统、图书系统。

真正的系统是高度复杂的,可能用到多种算法、多种语言。
但,这不是我们学的优路径,也不是把一堆知识乱如团给你的理由。
真正好书应该是可以抽丝剥茧、化繁为简、找到合理颗粒度的能力。

本书努力去做了。

本书定,你只懂python可以了。
然后,缺什么我们给你补什么。
只给你紧急而必需的(因为我们相信我们是给你推开一扇门,后面的留给后面)

我们认为:具体的,比抽象的更好理解
我们认为:动手做出的,是听说的要真实
我们认为:人的认知应该是从具体到抽象,再从抽象到具体。从抽象到抽象都是不负责的。
我们认为:读者是有感悟力的,只是缺少行动的抓手。

所以,我们给你一个又一个实例。

只有实践才是真知的来源。
只有实践才能给你走下去的勇气。
只有实践才能到达成功的彼岸。

小的知识点,有小的实例。
当你可以把这一个个小实例都能做出来了,可以顺利地进入下一步——构建再大的项目了(这也是刻意练的思想)
终结的有三个大实例——开发新闻系统、开发音乐系统、开发图书系统。

我们希望本书可以带给你“解剖小麻雀,而知所有鸟类的基本结构”的体验。

希望您可以认真阅读本书的目录,给你一个不一样的学体验。

行动吧,!
"

目录:

篇 系统的背景介绍和入门 
章 走进系统 2
1.1 从“啤酒与尿布”到系统的前世今生 2
1.1.1 “啤酒与尿布” 2
1.1.2 系统的前世今生 2
1.2 系统可以做什么 4
1.2.1 什么是系统 4
1.2.2 在电商类产品中的应用 5
1.2.3 在社交类产品中的应用 6
1.2.4 在音乐类产品中的应用 8
1.2.5 在类产品中的应用 9
1.2.6 在阅读类产品中的应用 10
1.2.7 在服务类产品中的应用 11
1.3 学本书需要的技能 12
1.3.1 python基础 12
1.3.2 数据结构 14
1.3.3 工程能力 15
1.4 如何学本书 17
1.5 知识导图 17
第2章 搭建你的个系统 19
2.1 实例1:搭建电影系统 19
2.1.1 利用flix数据集准备数据 19
2.1.2 使用python表示数据 21
2.1.3 选择相似用户 23
2.1.4 为用户相似用户喜欢的电影 24
2.1.5 分析效果 25
2.2 结:搭建系统的一般步骤 26
2.2.1 准备数据 26
2.2.2 选择算法 27
2.2.3 模型训练 28
2.2.4 效果评估 28
2.3 知识导图 28
第3章 系统常用数据集介绍 29
3.1 movielens数据集 29
3.1.1 readme 29
3.1.2 ratings.dat 29
3.1.3 movies.dat 31
3.1.4 users.dat 34
3.2 book-crossings数据集 36
3.2.1 bx-book-ratings.csv 37
3.2.2 bx-books.csv 39
3.2.3 bx-users.csv 39
3.3 last.fm数据集 41
3.3.1 readme 41
3.3.2 artists.dat 41
3.3.3 tags.dat 41
3.3.4 user_artists.dat 42
3.3.5 user_friends.dat 42
3.3.6 uses_taggedartists.dat 42
3.3.7 user_taggedartists-timestam.dat 42
3.4 foursquare数据集 43
3.4.1 users.dat 43
3.4.2 venues.dat 44
3.4.3 checkins.dat 44
3.4.4 sograph.dat 44
3.4.5 ratings.dat 45
3.5 kaggle比赛之retailrocket 数据集 46
3.5.1 events.csv 47
3.5.2 category_tree.csv 49
3.5.3 item_properties.csv 49
3.6 场景分析 49
3.7 知识导图 50
第2篇 系统涉及的算法介绍、冷启动和效果评估 
第4章 数据挖掘――让系统更懂你 52
4.1 数据预处理 52
4.1.1 数据标准化 52
4.1.2 实例2:实现数据的标准化 54
4.1.3 数据离散化 56
4.1.4 实例3:基于信息熵的数据离散化 58
4.1.5 数据抽样 61
4.1.6 数据降维 63
4.1.7 实例4:对鸢尾花数据集特征进行降维 66
4.1.8 数据清理 68
4.1.9 相似度计算 71
4.2 数据分类 74
4.2.1 k近邻算法 74
4.2.2 实例5:利用knn算法实现别判定 75
4.2.3 决策树算法 77
4.2.4 实例6:构建是否举办活动的决策树 80
4.2.5 朴素贝叶斯算法 84
4.2.6 实例7:基于朴素贝叶斯算法进行异常账户检测 87
4.2.7 分类器的评估 90
4.2.8 实例8:scikit-learn中的分类效果评估 92
4.3 数据聚类 92
4.3.1 kmeans算法 92
4.3.2 实例9:基于kmeans算法进行商品价格聚类 95
4.3.3 二分-kmeans算法 98
4.3.4 实例10:基于二分-kmeans算法进行商品价格聚类 99
4.3.5 聚类算法的评估 100
4.3.6 实例11:scikit-learn中的聚类效果评估 102
4.4 关联分析 103
4.4.1 apriori算法 103
4.4.2 实例12:基于apriori算法实现频繁项集和相关规则挖掘 106
4.5 知识导图 110 
第5章 基于用户行为特征的 111
5.1 用户行为分类 111
5.2 基于内容的算法 112
5.2.1 算法――从“构造特征”到“判断用户是否喜欢” 112
5.2.2 实例13:对手机属进行特征建模 115
5.3 实例14:编写一个基于内容算法的电影系统 117
5.3.1 了解实现思路 117
5.3.2 准备数据 119
5.3.3 选择算法 122
5.3.4 模型训练 122
5.3.5 效果评估 123
5.4 基于近邻的算法 124
5.4.1 usercf算法的――先“找到相似同户”,再“找到他们喜欢的物品” 124
5.4.2 itemcf算法的――先“找到用户喜欢的物品”,再“找到喜欢物品的相似物品” 131
5.5 实例15:编写一个基于usercf算法的电影系统 137
5.5.1 了解实现思路 138
5.5.2 准备数据 138
5.5.3 选择算法 138
5.5.4 模型训练 138
5.5.5 效果评估 141
5.6 实例16:编写一个基于itemcf算法的电影系统 141
5.6.1 了解实现思路 141
5.6.2 准备数据 142
5.6.3 选择算法 142
5.6.4 模型训练 142
5.6.5 效果评估 144
5.7 对比分析:usercf算法和itemcf算法 145
5.8 对比分析:基于内容和基于近邻 146
5.9 基于隐语义模型的算法 147
5.9.1 lfm概述 147
5.9.2 lfm算法理解 148
5.10 实例17:编写一个基于lfm的电影系统 152
5.10.1 了解实现思路 152
5.10.2 准备数据 152
5.10.3 选择算法 154
5.10.4 模型训练 155
5.10.5 效果评估 158
5.11 知识导图 159 
第6章 基于标签的 161
6.1 基于标签系统的应用 161
6.1.1 last.fm 161
6.1.2 delicious 162
6.1.3 豆瓣 163
6.1.4 云音乐 163
6.2 数据标注与关键词提取 165
6.2.1 系统中的数据标注 165
6.2.2 系统中的关键词提取 167
6.2.3 标签的分类 168
6.3 实例18:基于tf-idf算法提取商品标题的关键词 169
6.3.1 了解tf-idf算法 169
6.3.2 认识商品标题描述 170
6.3.3 提取关键词 170
6.4 基于标签的系统 174
6.4.1 标签评分算法 174
6.4.2 标签评分算法改进 176
6.4.3 标签基因 177
6.4.4 用户兴趣建模 177
6.5 实例19:利用标签算法实现艺术家的 178
6.5.1 了解实现思路 178
6.5.2 准备数据 178
6.5.3 选择算法 179
6.5.4 模型训练 179
6.5.5 效果评估 182
6.6 知识导图 182
第7章 基于上下文的 184
7.1 基于时间特征的 184
7.1.1 时间效应介绍 184
7.1.2 时间效应分析 187
7.1.3 系统的实时 194
7.1.4 协同过滤中的时间因子 195
7.2 实例20:实现一个“增加时间衰减函数的协同过滤算法” 197
7.2.1 在usercf算法中增加时间衰减函数 197
7.2.2 在itemcf算法中增加时间衰减函数 199
7.3 基于地域和热度特征的 200
7.3.1 为什么要将地域和热度特征放在一起 201
7.3.2 解读lars中的地域特征 202
7.3.3 基于地域和热度的算法 204
7.4 实例21:创建一个基于地域和热度的酒店系统 206
7.4.1 了解实现思路 206
7.4.2 准备数据 207
7.4.3 选择算法 207
7.4.4 模型训练 207
7.4.5 效果评估 210
7.5 其他上下文信息 210
7.6 知识导图 210 
第8章 基于点击率预估的 212
8.1 传统算法的局限和应用 212
8.1.1 传统算法的局限 212
8.1.2 传统算法的应用 213
8.2 点击率预估在系统中的应用 214
8.3 集成学 214
8.3.1 集成学概述 215
8.3.2 boosting算法(提升法) 215
8.3.3 bagging算法(自助法) 216
8.3.4 stacking算法(融合法) 217
8.4 导数、偏导数、方向导数、梯度 217
8.4.1 导数 217
8.4.2 偏导数 217
8.4.3 方向导数 218
8.4.4 梯度 219
8.4.5 梯度下降 219
8.5 gbdt算法 222
8.5.1 gradient boosting方法 223
8.5.2 决策树 223
8.5.3 gbdt算法的 224
8.6 实例22:基于gbdt算法预估电信客户流失 227
8.6.1 了解实现思路 227
8.6.2 准备数据 229
8.6.3 选择算法 232
8.6.4 模型训练 232
8.6.5 效果评估 234
8.7 回归分析 236
8.7.1 什么是回归分析 236
8.7.2 回归分析算法分类 236
8.8 logistic regression算法 237
8.8.1 sigmoid函数 237
8.8.2 lr为什么要使用sigmoid函数 239
8.8.3 lr的算法分析 240
8.9 实例23:基于lr算法预估电信客户流失 241
8.9.1 准备数据 242
8.9.2 选择算法 242
8.9.3 模型训练 242
8.9.4 效果评估 243
8.10 gbdt+lr的模型融合 245
8.10.1 gbdt+lr模型融合概述 245
8.10.2 为什么选择gbdt和lr进行模型融合 246
8.10.3 gbdt+lr模型融合的 246
8.11 实例24:基于gbdt和lr算法预估电信客户流失 247
8.11.1 准备数据 247
8.11.2 选择算法 247
8.11.3 模型训练 247
8.11.4 效果评估 248
8.12 知识导图 251
第9章 系统中的冷启动 252
9.1 冷启动介绍 252
9.1.1 冷启动的分类 252
9.1.2 冷启动的几种实现方法 252
9.2 基于热门数据实现冷启动 253
9.3 利用用户注册信息实现冷启动 254
9.3.1 注册信息分析 254
9.3.2 实例25:分析book-crossings数据集中的共特征 255
9.3.3 实现 261
9.4 利用用户上下文信息实现冷启动 261
9.4.1 设备信息特征 262
9.4.2 时间地域信息特征 262
9.4.3 实现 262
9.5 利用第三方数据实现冷启动 263
9.6 利用用户和系统之间的交互实现冷启动 263
9.6.1 实现 263
9.6.2 系统中实时交互的应用 265
9.6.3 实例26:用户实时交互系统设计 266
9.7 利用物品的内容属实现冷启动 267
9.7.1 物品内容属分析 267
9.7.2 物品信息的使用 268
9.8 利用专家标注数据实现冷启动 269
9.9 知识导图 270 
0章 系统中的效果评估 271
10.1 用户调研 271
10.2 在线评估 272
10.3 在线实验方式――abtest 272
10.3.1 abtest介绍 272
10.3.2 abtest流程 272
10.3.3 abtest的注意事项 273
10.4 在线评估指标 274
10.4.1 点击率 275
10.4.2 转化率 275
10.4.3 成交额 275
10.5 离线评估 276
10.6 拆分数据集 276
10.6.1 留出法 277
10.6.2 k-折交验证法 277
10.6.3 自助法 277
10.6.4 实例27:使用sklearn包中的train_test_split()函数进行数据集拆分 278
10.6.5 实例28:使用sklearn包中的kfold()函数产生交验证数据集 280
10.6.6 实例29:使用sklearn包中的cross_validate()函数演示交验证 281
10.7 离线评估指标 282
10.7.1 准确度指标之预测分类准确度指标 282
10.7.2 实例30:使用sklearn包中的metrics类预测分类准确度 288
10.7.3 准确度指标之预测评分准确度指标 290
10.7.4 实例31:使用sklearn包中的metrics类预测评分准确度 290
10.7.5 准确度指标之预测评分关联指标 291
10.7.6 准确度指标之排序准确度指标 292
10.7.7 非准确度指标 292
10.8 知识导图 296
第3篇 系统实例
1章 实例32:搭建一个新闻系统 298
11.1 准备数据 298
11.2 预处理数据 298
11.2.1 原始数据加工 298
11.2.2 新闻热度值计算 299
11.2.3 新闻相似度计算 300
11.2.4 指定标签下的新闻统计 302
11.3 设计架构 303
11.4 实现系统 304
11.4.1 准备环境 304
11.4.2 实现后端接 304
11.4.3 实现前端界面 309
11.4.4 系统演示 309
11.5 代码复现 311
11.5.1 安装依赖 311
11.5.2 数据入库 312
11.5.3 修改配置 312
11.5.4 项目启动 312
11.6 知识导图 312
2章 实例33:搭建一个音乐系统 314
12.1 准备数据 314
12.2 预处理数据 314
12.2.1 计算歌曲、歌手、用户相似度 314
12.2.2 计算用户集 315
12.2.3 数据导入数据库 319
12.3 设计架构 321
12.4 实现系统 322
12.4.1 准备环境 322
12.4.2 实现后端接 322
12.4.3 实现前端界面 324
12.4.4 系统演示 324
12.5 代码复现 327
12.5.1 安装依赖 327
12.5.2 数据入库 327
12.5.3 修改配置 327
12.5.4 项目启动 328
12.6 知识导图 328
3章 实例34:搭建一个图书系统 329
13.1 准备数据 329
13.2 预处理数据 329
13.2.1 原始数据加工 329
13.2.2 数据导入数据库 331
13.2.3 模型准备 331
13.3 设计架构 332
13.4 实现系统 333
13.4.1 准备环境 333
13.4.2 实现后端接 333
13.4.3 实现前端界面 336
13.4.4 系统演示 336
13.5 代码复现 338
13.6 知识导图 338
4章 业界系统架构介绍 340
14.1 概述 340
14.2 架构介绍 340
14.3 召回内容 342
14.4 计算排序 343
14.4.1 特征工程 343
14.4.2 特征分类 343
14.4.3 排序算法 343
14.5 物品过滤和展示 344
14.5.1 物品过滤 344
14.5.2 物品展示 344
14.6 效果评估 344
14.7 知识导图 345

内容简介:

本书是一本关于系统从入门到的读物,采用“理论实践”的形式展开,不仅对各种算法进行了介绍,还对算法所涉及的基础理论知识进行了补充。
全书共分为3篇:
篇是“系统的背景介绍和入门”,包括走进系统、搭建你的一个系统和系统常用数据集介绍;
第2篇是“系统涉及的算法介绍、冷启动和效果评估”,包括数据挖掘——让系统更懂你、基于用户行为特征的、基于标签的、基于上下文的、基于点击率预估的、系统中的冷启动和系统中的效果评估;
第3篇是“系统实例”,包括搭建一个新闻系统、搭建一个音乐系统、搭建一个图书系统和业界系统架构介绍。
书中的实例开发几乎都是基于公开的数据集进行的,当然也涉及一些网络中获取的数据,其终目的都是让读者能够更好地理解算法,更直观地认识系统。
书中所涉及的数据集和实例代码都会提供给读者,这不仅在程度上方便读者学,而且为以后的工作提供了便利。
本书非常适合有编程基础、对系统感兴趣的读者,希望用算法完成设计的高等院校计算机或电子信息专业的,准备开设系统实践课的授课老师,学过python、希望进一步提升编程水的开发者,初学数据挖掘、机器学的算法工程师或数据分析师阅读使用。

作者简介:

高阳团,原算法工程师。id:thinkgamer,cdn博客专家,博客地址为://blog.cdn./ gamer_gyt。一直从事系统相关的研究和开发工作,擅长排序、park、深度学。

—  没有更多了  —

以下为对购买帮助不大的评价

正版特价新书
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP