智能Web算法
正版书带塑封 14点之前订单当日发货 91004810720639975429
¥
13.65
1.5折
¥
89
九五品
库存2件
作者[美]Haralambos(哈若拉玛·玛若曼尼斯)、[美]Dmitry Babenko(德米特里·巴宾寇) 著;阿稳、陈钢 译
出版社电子工业出版社
出版时间2015-03
版次1
装帧平装
货号91004810720639975429
上书时间2024-12-24
商品详情
- 品相描述:九五品
图书标准信息
-
作者
[美]Haralambos(哈若拉玛·玛若曼尼斯)、[美]Dmitry Babenko(德米特里·巴宾寇) 著;阿稳、陈钢 译
-
出版社
电子工业出版社
-
出版时间
2015-03
-
版次
1
-
ISBN
9787121254567
-
定价
89.00元
-
装帧
平装
-
开本
16开
-
纸张
胶版纸
-
页数
400页
-
字数
440千字
-
正文语种
简体中文
- 【内容简介】
-
《智能Web算法》涵盖了五类重要的智能算法:搜索、推荐、聚类、分类和分类器组合,并结合具体的案例讨论了它们在Web应用中的角色及要注意的问题。除了第1章的概要性介绍以及第7章对所有技术的整合应用外,第2~6章以代码示例的形式分别对这五类算法进行了介绍。
- 【作者简介】
-
陈钢,计算机博士,华大科技副总裁,香港中文大学兼职助理教授。现主要从事生物数据存储,分析与可视化工作,兴趣包括机器学习,数据可视化,个人基因组等。阿稳,08年于中国科学技术大学研究生毕业后加入豆瓣算法组,从事数据与算法相关工作。五年的豆瓣工作生涯里经历了豆瓣早期几乎所有的数据与算法产品,如图书豆瓣猜、豆瓣FM。后加入阿里,参与过天猫商品推荐算法,及手机淘宝的产品与算法业务。2014年下半年创办移动外贸电商企业Akarat,继续在产品与算法结合的路上探索。
- 【目录】
-
前言
致谢
关于本书
1什么是智能Web
1.1智能Web应用实例
1.2智能应用的基本要素
1.3什么应用会受益于智能
1.3.1社交网络
1.3.2Mashup
1.3.3门户网站
1.3.4维基
1.3.5文件分享网站
1.3.6网络游戏
1.4如何构建智能应用
1.4.1检查功能和数据
1.4.2获取更多的数据
1.5机器学习、数据挖掘及其他
1.6智能应用中八个常见的误区
1.6.1误区1:数据是可靠的
1.6.2误区2:计算能马上完成
1.6.3误区3:不用考虑数据规模
1.6.4误区4:不考虑解决方案的可扩展性
1.6.5误区5:随处使用同样的方法
1.6.6误区6:总是能知道计算时间
1.6.7误区7:复杂的模型更好
1.6.8误区8:存在无偏见的模型
1.7小结
1.8参考资料
2搜索
2.1用Lucene实现搜索
2.1.1理解Lucene代码
2.1.2搜索的基本步骤
2.2为什么搜索不仅仅是索引
2.3用链接分析改进搜索结果
2.3.1PageRank简介
2.3.2计算PageRank向量
2.3.3alpha:网页间跳转的影响
2.3.4理解幂方法
2.3.5结合索引分值和PageRank分值
2.4根据用户点击改进搜索结果
2.4.1用户点击初探
2.4.2朴素贝叶斯分类器的使用
2.4.3整合Lucene索引、PageRank和用户点击
2.5Word、PDF等无链接文档的排序
2.5.1DocRank算法简介
2.5.2DocRank的原理
2.6大规模实现的有关问题
2.7用户得到了想要的结果吗?精确度和查全率
2.8总结
2.9ToDo
2.10参考资料
3推荐系统
3.1一个在线音乐商店:基本概念
3.1.1距离与相似度的概念
3.1.2走近相似度的计算
3.1.3什么才是最好的相似度计算公式
3.2推荐引擎是怎么工作的
3.2.1基于相似用户的推荐
3.2.2基于相似条目的推荐
3.2.3基于内容的推荐
3.3推荐朋友、文章与新闻报道
3.3.1MyDiggSpace.com简介
3.3.2发现朋友
3.3.3DiggDelphi的内部工作机制
3.4像Netflix.com那样推荐电影
3.4.1电影数据集的介绍及推荐器
3.4.2数据标准化与相关系数
3.5大规模的实现与评估
3.6总结
3.7ToDo
3.8参考资料
4聚类:事物的分组
4.1聚类的需求
4.1.1网站中的用户组:案例研究
4.1.2用SQLorderby子句分组
4.1.3用数组排序分组
4.2聚类算法概述
4.2.1基于分组结构的聚类算法分类
4.2.2基于数据类型和结构的聚类算法分类
4.2.3根据数据规模的聚类算法分类
4.3基于链接的算法
4.3.1树状图:基本的聚类数据结构
4.3.2基于链接的算法概况
4.3.3单链接算法
4.3.4平均链接算法
4.3.5最小生成树算法
4.4k-means算法
4.4.1初识k-means算法
4.4.2k-means的内部原理
4.5鲁棒的链接型聚类(ROCK)
4.5.1ROCK简介
4.5.2为什么ROCK这么强大
4.6DBSCAN
4.6.1基于密度的算法简介
4.6.2DBSCAN的原理
4.7超大规模数据聚类
4.7.1计算复杂性
4.7.2高维度
4.8总结
4.9ToDo
4.10参考资料
5分类:把事物放到它该在的地方
5.1对分类的需求
5.2分类器的概述
5.2.1结构分类算法
5.2.2统计分类算法
5.2.3分类器的生命周期
5.3邮件的自动归类与垃圾邮件过滤
5.3.1朴素贝叶斯分类
5.3.2基于规则的分类
5.4用神经网络做欺诈检测
5.4.1交易数据中关于欺诈检测的一个用例
5.4.2神经网络概览
5.4.3一个可用的神经网络欺诈检测器
5.4.4神经网络欺诈检测器剖析
5.4.5创建通用神经网络的基类
5.5你的结果可信吗
5.6大数据集的分类
5.7总结
5.8ToDo
5.9参考资料
6分类器组合
6.1信贷价值:分类器组合案例研究
6.1.1数据的简要说明
6.1.2为真实问题生成人工数据
6.2用单分类器做信用评估
6.2.1朴素贝叶斯的基准线
6.2.2决策树基准线
6.2.3神经网络的基准线
6.3在同一个数据集中比较多个分类器
6.3.1McNemar检验
6.3.2差额比例检验
6.3.3CochranQ检验与F检验
6.4bagging:bootstrap聚合(bootstrapaggregating)
6.4.1bagging实例
6.4.2bagging分类器底层细节
6.4.3分类器集成
6.5boosting:一种迭代提高的方法
6.5.1boosting分类器实例
6.5.2boosting分类器底层细节
6.6总结
6.7ToDo
6.8参考资料
7智能技术大汇集:一个智能新闻门户
7.1功能概览
7.2获取并清洗内容
7.2.1各就各位——预备——开抓!
7.2.2搜索预备知识回顾
7.2.3一个抓取并处理好的新闻数据集
7.3搜索新闻
7.4分配新闻类别
7.4.1顺序问题
7.4.2使用NewsProcessor类进行分类
7.4.3分类器
7.4.4分类策略:超越底层的分类
7.5用NewsProcessor类创建新闻分组
7.5.1聚类全部文章
7.5.2在一个新闻类别中聚类文章
7.6基于用户评分的动态内容展示
7.7总结
7.8ToDo
7.9参考资料
附录ABeanShell简介
附录B网络采集
附录C数学知识回顾
附录D自然语言处理
附录E神经网络
索引
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价