消息首页搜索举报

深入搜索引擎：海量信息的压缩、索引和查询

5 八五品

仅1件

河北沧州

认证卖家担保交易快速发货售后保障

作者[新]威顿（Witten I.H.）著；梁斌译

出版社电子工业出版社

出版时间2009-06

版次1

装帧平装

货号21

上书时间2024-07-01

燕园学海书社

十四年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 13小时
好评率暂无

最新上架

志愿者日文 ¥10.00

大空的武士 -- 不回头的零战队日文 ¥50.00

信长日文 ¥12.00

反逆(上、下) (講談社文庫，日文原版) ¥22.00

日文原版孙子浅野裕一孙子 ¥30.00

日文原版花森夏国 ¥30.00

信长之棺上下日文 ¥15.00

日文书安土往還記 (新潮文庫) 辻邦生 (著) ¥10.00

现代语译信长公记日文 ¥100.00

商品详情

品相描述：八五品

图书标准信息

作者 [新]威顿（Witten I.H.）著；梁斌译
出版社电子工业出版社
出版时间 2009-06
版次 1
ISBN 9787121084911
定价 79.00元
装帧平装
开本 16开
纸张胶版纸
页数 540页
字数 574千字
正文语种简体中文
原版书名 Managing Gigabytes: Compressing and Indexing Documents and Images

【内容简介】: 　　《深入搜索引擎：海量信息的压缩、索引和查询》是斯坦福大学信息检索和挖掘课程的首选教材之一，并已成为全球主要大学信息检索的主要教材。《深入搜索引擎：海量信息的压缩、索引和查询》理论和实践并重，深入浅出地给出了海量信息数据处理的整套解决方案，包括压缩、索引和查询的方方面面。其最大的特色在于不仅仅满足信息检索理论学习的需要，更重要的是给出了实践中可能面对的各种问题及其解决方法。
　　《深入搜索引擎：海量信息的压缩、索引和查询》作为斯坦福大学信息检索课程的教材之一，具有一定的阅读难度，主要面向信息检索专业高年级本科生和研究生、搜索引擎业界的专业技术人员和从事海量数据处理相关专业的技术人员。
【作者简介】: 　　IanH.Witten是新西兰Waikato大学计算系科学系教授，是ACM、新西兰皇家学会会员。是英国、美国、加拿大和新西兰的专业计算、信息检索和工程协会会员。他是《TheReactiveKeyboard》和《TextCompression》的作者之一，这两本书分别出版于1992年和1990年。各大会议和期刊论文都能看到他的论文。
　　AlistairMoffat是墨尔本大学计算科学系的副教授。在各大会议和期刊中发表了大量论文，这些论文包括的领域有：关于文本和图像压缩的算法和数据结构，字典和优先级队列的自适应数据结构，以及自适应搜索和排序算法。
　　TimothyC.Bell是Canterbury大学计算机科学系系主任。是出版于1990年的《TextCompression》一书的作者。在各大期刊和会议上发表了多篇论文，这些论文涉及文本和图像压缩，计算机和音乐，计算机教育等。
【目录】: 第1章概览
1.1文档数据库（DOCUMENTDATABASES）
1.2压缩（COMPRESSION）
1.3索引（INDEXES）
1.4文档索引
1.5MG海量文档管理系统
1.6进一步阅读
第2章文本压缩
2.1模型
2.2自适应模型
2.3哈夫曼编码
范式哈夫曼编码
计算哈夫曼编码长度
总结
2.4算术编码
算术编码是如何工作的
实现算术编码
保存累积计数
2.5符号模型
部分匹配预测
块排序压缩
动态马尔科夫压缩
基于单字的压缩
2.6字典模型
自适应字典编码器的LZ77系列
LZ77的Gzip变体
自适应字典编码器的LZ78系列
LZ78的LZW变体
2.7同步
创造同步点
自同步编码
2.8性能比较
压缩性能
压缩速度
其他性能方面的考虑
2.9进一步阅读
第3章索引
3.1样本文档集合
3.2倒排文件索引
3.3压缩倒排文件
无参模型（Nonparameterizedmodels）
全局贝努里模型
全局观测频率模型（Globalobservedfrequencymodel）
局部贝努里模型（LocalBernoullimodel）
有偏贝努里模型（SkewedBernoullimodel）
局部双曲模型（Localhyperbolicmodel）
局部观测频率模型（Localobservedfrequencymodel）
上下文相关压缩（Context-sensitivecompression）
3.4索引压缩方法的效果
3.5签名文件和位图
签名文件
位片签名文件（Bitslicedsignaturefiles）
签名文件分析
位图
签名文件和位图的压缩
3.6索引方法的比较
3.7大小写折叠、词根化和停用词
大小写折叠
词根化
影响索引长度的因素
停用词（stopword）
3.8进一步阅读
第4章查询
4.1访问字典的方法
访问数据结构
前端编码（Frontcoding）
最小完美哈希函数
完美哈希函数的设计
基于磁盘的字典存储
4.2部分指定的查询术语
字符串暴力匹配（Brute-forcestringmatching）
用n-gram索引
循环字典（Rotatedlexicon）
4.3布尔查询（BOOLEANQUERY）
合取查询（conjunctivequery）
术语处理顺序
随机访问和快速查找
分块倒排索引
非合取查询（Nonconjunctivequery）
4.4信息检索和排名
坐标匹配（Coordinatematching）
内积相似度
向量空间模型
4.5检索效果评价
召回率和精确率
召回率-精确率曲线
TREC项目208
万维网搜索（WorldWideWebSearching）
其他有效性评价方法
4.6余弦法实现
文档内频率
余弦值的计算方法
文档权重所需的内存
累加器内存
快速查询处理
按频率排序的索引
排序
4.7交互式检索
相关性反馈
概率模型
4.8分布式检索
4.9进一步阅读
第5章索引构造
第6章图像压缩
第7章文本图像
第8章混合图文
第9章系统实现
第10章信息爆炸
附录AMG系统指南
附录B新西兰图书馆

点击展开点击收起

— 没有更多了 —