• 大规模元搜索引擎技术
图书条目标准图
21年品牌 40万+商家 超1.5亿件商品

大规模元搜索引擎技术

16.59 2.4折 69 九品

仅1件

北京海淀
认证卖家担保交易快速发货售后保障

作者[美]孟卫一(Weiyi Meng) 著;朱亮 译

出版社机械工业出版社

出版时间2017-05

版次1

装帧平装

货号A16

上书时间2024-12-10

新起点书店

四年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九品
图书标准信息
  • 作者 [美]孟卫一(Weiyi Meng) 著;朱亮 译
  • 出版社 机械工业出版社
  • 出版时间 2017-05
  • 版次 1
  • ISBN 9787111556176
  • 定价 69.00元
  • 装帧 平装
  • 开本 16开
  • 纸张 胶版纸
  • 页数 143页
  • 丛书 大数据管理丛书
【内容简介】

   本书广泛而深入地介绍了大规模元搜索引擎技术,详细讨论了大规模元搜索引擎的主要部件——搜索引擎选择、搜索引擎加入和结果合并,重点关注部件的高度可扩展性和自动化解决方案。作为Web搜索的竞争技术,本书对大规模元搜索引擎技术的可行性进行了强有力的论证。本书可作为高等院校Web数据管理和信息检索等Web技术相关课程的教材,也可作为Web搜索领域的研究人员的参考书。

【作者简介】

   Weiyi Meng(孟卫一) 纽约州立大学宾汉姆顿分校计算机系教授,数据库实验室主席,IEEE ICTA国际会议程序委员会主席,美国元搜索引擎公司Webscalers创始人之一。孟卫一教授在互联网信息检索特别是元数据搜索引擎方面是国际公认的,取得多项研究成果并开发出可用的系统,现为人民大学客座教授。 
   Clement T. Yu 伊利诺伊大学芝加哥分校计算机科学教授。研究方向包括多媒体信息检索、元搜索引擎、数据管理等。

【目录】

丛书前言 
译者序 
前 言 
作者简介 
第1章 绪言 1 
1.1 Web上查找信息 3 
1.1.1 浏览 3 
1.1.2 搜索 4 
1.2 文本检索概述 7 
1.2.1 系统体系结构 7 
1.2.2 文档表示 8 
1.2.3 文档-查询匹配 9 
1.2.4 查询处理 11 
1.2.5 检索有效性度量 13 
1.3 搜索引擎技术概述 14 
1.3.1 Web的专门特性 14 
1.3.2 Web爬虫 15 
1.3.3 利用标签信息 17 
1.3.4 利用链接信息 18 
1.3.5 结果组织 23 
1.4 本书概述 25 
第2章 元搜索引擎体系结构 27 
2.1 系统体系结构 28 
2.2 为什么使用元搜索引擎技术 33 
2.3 挑战环境 39 
2.3.1 异构及其影响 40 
2.3.2 规范化研究 43 
第3章 搜索引擎选择 47 
3.1 粗糙表记方法 49 
3.2 基于学习的方法 50 
3.3 基于样本文档的方法 55 
3.4 统计表记方法 59 
3.4.1 D-WISE 59 
3.4.2 CORINet 61 
3.4.3 gGlOSS 63 
3.4.4 潜在有用文档数目 65 
3.4.5 最相似文档的相似度 68 
3.4.6 搜索引擎表记生成 72 
第4章 搜索引擎加入 77 
4.1 搜索引擎连接 77 
4.1.1 搜索引擎的HTML表单标签 78 
4.1.2 搜索引擎自动连接 81 
4.2 搜索结果抽取 86 
4.2.1 半自动包装器生成 88 
4.2.2 自动包装器生成 93 
第5章 结果合并 108 
5.1 基于完全文档内容的合并 111 
5.2 基于搜索结果记录的合并 113 
5.3 基于结果本地排序的合并 119 
5.3.1 基于轮转的方法 120 
5.3.2 基于相似度转换的方法 121 
5.3.3 基于投票的方法 124 
5.3.4 基于机器学习的方法 130 
第6章 总结与后续研究 132 
参考文献 136

点击展开 点击收起

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP