• 大规模元搜索引擎技术
21年品牌 40万+商家 超1.5亿件商品

大规模元搜索引擎技术

正版新书 新华官方库房直发 可开电子发票

44.16 6.4折 69 全新

库存2件

江苏南京
认证卖家担保交易快速发货售后保障

作者(美)孟卫一(Weiyi Meng),(美)於德(Clement T.Yu) 著;朱亮 译

出版社机械工业出版社

ISBN9787111556176

出版时间2017-05

版次1

装帧精装

开本16开

纸张胶版纸

页数143页

定价69元

货号SC:9787111556176

上书时间2024-11-08

江苏读客文化

四年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
全新正版 提供发票
商品描述
作者简介:
孟卫一,纽约州立大学宾汉姆顿分校计算机系教授,数据库实验室,IEEEICTA靠前会议程序委员会,美国元搜索引擎公司Webscalers创始人之一。孟卫一教授在互联网信息检索特别是元数据搜索引擎方面是靠前认可的,取得多项研究成果并开发出可用的系统,现为人民大学客座教授。
於德,伊利诺伊大学芝加哥分校计算机科学教授。研究方向包括多媒体信息检索、元搜索引擎、数据管理等。
精彩内容:
‖丛书前言陈寅恪先生说:“一时代之学术,必有其新材料与新问题。取用此材料,以研求问题,则为此时代学术之新潮流。治学之士,得预于此潮流者,谓之预流(借用佛教初果之名)。其未得预者,谓之未入流。”对今天的信息技术而言,“新材料”即为大数据,而“新问题”则是产生于“新材料”之上的新的应用需求。    当下大数据技术发展变化日新月异,大数据应用已经遍及工业和社会生活方方面面,原有的数据管理理论体系与大数据产业应用之前的差距日益加大,而工业界对于大数据人才的需求却极剧增加。大数据专业人才的培养是新一轮科技较量的基础,高等院校承担着大数据人才培养的重任。因此大数据相关课程将逐渐成为国内高校计算机相关专业的重要课程。近来越来越多的院校急切地开设大数据方面的人才培养计划,以求占得“先机”。但纵观大数据人才培养课程体系尚不尽如人意,多是已有课程的“冷拼盘”,顶多是加点“调料”,原材料没有新鲜感。现阶段无论多么新多么好的人才培养计划,都只能在六七十年代编写的计算机知识体系上施教,无法把当下的大数据带给我们的新思维方式和知识体系传导给学生。    为此我们意识到,缺少基础性工作和原始积累,就难以培养符合工业界需要的大数据复合型和交叉型人才。因此急需在思维和理念方面进行转变,为现有的课程和知识体系按大数据应用需求进行延展和补充,加入新的可以因材施教的知识模块。每一位学者都有责任和义务去为此“增砖添瓦”。    在此背景下,我们策划和组织了这套大数据管理丛书,希望能够培养数据思维的理念,对原有数据管理知识体系进行完善和补充,面向新的技术热点,提出新的知识体系/知识点,拉近教材体系与大数据应用的距离,为受教者应对现代技术带来的大数据领域的新问题和挑战,扫除障碍。现时要求学者编写大部头
...
内容简介:
本书广泛而深入地介绍了大规模元搜索引擎技术,详细讨论了大规模元搜索引擎的主要部件——搜索引擎选择、搜索引擎加入和结果合并,重点关注部件的高度可扩展性和自动化解决方案。作为Web搜索的竞争技术,本书对大规模元搜索引擎技术的可行性进行了强有力的论证。本书可作为高等院校Web数据管理和信息检索等Web技术相关课程的教材,也可作为Web搜索领域的研究人员的参考书。
目录:
丛书前言
译者序
前言
作者简介
第1章绪言1
1.1Web上查找信息3
1.1.1浏览3
1.1.2搜索4
1.2文本检索概述7
1.2.1系统体系结构7
1.2.2文档表示8
1.2.3文档—查询匹配9
1.2.4查询处理11
1.2.5检索有效性度量13
1.3搜索引擎技术概述14
1.3.1Web的专门特性14
1.3.2Web爬虫15
1.3.3利用标签信息17
1.3.4利用链接信息18
1.3.5结果组织23
1.4本书概述25
第2章元搜索引擎体系结构27
2.1系统体系结构28
2.2为什么使用元搜索引擎技术33
2.3挑战环境39
2.3.1异构及其影响40
2.3.2规范化研究43
第3章搜索引擎选择47
3.1粗糙表记方法49
3.2基于学习的方法50
3.3基于样本文档的方法55
3.4统计表记方法59
3.4.1D—WISE59
3.4.2CORINet61
3.4.3gGlOSS63
3.4.4潜在有用文档数目65
3.4.5最相似文档的相似度68
3.4.6搜索引擎表记生成72
第4章搜索引擎加入77
4.1搜索引擎连接77
4.1.1搜索引擎的HTML表单标签78
4.1.2搜索引擎自动连接81
4.2搜索结果抽取86
4.2.1半自动包装器生成88
4.2.2自动包装器生成93
第5章结果合并108
5.1基于接近文档内容的合并111
5.2基于搜索结果记录的合并113
5.3基于结果本地排序的合并119
5.3.1基于轮转的方法120
5.3.2基于相似度转换的方法121
5.3.3基于投票的方法124
5.3.4基于机器学习的方法130
第6章总结与后续研究132
参考文献136

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

全新正版 提供发票
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP