• 【正版9新】 搜索引擎 9787111282471 【消毒塑封】
21年品牌 40万+商家 超1.5亿件商品

【正版9新】 搜索引擎 9787111282471 【消毒塑封】

【消毒塑封 】 【正版9新】

14.1 3.1折 45 九五品

库存2件

浙江杭州
认证卖家担保交易快速发货售后保障

作者(美)克罗夫特

出版社机械工业出版社

ISBN9787111282471

出版时间2009-10

装帧平装

开本其他

定价45元

货号9787111282471

上书时间2024-11-23

浅秋书社

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九五品
商品描述
作者简介
W.Bruce Croft马萨诸塞大学阿默斯特分校计算机科学特聘教授、ACM会士。他创建了智能信息检索研究中心,发表了200余篇论文,多次获奖,其中包括2003年由ACM SIGIR颁发的Gerard Salton奖。

目录
1 Search Engines and Information Retrieval
  1.1 What Is Information Retrieval?
  1.2 The Big Issues
  1.3 Search Engines
  1.4 Search Engineers
2 Architecture of a Search Engine
  2.1 What Is an Architecture ?
  2.2 Basic Building Blocks
  2.3 Breaking It Down
2.3.1 Text Acquisition
    2.3.2 Text Transformation
    2.3.3 Index Creation
    2.3.4 User Interaction
    2.3.5 Ranking
    2.3.6 Evaluation
  2.4 How Does It Really Work?
3 Crawls and Feeds
  3.1 Deciding What to Search
  3.2 Crawling the Web
    3.2.1 Retrieving Web Pages
    3.2.2 The Web Crawler
    3.2.3 Freshness
    3.2.4 Focused Crawling
    3.2.5 Deep Web
   3.2.6 Sitemaps
   3.2.7 Distributed Crawling
3.3 Crawling Documents and Email
3.4 Document Feeds
3.5 The Conversion Problem
   3.5.1 Character Encodings
3.6 Storing the Documents
   3.6,1 Using a Database System
   3.6.2 Random Access
   3.6.3 Compression and Large Files
   3.6.4 Update
   3.6.5 BigTable
  3.7 Detecting Duplicates
  3.8 Removing Noise
4 Processing Text
  4.1 From Words to Terms
  4.2 Text Statistics
   4.2.1 Vocabulary Growth
   4.2.2 Estimating Collection and Result Set Sizes
4.3 Document Parsing
   4.3.1 Overview
   4.3.2 Tokenizing
   4.3.3 Stopping
   4.3.4 Stemming
   4.3.5 Phrases and N-grams
4.4 Document Structure and Markup
4.5 Link Analysis
   4.5.1 Anchor Text
   4.5.2 PageRank
   4.5.3 Link Quality
4.6 Information Extraction
   4.6.1 Hidden Markov Models for Extraction
4.7 Internationalization
5 Ranking with Indexes
6 Queries and Interfaces
7 Retrieval Models
8 Evaluating Search Engines
9 Classification and Clustering
10 So Search
11 Beyond Bag of Words
Reverences
Index

内容摘要
本书介绍了信息检索(1r)中的关键问题。以及这些问题如何影响搜索引擎的设计与实现,并且用数学模型强化了重要的概念。对于网络搜索引擎这一重要的话题,书中主要涵盖了在网络上广泛使用的搜索技术。
本书适用于高等院校计算机科学或计算机工程专业的本科生、研究生,对于专业人士而言,本书也不失为一本理想的入门教材。

精彩内容
    I. I What Is Information Retrieval?

    This book is designed to help people understand search engines, evaluate and compare them, and modify them for specific applications. Searching for information on the Web is, for most people, a daily activity. Search and communication are by far the most popular uses of the computer. Not surprisingly, many people in companies and universities are trying to improve search by coming up with easier and faster ways to find the right information. These people, whether they call themselves computer scientists, software engineers, information scientists, search engine optimizers, or something else, are working in the field of Information Retrieval.1 So, before we launch into a detailed journey through the internals of search engines, we will take a few pages to provide a context for the rest of the book.

    Gerard Salton, a pioneer in information retrieval and one of the leading figures from the 1960s to the 1990s, proposed the following definition in his classic 1968 textbook (Salton, 1968):

    Information retrieval is a field concerned with the structure, analysis, organization, storage, searching, and retrieval of information.

    Despite the huge advances in the understanding and technology of search in the past 40 years, this definition is still appropriate and accurate. The term "informa……

    ……

    

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP