内容提要 本书是信息检索的教材,旨在从计算机科学的视角提供一种现代的信息检索方法。书中从基本概念讲解网络搜索以及文本分类和文本聚类等,对收集、索引和搜索文档系统的设计和实现的方方面面、评估系统的方法、机器学习方法在文本收集中的应用等给出了的讲解。 书中所有重要的思想都是用示例进行解释,图文并茂。本书非常适合作为计算机科学及相关专业的高年级本科生和研究生的“信息检索”课程的入门教材,当然也同样适合研究人员和专业人士阅读。 目录 1 Boolean retrieval 2 The term vocabulary and postings lists 3 Dictionaries and tolerant retrieval 4 Index construction 5 Index compression 6 Scoring, term weighting, and the vector space model 7 Computing scores in a complete search system 8 Evaluation in information retrieval 9 Relevance feedback and query expansion 10 XML retrieval 11 Probabilistic information retrieval 12 Language models for information retrieval 13 Text classification and Naive Bayes 14 Vector space classification 15 Support vector machines and machine learning on documents 16 Flat clustering 17 Hierarchical clustering 18 Matrix decompositions and latent semantic indexing 19 Web search basics 20 Web crawling and indexes 21 Link analysis Inde Bibliography 作者介绍