• Elasticsearch实战
21年品牌 40万+商家 超1.5亿件商品

Elasticsearch实战

13.25 1.7折 79 九五品

仅1件

北京通州
认证卖家担保交易快速发货售后保障

作者拉杜·乔戈(RaduGheorghe),马修·李·欣曼(Ma

出版社人民邮电出版社

ISBN9787115449153

出版时间2018-10

版次1

装帧平装

开本16开

纸张胶版纸

页数337页

字数99999千字

定价79元

上书时间2024-12-17

纵列風

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九五品
商品描述
基本信息
书名:Elasticsearch实战
定价:79.00元
作者:拉杜·乔戈(RaduGheorghe),马修·李·欣曼(Matthe
出版社:人民邮电出版社
出版日期:2018-10-01
ISBN:9787115449153
字数:608000
页码:337
版次:1
装帧:平装
开本:16开
商品重量:
编辑推荐
现代搜索看起来好像很神奇——在搜索引擎中键入几个单词,搜索引擎看上去就好像知道你想要什么。有了Elasticsearch实时搜索和分析引擎,无需进行复杂的底层编程,也无需理解高级的数据科学算法,你就可以为用户提供这种神奇的体验。你只要安装它,调试它,就可以继续你的工作了。本书将教读者编写提供专业的高质量搜索的应用程序的方法。随着阅读的深入,读者将学会为任何应用程序添加基本的搜索特性,通过预测性分析和相关性排序来增强搜索结果,并使用之前搜索中保存的数据为用户提供定制化的体验。这本实战型的书籍聚焦在使用HTTP协议的Elasticsearch REST API。代码片段的书写多数是使用cURL的bash脚本,所以很容易翻译成其他编程语言。本书主要内容.什么是良好的搜索应用?.打造可扩展的搜索解决方案。.通过任何语言使用Elasticsearch 。.配置和调优。对于构建并管理面向搜索的应用程序而言,本书是程序开发者和系统管理员的选择。
内容提要
本书主要展示如何使用Elasticsearch构建可扩展的搜索应用程序。书中覆盖了Elasticsearch的主要特性,从使用不同的分析器和查询类型进行相关性调优,到使用聚集功能进行实时性分析,还有地理空间搜索和文档过滤等更多吸引人的特性。全书共分两个部分,部分解释了核心特性,内容主要涉及Elasticsearch的介绍,数据的索引、更新和删除,数据的搜索,数据的分析,使用相关性进行搜索,使用聚集来探索数据,文档间的关系等;第二部分介绍每个特性工作的更多细节及其对性能和可扩展性的影响,以便对核心功能进行产品化,内容主要涉及水平扩展和性能提升等。此外,本书还有6个附录(网上下载),提供了读者应该知道的特性,展示了关于地理空间搜索和聚集,如何管理Elasticsearch插件,学习在搜索结果中如何高亮查询单词,在生产环境中用来协助管理Elasticsearch的第三方的监控工具有哪些,如何使用Percolator过滤为多个查询匹配少量文档,如何使用不同的建议器来实现自动完成的功能。
目录
部分第1章 Elasticsearch介绍 21.1 用Elasticsearch解决搜索问题 31.1.1 提供快速查询 31.1.2 确保结果的相关性 41.1.3 精确匹配 51.2 探索典型的Elasticsearch使用案例 61.2.1 将Elasticsearch作为主要的后端系统 71.2.2 将Elasticsearch添加到现有的系统 71.2.3 将Elasticsearch和现有工具一同使用 81.2.4 Elasticsearch的主要特性 101.2.5 扩展Lucene的功能 101.2.6 在Elasticsearch中组织数据 121.2.7 安装Java语言 121.2.8 下载并启动Elasticsearch 131.2.9 验证是否工作 141.3 小结 16第2章 深入功能 172.1 理解逻辑设计:文档、类型和索引 182.1.1 文档 192.1.2 类型 202.1.3 索引 212.2 理解物理设计:节点和分片 212.2.1 创建拥有一个或多个节点的集群 222.2.2 理解主分片和副本分片 232.2.3 在集群中分发分片 252.2.4 分布式索引和搜索 262.3 索引新数据 272.3.1 通过cURL索引一篇文档 282.3.2 创建索引和映射类型 302.3.3 通过代码样例索引文档 312.4 搜索并获取数据 322.4.1 在哪里搜索 332.4.2 回复的内容 332.4.3 如何搜索 362.4.4 通过ID获取文档 392.5 配置Elasticsearch 402.5.1 在elasticsearch.yml中指定集群的名称 402.5.2 通过logging.yml指定详细日志记录 412.5.3 调整JVM设置 412.6 在集群中加入节点 422.6.1 启动第二个节点 432.6.2 增加额外的节点 442.7 小结 45第3章 索引、更新和删除数据 473.1 使用映射来定义各种文档 483.1.1 检索和定义映射 493.1.2 扩展现有的映射 503.2 用于定义文档字段的核心类型 513.2.1 字符串类型 523.2.2 数值类型 543.2.3 日期类型 553.2.4 布尔类型 563.3 数组和多字段 563.3.1 数组 563.3.2 多字段 573.4 使用预定义字段 583.4.1 控制如何存储和搜索文档 593.4.2 识别文档 613.5 更新现有文档 633.5.1 使用更新API 643.5.2 通过版本来实现并发控制 663.6 删除数据 693.6.1 删除文档 703.6.2 删除索引 713.6.3 关闭索引 723.6.4 重新索引样本文档 733.7 小结 73第4章 搜索数据 744.1 搜索请求的结构 754.1.1 确定搜索范围 754.1.2 搜索请求的基本模块 764.1.3 基于请求主体的搜索请求 784.1.4 理解回复的结构 814.2 介绍查询和过滤器DSL 824.2.1 match查询和term过滤器 824.2.2 常用的基础查询和过滤器 854.2.3 match查询和term过滤器 914.2.4 phrase_prefix查询 924.3 组合查询或复合查询 934.3.1 bool查询 934.3.2 bool过滤器 964.4 match和过滤器查询 984.4.1 range查询和过滤器 984.4.2 prefix查询和过滤器 994.4.3 wildcard查询 1004.5 使用过滤器查询字段的存在性 1024.5.1 exists过滤器 1024.5.2 missing过滤器 1024.5.3 将任何查询转变为过滤器 1034.6 为任务选择的查询 1044.7 小结 105第5章 分析数据 1065.1 什么是分析 1065.1.1 字符过滤 1075.1.2 切分为分词 1085.1.3 分词过滤器 1085.1.4 分词索引 1085.2 为文档使用分析器 1095.2.1 在索引创建时增加分析器 1095.2.2 在Elasticsearch的配置中添加分析器 1115.2.3 在映射中指定某个字段的分析器 1125.3 使用分析API来分析文本 1135.3.1 选择一个分析器 1145.3.2 通过组合即兴地创建分析器 1155.3.3 基于某个字段映射的分析 1155.3.4 使用词条向量API来学习索引词条 1165.4 分析器、分词器和分词过滤器 1175.4.1 内置的分析器 1175.4.2 分词器 1195.4.3 分词过滤器 1225.5 N元语法、侧边N元语法和滑动窗口 1285.5.1 一元语法过滤器 1285.5.2 二元语法过滤器 1295.5.3 三元语法过滤器 1295.5.4 设置min_gram和max_gram 1295.5.5 侧边N元语法过滤器 1295.5.6 N元语法的设置 1305.5.7 滑动窗口分词过滤器 1315.6 提取词干 1325.6.1 算法提取词干 1335.6.2 使用字典提取词干 1335.6.3 重写分词过滤器的词干提取 1345.7 小结 134第6章 使用相关性进行搜索 1366.1 Elasticsearch的打分机制 1376.1.1 文档打分是如何运作的 1376.1.2 词频 1376.1.3 逆文档频率 1386.1.4 Lucene评分公式 1386.2 其他打分方法 1396.3 boosting 1416.3.1 索引期间的boosting 1426.3.2 查询期间的boosting 1426.3.3 跨越多个字段的查询 1436.4 使用“解释”来理解文档是如何被评分的 1446.5 使用查询再打分来减小评分操作的性能影响 1476.6 使用function_score来定制得分 1486.6.1 weight函数 1496.6.2 合并得分 1506.6.3 field_value_factor函数 1516.6.4 脚本 1526.6.5 随机 1526.6.6 衰减函数 1536.6.7 配置选项 1556.7 尝试一起使用它们吧 1566.8 使用脚本来排序 1576.9 字段数据 1586.9.1 字段数据缓存 1586.9.2 字段数据用在哪里 1596.9.3 管理字段数据 1606.10 小结 163第7章 使用聚集来探索数据 1647.1 理解聚集的具体结构 1667.1.1 理解聚集请求的结构 1667.1.2 运行在查询结果上的聚集 1687.1.3 过滤器和聚集 1697.2 度量聚集 1707.2.1 统计数据 1717.2.2 高级统计 1727.2.3 近似统计 1737.3 多桶型聚集 1767.3.1 terms聚集 1777.3.2 range聚集 1837.3.3 histogram聚集 1857.4 嵌套聚集 1877.4.1 嵌套多桶聚集 1897.4.2 通过嵌套聚集获得结果分组 1907.4.3 使用单桶聚集 1927.5 小结 196第8章 文档间的关系 1978.1 定义文档间关系的选项概览 1978.1.1 对象类型 1988.1.2 嵌套类型 2008.1.3 父子关系 2008.1.4 反规范化 2008.2 将对象作为字段值 2028.2.1 映射和索引对象 2038.2.2 在对象中搜索 2048.3 嵌套类型:联结嵌套的文档 2068.3.1 映射并索引嵌套文档 2078.3.2 搜索和聚集嵌套文档 2108.4 父子关系:关联分隔的文档 2168.4.1 子文档的索引、更新和删除 2188.4.2 在父文档和子文档中搜索 2208.5 反规范化:使用冗余的数据管理 2278.5.1 反规范化的使用案例 2288.5.2 索引、更新和删除反规范化的数据 2308.5.3 查询反规范化的数据 2338.6 应用端的连接 2348.7 小结 235第二部分第9章 向外扩展 2389.1 向Elasticsearch集群加入节点 2389.2 发现其他Elasticsearch节点 2419.2.1 通过广播来发现 2419.2.2 通过单播来发现 2429.2.3 选举主节点和识别错误 2439.2.4 错误的识别 2449.3 删除集群中的节点 2459.4 升级Elasticsearch的节点 2509.4.1 进行轮流重启 2509.4.2 化重启后的恢复时间 2519.5 使用_cat API 2529.6 扩展策略 2549.6.1 过度分片 2549.6.2 将数据切分为索引和分片 2559.6.3 化吞吐量 2569.7 别名 2579.7.1 什么是别名 2589.7.2 别名的创建 2599.8 路由 2619.8.1 为什么使用路由 2619.8.2 路由策略 2629.8.3 使用_search_shards API来决定搜索在哪里执行 2639.8.4 配置路由 2659.8.5 结合路由和别名 2659.9 小结 267第10章 提升性能 26810.1 合并请求 26910.1.1 批量索引、更新和 删除 26910.1.2 多条搜索和多条获取 API接口 27310.2 优化Lucene分段的 处理 27610.2.1 刷新和冲刷的阈值 27610.2.2 合并以及合并策略 27910.2.3 存储和存储限流 28210.3 充分利用缓存 28510.3.1 过滤器和过滤器 缓存 28510.3.2 分片查询缓存 29110.3.3 JVM堆和操作系统 缓存 29310.3.4 使用预热器让缓存 热身 29610.4 其他的性能权衡 29710.4.1 大规模的索引还是 昂贵的搜索 29810.4.2 调优脚本,要么 别用它 30110.4.3 权衡网络开销,更少的 数据和更好的分布式 得分 30510.4.4 权衡内存,进行深度 分页 30810.5 小结 310第11章 管理集群 31111.1 改善默认的配置 31111.1.1 索引模板 31211.1.2 默认的映射 31511.2 分配的感知 31811.2.1 基于分片的分配 31811.2.2 强制性的分配感知 31911.3 监控瓶颈 32011.3.1 检查集群的健康 状态 32011.3.2 CPU:慢日志、热线程和 线程池 32211.3.3 内存:堆的大小、字段和 过滤器缓存 32611.3.4 操作系统缓存 33011.3.5 存储限流 33011.4 备份你的数据 33111.4.1 快照API 33111.4.2 将数据备份到共享的文件系统 33211.4.3 从备份中恢复 33511.4.4 使用资料库插件 33611.5 小结 337附录A 处理地理空间的数据(网上下载)附录B 插件(网上下载)附录C 高亮(网上下载)附录D Elasticsearch的监控插件(网上下载)附录E 使用渗滤器将搜索颠倒过来(网上下载)附录F 为自动完成和“您是指”功能使用建议器(网上下载)
作者介绍
作者简介拉杜 乔戈(Radu Gheorghe)是搜索技术顾问和软件工程师。马修 李 欣曼(Matthew Lee Hinman)开发过基于云的高可用系统。罗伊 罗素(Roy Russo)是预测分析方面的专家。译者简介黄申博士,现任LinkedIn(领英)资深数据科学家,毕业于上海交通大学计算机科学与工程专业,师从俞勇教授。微软学者、IBM ExtremeBlue天才计划成员。长期专注于大数据相关的搜索、推荐、广告以及用户精准化领域。曾在微软亚洲研究院、eBay中国、沃尔玛1号店(现京东1号店)和大润发飞牛网担任要职,带团队完成了若干公司级的战略项目。同时在国际上发表20多篇论文,并拥有10多项国际专利。《计算机工程》特邀审稿专家,2016年出版了《大数据架构商业之路》一书,广受好评。因对业界做出贡献,获得美国政府颁发的“美国杰出人才”称号。
序言

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP