大模型RAG实战9787111761990
正版图书,可开发票,请放心购买。
¥
78.87
8.0折
¥
99
全新
库存8件
作者汪鹏//谷清水//卞龙鹏|
出版社机械工业
ISBN9787111761990
出版时间2024-09
装帧平装
开本其他
定价99元
货号32179436
上书时间2024-11-29
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
汪鹏<br/>资深NLP技术专家和AI技术专家,拥有多年NLP落地经验。擅长结合用户场景,针对性地设计图谱、问答、检索、多模态、AIGC等相关的算法和落地方案。在Kaggle获得多枚奖牌,等级master。拥有公众号“NLP前沿”。<br/>谷清水<br/>毕业于清华大学,有国内多家大厂工作经历,7年深度学习项目开发经验。在KDD-CUP等机器学习竞赛中多次获奖,持有多项发明专利。知乎ID:“战士金”。<br/>卞龙鹏<br/>某上市公司资深AI算法工程师,多年互联网一线工作经验,10年机器学习与数据挖掘经验。持多项发明专利,发表多篇SCI文章,主攻机器视觉、模式识别、自然语言处理。
目录
目 录?Contents<br />前 言<br />第一部分 基础<br />第1章 RAG与大模型应用 2<br />1.1 大模型应用的方向:RAG 2<br />1.1.1 什么是RAG 2<br />1.1.2 RAG与模型微调的对比 5<br />1.1.3 RAG带来的范式改变 5<br />1.2 为什么需要RAG 6<br />1.2.1 大模型的知识更新问题 6<br />1.2.2 大模型生成结果的不可解释性问题 8<br />1.2.3 大模型的数据泄露问题 8<br />1.2.4 大模型的训练成本问题 9<br />1.3 RAG的工作流程 9<br />1.3.1 数据准备 10<br />1.3.2 数据召回 11<br />1.3.3 答案生成 12<br />1.4 RAG的优缺点 12<br />1.4.1 RAG的优点 12<br />1.4.2 RAG的缺点 13<br />1.5 RAG的使用场景 14<br />1.6 RAG面临的挑战 16<br />1.6.1 LLM的伸缩法则与知识库<br />大小的关系 16<br />1.6.2 相似度搜索的性能问题 17<br />1.7 本章小结 19<br />第2章 语言模型基础 20<br />2.1 Transformer 20<br />2.1.1 词嵌入 24<br />2.1.2 编码器 35<br />2.1.3 解码器 39<br />2.1.4 解码头 41<br />2.2 自动编码器 41<br />2.2.1 ELMo 42<br />2.2.2 BERT 43<br />2.3 自回归模型 47<br />2.3.1 GPT 48<br />2.3.2 LLaMA 53<br />2.4 本章小结 56<br />第3章 文本召回模型 58<br />3.1 文本召回模型基础 58<br />3.2 稠密向量检索模型 61<br />3.2.1 SimCSE 61<br />3.2.2 SBERT 63<br />3.2.3 CoSENT 64<br />3.2.4 WhiteBERT 65<br />3.2.5 SGPT 66<br />3.3 稀疏向量检索模型 67<br />3.3.1 朴素词袋模型 67<br />3.3.2 TF-IDF 68<br />3.3.3 BM25 70<br />3.4 重排序模型 71<br />3.5 本章小结 72<br />第二部分 原理<br />第4章 RAG核心技术与优化方法 74<br />4.1 提示词工程 74<br />4.1.1 提示词工程基础 74<br />4.1.2 RAG场景下的提示词<br />设计 81<br />4.2 文本切块 83<br />4.2.1 固定大小文本切块 84<br />4.2.2 基于NLTK的文本切块 85<br />4.2.3 特殊格式文本切块 85<br />4.2.4 基于深度学习模型的文本<br />切块 86<br />4.3 向量数据库 87<br />4.3.1 Faiss 88<br />4.3.2 Milvus 92<br />4.3.3 Weaviate 93<br />4.3.4 Chroma 93<br />4.3.5 Qdrant 93<br />4.4 召回环节优化 94<br />4.4.1 短文本全局信息增强 94<br />4.4.2 召回内容上下文扩充 95<br />4.4.3 文本多向量表示 96<br />4.4.4 查询内容优化 98<br />4.4.5 召回文本重排序 101<br />4.4.6 多检索器融合 102<br />4.4.7 结合元数据召回 104<br />4.5 效果评估 107<br />4.5.1 召回环节评估 107<br />4.5.2 模型回答评估 109<br />4.6 LLM能力优化 115<br />4.6.1 LLM微调 115<br />4.6.2 FLARE 117<br />4.6.3 Self-RAG 119<br />4.7 本章小结 120<br />第5章 RAG范式演变 121<br />5.1 基础RAG系统 121<br />5.1.1 基础流程 121<br />5.1.2 存在的问题 122<br />5.2 先进RAG系统 125<br />5.3 大模型主导的RAG系统 127<br />5.4 多模态RAG系统 131<br />5.5 本章小结 135<br />第6章 RAG系统训练 136<br />6.1 RAG系统的训练难点 136<br />6.2 训练方法 138<br />6.3 独立训练 138<br />6.4 序贯训练 139<br />6.4.1 冻结召回模块 140<br />6.4.2 冻结生成模块 141<br />6.5 联合训练 143<br />6.5.1 异步更新索引 143<br />6.5.2 批近似 147<br />6.6 本章小结 149<br />第三部分 实战<br />第7章 基于LangChain实现RAG<br />应用 152<br />7.1 LangChain基础模块 152<br />7.2 基于LangChain实现RAG 156<br />7.3 基于Streamlit搭建一个ChatPDF可视化应用 158<br />7.4 本章小结 161<br />第8章 RAG系统构建与微调<br />实战 162<br />8.1 向量模型构建 162<br />8.1.1 模型选型 162<br />8.1.2 训练数据构造 163<br />8.1.3 向量模型训练 166<br />8.1.4 向量模型联合训练 167<br />8.2 大模型指令微调 175<br />8.3 复杂问题处理 179<br />8.3.1 微调数据构造 180<br />8.3.2 微调数据处理 194<br />8.3.3 复杂问题推理处理 200<br />8.4 本章小结 203<br />
内容摘要
内容简介这是一本全面讲解RAG技术原理、实战应用与系统构建的著作。作者结合自身丰富的实战经验,详细阐述了RAG的基础原理、核心组件、优缺点以及使用场景,同时探讨了RAG在大模型应用开发中的变革与潜力。书中不仅揭示了RAG技术背后的数学原理,还通过丰富的案例与代码实现,引导读者从理论走向实践,轻松掌握RAG系统的构建与优化。无论你是深度学习初学者,还是希望提升RAG应用技能的开发者,本书都将为你提供宝贵的参考与指导。
通过阅读本书,你将掌握以下知识:?透彻理解RAG的召回和生成模块算法?高级RAG系统的技巧?RAG系统的各种训练方式方法?深入了解RAG的范式变迁
?实战0基础搭建RAG系统
?实战高级RAG系统微调与流程搭建
主编推荐
(1)作者经验丰富:3位作者在一线互联网大厂和上市公司又多年的AI技术经验和算法经验,是RAG领域的实践者和布道者。
(2)理论全面深入:系统梳理与大模型和RAG相关核心技术和优化方法,全面总结RAG的范式演变。
(3)内容实战导向:不仅讲解了各种RAG系统的训练方法,而且还讲解了如何从零搭建一个RAG系统以及RAG系统在大模型应用开发中的使用。
— 没有更多了 —
以下为对购买帮助不大的评价