大语言模型应用指南:以ChatGPT为起点从入门到精通的AI实践教程(全彩)9787121475986
正版图书,可开发票,请放心购买。
¥
89.04
7.5折
¥
118
全新
库存4件
作者万俊|
出版社电子工业
ISBN9787121475986
出版时间2024-05
装帧平装
开本其他
定价118元
货号32047402
上书时间2024-11-22
商品详情
- 品相描述:全新
- 商品描述
-
目录
第1篇 基础
第1章 从人工智能的起源到大语言模型2
1.1 人工智能的起源2
1.1.1 机器能思考吗2
1.1.2 达特茅斯会议3
1.2 什么是机器学习4
1.2.1 演绎推理与归纳推理4
1.2.2 人工编程与自动编程5
1.2.3 机器学习的过程5
1.2.4 机器学习的分类8
1.3 什么是神经网络9
1.3.1 还原论与涌现性9
1.3.2 神经网络的发展历史10
1.3.3 神经网络基础11
1.3.4 神经网络的三要素13
1.4 自然语言处理的发展历程17
1.4.1 什么是自然语言处理17
1.4.2 文本的向量化18
1.4.3 神经网络中的自监督学习21
1.5 大语言模型24
1.5.1 什么是大语言模型24
1.5.2 语言模型中的token25
1.5.3 自回归模型与文本生成33
1.5.4 统一自然语言任务41
1.5.5 大语言模型的训练过程44
1.5.6 大语言模型的局限性46
第2篇 入门
第2章 交互格式50
2.1 Completion交互格式50
2.2 ChatML交互格式52
2.3 Chat Completion交互格式54
第3章 提示工程57
3.1 什么是提示工程57
3.2 提示的构成58
3.3 提示的基础技巧62
3.3.1 在提示的末尾重复关键指令63
3.3.2 使用更清晰的语法63
3.3.3 尽量使用示例65
3.3.4 明确要求大语言模型回复高质量的响应65
3.4 Chat Completion交互格式中的提示65
3.5 提示模板与多轮对话69
第4章 工作记忆与长短期记忆72
4.1 什么是工作记忆72
4.2 减轻工作记忆的负担74
4.2.1 Chain-of-Thought74
4.2.2 Self-Consistency76
4.2.3 Least-to-Most76
4.2.4 Tree-of-Tought和Graph -of-Tought79
4.2.5 Algorithm-of-Tought85
4.2.6 Chain-of-Density88
4.3 关于大语言模型的思考能力90
4.4 长短期记忆91
4.4.1 什么是记忆91
4.4.2 短期记忆92
4.4.3 长期记忆105
第5章 外部工具122
5.1 为什么需要外部工具122
5.2 什么是外部工具122
5.3 使用外部工具的基本原理124
5.4 基于提示的工具126
5.4.1 Self-ask 框架126
5.4.2 ReAct 框架128
5.4.3 改进ReAct框架134
5.5 基于微调的工具137
5.5.1 Toolformer137
5.5.2 Gorilla140
5.5.3 function calling141
第6章 ChatGPT接口与扩展功能详解149
6.1 OpenAI大语言模型简介149
6.2 ChatGPT扩展功能原理151
6.2.1 网页实时浏览152
6.2.2 执行Python代码153
6.2.3 图像生成154
6.2.4 本地文件浏览157
6.3 Chat Completion接口参数详解158
6.3.1 模型响应返回的参数158
6.3.2 向模型发起请求的参数159
6.4 Assistants API162
6.4.1 工具162
6.4.2 线程163
6.4.3 运行163
6.4.4 Assistants API整体执行过程164
6.5 GPTs与GPT商店164
6.5.1 GPTs功能详解165
6.5.2 GPT商店介绍172
6.5.3 案例:私人邮件助手174
第3篇 进阶
第7章 无梯度优化184
7.1 单步优化184
7.2 强化学习入门188
7.3 多步优化中的预测191
7.4 多步优化中的训练194
7.5 多步优化中的训练和预测201
第8章 自主Agent系统210
8.1 自主Agent系统简介210
8.2 自主Agent系统的基本组成211
8.3 自主Agent系统案例分析(一)213
8.3.1 BabyAGI213
8.3.2 AutoGPT216
8.3.3 BeeBot221
8.3.4 Open Interpreter228
8.3.5 MemGPT232
8.4 自主Agent系统案例分析(二)243
8.4.1 CAMEL243
8.4.2 ChatEval246
8.4.3 Generative Agents250
第9章 微调262
9.1 三类微调方法262
9.2 Transformer解码器详解264
9.2.1 Transformer的原始输入264
9.2.2 静态编码和位置编码264
9.2.3 Transformer层265
9.3 高效参数微调268
9.3.1 Adapter高效微调268
9.3.2 Prompt高效微调269
9.3.3 LoRA高效微调272
9.3.4 高效微调总结274
9.4 微调RAG框架275
9.4.1 RAG框架微调概述275
9.4.2 数据准备和参数微调276
9.4.3 效果评估276
第10章 大语言模型的安全技术280
10.1 提示注入攻击280
10.1.1 攻击策略281
10.1.2 防御策略284
10.2 越狱攻击与数据投毒285
10.2.1 冲突的目标与不匹配的泛化285
10.2.2 对抗样本286
10.2.3 数据投毒289
10.3 幻觉和偏见问题292
10.4 为大语言模型添加水印294
第4篇 展望
第11章 大语言模型的生态与未来298
11.1 多模态大语言模型298
11.1.1 什么是多模态298
11.1.2 GPT-4V简介300
11.1.3 Gemini简介303
11.2 大语言模型的生态系统308
11.3 大语言模型的第一性原理:尺度定律311
11.3.1 什么是尺度定律312
11.3.2 尺度定律的性质313
11.3.3 尺度定律的未来320
11.4 通向通用人工智能:压缩即智能321
11.4.1 编码与无损压缩322
11.4.2 自回归与无损压缩331
11.4.3 无损压缩的极限336
11.5 图灵机与大语言模型:可计算性与时间复杂度342
11.5.1 图灵机与神经网络342
11.5.2 智能的可计算性346
11.5.3 逻辑推理的时间复杂度349
参考文献352
内容摘要
本书是一本对人工智能小白读者非常友好的大语言模型应用指南,有两大特点:一是以通俗易懂的方式解释复杂概念,通过实例和案例讲解大语言模型的工作原理和工作流程、基本使用方法,包括大语言模型常用的三种交互格式、提示工程、工作记忆与长短期记忆,以及外部工具等,使读者能够全面了解和掌握这一优选技术的应用和二次开发;二是紧跟当前大语言模型技术的更新动态,介绍GPTs的创建,以GPT-4V和Gemini为例讲述多模态模型的应用,还包括无梯度优化、自主Agent系统、大语言模型微调、RAG框架微调、大语言模型安全技术等。无论是学术研究者、工程师,还是对大语言模型感兴趣的普通读者,都可以通过本书获得大语言模型的前沿研究成果、技术进展和应用案例,从而更好地应用大语言模型解决实际问题。
— 没有更多了 —
以下为对购买帮助不大的评价