• ChatGPT原理、架构与实战,大预言模型算法、预训练、迁移和调优,畅销书(全2册) 刘聪 等 著 新华文轩网络书店 正版图书
21年品牌 40万+商家 超1.5亿件商品

ChatGPT原理、架构与实战,大预言模型算法、预训练、迁移和调优,畅销书(全2册) 刘聪 等 著 新华文轩网络书店 正版图书

人工智能 大模型技术工程师推荐阅读!实现从理论到实践的跨越 新华书店全新正版书籍

135.37 6.8折 198 全新

库存40件

江苏无锡
认证卖家担保交易快速发货售后保障

作者程戈刘聪杜振东涂铭沈盛宇

出版社其他

ISBN9782200059002

出版时间2024-05

版次1

装帧平装

开本16开

页数501页

定价198元

货号1203333615

上书时间2024-08-04

新华文轩网络书店

十四年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
新华文轩网络书店 全新正版书籍
商品描述
《ChatGPT原理与实战:大型语言模型的算法、技术和私有化》 赞誉  前言  第1章了解ChatGPT1  1.1ChatGPT的由来1  1.1.1什么是ChatGPT2  1.1.2ChatGPT的发展历史2  1.2ChatGPT的工作流程3  1.3ChatGPT用例3  1.3.1日常任务4  1.3.2编写代码5  1.3.3文本生成6  1.3.4办公自动化9  1.4本章小结10  第2章ChatGPT原理解构11  2.1背景知识11  2.1.1自然语言处理的发展历程12  2.1.2大型语言模型的发展历程14  2.2ChatGPT同类产品18  2.2.1BlenderBot 3.018  2.2.2LaMDA20  2.2.3Sparrow23  2.3ChatGPT的工作原理25  2.3.1预训练与提示学习阶段26  2.3.2结果评价与奖励建模阶段28  2.3.3强化学习与自我进化阶段28  2.4算法细节29  2.4.1标注数据29  2.4.2建模思路30  2.4.3存在的问题30  2.5关于ChatGPT的思考31  2.6本章小结32  第3章预训练语言模型33  3.1Transformer结构33  3.2基于Encoder结构的模型36  3.2.1BERT36  3.2.2RoBERTa39  3.2.3ERNIE40  3.2.4SpanBERT42  3.2.5MacBERT43  3.2.6ALBERT44  3.2.7NeZha45  3.2.8UniLM46  3.2.9GLM47  3.2.10ELECTRA48  3.3基于Decoder结构的模型49  3.3.1GPT49  3.3.2CPM51  3.3.3PaLM51  3.3.4OPT52  3.3.5Bloom53  3.3.6LLaMA54  3.4基于Encoder-Decoder结构的模型55  3.4.1MASS55  3.4.2BART56  3.4.3T557  3.5基于夸夸闲聊数据的UniLM  模型实战59  3.5.1项目简介59  3.5.2数据预处理模块59  3.5.3UniLM模型模块63  3.5.4模型训练模块65  3.5.5模型推理模块72  3.6本章小结76  第4章强化学习基础77  4.1机器学习的分类77  4.1.1有监督学习78  4.1.2无监督学习78  4.1.3强化学习79  4.2OpenAI Gym82  4.2.1OpenAI Gym API简介83  4.2.2环境简介84  4.3强化学习算法85  4.3.1Q-learning算法85  4.3.2SARSA算法87  4.3.3DQN算法89  4.3.4Policy Gradient算法93  4.3.5Actor-Critic算法95  4.4本章小结98  第5章提示学习与大型语言  模型的涌现99  5.1提示学习99  5.1.1什么是提示学习100  5.1.2提示模板设计100  5.1.3答案空间映射设计102  5.1.4多提示学习方法103  5.2上下文学习104  5.2.1什么是上下文学习104  5.2.2预训练阶段提升上下文  学习能力105  5.2.3推理阶段优化上下文  学习的效果107  5.3思维链108  5.4基于提示的文本情感分析实战113  5.4.1项目简介113  5.4.2数据预处理模块114  5.4.3BERT模型模块115  5.4.4模型训练模块118  5.4.5模型推理模块128  5.5本章小结131  第6章大型语言模型预训练132  6.1大型预训练模型简介132  6.2预训练模型中的分词器133  6.2.1BPE133  6.2.2WordPiece135  6.2.3Unigram136  6.2.4SentencePiece137  6.3分布式深度学习框架138  6.3.1并行范式简介139  6.3.2Megatron-LM145  6.3.3DeepSpeed147  6.3.4Colossal-AI149  6.3.5FairScale152  6.3.6ParallelFormers153  6.3.7OneFlow153  6.4基于大型语言模型的预训练实战155  6.4.1项目简介155  6.4.2数据预处理模块156  6.4.3执行模型训练159  6.5基于大型语言模型的信息   抽取实战168  6.5.1项目简介168  6.5.2数据预处理模块169  6.5.3Freeze微调模块172  6.5.4LoRA微调模块176  6.5.5P-Tuning v2微调模块181  6.6本章小结18

—  没有更多了  —

以下为对购买帮助不大的评价

新华文轩网络书店 全新正版书籍
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP