• 多模态大模型 算法、应用与微调
  • 多模态大模型 算法、应用与微调
21年品牌 40万+商家 超1.5亿件商品

多模态大模型 算法、应用与微调

89.25 7.5折 119 全新

库存33件

四川成都
认证卖家担保交易快速发货售后保障

作者刘兆峰 著

出版社机械工业出版社

ISBN9787111754886

出版时间2024-06

装帧平装

开本16开

定价119元

货号1203305070

上书时间2024-12-22

聚合博文书店

十年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
目录
前言

第一篇 算法原理

第1章 Transformer模型 2

1.1 Seq2Seq结构 2

1.1.1 分词器 2

1.1.2 编码器–解码器结构 6

1.1.3 注意力机制 9

1.1.4 实战:日期转换 13

1.2 Transformer模型介绍 18

1.2.1 位置编码 18

1.2.2 模型架构 24

1.2.3 标准化和残差连接 32

1.2.4 线性层和softmax层 36

1.2.5 损失函数 36

1.2.6 实战:日期转换 37

1.2.7 小结 45

1.3 ViT模型介绍 46

1.3.1 注意力机制在图像上的应用 47

1.3.2 ViT模型架构 48

1.3.3 大数据预训练 50

1.3.4 ViT模型训练实践 52

……

内容摘要
本书详尽地覆盖了多模态大模型的算法原理和应用实战,提供了丰富的微调技术细节和实际案例,适合对多模态大模型有兴趣的技术人员深入学习及应用。本书分为两篇:
算法原理篇 详细介绍了先进的深度学习模型,包括Transformer、GPT系列、深度生成模型,从基本架构、训练方法到特定应用,包括但不限于Seq2Seq结构、位置编码、注意力机制、残差连接、变分自编码器、GAN、ViT、CLIP、Stable Diffusion、各模型训练实践的知识点。此外,探讨了预训练模型的涌现能力、模型参数和通信数据量的估算,以及分布式训练的各种技术,如数据并行、模型并行和混合精度训练等。
应用实战篇 聚焦于深度学习模型的实际应用,特别是文本和图像生成,以及代码生成的应用实战。通过具体实战项目,如利用Stable Diffusion进行图像生成和Code Llama进行代码生成,提供了微调技术的详细细节,介绍了LangChain等大模型应用框架。

主编推荐
(1)内容权威:作者为一线的LLM研究及实践者,本书受到多位研究专家、科技公司管理者的好评及推荐。全面覆盖了多模态大模型的算法原理和应用实战,从基础到高级,涵盖Transformer、GPT系列、深度生成模型等前沿技术,详尽介绍了预训练模型、分布式训练等重要内容。 (2)质量可靠:书中包含丰富的项目案例。通过具体实战项目,如Stable Diffusion进行图像生成和Code Llama进行代码生成,展示了大模型的实际部署和优化过程,并强调了微调技术的细节,确保读者能够在实际操作中有效应用所学知识。 (3)收获切实:通过阅读本书,你将:1)深入了解多模态大模型的架构、原理及应用;2)掌握大模型的实际部署和优化技巧;3)获得详细的微调技术指导,提升在深度学习模型领域的实战能力和职业竞争力。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP