多模态大模型:算法、应用与微调
¥
69.8
5.9折
¥
119
全新
仅1件
作者刘兆峰
出版社机械工业出版社
出版时间2024-06
版次1
装帧平装
货号9787111754886
上书时间2024-11-05
商品详情
- 品相描述:全新
图书标准信息
-
作者
刘兆峰
-
出版社
机械工业出版社
-
出版时间
2024-06
-
版次
1
-
ISBN
9787111754886
-
定价
119.00元
-
装帧
平装
-
开本
16开
-
页数
416页
-
字数
593千字
- 【内容简介】
-
本书详尽地覆盖了多模态大模型的算法和应用实战,提供了丰富的微调技术细节和实际案例,适合对多模态大模型有兴趣的技术人员深入学及应用。本书分为两篇:
算法篇 详细介绍了优选的深度学模型,包括tranformer、gpt系列、深度生成模型,从基本架构、训练方法到特定应用,包括但不限于eq2eq结构、位置编码、注意力机制、残差连接、变分自、gan、vit、clip、table diffuion、各模型训练实践的知识点。此外,探讨了预训练模型的涌现能力、模型参数和通信数据量的估算,以及分布式训练的各种技术,如数据并行、模型并行和混合精度训练等。
应用实战篇 聚焦于深度学模型的实际应用,特别是文本和图像生成,以及代码生成的应用实战。通过具体实战项目,如利用table diffuion进行图像生成和code llama进行代码生成,提供了微调技术的详细细节,介绍了langchain等大模型应用框架。
- 【目录】
-
前言
篇 算法
章 transformer模型 2
1.1 seq2seq结构 2
1.1.1 分词器 2
1.1.2 –结构 6
1.1.3 注意力机制 9
1.1.4 实战:期转换 13
1.2 transformer模型介绍 18
1.2.1 位置编码 18
1.2.2 模型架构 24
1.2.3 标准化和残差连接 32
1.2.4 线层和softmax层 36
1.2.5 损失函数 36
1.2.6 实战:期转换 37
1.2.7 小结 45
1.3 vit模型介绍 46
1.3.1 注意力机制在图像上的应用 47
1.3.2 vit模型架构 48
1.3.3 大数据预训练 50
1.3.4 vit模型训练实践 52
……
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价