解构大语言模型:从线 回归到通用人工智能
新华书店全新正版书籍图书 保证_可开发票_极速发货支持7天无理由
¥
75.9
4.8折
¥
159
全新
库存6件
作者唐亘|
出版社电子工业
ISBN9787121477409
出版时间2024-05
装帧平装
开本其他
定价159元
货号32057964
上书时间2024-07-11
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
唐亘,数据科学家,专注于机器学习和大数据,热爱并积极参与ApacheSpark、Scikit-Learn等开源项目。作为讲师和技术顾问,为多家机构(包括惠普、华为、复旦大学等)提供百余场技术培训。
此前的工作和研究集中于经济和量化金融,曾参与经合组织(QECD)的研究项目并发表论文,并担任英国最大在线出版社Packt的技术审稿人。曾获得复旦大学的数学和计算机双学士学位、巴黎综合理工大学的金融硕士学位、法国国立统计与经济管理学校的数据科学硕士学位。
目录
第1章 绪论
1.1 是数字鹦鹉,还是自我意识
1.1.1 电车难题
1.1.2 任务分解
1.2 数据基础
1.3 模型结构
1.4 关于本书
第2章 数学基础:不可或缺的知识
2.1 向量、矩阵和张量
2.1.1 标量、向量、矩阵与张量
2.1.2 数学记号与特殊矩阵
2.1.3 矩阵运算
2.1.4 向量夹角
2.1.5 矩阵的秩
2.1.6 高维张量运算
2.2 概率
2.2.1 定义概率:事件和概率空间
2.2.2 条件概率:信息的价值
2.2.3 随机变量
2.2.4 正态分布:殊途同归
2.2.5 P-value:自信的猜测
2.3 微积分
2.3.1 导数和积分
2.3.2 极限
2.3.3 链式法则
2.3.4 偏导数与梯度
2.3.5 极值与最值
2.4 本章小结
第3章 线性回归:模型之母
3.1 一个简单的例子
3.1.1 机器学习的建模方式
3.1.2 统计分析的建模方式
3.2 模型实现
3.2.1 机器学习的代码实现
3.2.2 统计分析的代码实现
3.3 模型陷阱
3.3.1 过拟合:模型越复杂越好吗
3.3.2 假设检验:统计分析的解决方案
3.3.3 惩罚项:机器学习的解决方案
3.3.4 比较两种方案
3.4 面向未来的准备
3.4.1 图形表示与数学表达
3.4.2 模型的生命周期与持久化
3.5 本章小结
3.5.1 要点回顾
3.5.2 常见面试问题
第4章 逻辑回归:隐藏因子
4.1 二元分类问题:是与否
4.1.1 线性回归:为何失效
4.1.2 窗口效应:看不见的才是关键
内容摘要
本书从模型的结构和数据基础两个方面解构大语言模型,以便帮助读者理解和搭建类似ChatGPT的系统。在模型的结构方面,大语言模型属于深度神经网络,其设计核心是注意力机制,因此,本书涵盖了多层感知器、卷积神经网络和循环神经网络等经典模型。在模型的数据基础方面,本书既涉及模型训练的工程基础,如反向传播,又涉及数据的使用方式,如迁移学习、强化学习,以及传统的监督学习和无监督学习。此外,本书还阐述了如何从计量经济学和经典机器学习模型中汲取灵感,以提高模型的稳定性和可解释性。本书既适用于希望深入了解大语言模型、通过人工智能技术解决实际问题的读者,也适合作为高等院校计算机及相关专业的师生参考用书。
主编推荐
详解经典模型的核心结构及实现过程,重构ChatGPT。融合统计分析、机器学习、计量经济学等
— 没有更多了 —
以下为对购买帮助不大的评价