• 大语言模型 基础与前沿
21年品牌 40万+商家 超1.5亿件商品

大语言模型 基础与前沿

正版新书 新华官方库房直发 可开电子发票

82.6 7.0折 118 全新

库存29件

江苏南京
认证卖家担保交易快速发货售后保障

作者熊涛

出版社人民邮电出版社

ISBN9787115634887

出版时间2024-04

版次1

装帧平装

开本16开

纸张胶版纸

页数260页

定价118元

货号SC:9787115634887

上书时间2024-09-18

文源文化

六年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
全新正版 提供发票
商品描述
作者简介:
熊涛,美国明尼苏达大学双城分校电子与计算机工程博士。曾在多家中美知名高科技公司担任高级管理职位和首席科学家,在人工智能的多个领域,包括大语言模型、图神经网络等从事研发和管理工作多年。
主编推荐:
内容丰富。本书全面且深入介绍了大语言模型及其前沿进展,适合所有需要了解这个领域或掌握这种方法与工具的科学家、工程师和学生参考。
内容紧贴前沿领域。大语言模型作为当前爆火的chatGPT背后的技术,受到广泛关注,预计未来将推动人工智能技术进一步发展。
深入浅出,理论与实践相结合。本书摒弃了纯理论的说教模式,从案例入手,采用庖丁解牛的方式帮助读者理解与认识大语言模型。
作者权威,大厂海外技术骨干。本书作者熊涛曾担任多家中美高科技公司的首席科学家,长期深耕人工智能领域,发表相关论文百余篇。
行业专家背书,包括清华大学教授陈文光、复旦大学浩清特聘教授漆远、阿里巴巴集团阿里云副总裁叶杰平、蚂蚁集团副总裁赵闻飙。
媒体评论:
尽管市面上关于大语言模型的文章和图书已有很多,但大多流于碎片化或应用技术介绍,很少能系统性地阐释大语言模型的基础原理。这本书很好地补充了这方面的内容。同时这本书还介绍了MoE、多模态模型等前沿技术,实为相关从业者的学习佳作。
——陈文光,清华大学教授,蚂蚁技术研究院院长

作为近期人工智能领域的关键进展之一,大语言模型引起了行业和社会的广泛关注。这本书系统地讲述了大语言模型的训练目标、模型架构、使用方法、并行训练,以及检索增强、稀疏模型设计、基于人的反馈的微调、视觉语言模型等高级话题。对于想要了解或掌握大语言模型的科研人员来说,这本书极具学习和参考价值。
——漆远,复旦大学浩清特聘教授,复旦大学人工智能创新与产业研究院院长

作为一部阐述大语言模型及其进展的著作,这本书既有广度又有深度,旨在为科学家、工程师以及对大语言模型感兴趣的高校学生提供一份全面且深入的学习和参考资料。鉴于大语言模型所引领的革新浪潮正以靠前的力度进入众多学科和行业,并展现出对未来长远影响的潜力,每一个渴求掌握优选技术动态并应用于实践的读者,均应当密切关注这一领域的进展,并积极探寻将大语言模型的前沿应用转化为实际价值的可能性。
——叶杰平,阿里巴巴集团阿里云副总裁

在数字化时代,这本书显得尤为重要。作者凭借深厚的学术背景和丰富的实践经验,深入探讨了大语言模型的理论基础、技术细节、研究成果,以及未来可能的发展方向。这本书不仅系统地介绍了大语言模型的基本概念和关键技术,而且深入分析了大语言模型在自然语言处理、机器翻译、内容生成等多个应用场景中的实际效果和潜在挑战。
对于希望深入了解人工智能和机器学习领域的人士而言,这本书是一份的参考资料。它不仅适合作为学术研究和专业开发的指南,也适合任何对未来科技发展充满好奇心的读者阅读。无论是这一领域的新手还是资深专家,你都将从中获益。
——赵闻飙,蚂蚁集团副总裁、大安全事业群总裁
内容简介:
本书深入阐述了大语言模型的基本概念和算法、研究前沿以及应用,涵盖大语言模型的广泛主题,从基础到前沿,从方法到应用,涉及从方法论到应用场景方方面面的内容。首先,本书介绍了人工智能领域的进展和趋势;其次,探讨了语言模型的基本概念和架构、Transformer、预训练目标和解码策略、上下文学习和轻量级微调、稀疏专家模型、检索增强型语言模型、对齐语言模型与人类偏好、减少偏见和有害性以及视觉语言模型等内容;最后,讨论了语言模型对环境的影响。

本书内容全面、系统性强,适合高年级本科生和研究生、博士后研究人员、讲师以及行业从业者阅读与参考。

目录:
第1章大语言模型:辩论、争议与未来发展方向1

1.1新时代的曙光1

1.2LLM有意识吗3

1.2.1理解LLM的层次结构3

1.2.2意识是否需要碳基生物学4

1.2.3具身化与落地4

1.2.4世界模型7

1.2.5沟通意图8

1.2.6系统性和全面泛化9

1.3未来发展方向10

1.4小结13

第2章语言模型和分词15

2.1语言建模的挑战16

2.2统计语言建模16

2.3神经语言模型18

2.4评估语言模型19

2.5分词19

2.5.1按空格分割20

2.5.2字符分词21

2.5.3子词分词21

2.5.4无分词器24

2.5.5可学习的分词25

2.6小结27

第3章Transformer29

3.1Transformer编码器模块29

3.2编码器-解码器架构31

3.3位置嵌入32

3.3.1绝对位置编码32

3.3.2相对位置编码34

3.4更长的上下文38

3.5外部记忆42

3.6更快、更小的Transformer45

3.6.1高效注意力45

3.6.2条件计算47

3.6.3搜索高效Transformer48

3.6.4在单个GPU上一天内训练一个语言模型49

3.7推理优化49

3.7.1推测解码49

3.7.2简化Transformer51

3.7.3修剪52

3.7.
...

—  没有更多了  —

以下为对购买帮助不大的评价

全新正版 提供发票
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP