多模态大模型 新一代人工智能技术范式
全新正版 极速发货
¥
78.11
6.6折
¥
119
全新
库存15件
作者刘阳,林惊
出版社电子工业出版社
ISBN9787121475474
出版时间2024-04
装帧平装
开本16开
定价119元
货号1203246581
上书时间2024-11-13
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
"刘阳
中山大学计算机学院副研究员,中山大学人机物智能融合实验室(HCP-Lab)骨干成员。主要研究方向为多模态认知理解、因果推理和具身智能。截至2023年12月,在IEEE T-PAMI、T-IP、ICCV、ACM MM等期刊和会议上发表论文30余篇,2篇论文入选ESI高被引和热点论文。提出的视觉-语言因果推理开源框架CausalVLR受到国内外广泛关注。主持多项重量、省部级科研项目,作为课题骨干参与国家人工智能重大专项。获得2023年中国软件大会“达闼杯”机器人大模型与具身智能挑战赛优胜奖,广东省第三届计算机科学青年学术秀一等奖。
林倞
人工智能领域国际著名学者(IEEE Fellow、IAPR Fellow、IET Fellow)、鹏城实验室多智能体与具身智能研究所所长、中山大学二级教授、国家杰出青年科学基金获得者、国家人工智能重大专项首席科学家;在多模态认知计算、生成式模型、具身交互与学习等领域形成一系列突破创新成果。截至2023年10月,发表论文400余篇(含T-PAMI论文40余篇),论文被引用30000余次(谷歌学术统计),5次获得很好论文奖。获黑龙江省自然科学奖一等奖、吴文俊人工智能奖(自然科学类)、中国图象图形学学会科学技术奖一等奖等荣誉;指导学生获得CCF优秀博士论文奖、ACM China优秀博士论文奖及CAAI优秀博士论文奖。带领团队坚持产学研结合的科技创新思路,曾任商汤科技研究院执行院长,孵化新一代人工智能领军企业拓元智慧。在企业数智化、元宇宙、智慧城市等领域形成了具有广泛影响力的商业化产品和项目。"
目录
1大模型全家桶
1.1多模态大模型基本概念
1.1.1多模态
1.1.2大模型和基础模型
1.1.3多模态大模型
1.2BERT技术详解
1.2.1模型结构
1.2.2预训练任务
1.2.3下游应用场景
1.3ViT技术详解
1.3.1模型结构
1.3.2预训练任务
1.4GPT系列
1.4.1GPT-1结构详解
1.4.2GPT-2结构详解
1.4.3GPT-3结构详解
1.5ChatGPT简介
1.5.1InstructGPT
1.5.2ChatGPT
1.5.3多模态GPT-4V
1.6中英双语对话机器人ChatGLM
1.6.1ChatGLM-6B模型
1.6.2千亿基座模型GLM-130B的结构
1.7百川大模型
1.7.1预训练
1.7.2对齐
1.8本章小结
2多模态大模型核心技术
2.1预训练基础模型
2.1.1基本结构
2.1.2学习机制
2.2预训练任务概述
2.2.1自然语言处理领域的预训练任务
2.2.2计算机视觉领域的预训练任务
2.3基于自然语言处理的预训练关键技术
2.3.1单词表征方法
2.3.2模型结构设计方法
2.3.3掩码设计方法
2.3.4提升方法
2.3.5指令对齐方法
2.4基于计算机视觉的预训练关键技术
2.4.1特定代理任务的学习
2.4.2帧序列学习
2.4.3生成式学习
2.4.4重建式学习
......
内容摘要
本书以深入浅出的方式介绍近年来人工智能领域最热门的技术――多模态大模型的技术方法、开源平台和应用场景,并详细阐述因果推理、世界模型及多智能体与具身智能等前沿技术领域,有助于读者全面了解多模态大模型的特点及发展方向,对新一代人工智能技术范式和通用人工智能的发展起到重要推动作用。全书共5章,第1章深入探讨拥有代表性的大模型结构,第2章深度剖析多模态大模型的核心技术,第3章介绍多个具有代表性的多模态大模型,第4章深入分析视觉问答、AIGC 和具身智能这3个典型应用,第5章探讨实现通用人工智能的可行思路。 本书不仅适合高校相关专业高年级本科生和研究生作为教材使用,更是各类IT 从业者的推荐参考之作。
主编推荐
"从多模态基础模型到世界模型Sora
多模态大模型基础技术"
— 没有更多了 —
以下为对购买帮助不大的评价