深度学习与图像识别:原理与实践
全新正版 极速发货
¥
72.09
5.6折
¥
129
全新
库存12件
作者魏溪含 涂铭 张修鹏
出版社机械工业出版社
ISBN9787111630036
出版时间2019-07
装帧平装
开本16开
定价129元
货号1201908152
上书时间2024-09-18
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
作者简介魏溪含爱丁堡大学人工智能硕士,阿里巴巴达摩院算法专家,在计算机视觉、大数据领域有8年以上的算法架构和研发经验。在大数据领域,曾带领团队对阿里巴巴个性化推荐系统进行升级;计算机视觉领域,并攻克了光伏EL全自动瑕疵识别的世界难题,并在行为识别领域带领团队参赛打破世界纪录等。涂铭阿里巴巴数据架构师,对大数据、自然语言处理、图像识别、Python、Java相关技术有深入的研究,积累了丰富的实践经验。在工业领域曾参与了燃煤优化、设备故障诊断项目,正泰光伏电池片和组件EL图像检测项目;在自然语言处理方面,担任导购机器人项目的架构师,开发机器人的语义理解、短文本相似度匹配、上下文理解,以及通过自然语言检索产品库,在项目中构建了NoSQL+文本检索等大数据架构,也同时负责问答对的整理和商品属性的提取,带领NLP团队构建语义解析层。张修鹏毕业于中南大学,阿里巴巴技术发展专家,长期从事云计算、大数据、人工智能与物联网技术的商业化应用,在阿里巴巴抢先发售将图像识别技术引入工业,并推动图像识别产品化、平台化,擅于整合前沿技术解决产业问题,多个大数据和AI为核心的数字化转型项目成功实施,对技术和商业结合有着深刻的理解。
目录
前言第1章 机器视觉在行业中的应用11.1 机器视觉的发展背景11.1.1 人工智能11.1.2 机器视觉21.2 机器视觉的主要应用场景31.2.1 人脸识别31.2.2 视频监控分析41.2.3 工业瑕疵检测51.2.4 图片识别分析61.2.5 自动驾驶/驾驶辅助71.2.6 三维图像视觉81.2.7 医疗影像诊断81.2.8 文字识别91.2.9 图像/视频的生成及设计91.3 本章小结10第2章 图像识别前置技术112.1 深度学习框架112.1.1 Theano112.1.2 Tensorflow122.1.3 MXNet132.1.4 Keras132.1.5 PyTorch142.1.6 Caffe142.2 搭建图像识别开发环境152.2.1 Anaconda152.2.2 conda182.2.3 Pytorch的下载与安装192.3 Numpy使用详解202.3.1 创建数组202.3.2 创建Numpy数组222.3.3 获取Numpy属性242.3.4 Numpy数组索引252.3.5 切片252.3.6 Numpy中的矩阵运算262.3.7 数据类型转换272.3.8 Numpy的统计计算方法282.3.9 Numpy中的arg运算292.3.10 FancyIndexing292.3.11 Numpy数组比较302.4 本章小结31第3章 图像分类之KNN算法323.1 KNN的理论基础与实现323.1.1 理论知识323.1.2 KNN的算法实现333.2 图像分类识别预备知识353.2.1 图像分类353.2.2 图像预处理363.3 KNN实战363.3.1 KNN实现MNIST数据分类363.3.2 KNN实现Cifar10数据分类413.4 模型参数调优443.5 本章小结48第4章 机器学习基础494.1 线性回归模型494.1.1 一元线性回归504.1.2 多元线性回归564.2 逻辑回归模型574.2.1 Sigmoid函数584.2.2 梯度下降法594.2.3 学习率的分析614.2.4 逻辑回归的损失函数634.2.5 Python实现逻辑回归664.3 本章小结68第5章 神经网络基础695.1 神经网络695.1.1 神经元705.1.2 激活函数725.1.3 前向传播765.2 输出层805.2.1 Softmax805.2.2 one-hotencoding825.2.3 输出层的神经元个数835.2.4 MNIST数据集的前向传播835.3 批处理855.4 广播原则875.5 损失函数885.5.1 均方误差885.5.2 交叉熵误差895.5.3 Mini-batch905.6 很优化915.6.1 随机初始化915.6.2 跟随梯度(数值微分)925.7 基于数值微分的反向传播985.8 基于测试集的评价1015.9 本章小结104第6章 误差反向传播1056.1 激活函数层的实现1056.1.1 ReLU反向传播实现1066.1.2 Sigmoid反向传播实现1066.2 Affine层的实现1076.3 Softmaxwithloss层的实现1086.4 基于数值微分和误差反向传播的比较1096.5 通过反向传播实现MNIST识别1116.6 正则化惩罚1146.7 本章小结115第7章 PyTorch实现神经网络图像分类1167.1 PyTorch的使用1167.1.1 Tensor1167.1.2 Variable1177.1.3 激活函数1187.1.4 损失函数1207.2 PyTorch实战1227.2.1 PyTorch实战之MNIST分类1227.2.2 PyTorch实战之Cifar10分类1257.3 本章小结128第8章 卷积神经网络1298.1 卷积神经网络基础1298.1.1 全连接层1298.1.2 卷积层1308.1.3 池化层1348.1.4 批规范化层1358.2 常见卷积神经网络结构1358.2.1 AlexNet1368.2.2 VGGNet1388.2.3 GoogLeNet1408.2.4 ResNet1428.2.5 其他网络结构1448.3 VGG16实现Cifar10分类1458.3.1 训练1468.3.2 预测及评估1498.4 本章小结1528.5 参考文献152第9章 目标检测1539.1 定位+分类1539.2 目标检测1559.2.1 R-CNN1569.2.2 Fast R-CNN1609.2.3 Faster R-CNN1629.2.4 YOLO1659.2.5 SSD1669.3 SSD实现VOC目标检测1679.3.1 PASCAL VOC数据集1679.3.2 数据准备1709.3.3 构建模型1759.3.4 定义Loss1789.3.5 SSD训练细节1819.3.6 训练1869.3.7 测试1899.4 本章小结1909.5 参考文献191第10章 分割19210.1 语义分割19310.1.1 FCN19310.1.2 UNet实现裂纹分割19610.1.3 SegNet20910.1.4 PSPNet21010.2 实例分割21110.2.1 层叠式21210.2.2 扁平式21210.3 本章小结21310.4 参考文献214第11章 产生式模型21511.1 自编码器21511.2 对抗生成网络21511.3 DCGAN及实战21711.3.1 数据集21811.3.2 网络设置22011.3.3 构建产生网络22111.3.4 构建判别网络22311.3.5 定义损失函数22411.3.6 训练过程22411.3.7 测试22711.4 其他GAN23011.5 本章小结23511.6 参考文献235第12章 神经网络可视化23612.1 卷积核23612.2 特征层23712.2.1 直接观测23712.2.2 通过重构观测23912.2.3 末端特征激活情况24312.2.4 特征层的作用24412.3 图片风格化24512.3.1 理论介绍24512.3.2 代码实现24712.4 本章小结25512.5 参考文献255第13章 图像识别算法的部署模式25713.1 图像算法部署模式介绍25713.2 实际应用场景和部署模式的匹配26213.3 案例介绍26413.4 本章小结265
内容摘要
本书是一本有关人工智能图像识别应用开发与实践指导类的教材,主要介绍图像处理应用项目开发的基本流程、图像识别处理应用项目关键技术。本书直击当今研究热点,选择有代表性的专题项目而且尽量避免复杂的数学推导,易于读者理解,专注于实战。详细介绍了numpy,knn,线性回归,逻辑回归,神经网络在图像识别上的应用,并为后一部分的深度学习做好铺垫。同时,针对每一个项目介绍项目的应用及意义,该项目的数据特征分析、识别系统设计、图像预处理技术、特征提取技术,以及识别方法等。书中实例程序的框架结构简单,代码简洁,读者可在数字图像处理技术的基础上进一步深化学习内容,提高实践应用能力和项目开发能力。
主编推荐
(1)三位作者均来自阿里巴巴,由达摩院的资深算法专家领衔,技术积累深厚,业务经验丰富;(2)从技术原理、算法和工程实践3个维度系统展开,既适合零基础读者快速入门,又适合有基础读者理解其核心技术;(3)写作方式上避开了艰涩的数学公式及其推导,深入浅出。
精彩内容
为什么要写这本书随着深度学习技术的发展、计算能力的提升和视觉数据的增长,视觉智能计算技术在许多应用领域如拍照搜索、智能相册、人脸闸机、城市智能交通管理、智慧医疗等都取得了令人瞩目的成绩。因此越来越多的人开始对机器视觉感兴趣,并开始从事这个行业。就图像识别领域来说,运行一个开源的代码并不是什么难事,但搞懂其中的原理确实会稍有些难度。因此本书在每章中都会用相对通俗的语言来介绍算法的背景和原理,并会在读者“似懂非懂”时给出实战案例。实战案例的代码已全部在线下运行通过,代码并不复杂,可以很好地帮助读者理解其中的细节,希望读者在学习理论之后可以亲自动手实践。图像识别的理论和实践是相辅相成的,希望本书可以带领读者走进图像识别的世界。本书从章节规划到具体的讲述方式,具有以下两个特点:个特点是本书的主要目标读者定位为高校相关专业的本科生(统计学、计算机技术)、图像识别爱好者,以及不具备专业数学知识的人群。图像识别是一系列学科的集合体,它以机器学习、模式识别等知识为基础,因此依赖很多数学知识。本书尽量绕开复杂的数学证明和推导,从问题的前因后果、创造者思考的过程和简单的数学计算的角度来做模型的分析和讲解,目的是以更通俗易懂的方式带领读者入门。另外,在第8~12章的后面都附有参考文献,想要深入了解的读者可以继续阅读。第二个特点是本书在每章后面都附有实战案例,读者可以结合案例学习,通过实践验证自己想法的价值。在本书的内容编排上,遵循知识点背景介绍—原理剖析—实战案例的介绍方式,同时所有的代码会在书中详细列出或者上传到GitHub,以方便读者下载与调试,帮助读者快速掌握知识点,快速上手,而且这些代码也可以应用到后续实际的开发项目中。在实际项目章节中,选取目前在图像识别领域中比较热门的项目,对之前的知识点进行汇总,帮助读者巩固与提升。读者对象统计学或相关IT专业学生本书的初衷是面向相关专业的学生—拥有大量基于理论知识的认知却缺乏实战经验的人员,让其在理论的基础上深入了解。通过本书,学生可以跟随本书的教程一起操作学习,达到对自己使用的人工智能工具、算法和技术知其然亦知其所以然的目的。信息科学和计算机科学爱好者本书是一本近现代科技的历史书,也是一本科普书,还是一本人工智能思想和技术的教科书。通过本书可以了解人工智能领域的前辈们在探索的道路上做出的努力和思考,理解他们不同的观点和思路,有助于开拓自己的思维和视野。人工智能相关专业的研究人员本书详细介绍了图像识别的相关知识。通过本书可以了解其理论知识,了解哪些才是项目所需的内容以及如何在项目中实现,能够快速上手。如何阅读本书本书从以下几个方面阐述图像识别:第1章介绍图像识别的一些应用场景,让读者对图像识别有个初步的认识。第2章主要对图像识别的工程背景做简单介绍,同时介绍了本书后续章节实战案例中会用到的环境,因此该章是实战的基础。第3~6章是图像识别的技术基础,包括机器学习、神经网络等。该部分的代码主要使用Python实现。没有机器学习基础的同学需要理解这几章之后再往下看,有机器学习基础的同学可以有选择地学习。第7章是一个过渡章节,虽然第6章中手动用Python实现了神经网络,但由于本书后面的图像识别部分主要使用PyTorch实现,因此使用该章作为过渡,介绍如何使用PyTorch来搭建神经网络。第8~12章为图像识别的核心。第8章首先介绍了图像中的卷积神经网络与普通神经网络的异同,并给出了常见的卷积神经网络结构。接下来的第9~12章分别介绍了图像识别中的检测、分割、产生式模型以及可视化的问题,并在每章后面给出相应的实战案例。第13章简单介绍了图像识别的工业部署模式,以帮助读者构建一个更完整的知识体系。第8~12章包含参考文献,主要是本书中介绍的一些方法,或者本书中提到但是没有深入说明的方法,感兴趣的读者可以自行查询学习。关于附件的使用方法:除了第1章外,本书的每一章都有对应的源数据和完整代码,这些内容可在本书中直接找到,有些代码需要从GitHub中下载,地址为https://github.com/image_recognition/learning-recognition。需要注意的是,为了让读者更好地了解每行代码的含义,在注释信息中使用了中文标注,每个程序文件的编码格式都是UTF-8。勘误和支持由于本书的作者水平及撰稿时间有限,书中难免会出现一些错误或者不准确的地方,恳请读者批评指正。读者可通过发送电子邮件到weixihan1@163.com和kenny_tm@hotmail.com联系并反馈建议或意见。致谢首先很好感谢我的家人,由于业余时间常常被工作挤占,本书的撰写又用了所剩不多的业余时间,因此少了很多陪伴家人的时间,感谢他们的理解、支持和鼓励。撰写一本书,将自己的知识重新梳理后分享给读者,在技术发展的道路上帮助到其他人,这件事情是很好有价值的,因此也很好感谢两位合著者涂铭、张修鹏。感谢机械工业出版社华章公司的杨福川老师,以及全程参与审核、校验等工作的张锡鹏、孙海亮老师等出版工作者,是他们的辛勤付出才能保
— 没有更多了 —
以下为对购买帮助不大的评价