• 内容理解:技术、算法与实践
  • 内容理解:技术、算法与实践
21年品牌 40万+商家 超1.5亿件商品

内容理解:技术、算法与实践

全新正版 极速发货

55.71 5.6折 99 全新

库存16件

广东广州
认证卖家担保交易快速发货售后保障

作者孙子荀 等

出版社机械工业

ISBN9787111735137

出版时间2023-10

装帧其他

开本其他

定价99元

货号1203111650

上书时间2024-06-09

大智慧小美丽

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
目录
Contents 目 录作者简介前  言第一部分 内容理解第1章 文本内容理解21.1 文本表示21.1.1 文本表示的研究背景21.1.2 文本表示的方法31.2 文本分类91.2.1 文本分类的研究背景91.2.2 文本分类的方法91.3 本章小结17第2章 图像理解192.1 图像分类202.1.1 传统图像分类算法202.1.2 深度学习图像分类算法232.2 图像检测252.2.1 图像匹配算法262.2.2 基于OpenCV的模板匹配实现272.2.3 目标检测算法282.3 实际应用:通用元素检测框架302.4 本章小结31第3章 语音理解323.1 语音表征323.1.1 基于传统方法的语音表征333.1.2 基于深度学习的语音表征343.2 基于深度学习的音乐分类343.2.1 基于CNN的音乐分类353.2.2 基于RNN的音乐分类383.2.3 基于领域知识的CNN383.2.4 基于注意力机制的后端模块   算法413.3 本章小结43第4章 场景文字检测与识别444.1 场景文字的研究方向444.1.1 研究问题444.1.2 研究难点454.1.3 未来趋势454.2 场景文本算法的现状464.2.1 基于传统机器学习的文本检测464.2.2 基于传统机器学习的文本识别464.2.3 基于深度学习的文本检测474.2.4 基于深度学习的文本识别524.2.5 基于深度学习的端到端系统534.3 场景文本算法辅助技术554.3.1 不规则文本识别问题554.3.2 文本图像合成技术564.3.3 半监督技术574.4 数据集和评估标准584.4.1 基准数据集584.4.2 文本检测评估标准604.4.3 文本识别评估标准614.5 文本检测和识别的应用、现状   与未来614.5.1 应用614.5.2 现状624.5.3 挑战与未来趋势624.6 本章小结64第5章 视频理解655.1 视频表征665.1.1 研究目标与意义665.1.2 研究进展675.2 视频动作识别715.2.1 研究目标与意义715.2.2 研究难点715.2.3 研究进展715.3 视频时序动作定位745.3.1 研究目标与意义745.3.2 研究难点745.3.3 研究进展755.4 视频结构化分析795.4.1 研究目标与意义805.4.2 研究难点805.4.3 基于视频结构化的数据集805.4.4 视频结构的划分方法815.4.5 研究进展845.5 本章小结89第6章 多模态学习与内容理解916.1 多模态内容理解的研究方向916.1.1 研究问题916.1.2 研究意义与挑战926.1.3 研究方向与应用936.2 多模态表征946.2.1 因果表征946.2.2 联合表征986.3 多模态内容理解框架996.3.1 模态间推理996.3.2 模态间协同1016.3.3 模态间推理:零样本图像   分类1036.3.4 模态间协同:虚假新闻识别1056.4 大规模预训练技术1086.4.1 文本预训练1086.4.2 图像预训练1106.4.3 音频预训练1116.4.4 多模态预训练1126.5 本章小结114第7章 内容理解框架1157.1 常见的内容理解框架1157.1.1 Tensor2Tensor1157.1.2 OmniNet 1207.2 自研多模态内容理解框架1217.2.1 框架设计背景1217.2.2 contentAI框架介绍1257.2.3 高度配置化1257.2.4 高度组件化1277.2.5 开发者模式与用户模式1307.2.6 计算式网络搭建1317.2.7 计算图网络搭建 1327.2.8 自动化数据集构建 1337.2.9 能力优化1337.2.10 快速服务化1347.2.11 内容理解能力1357.2.12 代码编写范例1367.3 本章小结141第二部分 内容生成第8章 图片生成1448.1 基于GAN的图片生成1448.1.1 生成对抗网络1448.1.2 条件图片生成1468.1.3 文本转图片1478.1.4 图片迁移1478.1.5 高分辨率图片生成1498.2 基于扩散模型的图片生成1518.2.1 扩散模型1528.2.2 扩散模型生成图片1538.3 图片设计1558.3.1 智能裁剪1558.3.2 智能布局1568.4 本章小结157第9章 文本生成1589.1 文本生成的背景知识1589.1.1 语言模型1589.1.2 CFG文法1599.1.3 Encoder-Decoder框架1609.1.4 文本生成质量量化 1619.2 文本生成算法1629.2.1 基于统计的文本生成模型1629.2.2 基于神经网络的文本生成技术1649.3 本章小结172第10章 AI素材合成17310.1 AI人脸属性编辑17310.1.1 研究目标与意义17310.1.2 研究难点17510.1.3 研究进展17610.2 AI语音合成18110.2.1 研究目标与意义18110.2.2 基本的语音合成系统简介18210.2.3 端到端的语音合成系统18310.2.4 基于深度学习的算法介绍18510.3 AI虚拟人技术19510.3.1 研究目标与意义19510.3.2 二维多目标人体姿态估计19710.3.3 二维-三维人体姿态转换20310.4 AI表情包合成20510.4.1 表情包特性20610.4.2 表情包自动合成的意义及    挑战20710.4.3 表情包合成算法20810.4.4 表情包合成应用21210.5 本章小结213第11章 视频编辑21411.1 结构化数据视频编辑21511.1.1 基于模板的电视报道视频编辑21511.1.2 基于剪辑元素属性约束的    视频编辑21611.1.3 视频特效合成系统实践21711.2 文本驱动视频编辑22211.2.1 基于主题文本编辑的视频    蒙太奇22211.2.2 基于解说文本的旅游视频    编辑22411.3 音乐驱动视频编辑22511.3.1 音乐驱动视频蒙太奇22511.3.2 根据音乐生成视觉节奏22711.3.3 基于音乐合成视觉叙事    镜头23011.4 本章小结232第三部分 内容质量第12章 标题党23412.1 模型构建23512.1.1 业务定义23512.1.2 基于标题建模23612.1.3 基于文章整体内容建模 23812.2 标题党研究方向24112.2.1 数据方面的研究24112.2.2 特征构造方面的研究24112.2.3 模型方面的研究24112.3 数据集24212.4 相关论文介绍24312.4.1 特征构造24312.4.2 深度学习24512.5 本章小结247第13章 假新闻24813.1 基本方法24813.1.1 基于内容真实性24813.1.2 基于内容风格24913.1.3 基于传播模式25113.1.4 基于传播源特征25313.2 未来研究方向25313.3 数据集25413.4 相关论文介绍25413.5 本章小结271第14章 图文低俗识别27214.1 研究背景与问题定义27214.1.1 研究背景27214.1.2 问题定义27314.2 业界常用产品27414.3 主要技术手段27514.3.1 关键词27514.3.2 模型27614.3.3 匹配27714.3.4 举报27914.3.5 用户行为27914.3.6 多模态27914.4 业务案例27914.5 本章小结282

内容摘要
这是一本在AI大模型技术背景下深入讲解内容理解的技术原理、算法实现与业务实践的著作,由腾讯的高级总监和资深内容专家领衔撰写,全面融入了工业界在内容业务方面积累的先进技术和成熟经验。全书围绕内容理解、内容生成、内容质量3大关键领域展开,从内容产业的发展趋势与挑战到各种技术和算法,从行业的先进的研究成果到各种典型的应用案例,应有尽有。第一部分内容理解(第1~7章)首先,详细介绍了内容理解的各个模块,包括文本、图像、语音等单模态内容的理解以及多场景文本、视频等多模态内容的理解,帮助读者全面了解内容理解的核心概念、技术细节和研究进展。接着,讲解了多模态学习在内容理解中的应用、多模态内容理解的理论框架和大规模预训练技术。最后,介绍了两个主流的内容理解框架,并结合一个自研的多模态内容理解框架,阐述了解决内容理解问题的流程和具体方案。第二部分内容生成(第8~11章)详细讲解了内容生成的技术细节,结合作者团队在业务实践中探索的应用案例,从图片生成、文本生成、AI素材合成到AI创作,介绍了内容创作的全栈技术,能帮助读者由浅入深地理解内容生成的技术原理与业务实践。第三部分内容质量(第12~14章)详细讲解了信息流产品常见的内容质量问题,比如标题党、假新闻、低俗图片等,介绍了如何对这些与内容质量相关的业务场景进行拆解和定义,将抽象的业务场景转化为可以建模的问题。此外,还介绍了作者团队采用的业务建模流程以及业界常用的解决方案和研究进展。

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP