知识图谱:认知智能理论与实战
①全新正版,现货速发,7天无理由退换货②天津、成都、无锡、广东等多仓就近发货,订单最迟48小时内发出③无法指定快递④可开电子发票,不清楚的请咨询客服。
¥
79.32
5.0折
¥
158
全新
库存2件
作者 王文广
出版社 电子工业出版社
ISBN 9787121432996
出版时间 2022-05
装帧 平装
开本 16开
定价 158元
货号 31451442
上书时间 2024-10-14
商品详情
品相描述:全新
商品描述
作者简介 "王文广,浙江大学计算机科学与技术硕士,高级工程师,知识图谱与认知智能领域知名专家。 现任达观数据副总裁,专注于自然语言处理、知识图谱、图像与语音分析、认知智能、大数据和图分析等方向的技术研究、产品开发和产业应用,为金融、智能制造、医疗与生物医药、半导体等行业提供认知智能产品和技术服务。 现为上海市人工智能技术标准化委员会委员,上海市科学技术委员会评审专家、人工智能领域标准编制专家,CCF 高级会员,CIPS语言与知识计算专委会委员,CAAI深度学习专委会委员。主导或参与过百余个人工智能科学研究和产业应用项目,曾获得国际、国内多个很好算法竞赛奖项,申请人工智能领域国家发明专利数十项,并参与编制人工智能领域的多个国家标准、行业标准和团体标准。" 目录 第1章 知识图谱概述0 1.1 从李白的《静夜思》开始2 1.2 什么是知识图谱3 1.3 DIKW模型6 1.4 从DIKW模型到知识图谱8 1.5 知识图谱技术体系9 1.5.1 知识图谱模式设计与管理11 1.5.2 知识图谱构建技术11 1.5.3 知识图谱存储技术13 1.5.4 知识图谱应用技术14 1.5.5 用户接口与界面17 1.6 知识图谱辨析17 1.6.1 知识图谱与自然语言处理18 1.6.2 知识图谱与图数据库20 1.6.3 知识图谱与语义网络20 1.6.4 知识图谱与搜索引擎21 1.6.5 知识图谱与深度学习21 1.7 知识图谱是人工智能进步的阶梯22 1.7.1 明鉴历史23 1.7.2 预见未来26 1.8 本章小结27 第2章 知识图谱模式设计30 2.1 知识图谱模式32 2.2 模式与本体35 2.2.1 本体35 2.2.2 模式与本体辨析37 2.3 本体概论38 2.3.1 本体的构成要素39 2.3.2 本体分类40 2.3.3 资源描述框架RDF41 2.3.4 网络本体语言OWL42 2.3.5 知名本体介绍44 2.4 模式设计的三大基本原则52 2.4.1 赋予一类事物合适的名字53 2.4.2 建立事物间清晰的联系54 2.4.3 明确、正式的语义表达55 2.5 六韬法56 2.5.1 场景58 2.5.2 复用59 2.5.3 事物63 2.5.4 联系65 2.5.5 约束67 2.5.6 评价71 2.6 模式设计的工程模型72 2.6.1 瀑布模型72 2.6.2 螺旋模型74 2.7 本章小结76 第3章 实体抽取78 3.1 实体、命名实体和实体抽取80 3.2 基于规则的实体抽取82 3.2.1 基于词典匹配的实体抽取方法83 3.2.2 编写正则表达式抽取实体84 3.2.3 基于模板的实体抽取方法85 3.3 如何评价实体抽取的效果88 3.4 传统机器学习方法91 3.4.1 概率图模型92 3.4.2 朴素贝叶斯模型93 3.4.3 最大熵模型95 3.4.4 隐马尔可夫模型100 3.4.5 条件随机场102 3.4.6 标记方法106 3.4.7 用CRF++进行实体抽取108 3.5 深度学习方法114 3.5.1 基于深度学习的通用实体抽取框架114 3.5.2 BiLSTM-CRF模型117 3.5.3 预训练模型用于实体抽取122 3.6 弱监督学习方法134 3.7 本章小结136 第4章 关系抽取138 4.1 关系和关系抽取140 4.2 基于规则的关系抽取方法145 4.2.1 词法分析与依存句法分析146 4.2.2 基于语法结构的关系抽取149 4.3 基于深度学习的关系抽取方法154 4.3.1 关系分类154 4.3.2 基于BERT的关系分类158 4.4 实体-关系联合抽取的方法161 4.4.1 实体-关系联合抽取方法162 4.4.2 基于片段预测的实体-关系联合抽取165 4.5 弱监督学习与关系抽取171 4.5.1 引导法171 4.5.2 远程监督174 4.5.3 弱监督学习与Snorkel176 4.5.4 Snorkel用于关系抽取179 4.6 本章小结184 第5章 知识存储186 5.1 数据与知识存储188 5.1.1 数据存储模型188 5.1.2 知识存储极简史189 5.2 图数据库模型193 5.2.1 属性图模型193 5.2.2 完整性约束196 5.2.3 事务、ACID与BASE200 5.2.4 查询语言202 5.3 JanusGraph分布式图数据库202 5.3.1 JanusGraph的存储模型205 5.3.2 JanusGraph的属性图模式209 5.3.3 事务和故障恢复220 5.3.4 图查询语言Gremlin221 5.3.5 JanusGraph和Gremlin入门指南222 5.4 其他图数据库介绍235 5.4.1 Neo4j236 5.4.2 Dgraph239 5.4.3 NebulaGraph243 5.4.4 图数据对比一览表246 5.5 本章小结248 第6章 知识计算250 6.1 知识计算及其数学基础252 6.1.1 知识图谱与图252 6.1.2 图论253 6.1.3 邻接矩阵256 6.1.4 谱图理论257 6.2 遍历与最短路径算法258 6.2.1 广度优先搜索258 6.2.2 深度优先搜索260 6.2.3 Dijkstra单源最短路径262 6.2.4 最短路径快速算法265 6.2.5 Floyd算法268 6.3 中心性270 6.3.1 度中心性270 6.3.2 亲密中心性272 6.3.3 中介中心性274 6.3.4 特征向量中心性279 6.3.5 PageRank281 6.4 社区检测284 6.4.1 模块度286 6.4.2 GN社区检测算法290 6.4.3 Louvain社区检测算法291 6.5 知识计算工具与系统297 6.5.1 图数据库计算框架297 6.5.2 分布式图计算引擎298 6.5.3 图分析工具包298 6.6 本章小结299 第7章 知识推理300 7.1 知识的表示与推理302 7.1.1 因果推理303 7.1.2 演绎推理303 7.1.3 归纳推理304 7.1.4 概率推理305 7.1.5 知识图谱的推理技术306 7.2 基于规则和逻辑的知识推理方法308 7.2.1 基于规则的方法308 7.2.2 基于逻辑的方法311 7.2.3 定性时空推理313 7.3 几何空间嵌入的知识推理方法316 7.3.1 欧几里得空间的平移变换方法317 7.3.2 复数向量空间的RotatE模型330 7.3.3 双曲空间嵌入的知识推理方法334 7.4 知识推理的深度学习方法353 7.4.1 卷积神经网络的知识推理方法353 7.4.2 图神经网络模型358 7.5 本章小结368 第8章 知识图谱行业应用370 8.1 行业知识图谱372 8.1.1 行业知识图谱的特点372 8.1.2 行业知识图谱的应用价值376 8.2 知识图谱行业应用范式382 8.3 共通的应用程序385 8.3.1 数据与知识中台385 8.3.2 可视化与交互式分析388 8.3.3 智能问答391 8.3.4 认知推荐396 8.3.5 辅助决策模型400 8.4 金融400 8.4.1 反洗钱和反恐怖融资400 8.4.2 个人信用评估与风险控制402 8.4.3 企业风险识别、控制与管理404 8.4.4 系统性金融风险406 8.4.5 审计407 8.4.6 证券分析与投资研究408 8.4.7 保险410 8.5 医疗、生物医药和卫生健康411 8.5.1 基因知识图谱411 8.5.2 生物医药412 8.5.3 智慧医疗414 8.5.4 公共卫生416 8.5.5 中医药知识图谱418 8.6 智能制造418 8.6.1 设计研发419 8.6.2 质量与可靠性工程420 8.6.3 设备的管理、维护与维修422 8.6.4 BOM物料清单管理425 8.6.5 供应链管理427 8.6.6 售后服务428 8.7 本章小结429 内容摘要 知识图谱作为认知智能的核心技术正蓬勃发展。本书系统全面地介绍了知识图谱的核心技术,既有宏观整体的技术体系,也有关键技术和算法细节,内容包括:知识图谱模式设计的方法论——六韬法;知识图谱构建中的实体抽取和关系抽取;知识存储中的属性图模型及图数据库,重点介绍了JanusGraph分布式图数据库;知识计算中的图论基础,以及中心性、社区检测等经典图计算算法;知识推理中的逻辑推理、几何变换推理和深度学习推理,及其编程实例。最后,本书以金融、医疗和智能制造三大行业的应用场景为例,梳理了知识图谱的应用价值和应用程序形态。 《知识图谱:认知智能理论与实战》既适合人工智能行业从业者和研究人员系统学习知识图谱,也适合一线工程师和技术人员参考使用,并可作为企业管理人员、政府人员、政策制定人员、公共政策学者的参考材料,以及高等院校计算机、金融和人工智能等相关专业师生的参考资料和培训学校的教材。 主编推荐 "理论完备,应用丰富:知识图谱涉及庞大的理论知识体系,本书深入每个概念、理论和算法的本质,给出推导、解析和阐述,便于读者理解概念与算法背后的逻辑。在应用方面,完整涵盖知识计算、知识推理等方面内容,并系统梳理了三大行业应用场景。 内容全面,结构有序:重点介绍知识图谱的模式设计、构建、存储和应用四大板块,对应大脑学习、记忆和使用知识的模式,符合在实践中应用知识图谱的通常做法。 各章独立,主题明确:各章主题相对独立,既可以作为行业参考资料,也适合作为高校教材;读者既可以系统性地学习,也可以有选择性地学习知识图谱。 全彩印刷,图解精致:书中包含大量精心绘制的彩图,对算法和概念等进行深度剖析,便于读者直观形象地理解各知识点。" 精彩内容 序一 《知识图谱:认知智能理论与实战》一书深入浅出地介绍了知识图谱的知识,并且指出“知识图谱是人工智能发展的阶梯”。人工智能的目的在于处理知识,有知识图谱这种形式化的知识表示方式作为阶梯,人工智能当然会取得蒸蒸日上的进步。我同意王文广的这个观点。 早在1956年于美国的达特茅斯学院召开的达特茅斯会议上,学者们就提出了“人工智能”的设想,此后人工智能迅速地发展起来。自然语言处理是人工智能的重要研究领域,在自然语言处理的研究中,学者们开始构建自动推理模型对问题进行求解,提出了语义网络、框架、脚本等一系列知识描述的理论和方法。 Sowa等人在1983年提出了“概念网络”,对知识进行描述。根据符号主义的原则,学者们将实体之间的关系局限于“拥有、导致、属于”等特殊的基本关系,并定义了一些在图谱上推理的规则,希望通过逻辑推理的方式实现人工智能。 在这些知识描述理论和方法的基础上,领域专家开始使用人工的方式编写实例数据,建立知识库,这些研究在一些受限的领域获得成功。学者们开始关注知识资源的研究。 互联网出现之后,人们在与自然和社会的交互中创造了大规模的数据,人类社会进入了大数据时代,这些大数据以文字、图片、音频、视频等不同的模态存在。怎样让计算机自动识别、阅读、分析、理解这些庞杂而海量的大数据,从中挖掘出有价值的信息,为用户提供精准的信息服务,成为下一代信息服务的核心目标之一。 2001年,TimBernersLee提出了语义网的概念,定义了一种描述客观世界的概念化规范,通过一套统一的元数据,对互联网的内容进行详细的语义标注,从而给互联网赋予语义,把网页互联的万维网(WWW)转化为内容互联的语义网。在语义网思想的影响下,亿万网民协同构建了“维基百科”(Wikipedia),促进了知识资源的迅速增长,使知识类型、覆盖范围和数据规模都达到了空前的水平。 1972年的文献中就出现了“知识图谱”(KnowledgeGraph)这个术语。2012年5月,谷歌公司明确提出了知识图谱的概念并构建了一个大规模的知识图谱,开启了知识图谱研究之先河。从此,知识图谱便在自然语言处理的研究中普及开来,成为自然语言处理研究的一个重要内容。 知识图谱用节点(Vertex)表示语义符号,用边(Edge)表示符号与符号之间的语义关系,因而构成了一种通用的语义知识形式化描述框架。在计算机中,节点和边等符号都可以通过“符号具化”(SymbolGrounding)的方式表征物理世界和认知世界中的对象,并作为不同个体对认知世界中信息和知识进行描述和交换的桥梁。知识图谱使用统一形式的知识描述框架,便于知识的分享和学习,因而受到了自然语言处理研究者的普遍欢迎。 自谷歌构建知识图谱,并在2012年发布了包含507亿个实体的大规模知识图谱以来,不少互联网公司很快跟进,纷纷构建各自的知识图谱。例如,微软建立了Probase,百度建立了“知心”,搜狗建立了“知立方”。金融、医疗、司法、教育、出版等各个行业也纷纷建立起各自垂直领域的知识图谱,大幅提高了这些行业的智能化水平。Amazon、eBay、IBM、LinkedIn、Uber等公司相继发布了开发知识图谱的公告。与此同时,学术界也开始研究构建知识图谱的理论和方法,越来越多的关于知识图谱主题的书籍和论文被出版和发表,其中包括新技术及有关知识图谱的调查。知识图谱得到了产业界和学术界的广泛认可和关注。 知识图谱技术的发展有着深厚的历史渊源,它源于对人工智能中自然语言的语义知识表示的研究,并经历了互联网信息服务不断深化需求的洗礼,现在已经发展成为互联网知识服务的核心工具。 以语义网络(SemanticNetwork)为代表的知识表示的相关理论研究,对互联网智能化信息处理的应用实践,以维基百科为代表的网络协同构建知识资源的创举,这些因素共同推动了知识图谱的进一步发展。 目前,大规模的知识图谱有DBpedia、YAGO、Freebase、Wikidata、NELL、KnowledgeVault等,它们用丰富的语义表示能力和灵活的结构来描述认知世界和物理世界中的信息和知识,是知识的有效载体。 《知识图谱:认知智能理论与实战》一书系统全面地介绍了知识图谱的核心技术,既有宏观整体的技术体系介绍,也深入关键技术和算法细节;既适合作为高等学校人工智能课程的参考资料,也可以作为产业界系统开发的指南。 冯志伟 中国中文信息学会会士中国计算机学会NLPCC杰出贡献奖获得者2022年2月10日序二随着数字化日渐成熟,知识图谱的应用正在广泛渗透到C端用户生活的方方面面,比如智能搜索。实际上,“知识图谱”概念最早由谷歌在2012年提出,它能够在反馈正确结果、给出全面总结、更深入广泛探索三大方面优化搜索效果。再比如电商智能推荐,阿里巴巴从2017年开始搭建电商认知图谱,将用户需求表达为图中的节点,并将需求点和电商领域的商品、类目、电商外部的通用领域知识等关联起来,从中挖掘客户的购物偏好和潜在的感兴趣的商品,使客户与商品和场景更好地连接。此外,还有O2O领域线上线下生活场景图谱,以美团为例,美团点评从2018年开始建立基于知识图谱的美团大脑,在客户、线下店铺和商品及不同的消费场景之间构建知识关联,从而优化客户的使用体验。 在B端,知识图谱在企业关联和企业分析方向也有很好的应用。比如对企业的法人或高管、企业之间的投资关系和关联风险进行分析,呈现在图谱上会非常直观。这种方式能够使海量信息以十分有效的方式在短时间内触达使用者。 知识图谱是企业将核心业务竞争能力和隐形数字资产融合形成新发展模式并获得持续竞争优势的关键技术,其应用领域日趋广泛,尤其在金融、医疗、制造等领域应用中发挥了极其重要的作用。王文广的这本书将知识图谱核心内容与深度学习技术融合,体系合理,理论完备,实践丰富,语言深入浅出,是研究与应用知识图谱的优秀参考书。 朱琳微软人工智能和物联网实验室前首席执行官微软-仪电人工智能创新院总经理2022年3月13日 媒体评论 "知识图谱是人工智能领域的前沿技术方向,在许多行业具有广泛的应用前景。本书系统介绍了知识图谱基础理论方法,同时提供了丰富的应用实例和代码,真正做到了理论与实践兼顾,对相关领域从业者具有很高的参考价值。 万小军 北京大学王选计算机研究所教授 中国计算机学会自然语言处理专委会秘书长 近年来,知识图谱一直是各通用搜索引擎及面向企业服务的公有云厂商激烈竞争的焦点之一。在概念和理论上,本书对知识图谱模式、内容构建和存储应用等方面内容覆盖全面且讲解深入;在实用性上,本书探讨了很多在企业界已经得到大规模数据验证的有效方法。因此,不论你是想了解知识图谱领域的理论知识,还是正积极准备在该领域大展拳脚,本书都是你不可错过的参考书之一! 于志伟 Staff Software Engineer,Google Search 近年来,知识图谱得到学术界和工业界越来越多的关注,不仅在大规模知识图谱构建与融合、知识问答与推理、图查询与计算一体化,以及各种可解释图神经网络等方面涌现出大量算法创新,而且在金融、医疗、智能制造等诸多行业产生了井喷式的赋能落地。在这样的大背景下,知识图谱的人才培养及各种配套教材就显得十分重要。 文广是知识图谱领域的资深从业者,不仅具备扎实的理论功底,更难能可贵的是,他在图谱落地过程中积累了很多宝贵经验。因此,当文广第一时间告诉我,他打算撰写一本理论结合实践的图书时,我就百分之百地支持并翘首以待这本新书的出版。最近,我有幸在第一时间阅读了本书的不少章节,发现其内容极其翔实,深入浅出,在呈现各种知识时不忘结合案例。 我真诚地向所有致力于知识图谱工作的研发工程师、在校师生,以及各行各业的从业者和决策者推荐此书,相信大家阅读后一定能对知识图谱的价值、技术趋势和应用案例有更全面的了解,并更好地在工作中运用知识图谱。 王昊奋 同济大学特聘研究员、博士生导师 OpenKG发起人 知识是宝贵的、稀缺的,拥有知识就拥有了竞争力。应用知识图谱这种新的人工智能技术,能够使工程师充分利用企业的集体智慧,提升企业知识的使用效率并激发创新,形成可持续的竞争优势。本书系统介绍了知识图谱技术,既有完备的理论,又很好地融合了作者的实践经验,并提供了大量的应用实例;既是知与行的统一,又是企业应用知识图谱的不错参考书籍。 乐承筠 微创投资控股有限公司商业发展与项目管理资深副总裁 从人工智能技术诞生开始,知识表示和推理一直是一个核心课题,但因受限于算力和数据而没有重大突破,直到谷歌提出了知识图谱,并成功将其用于改进搜索质量。从此,知识图谱开始得到业界的关注,并随着深度学习技术的蓬勃发展而突飞猛进,开始在不同行业得到广泛应用。市面上不少介绍知识图谱的书籍,或是偏于理论,或是偏于科普。文广的这本书很好地结合了理论和实践,深入浅出,可以帮助工程师、产品经理、AI技术爱好者等不同行业的人掌握知识图谱的关键技术,并快速用它来解决实际问题,这是一本的参考书。 Alex Lu 百度商业平台前技术总监 盛大集团前副总裁 知识图谱是人工智能发展的重要基础设施之一。随着知识图谱应用的日益深化,从应用实战角度总结知识图谱的落地经验,对于进一步推广知识图谱技术,以及进一步推动基于知识图谱的行业认知智能发展具有更加重要的意义。本书是作者多年深耕知识图谱行业应用与实践,并持续反思与系统总结的成果,其中不乏犀利独特的视角,多有精彩惊奇的类比。读此书如同与好友品茶论道,愿读者能从中有所启发,有所感悟。 肖仰华 复旦大学教授 知识工场实验室负责人 作为人类知识的近期新载体,知识图谱正驱动着人工智能在迈向认知智能的征途中飞速发展。作者以通俗易懂的语言解析了什么是知识图谱,并从全局视角概览了知识图谱技术体系。同时,本书全面介绍了知识图谱构建、存储和应用技术体系,契合人类大脑的知识获取、记忆和使用的方式。 在构建方面,作者以自然语言处理技术为核心介绍了知识抽取;在存储方面,知识图谱的很多技术来源于工程应用实践,本书体现了作者在知识图谱产业中耕耘多年的丰富经验和思考,涵盖了知识图谱构建、存储和应用等方面的内容,理论简炼完备,图示和算法实例丰富,是一本非常实用的知识图谱技术图书,既可以作为高校师生的教科书,也可以作为学术研究和工程应用的参考书。 陈华钧 浙江大学计算机科学与技术学院教授 OpenKG 发起人 知识图谱是认知智能中的一项关键性技术,我们对海量的数据、文本、图像等进行加工提炼,将知识萃取出来填入图网络,并进行充分地挖掘、推理、分析和应用。这个从信息变为数据,然后提炼知识,并最终转化为智慧的过程,有力地促进了人工智能的行业应用。 王文广和他所在的达观数据知识图谱产品团队,一直在负责达观数据知识图谱的产品构建和行业应用,不仅研发了很多图谱算法,也为众多客户解决了工程实践问题。在处理知识图谱落地应用的各类疑难问题中,文广积累了非常丰富的工程实践经验,也对达观知识图谱的产品理念有了更深刻的感悟。在写作本书的过程中,文广仔细查阅了很多行业近
— 没有更多了 —
以下为对购买帮助不大的评价