实体识别技术
¥
20.7
3.0折
¥
69
全新
仅1件
作者申德荣、寇月、聂铁铮、于戈 著
出版社机械工业出版社
出版时间2017-10
版次1
装帧精装
上书时间2024-12-21
商品详情
- 品相描述:全新
图书标准信息
-
作者
申德荣、寇月、聂铁铮、于戈 著
-
出版社
机械工业出版社
-
出版时间
2017-10
-
版次
1
-
ISBN
9787111581611
-
定价
69.00元
-
装帧
精装
-
开本
16开
-
纸张
胶版纸
-
页数
199页
-
正文语种
简体中文
-
丛书
大数据管理丛书
- 【内容简介】
-
《实体识别技术》基于作者多年对数据集成的相关研究工作,从多角度阐述实体识别技术,主要包括相似度计算算法、实体识别的分块技术、典型的基于机器学习的实体识别技术和基于关系的实体记录识别技术,以及新型的实体识别技术(包括基于时间的宴体识别技术、基于众包的实体识别、隐私保护下的实体识别)等内容。
《实体识别技术》深入浅出、案例丰富,适合数据集成等方向的研究生阅读,也能为相关领域研究人员和开发人员提供重要参考。
- 【作者简介】
-
申德荣,东北大学、计算机学院教授,博导,目前研究方向主要为分布式数据管理与数据集成。
寇月,东北大学、计算机学院副教授,目前研究方向主要为实体识别。
聂铁铮,东北大学、计算机学院副教授,目前研究方向主要为数据质量。
- 【目录】
-
丛书前言
前言
第1章 概述
1.1 实体识别问题的提出
1.2 实体识别研究的发展历史
1.3 实体识别问题的描述
1.4 实体识别的处理流程
1.5 实体识别的挑战
1.5.1 相似度衡量问题
1.5.2 计算效率问题
1.5.3 机器学习方法的应用问题
1.5.4 关联对象的识别问题
1.5.5 一些新的挑战
1.5.6 实体识别评估
1.6 实体识别的应用
1.6.1 医疗卫生
1.6.2 人口普查
1.6.3 客户关系管理
1.6.4 网购比价
1.6.5 犯罪及欺诈侦查
1.6.6 关联的开放数据
1.6.7 引文数据库
1.7 本章小结
参考文献
第2章 相似度计算算法
2.1 基于字段的相似度算法
2.1 Jaccard相似度算法
2.1.2 基于TF-IDF的相似度算法
2.1.3 基于q-grams的相似度算法
2.2 基于编辑距离的相似度算法
2.2.1 Levenshtein距离算法
2.2.2 Jaro和Jaro-Winkler距离算法
2.3 混合的相似度算法
2.3.1 扩展的Jaccard相似度算法
2.3.2 Monge-Elkan相似度算法
2.3.3 Soft TF-IDF相似度算法
2.4 数值型数据相似度算法
2.4.1 数字型相似度算法
2.4.2 日期型相似度算法
2.4.3 价格型相似度算法
2.5 本章小结
参考文献
第3章 实体识别的分块技术
3.1 引言
3.1.1 数据分块技术的应用
3.1.2 实体识别数据分块问题定义与算法分类
3.2 分块键
3.2.1 分块键的定义
3.2.2 分块键的编码
3.3 基于等值匹配的分块算法
3.3.1 标准分块方法
3.3.2 基于学习的分块键定义
3.4 基于相似性的分块算法
3.4.1 基于排序的分块方法
3.4.2 基于字符串分割的分块方法
3.4.3 基于MinHash的分块方法
3.4.4 基于Canopy聚类的分块方法
3.4.5 基于前缀过滤的分块方法
3.5 本章小结
参考文献
第4章 基于机器学习的实体识别方法
4.1 基于分类器的实体识别方法
4.1.1 基于决策树的实体识别方法
4.1.2 基于贝叶斯分类器的实体识别方法
4.1.3 基于SVM的实体识别方法
4.1.4 基于主动学习的实体识别方法
4.1.5 其他方法
4.2 基于概率图模型的实体识别方法
4.2.1 基于马尔可夫逻辑网络的实体识别方法
4.2.2 基于条件随机场的实体识别方法
4.3 本章小结
参考文献
第5章 基于关系的实体识别方法
5.1 引言
5.2 联合式实体识别方法
5.2.1 基于关系聚类的联合式实体识别方法
5.2.2 复杂信息空间中的联合式实体识别方法
5.3 基于实体关系的消歧方法
5.3.1 基于社交关系的名字消歧方法
5.3.2 基于实体关系的实体消歧方法
5.3.3 基于异构实体关系的实体消歧方法
5.4 本章小结
参考文献
第6章 新型的实体识别技术
6.1 引言
6.2 基于时间模型的实体识别技术
6.2.1 一个实例
6.2.2 时间模型
6.2.3 基于时间模型的实体识别算法
6.3 基于众包的实体识别技术
6.3.1 一个实例
6.3.2 基于众包的实体识别框架
6.3.3 基于众包的实体识别的核心问题
6.3.4 基于众包的实体识别方法的特点
6.4 隐私保护下的实体识别技术
6.4.1 实体匹配中隐私保护的分类
6.4.2 实体识别隐私保护算法的评估
6.5 本章小结
参考文献
第7章 实体识别评估
7.1 基于记录对的精确性评价一准确率、召回率和F测度
7.2 分块技术评价
7.3 常用数据集
7.3.1 真实数据集
7.3.2 数据生成工具
7.4 本章小结
参考文献
第8章 总结与展望
8.1 实体识别研究总结
8.2 新型实体识别研究展望
8.2.1 基于时间模型的实体识别
8.2.2 基于众包的实体识别
8.2.3 隐私保护下的实体识别
8.3 研究挑战
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价