数据集成原理
全新正版 极速发货
¥
47.09
5.5折
¥
85
全新
库存2件
作者AnHai Doan
出版社机械工业出版社
ISBN9787111471660
出版时间2014-09
装帧平装
开本16开
定价85元
货号1200970926
上书时间2024-06-08
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
孟小峰,1964生,博士,中国人民大学信息学院教授,博士生导师。
目录
出版者的话
中文版序
译者序
前言
章 绪论1
1.1 什么是数据集成1
1.2 数据集成面临的挑战5
1.2.1 系统原因5
1.2.2 逻辑原因5
1.2.3 社会和管理原因6
1.2.4 设定预期7
1.3 数据集成架构7
1.3.1 数据集成系统的组成部分7
1.3.2 数据集成实例9
1.4 全书概览12
参考文献注释13
部分 数据集成技术基础
第2章 查询表达式及运算16
2.1 数据库概念回顾16
2.1.1 数据模型16
2.1.2 完整性约束18
2.1.3 查询和应答19
2.1.4 合取查询20
2.1.5 datalog查询21
2.2 查询展开22
2.3 查询包含与等价23
2.3.1 形式化定义23
2.3.2 合取查询的包含24
2.3.3 合取查询的并集25
2.3.4 带有比较谓词的合取查询26
2.3.5 带有否定的合取查询28
2.3.6 包语义、分组和聚集30
2.4 基于视图计算查询32
2.4.1 问题定义33
2.4.2 视图与查询计算的相关性34
2.4.3 查询重写的可能长度34
2.4.4 桶算法和MiniCon算法35
2.4.5 逻辑方法:逆规则算法41
2.4.6 算法比较42
2.4.7 基于视图的查询应答43
参考文献注释46
第3章 数据源描述47
3.1 概述和必要条件47
3.2 模式映射语言49
3.2.1 模式映射语言规则49
3.2.2 全局视图50
3.2.3 局部视图53
3.2.4 全局-局部视图55
3.2.5 元组生成依赖56
3.3 访问模式限制57
3.3.1 构建访问模式限制58
3.3.2 生成可执行计划58
3.4 中介模式上的完整性约束61
3.4.1 带有完整性约束的LAV61
3.4.2 带有完整性约束的GAV62
3.5 结果完备性63
3.5.1 局部完备性63
3.5.2 结果完备性检测64
3.6 数据级的异构性65
3.6.1 标度差异性66
3.6.2 相同实体的多重表示66
参考文献注释67
第4章 字符串匹配68
4.1 问题描述68
4.2 相似度度量69
4.2.1 基于序列的相似度度量69
4.2.2 基于集合的相似度度量75
4.2.3 混合相似度度量77
4.2.4 语音相似度度量79
4.3 可扩展的字符串匹配80
4.3.1 字符串上的倒排索引81
4.3.2 大小过滤81
4.3.3 前缀过滤82
4.3.4 位置过滤84
4.3.5 边界过滤85
4.3.6 其他相似度度量方法的可扩展技术86
参考文献注释86
第5章 模式匹配与模式映射88
5.1 问题定义88
5.1.1 语义映射89
5.1.2 语义匹配89
5.1.3 模式匹配与模式映射90
5.2 模式匹配和模式映射的挑战90
5.3 匹配和映射系统概述92
5.3.1 模式匹配系统92
5.3.2 模式映射系统94
5.4 匹配器94
5.4.1 名字匹配器94
5.4.2 实例匹配器96
5.5 组合匹配预测97
5.6 施加域完整性约束98
5.6.1 域完整性约束99
5.6.2 搜索匹配组合空间100
5.7 匹配选择器104
5.8 匹配重用105
5.8.1 学习匹配106
5.8.2 学习器107
5.8.3 训练元学习器108
5.9 多对多匹配109
5.10 由匹配到映射111
参考文献注释116
第6章 通用模式操作118
6.1 模型管理操作119
6.2 合并操作120
6.3 模型生成操作121
6.4 逆映射操作123
6.5 模型管理系统124
参考文献注释124
第7章 数据匹配126
7.1 问题定义126
7.2 规则匹配127
7.3 学习匹配129
7.4 聚类匹配131
7.5 概率匹配133
7.5.1 贝叶斯网络133
7.5.2 基于朴素贝叶斯的数据匹配138
7.5.3 特征相关性140
7.5.4 文本中的实体指代匹配141
7.6 协同匹配144
7.6.1 基于聚类的协同匹配146
7.6.2 协同匹配文档中的实体指代146
7.7 数据匹配的可扩展性148
7.7.1 规则匹配扩展148
7.7.2 其他匹配方法的扩展149
参考文献注释150
第8章 查询处理152
8.1 背景:DBMS查询处理153
8.1.1 选择查询执行计划154
8.1.2 执行查询计划156
8.2 背景:分布式查询处理157
8.2.1 数据放置和转移158
8.2.2 两阶段连接158
8.3 数据集成查询处理160
8.4 生成初始查询计划161
8.5 互联网数据的查询执行161
8.5.1 多线程、流水线、数据流架构161
8.5.2 有自治数据源的接口162
8.5.3 故障处理163
8.6 自适应查询处理163
8.7 事件驱动自适应策略164
8.7.1 数据源故障和延迟处理165
8.7.2 处理流水线操作结束时突发的基数问题166
8.8 性能驱动的自适应策略168
8.8.1 Eddy:基于队列的计划选择169
8.8.2 校正查询处理:基于代价的重新优化171
参考文献注释175
第9章 包装器176
9.1 引言176
9.1.1 包装器的构建177
9.1.2 包装器构建面临的挑战177
9.1.3 构建方法的分类178
9.2 手动的包装器构建179
9.3 基于学习的包装器构建180
9.3.1 HLRT包装器181
9.3.2 Stalker包装器182
9.4 无模式的包装器学习186
9.4.1 建模数据源模式TS和抽取程序EW187
9.4.2 推导数据模式TS和抽取程序EW187
9.5 交互的包装器构建191
9.5.1 使用Stalker交互标记页面192
9.5.2 使用Poly识别正确的抽取规则193
9.5.3 用Lixto创建抽取规则195
参考文献注释197
0章 数据仓库与缓存199
10.1 数据仓库200
10.1.1 数据仓库设计201
10.1.2 ETL:抽取/转换/加载201
10.2 数据交换:描述性仓库203
10.2.1 数据交换设置203
10.2.2 数据交换解204
10.2.3 通用解204
10.2.4 核心通用解206
10.2.5 查询物化信息库207
10.3 缓存及部分物化207
10.4 本地、外部数据的直接分析208
参考文献注释210
第二部分 扩展数据表示集成
1章 XML214
11.1 数据模型215
11.2 XML结构和模式定义217
11.2.1 文档类型定义218
11.2.2 XML模式219
11.3 查询语言220
11.3.1 先驱:DOM和SAX221
11.3.2 XPath:XML查询原语221
11.3.3 XQuery:XML查询能力225
11.4 XML查询处理229
11.4.1 XML路径匹配231
11.4.2 XML输出232
11.4.3 XML查询优化233
11.5 XML模式映射233
11.5.1 嵌套映射233
11.5.2 带嵌套映射的查询重写236
参考文献注释236
2章 本体和知识表示238
12.1 数据集成中的知识表示举例238
12.2 描述逻辑239
12.2.1 描述逻辑的语法240
12.2.2 描述逻辑的语义241
— 没有更多了 —
以下为对购买帮助不大的评价