计算机科学丛书：数据集成原理

31.07 3.7折 85 九五品

仅1件

河北廊坊

认证卖家担保交易快速发货售后保障

作者[美]多恩（AnHai Doan）、[美]哈勒维（Alon Halevy）、[美]艾夫斯（Zachary Ives）著；孟小峰、马如霞、马友忠译

出版社机械工业出版社

出版时间2014-09

版次1

装帧平装

货号A8

上书时间2024-12-13

简简单单-书店的书店

三年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 13小时
好评率暂无

最新上架

Python 3 基础教程 ¥17.44

妙趣横生的统计学培养大数据时代的统计思维（第四版） ¥26.58

Spring Boot实战 ¥18.07

军事理论教程（慕课版双色版） ¥17.37

用Python写网络爬虫 ¥18.85

挑战程序设计竞赛2 算法和数据结构 ¥20.84

你不知道的JavaScript（中卷） ¥21.65

整体拉伸 3步提升全身柔韧性、灵活性和力量（全彩图解第2版） ¥38.11

心理画绘画心理分析图典（修订扩展版） ¥50.44

商品详情

品相描述：九五品

图书标准信息

作者 [美]多恩（AnHai Doan）、[美]哈勒维（Alon Halevy）、[美]艾夫斯（Zachary Ives）著；孟小峰、马如霞、马友忠译
出版社机械工业出版社
出版时间 2014-09
版次 1
ISBN 9787111471660
定价 85.00元
装帧平装
开本 16开
纸张胶版纸
页数 373页
字数 100千字
正文语种简体中文
丛书计算机科学丛书

【内容简介】: 　　近20年里，数据产生的方式不断得到扩展，带来数据管理需求和任务的不断变化，促使数据管理技术不断推陈出新。数据库管理系统、数据仓库与数据挖掘、数据集成被视为三足鼎立的现代数据管理技术，它们在构建信息系统中的作用相当、互为依存、缺一不可。但数据集成技术缺乏像数据库系统、数据挖掘广为人知的专业教材，使得该技术虽“叫好（广为应用）”，但“不叫座（缺乏教学传播）”。大学鲜有开设此类课程，其知识的积累多散见论文、系统。《计算机科学丛书：数据集成原理》可以说一举改变了数据集成没有专业教材的困局，尤其在当今大数据背景下，其作用尤为突出。
　　数据集成主要用来解决跨多个数据源的查询处理问题。《计算机科学丛书：数据集成原理》是有关数据集成技术的集大成之作。全书是以教科书的逻辑整理有关内容，强调知识的基础性和理论性。主要讨论以下问题：如何对数据库思想进行扩充和深化，从而使其能够容纳外部信息源，处理Web的分布式特性和信息共享带来的问题，特别是异构性和不确定性。
　　《计算机科学丛书：数据集成原理》内容主要包括三部分。第一部分以数据库课程涵盖的研究主题为基础，主要关注数据集成领域的基本技术，如查询的表示、数据源的描述、模式匹配、查询处理、集成方法等：穿插补充了Web数据集成的内容，如包装器、数据匹配（实体识别）等。第二部分主要介绍扩展数据集成的知识，包括×ML、语义Web、不确定性、数据溯源等。第三部分介绍了解决特定集成问题的创新框架，包括Web数据集成、基于关键字的按需集成、对等集成、协同集成等。最后介绍了数据集成技术的主要研究方向。
【作者简介】: 　　　AnHaiDoan，威斯康星大学麦迪逊分校计算机科学系副教授。
　　　　AlonHalevy，谷歌结构化数据组负责人。
　　ZacharyIves，宾夕法尼亚大学费城分校副教授。
【目录】: 出版者的话
中文版序
译者序
前言
第1章绪论
1.1什么是数据集成
1.2数据集成面临的挑战
1.2.1系统原因
1.2.2逻辑原因
1.2.3社会和管理原因
1.2.4设定预期
1.3数据集成架构
1.3.1数据集成系统的组成部分
1.3.2数据集成实例
1.4全书概览
参考文献注释

第一部分数据集成技术基础
第2章查询表达式及运算
2.1数据库概念回顾
2.1.1数据模型
2.1.2完整性约束
2.1.3查询和应答
2.1.4合取查询
2.1.5datalog查询
2.2查询展开
2.3查询包含与等价
2.3.1形式化定义
2.3.2合取查询的包含
2.3.3合取查询的并集
2.3.4带有比较谓词的合取查询
2.3.5带有否定的合取查询
2.3.6包语义、分组和聚集
2.4基于视图计算查询
2.4.1问题定义
2.4.2视图与查询计算的相关性
2.4.3查询重写的可能长度
2.4.4桶算法和MiniCon算法
2.4.5逻辑方法：逆规则算法
2.4.6算法比较
2.4.7基于视图的查询应答
参考文献注释
第3章数据源描述
3.1概述和必要条件
3.2模式映射语言
3.2.1模式映射语言规则
3.2.2全局视图
3.2.3局部视图
3.2.4全局-局部视图
3.2.5元组生成依赖
3.3访问模式限制
3.3.1构建访问模式限制
3.3.2生成可执行计划
3.4中介模式上的完整性约束
3.4.1带有完整性约束的LAV
3.4.2带有完整性约束的GAV
3.5结果完备性
3.5.1局部完备性
3.5.2结果完备性检测
3.6数据级的异构性
3.6.1标度差异性
3.6.2相同实体的多重表示
参考文献注释
第4章字符串匹配
4.1问题描述
4.2相似度度量
4.2.1基于序列的相似度度量
4.2.2基于集合的相似度度量
4.2.3混合相似度度量
4.2.4语音相似度度量
4.3可扩展的字符串匹配
4.3.1字符串上的倒排索引
4.3.2大小过滤
4.3.3前缀过滤
4.3.4位置过滤
4.3.5边界过滤
4.3.6其他相似度度量方法的可扩展技术
参考文献注释
第5章模式匹配与模式映射
5.1问题定义
5.1.1语义映射
5.1.2语义匹配
5.1.3模式匹配与模式映射
5.2模式匹配和模式映射的挑战
5.3匹配和映射系统概述
5.3.1模式匹配系统
5.3.2模式映射系统
5.4匹配器
5.4.1名字匹配器
5.4.2实例匹配器
5.5组合匹配预测
5.6施加域完整性约束
5.6.1域完整性约束
5.6.2搜索匹配组合空间
5.7匹配选择器
5.8匹配重用
5.8.1学习匹配
5.8.2学习器
5.8.3训练元学习器
5.9多对多匹配
5.10由匹配到映射
参考文献注释
第6章通用模式操作
6.1模型管理操作
6.2合并操作
6.3模型生成操作
6.4逆映射操作
6.5模型管理系统
参考文献注释
第7章数据匹配
7.1问题定义
7.2规则匹配
7.3学习匹配
7.4聚类匹配
7.5概率匹配
7.5.1贝叶斯网络
7.5.2基于朴素贝叶斯的数据匹配
7.5.3特征相关性
7.5.4文本中的实体指代匹配
7.6协同匹配
7.6.1基于聚类的协同匹配
7.6.2协同匹配文档中的实体指代
7.7数据匹配的可扩展性
7.7.1规则匹配扩展
7.7.2其他匹配方法的扩展
参考文献注释
第8章查询处理
8.1背景：DBMS查询处理
8.1.1选择查询执行计划
8.1.2执行查询计划
8.2背景：分布式查询处理
8.2.1数据放置和转移
8.2.2两阶段连接
8.3数据集成查询处理
8.4生成初始查询计划
8.5互联网数据的查询执行
8.5.1多线程、流水线、数据流架构
8.5.2有自治数据源的接口
8.5.3故障处理
8.6自适应查询处理
8.7事件驱动自适应策略
8.7.1数据源故障和延迟处理
8.7.2处理流水线操作结束时突发的基数问题
8.8性能驱动的自适应策略
8.8.1Eddy：基于队列的计划选择
8.8.2校正查询处理：基于代价的重新优化
参考文献注释
第9章包装器
9.1引言
9.1.1包装器的构建
9.1.2包装器构建面临的挑战
9.1.3构建方法的分类
9.2手动的包装器构建
9.3基于学习的包装器构建
9.3.1HLRT包装器
9.3.2Stalker包装器
9.4无模式的包装器学习
9.4.1建模数据源模式TS和抽取程序EW
9.4.2推导数据模式TS和抽取程序EW
9.5交互的包装器构建
9.5.1使用Stalker交互标记页面
9.5.2使用Poly识别正确的抽取规则
9.5.3用Lixto创建抽取规则
参考文献注释
第10章数据仓库与缓存
10.1数据仓库
10.1.1数据仓库设计
10.1.2ETL：抽取/转换/加载
10.2数据交换：描述性仓库
10.2.1数据交换设置
10.2.2数据交换解
10.2.3通用解
10.2.4核心通用解
10.2.5查询物化信息库
10.3缓存及部分物化
10.4本地、外部数据的直接分析
参考文献注释

第二部分扩展数据表示集成
第11章XML
11.1数据模型
11.2XML结构和模式定义
11.2.1文档类型定义
11.2.2XML模式
11.3查询语言
11.3.1先驱：DOM和SAX
11.3.2XPath：XML查询原语
11.3.3XQuery：XML查询能力
11.4XML查询处理
11.4.1XML路径匹配
11.4.2XML输出
11.4.3XML查询优化
11.5XML模式映射
11.5.1嵌套映射
11.5.2带嵌套映射的查询重写
参考文献注释
第12章本体和知识表示
12.1数据集成中的知识表示举例
12.2描述逻辑
12.2.1描述逻辑的语法
12.2.2描述逻辑的语义
12.2.3描述逻辑的推理
12.2.4描述逻辑和数据库推理的比较
12.3语义Web
12.3.1资源描述框架
12.3.2RDF模式
12.3.3Web本体语言
12.3.4RDF查询：SPARQL语言
参考文献注释
第13章不确定性数据集成
13.1不确定性表示
13.1.1概率数据表示
13.1.2从不确定性到概率
13.2不确定模式映射建模
13.2.1概率映射
13.2.2概率映射的语义
13.2.3表语义
13.2.4元组语义
13.3不确定性和数据溯源
参考文献注释
第14章数据溯源
14.1溯源的两种表示方法
14.1.1使用数据标注表示溯源
14.1.2使用数据关系图表示溯源
14.1.3两种表示方法的可交换性
14.2数据溯源的应用
14.3溯源半环
14.3.1半环形式化模型
14.3.2半环模型的应用
14.4溯源的存储
参考文献注释

第三部分新型集成系统
第15章Web数据集成
15.1Web数据的用途
15.2深层网络
15.2.1垂直搜索
15.2.2深层网络浅层化
15.3主题门户网站
15.4Web数据的轻量级集成
15.4.1发现Web中的结构化数据
15.4.2导入数据
15.4.3合并多个数据集
15.4.4重用他人工作成果
15.5“即付即用”数据管理
参考文献注释
第16章关键字搜索：按需集成
16.1结构化数据中的关键字搜索
16.1.1数据图
16.1.2关键字匹配和评分模型
16.2结果排名计算
16.2.1图扩展算法
16.2.2基于阈值的合并
16.3数据集成中的关键字搜索
16.3.1以可扩展的方式自动地构建边
16.3.2可扩展的查询应答
16.3.3通过学习算法调整边和节点的权重
参考文献注释
第17章对等数据集成
17.1对等节点和映射
17.2映射的语义
17.3PDMS查询应答的复杂性
17.3.1有环PDMS
17.3.2对等映射中的比较谓词
17.4查询重写算法
17.5组合映射
17.6采用松散映射进行对等数据管理
17.6.1基于相似度的映射
17.6.2映射表
参考文献注释
第18章支持协同的集成
18.1协同因何而不同
18.2处理校正和反馈
18.2.1直接向下传播的用户更新
18.2.2回溯传播的反馈或更新
18.3协同标注与表达
18.3.1映射作为标注：轨迹
18.3.2评论和讨论作为标注
18.4动态数据：协同数据共享
18.4.1基本架构
18.4.2映射更新与物化实例
18.4.3冲突协调
参考文献注释
第19章数据集成的未来
19.1不确定性、溯源和清理
19.2众包和“人计算”
19.3构建大规模结构化Web数据库
19.4轻量级集成
19.5集成数据可视化
19.6社交媒体集成
19.7基于集群和云的并行处理与缓存
参考文献
索引

点击展开点击收起

— 没有更多了 —