作者程显毅、朱倩 著
出版社科学出版社
出版时间2010-10
版次1
装帧平装
上书时间2024-06-13
商品详情
- 品相描述:全新
图书标准信息
-
作者
程显毅、朱倩 著
-
出版社
科学出版社
-
出版时间
2010-10
-
版次
1
-
ISBN
9787030293060
-
定价
45.00元
-
装帧
平装
-
开本
32开
-
纸张
胶版纸
-
页数
228页
-
丛书
智能科学技术著作丛书
- 【内容简介】
-
在信息时代存储大量数据是容易的,通过Web、企业内部网、电传新闻获得的文本数量在急剧增加,因而导致了信息过载。然而,数据量虽然增加了,但可用的信息在减少。文本挖掘是一个新的令人振奋的研究领域,它试图通过综合数据挖掘、机器学习、自然语言处理、信息检索和知识管理等技术来解决信息过载问题。文本挖掘包括文本集合的预处理(文本分类、信息抽取),中间结果存储,中间结果分析技术(分布分析,聚类,趋势分析,关联规则抽取)和最终结果的可视化。它与关联分析类似,为人们提供了分析海量文本数据的新工具,并且通过学习模式来指导抽取、发现和实体关系。本书首先讨论了文本挖掘的总体结构,文本挖掘预处理算法。其次,比较深入地研究了文本挖掘核心操作,最后,探讨真实世界中文本挖掘的主要应用和DIAL语言,弥补了理论和实践的脱节。
- 【目录】
-
前言
第1章文本挖掘概述
1.1文本挖掘的产生背景
1.2文本
1.2.1文本格式
1.2.2动态文本集
1.3文本挖掘的概念
1.4文本挖掘的任务
1.4.1文本挖掘预处理
1.4.2文本模式挖掘
1.4.3挖掘结果可视化
1.5文本挖掘系统的通用体系结构
第2章文本表示
第3章文本挖掘预处理——文本分类
第4章文本挖掘预处理——文本聚类
第5章文本挖掘核心操作——信息抽取
第6章文本挖掘核心操作——关系抽取
第7章文本挖掘核心操作——关联分析
第8章文本挖掘结果的可视化
第9章文本挖掘的应用
第10章专门用于文本挖掘的信息抽取语言——DIAL
参考文献
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价