基于多重共现的知识发现方法
¥
45.08
5.6折
¥
80
全新
库存2件
作者庞弘燊
出版社科学出版社
出版时间2017-06
版次31
装帧平装
货号R4库 12-18
上书时间2024-12-19
商品详情
- 品相描述:全新
图书标准信息
-
作者
庞弘燊
-
出版社
科学出版社
-
出版时间
2017-06
-
版次
31
-
ISBN
9787030529435
-
定价
80.00元
-
装帧
平装
-
开本
其他
-
页数
144页
-
字数
99999千字
- 【内容简介】
-
基于多重共现的知识发现技术是将载体中的多特征项共现信息定量化、重点热点信息内容可视化的分析方法。目前国内外对特征项共现的研究方法以及工具软件多集中在两个特征项之间共现的研究,本书致力于将三个或以上特征项共现的现象作为研究主体,在总结现有相关的共现研究方法、数据挖掘技术、可视化技术、知识发现方法的基础上,拓展共现现象的研究范围,并预期设计出一套可应用于学科领域分析的多特征项共现分析方法,*后从应用研
- 【作者简介】
-
庞弘燊,1983年生,学院文献情报中心情报学博士,信息师资人才,兼职硕士生导师,现为深圳大学图书馆副研究馆员,曾工作于学院广州生物医药与健康研究院信息情报中心。主要研究领域包括科学计量学、情报计量学、计量学以及科技政策管理研究、软科学研究等。主持科研项目18项,其中包括自然科学青年科学项目1项,学院及省部级项目10项;组织撰写情报分析报告20余篇,其中与情报分析报告曾获部委采用及地方批示;在ci/ci/cci等收录的期刊中发表40余篇。
精彩内容:
章绪论科技发展新月异,在信息迅速膨胀与高度开放的,随着科学知识的普及、科学思想的传播、科学理论的研究、科学成果的应用和推广等,信息源越来越庞大。在激增的信息当中,包含着许多科学活动规律的重要知识。1.1研究背景文献计量学者很早注意到共现(cooccurrenceandoccurrence)现象,通过分析共现现象可以从多个角度解释、挖掘隐含在中的各类信息,揭示与之间的内容关联和逻辑关联。由于共现现象可以转换为形式化的表述方式(如共现矩阵)加以定量测度,尤其是在计算机技术的辅助下,共现分析以其方法的简明和分析结果的可靠,成为支撑信息内容分析研究过程的重要手段和工具,受到研究者的关注并得到了大量理论探讨与应用研究。在学术期刊上公开发表的,都有着比较严格的著录规范,包括正文以及一系列对相关信息进行描述的特征项。因此,期刊作为科学知识、科研成果的有形载体,除了直接反映成果的研究内容,还蕴藏着大量表征科学活动基本状的信息。例如,题名是对主题的扼要表达;关键词是反映主题的学术词汇;摘要是对内容的高度概括;而其他特征项如作者、机构、引文、发表期刊、出版年份等则是对外部特征全方面、多角度的补充。这些在学术期刊上单独成篇发表的数据看似孤立,实则有着千丝万缕的关联。每一篇都由若干个特征项(entitie)组成,包括关键词、作者、机构、发表期刊等[1]。这些特征项结合在一起构成了一篇的重要特征,也是之间相互区别的重要特质。在文献计量研究中,通常用分析特征项之间关联的方法探索的关联,进而映科学领域在不同方面的关联结构,揭示科学活动的发展规律。而要实现对海量数据的量化分析,必须对文献数据进行特征提炼,抽取可以定量分析的结构化数据。揭示某种特征项的关联结构是目前大部分可视化技术所能实现的,并在科学计量研究中被广泛应用,如聚类分析和多维尺度分析等。这些可视化技术揭示的是一种特征项之间的关系,如关键词共现、作者合作、文献共被引等,然而,这些关系揭示的信息存在的局限。众所周知,作为反映科学特征的不同特征项之间,也存在千丝万缕的联系。例如,施引与被引两种不同特征项之间的相互引用关系,作者与关键词之间的使用关系,与作者之间的隶属关系等。到目前为止,许多研究者已经对中特征项之间的联系进行了多方面的研究[225]。1.2靠前外相关研究领域的发展现状与趋势1.2.1知识发现的理论与实践研究知识发现又称数据库中的知识发现(knowledgedicoveryindatabae,kdd),是指从大量数据集合中识别出有效的、新颖的、潜在有用的以及终可理解模式的不错处理过程,数据挖掘(datamining)是知识发现过程中的一个主要步骤[26]。目前靠前上知识发现的研究方向主要以知识发现的任务描述、知识评价与知识表示为主线,以有效的知识发现算法为中心,以知识发现模型为重点,研究知识发现自身的运行机制和内在机理及其在各领域中的实际应用。知识发现的基本任务包括[27]数据分类、数据聚类、衰退和预报、关联和相关、顺序发现、描述和辨别、时间序列分析等。知识发现的过程如图11所示,可以概括为三部曲,即数据准备(数据筛选、数据预处理、数据变换)、数据挖掘以及结果的解释评价。目前靠前外基于数据库本身的知识发现研究,除了借鉴数据库知识发现的理论,主要是运用聚类分析、神经网络方法、决策树方法、粗糙集技术、遗传算法、关联规则挖掘等数据挖掘算法分析发现数据集中数据之间的关联关系。1.2.2共现的相关研究1.共现的基本理论研究目前靠前外已有很多关于各种类型共现现象的研究,包括相同类型特征项的共现研究(cooccurrence)和不同类型特征项的共现研究(occurrence)。相同类型特征项的共现包括共现、关键词共现、作者共现等,其中研究早、影响大程度的是共现。不同类型特征项的共现包括作者文献耦合、作者关键词耦合等。以下是目前各种共现类型的研究现状。图11知识发现的过程1)文献耦合(bibliographiccoupling)文献耦合是指文献通过参文献进行的耦合。具体地,是当两篇文献共同引用了一篇或多篇文献时,这两篇文献之间的关系称为文献耦合。耦合的强度取决于共同参文献(被引文献)的数量。fano在1956年注意到这种现象,先发售提出文献耦合的概念和思路,但之后并没有引起人们广泛的关注[2]。1963年,keler在对phyicalreview期刊进行研究时注意到越是学科专业内容相近的,它们参文献中的相同文献的数量越多,于是他把两篇(或多篇)同时引用一篇的称为耦合,并把它们之间的这种关系称为文献耦合,相同参文献的数量即耦合强度[3]。两篇文献的耦合强度越高,说明这两篇文献之间的研究主题越相似。在美国科学情报研究所(ii)的webofcience数据库中,是通过文献耦合为用户提供相关文献的信息。但是文献耦合的分析方法有的制约,因为对于选定的数据,耦合关系不会随着时间流逝而发生改变,而是保持固定的,从这个意义上讲,耦合分析的结论是静态的。2)共被引(cocitation)共被引是目前广受关注、研究成果多的共现研究,包括文献共被引、作者共被引、期刊共被引等。(1)文献共被引分析(documentcocitationanalyi,dca)。文献共被引,又称文献共引,是指两篇文献同时被后来的其他文献所引用。具有共被引关系的文献之间借共被引强度体现彼此之间的关联度和内容的相似,其实质是将一组具有共被引关系的文献作为分析对象,综合利用数学、统计学和逻辑分析方法,把对象之间错综复杂的共被引关系量化、抽象并简单表达的过程[4]。1973年,美国情报学家mall在对“粒子物理学专业”进行知识结构描述时,发现两篇被相同文献引用的强度可以用来测度其内容相似程度,在此基础上创造地提出了共被引的概念[5]。文献共被引分析方法经过40多年的演进,以mall等为代表的研究者从引文数据的选择、共被引矩阵的标准化处理,到不同层次及等级聚类方法的改进、可视化方法的引入等方面进行了大量的研究,使得文献共被引分析的理论和技术臻完善。而来,利用共被引聚类来挖掘科学的热点领域、前沿领域以及发展领域正成为研究的焦点。(2)作者共被引分析(authorcocitationanalyi,aca)。作者共被引,又称作者共引,是在文献共被引的基础上提出的,aca定两位作者的文章若被后来的文献同时引用,那么表明这两位作者之间有联系,同时被引用的次数越多,说明他们之间关系越紧密。aca起源于美国的drexel大学,在1981年该校的white和griffith合作发表的“authorcocitation:aliteraturemeaureofintellectualtructure”一文开创了aca的先河,文章对39位信息科学作者进行了共被引分析,划分出了情报学五大体系的核心作者,为之后的aca研究提供了良好的范例[6]。1990年,mccain[7]将aca的分析步骤归纳为选择作者、检索共被引频次、生成共被引矩阵、转化为pearon相关系数矩阵、多元统计分析、解释结果及效度分析六个步骤,人们将其称为aca传统法模式或drexel模式。现在,作者共被引分析已成为一种高效和多产的分析方法,不仅可以用来揭示科学结构的发展现状乃至变化情况,还可以用来进行前沿分析、领域分析、科研评价等。但是目前对于aca的相关分析方法还有待优化,如在pearon相关系数的适应、对角线值的确定、矩阵的标准化等问题上还存有争议[8]。(3)期刊共被引分析(journalcocitationanalyi,jca)。期刊共被引,又称期刊共引,是指以期刊为基本单元而建立的共被引关系。具体来说,是n种(n≥2)期刊的被其他期刊同时引用,称这n种期刊具有共被引关系。其共被引程度以引用它们的期刊种数(或次数)来衡量,这个测度称为期刊共被引强度或频次。期刊共被引分析把数量众多的期刊按被引证关系联系起来,从而从利用的角度揭示了各学科期刊之间的相互关系和结构特征[9]。1991年,美国得萨斯大学的mccain将文献共被引、作者共被引的思路和技术应用到期刊共现研究上,对经济学领域期刊进行共被引分析,以此为例察在期刊水上得出的聚合情况[10];1998年和2000年mccain和等分别对神经网络领域、信息检索领域主流期刊进行了多维尺度(md)分析,察了在不同时间段期刊的交流结构,通过透视期刊共被引结构来发现学科研究的变迁[11,12]。期刊共被引分析也可以用于挑选与评价期刊,运用社会网络分析方法如md分析来发现处于被引中心圈的期刊,即核心期刊[13]。3)共篇(cotext)共篇分析属于共现研究。2002年,中国学者崔雷和郑华川注意到之间基于相同关键词会产生关联,提出了“共篇”的概念,认为两篇共同出现相同关键词的数量越多,则两篇的内容相关越强;并通过对胃癌前病变的研究现状和热点进行了探索,比较了共被引分析与共篇分析结果,发现两者的聚类分析的结论大致相同[14]。4)共词(coword、coterm)共词分析方法属于内容分析方法的一种,其主要是对一组词两两统计它们在同一篇文献中出现的次数,对这些词进行聚类分析,进而分析这些词所代表的学科和主题的结构变化。共词分析的思路初是在20世纪70年代由法国文献计量学家提出的。1986年,法国科研中心(r)的callon等出版了mappingthedynamicofcienceandtechnology一书,当时被称为“lemappe”[15]。由于在结果分析方面关键词具有得天独厚的直接,很快引起了研究者的高度关注。共词分析方法发展至今,主要经历了三个阶段,即代基于包容指数和临近指数的共词分析方法,第二代基于战略坐标的共词分析方法以及新一代基于数据库内容结构分析的共词分析方法[16]。经过30多年的发展,共词分析方法从到使用都有了大幅度改进。利用共词分析方法基本可以概述研究领域的研究热点,横向和纵向分析领域学科的发展过程、特点以及领域或学科之间的关系,反映某个专业的科学研究水及其发展历史的动态和静态结构,以及基础研究和技术研究之间的关系等。但是这种方法也存在着一些弊端,例如,共词分析对于词的选择敏感,作者取词的惯、未经规范的关键词在表征内容的完整等都会造成结论的模糊、晦涩。此外,还有些研究对共词结论的可解释提出质疑,认为其具有随意较大和存在不确定的缺陷,因而关于这一研究仍需不断地完善和改进[17,18]。5)作者合作(coauthorhip)及、机构合作在优选化趋势益明显的,科研人员相互之间进行科研合作是普遍的现象,很多品质的研究成果需要通过不同科研人员的紧密协作完成。在文献计量研
- 【目录】
-
前言章 绪论 11.1 研究背景 11.2 国内外相关研究领域的发展现状与趋势 21.2.1 知识发现的理论与实践研究 21.2.2 共现的相关研究 21.3 研究问题的提出 91.4 研究目标与研究意义 101.5 研究思路与框架 111.6 研究方法 121.7 本书组织结构 13第2章 多重共现的基础理论研究 152.1 相关概念内涵 152.1.1 共现的分析范畴 152.1.2 多重共现的定义与研究范畴 162.2 多重共现特征项的变量符号 172.3 多重共现的矩阵定义与数据组织形式 192.4 多重共现的延展系数 232.5 小结 25第3章 多重共现的可视化方法研究 263.1 可视化概念简介 263.2 知识图谱的可视化软件工具简介 283.3 可应用于多重共现的可视化方式研究 333.3.1 多重共现的社会网络可视化方式 333.3.2 多重共现的交叉图技术可视化方式 383.3.3 多重共现的可视化方式对比研究 433.4 小结 43第4章 多重共现知识发现方法的理论研究 454.1 知识发现的概念、模式及一般过程 454.1.1 数据、信息与知识的定义 454.1.2 知识发现的概念 464.1.3 知识发现的模式 474.1.4 知识发现的一般过程 484.2 多重共现的知识发现方法体系设计 514.2.1 共现关联强度的分析方法设计 524.2.2 被引关联强度的分析方法设计 594.2.3 共现突发强度的分析方法设计 654.2.4 多重共现的知识发现方法与一般共现分析效果对比 704.3 多重共现知识发现可视化分析工具的设计与开发 714.3.1 MOVT数据处理及可视化绘图流程 724.3.2 MOVT模块构成 734.3.3 MOVT与DIVA对比 744.4 小结 74第5章 三重共现知识发现方法的实证研究 765.1 共现关联强度的实证分析 765.1.1 研究领域的分析一 765.1.2 研究领域的分析二 825.1.3 研究机构的分析 865.1.4 机构间的对比分析 955.1.5 研究学者的分析 1025.2 被引关联强度的实证分析 1055.2.1 分析模型 1055.2.2 数据来源 1065.2.3 样例分析 1075.2.4 分析效果 1095.3 共现突发强度的实证分析 1105.3.1 分析模型 1105.3.2 数据来源 1125.3.3 样例分析 1125.3.4 分析效果 1135.4 各方法联立的实证分析 1145.5 小结 115第6章 总结与展望 1176.1 研究总结 1176.1.1 相关理论的研究 1176.1.2 多重共现基础理论体系的构建 1176.1.3 多重共现的可视化方法研究 1196.1.4 多重共现知识发现方法的理论研究 1206.1.5 三重共现知识发现方法的实证研究 1216.2 研究的创新之处 1226.3 研究展望 122参考文献 128
作者介绍
序言
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价