Python文本数据分析与挖掘
全新正版 极速发货
¥
29.49
3.7折
¥
79.8
全新
库存10件
作者【日】山内长承著,张倩南刘博 译
出版社中国青年出版社
ISBN9787515362946
出版时间2021-06
装帧平装
开本32开
定价79.8元
货号1202330754
上书时间2024-06-05
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
目录
前言
第1章 文本挖掘的概要
1.1 什么是文本挖掘
1.2 应用实例
第2章 Python概要和实验准备
2.1 什么是Python
2.2 编写、运行程序的环境
2.3 Python的语法规则
2.4 可用于文本挖掘的程序包
2.5 数据的准备
第3章 文本分割和数据分析的方法
3.1 文本的构成元素
3.2 统计分析、数据挖掘的基本方法
3.3 文本挖掘特有的方法
第4章 频率统计的实际应用
4.1 文字单位的出现频率分析
4.2 单词的出现频率分析
第5章 文本挖掘的各种处理示例
5.1 连续?N-gram的分析和利用
5.2 词的重要性和TF-IDF分析
5.3 基于KWIC的检索
5.4 基于单词属性的积极消极分析
5.5 基于WordNet的同义词检索
5.6 句法分析和关联分析的实际操作
5.7 语义分析和Word2Vec
附录 Python编程环境的简单安装
A.1 什么是开发环境
A.2 在Windows10上的安装
A.3 开始使用Jupyter Notebook
A.4 作业结果的保存和Jupyter Notebook的结束
内容摘要
书中将自然语言处理技术和统计处理技术视为工具,不会涉及到其繁琐的原理、数学定理等。书中利用操作简便的Python程序包来处理文本数据,探索文本挖掘可以帮我们做到的事情,而非用尖端的技术进行程序设计。书中用简单明快的例子演示应用效果,并配有视频展示,下载资料包即可获取视频和案例二维码!
本书通过5个章节介绍相关知识,第1章介绍文本挖掘的整体印象;在第2章中概括介绍了本书后面用到的Python的必要知识;第3章中介绍文本处理相关的基本概念和观点;第4章中利用Python学习作为基础处理的频率分析方法和其能得到的结果;最后,在第5章中介绍文本挖掘需要用到的各种具体方法以及在Python中的处理步骤。
精彩内容
首先,我们要弄清楚三个问题:文本挖掘是干什么的?其内容是什么?在什么场合会用到文本挖掘?文本挖掘就是通过分析文本,把其中的信息压缩后提取出来的一种技术。需要准备的工具有两个:能把语言特征提取出来的自然语言处理技术和能从特征中把信息提取出来的统计处理技术。文本挖掘技术在问卷调查的意见分析、评价分析、话题的关联性分析和文书检索、分类等领域都得到了广泛的应用。
文本挖掘是指从文本数据中把信息挖掘出来,如同从大量沙土中找出被掩埋的宝贵钻石,文本挖掘是从大量文本数据中找出被掩埋的“有意义的信息”。
通过使用自然语言处理技术和统计学工具,从大量的文本数据中提取出压缩后有意义的信息。在这里,我们分别使用“文本数据”和“信息”这两个词。先说文本数据,比如各种各样的文件、在社交平台上发布的信息、关于产品或服务的问卷调查结果,这些数据的产生都有原本的目的。也就是说,我们是为了写文件、为了在社交平台上发布信息、为了评价产品或服务等目的,才去写作各种文本,而这些文本就是我们输入的“数据”。文本挖掘,就是从这些数据入手,比如从社交平台中提取出最近的流行趋势,从问卷调查中提取出对某种商品或服务的整体评价和出现的问题(图1-1)。而上面说的从社交平台上提取的流行趋势、通过问卷得到的评价和问题,和原来的文本数据相比,被大幅度地压缩了。我们把压缩后得到的东西称为“信息”。
— 没有更多了 —
以下为对购买帮助不大的评价