Python文本数据分析与挖掘
全新正版 极速发货
¥
29.49
3.7折
¥
79.8
全新
库存10件
作者(日)山内长承
出版社中国青年出版社
ISBN9787515362946
出版时间2021-06
装帧平装
开本32开
定价79.8元
货号1202330754
上书时间2024-09-04
商品详情
- 品相描述:全新
- 商品描述
-
目录
前言
章 文本挖掘的概要
1.1 什么是文本挖掘
1.2 应用实例
第2章 Python概要和实验准备
2.1 什么是Python
2.2 编写、运行程序的环境
2.3 Python的语法规则
2.4 可用于文本挖掘的程序包
2.5 数据的准备
第3章 文本分割和数据分析的方法
3.1 文本的构成元素
3.2 统计分析、数据挖掘的基本方法
3.3 文本挖掘特有的方法
第4章 频率统计的实际应用
4.1 文字单位的出现频率分析
4.2 单词的出现频率分析
第5章 文本挖掘的各种处理示例
5.1 连续·N-gram的分析和利用
5.2 词的重要性和TF-IDF分析
5.3 基于KWIC的检索
5.4 基于单词属性的积极消极分析
5.5 基于WordNet的同义词检索
5.6 句法分析和关联分析的实际操作
5.7 语义分析和Word2Vec
附录 Python编程环境的简单安装
A.1 什么是开发环境
A.2 在Windows10上的安装
A.3 开始使用Jupyter Notebook
A.4 作业结果的保存和Jupyter Notebook的结束
内容摘要
书中将自然语言处理技术和统计处理技术视为工具,不会涉及到其繁琐的原理、数学定理等。书中利用操作简便的Python程序包来处理文本数据,探索文本挖掘可以帮我们做到的事情,而非用很好的技术进行程序设计。书中用简单明快的例子演示应用效果,并配有视频展示,下载资料包即可获取视频和案例二维码!本书通过5个章节介绍相关知识,章介绍文本挖掘的整体印象;在第2章中概括介绍了本书后面用到的Python的必要知识;第3章中介绍文本处理相关的基本概念和观点;第4章中利用Python学习作为基础处理的频率分析方法和其能得到的结果;很后,在第5章中介绍文本挖掘需要用到的各种具体方法以及在Python中的处理步骤。
— 没有更多了 —
以下为对购买帮助不大的评价