Python自然语言处理
全新正版 急速发货
¥
36.4
6.7折
¥
54
全新
库存7件
作者刘鸿博
出版社电子工业出版社
ISBN9787121446597
出版时间2022-12
装帧平装
开本其他
定价54元
货号29507077
上书时间2024-11-24
商品详情
- 品相描述:全新
- 商品描述
-
导语摘要
本书基于Python编程语言,以实战为导向,主要介绍自然语言处理的各种理论、方法及应用案例。全书共14章:第1~3章侧重介绍自然语言处理所必需的理论基础知识,包括自然语言处理基础、Python基础、语料库基础等内容;第4~10章主要讲解词法分析、词向量与关键词提取、句法分析、语义分析、情感分析等自然语言处理核心技术的原理及实现方法,以及自然语言处理中常用的机器学习和深度学习技术;第11~14章主要介绍自然语言处理比较典型的应用场景,包括机器翻译与写作、智能问答与对话及个性化推荐,以及自然语言处理技术在医疗、司法和金融领域的应用情况。本书设置较多示例,实操性较强,建议读者根据书内讲解动手完成实验,以便巩固所学内容。
作者简介
刘鸿博,中国共产党员。池州学院大数据与人工智能学院副院长,池州学院大数据与人工智能学院大数据应用创新中心副主任。先后参与太原市公安局、苏州工业园区公安局、湖北省公安厅大数据与人工智能平台人像识别与生物特征识别的架构设计与实施。在自然语言处理、数据分析等领域有多年的研究。
目录
目 录
第1章 自然语言处理基础1
1.1 什么是自然语言处理1
1.1.1 自然语言处理的概念1
1.1.2 自然语言处理的研究任务3
1.2 自然语言处理的发展历程4
1.3 自然语言处理相关知识的构成6
1.3.1 基础术语6
1.3.2 知识结构7
1.4 探讨自然语言处理的几个层面8
1.5 自然语言处理与人工智能10
第2章 Python基础11
2.1 搭建Python开发环境11
2.1.1 Python的科学计算发行版—Anaconda11
2.1.2 Anaconda的下载与安装13
2.2 正则表达式在自然语言处理中的基本应用17
2.2.1 匹配字符串18
2.2.2 使用转义符20
2.2.3 抽取文本中的数字21
2.3 Numpy使用详解22
2.3.1 创建数组22
2.3.2 获取Numpy中数组的维度24
2.3.3 获取本地数据24
2.3.4 正确读取数据25
2.3.5 Numpy数组索引25
2.3.6 Numpy数组切片26
2.3.7 数组比较26
2.3.8 替代值27
2.3.9 数据类型的转换28
2.3.10 Numpy的统计计算方法29
第3章 语料库基础30
3.1 语料库基础概述30
3.2 自然语言工具包NLTK31
3.2.1 NLTK概述31
3.2.2 安装NLTK32
3.2.3 使用NLTK33
3.2.4 在Python NLTK下使用Stanford NLP37
3.3 获取语料库41
3.3.1 访问网站41
3.3.2 编写程序42
3.3.3 通过NLTK获取43
3.4 综合案例:走进《红楼梦》46
3.4.1 数据采集和预处理46
3.4.2 构建本地语料库47
3.4.3 语料操作47
第4章 词法分析51
4.1 中文分词51
4.1.1 中文分词介绍51
4.1.2 规则分词52
4.1.3 统计分词58
4.1.4 混合分词67
4.1.5 中文分词工具—Jieba67
4.2 词性标注70
4.2.1 词性标注概述70
4.2.2 词性标注规范71
4.2.3 Jieba分词中的词性标注72
4.3 命名实体识别73
4.3.1 命名实体识别概述73
4.3.2 基于CRF的命名实体识别75
4.3.3 日期识别实战77
4.3.4 地名识别实战81
第5章 词向量与关键词提取90
5.1 词向量算法word2vec90
5.1.1 神经网络语言模型91
5.1.2 C&W模型92
5.1.3 CBOW模型和Skip-gram模型93
5.2 关键词提取技术概述94
5.3 TF-IDF算法95
5.4 TextRank算法96
5.5 LSA/LSI/LDA算法98
5.5.1 LSA/LSI算法98
5.5.2 LDA算法99
5.6 提取文本关键词100
第6章 句法分析108
6.1 句法分析概述108
6.1.1 句法分析的基本概念108
6.1.2 句法分析的基本方法109
6.2 句法分析的数据集与评测方法109
6.2.1 句法分析的数据集110
6.2.2 句法分析的评测方法111
6.3 句法分析的常用方法111
6.3.1 基于PCFG的句法分析112
6.3.2 基于间隔马尔可夫网络的句法分析113
6.3.3 基于CRF的句法分析114
6.3.4 基于移进-归约的句法分析模型114
6.4 使用Stanford Parser的PCFG算法进行句法分析115
6.4.1 Stanford Parser115
6.4.2 基于PCFG的中文句法分析实战116
第7章 语义分析119
7.1 词义消歧119
7.1.1 基于规则的词义消歧120
7.1.2 基于统计的词义消歧121
7.1.3 基于实例的词义消歧122
7.1.4 基于词典的词义消歧122
7.2 语义角色标注124
7.2.1 格语法124
7.2.2 基于统计机器学习技术的语义角色标注125
7.3 深层语义推理126
7.3.1 命题逻辑和谓词逻辑126
7.3.2 语义网络127
7.3.3 概念依存理论129
第8章 情感分析130
8.1 情感分析的应用领域130
8.2 情感分析的基本方法131
8.2.1 词法分析132
8.2.2 机器学习方法132
8.2.3 混合分析132
8.3 实战—电影评论情感分析133
8.3.1 模型选择134
8.3.2 载入数据136
8.3.3 辅助函数138
8.3.4 模型设置138
8.3.5 调参配置140
8.3.6 训练过程140
第9章 机器学习与自然语言处理141
9.1 几种常用的机器学习方法141
9.1.1 文本分类141
9.1.2 特征提取142
9.1.3 标注142
9.1.4 搜索与排序143
9.1.5 推荐系统144
9.1.6 序列学习145
9.2 无监督学习的文本聚类146
9.3 文本分类实战:中文垃圾邮件分类148
9.3.1 实现代码148
9.3.2 评价指标151
9.4 文本聚类实战:用k-means对豆瓣读书数据聚类153
第10章 深度学习与自然语言处理157
10.1 词嵌入算法157
10.1.1 词向量157
10.1.2 word2vec158
10.1.3 词向量模型159
10.1.4 CBOW和Skip-gram161
10.2 训练词向量实践161
10.3 RNN166
10.3.1 简单RNN166
10.3.2 LSTM网络168
10.3.3 Attention机制172
10.4 seq2seq模型与实战173
10.4.1 seq2seq模型173
10.4.2 实战seq2seq问答机器人174
第11章 机器翻译与写作194
11.1 机器翻译194
11.1.1 机器翻译的意义194
11.1.2 经典的神经网络机器翻译模型195
11.1.3 机器翻译译文质量评价200
11.1.4 机器翻译面临的挑战202
11.2 机器写作203
11.2.1 什么是机器写作203
11.2.2 艺术写作204
11.2.3 当代写作207
第12章 智能问答与对话212
12.1 智能问答212
12.2 智能对话系统212
12.2.1 对话系统的基本过程213
12.2.2 对话系统的常见场景213
12.3 问答系统的主要组成214
12.4 不同类型的问答系统215
12.4.1 文本问答系统216
12.4.2 阅读理解型文本问答系统220
12.4.3 社区问答系统223
12.4.4 IBM的“沃森”问答系统225
12.5 前景与挑战226
第13章 个性化推荐227
13.1 推荐系统是什么227
13.2 个性化推荐的基本问题227
13.2.1 推荐系统的输入228
13.2.2 推荐系统的输出228
13.2.3 推荐的基本形式229
13.2.4 推荐系统的三大核心230
13.3 推荐的可解释性230
13.4 前景与挑战232
13.4.1 推荐系统面临的问题232
13.4.2 推荐系统的新方向233
第14章 行业应用235
14.1 智慧医疗235
14.1.1 智慧医疗的产生与概念235
14.1.2 智慧医疗中的人工智能237
14.1.3 前景与挑战239
14.2 智慧司法240
14.2.1 智慧司法是什么240
14.2.2 研究与应用方向241
14.2.3 期望与挑战247
14.3 智能金融248
14.3.1 了解智能金融248
14.3.2 智能金融技术的应用252
14.3.3 智能金融的前景与挑战254
内容摘要
本书基于Python编程语言,以实战为导向,主要介绍自然语言处理的各种理论、方法及应用案例。全书共14章:第1~3章侧重介绍自然语言处理所必需的理论基础知识,包括自然语言处理基础、Python基础、语料库基础等内容;第4~10章主要讲解词法分析、词向量与关键词提取、句法分析、语义分析、情感分析等自然语言处理核心技术的原理及实现方法,以及自然语言处理中常用的机器学习和深度学习技术;第11~14章主要介绍自然语言处理比较典型的应用场景,包括机器翻译与写作、智能问答与对话及个性化推荐,以及自然语言处理技术在医疗、司法和金融领域的应用情况。本书设置较多示例,实操性较强,建议读者根据书内讲解动手完成实验,以便巩固所学内容。
主编推荐
刘鸿博,中国共产党员。池州学院大数据与人工智能学院副院长,池州学院大数据与人工智能学院大数据应用创新中心副主任。先后参与太原市公安局、苏州工业园区公安局、湖北省公安厅大数据与人工智能平台人像识别与生物特征识别的架构设计与实施。在自然语言处理、数据分析等领域有多年的研究。
— 没有更多了 —
以下为对购买帮助不大的评价