自然语言处理方法——使用Python基于机器学习和深度学习发掘文本数据
¥
8
1.7折
¥
48
八五品
仅1件
作者王侃
出版社西安电子科技大学出版社
出版时间2021-04
版次1
印刷时间2021-04
印次1
装帧其他
上书时间2024-11-13
商品详情
- 品相描述:八五品
-
正版有点划线
图书标准信息
-
作者
王侃
-
出版社
西安电子科技大学出版社
-
出版时间
2021-04
-
版次
1
-
ISBN
9787560660219
-
定价
48.00元
-
装帧
其他
-
开本
16开
-
纸张
胶版纸
-
页数
176页
-
字数
178千字
- 【内容简介】
-
本书系统介绍了基于机器学习和深度学习对文本数据进行挖掘和分析的方法,从文本分类、语音识别、主题建模、文本总结、文本生成、情感分析等多个自然语言处理的应用角度出发,对自然语言处理进行了深入解读,通过大量Python代码帮助读者快速学习并实现基本的甚至较高级的自然语言处理技术。
全书共六章。第1章介绍数据的收集和提取,包括从网页、PDF、Word、HTML、JSON中收集数据;第2章介绍文本数据的处理,包括形式转换、删除标点符号、拼写校正、词干提取、词形还原等;第3章介绍文本特征工程,采用的技术包括One Hot编码、统计向量化、N-grams、哈希向量化、共生矩阵等;第4章介绍高级自然语言处理,包括文本相似度计算、词性标注、提取实体、提取主题、情感分析、语音和文本互转等;第5章介绍自然语言处理的行业应用,如多类分类、文本数据总结、文档聚类、自然语言处理在搜索引擎中的应用等;第6章介绍基于深度学习的自然语言处理,通过深度学习实现信息检索、文本分类和单词预测。
本书注重理论与实践相结合,具有较好的实用性,可为自然语言处理或机器学习的相关从业人员以及爱好者提供业务学习指导,也可为Python程序员提供技术参考,还可为高等院校相关专业的本科生和研究生提供学习参考。
- 【作者简介】
-
阿克沙伊库尔卡尼(akshaykulkarni),人工智能和机器学专家,在人工智能和机器学的建模与扩展应用方有丰富的经验。akshaykulkarni目前是sapientrazorfish核心数据科学团队的数据科学家。在该团队中,akshaykulkarni致力于利用人工智能进行策略和转换干预,并利用新的技术开展各种机器学、深度学和人工智能方面的工作。此前,akshaykulkarni曾供职于gartner和accenture,负责分析和数据科学业务。
- 【目录】
-
引言
章提取数据
概述
方1-1使用api收集文本数据
方1-2从pdf中收集数据
方1-3从word文件中收集数据
方1-4从json中收集数据
方1-5从html中收集数据
方1-6使用正则表达式解析文本
方1-7处理字符串
方1-8从网页抓取文本
第2章探索和处理文本数据
方2-1将文本数据转换为小写形式
方2-2删除标点符号
方2-3删除停止词
方2-4文本标准化
方2-5拼写校正
……
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价