Python语言数据分析
正版新书 新华官方库房直发 可开电子发票
¥
44.88
6.6折
¥
68
全新
库存9件
作者管新潮
出版社上海交通大学出版社
ISBN9787313248916
出版时间2021-05
版次1
装帧平装
开本16开
纸张胶版纸
页数272页
字数322千字
定价68元
货号SC:9787313248916
上书时间2024-10-30
商品详情
- 品相描述:全新
-
全新正版 提供发票
- 商品描述
-
内容简介:
本书分为上下篇,共计十章,以如何将Python编程技术融入语言学/翻译学教学科研活动为线索,展开涉及短语学、情感分析、相似性度量、语义分析、主题建模、语言学变量等方面的语言数据分析。上篇为语言数据分析的基础性知识,旨在构建后续深入分析的技术性前提条件;下篇为语言数据分析的理论与应用,专注于探索语言知识与技术的融合性分析路径。本书以案例讲解为特点,其中的工具案例用于描述技术工具的适用性和可靠性,解决技术应用之前有关编程技术的知识问题;语言学路径案例则紧密结合语言学/翻译学知识探索如何以技术手段解决教学科研中的相关问题。案例的呈现也同时说明算法在解决案例问题中的重要性。本书适合高等院校语言学、翻译学等专业的师生以及从事语言或翻译实践活动的社会人士阅读使用。
目录:
上篇 语言数据分析基础
第1章 语言数据结构
1.1 一维数据结构
1.1.1 单词列表
1.1.2 术语列表
1.1.3 句子列表
1.1.4 段落列表
1.1.5 语篇列表
1.1.6 其他一维数据结构
1.2 二维数据结构
1.2.1 字典结构
1.2.2 元组列表结构
1.2.3 二维数据的遍历
1.3 多维数据结构
1.3.1 元组字典结构
1.3.2 列表元组列表结构
1.3.3 Brown语料库词性标记训练集
1.4 数据结构转换
1.4.1 多连词的转换
1.4.2 矩阵结构的转换
1.4.3 spaCy列表到NLTK列表的转换
第2章 语言数据清洗
2.1 Python数据清洗方法
2.1.1 无效字符清除方法
2.1.2 字符判断方法
2.1.3 替换方法
2.1.4 标点符号清除方法
2.1.5 停用词方法
2.2 无效信息的清洗
2.2.1 何为无效信息
2.2.2 新闻文本的语言数据清洗
2.2.3 中文动词的清洗
2.3 有效信息的清洗
2.3.1 何为有效信息
2.3.2 英文动词词组的清洗
2.3.3 词形还原法
2.3.4 特征值清洗
第3章 语言数据可视化
3.1 数字结果可视化
3.1.1 语篇词汇密度分布及其柱状图可视化
3.1.2 作业分数统计及其正态分布拟合可
...
— 没有更多了 —
全新正版 提供发票
以下为对购买帮助不大的评价