• 基于Python的智能文本分析
图书条目标准图
21年品牌 40万+商家 超1.5亿件商品

基于Python的智能文本分析

40.5 4.6折 88 全新

仅1件

河北保定
认证卖家担保交易快速发货售后保障

作者Benjamin、Bengfort、Rebecca、Bilbro、Tony 著

出版社中国电力出版社

出版时间2019-12

版次1

装帧平装

货号9787519838294

上书时间2024-10-22

尚贤文化河北分店的书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
图书标准信息
  • 作者 Benjamin、Bengfort、Rebecca、Bilbro、Tony 著
  • 出版社 中国电力出版社
  • 出版时间 2019-12
  • 版次 1
  • ISBN 9787519838294
  • 定价 88.00元
  • 装帧 平装
  • 开本 16开
  • 纸张 胶版纸
  • 页数 328页
  • 字数 392千字
【内容简介】

 

 

·预处理并将文本向量化成高维特征表示。

 

·执行文档分类和主题建模。

 

·通过可视化诊断指导模型选择过程。

 

·提取关键短语、命名实体和图结构,实现文本数据推断。

 

·建立对话框架,实现聊天机器人和语言驱动交互。

 

·用Spark扩展处理能力,用神经网络实现对更复杂模型的支持。

 


【作者简介】

 

 

Benjamin Bengfort是一位专门研究分布式系统、机器学习及其他相关技术的计算机科学家。

 

Rebecca Bilbro是一名数据科学家和Python程序员,致力于研究机器学习工作流的可视化诊断。

 

Tony Ojeda是District Data Labs的创始人和CEO,专注于商业策略应用分析、优化、预测服务,以及开源工具使用课程。

 

 

 

 

 

译者介绍

 

 

 

陈光,北京邮电大学副教授,主要研究方向为机器学习和自然语言处理。

 


【目录】

前言 1

 

第1章 语言与计算 13

 

数据科学范式 14

 

语言感知数据产品 .16

 

语言即数据 21

 

小结 .29

 

第 2 章 构建自定义语料库 31

 

语料库是什么? .32

 

语料库数据管理 .35

 

语料库读取器 39

 

小结 .49

 

第3章 语料库预处理与处置 50

 

分解文档.50

 

语料库的转换 60

 

小结 .67

 

第4章 文本向量化和转换流水线 68

 

空间中的词 69

 

Scikit-Learn API .81

 

流水线 .88

 

小结 .93

 

第5章 面向文本分析的文本分类 95

 

文本分类.96

 

构建文本分类应用 .99

 

小结 .110

 

第6章 文本相似性聚类 . 112

 

文本上的无监督学习 112

 

文档相似性聚类 .114

 

文档主题建模 127

 

小结 .139

 

第7章 上下文感知文本分析 140

 

基于语法的特征提取 141

 

n-Gram特征提取 147

 

n-Gram语言模型 155

 

小结 .165

 

第8章 文本可视化 166

 

可视化特征空间 .167

 

模型诊断.185

 

可视化操纵 193

 

小结 .196

 

第9章 文本的图分析 .198

 

图计算与分析 200

 

从文本中抽取图 .204

 

实体解析.216

 

小结 .221

 

第10章 聊天机器人 223

 

对话基础.224

 

礼貌对话规则 231

 

有趣的问题 239

 

学习帮助.250

 

小结 .257

 

第11章 利用多处理和Spark扩展文本分析259

 

Python多处理 .260

 

Spark集群计算 271

 

小结 .289

 

第12章 深度学习与未来 .291

 

应用神经网络 292

 

神经网络语言模型 .292

 

情感分析.303

 

未来(几乎)已来 .309

 

词汇表  311

 


点击展开 点击收起

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP