自然语言标注:用于机器学习9787564142810
正版图书,可开发票,请放心购买。
¥
33.87
6.3折
¥
54
全新
库存2件
作者James Pustejovsky,Amber Stubbs著
出版社东南大学出版社
ISBN9787564142810
出版时间2012-02
装帧平装
开本其他
定价54元
货号8104315
上书时间2024-12-14
商品详情
- 品相描述:全新
- 商品描述
-
导语摘要
是时候创建属于你自己的用于机器学习的自然语言训练语料库了。无论你使用英语、汉语或者其他任何一种自然语言,普斯特若夫斯基、斯塔布斯著的《自然语言标注--用于机器学习(影印版)》都可以手把手地指导你一种经验证的标注开发周期一一把元语添加到你的训练语料库中来帮助机器学习算法更有效工作的过程。你无需任何编程或者语言学方面的经验就可以上手。
作者简介
刚刚获得了Brandeis大学标注方法论的博士学位。她现在是SUNYAlbany大学的博士后是Brandeis大学的教授,他在该大学的计算机科学系讲解和研究人工智能及计算语言学。
目录
Preface
1. TheBasics
The Importance of Language Annotation
The Layers of Linguistic Description
What Is Natural Language Processing?
A Brief History of Corpus Linguistics
What Is a Corpus?
Early Use of Corpora
Corpora Today
Kinds of Annotation
Language Data and Machine Learnin9
Classification
Clustering
Structured Pattern Induction
The Annotation Development Cycle
Model the Phenomenon
Annotate with the Specification
Train and Test the Algorithms over the Corpus
Evaluate the Results
Revise the Model and Algorithms
Summary
2. DefiningYourGoaI and Dataset
Defining Yoor Goal
The Statement of Purpose
Refining Your Goal:Informativity Versus Correctness
Background Research
Language Resources
……
内容摘要
是时候创建属于你自己的用于机器学习的自然语言训练语料库了。无论你使用英语、汉语或者其他任何一种自然语言,《自然语言标注--用于机器学习(影印版)》都可以手把手地指导你一种经验证的标注开发周期一一把元语添加到你的训练语料库中来帮助机器学习算法更有效工作的过程。你无需任何编程或者语言学方面的经验就可以上手。
普斯特若夫斯基、斯塔布斯著的《自然语言标注--用于机器学习(影印版)》通过每一步中的详细示例,你将学到“标注开发过程”是如何帮助你建模、标注、训练、测试、评估和修正你的训练语料库。你也将了解到一个实际标注项目的完整演示。
本书内容:在收集你的数据集(语料库)之前定义一个清晰的标注目标学习用于分析你的语料库中语言内容的工具搭建用于你的标注项目的模型和规范检查从基本的XML到语言标记框架这样一些不同的标注格
式创建适合于训练和测试机器学习算法的黄金标准语料库选择用来处理你的标注数据的机器学习算法评估测试结果并修正你的标注任务学习如何使用用于标注文本和调整标注的轻量级软件
精彩内容
是时候创建属于你自己的用于机器学习的自然语言训练语料库 了。无论你使用英语、汉语或者其他任何意种自然语言,本书都 可以手把手地指导你义种经验证的标注开发周期一一把元语添加 到你的训练语料库中来帮助机器学习算法更有效工作的过程。你 无需任何编程或者语言学方面的经验就可以上手。
通过每ー步中的详细示例,你将学到"标注开发过程"是如何帮 助你建模、标注、训练、测试、评估和修正你的训练语料库。你 也将了解到一个实际标注项目的完整演示。
在收集你的数据集(语料库)之前定义一个清晰的标注目
学习用子分析你的语料库中语言内容的工具
搭建用于你的标注项目的模型和规范
检査从基本的XML到语言标记框架这样ー些不同的标注格
创建适合于训练和测试机器学习算法的黃金标准语料库
选择用来处理你的标注数据的机器学习算法
评估测试结果并修正你的标注任务
学习如何使用用于标注文本和调整标注的轻置级软件
— 没有更多了 —
以下为对购买帮助不大的评价