自然语言处理从入门到实战

编号:: wx1202070802

销售价:: ￥69.43; (市场价: ~~￥79.80~~)

赠送积分:: 69

数量:: 件

商品介绍
商品参数
商品评论
商品咨询

商品介绍

本书特色1内容安排实用实在、详略得当，符合初学者的认知规律本书内容涵盖了从自然语言数据处理、基础任务（如分词、词性标注、命名实体识别等）到实战性任务（如文本分类、文本摘要、聊天系统等）所必须掌握的知识，从内容结构上很好注重知识的实用性和可操作性。必须掌握的细节处不吝笔墨，辅以图表以及代码加深读者印象；对仅需要大致了解处简要介绍一些相关理论及前沿动态。这样的安排使得初学者能够掌握推荐知识，了解并思考学术前沿及行业应用，符合初学者对自然语言处理知识的认知规律。2行文简单直白，以实例引导理论，特别适合初学者阅读本书行文简单直白，全程都有相应的实例作为引导，对于比较难的内容尽量以举例的形式帮助读者理解。在介绍这些知识时，并不是教条式的，填鸭式的讲解，而是尽量以平实化的语言讲解相关理论，犹如帮助一位老朋友，一步步地成为初级自然语言处理工程师。3设置思考题以及项目代码，激发初学者的热情与兴趣本书的每一章都设置有相应的思考题，并在附录中提供了相关参考答案；读者可以自测对章节内容的学习的掌握程度。此外，本书章节介绍的代码实例，相关的电子版本会随书赠予，使读者能够进行实践操作，更加深入地理解知识。这些实践内容是学习自然语言处理过程中必不可少的环节，通过思考题以及代码的操作练习，能够使读者朋友快速地入门自然语言处理。

为了帮助广大爱好自然语言处理（NaturalLanguageProcessing,NLP）技术的读者朋友入门此领域，本书阐述了自然语言处理概况、领域应用、相关处理工具包、相关的机器学习及深度学习模型、文本预处理及文本表征等基础知识，以及具体的自然语言处理任务，包括文本分类、关系抽取、知识图谱、文本摘要、序列标注、机器翻译和聊天系统，同时介绍了自然语言处理技术在学术界以及工业界的发展、应用现状，并为读者们提供了部分面试参考题目。
本书适合有一定的编程及机器学习基础，想入门自然语言处理，以及想系统了解或准备求职自然语言处理初级岗位的读者阅读。

胡盼盼自然语言处理工程师，斯特拉斯堡大学计算机语言学硕士，曾任法国科学院（CNRS，Centre National de la Recherche Scientifique）算法研究员，负责过医疗知识图谱、聊天机器人、智能律师系统、文本生成系统等企业级核心项目。

部分了解自然语言处理
章自然语言处理初探
1.1 自然语言处理概述
1.1.1 自然语言处理早期发展史
1.1.2 新世纪的里程碑事件
1.2 自然语言处理的挑战
1.2.1 词义消歧
1.2.2 指代消解
1.2.3 上下文理解
1.2.4 语义与语用的不对等
1.3 自然语言处理的应用领域
1.3.1 医疗
1.3.2 教育
1.3.3 媒体
1.3.4 金融
1.3.5 法律
1.4 自然语言处理的常见工具
1.4.1 基础任务工具包
1.4.2 科学计算及机器学习框架
1.4.3 深度学习框架
本章小结
思考题
第二部分自然语言处理核心技术
第2章自然语言处理与机器学习
2.1 逻辑回归
2.1.1 逻辑回归基本原理
2.1.2 逻辑回归在实践中的注意要点
2.1.3 逻辑回归的优势与不足
2.2 朴素贝叶斯
2.2.1 朴素贝叶斯基本原理
2.2.2 朴素贝叶斯的类型
2.2.3 朴素贝叶斯的优势与不足
2.3 Kmeans算法
2.3.1 Kmeans算法基本原理
2.3.2 Kmeans算法实践
2.3.3 Kmeans算法的优势与不足
2.4 决策树
2.4.1 决策树的属性划分
2.4.2 随机森林的基本原理
2.4.3 随机森林在应用中的注意细节
2.5 主成分分析
2.5.1 梯度上升法解PCA
2.5.2 协方差矩阵解PCA
2.5.3 实战PCA
本章小结
思考题
第3章自然语言处理与神经网络
3.1 神经网络初探
3.1.1 神经元结构
3.1.2 常见的激活函数
3.1.3 误差反向传播算法
3.2 常见的神经网络结构
3.2.1 多层感知机
3.2.2 循环神经网络的基本原理
3.2.3 卷积神经网络的基本原理
3.2.4 神经网络的优势与不足
3.3 神经网络算法的改进与提升
3.3.1 防止过拟合的方法
3.3.2 训练速度与精度的提高方法
3.3.3 注意力机制
本章小结
思考题
第三部分自然语言处理基本任务
第4章文本预处理
4.1 文本预处理的基础项目
4.1.1 文本规范化
4.1.2 语义分析
4.1.3 分词
4.1.4 文本纠错
4.2 关键词提取
4.2.1 基于特征统计
4.2.2 基于主题模型
4.2.3 基于图模型
4.3 数据不平衡的处理
4.3.1 常见方法
4.3.2 数据不平衡问题实战
本章小结
思考题
第5章文本的表示技术
5.1 词袋模型
5.1.1 基于频次的词袋模型
5.1.2 基于TFIDF的词袋模型
5.1.3 相关工具的使用
5.2 Word2Vec词向量
5.2.1 Word2Vec的基本原理
5.2.2 Word2Vec模型细节及代码演示
5.2.3 应用工具训练Word2Vec
5.3 改进后的词表征
5.3.1 GloVe模型
5.3.2 FastText模型
5.3.3 ELMo模型
5.4 句向量
5.4.1 基于词向量的平均
5.4.2 沿用Word2Vec思想
5.4.3 有监督方式
本章小结
思考题
第6章序列标注
6.1 序列标注基础
6.1.1 序列标注的应用场景
6.1.2 基线方式
6.1.3 序列标注任务的难点
6.2 基于概率图的模型
6.2.1 隐马尔科夫模型（HMM）
6.2.2 优选熵马尔科夫模型（MEMM）
6.2.3 条件随机场模型（CRF）
6.2.4 天气预测实例
6.3 基于深度学习的方式
6.3.1 数据表征形式
6.3.2 序列处理模型
本章小结
思考题
第7章关系抽取
7.1 关系抽取基础
7.1.1 关系抽取概述
7.1.2 关系抽取的主要方法
7.1.3 深度学习与关系抽取
7.1.4 强化学习与关系抽取
7.2 基于半监督的关系抽取模式：Snowball系统
7.2.1 Patterns及Tuples的生成
7.2.2 Patterns及Tuples的评估
7.2.3 Snowball的实现细节
7.3 关系抽取工具——DeepDive
7.3.1 DeepDive概述
7.3.2 DeepDive工作流程
7.3.3 概率推断与因子图
本章小结
思考题
第四部分自然语言处理不错任务
第8章知识图谱
8.1 知识图谱基本概念
8.1.1 从语义网络到知识图谱
8.1.2 知识的结构化、存储及查询
8.1.3 几个开源的知识图谱
8.2 知识图谱的关键构建技术
8.2.1 本体匹配
8.2.2 实体链接
8.2.3 知识推理
8.3 知识图谱应用
8.3.1 反欺诈
8.3.2 个性化推荐
8.3.3 知识库问答
本章小结
思考题
第9章文本分类
9.1 文本分类的常见方法
9.1.1 机器学习
9.1.2 模型融合
9.1.3 深度学习
9.2 文本分类的不同应用场景
9.2.1 二分类
9.2.2 多分类
9.2.3 多标签多分类
9.3 案例：搭建一款新闻主题分类器
9.3.1 数据预处理
9.3.2 训练与预测
9.3.3 改进
本章小结
思考题
0章文本摘要
10.1 抽取式摘要

商品参数

基本信息
出版社	中国铁道出版社
ISBN	9787113266912
条码	9787113266912
编者	胡盼盼
译者	--
出版年月	2020-06-01 00:00:00.0
开本	16开
装帧	平装
页数	251
字数	366000
版次	1
印次	1
纸张	80g胶版纸

商品评论

暂无商品评论信息 [发表商品评论]

商品咨询

暂无商品咨询信息 [发表商品咨询]