智能系统与技术丛书基于深度学习的自然语言处理 版权信息
- 出版社:机械工业出版社
- 出版时间:2020-05-01
- ISBN:9787111653578
- 条形码:9787111653578 ; 978-7-111-65357-8
智能系统与技术丛书基于深度学习的自然语言处理 本书特色
将深度学习方法应用于自然语言处理,涵盖自然语言处理领域热门话题
智能系统与技术丛书基于深度学习的自然语言处理 内容简介
自然语言处理(Natural Language Processing,NLP)属于人工智能的一个子领域,是指用计算机对自然语言的形、音、义等信息进行处理,即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等进行操作和加工。它对计算机和人类的交互方式有许多重要的影响。本书可划分为三大部分:部分包括、2章,主要介绍了NLP的常用基本技术,包括词嵌入、文本规范化、标记文本、词性标注等,并且附有练习,以帮助读者实际上手和巩固所学知识;第二部分涵盖第3章到第8章,这部分专门针对用于NLP任务的神经网络与深度学习技术进行讲解,包括CNN、RNN、GRU、LSTM等,特别是第8章讲解了很前沿的用于自然语言处理任务的技术,包括注意力机制、transformer及BERT等;第三部分(第9 章)则是NLP在真正项目工作流中的体现。原理加项目代码实现是整本书的特点。希望读者可以多编码,加深记忆。
智能系统与技术丛书基于深度学习的自然语言处理 目录
译者序
前言
第1章 自然语言处理
1.1 本章概览
1.2 自然语言处理的基础知识
1.3 自然语言处理的能力
1.4 自然语言处理中的应用
1.4.1 文本预处理
1.4.2 文本预处理技术
1.5 词嵌入
1.6 本章小结
第2章 自然语言处理的应用
2.1 本章概览
2.2 词性标注
2.2.1 词性
2.2.2 词性标注器
2.3 词性标注的应用
2.4 分块
2.5 加缝
2.6 命名实体识别
2.6.1 命名实体
2.6.2 命名实体识别器
2.6.3 命名实体识别的应用
2.6.4 命名实体识别器类型
2.7 本章小结
第3章 神经网络
3.1 本章概览
3.1.1 深度学习简介
3.1.2 机器学习与深度学习的比较
3.2 神经网络
3.3 训练神经网络
3.3.1 计算权重
3.3.2 损失函数
3.3.3 梯度下降算法
3.3.4 反向传播
3.4 神经网络的设计及其应用
3.4.1 有监督神经网络
3.4.2 无监督神经网络
3.5 部署模型即服务的基础
3.6 本章小结
第4章 卷积神经网络
4.1 本章概览
4.2 理解CNN的架构
4.2.1 特征提取
4.2.2 随机失活
4.2.3 卷积神经网络的分类
4.3 训练CNN
4.4 CNN的应用领域
4.5 本章小结
第5章 循环神经网络
5.1 本章概览
5.2 神经网络的早期版本
5.3 RNN
5.3.1 RNN架构
5.3.2 BPTT
5.4 更新和梯度流
5.4.1 调整权重矩阵Wy
5.4.2 调整权重矩阵Ws
5.4.3 关于更新Wx
5.5 梯度
5.5.1 梯度爆炸
5.5.2 梯度消失
5.5.3 Keras实现RNN
5.5.4 有状态与无状态
5.6 本章小结
第6章 门控循环单元
6.1 本章概览
6.2 简单RNN的缺点
6.3 门控循环单元
6.3.1 门的类型
6.3.2 更新门
6.3.3 重置门
6.3.4 候选激活函数
6.3.5 GRU变体
6.4 基于GRU的情感分析
6.5 本章小结
第7章 长短期记忆网络
7.1 本章概览
7.1.1 LSTM
7.1.2 遗忘门
7.2 输入门和候选单元状态
7.3 输出门和当前激活
7.4 神经语言翻译
7.5 本章小结
第8章 自然语言处理前沿
8.1 本章概览
8.1.1 注意力机制
8.1.2 注意力机制模型
8.1.3 使用注意力机制的数据标准化
8.1.4 编码器
8.1.5 解码器
8.1.6 注意力机制
8.1.7 α的计算
8.2 其他架构和发展状况
8.2.1 transformer
8.2.2 RERT
8.2.3 Open AI GPT
8.3 本章小结
第9章 组织中的实际NLP项目工作流
9.1 本章概览
9.1.1 机器学习产品开发的一般工作流
9.1.2 演示工作流
9.1.3 研究工作流
9.1.4 面向生产的工作流
9.2 问题定义
9.3 数据采集
9.4 谷歌Colab
9.5 Flask
9.6 部署
9.6.1 对Flask网络应用程序进行更改
9.6.2 使用Docker将Flask网络应用程序包装到容器中
9.6.3 将容器托管在亚马逊网络服务EC2实例上
9.6.4 改进
9.7 本章小结
附录
智能系统与技术丛书基于深度学习的自然语言处理 作者简介
卡蒂克・雷迪・博卡(Karthiek Reddy Bokka)语音和音频机器学习工程师,毕业于南加州大学,目前在波特兰的 Bi-amp Systems公司工作。他的兴趣包括深度学习、数字信号和音频处理、自然语言处理以及计算机视觉。他拥有设计、构建和部署人工智能应用程序的经验,这些应用程序可以用各种形式的实际数据(包括图像、语音、音乐、非结构化原始数据等)来解决现实世界中的问题。舒班吉・霍拉(Shubhangi Hora)Python开发者、人工智能爱好者和作家。她有计算机科学和心理学背景,对与心理健康相关的人工智能特别感兴趣。她住在印度浦那,热衷于通过机器学习和深度学习来推进自然语言处理。除此之外,她还喜欢表演艺术,是一名训练有素的音乐家。塔努吉・贾因(Tanuj Jain)在德国公司工作的数据科学家。他一直在开发深度学习模型,并将其投入生产以商用。他对自然语言处理特别感兴趣,并将自己的专业知识应用于分类和情感评级任务。他拥有电气工程硕士学位,主要研究统计模式识别。莫尼卡・瓦姆布吉(Monicah Wambugu)金融技术公司的首席数据科学家,该公司通过利用数据、机器学习和分析来提供小额贷款,以执行替代信用评分。她是加州大学伯克利分校信息管理与系统硕士研究生。Monicah对如何利用数据科学和机器学习来设计产品和应用程序,以满足目标受众的行为和社会经济需求特别感兴趣。