自然语言处理与计算语言学 NLP零基础入门自学教程 数据清洗文本分析统计学习方法人工智能深度学习入门 下载 kindle 电子版 pdf mobi pmlz 夸克云 caj

自然语言处理与计算语言学 NLP零基础入门自学教程 数据清洗文本分析统计学习方法人工智能深度学习入门电子书下载地址
- 文件名
- [epub 下载] 自然语言处理与计算语言学 NLP零基础入门自学教程 数据清洗文本分析统计学习方法人工智能深度学习入门 epub格式电子书
- [azw3 下载] 自然语言处理与计算语言学 NLP零基础入门自学教程 数据清洗文本分析统计学习方法人工智能深度学习入门 azw3格式电子书
- [pdf 下载] 自然语言处理与计算语言学 NLP零基础入门自学教程 数据清洗文本分析统计学习方法人工智能深度学习入门 pdf格式电子书
- [txt 下载] 自然语言处理与计算语言学 NLP零基础入门自学教程 数据清洗文本分析统计学习方法人工智能深度学习入门 txt格式电子书
- [mobi 下载] 自然语言处理与计算语言学 NLP零基础入门自学教程 数据清洗文本分析统计学习方法人工智能深度学习入门 mobi格式电子书
- [word 下载] 自然语言处理与计算语言学 NLP零基础入门自学教程 数据清洗文本分析统计学习方法人工智能深度学习入门 word格式电子书
- [kindle 下载] 自然语言处理与计算语言学 NLP零基础入门自学教程 数据清洗文本分析统计学习方法人工智能深度学习入门 kindle格式电子书
内容简介:
自然语言处理是一门融语言学、计算机科学、数学于一体的科学,研究人与计算机之间用自然语言进行有效通信的各种理论和方法。计算语言学是指通过建立形式化的数学模型来分析、处理自然语言,并在计算机上用程序来实现分析和处理的过程,旨在以机器来模拟人的部分或全部语言能力的目的。 《自然语言处理与计算语言学》作为一本借助于Python编程语言以及各种开源工具(如Gensim、spaCy等)来执行文本分析、自然语言处理和计算语言学算法的图书,从应用层面介绍了相关的理论知识和所涉及的技术。《自然语言处理与计算语言学》共分为15章,其内容涵盖了文本分析的定义、使用Python进行文本分析的技巧、spaCy语言模型、Gensim工具、词性标注及其应用、NER标注及其应用、依存分析、主题模型、高级主题建模、文本聚类和文本分类、查询词相似度计算和文本摘要、词嵌入、使用深度学习处理文本、使用Keras和spaCy进行深度学习、情感分析与聊天机器人的原理介绍等。 《自然语言处理与计算语言学》适合对自然语言处理的实现细节感兴趣的Python程序开发人员阅读。如果读者具备统计学的基本知识,对学习本书内容会大有裨益。
书籍目录:
第 1章 什么是文本分析 1
1.1 什么是文本分析 1
1.2 搜集数据 5
1.3 若输入错误数据,则输出亦为错误数据(garbage in,garbage out) 8
1.4 为什么你需要文本分析 9
1.5 总结 11
第 2章 Python文本分析技巧 12
2.1 为什么用Python来做文本分析 12
2.2 用Python进行文本操作 14
2.3 总结 18
第3章 spaCy语言模型 19
3.1 spaCy库 19
3.2 spaCy的安装步骤 21
3.3 故障排除 22
3.4 语言模型 22
3.5 安装语言模型 23
3.6 安装语言模型的方式及原因 25
3.7 语言模型的基本预处理操作 25
3.8 分词 26
3.9 词性标注 28
3.10 命名实体识别 29
3.11 规则匹配 30
3.12 预处理 31
3.13 总结 33
第4章 Gensim:文本向量化、向量变换和n-grams的工具 34
4.1 Gensim库介绍 34
4.2 向量以及为什么需要向量化 35
4.3 词袋(bag-of-words) 36
4.4 TF-IDF(词频-反向文档频率) 37
4.5 其他表示方式 38
4.6 Gensim中的向量变换 38
4.7 n-grams及其预处理技术 42
4.8 总结 44
第5章 词性标注及其应用 45
5.1 什么是词性标注 45
5.2 使用Python实现词性标注 49
5.3 使用spaCy进行词性标注 50
5.4 从头开始训练一个词性标注模型 53
5.5 词性标注的代码示例 57
5.6 总结 59
第6章 NER标注及其应用 60
6.1 什么是NER标注 60
6.2 用Python实现NER标注 64
6.3 使用spaCy实现NER标注 67
6.4 从头开始训练一个NER标注器 72
6.5 NER标注应用实例和可视化 77
6.6 总结 79
第7章 依存分析 80
7.1 依存分析 80
7.2 用Python实现依存分析 85
7.3 用spaCy实现依存分析 87
7.4 从头开始训练一个依存分析器 91
7.5 总结 98
第8章 主题模型 99
8.1 什么是主题模型 99
8.2 使用Gensim构建主题模型 101
8.3 隐狄利克雷分配(Latent Dirichlet Allocation) 102
8.4 潜在语义索引(Latent Semantic Indexing) 104
8.5 分层狄利特雷过程(Hierarchical Dirichlet Process) 105
8.6 动态主题模型 108
8.7 使用scikit-learn构建主题模型 109
8.8 总结 112
第9章 高级主题建模 113
9.1 高级训练技巧 113
9.2 探索文档 117
9.3 主题一致性和主题模型的评估 121
9.4 主题模型的可视化 123
9.5 总结 127
第 10章 文本聚类和文本分类 128
10.1 文本聚类 128
10.2 聚类前的准备工作 129
10.3 K-means 132
10.4 层次聚类 134
10.5 文本分类 136
10.6 总结 138
第 11章 查询词相似度计算和文本摘要 139
11.1 文本距离的度量 139
11.2 查询词相似度计算 145
11.3 文本摘要 147
11.4 总结 153
第 12章 Word2Vec、Doc2Vec和Gensim 154
12.1 Word2Vec 154
12.2 用Gensim实现Word2Vec 155
12.3 Doc2Vec 160
12.4 其他词嵌入技术 166
12.5 总结 172
第 13章 使用深度学习处理文本 173
13.1 深度学习 173
13.2 深度学习在文本上的应用 174
13.3 文本生成 177
13.4 总结 182
第 14章 使用Keras和spaCy进行深度学习 183
14.1 Keras和spaCy 183
14.2 使用Keras进行文本分类 185
14.3 使用spaCy进行文本分类 191
14.4 总结 201
第 15章 情感分析与聊天机器人 202
15.1 情感分析 202
15.2 基于Reddit的新闻数据挖掘 205
15.3 基于Twitter的微博数据挖掘 207
15.4 聊天机器人 209
15.5 总结 217
作者介绍:
Bhargav Srinivasa-Desikan 是就职于法国INRIA公司(位于里尔)的一名研究人员。作为MODAL(数据分析与机器建模)小组的一员,致力于度量学习、预测聚合和数据可视化等研究领域。同时,他也是Python开源社区的一名活跃贡献者,在2016年度Google的夏季编程赛上,他通过Gensim实现了动态主题模型。Bhargav是欧洲和亚洲PyCons和PyDatas的常客,并使用Python进行文本分析教学。他也是Python机器学习软件包pycobra的维护者,还在Machine Learning Research杂志上发表过相关文章。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
编辑推荐
Python开源社区资深供稿人撰写 文本分析实用指南 计算语言学领域为数不多的作品之一 技术实用性强 侧重于技术细节的实现 提供源码下载
书籍介绍
自然语言处理是一门融语言学、计算机科学、数学于一体的科学,研究人与计算机之间用自然语言进行有效通信的各种理论和方法。计算语言学是指通过建立形式化的数学模型来分析、处理自然语言,并在计算机上用程序来实现分析和处理的过程,旨在以机器来模拟人的部分或全部语言能力的目的。 《自然语言处理与计算语言学》作为一本借助于Python编程语言以及各种开源工具(如Gensim、spaCy等)来执行文本分析、自然语言处理和计算语言学算法的图书,从应用层面介绍了相关的理论知识和所涉及的技术。《自然语言处理与计算语言学》共分为15章,其内容涵盖了文本分析的定义、使用Python进行文本分析的技巧、spaCy语言模型、Gensim工具、词性标注及其应用、NER标注及其应用、依存分析、主题模型、高级主题建模、文本聚类和文本分类、查询词相似度计算和文本摘要、词嵌入、使用深度学习处理文本、使用Keras和spaCy进行深度学习、情感分析与聊天机器人的原理介绍等。 《自然语言处理与计算语言学》适合对自然语言处理的实现细节感兴趣的Python程序开发人员阅读。如果读者具备统计学的基本知识,对学习本书内容会大有裨益。
网站评分
书籍多样性:8分
书籍信息完全性:9分
网站更新速度:4分
使用便利性:8分
书籍清晰度:7分
书籍格式兼容性:8分
是否包含广告:8分
加载速度:6分
安全性:3分
稳定性:7分
搜索功能:5分
下载便捷性:4分
下载点评
- 图文清晰(605+)
- 中评(556+)
- azw3(361+)
- 种类多(365+)
- 赞(85+)
- 推荐购买(464+)
- 好评(235+)
- 二星好评(205+)
- 一般般(486+)
- 值得购买(284+)
- 体验好(614+)
- 无多页(267+)
下载评价
- 网友 陈***秋:
不错,图文清晰,无错版,可以入手。
- 网友 权***颜:
下载地址、格式选择、下载方式都还挺多的
- 网友 薛***玉:
就是我想要的!!!
- 网友 田***珊:
可以就是有些书搜不到
- 网友 步***青:
。。。。。好
- 网友 益***琴:
好书都要花钱,如果要学习,建议买实体书;如果只是娱乐,看看这个网站,对你来说,是很好的选择。
- 网友 沈***松:
挺好的,不错
- 网友 訾***晴:
挺好的,书籍丰富
- 网友 邱***洋:
不错,支持的格式很多
- 网友 扈***洁:
还不错啊,挺好
- 网友 宫***凡:
一般般,只能说收费的比免费的强不少。
- 网友 游***钰:
用了才知道好用,推荐!太好用了
- 网友 苍***如:
什么格式都有的呀。
- 网友 宫***玉:
我说完了。
- 网友 瞿***香:
非常好就是加载有点儿慢。
喜欢"自然语言处理与计算语言学 NLP零基础入门自学教程 数据清洗文本分析统计学习方法人工智能深度学习入门"的人也看了
中公版·2018山东省高校毕业生“三支一扶”招募考试用书:历年真题精解及全真模拟预测试卷 下载 kindle 电子版 pdf mobi pmlz 夸克云 caj
设计师眼中的海外设计丛书——美国街头商景 下载 kindle 电子版 pdf mobi pmlz 夸克云 caj
财税法学(第五版)/21世纪高等院校法学系列精品教材 下载 kindle 电子版 pdf mobi pmlz 夸克云 caj
新理念英语阅读 小学四年级 第1册(新mp3版) 下载 kindle 电子版 pdf mobi pmlz 夸克云 caj
有钱人和你想的不一样 下载 kindle 电子版 pdf mobi pmlz 夸克云 caj
9787122175670 下载 kindle 电子版 pdf mobi pmlz 夸克云 caj
尤斯伯恩·探秘神奇星球:潜行深海 下载 kindle 电子版 pdf mobi pmlz 夸克云 caj
【正版全新】 乌龙院大长篇:43敖幼祥编绘浙江文艺出版社9787533953096 下载 kindle 电子版 pdf mobi pmlz 夸克云 caj
高花自然低花精确叫牌法 下载 kindle 电子版 pdf mobi pmlz 夸克云 caj
气候变化与能源消费 下载 kindle 电子版 pdf mobi pmlz 夸克云 caj
- 新高考数学你真的掌握了吗?高一起点(套装共三本) 下载 kindle 电子版 pdf mobi pmlz 夸克云 caj
- 达尔文传 下载 kindle 电子版 pdf mobi pmlz 夸克云 caj
- 21世纪大学俄语系列教材-俄语阅读教程(3) 北京大学出版社 下载 kindle 电子版 pdf mobi pmlz 夸克云 caj
- 地球的故事 小学语文(四年级下)“快乐读书吧”阅读书目 下载 kindle 电子版 pdf mobi pmlz 夸克云 caj
- ESSENTIALS OF RISK MANAGEMENT(ISBN=9780071429665) 下载 kindle 电子版 pdf mobi pmlz 夸克云 caj
- 美声唱法(9级-10级中国音乐学院社会艺术水平考级全国通用教材) 下载 kindle 电子版 pdf mobi pmlz 夸克云 caj
- 像老板那样工作 邱庆剑 著 机械工业出版社,【正版保证】 下载 kindle 电子版 pdf mobi pmlz 夸克云 caj
- The Big Short Inside the Doomsday Machine 大空头 9781846142574 下载 kindle 电子版 pdf mobi pmlz 夸克云 caj
- 出国旅游一定会用到的英语1MP3 韩姗姗 编 9787517012658 水利水电出版社 下载 kindle 电子版 pdf mobi pmlz 夸克云 caj
- 酒店企业全流程财税处理(会计核算+政策解析+税务处理) 下载 kindle 电子版 pdf mobi pmlz 夸克云 caj
书籍真实打分
故事情节:9分
人物塑造:5分
主题深度:3分
文字风格:3分
语言运用:9分
文笔流畅:3分
思想传递:8分
知识深度:8分
知识广度:5分
实用性:4分
章节划分:4分
结构布局:6分
新颖与独特:7分
情感共鸣:5分
引人入胜:5分
现实相关:8分
沉浸感:7分
事实准确性:7分
文化贡献:4分