本书介绍
spaCy是一个免费的开源库,用于Python 中的自然语言处理(NLP),具有许多内置功能。在 NLP 中处理和分析数据变得越来越流行。非结构化文本数据持续大规模生成,因此处理非结构化数据并从中获取关键信息非常重要,比如实体识别、事件抽取等。为此,需要以计算机可以理解的格式表示数据。NLP 可以帮助做到这一点。
文末附本书最新免费pdf下载地址。
在本教程中,将学习:
1. NLP 中的基本术语和概念是什么
2. 如何在 spaCy 中实现这些概念
3. 如何在 spaCy 中自定义和扩展内置功能
4. 如何对文本进行基本的统计分析
5. 如何创建管道来处理非结构化文本
6. 如何解析句子并从中提取有意义的见解
什么是 NLP 和 spaCy?
NLP是人工智能的一个子领域,关注计算机和人类语言之间的交互。NLP 是为计算机分析、理解和从人类语言中推导出关键知识的过程。
NLP 可帮助我们从非结构化文本中提取知识,并具有多种用例,例如:自动摘要,命名实体识别,问答系统,情绪分析
spaCy 是一个免费的开源库,用于 Python 中的 NLP处理。它是用Cython编写的,旨在构建信息提取或自然语言理解系统。它专为生产环境而构建,并提供简洁且用户友好的 API。
本书目录