NLTK是自然语言处理领域中非常受欢迎和广泛使用的Python库。NLTK的优点在于其简单性,其中大多数复杂的自然语言处理任务使用几行代码即可完成。本书旨在讲述如何用Python和NLTK解决各种自然语言处理任务并开发机器学习方面的应用。本书介绍了NLTK的基本模块,讲述了采用NLTK实现自然语言处理的大量技巧,讨论了一些文本处理方法和语言处理技术,展示了使用Python实现NLP项目的大量实践经验。本书主要内容包括文本挖掘/NLP任务中所需的所有预处理步骤,如何使用Python 3的NLTK 3进行文本处理,如何通过Python开展NLP项目。本书适合NLP和机器学习领域的爱好者、Python程序员以及机器学习领域的研究人员阅读。本书包括以下主要内容• 使用词性标注和分块的方法对文本进行整理与清洗。• 把文本标记为句子,把句子标记为单词。• 文本分类和情感分析。• 字符串匹配算法和归一化方法。• 信息检索和文本摘要的概念。• 使用Python解决各种NLP任务的方式。