使用Python实现NLP项目的大量实践经验
Key Features
- NLTK是自然语言处理领域中非常受欢迎和广泛使用的Python库。
Book Description
NLTK是自然语言处理领域中非常受欢迎和广泛使用的Python库。NLTK的优点在于其简单性,其中大多数复杂的自然语言处理任务使用几行代码即可完成。本书旨在讲述如何用Python和NLTK解决各种自然语言处理任务并开发机器学习方面的应用。本书介绍了NLTK的基本模块,讲述了采用NLTK实现自然语言处理的大量技巧,讨论了一些文本处理方法和语言处理技术,展示了使用Python实现NLP项目的大量实践经验。本书主要内容包括文本挖掘/NLP任务中所需的所有预处理步骤,如何使用Python 3的NLTK 3进行文本处理,如何通过Python开展NLP项目。本书适合NLP和机器学习领域的爱好者、Python程序员以及机器学习领域的研究人员阅读。
本书包括以下主要内容
• 使用词性标注和分块的方法对文本进行整理与清洗。
• 把文本标记为句子,把句子标记为单词。
• 文本分类和情感分析。
• 字符串匹配算法和归一化方法。
• 信息检索和文本摘要的概念。
• 使用Python解决各种NLP任务的方式。
What you will learn
- 使用词性标注和分块的方法对文本进行整理与清洗。
- 把文本标记为句子,把句子标记为单词。
- 文本分类和情感分析。
- 字符串匹配算法和归一化方法。
- 信息检索和文本摘要的概念。
- 使用Python解决各种NLP任务的方式。
Who this book is for
本书适合NLP和机器学习领域的爱好者、对文本处理感兴趣的读者、想要快速学习NLTK的资深Python程序员以及机器学习领域的研究人员阅读。
Table of Contents
- 使用字符串
- 统计语言模型
- 词语形态学——试一试
- 词性标注——识别单词
- 解析——分析训练数据
- 语义分析——意义重大
- 情感分析——我很高兴
- 信息检索——访问信息
- 话语分析——知识就是信仰
- NLP系统的评估——性能分析
Loading...
Loading...
Loading...
Loading...

