作者简介
迪潘简·撒卡尔(Dipanjan Sarkar)Intel 数据 科学 家。他的主要研究领域是 数据分析 、 商业 智能 、应用 开发 以及大型智能 系统 构建。他专注于数据分析实践领域已经有四年多了,通过约翰霍普金斯大学的 网络 公开课程获得了数据科学专业认证,并且还 出版 了几本关于R 语言 和机器 学习 的书。内容简介
《Python文本分析》遵循结构化和综合性的 方法 ,介绍了文本和语言语法、结构和语义的基础概念和高级概念。从 自然 语言和Python的基础开始,进而学习先进的分析理念和 机器学习 概念。全面提供了自然语言处理(NLP)和文本分析的主要概念和 技术 。包含了丰富的真实案例实现技术,例如构建分类 新闻 文章的文本分类系统,使用主题建模和文本摘要分析app或 游戏 评论,进行热门 电影 概要的聚类分析和电影评论的情感分析。介绍了基于Python和流行NLP开源库和文本分析 实用工具 ,如自然语言 工具 包(nltk)、gensim、scikit-learn、spaCy和Pattern。
迪潘简·撒卡尔(Dipanjan Sarkar)Intel 数据科学家。他的主要研究领域是数据分析、商业智能、应用开发以及大型智能系统构建。他专注于数据分析实践领域已经有四年多了,通过约翰霍普金斯大学的网络公开课程获得了数据科学专业认证,并且还出版了几本关于R语言和机器学习的书。
评论列表
发表评论