作者简介
Pramod Singh是Publicis.Sapient公司 数据 科学 部门的经理,目前正作为数据科学跟踪负责人与梅赛德斯奔驰的一个项目进行合作。他在机器 学习 、数据工程、 编程 ,以及为各种业务需求 设计 算法 方面拥有丰富的实践经验,领域涉及 零售 、电信、汽车以及日用消费品等行业。他在Publicis.Sapient主导了大量应对机器学习和AI的 战略 计划。他在孟买大学获得了电气与电子工程的学士学位,并且在 印度 共生国际大学获得了MBA学位( 运营 & 财务 ),还在IIM – Calcutta(印度 管理 学院加尔各答分校)获得了 数据分析 认证。在过去八年中,他一直在跟进多个数据项目。在大量客户项目中,他使用R、Python、Spark和TensorFlow应用机器学习和 深度学习 技术 。他一直是各重大会议和大学的 演讲 常客。他会在Publicis.Sapient举办数据科学聚合并且定期出席关于ML和AI的 网络 研讨会。他和妻子以及两岁的儿子居住在班加罗尔。闲暇的时候,他喜欢弹吉他、写代码、 阅读 以及观看 足球 比赛。内容简介
使用PySpark构建机器学习模型、 自然 语言 处理应用 程序 以及推荐 系统 ,从而应对各种业务挑战。《PySpark机器学习、自然语言处理与推荐系统》首先介绍Spark的基础知识,然后讲解使用PySpark构建传统机器学习算法以及自然语言处理和推荐系统的全部知识点。
《PySpark机器学习、自然语言处理与推荐系统》阐释了如何构建有监督机器学习模型,比如线性回归、 逻辑 回归、 决策 树和随机森林,还介绍了无监督机器学习模型,比如K均值和层次聚类。《PySpark机器学习、自然语言处理与推荐系统》重点介绍特征工程,以便使用PySpark创建有用的特征,从而训练机器学习模型。自然语言处理的相关章节将介绍文本处理、文本挖掘以及用于分类的嵌入。
在阅读完《PySpark机器学习、自然语言处理与推荐系统》之后,读者将了解如何使用PySpark的机器学习库构建和训练各种机器学习模型。此外,还将熟练掌握相关的PySpark组件,从而进行数据获取、数据处理和数据分析, 开发 数据驱动的 智能 应用。
构建一系列有监督和无监督机器学习算法
使用Spark MLlib库实现机器学习算法
使用Spark MLlib库开发推荐系统
处理与特征工程、分类平衡、偏差和方差以及交叉验证有关的问题,以便构建最优的拟合模型
Pramod Singh是Publicis.Sapient公司数据科学部门的经理,目前正作为数据科学跟踪负责人与梅赛德斯奔驰的一个项目进行合作。他在机器学习、数据工程、编程,以及为各种业务需求设计算法方面拥有丰富的实践经验,领域涉及零售、电信、汽车以及日用消费品等行业。他在Publicis.Sapient主导了大量应对机器学习和AI的战略计划。他在孟买大学获得了电气与电子工程的学士学位,并且在印度共生国际大学获得了MBA学位(运营&财务),还在IIM – Calcutta(印度管 理学 院加尔各答分校)获得了数据分析认证。在过去八年中,他一直在跟进多个数据项目。在大量客户项目中,他使用R、Python、Spark和TensorFlow应用机器学习和深度学习技术。他一直是各重大会议和大学的演讲常客。他会在Publicis.Sapient举办数据科学聚合并且...
下载地址
本站夸克网盘精选资源合集:https://pan.quark.cn/s/936c760dd840
评论列表
发表评论