小苏子
小苏子PDF在线图书

深度实践Spark机器学习 作者:吴茂贵,郁明敏,朱凤元,张粤磊,杨本法

深度实践Spark机器学习 作者:吴茂贵,郁明敏,朱凤元,张粤磊,杨本法

深度实践Spark机器学习 出版社:机械工业出版社

深度实践Spark机器学习 内容简介

深度实践Spark机器学习 目录

深度实践Spark机器学习 精彩文摘

本书系统讲解了Spark机器学习的技术、原理、组件、算法,以及构建Spark机器学习系统的方法、流程、标准和规范。此外,还介绍了Spark的深度学习框架TensorFlowOnSpark,以及如何借助它实现卷积神经网络和循环神经网络。全书共14章,分为四个部分:第一部分(1~7章)主要讲解了Spark机器学习的技术、原理和核心组件,包括Spark ML、Spark ML Pipeline、Spark MLlib,以及如何构建一个Spark机器学习系统。第二部分(8~12章)主要以实例为主,讲解了Spark ML的各种机器学习算法,包括推荐模型、分类模型、聚类模型、回归模型,以及PySpark决策树模型和Spark R朴素贝叶斯模型。第三部(第13章)与之前的批量处理不同,本章以在线数据或流式数据为主,讲解了Spark的流式计算框架Spark Streaming。第四部分(第14章)介绍了Spark深度学习,主要包括TensorFlow的基础知识及它与Spark的整合框架TensorFlowOnSpark。前言第1章 了解机器学习1.1 机器学习的定义1.2 大数据与机器学习1.3 机器学习、人工智能及深度学习1.4 机器学习的基本任务1.5 如何选择合适算法1.6 Spark在机器学习方面的优势1.7 小结第2章 构建Spark机器学习系统2.1 机器学习系统架构2.2 启动集群2.3 加载数据2.4 探索数据2.5 数据预处理2.6 构建模型2.7 模型评估2.8 组装2.9 模型选择或调优2.10 保存模型2.11 小结第3章 ML Pipeline原理与实战3.1 Pipeline简介3.2 DataFrame3.3 Pipeline组件3.4 Pipeline原理3.5 Pipeline实例3.6 小结第4章 特征提取、转换和选择4.1 特征提取4.2 特征转换4.3 特征选择4.4 小结第5章 模型选择和优化5.1 模型选择5.2 交叉验证5.3 训练验证拆分法5.4 自定义模型选择5.5 小结第6章 Spark MLlib基础6.1 Spark MLlib简介6.2 Spark MLlib架构6.3 数据类型6.4 基础统计6.5 RDD、Dataframe和Dataset6.6 小结第7章 构建Spark ML推荐模型7.1 推荐模型简介7.2 数据加载7.3 数据探索7.4 训练模型7.5 组装7.6 评估模型7.7 模型优化7.8 小结第8章 构建Spark ML分类模型8.1 分类模型简介8.2 数据加载8.3 数据探索8.4 数据预处理8.5 组装8.6 模型优化8.7 小结第9章 构建Spark ML回归模型9.1 回归模型简介9.2 数据加载9.3 探索特征分布9.4 数据预处理9.5 组装9.6 模型优化9.7 小结第10章 构建Spark ML聚类模型10.1 K-means模型简介10.2 数据加载10.3 探索特征的相关性10.4 数据预处理10.5 组装10.6 模型优化10.7 小结第11章 PySpark决策树模型11.1 PySpark简介11.2 决策树简介11.3 数据加载11.4 数据探索11.5 数据预处理11.6 创建决策树模型11.7 训练模型进行预测11.8 模型优化11.9 脚本方式运行11.10 小结第12章 SparkR朴素贝叶斯模型12.1 SparkR简介12.2 获取数据12.3 朴素贝叶斯分类器12.4 小结第13章 使用Spark Streaming构建在线学习模型13.1 Spark Streaming简介13.2 Dstream操作13.3 Spark Streaming应用实例13.4 Spark Streaming在线学习实例13.5 小结第14章 TensorFlowOnSpark详解14.1 TensorFlow简介14.2 TensorFlow实现卷积神经网络14.3 TensorFlow实现循环神经网络14.4 分布式TensorFlow14.5 TensorFlowOnSpark架构14.6 TensorFlowOnSpark安装14.7 TensorFlowOnSpark实例14.8 小结附录A 线性代数附录B 概率统计附录C Scala基础大数据、人工智能是目前大家谈论比较多的话题,它们的应用也越来越广泛,与我们的生活关系也越来越密切,影响也越来越深远,其中很多已进入寻常百姓家,如无人机、网约车、自动导航、智能家电、电商推荐、人机对话机器人等。大数据是人工智能的基础,而使大数据转变为知识或生产力,离不开机器学习(Machine Learning),可以说机器学习是人工智能的核心,是使机器具有类似人的智能的根本途径。

赞(0)
未经允许不得转载:小苏子图书 » 深度实践Spark机器学习 作者:吴茂贵,郁明敏,朱凤元,张粤磊,杨本法