ISBN/价格: | 978-7-302-67520-4:CNY89.00 |
---|---|
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | 循序渐进Spark大数据应用开发/.柳伟卫著 |
出版发行项: | 北京:,清华大学出版社:,2024.11 |
载体形态项: | xiv, 273页:;+图:;+26cm |
提要文摘: | 本书结合作者一线开发实践, 循序渐进地介绍了新版Apache Spark 3.x的开发技术。全书共10章, 第1章和第2章主要介绍Spark的基本概念、安装, 并演示如何编写最简单的Spark程序。第3章深入探讨了Spark的核心组件RDD。第4章讲解了Spark集群管理, 帮助读者理解任务提交与执行的基本原理。第5章介绍了Spark SQL, 这是处理结构化数据的基础工具。第6章展示了Spark Web UI, 通过界面化的方式了解Spark集群运行状况。第7章和第8章分别介绍了Spark流式数据处理框架Spark Streaming和Structured Streaming。第9章和第10章则分别介绍了业界流行的机器学习和图计算处理框架MLlib和GraphX。书中各章节还提供了丰富的实战案例和上机练习题, 以便读者在学习的同时进行实际操作, 迅速提升动手能力。 |
题名主题: | 数据处理软件 教材 |
索书号: | TP274/L82 |
中图分类: | TP274 |
个人名称等同: | 柳伟卫 著 |
记录来源: | CN 上海新华 20231229 |