绿林网

深入理解SPARK读后感锦集

深入理解SPARK读后感锦集

《深入理解SPARK》是一本由耿嘉安著作,机械工业出版社出版的平装图书,本书定价:99,页数:469,特精心收集的读后感,希望对大家能有帮助。

《深入理解SPARK》读后感(一):这书不错,值得阅读

力荐 Spark作为快速、通用的大规模数据处理引擎,提供了一站式的解决方案。而了解Spark的工作原理与机制,设计思想,可以让我们的工作更加有据可依,对定制化开发、运维与排障等有大有好。Spark源码解读的书,市面上目前有3本,唯有本书是解读最全面、最系统的,值得阅读。

《深入理解SPARK》读后感(二):深入理解SPARK - 没有深度的粘贴代码

1. 基本就是罗列各种组建,然后把代码从github copy下来放书上了

2. 代码片段所谓分析就是把代码片段的逻辑翻译成汉字

3. 组件之间的运行关系,以及设计思路基本没有。看不出作者的所谓“分析”和“理解”。只是告诉大家作者看过这些源码。

4. 非常不理解那些5星评价。。。

《深入理解SPARK》读后感(三):一本深入介绍原理和实现的书,很值得推荐

这本书很具体的从代码切入,介绍spark的各个组件,前面章节总结概括基本搭建和原理架构等,后面横向的从各个模块触发,比如SparkContext,BlockManager, Memstore以及上层的任务提交,RDD模式的开发和实践,介绍的比较具体。推荐给对spark稍有了解,想深入代码原理的人,源码之前。一切都是透明的。后面的章节追加了Mlib、GraphX、StreamingSql等应用场景,对数据开发也有帮助,很赞!

《深入理解SPARK》读后感(四):Spark学习必备中文参考书籍

该书比之前看的其他中文Spark书籍更加详细,结合大量源码,作者的分析很是详细,整个内容的衔接性很好,推荐阅读!

准备篇,作者详细介绍了如何快速搭建Spark本地运行环境,源码编译及调试环境,本人亲试了一遍,作者提到的细节都是这个过程中需要注意才能走通的。

核心设计篇,分为SparkContext、存储体系、任务提交及运行、计算引擎、部署模式等几个章节详细介绍了Spark的核心设计和实现思想,这部分目前还正在阅读中,感觉很不错。

扩展篇,介绍了Spark的生态,包括Spark SQL、流计算、图计算、机器学习等。内容很丰富。

《深入理解SPARK》读后感(五):sparkSQL, graphx和mllib的分析非常差

前面讲spark核心设计对源码的分析现在还没读完, 初看还是比较详细的.

但是扩展篇的sparkSQL, graphx和mllib部分, 完全从"源码分析"变成了官方教程文档翻译, 还是机器翻译的水平, 而且都没人工review的.

差到什么程度呢? 举个例子:

官方文档原文: "Note that the number of bins cannot be greater than the number of instances N (a rare scenario since the default maxBins value is 32). The tree algorithm automatically reduces the number of bins if the condition is not satisfied"

书中翻译原文: "箱的数量不能大于实例的数目N(因为默认的maxBins值在罕见的情况下为32). 如果条件不满足, 生成树算法自动降低垃圾箱的数量. "

明明是说bin的数量大于样本数量的情况很罕见, 因为默认值是32, 结果被译为了默认值为32很罕见, 而且把bins翻译成垃圾箱是几个意思?

还有把特征"feature"翻译成"功能"什么的... 各种机器翻译无力吐槽

本来买的时候主要是想看对graphx和mllib的源码分析, 然而这部分内容太让人失望了. 因为前面的内容还能看看, 给两个星星咯.

本文由作者上传并发布(或网友转载),绿林网仅提供信息发布平台。文章仅代表作者个人观点,未经作者许可,不可转载。
点击查看全文
相关推荐
热门推荐