绿林网

数据科学工程实践经典读后感有感

数据科学工程实践经典读后感有感

《数据科学工程实践》是一本由谢梁 / 缪莹莹 / 高梓尧 / 王子玲著作,机械工业出版社出版的平装图书,本书定价:89,页数:259,特精心收集的读后感,希望对大家能有帮助。

《数据科学工程实践》读后感(一):《数据科学工程实践》读书笔记

《数据科学工程实践》读书笔记 数据科学工程实践是由腾讯、滴滴、快手公司的众多数据科学家、数据分析师、算法工程师的经验总结,该书主要是帮助读者对数据科学有一个全面理解,对企业经营管理者来说,也可以学习到如何去搭建企业数据驱动的企业文化和打造数据科学的团队。 数据的重要性不言而喻,它能够帮助经营管理人员透过现象看本质,以帮助我们更好的决策和减少失误。数据科学广义上来说可以认为是数据分析,数据分析的流程:数据获取,数据储存,数据清洗,建模,数据分析,分析结论,大家应该对其都比较熟悉了。而《数据科学工程实践》的侧重点放在了建模和分析框架上,书中提到了很多的模型以及分析方法,并且用案例的形式演示,让人理解并不是十分困难。 本书涉及的知识包含消费者行为学,统计学,经济学,机器学习等等领域; 本书的理解难度:中等(跨了一些专业); 本书的可读性:容易(代码+案例说明比较容易理解); 本书内容分为三部分: 第一部分:主要是针对用户行为的分析方法,原理以及?相关案例;包含有消费者偏好分析,时间序列的行为分析,LTV预测,商业场景挖掘等等内容。作者对这部分内容的撰写比较祥尽,相关模型的软件包导入说明以及案例说明都比较容易理解。 第二部分:主要针对实验的设计已经实现的过程,重点介绍AB测试的相关内容,书中也对实验结果的检验给出了一系列方法论。 第三部分:主要介绍SQLFlow的相关内容,笔者还没有安装,所以没有看这部分内容。 总结:本书的作者团队十分庞大,书的内容比较丰富,相关的分析模型及方法不算难,可以作为学习参考书。

《数据科学工程实践》读后感(二):数据科学理论与工程实现的桥梁

我们谈到数据科学时,一般是从统计学的角度进行阐述,并通过R语言或者Python实现,而如何实现工程化,进而在企业工作中实际应用?《数据科学工程实践》提供了一个很好的视角。

该书每章的基本结构是先介绍背景知识,让读者对于该方法的适用条件有所了解;接下来是相关的理论,让读者对该模型有深入地学习,最后是代码的具体实现。这样的结构满足了不同类别读者的需求,如果对理论感兴趣,可以着重阅读理论部分,如果对工程实现感兴趣,则可着重阅读图书的代码部分。这本书由多位作者完成,这些作者一方面发挥自己所长,写自己熟悉的章节,另一方面又默契配合,保证章节的结构、行文保持一致,能做到这点实属不易。这本书相当于在数据科学的理论与工程实现之间建立了一座桥梁,我们可以轻易地从一端走向另一端。

从书的内容上来看,本书的数据分析技术主要分为两类,一类是根据实际观测数据来进行分析,这些是自然条件下的数据,接近于工作的实际情况。但是我们如果想做因果推论,则需要借助于实验的手段,这就是本书所讲的第二类数据分析技术。这两类分析技述适用于不同的工作场景,我们在实际工作中应该有选择性地使用。本书的最后还介绍了自助式数据科学平台SQLFlow,由于部分数据科学的代码较为繁琐,该平台的目标是让业务人员可以像调用SQL一样简单调用AI,对该平台感兴趣的读者可以详细阅读。

该书要求读者有一定的数据科学基础,因此这本书并不是一本入门读物。如果你读了一些入门读物,但仍不清楚数据科学的方法如何去工程实现,那么这本书是一个很好的选择。

《数据科学工程实践》读后感(三):数据科学工程实践-给大四学生的工程参考书

数据科学提了这么多年,总感觉还是换汤不换药,培养方案就是--数学-统计学-编程-然后就是人工智能啥的了。反正大家都在摸石头过河,所以没有什么标准答案。前几天看别人写的关于工科认证的论文,经常提到的一个词就是复杂工程,要让学生学会解决复杂工程问题。这就显得好玩了,负责这个单词是不可测量的,工程是名词,这样还是不可测量啊。

所以没办法,怎样量化教学本身就是一个问题。只能不断去找可以将工程可以测量的教材。其实在教学的过程中,最近面临的问题就是学生对商业环境的不理解,学习好的学生对模型理解很快,编程好的学生对程序理解的很快,然后之间也没有沟通,我要花大力气去解释商业应用,但是商业应用中不管是学习好的学生还是编程好的学生都不能理解,结果就陷入了一个讲简单了:学生认为我是傻瓜,讲复杂了:学生认为自己是傻瓜的怪圈。

好在这次找了这本书,数据科学工程实践,可以让学生看一下什么是工程。作者们都很年轻,都是实战出身,都是数据科学家或是数据分析师,而且都是大厂的。所以我们可以看一下大厂的数据分析是怎么样做的。

还是简单介绍一下书:

第一章理解消费者的选择,其实我一直在给计算机的学生灌输一点消费者心理的东西,人在做选择的时候是什么心理?他为什么要使用你的东西?为什么要买你的东西?这些都很重要。第二章是时间相关分析,生存函数(可以详细读一下),第三章客户价值,这点就不多说了,基本做客户的这个要是不知道就要回炉重造了。第四章场景分析,其实就是决策树,第五章行为分析,其实就是奇异值分解和非负矩阵分解。第六章就是回归分析了。书上把这些理论用实际的案例给介绍出来了,不是用公式,这样就友好了很多。

第七章是A/B实验的做法,后面的2章都是讲实验,我觉得工科学生真的有必要看一下。科学是讲究实验的,结果现在的学生就觉得自己做出来就很好,实验也是设计科学里面的一部分,可以深入研究一下。

再就是SQLFLOW,我没有用过,估计暑假有时间安装一下看看吧。

总结一下,这本书是学过人工智能和数据科学的学生才能看的,需要python 和一部分R的知识,作者挺多,所以内容有时候不是连贯的。推荐给大四学生做项目时候看。

本文由作者上传并发布(或网友转载),绿林网仅提供信息发布平台。文章仅代表作者个人观点,未经作者许可,不可转载。
点击查看全文
相关推荐
热门推荐