The Lady Tasting Tea经典读后感有感

漫步于花雨

发布日期：2023-11-18 03:05:12

《The Lady Tasting Tea》是一本由David Salsburg著作，Holt Paperbacks出版的Paperback图书，本书定价：USD 18.00，页数：352，特精心收集的读后感，希望对大家能有帮助。

《The Lady Tasting Tea》读后感(一)：值得一读再读的书

常读常新。

以后也要读读R. A. Fisher的书。

书中除了用大白话讲述统计学知识外，还穿插介绍了很多背景知识和小故事。生动有趣、不失严谨。

书中讲Fisher在Rothamsted农业实验站研究作物产量历史数据那段故事太逗了。老少Pearson的不同结局至少也能说明做人和做学问同样重要。Hypothesis Testing前后几节加深了我对统计检验和Null/Alternative Hypothesis的理解。

再一次体会到真正理解的东西才能记住。

《The Lady Tasting Tea》读后感(二)：读书笔记：《The Lady Tasting Tea》

这本书是我完整意义上读完的第一本英文著作。出国快一年了，之前也尝试过阅读一些英文小说，可是都很难完整的读完。因为都还是所谓的名著，于是我自然的将没有读完的原因归结为自己没有耐心，或者是英文还不够好。直到我那天在一个订阅的博客上看到这本书的书评，那段时间正好在频繁的使用统计方法来分析手头的数据，于是自然而然的对这本所谓的和统计有关的小说产生了兴趣，于是便借来一读。

实话实说，我大学时候统计学的很烂，于是造成今日不得不狂补各种统计学基础知识，实在是悔不该当初。诚然，阅读这本写给没有数学基础的读者的小说并不会对提高我的统计学能力，书中所讲的各种统计学理论和方法我虽大多都有耳闻，但是大多也只是耳闻罢了。书中的那些统计学家在作者的笔下像一个个武林高手，Pearson的固执，Gosset的低调，Fisher的天才，还有那许多我记不住名字的高手们，共同演绎了二十世纪这场绚丽多彩，又跌宕起伏的统计学革命。

书中我认为比较精彩的一段是写如何证明吸烟和肺癌之间的关系。许多统计学家和医学家经过研究，发现吸烟和肺癌的发生率之间存在关系，于是进而想要推导出吸烟会增加患肺癌的风险。听起来很合理，但是有人不同意，有个大烟民不同意，这个大烟民就是Fisher。Fisher对这些学者的研究进行了有力的反驳，相关关系并不等于就是因果关系，我自个儿吸烟几十年了，身体还是倍儿棒。这边厢各路医学家和统计学家人多势众，那边厢Fisher同志赤膊上阵，力敌穷雄，好不精彩！虽然最终无论是医学界还是公众都接受了吸烟会导致患肺癌风险增加这一事实，不过Fisher依然坚持自己的观点，照吸不误。

我认为这本书的最大的优点在于生动，将平常我们所接触的那些统计学方法生动写成了一个个有趣的故事。好处很明显，以后我再用到Student's T-test的时候，会自然而然的想起那个夹在Pearson和Fisher两位巨人之间，位置有些尴尬的Gosset，而对于所谓的显著性检验，我也会想起Fisher的观点，那就是如果没有随机化的实验设计，你无法从实验结果中证明任何事情。

很显然，我凌乱的记忆并不能保证我能写出一篇清晰流畅的书评，因此这本书有时间我还会再读一遍甚至买一本收藏的。很高兴这本书也有中文译本。我想说的是，别被什么“统计学如何革命了二十世纪的科学”这种名号给唬住了，其实这本书里一个数学符号，一个数学公式都没有，尽可以把它当做一本科普小说。

《The Lady Tasting Tea》读后感(三)：一定统计学基础后的体系轮廓描绘

断断续续终于在申请前读完了！前期雄心壮志读英文实在耗时，改为中译本+想读更精确概念切原版后，更明晰效率也高了不少。

这本书说实话不适合初学者读，既没有直观的趣味也没有零门槛的统计学知识；但作为学习了一段时间需要大概建立体系的同学来说，是一本比较流畅的辅助故事书。读本书时，脑中不由回应起了概率论基础，数理统计学，非参数统计，贝叶斯统计，统计机器学习，时间序列分析，随机过程等本科课程…

简要整理本书的大事记：

～galton：均值回归，相关

（信托给了）

～karl person：偏态分布和分布函数，biometrika

gosset：guiness公司，student-t分布

（两人之间的桥梁）

～r.a.fisher：方差分析，自由度，*参数确定了分布，为了更好地估计参数，选择合适的统计量，即三大指标consistent unbiased efficient*，无偏有效的MLE（后有EM引申）

tippett：极值分布

bliss：probit analysis

～CLT应用正态的前提：lindeberg-levy，hoeffding's u statistics

二战兴起的or

混沌理论

karl pearson's goodness of fit, leading to hypothesis testing

significance: prob low enough to reject. 判断显著性的概率：p值。p值检验原假设，被计算出来的，当原假设成立时观测结果出现的概率；power指备择假设成立时p值将其识别出来的能力。

～venn大数定律：频率接近概率，用来解释p值

neyman from poland＋egon pearson：hypothesis testing. neyman: confidence interval.

～Two different perspectives: fisher significance testing/p-value vs neyman-pearson hypothesis testing

～Kolomogorov from Soviet Union:应用测度论奠定了概率的数学基础概率论公理probability is a measure of sets in an abstract space of events；处理时序问题，将按照时序的相关数据称为随机过程。

nonparametics

the chemist Wilcoxon; the economist Mann&graduate in osu Whitney 检验统计量不再以分布参数的估计值为基础

pitman from unknown Australia非参可以应用于参数方法，且数据不fit时非参方法更好

fisher&cornfield: causal inference

*Cox from isu, surprising story

*box: robust-downgrade the influence of contaminating measurements if they are there; produce correct answers if the measurements have not been contaminated.

box-cox transformations

deming: quality control

*cunliffe

～levy: a martingale sequence: the variability has to be bounded so individual values do not become infinitely large or small; the best estimator of the next number is the value of the last number

peto's problem没看懂

model-bound methods vs nonparametric methods with little or no mathematical structure

～the glivenko(student of kolmogorov)-cantelli lemma: construct a nonparametric empirical distribution function, it will come closer and closer to the true distribution as the number of observation increases. It's the basis of a new technique that could only exist in a world of high-speed computers.

efron: bootstrap(data lifting themselves up by their own bootstraps-function independently) based on g-c lemma.

bootstrap→resampling→computer-intensive

rosenblatt&parzen: kernel density estimation. 2 arbitrary parameters: kernel&bandwidth

注：～表示大事记，*表示有意思

本文由作者上传并发布（或网友转载），绿林网仅提供信息发布平台。文章仅代表作者个人观点，未经作者许可，不可转载。

点击查看全文