注册 登录
美国中文网首页 博客首页 美食专栏

ImYoona //www.sinovision.net/?70618 [收藏] [复制] [分享] [RSS] txgz999@yahoo.com

分享到微信朋友圈 ×
打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

柴静视频中图示的解读

热度 8已有 20309 次阅读2015-3-14 16:16 分享到微信

3/6/2015 方舟子最初的推特
https://mobile.twitter.com/fangshimin/status/573734653351174144

柴静视频中图示的解读_图2-1

柴静视频中图示的解读_图2-2



柴静视频中图示的解读_图2-3

柴静视频中图示的解读_图2-4


高清版:柴静雾霾调查:穹顶之下
https://www.youtube.com/watch?v=xbK4KeD2ajI

柴静视频中图示的解读_图2-5

柴静视频中图示的解读_图2-6

柴静视频中图示的解读_图2-7

柴静视频中图示的解读_图2-8

柴静视频中图示的解读_图2-9

柴静视频中图示的解读_图2-10


柴​静​雾​霾​调​查​片​《​穹​顶​之​下​》​中​有​争​议​的​“​中​科​院​给​我​们​提​供​的​测​算​显​示​,​当​P​M​2​.​5​的​值​升​高​的​时​候​,​人​群​的​死​亡​率​是​随​之​上​升​的​.​.​.​”​引​用​图​表​原​论​文​。​中​科​院​大​气​物​理​研​究​所​、​北​大​医​学​院​等​单​位​做​的​【​北​京​大​气​颗​粒​物​粒​级​对​死​亡​率​影​响​的​时​间​序​列​分​析​】​。
Time-series analysis of mortality effects from airborne particulate matter size fractions in Beijing


3月19日补充:

蒙枪枪垂问,勉为其难的了解了一下柴静视频中一个有关P​M​2​.​5值和死亡率关系的图示引发的争论。

初读之下我有这样三个疑问:
1)柴静说'当PM2.5值升高的时候',是在说2005-2009的实际情况,还是在说一种与事实不同的假设状态?
2)为何三条曲线和三个三次函数的值不匹配?
3)为何柴静的最上面一条曲线与论文图完全不同?

看了柴静视频的那个片段,通读了原始论文以及方舟子和岳东晓的相关博文,最主要是靠了一剑和枪枪两位好友的点拨,感觉现在基本理解了该图示的意思。所以我来用自己的语言来谈谈我的理解。

柴静图是基于原始论文及其中的图6。这图说的是2005至2009年北京市的PM2.5值对三种常见死亡原因(循环系统,呼吸系统,非意外事故)的死亡率的影响,更明确的说是测算在每天PM2.5值增加10时,这三种死亡率的增加幅度。

有意思的是当考虑PM2.5值对死亡率的影响时,作者并没有直接比较那些年份间PM2.5的大小和死亡率的大小的关系,在论文中甚至没列出那些年的死亡率,而是估算了一个假设的问题,在同一时间段如果PM2.5增加10,死亡率会有多大变化?

论文作者在北京某北三环和北四环之间的密集居住区的某个点上持续5年测量了每天的PM2.5值,又用了国家机构提供的北京市每天各种死亡原因的死亡数数据。具体的测算方式据作者说是基于时间序列分析,我没学过这个理论,但如果我有一年365天每天的死亡数和PM2.5值,我会如何估算呢?我们知道这些PM2.5的值大致是几十多的有一百多。所以在这365个数组里,会有一些两组两组的能成为一对,它们的PM2.5值会相差将近10。我们就计算对应的死亡数的增长率,然后把每对所得的死亡数的增长率做个平均,就得到一年的估算值。

这样我们就有了这五年每年这三种常见死亡原因的死亡率的增长率的估算值,然后用曲线拟合来描述这个增长趋势,这是个简单的数学问题,就是如何选取一定次数的多项式曲线来尽可能的和给定的样品点拟合,这在数学上称为最小二乘曲线拟合 (curve fitting in the least-squares sense) http://read.pudn.com/downloads144/ebook/629385/minleast.doc, 我们可以用一个拟合度(R^2值)来衡量这种拟和程度,这值最大是1,当曲线经过所有样品点时达到。

论文图用的是四次曲线来拟合五年的数值,所以拟合度达到1,而柴静的图用的是三次曲线来拟合五年的数值。这说明柴静图和论文图曲线的不同是因为前者用三次曲线吻合而后者用四次曲线,至少从数学上讲两者都是正确的结果。当然从这个具体问题看,也许可以说由于样品点的上下波动,三次曲线难以和样品点有很好的吻合,应该用四次曲线来吻合更合适。当然是不是需要用四次曲线来拟合又和想要得到的结论有关,在论文中强调的一点是2008年北京奥运会前对空气污染的控制,那用四次曲线就很有必要。而柴静要说明"当​P​M​2​.​5​的​值​升​高​的​时​候​,​人​群​的​死​亡​率​是​随​之​上​升​的​",那用三次曲线来拟合也能行,事实上曲线拟合都不需要,因为这五年每年的死亡率测算结果都说明了这个结论。

也许有人会认为"当​P​M​2​.​5​的​值​升​高​的​时​候​,​人​群​的​死​亡​率​是​随​之​上​升​的​"这样一个结论是显而易见无需论证的,其实也许也不尽然,因为同一篇论文还发现了P​M​2​.​5​-10的​值​的升​高对​人​群​的​死​亡​率​没明确影响。

回到我前几天不解的问题。这图利用的北京PM2.5值是虚拟的吗?也是也不是。大致上讲它是在比较那五个年度PM2.5值(76,84, 78, 69, 65)时的死亡率和这些值增加10,即(86, 94,88,79,75)时的通过上述估算的死亡率的增长率。(在我前面的土测算法里严格的讲不一定就是这些数如76和86,而是那些对中大的半部分的平均和小的半部分的平均。所以也可能是比如75和85,相差一定是10。)

那么柴静说的当PM2.5值升高时死亡率是随之上升的是如何体现在图上的呢?这条曲线完全在横坐标的上方,所以每年(即每个横坐标点)都是一个证明柴静这句话的例子。前几天我一直以为柴静说的当P​M​2​.​5值升高指的是横向,即如果按年份不断增长,现在才知道是指同一时间如果PM2。5值高一些的话会对死亡率造成的影响。

记得推特或新语丝里有评论说图上显示的每年的死亡率数据,为何要提每天死亡率?当我们了解了估算的途径后就知道光有年死亡率是没法进行估算的。

还有论文图里标的每年的P​M​2​.​5值并不是官方的北京市数值,而且官方也没公布过这几年的数据(除2005年外)。这个数据就是依据作者在北京某处的逐日观察结果。

最后总结一下我对柴静图和论文图不同的理解。之所以不同是因为前者用的是三次曲线拟合而后者用的是四次曲线拟合。对于柴静想说明的结论"当​P​M​2​.​5​的​值​升​高​的​时​候​,​人​群​的​死​亡​率​是​随​之​上​升​的​"而言,拟合都是多余,每年的测算值都是正的本身就说明了柴静的结论。

柴静视频中图示的解读_图2-11



免责声明:本文中使用的图片均由博主自行发布,与本网无关,如有侵权,请联系博主进行删除。







鲜花
3

握手

雷人

路过

鸡蛋

刚表态过的朋友 (3 人)

发表评论 评论 (183 个评论)

回复 岳东晓 2015-3-22 15:20
方枪枪: 指责造假的都是以柴静团队为对象的,因为是号称团队是由有科学家组成的。
网上对柴静
比如我,只是不喜欢她的风格,认为煽情,对视频中的造假有疑问。觉得不喜欢 ...
支持指责柴静包括其整个团队的说法。如果说柴静作假,是指其整个团队,具体是柴静自己还是她团队其他人不重要。
回复 岳东晓 2015-3-22 15:02
随笔: 我个人认为,这是一篇不错的论文,就它的题目而言,它完成了对北京地区雾霾产生的颗粒物对人体健康影响的时间序列分析。人家的论文是有前提的,是在限定条件下, ...
论文作为起点的数学模型可能存在问题,导致只能在线性近似下成立。不过,类似的文献也是用类似的模型。雾霾的影响实际是以指数形式出现,其余的因素用 non-parametric 的 cubic p-spline。感觉应该至少先用non-parametric的regression 试一下这个PM的响应。
回复 岳东晓 2015-3-22 14:59
随笔: 还应该加一个,CM死亡人数的增长有多大比重是因为雾霾引起的,没有雾霾这个比重就不会增长吗?
论文就是做这个分析,其结论是 PM 2.5增加10,则CM死亡数增加 1.38% (95% CI: 0.51--1.71)。
回复 岳东晓 2015-3-22 14:33
随笔: 刚刚看到你的回帖,1.38%的增长是论文中提到的,这是基于已发生数据计算的,没有异议。pm200,死亡率26%的增长应该是根据10:1.38推出来的,这个推导有什么科学依 ...
论文中的PM与CM死亡关系不是线性的而是指数,但在增量不大时可以近似为线性。论文table 1中显示 PM2.5 值最高达到435, 因此 PM2.5=200是在统计数据分析的范围之内。

把指数关系推到 26% 肯定有相当误差,因为 0.26^2/2 ~ 0.034,二阶修正不能忽略。

但是这个PM2.5增加200,CM病死亡增加26%的说法确实应该是柴静直接运用图6数据的结果。换言之,柴静对图6 的理解符合论文精神,而不同于方舟子的理解。方舟子将图6在2008年的下降理解成了死亡率下降。
回复 岳东晓 2015-3-22 14:18
方枪枪: 我拨冗解释一下,这里的朋友们学你说话,用“拨冗”,都是粉拳。人都相当奈斯啊 你可以请他们拨冗讲一下与造假有关的。   ...
    那我就请随笔拨冗写一篇分析文章吧。
回复 在美一方 2015-3-22 13:41
随笔: 我个人认为,这是一篇不错的论文,就它的题目而言,它完成了对北京地区雾霾产生的颗粒物对人体健康影响的时间序列分析。人家的论文是有前提的,是在限定条件下, ...
比较一下图1和后来那个exposure-response图,我不认为以图1报告的数据分布做出那个dose-response 曲线是 valid and justified. 这是我说的文章很有问题之一,也是我为什么说冤有头债有主,这个是文章的毛病不是柴静的。
回复 随笔 2015-3-22 11:55
岳东晓: 图6显示,PM值增加10, CM病死亡增加 1.38%。 PM值200, 死亡增加 26%,这是一个推算结果。

实际数据显示,2008年CM病死亡率比2007年增加了9%。

论文中研究的 ...
刚刚看到你的回帖,1.38%的增长是论文中提到的,这是基于已发生数据计算的,没有异议。pm200,死亡率26%的增长应该是根据10:1.38推出来的,这个推导有什么科学依据?

雾霾指数和死亡率不可能是直线关系,pm2.5增长10,死亡比率增长1.38%,增长到20,死亡人数有可能增长到2.76%,pm再接着增长10,死亡率就不一定还能多增1.38%。说句不好听的,pm增到20时,该死的人大概都死了,不该死的就是增到200也照样能活着。pm真发展到一定级别,到世贸中心倒塌时的污染程度,就是年轻力壮的不该死的小伙子也躲不过去。

pm的增长和死亡率只能是一个曲线关系。就像医疗水平提高,人的寿命延长,开始会有10岁,20岁的增长期,但这个比例不会一直延续,会逐步放缓,不然,人就真会长生不老了。

所以,我不认为pm200比26%的死亡增长率是科学的,如果柴静真是这样解释的,就太武断了。
回复 随笔 2015-3-22 11:50
方枪枪: 这是一篇劣质论文。 这还真的不能怪柴静,呵呵。
我个人认为,这是一篇不错的论文,就它的题目而言,它完成了对北京地区雾霾产生的颗粒物对人体健康影响的时间序列分析。人家的论文是有前提的,是在限定条件下,限定时间里对个别因素进行分析论证,这不是大大语录,结论不是放之全国,无条件的真理,不能捡起来就用。

论文重点是对已发生数据的计算,分析也只局限于对图表的解释,几乎没有做数据外的推论,给出的结论小心谨慎,比如最后总结pm2.5和pm10和健康相关系数高,pm2.5-10没有发现这种关系,除此之外,没有做数据外无依据的推论。可以讨论的是它们用于运算的统计模型是不是科学。这确实不好妄加评论,而且,除非大家能给出更有说服力的替代模型。

从统计的角度看,数据是比较全面的,包括了平均值,标准差,相关系数,区间,可靠度的计算。。图和表也很清晰,而且对这些数值都做了全面的解释。

文中多次提到气温对健康的影响,而且把它作为重要指标加人到分析中来,结论雾霾和健康的关系不如气候和健康的关系明显,这也是基于数据分析的结果, 注意,这里对比的相互关系。我的直觉,认同这个结论,冬天冷空气来临,很多人会立马生病,雾霾和健康没有这种立竿见影的关系。

这篇讨论局部问题的论文很难支持柴静对健康和雾霾所做出的泛泛的结论。我前面也说过,这么多的指标必须结合运用,不然人家算出,列出来还有什么意义?不能单抽出一个图就用,这确实会给观众造成误解。就像天气预报,下雨的预测总会伴随着百分比,降雨量大小的指标,你得结合起来看,除非你愿意成天扛把伞,自己吓唬自己。

还是那句话,报告里没必要强加进这个图表,雾霾不是一时就可能治理的,新闻人应该普及知识,引发大家重视,监督各方减少,杜绝污染。而不是夸大事实,引起民众的恐慌。
回复 在美一方 2015-3-22 00:40
方枪枪: 这是一篇劣质论文。 这还真的不能怪柴静,呵呵。
呃,只从这句话,我不能判断劣质论文  
回复 方枪枪 2015-3-22 00:12
在美一方: 会啊,原文里面,更有意思的一段,不知道你有没有看到,说气温对健康的危害“大于”PM2.5的影响,我倒
这是一篇劣质论文。 这还真的不能怪柴静,呵呵。
回复 在美一方 2015-3-22 00:08
随笔: 还应该加一个,CM死亡人数的增长有多大比重是因为雾霾引起的,没有雾霾这个比重就不会增长吗?
会啊,原文里面,更有意思的一段,不知道你有没有看到,说气温对健康的危害“大于”PM2.5的影响,我倒
回复 在美一方 2015-3-22 00:07
随笔: 你把我前面提的问题都解答了。
     
回复 随笔 2015-3-21 23:58
在美一方: 你看看我的猜测有没有参考价值。
http://www.zhenzhubay.com/home.php?mod=space&uid=22&do=blog&id=28604
你把我前面提的问题都解答了。
回复 随笔 2015-3-21 23:54
方枪枪: 这里有三个概念:1. CM 病死率;2. CM死亡人数; 3. CM占死亡人数的%

现在的情况是,CM病死率是下降的,owing to advanced healthcare tech and delivery and ed ...
还应该加一个,CM死亡人数的增长有多大比重是因为雾霾引起的,没有雾霾这个比重就不会增长吗?
回复 方枪枪 2015-3-21 23:47
随笔: 同意怨有头债有主这句话,我根本不相信柴静有能力“篡改”原图,甚至怀疑她是不是有能力理解原图。从讲演中可以看出,很多简单的图她也认为很复杂。不论这张图的 ...
指责造假的都是以柴静团队为对象的,因为是号称团队是由有科学家组成的。
网上对柴静
比如我,只是不喜欢她的风格,认为煽情,对视频中的造假有疑问。觉得不喜欢这个片子。喜欢与不喜欢是个个人主观的看法,没有对错。
比如在美,你也看得到,还是对科学数据的意见。
真扣屎盆子的,也许就是指的从政治意图上进行指责吧。没有人觉得柴静有这个能力改图,但是新闻记录片,新闻调查,人们要求客观真实也是必然的,如果一个以科学论据为支撑的记录片,并不科学,甚至有误导,网友当然可以觉得没有价值。至于抑制污染,当然是正确的主张,但人们认为以不靠普的论据去支持一个正确的主张是不是正确,就是见仁见智各自解读的问题了。
回复 在美一方 2015-3-21 23:40
随笔: 同意怨有头债有主这句话,我根本不相信柴静有能力“篡改”原图,甚至怀疑她是不是有能力理解原图。从讲演中可以看出,很多简单的图她也认为很复杂。不论这张图的 ...
你看看我的猜测有没有参考价值。
http://www.zhenzhubay.com/home.php?mod=space&uid=22&do=blog&id=28604
回复 在美一方 2015-3-21 23:39
ImYoona: 哈,看看类似的研究能不能得到类似的结果还是满有意思的。好象它的一个主要结论是PM2.5的变化对RM的变化比对CM的变化要大,而北京的这篇的结论正好相反。 ...
这个没什么问题的,各个地方的PM2.5 组成不一样
回复 随笔 2015-3-21 23:38
在美一方: 评论一句(这个与柴静无关,我们提倡冤有头债有主),任何模型推算都不能超出其适用数据空间,除非有极好的 a prior knowledge 来支持超出其数值空间的外插。 ...
同意怨有头债有主这句话,我根本不相信柴静有能力“篡改”原图,甚至怀疑她是不是有能力理解原图。从讲演中可以看出,很多简单的图她也认为很复杂。不论这张图的对错,把屎盆中都扣在柴静的头上确实有点冤枉她。
回复 ImYoona 2015-3-21 23:37
在美一方: 这个是meta-analysis,没有自己取样
哈,看看类似的研究能不能得到类似的结果还是满有意思的。好象它的一个主要结论是PM2.5的变化对RM的变化比对CM的变化要大,而北京的这篇的结论正好相反。
回复 在美一方 2015-3-21 23:34
方枪枪: 我拨冗解释一下,这里的朋友们学你说话,用“拨冗”,都是粉拳。人都相当奈斯啊 你可以请他们拨冗讲一下与造假有关的。   ...
哎哎哎,我没学他啊,兄弟我真的是冗啊,今天还在办公室好吧?!!

facelist

您需要登录后才可以评论 登录 | 注册

 留言请遵守道德与有关法律,请勿发表与本文章无关的内容(包括告状信、上访信、广告等)。
 所有留言均为网友自行发布,仅代表网友个人意见,不代表本网观点。

关于我们| 节目信息| 反馈意见 | 联系我们| 招聘信息| 返回手机版| 美国中文网

©2024  美国中文网 Sinovision,Inc.  All Rights Reserved. TOP

回顶部