微信

English
 

学院快讯

本科生系列学术沙龙 ——相关关系VS因果关系与统计陷阱

时间:2017年07月14日

来源:

浏览:

维多利亚老品牌vic1192016-2017学年第三学期

本科生系列学术沙龙-6

 ——相关关系VS因果关系与统计陷阱


77日,维多利亚老品牌vic119第六次本科生系列学术沙龙活动如期举行,由我院卫生统计组周鼒老师和韩耀风老师分享“统计的那些事儿”。沙龙由何承勇老师主持,预防医学系刘衡川老师以及2013级预防医学系20名本科生共同参加。   

开场中,周鼒老师带我们认识了台湾著名学者沈君山先生。作为“台湾四公子”之一,沈君山先生不仅文学水平了得,还是台湾清华大学创始人之一、物理系教授兼理学院院长,然而即使是这样拥有“开挂”一生的传奇人物,却在199620052007年三度发生脑中风重度昏迷,深受脑卒中疾病的困顿侵害,引人深思。周鼒老师由此引出“中国中老年人社会隔离、抑郁与脑卒中发病风险的因果关系研究”的案例探讨“相关关系VS因果关系”

图一 周老师介绍沈君山先生


预防脑卒中,最重要的是寻找、验证诸如社会隔离和抑郁等危害因素。但是研究结果显示的相关性是否能代表因果关系呢?周老师举了几个例子:“烟草和肺癌的关系”、“海参和IQ的关系”、“啤酒和尿布营销策略”、“气温与冰淇淋的销量”、“马克莱莱的重要性”、“《大话西游》经典桥段的解读”等。用丰富的案例从正反两面为我们验证“相关关系和因果关系的不等性”。

图二 同学们热烈讨论


其中,“马克莱莱的重要性”一例尤为生动。2001~2002赛季,皇马作为欧冠和西甲双冠王的足球俱乐部,拥有豪华的前场阵容,但因为看重市场推广,2003年皇马主席弗洛伦蒂诺将“既不会传球,也不会进球,踢法难看,缺乏颜值”的马克莱莱卖给切尔西。从此,即便阵容依旧豪华,但少了中后场“任劳任怨”的“防守”马克莱莱,皇马后续几年内再也没有获得过西甲冠军。马克莱莱离开前后皇马“战绩”对比显而易见地体现出马克莱莱的重要性,与“滥竽充数”、“没了你世界照样转”形成鲜明对比。周老师“妙语连珠”, 教人不得不记住:“关键因素存在与否对结果的影响”,这一判断因果关系的重要法则。

周老师还从大家熟知的《大话西游》经典桥段中“挖掘”出深刻的因果关系,得出“厚黑学”的“无敌”、要不要面子和恋爱结局的关系等“独特视角”,惹得全场哄堂大笑,让同学们在轻松幽默的氛围中领悟因果,好不有趣。

周老师最后总结,普遍的相关关系不代表因果关系。虽然世界是普遍联系的,但是因果是更本质的关系,对于预防医学的病因研究,本质的因果关系更为需要。正如大家所知道的,由于无法解释时序性和内生性,阐明因果必然的联系,横截面对照和病例对照试验在因果关系验证中局限性大,验证强度较低。

图三 周老师介绍RCT试验和MSM模型


为缓解现实中难以达到完全控制变量的问题,明确因果关系,一些方法应运而生。比如使用RCT(随机对照试验)方法,最大限度控制混杂因素,提高实验可靠性,但RCT方法要求样本大(如我院戊肝疫苗RCT样本达到11万多人群)、耗时长、成本高、质量严(如临床实验的依从性、污染问题),往往让人“望而生畏”。因此,周老师特别介绍了MSM模型,对统计数据进行统计因果推断。用调查数据模拟人群来控制混杂因素,达到近似RCT实验效果,具有成本小、时间短、普适性等优点。本次讨论课题即通过该法得到社会隔离和脑卒中的相关性。RCT方法和MSM模型为我们提供了新的研究思路。

下半场中,韩耀风老师的“统计陷阱”也引起了大家极大的兴趣。韩老师旁征博引,例举“亲子鉴定风波”、“美国总统大选选票调查预测选举结果”、“《政府工作报告》的鼓舞”、“高露洁的‘甜言蜜语’”、“家庭居室布局考究”、“条图的trick”、“航空与铁路的风险”、“烟草与学习成绩”、“中国富人‘移居潮’”、“取暖政策与减寿”、、“高盐饮食与高血压”等等纵横社会热点问题,引起同学们热烈的讨论和深入的思考,诸如样本的代表性、样本的来源、样本数量、统计数据到底用均值好还是中位数好、众数好?

图四 韩老师介绍PNAS杂志“取暖政策与减寿”文章中统计问题


韩老师从与同学们密切相关的“各大学毕业五年后本科生薪资平均水平排行榜”问题入手,鼓励同学们发散思维、自主思考。意识到统计中样本量、样本的代表性、分布特征、统计量选择、调查质量的重要性,提醒同学们谨防被数据“欺骗”,应当重视专业知识的积累,善于透过“假象”寻找真理。

图五 韩老师推荐统计学书目


处于大数据时代中的我们,每天都被各种各样的数据所包围,我们应当善用统计这个工具,而不能成为统计的奴隶。正如韩老师所说,统计有“让我们开心的时候”,也有“让我们伤心的时候”,比如曾统计住院天数、住院人数、X-射线检查等五种因素与医疗人力需求的关系,运用多因素分析,发现都没有显著差异,很让人伤心;但运用单因素相关分析发现每项都有显著差异。因此当我们掌握了正确的统计学知识,选择了合适的统计方法后,也许就能化痛苦为力量,化力量为乐趣,化乐趣为真知。


最后韩老师向我们推荐了《统计数字会撒谎》和《统计陷阱》这两本书,并赠予我们C.R.Rao的名言:

在终极分析下,一切知识都是历史

在抽象的意义下,一切科学都是数据

在理性的基础上,所有的判断都是统计学


(维多利亚老品牌vic119预防医学2013级本科生杨颖)



上一篇 下一篇