亦弘视野
当前位置:网站首页  > 亦弘视野 > 推荐阅读
同学说 | 打开统计学之门,先知知后知,先觉觉后觉

作者简介

陈小亮

 

 

成都市第五人民医院临床药理研究中心

临床研究管理二班学员

 

 

 

药理学硕士,目前在医院从事新药临床药理工作,兴趣:定量药理学&统计学。

 


 

——谨以此文,献给亦弘商学院孜孜以求、诲人不倦的各位统计学老师们:马政博士、王钧源博士、狄佳宁博士、何静博士和高岩菲女士。余尝闻:贤者以其昭昭使人昭昭,愚者以其昏昏使人昭昭。感谢他们以学富五车的精湛才识,精心准备的课件,为行业的后辈学员,打开统计学之门,先知知后知,先觉觉后觉。

 

 

一杯奶茶

 

事情要从20世纪20年代英国剑桥镇的一位女士说起,她坚持认为,将茶倒进牛奶里和将牛奶倒进茶里的味道是不同的。

 

如何确定这位女士是否能判断出两种茶的区别,这是个问题。

 

如果给她1杯茶,即使无法判断出区别,她也有50%的机会猜对;如果给她2杯茶,她仍然可能猜对,但同时猜对的概率则会降低。

 

即使她能判断出区别,仍然存在问题,她可能犯错误:某杯茶可能混合不够好,导致10杯茶,她可能只答对9杯。

 

如何确定需要测试多少杯、测试的顺序、应向女士透露多少顺序的信息,才能计算出这位女士在拥有,或者没有辨别能力时,出现不同结果的概率?

 

100年后的今天,翻开各种统计学教材,乃至新药研发的统计应用领域,样本量、零假设、顺序效应、条件概率等概念,在这杯奶茶试验设计的故事中,已经出现了概念的雏形。

 

亦弘悦读:《女士品茶》(临床研究管理班课程教授推荐阅读书籍)

 

 

概率及概率分布

 

科学就是测量,临床试验也是在测量一堆数据,但实际上这些测量出的精确的个体数字,对于群体来说,或者对于“真实结果”来说,都是随机且有误差的,只能谈论数值的概率而不是确定的数值。

 

在毒理学中,某些药物即使剂量再低也有实验动物死亡,剂量再高也有实验动物存活,这就无法确定杀死某只具体实验动物所需要的剂量,似乎也无法准确量化药物的毒性,但将剂量与这个剂量下死亡的概率联系起来,便可产生一个50%致死概率下对应的剂量,毒理学术语称之为LD50。

 

另一个概率及概率分布模型的应用是博彩。输和赢,不同比分的输赢,都是可能发生的事件,而这些事件发生的概率都是可以基于不同参数估算出来,精算师就是预先将这种概率计算到极致,最终庄家也会因为对各种精算信息的不对称预知,永远都是赢家,而买家即便有个体获益,也是以牺牲群体利益为代价,类似一个囚徒困境,模型注定了结局,我已经看见,一部悲剧正在上演。

 

 

假设检验和多重比较

 

假设检验,是基于小概率事件发生的可能性不大这一基本逻辑,从而推翻原假设(null)的一种工具,但这并不能让我们必然接受另一个假设(alternative),更不能因为假设事件(null)概率的大小,得出另一个假设(alternative)显著性的大小。这是一切假设检验的逻辑基础,也是为什么用“假设检验”要比用“显著性检验”准确,“有统计学意义”比“有显著性差异”更好的原因。

 

 

回到前面的奶茶试验,假设女士不能正确判断(null),那么品尝1杯奶茶,得出正确的结论的概率50%(靠猜测);如果品尝2杯奶茶,得出至少1次正确的概率75%,由此看出,多测试几次,总有一次蒙对的概率大大提高。这是假设检验中的另一个基础理论,多重比较会增加假阳性的错误(I类错误),这也是为什么序贯设计、中期分析、适应性设计中需要调整检验水平的原因。

 

相关容易,因果太难

 

“生子植一树,一岁一测量,子长树亦长,遂奉为神树。”

 

这样的例子常常被写入各种统计学教材,生动地告诫着我们,相关容易,因果太难。大千世界,纷纷扰扰,很多事件与事件,从数据看总能发现千丝万缕的相关,但这种关系从理论上看,至少有五种可能:1导致2(因果)、2导致1(果因)、3导致1和2、1和2互为因果、偶然巧合。

 

相关的事件未必都有因果,但知其然而知其所以然,是我们与生俱来认识世界的一种本性,收集资料,寻找因果,确认结论的必然性,进一步解释和扩大认知,这是经典的认识方法学。

 

然而在大数据时代背景下,“谷歌流感趋势”和“啤酒与尿不湿”的案例都能得出准确的结论。显然这与传统的抽样、概率、统计推断的思路不同,因果无法得到证明,我们都不知道“为何如此”,但并不妨碍我们知道“正是如此”。

 

历史在往前发展,认识世界的方法也在发生着改变,但发展的就一定是进步的吗?执其两端,用其中于民,或许才是一切认知思维的总纲。

 

 

剑宗与气宗之争——频数派和贝叶斯派

 

前面提到的概率,是统计学的基石。而对于概率的解释,一种观点认为是大量试验稳定重现后反映的真实值,概率是客观存在的,事件的不确定性也只是频率的不稳定性而已。另一种观点则认为,概率只是人们对于事件认识的不确定程度,可以通过人的知识和经验做出判断或不断修正。简言之,前者是频数派,认为概率有准确客观的值,后者是贝叶斯派,认为概率只是随机变量。两派争论的焦点也是后续计算思维差异的根本所在。

 

贝叶斯派在此基础上,提出事件的先验概率(主观经验假定),通过假定的先验概率和真实结果的偏差,修正事件的概率(后验概率),重复计算得到一个更接近事件的真实概率,从而最终获取一个相对准确的结果,这是贝叶斯理论的逻辑基础。计算机的出现,将这种重复迭代计算能力发挥到极致,通过不断学习和积累,修正后验概率,便有了人工智能。

 

显然,频数派是从客观的实验和数据出发,而贝叶斯派则认为太过于追求客观,而牺牲人的知识和经验,两派之争,涉及到人的世界观和方法论,不再仅仅是概率的学术问题。

 

无论哪种学派,随着试验次数的增加,得到的概率趋于同一个P值,但它们背后的含义是截然不同的。这也许从另一个方面揭示了方法的差异和真理的唯一, 殊途而同归。用王钧源老师的话,两种学派的理论,不是替代,而是互补,是剑宗与气宗之争。

 

 

应用案例举隅

 

在这个信息爆炸的时代,简约的事情有着难以撼动的优势,3+3设计便是因为这种简约易于理解和执行,在剂量爬坡试验中成为经典。CRM模型,则是假设某种剂量与DLT之间的(参数)关系,根据每一个人/组受试者的剂量反应结果更新参数(模型),根据新的模型外推计算,选择下一个剂量。奇妙的是,这种模型参数的更新,既可以采用频数派理论,也可以采用贝叶斯派理论。

 

狄佳宁老师,通过模拟剂量爬坡试验的4种情况,生动对比了两种方法的应用过程,有案例,有过程,有对比,有归纳,让我们更直观地体会了CRM模型。

 

联想到定量药理学,已经从单纯的PK 数据建模与模拟,发展到学习与验证循环,并不断更新,研究模式包括收集数据、学习规律、进行外推三大步骤,这一思路抽象地看,关键词可以概括为:模型、迭代计算。

 

 

结  语

 

四天学习,倏忽而过,书不尽言,言不尽意。但一言蔽之,亦弘商学院统计学模块的学习,目的不是培养统计学技能,而是培养一种统计学思维和视角。再次感谢各位老师传道解惑,借我们一双慧眼,来测量上帝的旨意。

 


 

敬请持续关注临床研究管理精彩课堂!

临床研究管理第三期即将启动招生,

点击此处与我们一同出发!

 

电话:010-65541577-836/832

邮件:apply@yeehongedu.cn