更新时间:2023-07-13 09:51
在统计学中,零假设(虚无假设)是做统计检验时的一类假设。零假设的内容一般是希望证明其错误的假设。比如说,在相关性检验中,一般会取“两者之间没有关联”作为零假设,而在独立性检验中,一般会取“两者之间有关联”作为零假设。与零假设相对的是备择假设(对立假设),即不希望看到的另一种可能。从数学上来看,零假设和备择假设的地位是相等的,但是在统计学的实际运用中,常常需要强调一类假设为应当或期望实现的假设。如果一个统计检验的结果拒绝零假设(结论不支持零假设),而实际上真实的情况属于零假设,那么称这个检验犯了第一类错误。反之,如果检验结果支持零假设,而实际上真实的情况属于备择假设,那么称这个检验犯了第二类错误。通常的做法是,在保持第一类错误出现的机会在某个特定水平上的时候,尽量减少第二类错误出现的概率。
看到零假设的时候我们会自然地发问,这个“假设”太奇怪了,竟然叫零假设,难道还有什么一假设和二假设吗?换句话说,假设是可用数字来计量的吗?对这个问题有一个好的理解的办法可能需要提到相关系数,还有就是关于假设的一些简单陈述。当我们想理解两个事件是否相关的时候,我们用相关系数来测量它们之间的相关程度,它是介于-1到1的一个数值。当相关系数是零的时候,我们说这两个事件没有关系。假设就是我们对两个事件之间关系的某种猜测。因此,如果我们要研究两个事件的关系时,零假设的意思就是说,两件事情之间没有关系。
当然,零假设仍然是一种假设,并不是对世界运动的客观描述,至少在没有证明它是正确的情形下这样的表达是可靠的。零假设不过是我们研究两个事物之间是否有关的时候我们能做出的最保守的假设。如果我们想知道温室气体排放的增加和全球变暖之间的关系,而在研究之前我们没有做过任何的研究和调查,我们最保险的办法就是认为这两者之间没有关系,这就是零假设。因为在研究之前我们不知道它们之间是什么样的关系,所以我们宁可认为它们之间没有关系。然后通过我们科学的调查研究,再排除那些偶然性的因素之后,我们得到的结论是温室气体排放使全球变暖。
正如上面所提到的,零假设还要让我们接受偶然性。许多事情的发生出于偶然,这是一个基本事实。由于偶然而导致两个事情看起来有关系,或者说有关系,但实际上我们还是认为这两者之间的关系仍然是不相关的,用零假设来描述它们的关系仍然是恰当的。偶然性是一个让人着迷又易犯错误的领域,尽管它确实存在,但是在对它进行研究的人们仍然是我们人类中的强者。我们所要研究的是,在排除这些偶然性的因素之后得到的两者之间的必然联系。只有这样的结论才是可靠的,运用这样的结论来改造世界才是安全的。
1零假设一般是有意推翻的假设;
2由于第一类错误的概率可以通过显著性水平的选定加以控制,零假设一般是如果出现第一类错误后后果更为严重的情况的假设。
在假定零假设为真的前提下,确定样本分布形态和特征值(包括期望和方差)并选择合适的统计量,然后,确定包括接受域,临界值和拒绝域在内的决策标准;根据样本数据计算出统计量并将其与决策标准比后得出结论。其间决策标准的逻辑意义在于,零假设为真时的样本分布中,抽样数据落在拒绝域被设定为小概率事件,而小概率事件在一次试验中几乎是不可能发生的,一旦发生,可认定样本数据落在拒绝域并非小概率事件,零假设为真的前提可以被推翻。
人们通常认为科学家的工作是证明一个假设的正确性——比如说电子的存在,或者某个药物可以治愈癌症。但是,大部分时候,科学家做着相反的工作:他们需要推翻假设。
这个方法经过科学家们数十年的发展和完善,但是20世纪20年代初的一个下午在这段历史过程中尤其引人注目。那是在英格兰的一个农业研究站,三位科学家在喝下午茶。一位叫做罗纳德·费希尔(Ronald Fisher)的统计学家倒了一杯奶茶端给了他的同事,穆丽尔·布里斯托(Muriel Bristol)。
布里斯托拒绝了这杯茶。她更喜欢先倒牛奶后倒茶的味道。
“怎么可能。”据说费希尔这样回答道,“先倒牛奶还是后倒牛奶当然没有区别。”
但是布里斯托态度坚定。她坚持说,她可以尝出其中的区别。
对话的第三个科学家,威廉姆·洛奇(William Roach),建议大家做个试验。(这或许其实是个科学勾搭的时刻:布里斯托和洛奇1923年结婚了。)
但是如何测试布里斯托的宣称呢?费希尔和洛奇能做的最简单的事情,就是倒一杯奶茶,不让布里斯托看见,然后给她尝,看她能不能猜对是先加的奶还是先加的茶。
不过,就算她说对了,也并不见得能证明她对茶的有着独到的鉴赏力。考虑到有50%的概率可以答对,她完全可以全靠蒙来猜中答案。
多年之后,费希尔在他1935出版的书《实验设计》中描述了应该如何检验这样的宣称。他不是去试图证明布里斯托可以尝出两种茶的区别,而是试图驳斥这样的假设:“布里斯托的选择是随机的”。“我们可以称这样的假设为‘零假设’,”费希尔写到,“零假设永远无法证明或者确定,但是可能通过实验手段被否定。可以说,每个实验存在的目的,都不过是为了给事实提供一个机会去推翻零假设。”
费希尔概述了一种方式来驳斥零假设——布里斯托的选择是随机的。他会准备8杯茶,4杯先放牛奶,4杯后放牛奶。然后他会打乱杯子的顺序,让布里斯托每次品尝一杯。她需要将8杯茶分两组,一组她认为是先放了牛奶的,另外一组是后放了牛奶的。
据说布里斯托不费吹灰之力满分过关,正确地分辨出全部8杯茶。由于费希尔的实验设计,她全靠瞎猜将8杯茶全部正确分类的概率很小。8杯茶平分成2组有整整70种不同组合,也就是说布里斯托完全蒙对答案的概率只有1/70。
费希尔的检测依然不能完全排除布里斯托是猜对的可能性。只是说,她都是猜对的可能性很小。他可以通过让布里斯托喝更多的茶进一步降低这种可能性,但是他永远不可能把这种可能性降到0。
既然绝对的证明是不可能的,费希尔在做实验的时候更倾向于考虑可操作性。在他和布里斯托工作的农业实验室,费希尔的工作就是分析几十年采集的数据来确定这些信息是否有价值,比如,能判断出作物肥料的最佳配方是什么。科学家可以用这些数据来设计规模更大的实验来得到更精确的结果。费希尔认为,设计一个需要历经数百年才能得到结果的实验没有任何意义。他相信,等到可能性低到一定程度的时候,见好就收也足够了。
他认为5%就是一个合理的阈值。如果我们假定某个零假设是正确的,却发现在零假设下观察到这种数据的概率不到5%,那我们就可以很安全地“拒绝”零假设了。在布里斯托的例子中,她猜对的概率远远小于费希尔的阈值,只有1.4%。
很大程度上多亏了费希尔,零假设已经成为了科学发现的一个重要工具。你可以在每一个科学分支找到零假设的影子,从心理学到病毒学到宇宙学。并且,科学家们延续了费希尔5%的阈值概率。