更新时间:2022-08-25 13:24
统计假设是关于一个或多个随机变量的未知分布的假设。随机变量的分布形式已知,而仅涉及分布中的一个或几个未知参数的统计假设,称为参数假设。检验统计假设的过程称为假设检验,判别参数假设的检验称为参数检验。
统计分布就是形成总体中各个单位在各组间的分布。其实质是把总体的全部单位按某标志所分的组进行分配所形成的数列,所以又称分配数列或分布数列。 统计分布由两个构成要素所组成:总体按某标志所分的组,各组所占有的单位数—次数。根据分组标志的不同,分配数列分为品质分配数列和变量分配数列。由上面的概念,统计分布包括两个要素:总体按某标志所分的组和各组的单位数(简称次数)。
根据分组标志的不同,分配数列可分为品质分配数列和变量分配数列。按品质标志分组所编成的分配数列叫做品质分配数列,简称品质数列;按数量标志分组所编成的分配数列叫作分配数列,简称变量数列。
为研究问题的需要,预先设定的一种假设。在假设检验中,统计假设有原假设H0和备择假设H1。例如,欲研究性别对学习成绩的影响问题。定义Xi,Yi分别是男生、女生某学科成绩,可设立原假设X=Y,通过统计方法进行推断。
假设检验(Hypothesis Testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法。具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。常用的假设检验方法有u—检验法、t检验法、χ2检验法(卡方检验)、F—检验法,秩和检验等。
假设检验是抽样推断中的一项重要内容。它是根据原资料作出一个总体指标是否等于某一个数值,某一随机变量是否服从某种概率分布的假设,然后利用样本资料采用一定的统计方法计算出有关检验的统计量,依据一定的概率原则,以较小的风险来判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异,是否应当接受原假设选择的一种检验方法。
用样本指标估计总体指标,其结论有的完全可靠,有的只有不同程度的可靠性,需要进一步加以检验和证实。通过检验,对样本指标与假设的总体指标之间是否存在差别作出判断,是否接受原假设。这里必须明确,进行检验的目的不是怀疑样本指标本身是否计算正确,而是为了分析样本指标和总体指标之间是否存在显著差异。从这个意义上,假设检验又称为显著性检验。
假设检验的思想和方法的根据是小概率原理,具体地说当我们对问题提出原假设和备择假设,并要检验“。是否可信时,可以先假设原假设是正确的,在此假定下,经过一次抽样,若发生了一个小概率事件,可以根据“小概率事件在一次实验中几乎不可能发生”的理由,怀疑原假设原假设不真,而作出拒绝原假设的决定,反之,如果小概率事件没有发生,就没有理由拒绝衬原假设,从而接受原假设。
由于抽样的随机性,利用小概率原理对原假设是否成立作出判断时,难免要犯两类错误。邱芳对该问题进行相关研究,结论如下:
(1)犯两类错误的概率是相互有关联的,当样本容量M固定时,犯第一类错误的概率的减小会导致犯另一类错误的增加。
(2)犯第一类错误的概率可以通过适当改变检验的拒绝域来进行调整。
(3)当样本容量n给定时,由于很难得到第二类错误的表达式,在实际应用中,一般只是对犯第一类错误的概率加以控制,特别是在进行单侧检验时,最好把原假设取为预想的结果的反面。
(4)当零假设不真时,参数的真值越接近零假设下的值时,犯第二类错误的概率就越大。
(5)要同时降低犯两类错误的概率,需要增加样本容量。