更新时间:2023-12-30 13:07
抽样误差是指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全局指标的绝对离差。必须指出,抽样误差不同于登记误差,登记误差是在调查过程中由于观察、登记、测量、计算上的差错所引起的误差,是所有统计调查都可能发生的。抽样误差不是由调查失误所引起的,而是随机抽样所特有的误差。
抽样误差是指用样本统计值与被推断的总体参数出现的偏差。
主要包括:样本平均数与总体平均数之差,样本成数与总体成数之差。
统计误差的来源:一类:登记性误差;二类:代表性误差(A、系统性误差;B、偶然性误差),抽样误差特指偶然性误差。
抽样实际误差是指在一次具体的抽样调查中,由于随机因素引起的样本指标与总体指标之间的离差。如样本平均数与总体平均数之间的绝对离差,样本成本与总体成本之间的离差。但是,在抽样中,由于总体指标数值是未知的,因此,抽样实际误差是无法计算的。同时,抽样实际误差仅仅是一系列可能出现的误差数值之一,因此,抽样实际误差没有概括所有可能产生的抽样误差。
抽样平均误差是指抽样平均数的标准差或抽样成数的标准差。从一个总体中我们可能抽取很多个样本,因此样本指标如样本平均数或样本成本数将随着不同的样本而有不同的取值,它们对总体指标如总体平均数或总体成本数的离差有大有小,即抽样误差是个随机变量。而抽样平均误差则是反映抽样误差的一般水平的一个指标,但由于所有可能样本平均数的平均数等于总体平均数,样本成本的平均数等于总体成数,因此,我们不能用简单算术平均的方法来求抽样平均误差,而应采取标准差的方法来计算抽样平均误差。
抽样极限误差就是指样本指标与总体指标之间的误差范围。
影响抽样误差的因素:抽样单位数的多少,总体中被研究标志的变动程度的大小。
抽样误差是抽样理论的一个重要概念,在说明抽样误差之前我们先介绍统计误差。统计误差是指在统计调查中,调查资料与实际情况间的偏差。即抽样估计值与被估计的未知总体参数之差。例如,样本平均数与总体平均数之差;样本成数与总体成数之差等。在统计推断中,误差的来源是多方面的,统计误差按产生的来源分类,有登记误差和代表性误差。
登记误差:
又称调查误差或工作误差,是指在调查过程中,由于各种主观或客观的原因而引起的误差。例如,由于指标含义不清,口径不同而造成的误差;由于被调查者提供不实的资料,以及在登记、计算、抄写上有差错等而出现的误差。这种登记误差不论是在抽样调查还是在其他形式的调查中都有可能产生。调查的范围越广,规模越大,内容越复杂,产生登记误差的可能性就越大。
代表性误差:
它是指在抽样调查中,样本各单位的结构情况不足以代表总体的状况,而用部分去推断总体所产生的误差。代表性误差的发生有以下两种情况:一种是由于违反了抽样调查的随机原则。例如,有意识多选好的单位或较差的单位进行调查而造成的系统性误差。可见,只要遵循了随机原则就可以避免产生系统性误差,系统性误差和登记性误差一样,都是抽样组织工作造成的,应该采取措施预防误差发生或将其减小到最低程度;另一种情况是指遵循了随机原则,可能抽到各种不同的样本而产生的随机性误差。随机性误差在抽样推断中是不避免的,是偶然的代表性误差。
抽样误差:
是指在遵循了随机原则的条件下,不包括登记误差和系统性误差在内的,用样本指标代表总体指标而产生的不可避免的误差。由于总体平均数、总体成数是确定的,而样本平均数、样本成数是随机变量,因而抽样误差也是一个随机变量。抽样误差越小,说明样本的代表性越高;反之,样本的代表性越低。同时抽样误差还说明样本指标与总体指标的相差范围,因此,它是推断总体指标的依据。
抽样误差是统计推断所固有的,虽然无法避免,但可以运用数学公式计算。确定其具体的数量界限,并通过抽样设计程序加以控制,因此抽样误差也可以称为可控制的误差。
①抽样单位的数目。在其他条件不变的情况下,抽样单位的数目越多,抽样误差越小;抽样单位数目越少,抽样误差越大。这是因为随着样本数目的增多,样本结构越接近总体。抽样调查也就越接近全面调查。当样本扩大到总体时,则为全面调查,也就不存在抽样误差了。
②总体被研究标志的变异程度。在其他条件不变的情况下,总体标志的变异程度越小,抽样误差越小。总体标志的变异程度越大,抽样误差越大。抽样误差和总体标志的变异程度成正比变化。这是因为总体的变异程度小,表示总体各单位标志值之间的差异小。则样本指标与总体指标之间的差异也可能小;如果总体各单位标志值相等,则标志变动度为零,样本指标等于总体指标,此时不存在抽样误差。
③抽样方法的选择。重复抽样和不重复抽样的抽样误差的大小不同。采用不重复抽样比采用重复抽样的抽样误差小。
④抽样组织方式不同。采用不同的组织方式,会有不同的抽样误差,这是因为不同的抽样组织所抽中的样本,对于总体的代表性也不同。通常,我们不常利用不同的抽样误差,做出判断各种抽样组织方式的比较标准。