更新时间:2024-06-17 18:20
极限误差是指抽样推断中依一定概率保证下的误差的最大范围,所以也称为允许误差。估计量加上允许误差形成置信区间的上限,估计量减去允许误差形成置信区间的下限。极限误差表现为某置信度的临界值( 或称概率度)乘以抽样平均误差。即:极限误差= 临界值x 抽样平均误差。
“极限误差”在学术文献中的解释:
1、所谓极限误差是指国家有关技术标准、检定过程中对计量器具所规定的最大允许误差值。所谓商品计量负偏差是指商品量的实际数值低于商品结算或者标称量的状况。
2、以上这种表达形式给出的是:测量结果的误差限或可能误差限(最好不要称为极限误差,因为曾经长期使用过的极限误差一词有不同的定义而并非这里的U或Urel)。
3、但是使用中将s与σ不分的现象相当普遍,s当作σ运用,并把它的三倍称为极限误差,认为真值存在于±3σ之内的或然率为99.73%,这是错误的。
4、对于某一项调查来说,根据客观要求一般应有一个允许的误差限,若抽样误差在这个限度之内就认为是可允许的,这一允许的误差限度就称为极限误差。根据理论上的要求,抽样极限误差通常需要以抽样平均误差为根据。
什么是抽样极限误差
抽样极限误差又称“置信区间和抽样允许误差范围”,是指在一定的把握程度(P)下保证样本指标与总体指标之间的抽样误差不超过某一给定的最大可能范围,记作Δ。
抽样极限误差的计算
作为样本的随机变量——抽样指标值(或p),是围绕以未知的仅能确定的全及指标真值(或P)为中心上下波动,它与全及指标值可能会产生正或负离差,这些离差均是抽样指标的随机变量,因而难以避免,只能将其控制在预先要求的误差范围(或)内。
或 由于和是预先给定的抽样方案中所允许的误差范围,所以利用和可以反过来估计未知的全及指标的取值可能的范围。解上述两个绝对值不等式便可得:
例1:例如要估计北京北站整车到达货物的平均运送时间。从交付的全部整车货票共26193批中,用不重复抽样抽取2718批货票。若允许的抽样极限误差(天),经计算知所抽取的每批货物平均运送时间为((天),那么北京北站整车到达货物的平均运送时间区间估计为(5.64-0.125,5.64+0.125),即在5.515到5.765天之间。
例2:资料同上,若要估计北京北站整车到达货物的逾期运到率(报告期内超过规定货物运到期限运到的货物批数/货物的到达总批数),从随机抽取的2718批货票中,计算得抽样逾期到率为6.43%,所确定的抽样极限误差为,由此可得北京北站总体的逾期运到率的区间估计是(6.43%-0.642%,6.43%+0.642%)。
冲件的极限误差是具有极限偏差的冲件所具有的实际允许的最大尺寸误差。这类冲件通常是在冲模失效报废前冲制的最后一批合格冲件。
对各类冲模冲件误差在冲模整个寿命中出现的波动、增减趋向及规律等进行全面分析便可发现:冲件误差的主导部分是不变的;因刃口或型腔的自然磨损而出现的误差增量随冲模刃磨冲数增加而使这部分误差逐渐加大;还有部分误差的增量是非常规的、不可预见的。所以,各类冲模冲件误差是由因定误差、渐增误差、系统误差及偶发误差等几部分综合构成。
固定误差:新冲模在指定的冲压设备上投入使用至失效报废的整个(总)寿命过程中,其合格冲件误差的主导部分固定不变即所谓固定误差。其大小就是新冲模第一次刃磨前冲制的合格冲件的偏差,也即冲模的初始误差,而此时的冲模具有初始冲压精度。刃磨后的冲模,因其工作零件(凸、凹模)磨损而改变尺寸误差,使冲件识差增量随刃磨次数增加而逐渐加大,故冲模刃磨后的冲压精度亦称“刃磨精度”比其初始精度要低。冲模冲件的固定误差取决于以下各要素:冲件的材料种类、结构(形状)尺寸及料厚。
冲裁间隙的大小及其均匀度对冲裁件的尺寸精度有决定性的影响。不同冲裁工艺、不同材料种类与不等料厚,间隙相差悬殊,冲压精度差异很大。同一种模数m=0.34的2mm的料厚、中心有孔的H62黄铜材料片齿轮复合模冲件,当取间隙C=0.5%t(单边),用复合精冲模冲制,冲件尺寸精度达到IT7级,冲件平直无拱弯,冲切面垂直度可达89.5°,其表面粗糙Ra值为0.2μm;而用普通复合模冲制,间隙C=5%t(单边),冲件初始误差亦即冲模的初始冲压精度为1T9级,冲切面粗糙度Ra值为12.5μm,毛刺高度为0.10mm;还是这个冲件用连续模冲制,间隙C=7%t(单边),初始冲件精度为IT11级,冲切面更粗糙,甚至有肉眼可见的台阶。通常情况下,冲件材料及其厚度t是选取冲裁间隙的主要依据。一旦选定间隙就确定了冲件的平面尺寸的固定误差的主体;冲件结构刚度及立体形状则影响其形位精度。
测量不确定度和误差是计量学中研究的基本命题,也是计量测试人员经常运用的重要概念之一。它直接关系着测量结果的可靠程度和量值传递的准确一致。然而很多人由于概念不清,很容易将二者混淆或误用,本文结合学习《测量不确定度评定与表示》的体会,着重谈谈二者之间的不同之处。
首先要明确的是测量不确定度与误差二者之间概念上的差异。
测量不确定度表征被测量的真值所处量值范围的评定。它按某一置信概率给出真值可能落入的区间。它可以是标准差或其倍数,或是说明了置信水准的区间的半宽。它不是具体的真误差,它只是以参数形式定量表示了无法修正的那部分误差范围。它来源于偶然效应和系统效应的不完善修正,是用于表征合理赋予的被测量值的分散性参数。不确定度按其获得方法分为A、B两类评定分量。A类评定分量是通过观测列统计分析作出的不确定度评定,B类评定分量是依据经验或其他信息进行估计,并假定存在近似的“标准偏差”所表征的不确定度分量。
误差多数情况下是指测量误差,它的传统定义是测量结果与被测量真值之差。通常可分为两类:系统误差和偶然误差。误差是客观存在的,它应该是一个确定的值,但由于在绝大多数情况下,真值是不知道的,所以真误差也无法准确知道。我们只是在特定的条件下寻求最佳的真值近似值,并称之为约定真值。
通过对概念的理解,我们可以看出测量不确定度与测量误差的主要有以下几方面区别:
一.评定目的的区别:
测量不确定度为的是表明被测量值的分散性;
测量误差为的是表明测量结果偏离真值的程度。
二.评定结果的区别:
测量不确定度是无符号的参数,用标准差或标准差的倍数或置信区间的半宽表示,由人们根据实验、资料、经验等信息进行评定,可以通过A,B两类评定方法定量确定;
测量误差为有正号或负号的量值,其值为测量结果减去被测量的真值,由于真值未知,往往不能准确得到,当用约定真值代替真值时,只可得到其估计值。
三.影响因素的区别:
测量不确定度由人们经过分析和评定得到,因而与人们对被测量、影响量及测量过程的认识有关;
测量误差是客观存在的,不受外界因素的影响,不以人的认识程度而改变;
因此,在进行不确定度分析时,应充分考虑各种影响因素,并对不确定度的评定加以验证。否则由于分析估计不足,可能在测量结果非常接近真值(即误差很小)的情况下评定得到的不确定度却较大,也可能在测量误差实际上较大的情况下,给出的不确定度却偏小。
四.按性质区分上的区别:
测量不确定度不确定度分量评定时一般不必区分其性质,若需要区分时应表述为:“由随机效应引入的不确定度分量”和“由系统效应引入的不确定度分量”;
测量误差按性质可分为随机误差和系统误差两类,按定义随机误差和系统误差都是无穷多次测量情况下的理想概念。
五.对测量结果修正的区别:
“不确定度”一词本身隐含为一种可估计的值,它不是指具体的、确切的误差值,虽可估计,但却不能用以修正量值,只可在已修正测量结果的不确定度中考虑修正不完善而引入的不确定度;
而系统误差的估计值如果已知则可以对测量结果进行修正,得到已修正的测量结果。
一个量值经修正后,可能会更靠近真值,但其不确定度不但不减小,有时反而会更大。这主要还是因为我们不能确切的知道真值为多少,仅能对测量结果靠近或离开真值的程度进行估计而已。
虽然测量不确定度与误差有着以上种种不同,但它们仍存在着密切的联系。不确定度的概念是误差理论的应用和拓展,而误差分析依然是测量不确定度评估的理论基础,在估计B类分量时,更是离不开误差分析。例如测量仪器的特性可以用最大允许误差、示值误差等术语描述。在技术规范、规程中规定的测量仪器允许误差的极限值,称为“最大允许误差”或“允许误差限”。它是制造厂对某种型号仪器所规定的示值误差的允许范围,而不是某一台仪器实际存在的误差。测量仪器的最大允许误差可在仪器说明书中查到,用数值表示时有正负号,通常用绝对误差、相对误差、引用误差或它们的组合形式表示。例如土0.1PV,土1%等。测量仪器的最大允许误差不是测量不确定度,但可以作为测量不确定度评定的依据。测量结果中由测量仪器引入的不确定度可根据该仪器的最大允许误差按B类评定方法评定。又如测量仪器的示值与对应输入量的约定真值之差,为测量仪器的示值误差。对于实物量具,示值就是其标称值。通常用高一等级测量标准所提供的或复现的量值,作为约定真值(常称校准值或标准值)。在检定工作中,当测量标准给出的标准值的扩展不确定度为被检仪器最大允许误差的1/3~1/10时,且被检仪器的示值误差在规定的最大允许误差内,则可判为合格。
抽样推断是按照随机的原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,根据观察结果来推断,对总体做出数量上的推断分析。比如我们平时购买商品时,都要选一样看看或者尝一点试试,就可以知道全部商品是怎样的,也就是说,你不必吃完整盘菜,才知道菜好不好吃。这是抽样的精髓,从一部分得知全体。在抽样的推断中,要注意抽样中的极限误差与置信水平。
实际抽样时,样本的选取很关键。如果只抽取一个样本,我们不知道从这个样本得到的估计值与总体真正值的距离有多大,因为我们根本不知道总体真正值是多少。但是只要是从大的随机样本算出来的估计值,几乎一定会靠近真正值。根据有多样本结果构成的形态,我们可以知道用一个样本的结果来估计总体时有多少置信程度。抽样调查中的极限误差,其实就是把抽样的变异性换成调查结果置信程度的一种描述。变异性是说当抽取很多样本时,统计量的值的离散程度。
极限误差通常是这样描述的:极限误差是正负3个百分点。它的意思是如果我们用同样的抽样方法抽取许多样本,则这些样本中有95%,其所得的结果会在总体真正值的正负3个百分点之内。通常一个随机样本的结果,不会刚好估计出总体的真正值,我们必须用一个极限误差来描述估计值与总体真正值的距离,但是又不能百分之百确
定,估计值和总体真正值的差距必定小于极限误差。所有样本当中有95%,距离总体真正值的确有这么近,但是另外的5%,距总体真正值的差距就超过极限误差了。我们并不知道总体的真正值是多少,所以我们也无法得知,我们的样本到底是属于那95%的样本还是属于5%的样本。所以我们只能说是有95%的可靠性,总体真正值会在极限误差内。95%是我们通常所说的置信程度或者有95%的信心或者置信水平。
置信程度是估计的可靠程度。比如说调查发现有47%的女性认为她们没有足够的个人时间,我们有95%的信心,使所有女性的真正比率,会在这个样本结果的正负3个百分点范围内。这是关于置信程度的叙述。置信程度包含两个内容:极限误差和置信水平。极限误差告诉我们,样本统计量与总体参数的距离有多大,也就是估计的准确性。置信水平则告诉我们,所有可能样本中有多少把握满足这样的极限误差。置信程度显示出所有可能样本会发生的状况,我们用它来描述对一个样本的结果有多少可信程度。95%的置信程度的意思是如果我们用同样的抽样方法,有95%的时候可以得到与总体真正值这么接近的结果。
有几点需要说明:
(1)置信程度的结论永远是针对总体而不是针对样本。比如对女性问题的调查的置信程度是根据样本结果来对所有女性这个总体做某种结论。
(2)对总体所做的结论永远不会是完全正确的,你的样本可能就是置信程度超过3个百分点的5%的样本之一。
(3)抽样推断可以选择95%以外的置信水平。抽样中的极限误差决定了估计的准确性,置信程度决定了估计的可靠性。在抽样推断中,总是希望估计的准确性尽量高一些,估计的可靠性尽量大一些,对于同一个总体来说,提高了估计的准确性必然会降低估计的可靠性,也就是说,较高的置信水平的代价是较大的极限误差。对于同一个样本,99%的置信程度的极限误差,就比95%置信程度的要大,如果只要95%的置信程度,就可以得到较小的极限误差。在估计时,只能对其中的一个要素提出要求,而推求另一个要素的变化情况。我们前面计算的极限误差的简单方法用的就是95%的置信程度。实际当中,应用95%的置信水平是很普遍的。
(4)如果对估计的可靠性提出要求,即在同样的置信水平下,又要求较小的极限误差来要求估计的准确性,就取一个大一点的样本,因为较大的样本会有较小的变异性,只要抽取较大的样本,就可以得到所要求的小的极限误差,并且仍然维持高的置信水平。