更新时间:2022-04-19 20:50
从总体中随机抽取一部分观察单位,某变量的实测值构成样本。如总体是某地某年全部正常成年人(的血压值),从中随机抽取部分正常成年人,分别测得其血压值,组成样本。抽取样本的方法可以是随机的也可以是非随机的,样本有时可能代表总体,有时也不一定能代表总体。
亦称子样、抽样的结果.统计学的基本概念之一.从总体ξ中随机地抽取n个个体ξ1,ξ2,…,ξn,称(ξ1,ξ2,…,ξn)为总体ξ的一个样本.样本中个体的数目n称为样本容量.由于每个ξi(i=1,2,…,n)从总体ξ中被抽出的随机性,所以必须把每个ξi都视为随机变量,容量为n的样本(ξ1,ξ2,…,ξn)则视为n维随机向量,而对一次抽取得到的n个具体确定的数值(x1,x2,…,xn)称为样本(ξ1,ξ2,…,ξn)的观察值,简称样本值.一般地说,一个样本值就是一个n元有序数组.(ξ1,ξ2,…,ξn)所有可能取的全体样本值的集合,称为样本空间,它是抽样理论中的一个基本空间.样本空间的样本值(x1,x2,…,xn)就是样本空间中的点,称为样本点.人们常用“从总体ξ中抽取样本ξ1,ξ2,…,ξn”这一术语,是指从总体中随机地抽取容量为n的样本,并用ξ1,ξ2,…,ξn表示.因此ξ及ξ1,ξ2,…,ξn都是随机变量,(ξ1,ξ2,…,ξn)是n维随机向量.当总体相当大时,只可能从总体中抽取部分个体即样本来研究,从样本的研究中对总体的特性做出估计与推断.
①整群样本(cluster sample):以人群为单位而不是以个体为单位进行抽样而得的样本。如一个城市街区或一个家庭的全部人员。
②随意样本(grab sample):通常指在选取样本时,采用了易于获得样本的抽样方式,基本上属于非概率的抽样方法,例如,街上行人和随便到检查站的志愿者血压的调查。因为无法知道这种样本存在何种偏倚,因此,根据这种样本的调查结果进行推论是不适当的。
③概率样本(probabitity sample):总体中每个个体均有一已知的概率在样本中出现。如果为单纯随机抽样,则每个个体均有一相等的机会被抽取为样本;如果采用分层抽样的方法,为使某些亚层具有较大的代表性,不同亚层的抽样比例可以有所不同。取得概率样本的方法是,首先对总体中每个人用字母或数字依次编号,或根据居住地区编组,然后按一定顺序选择。
④单纯随机样本(simple random sample):用随机方法从总体中抽出样本。最好用随机表或随机数字来抽样,直到所抽的样本达到要求为止。此法使总体中每个个体有同等被抽到的机会。
⑤分层随机样本(strtified ran-dom sample):根据某种特征,如年龄,社会经济状况等,把总体分成若干亚组,每个亚组中的每个个体有相等机会被抽到。
⑥双阶或多阶抽样(two or more stagesample):采用一系列连续的步骤从总体中抽样。例如,一个城镇可分为许多区域,用随机方法从中抽出若干区域,将这些被抽区域中的学校列成名单,再从中随机抽若干学校,被抽到的学校中的学生就成为要调查的样本。
⑦系统样本(systematicsample):用简单的、系统的规则从总体中抽取样本。如根据生日或按病人进入病房的顺序编号来抽样。系统抽样可产生误差,而影响其结果推广到总体。
①在临床试验中,将病人配成对子进行研究,其中一个病人接受试验疗法,另一个病人接受适当的对照治疗方法。配对的条件应考虑选择那些会影响预后的变量,如年龄、疾病严重程度等。在病例对照研究与定群研究中也可采用类似的配对方法。
②在统计学中是指两个样本中的观察值由于存在某种联系而一一对应结成对子的情况,如同一批对象身体两个部位(左、右臂)的数据(敏感试验测得的红斑直径);同一批对象实验(或处理)前后的配对数据;同一批样品两种方法检验的结果;配对试验结果(如把大白鼠按种系、窝别、性别和体重配成对子,然后把每一对中两头大白鼠用随机方法分配到A、B两组进行试验所得的成对数据)。