等距分组

更新时间:2023-05-22 22:23

等距分组是各组保持相等的组距,也就是说各组标志值的变动都限于相同的范围。

计算取值范围

取值范围(Value Area)为全体数据中最大数值与最小数值之差,反映了该组数值变量取值的变动幅度,一般用R表示,有

R=max{X}-min{X} (1)

确定组数

在进行数值型数据分组时,有一个计算组数的经验公式,即

(2)

由于组数是个只能取整数的离散变量,一般取式(2)的四舍五入数值作为组数的参考数值。例如,当数据的总数N为80时,采用经验公式计算出组数为,可考虑将该组数分为7组。

确定组数的目的是为了使数据恰当地分布在各组中,数据过于集中和过于分散都有碍于对数据分布特征的展示,不利于后续的分析研究,计算组数的经验公式正是从这个角度出发,总结出的一个根据待分组数据的多少计算组数的具体方法。但是,经验公式计算出来的组数只是一个参考数值,组距的确定还要根据研究对象的实际情况,具体问题具体分析,因地制宜地加以确定。例如,在考试成绩的分析中,人们习惯将其分为优、良、中、及格和不及格5组,不论数据个数多少,分成这样5组较为适宜。

计算组距

由于取值范围是客观存在的,当组数确定之后,组距也就随之确定了,两者成反比例关系。设H为组数,d为组距,即有组距d=R/H。为了便于数据分组和组限的划定,组距一般取5,10的整数倍。

确定组限

确定组限就是具体规定各组中变量可能取值的上限和下限。确定组限的原则是“不重不漏”,使每一数据都能够被分配到其中一组里,并且只能分配到其中一组里。组限的具体形式有间断组限和重合组限,闭口组限和开口组限。

间断组限是每一组的组限与邻组的组限都是间断设置的。重合组限是每一组的组限与邻组的组限都是相互重叠设置的。

闭口组限是既有上限又有下限的组限设置。由闭口组限设置形成的数据分组称为闭口组。开口组限是缺少上限或者缺少下限的组限设置。由开口组限设置形成的数据分组称为开口组。开口组限用于组距的上下两端的组限设置,即最高数值和最低数值组的组限设置。当继续采用相等的组距进行分组,落在上下两端的分组中的数据明显过少,不具有单独分析价值时,通常采用开口组限设置。

免责声明
隐私政策
用户协议
目录 22
0{{catalogNumber[index]}}. {{item.title}}
{{item.title}}