现代心理与教育统计学 第3版

> 现代心理与教育统计学 第3版

张厚粲,徐建平
北京师范大学出版社2009/1

48.00

第三节次数分布图

在次数分布表的基础上,若对分布进行粗略分析:看其变动趋势、差异细节,获得更为直观印象就要绘制次数分布图。常用的次数分布图有直方图、次数多边形图及累加次数分布图等。

一、直方图

直方图(histogram),又名等距直方图,是以矩形的面积表示连续性随机变量次数分布的图形。一般用纵轴表示数据的频数,横轴表示数据的等距分组点,即各分组区间的上下限,有时用组中值表示。纵轴的刻度通常从零开始,横轴的刻度可以从任何合适的数字开始,与数据的分布范围和组距有关。组距的大小直接影响矩形的宽度,矩形的高度是由每组的频数表示的。在制作直方图时,以组距为底边,以分组区间的精确上下限为底边二端点,以次数为高画矩形,各直条矩形之间不留空隙,没有间隔。直方图下的面积与总次数相等,所以一个矩形的面积大小与每组的频数分布大小是等价的。如果将总面积定为1,那么,直方图中每一部分矩形的面积就是该矩形表示的分组区间内的次数与总次数的比值。

图2‐3和图2‐4是根据表2‐3的资料绘制的,它们要比表2‐3显示数据分布的情况更生动、直观。对于各组次数的多少,分布是否对称,是峻峭还是低平,显示得更清楚。

其中图2‐4没有画矩形,只使直方图包围的面积成封闭的图形,这种图又叫组织图,是直方图的另一种形式。

直方图是统计学中常用而且又有特殊意义的一种统计图,有着重要的应用价值。

图 2‐  100名学生某项测验成绩直方图

图 2‐  100名学生某项测验成绩组织图

二、次数多边形图

次数多边形图(frequency polygon)是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边形图来表示。绘制时,横坐标是用各分组区间组中值表示的连续变量,纵坐标是数据的频数。以每个分组区间的组中值为横坐标,以各组的次数为纵坐标标点,连接各点,就成为一条折线。为使计算面积与直方图相等,可将折线两端画至前一组及后一组的组中值点,这样便连接成一个多边形了。例如,图2‐5就是在横坐标上向两端各延

 图 2‐  100名学生某项测验成绩次数多边形

伸一个分组区间,用虚线与各组中值58及100相连接,而构成的一个多边形图。

多边形图与直方图虽然都是以面积表示连续性数据的次数分布,但次数多边形对次数的轮廓显示得更好,组与组之间的次数过渡是连续而直接的。如果样本很大,能描绘出一条分布曲线,还可据此找到次数分布的经验公式。这样就能够对于某总体的理论次数分布的分析提供很多有用的信息。次数多边形还可用于多个同质的次数分布的比较,尽管各次数分布的总次数不等,但只要将次数用相对次数表示,并且组距相同,即可在同一个图中,表示两个或两个以上不同总数的次数分布,这样绘制的图也就是一个相对次数分布图。参见表2‐7及图2‐6。

表 2‐ 两组被试通过同一测验的分数分布

第一组 第二组

分组区间 f1 P1 f2 P2

95~    1 0畅01    1 0畅02

90~ 3 0畅03 2 0畅04

85~ 5 0畅05 4 0畅08

80~ 6 0畅06 5 0畅10

75~ 10 0畅10 7 0畅14

70~ 14 0畅14 11 0畅22

65~ 18 0畅18 8 0畅16

60~ 15 0畅15 5 0畅10

55~ 11 0畅11 4 0畅08

50~ 7 0畅07 2 0畅04

45~ 5 0畅05 1 0畅02

40~ 3 0畅03     — —

35~ 2 0畅02     — —

合计 100 1畅00 50 1畅00

三、累加次数分布图

累加次数分布图有累加直方图与累加曲线图两种,它们都是在累加次数分布表基础上绘制的。

图 2‐ 不同总次数的次数分布比较

(一)累加直方图

这种图的横坐标同直方图一样,标以分组区间,纵坐标是累加次数,其余步骤同绘制直方图的要求一样。图2‐7是根据表2‐4的资料绘制的累加直方图。累加直方图的形式有以下两种。

图 2‐ 累加直方图

有了累加直方图可以清楚地看出某精确上限以下的累加次数。如果在累加直方图右侧纵线自上而下地标出次数,又可看到某精确下限以上的累加次数来。

(二)累加曲线

累加曲线又称递加线。它的画法同次数多边形基本相同,不同点是横坐标为每分组区间的精确上限或精确下限,纵坐标是各分组的累加次数,分别标出各个交点,连接各交点即可画成累加曲线。如果有累加直方图,连接各组矩形的右顶点可画累加曲线。累加曲线的形式总是上升的,没有下降的情况,即使有的分组内无次数,曲线也不会下降。图2‐8是根据表2‐4中的数据绘制的累加曲线图。

图 2‐8 累加曲线图

累加曲线的形状大约有以下三种:一种是曲线的上枝(曲线靠近上端的部分)长于下枝(曲线靠近基线的部分),另一种形状是下枝长于上枝,第三种形状是上枝与下枝长度相当。曲线上枝长,说明大数端各组次数偏少且组数较多,各组的次数变化小。因此称次数分布的这种情况为正偏态分布,若小数端出现这种情况,则称这种次数分布为负偏态分布,若曲线的上下枝相当,说明次数分布的大数端与小数端分组的数目及各组的次数相当,各组次数的变化也基本相同,次数分布的这种情形称为正态分布。

图 2‐9 累加曲线的三种形状累加曲线的纵坐标可以不用实际累加次数,而用相对次数作为图尺表示,如果纵坐标是用累加百分数作为图尺,则此累加曲线称为累加百分数曲线。若用频率作为图尺,则此曲线称为累加频率曲线。这些曲线形式在心理与教育科研数据的整理中亦常有应用。