教育统计中的常见问题(一)

平均数相关的问题

算术平均数易受极值影响。例如个别高低分会影响对整体平均水平的判断。

中数计算用不到所有数据,在心理和教育科研中的实验常不能持续进行、缺少数据或不清楚数据分布情况,中数在这类情况下常被使用。 众数跟中数大体相同。

加权平均数面临权重制定问题。对教育或心理问题,权重不易衡量。

一、几何平均数

几何平均数(geometric mean),记作$Mg$,计算基本公式如下:
$$M_g = \sqrt[N] {X_1 \times X_2 \times X_3 \cdots X_N }$$
式中: $N$为数据个数;$X_i$为变量值。
计算时常用取对数法:
$$lgM_g =\frac {\sum lgX_i}N$$

数据间差异较大,且几乎按一定比例关系变化,例如教育经费的逐年增加,学习、阅读的进步数,学生人数的增长数等。一般采用平均增长率,都要用到几何平均数计算平均比率。

例1:学习方面进步率

由公式: $lgM_g = \frac {0.3846}5$$=0.07692$
求反对数: $M_g=10^{0.07692}=1.19377$
该实验阅读能力平均进步率为1.19377,平均增加比率为$1.19377-1=0.19377$

Note:
若以$X_I=40$为基数,那么学习第六遍应理解多少? 则$X_6=40 \times {1.19377^5} =96.97 \approx 97$,若用算数平均数,增加率$\overline X =\frac {5.979}5=1.1958$,同样以$X_I=40$为基数,则$X_6=40 \times {1.1958^5} =97.8$,比实际理解成份多.
此类问题可简化计算:
$$M_g = \sqrt[N-1] {\frac {X_2}{X_1} \times \frac {X_3}{X_2} \times \frac {X_4}{X_3} \cdots \frac {X_N}{X_{N-1}}} = \sqrt[N-1] {\frac {X_N}{X_1}}$$

N <- 6
data <- c(0.4,0.52,0.65,0.75,0.86,0.97)
Mg <- (0.97/0.4)^(1/(N-1))

例2:学生记单词进步率

N <- 5 
Mg <- (34/20)^(1/4) # 1.141858
# 进步率1.141858-1 =0.141858

例3:学生或人口增长估计

某校连续四年的毕业人数为: 980人,1100 人 ,1200 人 ,1300 人 , 问毕业生 均 增长率是多少? 若该校毕业生一直按此增长率变化,问第五年后的毕业人数是多少 ?

N <- 4
data <- c(980,1100,1200,1300)
# 方法一
Mg <- prod(data[2:4]/data[1:3])^(1/(N-1)) #  1.098767 
# 方法二
Mg <- (1300/980)^(1/3) #  1.098767 
## 增长率1.098767 -1=0.98767

ans <- 1300*(Mg^5) # 2081.959

例4:教育经费增加率

# 由题意 N-1 = 1982-1950 =32
Mg <- (121/10)^(1/32) # 1.081028
# 增长率 1.081028-1 =0.081028
# 1982到1990中间为8年,故N-1=8
ans <- 121*(Mg^8)  # 225.6741

二、调和平均数

几何平均数(geometric mean),记作$Mg$,计算基本公式如下:
$$M_g = \sqrt[N] {X_1 \times X_2 \times X_3 \cdots X_N }$$
式中: $N$为数据个数;$X_i$为变量值。
计算时常用取对数法:
$$lgM_g =\frac {\sum lgX_i}N$$

主要是用来描述学习速度方面的问题。
在有关研究学习速度的实验设计中,一般常取两种形式: 一是工作量固定,记录各被试完成相同工作所用的时间。二是学习时间一定,记录一定时间内各被试完成的工作量。在计算学习速度时要特别注意。
学习任务量相同而所用时间不等。这时先要求出单位时间的工作量,并以它为 $X_i$ 代入调和平均数公式计算,所得结果就是平均学习速度。

例1:学习任务量相同而所用时间不等

N <- 6
works <- 10
times <- c(0.8,1.0,1.2,1.5,2.5,5.0)
per_hour <- works/times
Mh <- N/sum(1/per_hour) # 5

Note:
此情形中要求6人平均完成10道题的速度,由于每人学习任务量相同都为10题(可理解为单位工作量扩大10倍),可利用计算平均速度的方式计算调和平均数,即:
$$作业平均速度=\frac{总完成题量}{总时间}= \frac {6 \times 10}{0.8+1.0+1.2+1.5+2.5+5.0} =5$$
下例2则不同

例2:学习时间相同而工作量不等

N <- 6
works <- c(24,20,16,12,8,4)
times <- 2
per_hour <- works/times
Mh <- N/sum(1/per_hour) # 4.8979

留下评论