教育统计中的常见问题(二)

百分等级、标准差、标准分数相关问题

一、百分位差和百分位等级

百分位数(percentile)是指量尺上的一个点,在这个点以下的数据个数占了全部数据个数一定百分比。其符号为$P_p$。

  • 可利用R语言中quantile()函数直接计算:
data <- seq(1,15,2)
#  1  3  5  7  9 11 13 15
quantile(c(1,3,5,7,9,11,13,15))
#  0%  25%  50%  75% 100% 
# 1.0  4.5  8.0 11.5 15.0 
quantile(data,probs = c(0.25,0.75))
# 25%  75% 
# 4.5 11.5 
quantil(data,probs = c(0.5))
# 50% 
#  8 

百分等级(percentile rank),是指某个百分位数在整个分数分布中所处的百分位置。

  • 计算百分等级:
data <- seq(1,15,2)

x <- 8
Pr <- sum(data < x)/length(data)  # 0.5

x <- 4.5
Pr <- sum(data < x)/length(data)   # 0.25

例:百分位差和百分位等级描述学生成绩

某班依次测验中成绩如下,问考多少分可以超过班上一半的同学?某同学考了90分,超过班上多少人?

set.seed(1) 
data <- round(runif(50,40,100)) # 生成测试数据

Pp <- quantile(data,probs = c(0.5)) # 70.5
x <- 90
Pr <- sum(data < x)/length(data) # 0.86
# 考70.5分以上可超过一半同学,考90分超过班上86%的学生

二、方差和标准差


方差和标准差是表示数据离散程度最好的指标,应用广泛。

  • R语言中var()计算方差,sd()计算标准差

例:差异系数

变异系数$CV=\frac sX$
$CV_{1} = \frac{4.02} {60} =0.067$
$CV_{2}= \frac{6.04} {80} =0.0755$
五年级的测验分散程度大

三、标准分数

教育统计中的标准分数即是$Z$分数,计算公式:
$$Z = \frac {x-\overline X}{s}$$
式中:$X$为某一具体分数,$\overline X$为平均数,$s$为标准差。

例1:Z分数计算


某班依次测验中成绩如下,甲生100分,乙生80分,问这两生$Z$分数是多少少

set.seed(1) 
data <- round(runif(50,40,100))

mean_x <- mean(data)
s <- sd(data)

Z1 <- (100-mean_x)/s  # 1.71
Z2 <- (80-mean_x)/s   # 0.49

例2:利用$Z$分数并比较成绩

Za1 <- (70-70)/8
Za2 <- (57-55)/4
Za3 <- (45-42)/5
Za <- Za1+Za2+Za3  

Zb1 <- (90-70)/8
Zb2 <- (51-55)/4
Zb3 <- (40-42)/5
Zb <- Zb1+Zb2+Zb3 

# Za = Zb 两生三门功课总成绩无差别

Note:

留下评论