一、百分位差和百分位等级
百分位数(percentile)是指量尺上的一个点,在这个点以下的数据个数占了全部数据个数一定百分比。其符号为$P_p$。
- 可利用R语言中
quantile()
函数直接计算:
data <- seq(1,15,2)
# 1 3 5 7 9 11 13 15
quantile(c(1,3,5,7,9,11,13,15))
# 0% 25% 50% 75% 100%
# 1.0 4.5 8.0 11.5 15.0
quantile(data,probs = c(0.25,0.75))
# 25% 75%
# 4.5 11.5
quantil(data,probs = c(0.5))
# 50%
# 8
百分等级(percentile rank),是指某个百分位数在整个分数分布中所处的百分位置。
- 计算百分等级:
data <- seq(1,15,2)
x <- 8
Pr <- sum(data < x)/length(data) # 0.5
x <- 4.5
Pr <- sum(data < x)/length(data) # 0.25
例:百分位差和百分位等级描述学生成绩
某班依次测验中成绩如下,问考多少分可以超过班上一半的同学?某同学考了90分,超过班上多少人?
![](https://blog.guyinzhong.com/wp-content/uploads/2022/03/image-14.png)
set.seed(1)
data <- round(runif(50,40,100)) # 生成测试数据
Pp <- quantile(data,probs = c(0.5)) # 70.5
x <- 90
Pr <- sum(data < x)/length(data) # 0.86
# 考70.5分以上可超过一半同学,考90分超过班上86%的学生
二、方差和标准差
方差和标准差是表示数据离散程度最好的指标,应用广泛。
- R语言中
var()
计算方差,sd()
计算标准差
例:差异系数
![](https://blog.guyinzhong.com/wp-content/uploads/2022/03/image-15.png)
变异系数$CV=\frac sX$
$CV_{1} = \frac{4.02} {60} =0.067$
$CV_{2}= \frac{6.04} {80} =0.0755$
五年级的测验分散程度大
三、标准分数
教育统计中的标准分数即是$Z$分数,计算公式:
$$Z = \frac {x-\overline X}{s}$$
式中:$X$为某一具体分数,$\overline X$为平均数,$s$为标准差。
例1:Z分数计算
某班依次测验中成绩如下,甲生100分,乙生80分,问这两生$Z$分数是多少少
![](https://blog.guyinzhong.com/wp-content/uploads/2022/03/image-16.png)
set.seed(1)
data <- round(runif(50,40,100))
mean_x <- mean(data)
s <- sd(data)
Z1 <- (100-mean_x)/s # 1.71
Z2 <- (80-mean_x)/s # 0.49
例2:利用$Z$分数并比较成绩
![](https://blog.guyinzhong.com/wp-content/uploads/2022/03/image-17.png)
Za1 <- (70-70)/8
Za2 <- (57-55)/4
Za3 <- (45-42)/5
Za <- Za1+Za2+Za3
Zb1 <- (90-70)/8
Zb2 <- (51-55)/4
Zb3 <- (40-42)/5
Zb <- Zb1+Zb2+Zb3
# Za = Zb 两生三门功课总成绩无差别
Note:
![](https://blog.guyinzhong.com/wp-content/uploads/2022/03/image-18.png)