如何找到R数据帧列的平方偏差总和?

偏差的平方和是每个值与平均值之间的差异平方的总和。要找到此值,我们需要在R平台中创建公式。例如,如果我们有一个名为df的数据框,其中包含一列x,则可以通过使用sum((df $x-mean(df $x))^ 2)计算x的平方差之和。

例1

考虑以下数据帧-

set.seed(1021)
x1<−letters[1:20]
x2<−rpois(20,5)
df1<−data.frame(x1,x2)
df1
输出结果
x1 x2
1 a 4
2 b 2
3 c 2
4 d 4
5 e 4
6 f 6
7 g 4
8 h 4
9 i 8
10 j 4
11 k 4
12 l 3
13 m 6
14 n 3
15 o 7
16 p 0
17 q 2
18 r 8
19 s 3
20 t 5

在df1中找到列x2的平方偏差的总和-

示例

sum((df1$x2−mean(df1$x2))^2)
输出结果
[1] 80.55

例2

y1<−1:20
y2<−rnorm(20,2525,301.2)
df2<−data.frame(y1,y2)
df2
输出结果
y1 y2
1 1 2643.340
2 2 2682.804
3 3 2555.982
4 4 2906.473
5 5 1771.400
6 6 2763.651
7 7 2818.183
8 8 3184.697
9 9 2731.398
10 10 2530.297
11 11 2361.374
12 12 2534.605
13 13 2266.180
14 14 2237.827
15 15 3178.079
16 16 2761.979
17 17 2224.662
18 18 2351.776
19 19 2200.108
20 20 2067.530

在df2中找到y2列的平方偏差平方和-

示例

sum((df2$y2−mean(df2$y2))^2)
输出结果
[1] 2464370