子集是一种常用的技术,根据分析的目的,它可以用于许多不同的目的。如果找到提供的分组值之一,则对数据框进行子集化意味着我们希望在分类列中存在任何分类变量值时进行子集化,为此,我们可以按照以下步骤操作 -
创建数据框。
如果存在任何提供的分类变量值,则对数据框进行子集化。
让我们创建一个数据框,如下所示 -
x<-rnorm(20,2) Grp<-sample(LETTERS[1:4],20,replace=TRUE) df<-data.frame(x,Grp) df
执行时,上述脚本生成以下内容output(this output will vary on your system due to randomization)-
x Grp 1 0.3359965 A 2 2.0416162 A 3 0.9818926 A 4 1.4677398 D 5 1.5241767 B 6 1.3522920 A 7 0.1696135 D 8 2.8538156 C 9 1.5310543 C 10 3.8808002 A 11 1.6601963 C 12 0.7691347 A 13 -0.3206033 B 14 3.0502846 A 15 2.7044244 C 16 0.4451980 A 17 0.8252894 C 18 0.8465413 A 19 2.0163445 C 20 1.5913034 C
如果 Grp 列中存在 A 或 C,则加载 dplyr 包和子集 df -
library(dplyr) x<-rnorm(20,2) Grp<-sample(LETTERS[1:4],20,replace=TRUE) df<-data.frame(x,Grp) df %>% filter(Grp=="A"|Grp=="C")
x Grp 1 0.3359965 A 2 2.0416162 A 3 0.9818926 A 4 1.3522920 A 5 2.8538156 C 6 1.5310543 C 7 3.8808002 A 8 1.6601963 C 9 0.7691347 A 10 3.0502846 A 11 2.7044244 C 12 0.4451980 A 13 0.8252894 C 14 0.8465413 A 15 2.0163445 C 16 1.5913034 C