在R中对数据集执行多重相关的循环

詹姆士

我有一个具有x列数的数据集,其中包含测试结果组,例如test1_1,test1_2 ... test1_x,test2_1,test2_2,test2_x,testx_x ...等。每组测试都有不同数量的测试结果与之相关联,因此每个测试(test1_1至test1_30,test2_1至test2_19等)的实际数字并不相同。最后一栏是我的目标变量。我正在寻找建立哪些测试与目标变量相关的方法,但是我也想为每组测试创建数据集。我还将针对目标变量绘制每个测试的相关图。目前,我已经使用dplyr软件包完成了以下操作:

# Filter dataset into corresponding test groups and target variable and create a 
# new dataframe of each individual test group
test1 <- dataset %>% select((starts_with("test1_")) | matches("Target"))
test2 <- dataset %>% select((starts_with("test2_")) | matches("Target"))
test2 <- dataset %>% select((starts_with("test3_")) | matches("Target"))

# establish correlation between each test groups and target variable
cor_test1 <- cor(test1)
cor_test2 <- cor(test2)
cor_test2 <- cor(test2)

# Create correlation plots of each test group and target variable
cplot_t1 <- corrplot(cor_test1)
cplot_t2 <- corrplot(cor_test2)
cplot_t3 <- corrplot(cor_test3)

这给了我我想要的结果,并且当前可以满足我的需要,但是要做起来似乎非常乏味。我怀疑我可能可以在for / while循环中的几行代码中实现所有这些功能,但是,我不确定从哪里开始。

斯蒂芬

使用lapply这可以像这样实现:

library(dplyr)
library(corrplot)

set.seed(42)
dataset <- data.frame(
  test1_1 = runif(20),
  test1_2 = runif(20),
  test2_1 = runif(20),
  test2_2 = runif(20),
  Target = runif(20)
)

test_cols <- gsub("_\\d+$", "", names(dataset))
test_cols <- test_cols[grepl("^test", test_cols)]
test_cols <- unique(test_cols)
test_cols <- setNames(test_cols, test_cols)

test_fun <- function(x, test) {
  x <- x %>% 
    select((starts_with(test)) | matches("Target")) 
  
  cor(x)
}

cor_test <- lapply(test_cols, test_fun, x = dataset)
cplot <- lapply(cor_test, corrplot)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何使用R对数据集的起点执行线性回归

来自分类Dev

在R中添加行时如何在for循环中对数据集的所有变量应用回归

来自分类Dev

如何在R中对微阵列数据执行多重比较

来自分类Dev

如何在R中操纵配对数据集?

来自分类Dev

在 R 中对数据集进行子集化

来自分类Dev

在 R 中创建数据集的 for 循环

来自分类Dev

在keras中,对多个单个日期点执行fit()是否与对数据集执行fit()一样?

来自分类Dev

如何使用Sapply对数据集执行线性回归

来自分类Dev

在python中对数据名称进行For循环

来自分类Dev

配置嵌套的if循环以对数据集进行分类

来自分类Dev

配置嵌套的if循环以对数据集进行分类

来自分类Dev

Spark:如何对数据帧执行循环功能

来自分类Dev

函数不对R中的数据集执行操作

来自分类Dev

对R的MICE中的每个估算数据集执行操作

来自分类Dev

使用大数据集在 R 中循环,更好的方法?

来自分类Dev

如何在for循环中存储来自for循环的数据?(r中的滚动相关性)

来自分类Dev

按相关表中的字段对数据进行分组

来自分类Dev

按r中的精确数字顺序对数据集进行排序

来自分类Dev

按r中的精确数字顺序对数据集进行排序

来自分类Dev

R:循环对存储在矩阵中的数据帧执行 ks 测试

来自分类Dev

对数据帧执行滞后运算以计算R中的新值

来自分类Dev

通过忽略r中的特定字符,对数据框的列执行操作

来自分类Dev

如何按日期对数据进行子集化并在R中执行多项操作?

来自分类Dev

R:在r中创建具有特定相关性的数据集

来自分类Dev

R:如何仅对数据框中的子集行申请循环

来自分类Dev

R:使用for循环将与每个唯一事件相关的数据写入单独的文件中

来自分类Dev

使用循环根据R中的子集数据计算相关性

来自分类Dev

对数据帧(R)内的多个子集执行操作

来自分类Dev

在R中对数据进行分类

Related 相关文章

  1. 1

    如何使用R对数据集的起点执行线性回归

  2. 2

    在R中添加行时如何在for循环中对数据集的所有变量应用回归

  3. 3

    如何在R中对微阵列数据执行多重比较

  4. 4

    如何在R中操纵配对数据集?

  5. 5

    在 R 中对数据集进行子集化

  6. 6

    在 R 中创建数据集的 for 循环

  7. 7

    在keras中,对多个单个日期点执行fit()是否与对数据集执行fit()一样?

  8. 8

    如何使用Sapply对数据集执行线性回归

  9. 9

    在python中对数据名称进行For循环

  10. 10

    配置嵌套的if循环以对数据集进行分类

  11. 11

    配置嵌套的if循环以对数据集进行分类

  12. 12

    Spark:如何对数据帧执行循环功能

  13. 13

    函数不对R中的数据集执行操作

  14. 14

    对R的MICE中的每个估算数据集执行操作

  15. 15

    使用大数据集在 R 中循环,更好的方法?

  16. 16

    如何在for循环中存储来自for循环的数据?(r中的滚动相关性)

  17. 17

    按相关表中的字段对数据进行分组

  18. 18

    按r中的精确数字顺序对数据集进行排序

  19. 19

    按r中的精确数字顺序对数据集进行排序

  20. 20

    R:循环对存储在矩阵中的数据帧执行 ks 测试

  21. 21

    对数据帧执行滞后运算以计算R中的新值

  22. 22

    通过忽略r中的特定字符,对数据框的列执行操作

  23. 23

    如何按日期对数据进行子集化并在R中执行多项操作?

  24. 24

    R:在r中创建具有特定相关性的数据集

  25. 25

    R:如何仅对数据框中的子集行申请循环

  26. 26

    R:使用for循环将与每个唯一事件相关的数据写入单独的文件中

  27. 27

    使用循环根据R中的子集数据计算相关性

  28. 28

    对数据帧(R)内的多个子集执行操作

  29. 29

    在R中对数据进行分类

热门标签

归档