두 변수의 정확한 시차를 기반으로 그룹화 된 데이터 세트에 조건부로 변수 생성

debugcn 에 게시 Dev

나딘 M.

다음에는 전체 데이터 세트 df의 일부가 있습니다.

structure(list(Kennung = c("AO03HU23", "AO03HU23", "AO03HU23",  "AO03HU23", AO03HU23", "AO03HU23"),
minutenPrompt = c("00:09",  "00:18", "00:27", "00:36", "NA:NA", "NA:NA"),
timestamp = structure(c(1494946963,  1494947504, 1494948053, NA, NA, NA), class = c("POSIXct", "POSIXt" ), tzone = "UTC"),
interval.start_lastprompt = c(NA, NA, NA,  NA, NA, NA)), row.names = c(NA, 6L), class = "data.frame")

더 명확하게하기위한 그림도 있습니다.

"Kennung"은 서로 아래에있는 모든 참가자를 나타내는 이드와 같은 것입니다. 각 참가자에는 8 개의 행이 있습니다 (첫 번째 참가자 만 볼 수 있음). 각 참가자는 (실험에서) 4 번 프롬프트를 받았습니다 : 정확히 9 분 후에 처음으로 프롬프트를 받았습니다 (이 9 분은 "minutenprompt"에서 00:09로 표시됩니다. 그런 다음 추가로 3 번 프롬프트되었습니다. 각 참가자는 8 개의 행을 가지며 "minutenPrompt"에는 각 사람에 대해 4 개의 항목 (항상 동일한 항목)이 있으므로 각 참가자의 "minutenPrompt"에 "NA : NA"줄이 4 개 있습니다.

이제 각 참가자가 최소한 실험에서 얼마나 오래 배웠는지 (분 단위로 표시) 관심이 있습니다. 첫 번째 프롬프트는 학습을 시작한 후 9 분 후에 왔으므로 각 참가자의 "timestamp"첫 번째 행에 표시된 정확한 시간에서 각 참가자의 첫 번째 "minutenPrompt"필드에 표시된 9 초를 뺀 시간이 필요합니다. 이것은 각 사람이 학습을 시작한 정확한 시간을 제공합니다. 이러한 값을 새 변수 "starting.time"에 저장하는 것이 가장 좋습니다.

그리고 다음 단계에서 학습을 시작한 시간과 각 사람의 마지막 타임 스탬프 (참가자의 2, 3 또는 4 번째 셀에있을 수 있음) 시간 사이의 시간 차이가 필요합니다. 이 시간 간격은 interval.start_lastprompt변수에 인쇄되어야합니다 (시작 지점과 마지막 프롬프트 시간 사이의 분과 초를 표시해야 함).

매트

여기입니다 tidyverse및 lubridate솔루션 :

library(tidyverse)
library(lubridate)
df %>% 
  group_by(Kennung) %>% 
  mutate(timestamp = ymd_hms(timestamp),
         interval.start_lastprompt = min(timestamp, na.rm = T) - as.difftime(9, units = 'mins'))

이것은 우리에게 제공합니다 :

  Kennung  minutenPrompt timestamp           interval.start_lastprompt
  <chr>    <chr>         <dttm>              <dttm>                   
1 AO03HU23 00:09         2017-05-16 15:02:43 2017-05-16 14:53:43      
2 AO03HU23 00:18         2017-05-16 15:11:44 2017-05-16 14:53:43      
3 AO03HU23 00:27         2017-05-16 15:20:53 2017-05-16 14:53:43      
4 AO03HU23 00:36         NA                  2017-05-16 14:53:43      
5 AO03HU23 NA:NA         NA                  2017-05-16 14:53:43      
6 AO03HU23 NA:NA         NA                  2017-05-16 14:53:43

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-2

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

두 변수의 정확한 시차를 기반으로 그룹화 된 데이터 세트에 조건부로 변수 생성

두 변수의 정확한 시차를 기반으로 그룹화 된 데이터 세트에 조건부로 변수 생성

조건부 변수에 의한 열의 차이를 기반으로 데이터 프레임 생성

R에서 두 그룹화 변수로 그룹화 된 데이터 세트의 다중 패널 그림 만들기

그룹화 된 분위수를 기반으로 한 서브 세트 원본 데이터 프레임

R의 열에있는 두 변수를 기준으로 그룹의 값을 조건부로 필터링

그룹화 된 데이터 조건에서 고유 ID에 대한 변수 생성

순위가 지정된 데이터를 기반으로 그룹화 변수 추가

두 개의 열로 그룹화 된 데이터에 대한 Google 앱 차트

SQL : 그룹화 된 변수에 대한 if 조건 생성

정의 된 연속 관측치 수를 기반으로 조건부 R의 패널 데이터에서 변수 삭제

R 데이터 관리 : 다른 변수의 여러 조건을 기반으로 여러 변수를 새로 생성 된 변수로 집계

미리 결정된 데이터 설정을 기반으로 Pyomo 제약 조건에 변수를 조건부로 추가하는 방법

k- 겹 교차 검증 : Stata에서 무작위로 생성 된 정수 변수를 기반으로 데이터를 필터링하는 방법

다른 ENV 변수를 기반으로 한 변수의 조건부 세트

R에서 서로 다른 두 그룹을 기반으로 한 두 행의 조건부 차이

인수 순서가 중요한 두 개의 일치하는 변수 인수가있는 함수를 기반으로 데이터 프레임 변수 생성

data.table에서 두 요인으로 그룹화 된 두 변수의 변화를 찾습니다.

Terraform : .tfvars의 변수를 기반으로 한 리소스의 조건부 생성

jquery ajax done 함수에 의해 생성 된 데이터를 변수로 반환

두 데이터 프레임 간의 조건부 교체로 새 변수 생성

그룹 내 이전 값에 조건부로 새로운 개수 변수 생성

두 변수를 기반으로 한 조건부 일치

R에서 두 개의 변수와 두 개의 데이터 세트를 기반으로 값을 바꿉니다.

Laravel : 그룹화 된 데이터를 한 행으로 변환

Ansible 작업-이 형식으로 Linux 그룹을 생성하기 위해 사전 정의 된 모든 변수를 어떻게 반복 할 수 있습니까?

그룹별로 데이터 세트의 각 변수에 대한 차이 (빼기) 찾기

R에서 두 개의 순차 변수를 기반으로 클러스터 / 그룹 할당

두 변수를 기반으로하는 팬더 그룹화

다른 데이터 프레임의 규칙 세트를 기반으로 데이터 프레임에 변수 세트 생성

r의 다른 변수를 기반으로 플래그 지정 변수 생성