>str(data$Installs)
$インストール:21レベルの係数 ""、 "0+"、 "1+"、 "1,000 +"、..:8 20 15 18 11 17 17 5 5 8 .. ..
db$Installs = as.character(gsub("\\+", "", db$Installs))
str(db$Installs)
chr [1:10841] "10,000" "500,000" "5,000,000" "50,000,000" "100,000" "50,000" "50,000" "1,000,000" "1,000,000" "10,000" ...
db$Installs = as.double(gsub(",","",db$Installs))
str(db$Installs)
num [1:10841] 1e+04 5e+05 5e+06 5e+07 1e+05 5e+04 5e+04 1e+06 1e+06 1e+04 ...
私はこのような変数が欲しいです:
"10000" "500000" "5000000" "50000000" "100000" "50000" "50000" "1000000" "1000000" "10000" .. ..
db$Installs.factor <- factor(db$Installs)
db$Installs = as.character(gsub("\\+", "", db$Installs))
db$Installs = as.double(gsub(",","",db$Installs))
これを試して
入力-
sample <- c("10,000+" ,"500,000+", "5,000,000+", "50,000,000+" ,"100,000+", "50,000+" ,"50,000+" ,"1,000,000+" )
解決策-
sample <- as.numeric(gsub("\\D", "", sample))
出力-
1] 10000 500000 5000000 50000000 100000 50000 50000 1000000
注-Rに指数表記を使用しないように強制する場合は、-を使用できます。
options("scipen"=100, "digits"=4)
' scipen ':整数。数値を固定表記または指数表記で出力することを決定するときに適用されるペナルティ。正の値は固定に偏り、負の値は科学的記数法に偏ります。「scipen」桁より広い場合を除いて、固定表記が優先されます。
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加