Rでの文字列操作についてです。文字列の結合、置換、検索、切出しを行う方法をご紹介します。
文字の結合 paste
「sep = “”」をいれることで文字の間をなくすこともできます。「sep = “-“」といれることであえて文字をいれることもできます。
x <- "abc"
y <- "xyz"
paste(x,y)
## [1] "abc xyz"
文字列の置換 gsub
gsub(pattern = "a",
replacement = "",
x = x)
空白文字、タブ文字の置換例
以下がデータの前処理でよく利用するやり方です。
d_txt2$str <- gsub(pattern = "[[:blank:]]",replacement = "",x = d_txt2$str) # タブ文字
d_txt2$str <- gsub(pattern = " ",replacement = "",x = d_txt2$str) # 空白半角
d_txt2$str <- gsub(pattern = " ",replacement = "",x = d_txt2$str) # 空白全角
d_txt2$str <- gsub(pattern = ",",replacement = "",x = d_txt2$str) # カンマ
文字列の検索 grepl
grepl(pattern = "a",x = x)
## [1] TRUE
grepl(pattern = "a",x = y)
## [1] FALSE
文字列の切出し
x <- "datascience"
substr(x = x,start = 3,stop = 5)
## [1] "tas"