文字列の操作(結合、置換、検索)

Rでの文字列操作についてです。文字列の結合、置換、検索、切出しを行う方法をご紹介します。

文字の結合 paste

「sep = “”」をいれることで文字の間をなくすこともできます。「sep = “-“」といれることであえて文字をいれることもできます。

x <- "abc"
y <- "xyz"
paste(x,y)

## [1] "abc xyz"

文字列の置換 gsub

gsub(pattern = "a",
      replacement = "",
      x = x)

空白文字、タブ文字の置換例

以下がデータの前処理でよく利用するやり方です。

d_txt2$str <- gsub(pattern = "[[:blank:]]",replacement = "",x = d_txt2$str) # タブ文字
 d_txt2$str <- gsub(pattern = " ",replacement = "",x = d_txt2$str) # 空白半角
 d_txt2$str <- gsub(pattern = " ",replacement = "",x = d_txt2$str) # 空白全角
 d_txt2$str <- gsub(pattern = ",",replacement = "",x = d_txt2$str) # カンマ

文字列の検索 grepl

grepl(pattern = "a",x = x)
## [1] TRUE

grepl(pattern = "a",x = y)
## [1] FALSE

文字列の切出し

x <-  "datascience"
substr(x = x,start = 3,stop = 5)

## [1] "tas"