顔妻です。
今回はdplyrのfilter関数を使ったデータテーブルの絞り込み方法についてです。SQLのwhere句のように簡単に絞り込みをしたいシーンがあると思います。また、値の比較だけではなく、部分一致で絞り込みたいときもあると思います。正規表現を使う方法もありますが今回はExcel感覚で部分一致ができる方法を紹介します。
|
date |
weather |
temperature |
1 |
2019-1-5 |
曇り |
5 |
2 |
2019-1-6 |
晴れときどき曇り |
15 |
3 |
2019-1-7 |
晴れ |
20 |
4 |
2019-1-8 |
雨 |
10 |
5 |
2019-1-9 |
雪 |
-5 |
6 |
2019-1-10 |
くもり |
8 |
数値を使って行の絞り込み
|
date |
weather |
temperature |
1 |
2019-1-6 |
晴れときどき曇り |
15 |
2 |
2019-1-7 |
晴れ |
20 |
3 |
2019-1-8 |
雨 |
10 |
文字を使った行の絞り込み①
|
date |
weather |
temperature |
1 |
2019-1-9 |
雪 |
-5 |
文字を使った行の絞り込み② 部分一致
|
date |
weather |
temperature |
1 |
2019-1-6 |
晴れときどき曇り |
15 |
2 |
2019-1-7 |
晴れ |
20 |
日付を使った行の絞り込み
|
date |
weather |
temperature |
1 |
2019-01-07 |
晴れ |
20 |
2 |
2019-01-08 |
雨 |
10 |
3 |
2019-01-09 |
雪 |
-5 |
4 |
2019-01-10 |
くもり |
8 |
![]()
まとめ
いかがでしょうか?セグメントやカテゴリ内を詳しくみていくために、データを絞り込んで集計するシーンは多いと思います。同じようなことはSQLでもできますが一度吐き出したデータを改めてSQLに入れ直すのはやはり手間です。また、文字の一部を使って絞ることも頻繁にあると思います。そんなときに是非試してみてください。