R

1/3ページ

Rで時系列データの要約(可視化)

顔妻です。今回はRで時系列データの要約(可視化)についてです。 時系列データを要約する意義は季節性やその他の周期(パターン)を見出すためです。また見方として、変化率でみたり、基準決めてそこからどれだけ変化したかをみる指標でみることでよりデータの性質を理解しやすくなります。 時系列データの要約 library(ggplot2) #### データの準備 #### date <- c(‘ […]

Rで散布図行列を作成

顔妻です。今回はデータの全体像を掴むのに便利な散布図行列のご紹介です。ggplotとGGalaryを利用したほうが色々と便利な表現もしてくれるようです。 散布図行列の作成(base関数のplotを利用) # irisデータを利用plot(iris, col = iris$Species) 散布図行列の作成(ggplotを利用) library(“ggplot2”)libra […]

Rで階層クラスター分析

顔妻です。階層クラスター分析についてご紹介です。とりあえずデータはたくさんあるといったときオススメです。内容は似ているデータをクラスターとしてまとめていき、主観に基づいて探索的に調査を進めながら分析するときに活用できます 前準備 実施するための下準備です。irisを使います。Rにも標準でinstallされています # irisの数値だけを抽出d2 <- iris[1:4] # ユークリッド距 […]

R

Rでクリップボードを使ったデータのコピペ library(cliipr)

顔妻です。分析やデータ活用を行なっているとき、さっとスプレッドシートにあるデータをデータを取り込んだり、Rで作った集計表をさっと貼り付けしたいことがあると思います。そんなときに是非活用してみてください。Mac、windowsどちらのOSでも利用できますよ。 libraryのcliiprをご紹介 まとめ CSVやテキストでデータをエクスポートすることは大事ですが、それよりもさっとものごと進めていくこ […]

Rで非階層クラスター分析

顔妻です。 クラスター分析についてご紹介です。教師なし学習のひとつとして有名な手法のひとつで、目的変数を設定せずに集団の傾向を探していくときに利用したりします。今回は使い方を中心に記載します。 今回利用するデータとか目的 Rに標準で入っているirisのデータを利用します。今回はとりあえず使えるようになることがメインです。このデータはアヤメの種類ごとに花びらの大きさが載っています。葉の種類から種類を […]

Rのround関数、trunc関数を使って年代ラベル作成

顔妻です。 今回はRでデータ処理を行なうときのユーザーの年齢データを年代ラベルに変換する方法をご紹介します。Excelではround関数一択で年代ラベルを作成できますがRでround関数を使うと切り捨てがうまくいきませんので別の関数を使う必要があります。また、今回は10歳刻みだけではなく5歳刻みに変更する方法もご紹介します。

R

ggplotで作成したグラフにデータラベルをつける

顔妻です。 今回はExcelで言うところのデータラベルの付け方についてです。グラフを作成して傾向を確認できたはいいものの値やテキストのラベルがないとわかりにくいことが多々あります。そんなときに是非使ってみてください。また、今回はテキストを利用しますのでmac版、windows版のそれぞれコードを記載しています。

R

tidyrを使った縦横変換

顔妻です。 今回はtidyrを使ったデータテーブルの縦と横の持ち方変換についてです。SQLやdplyrを使って集計したはいいものの、この結果をそのまま見せるとどうしてもみにくかったりします。どうしても一般的なクロス集計表の見方と異なるのは不便ですので、これを見やすい形に変えてみましょう。また、あまり使わない人も多いと思いますので是非手を動かしながら試してみてください。

R

dplyrのfilter関数を使った行の絞り込み方[文字列の部分一致]

顔妻です。 今回はdplyrのfilter関数を使ったデータテーブルの絞り込み方法についてです。SQLのwhere句のように簡単に絞り込みをしたいシーンがあると思います。また、値の比較だけではなく、部分一致で絞り込みたいときもあると思います。正規表現を使う方法もありますが今回はExcel感覚で部分一致ができる方法を紹介します。

R

dplyrのlead関数、lag関数の使い方

顔妻です。 今回はdplyrを使ったlead関数、lag関数の使い方です。 データテーブルの行列入れ替えを行うと大変な作業になるけども、行の前後の値を使って比較評価を行いたときがあると思います。sqlにあるOLAP関数のlag関数、lead関数と同じような使い方できますので行の前後の値を使ったり、並び替えを行ってうまく別の使い方をしたりしてみてください。

1 3