顔妻です。
今回はRstudioにあるレポート提出に最適な機能をご紹介します。jupyterのレポーティングが主流かなと思いますがコードが長くなったときに不便なときもあると思います。こちらではコードを隠すこともできるので、この辺りも解消するやり方も併せてご紹介です。
Rmarkdownを利用したレポート出力例
早速ですが上記がRmarkdownを利用したRでのレポート出力の例です。jupyter と同じように「コード」「コードの出力結果」の順番でレポーティングすることが可能です。
次に営業やマーケティングといったビジネス系の担当者や集計プロセスを確認する必要のない役員や上司への報告用としてコードを隠したバージョンです。
コードを隠しただけでグッと見やすさが変わりましたね。アナリスト同士や、分析を行なっている途中ではコードがある方が条件の確認や集計処理方法が見えていいのですが、アウトプットに集中した場合はこちらの方が都合のいいことが多いと思います。
RmarkdownのRstudioでの使い方
デモを見ていただいたところで次はRstudioを利用して実際に作って見ましょう。Rstudioをインストールしていない方は以下にやり方がありますので事前にインストールを行なってください。
まずはRmarkdownを出力するのに必要なライブラリのインポート行なっていきましょう。Rstudioで新規のスクリプトを作成してください。次にスクリプトパネルにでてくる下図の青枠をクリックしてください。数のように表示されますので赤枠をおしてください。
レイアウトは以下のように変わっていると、赤枠内のように「knit」というボタンが表示されると思いますのでボタンを押してインストールを始めてください。
インストールが無事終わった方は作成していたスクリプトを保存してください。ここでは「demo_markdown」という名前にしています。また、下記と同じ内容を先ほどのクエリにコピペしてください。
1 2 3 4 5 |
# 利用している集計データの上位6行を抽出 ```{r, echo=FALSE} head(iris) ``` |
どのような内容になっているかというと「#」以降がmarkdownの書き方になり、出力例の見出しで使った箇所になります。また、上記の図で水色で囲まれている箇所がR のコードを記述する部分になりますので実行したコードは必ずこの青枠内に記述をしてください。
ここまで記載したら試しに「knit」ボタンを押して見ましょう。以下のようにレポートができあがると思います。
こちらはコードを出力させないバージョンになります。コードを出力したい場合は「echo=FALSE」を消すか「echo=TRUE」に変更してください。また、「Open in Browser」のボタンを押すとお使いのブラウザで表示されます。
まとめ
以上がRmarkdownを利用したレポート出力機能のご紹介でした。この機能はとても様々なことができます。今回はご紹介しきれなかったことも多いので、また内容を集めて便利な機能をご紹介できたらと思います。また、以下に出力例で利用したコードをサンプルとして記載しました。説明していないところもありますが参考にしてみてください。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 |
--- title: 'Rmarkdown Demo' output: html_document: df_print: kable number_sections: yes --- # 目次 1. irisの上位6行を出力 2. irisの要約統計量 3. plot関数を利用した可視化 # 利用している集計データの上位6行を抽出 ```{r, echo=FALSE} head(iris) ``` ## 集計データの要約統計量(省略) ```{r,include=FALSE} summary(iris) ``` # 可視化 - 以下は花びらと萼(がく)の長さや横の幅を掛け合わせて散布図で可視化を行った。 - 色分けはデータテーブルに含まれる葉の種類。 - この結果より、仮説として持っていた花の種類による傾向の違いがみてとれる。 ```{r,echo=FALSE} plot(iris[1:4],col = iris$Species) ``` |