肥満度の推移[ 国民健康・栄養調査2016版]

顔妻です。 厚生労働省が提供している白書のデータを使う機会がありましたので集計の過程も含めて共有です。今回のデータをみると、どうやら日本国民の体重にトレンドがあることがわかりました。データを可視化する方法も記載していますので仕事でも使えると思いますのでよかったら参考にしてみてください。 利用した調査データ 今回利用した調査データは日本政府が実施している 国民健康・栄養調査 で実施された2016年度 […]

【mac】matplotlibの日本語文字化け防止方法

顔妻です。 今回はpythonでmatplotlibを利用するときの文字化け防止方法をメモしたいと思います。こちらはmacでしか試してませんのでご了承ください。 文字化け防止方法 まずは防止策を使っていないグラフの可視化から。 [crayon-5c135af82f267292208509/] 見事に豆腐になっていますね。では、今度は「」を追加して可視化をします。 [crayon-5c135af82 […]

R

Rのdplyrを使った集計(簡易版)

顔妻です。 非常に遅ればせながらdplyrについて書いていきたいと思います。実は巷の好印象とは違ってあまりよい印象を持っていませんでした。というのも、なんだかんだでDBからデータ抽出をするときはSQLだし、またいろんな方法を覚えて実施するなんて非常に面倒だと思っていました。ただ、この見解が本当に誤りだと気づいた反省も含め記載していきます。 利用するデータ year month ShopName S […]

pythonのmatplotlibとseabornを利用した可視化〜折れ線グラフ〜

顔妻です。 今回はデータのグラフ可視化をするにあたってpythonのmatplotlibを利用して折れ線グラフを作ろうと思います。 折れ線グラフの作成 まずは可視化前にmaplotlibのインストールを行います。ここではjupyter notebookでグラフが埋め込まれるようなおまじないも含めて記載を行なっています。コマンドプロンプトや他の開発ツールを使っている方はパッケージのインポート以外は不 […]

R

【Mac】Rで作ったグラフの文字化けを解消する

顔妻です。 今回はmacでRを使っている場合の文字化け対策です。windowsでは問題ないのですが、Rをmacで利用すると文字化けすることがあります。豆腐が現れてしまったグラフを報告で使うとバツが悪いので解消したいと思います。 文字化けグラフ まずは標準搭載のグラフから。 [crayon-5c135af82fb86048881796/]     次はライブラリのggplot2で […]

pythonのpandasパッケージを利用したデータフレームの扱い

顔妻です。 今回はpythonのpandasパッケージを利用してデータフレームの作成や操作をします。pythonでデータ分析をするに当たって表の操作がうまくできないと何もできません。なので、データ分析の文脈で可視化やモデル作成ができる程度を目指します。 pythonやパッケージのインストールの方法はこちらを参考にしてください。また、numpyを使った配列処理はこちらをご覧ください。

1 4

Overall Ranking