データ処理

R

Rのdplyrを使った集計(簡易版)

顔妻です。 非常に遅ればせながらdplyrについて書いていきたいと思います。実は巷の好印象とは違ってあまりよい印象を持っていませんでした。というのも、なんだかんだでDBからデータ抽出をするときはSQLだし、またいろんな方法を覚えて実施するなんて非常に面倒だと思っていました。ただ、この見解が本当に誤りだと気づいた反省も含め記載していきます。 利用するデータ year month ShopName S […]

pythonのpandasパッケージを利用したデータフレームの扱い

顔妻です。 今回はpythonのpandasパッケージを利用してデータフレームの作成や操作をします。pythonでデータ分析をするに当たって表の操作がうまくできないと何もできません。なので、データ分析の文脈で可視化やモデル作成ができる程度を目指します。 pythonやパッケージのインストールの方法はこちらを参考にしてください。また、numpyを使った配列処理はこちらをご覧ください。