2/4ページ

2/4ページ

pythonのpandasパッケージを利用したデータフレームの扱い

顔妻です。 今回はpythonのpandasパッケージを利用してデータフレームの作成や操作をします。pythonでデータ分析をするに当たって表の操作がうまくできないと何もできません。なので、データ分析の文脈で可視化やモデル作成ができる程度を目指します。 pythonやパッケージのインストールの方法はこちらを参考にしてください。また、numpyを使った配列処理はこちらをご覧ください。

2018年7月の振り返り〜スタートアップを退職しました〜

顔妻です。 スタートアップに参画して早3ヶ月目というところだったのですが転職いたしました。3ヶ月という短い間でしたが個人的にはかなり濃い時間とすることができたので人生の備忘録も兼ねて振り返りをしようと思います。 このブログの経歴にも書いているのですが私はスタートアップの前はアドネットワークの会社でデータサイエンティストをやっていました。 といっても世間で輝くようなキャリアを積んできたわけではなく、 […]

  • 2018.07.07

携帯型ホワイトボード利用のすゝめ

顔妻です。 最近買ったバタフライボード2が非常に便利だったのでご紹介です。 私の普段の仕事的にはパソコンを使うことがメインではあるのですが、 企画資料やふんわりした発想をまとめるときにはよく紙を使っていました。

  • 2018.05.30

pythonのインストールとデータ分析環境の構築

【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門 顔妻です。 今回はpythonのインストールと最低限の分析環境の構築を行おうと思います。 私自身はずっとRを使っていたのですが以下の記事をみてもう世間の流れには勝てないなという印象を持ってしまいました。少しだけ触ったことがあるのですが、これを機にpythonでのデータ分析もしっかりと使えるようになろうと思います。 […]

  • 2018.05.02

数字の取り扱いの難しさ

顔妻です。 先日とある方と話をしたことについて非常に共感したので備忘録です。 内容は表題のとおり数字の取り扱いの難しさについてです。 お話をした相手は初対面だったのですが、データ分析ってキワモノだよねーっていう話になりました。とはいえ、その方自体はおそらくデータ分析にかなりの信頼を置いていてご自身もゴリゴリできる方であったに違いない人でした。

  • 2018.03.28

Rを使ったクロス集計表の作り方・使い方②

顔妻です。 本日は以前に紹介したクロス集計の記事に続いて、連続量にカテゴリーのフラグを立てて集計する方法をご紹介したいと思います。これができるようになるとほとんどのデータをクロス集計として表現できるようになると思いますので活用してもらえたらと思います。

Rで行う回帰分析

顔妻です。 今回はRで回帰分析を実施してみたいと思います。特に全体像を把握するために実際の利用方法を一通りこなしておき、結果の読み取りは最低限にしたいと思います。

1 2 4