データのさまざまな尺度と意味

データのさまざまな尺度と意味

顔妻です。
ふとした瞬間に忘れてしまいそうですが知っておくと非常に大切な概念であるデータの種類について説明していきます。データの種類がわかったところで何の役に立つのかと思う方も多いと思いますが、どのような分析手法を適用するのかを理解するために必要な概念ですのでしっかり理解をしてください。

定番の4つの尺度

こちらは統計の教科書には必ず載っているであろう尺度について記載しています。常に意識しているわけではありませんが事あるごとにこの概念に照らし合わせて考えると色々気づきがでてきます。

尺度名 内容
【1】比例尺度 原点の決め方が定まっていて、間隔や比率にも意味がある尺度 身長、体重、売上
【2】間隔尺度 間隔に意味はあるが、原点をずらして考えても問題のない尺度 体温、気温
【3】順序尺度 順序に意味はあるけれども、間隔に意味のない尺度 出席番号、ランキング
【4】名義尺度 順序や間隔に意味はなく分類をするための尺度 名前、性別、血液型、会社名

 

統計学でよく出てくる尺度

こちらも統計の教科書でよく見かける尺度になると思います。 特に「連続」「離散」この概念はより上位の統計学を理解するのに欠かせない概念ですのでしっかりと押さえておさえた方がいいと思います。

 

名称 該当する尺度名
連続値(≒量的変数) 【1】比例尺度、【2】間隔尺度
離散値(≒質的変数) 【3】順序尺度、【4】名義尺度

まとめ

統計を勉強して後から振り返ると大事な概念だなと思うのですが、統計の勉強を始めたばかりの方は「間隔尺度」と「連続尺度」の違いもかなり難しいのではないでしょうか。ちなみに冒頭で非常に重要な概念とお伝えしましたが、杓子定規で考えてしまうと視野が狭くなってしまいますので、この点には注意してください。また、個人的な主観ですが量的変数は割と「行動データ」が多く、質的変数は「意識データ」と捉えることが多いと感じます。

分析カテゴリの最新記事