尺度水準
出典: フリー百科事典『ウィキペディア(Wikipedia)』
尺度水準(しゃくどすいじゅん)とは、調査対象に割り振った変数、その測定、あるいはそれにより得られたデータを、それらが表現する情報の性質に基づき数学・統計学的に分類する基準である。スタンレー・スティーヴンズ(Stanley Smith Stevens)により1946年の論文「測定尺度の理論について」"On the theory of scales of measurement"で提案された分類がよく用いられる。
変数に対して可能な数学的操作は、変数を測定する尺度水準に依存し、その結果特に統計学で用いるべき要約統計量および検定法も変数の尺度水準に依存する。
スティーヴンズは低い方から順に以下の4つの尺度水準を提案しており、高い水準はより低い水準の性質を含む形になっている。また高い水準でのデータを低い水準に変換して扱うことができる。
目次 |
[編集] 名義尺度
この水準では数字を単なる名前として対象に割り振る。2つの対象に同じ数字がついていればそれらは同じカテゴリに属する。変数値間の比較は等しいか異なるかでしか行えない。順序もないし加減などの演算もできない。
例としては電話番号、背番号、バスの系統番号など。中心的傾向の指標として使えるのは最頻値のみである。統計的バラツキは変動比や情報エントロピーで評価できるが、標準偏差などの概念はありえない。名義尺度でのみ測定されるデータはカテゴリデータとも呼ばれる。
- なおカテゴリデータを、ある性質が「あるかないか」という表現に直し、さらにこれを「1か0か」で表現したものをダミー変数という。ダミー変数またはそれから算出されるスコア(点数)を、順序尺度以上の水準に準じて扱う方法もよく用いられる。
[編集] 順序尺度
この水準では対象に割り振られた数字は測定する性質の順序を表す。数字は等しいかどうかに加え、順序(大きいか小さいか)による比較ができる。しかし加減などの演算には意味がない。
物理学的な例にはモース硬度がある。その他の例にはレースの着順などがあるが、これでは到着時間の差は記録できない。心理学や社会科学の測定のほとんどは順序尺度で行われる。例えば社会的態度(保守的か進歩的かなど)や階級は順序水準で測定されるものである。また客の嗜好(アイスクリームのバニラ味とチョコレート味とどちらが好きか)のデータもこれで表現できる。順序尺度の中心的傾向は最頻値や中央値で表されるが、中央値の方が多くの情報を与える。順序尺度で測定されるデータは順序(または順位)データと呼ばれる。
- 以上の名義尺度および順序尺度で表されるデータを合わせて質的データともいう。また各カテゴリに属す対象の個数という形のデータにまとめると数量データと呼ばれ、これは分割表で表示できる。これらに対して用いられる統計検定法はノンパラメトリックなものに限られる。
[編集] 間隔尺度
対象に割り振られる数字は順序水準の性質を全て満たし、さらに差が等しいということは間隔が等しいということを意味する。つまり測定値のペアの間の差を比較しても意味がある。加減の演算にも意味があるが、尺度上のゼロ点は任意で負の値も使える。
例にはカレンダーの日付がある。値の間の比には意味がなく、直接の乗除の演算は行えない。とはいえ差の比には意味がある。中心傾向は最頻値、中央値あるいは算術平均で表され、算術平均が最も多くの情報を与える。間隔尺度で測定されるデータは間隔データと呼ばれる。摂氏または華氏で測る温度も間隔尺度である。社会・人文科学分野で普通用いられる唯一の間隔尺度は知能指数(IQ)である。
[編集] 比率尺度または比例尺度
対象に割り振られた数字は間隔尺度の性質を全て満たし、さらにその中のペアの比にも、乗除の演算にも意味がある。比率水準のゼロ点は絶対的である。
ほとんどの物理学的量、つまり質量、長さやエネルギーは比率水準である。また温度も絶対温度で測れば比率尺度である。比率尺度で測定される変数の中心的傾向は最頻値、中央値、算術平均あるいは幾何平均で表されるが、間隔尺度と同じく算術平均が最も多くの情報を与える。比率尺度で測定されるデータは比率データと呼ばれる。比率尺度で表される社会的変数には年齢、ある場所での居住期間、収入などといったものがある。
- 正しい意味で単位を有するのは間隔尺度と比率尺度のみであり、従ってこれらは真の尺度とも呼ばれる。これらのデータを合わせて量的データ(質的データに対して)、数値データ(数量データに対して)ともいう。
以上のスティーヴンズの分類は広く用いられてはいるものの、完全に認められたものではなく、議論がある。例えば、行動科学で順序尺度の平均値に意味があるかどうかといった議論がなされている。数学的には意味がないが、一部の行動科学者は実際に使っている。行動科学における順序尺度は実際には順序尺度と間隔尺度の中間にある(2つのランクの差は一定ではないが、ほぼ同程度である)というのがその理由である。