統計図表
出典: フリー百科事典『ウィキペディア(Wikipedia)』
統計図表(とうけいずひょう)とは、複数の統計データの整理、視覚化、分析、解析等に用いられるグラフ [1] [2] [3] [4] [5] [6] [7] [8] [8] [9] [10] [11] および表の総称である。ここで、グラフとは「図形を用いて視覚的に、複数の数量・標本資料の関係などを特徴付けた物」のことを指す。この意味においてのグラフはしばし「統計グラフ」と呼ばれる。
統計図表は、統計データの整理、分析、検定などの過程で用いられる。統計図表を駆使することで、「調査活動によって得られた数量(統計データ)の特徴」(増減の傾向の型,集団の構成など)や、統計データ同士の関係(相関関係など)を視覚的に理解することが出来る。
目次 |
[編集] 概要
統計図表を適切に活用すれば、「統計データの特徴(増減等)をつかむこと」や、「得られた統計データを系統だてて比較すること」ができるなど、現状把握や客観的判断を行ううえで大きな手助けとなる。統計図表を用いて、統計データの傾向などを把握することを「統計データの解釈」あるいは「資料解釈」という。
統計図表を用いればデータを直感的に扱うことと、客観的に扱うことを両立させられる反面、用法、解釈を誤ることによって誤った印象を与える/受ける可能性がある。ただし、何を以って正しい用法、印象、判断とするのかという問題は、深く考えればきわめて難しい問題であり、場合によっては「増加しているのか否か」というような「客観的なはずの問題」自体が極めて微妙な判断を要する問題になることもある(いわゆる有意性の問題)。また、特に最近話題になる問題として、「同じデータを用いて議論しているはずなのに、正反対の解釈がとられ、論争が生じる」ということも起こり得る。無論、「どのような統計グラフをどのように用いればよいのか」については、ある程度の目安は存在する。それについては、「統計図表で分かること・選択の目安」で説明する。
統計グラフの種類としては、よく知られているところでは「折れ線グラフ」、「柱状グラフ」、「円グラフ」などがあるが、その分類は、人によってそれぞれである。この点については、「統計グラフの種類」で延べる。
では、どんなときにどんなグラフがよいのだろうか?研究やそれに準じる調査活動において統計グラフを作成する必要がある局面は、「実験ノート上などの一次的な記録物や計算紙などの上でのデータの簡易的な分析」、「実験、調査後に行う本格的なデータの分析」、「論文、講演のスライド等の公表用の資料」等様々な状況がありえるが、どのようなケースにおいても、
- 「何を分析するのか」、「何を主張するのか」、「何を検定するのか」といった目的意識(下記統計グラフで分かること参照)
- 研究目的に照らして適切に取得、処理された統計データそのもの
がなければ統計グラフの作成が不可能である。これについては、「統計グラフを作る前に」で延べる。
統計グラフの作成は、方眼紙などを用いて行うことが基本だが、小中学校の教育の現場を除けば、最近ではExcel等の表計算ソフト、場合によってはOriginやカレイダグラフ等の統計ソフトを用いるケースのほうが多いと思われる。
[編集] 統計グラフを作る前に
統計図表の作成は、実験や社会調査等の調査活動におけるデータの整理や分析の一環として行われる。統計グラフの作成を、調査活動自体から切り離して考えることは難しい。何を分析するのか、何を訴えるのかによって、「適切なグラフとはなにか」が変わってくる。一般的な見地から「正しい統計グラフを作成するための目安」(一般的な精神のほか、「棒グラフを用いるのが適切な側面」のような事例分析)を示すことは自体は可能だが、”ばかの一つ覚え”は通用しない。それぞれの場合に応じて、工夫をこらすだけの力をもつようにすることが必要で、そのためにはよいといわれる論文などに掲載されている統計図表を、その論旨と照らし合わせながら吟味することで、目をこやすことが必要である。
また、統計データそのものがない状態で、あたかもそれがあるように偽ってグラフを作成してしまっては捏造である [12]。飽くまで統計グラフの作成は、データの加工手段の一つである。「目的や着眼点に沿って散在する情報を収集する」というプロセスなしには成立し得ない。さらに言えば、グラフ作成の前に、データ自体に何らかの統計処理を加える場合がある。データの取得、処理の妥当性については、グラフ選択、スケール等の設定以前の問題だが、この段階で問題がある場合には、グラフ自体の価値はなくなる。ただし、データの取得、処理の妥当性についても、統計学、特に実験計画法などの体系的な学問が存在するが、安易に可否を決められる問題ではない。
- なお、特殊な例として科学的な予想をグラフ化する場合があり、その場合はデータが存在しないことはあり得る。下に詳述する。
先にも述べたように、グラフを作成する上では、
- 「何を分析するのか」、「何を主張するのか」、「何を検定するのか」といった目的意識(下記統計グラフで分かること参照)
- 研究目的に照らして適切に取得、処理された統計データそのもの
を明確にしておく必要がある。 [3] [4] たとえば「ここに全国の小学生それぞれの身長と体重、学年、学校を記したデータがあります。さぁ統計グラフを作ってください」といわれたとして、データとしては膨大なものがあるにしても、これだけの”情報”では「どのようなグラフをどのように作成するのが適切か」を決めることはできない。つまり、
- 使用するグラフの種類(円グラフにするのか、棒グラフにするのかなど)
- 主要なパラメータの選択(棒グラフの場合は軸の設定、円グラフの場合には分類の設定、ヒストグラムの場合には階級の設定)
- スケールの選択
などが定まらない(下記、統計グラフ選択の目安参照)。たとえば「身長のバラつき(ここでは敢えて、評価方法を特定しないために素朴なバラつきという言葉を用いる。)が見たい」(⇒普通はヒストグラムを使う)とか、「身長と体重の関係を見たい」(⇒普通は散分図を用いる)のように、同じデータを用いたとしても「何を議論するのか」によって適切なグラフは異なる。同じ「身長のバラつき」が見たいと言った場合でも、「小学2年生身長のバラつきが見たい人」(ヒストグラム)、「小学2年生身長のバラつきと、5年生の身長のばらつき具合を比較したい人」(2つのヒストグラムをスケールを統一して表示。あるいは、箱ひげ図を用いる)のように、スケールの選択や場合によってはグラフの選択さえ変わってくる。無論、複数の種類のグラフを選択し得る場合もある。なお、目的が明確になったとしても、「どのような問題を論じるのにはどのようなグラフがよいのか」について知らねば、どうにもならないが、これについては後述する。
グラフ作成の下準備の過程は、概ね下記のとおりである。[3] [4]
- 作成する統計グラフの主題を決める
- 作成するグラフの主題に沿って必要と思われるデータを収集、整理する
- データの取捨選択、主題の再検討
- どのようなグラフを作成するのかを検討する
- 実際に作成する
より一般に、グラフを作成するという問題は、「『主張すべき事柄』を論証するための素材をどのような素材を集め、それをどのように配置するか?」という問題の一部である。統計グラフの作成までの具体的な手順は、人それぞれで、状況次第ではあるがどのようなケースにおいても、「どのようなデータからどのような知見を得ようとするのか」がある程度定まらなければ作成ができない。そのため、統計グラフ作成の手順は、研究の手順とほぼ同じで、概ね 「目的や着眼点に沿って散在する情報を集約した後、それを整理、分析し、特徴や傾向を見出す」という プロセスを経る。当然の話だが、これらの各段階が「適切」に行われていることが、グラフ自体の適切/不適切を決める。
[編集] 統計グラフの種類
統計グラフの分類は、人によって様々だが、以下に典型的な統計グラフの種類を示す。 [3] [4] [9][10] [11]
[編集] 棒グラフ
棒グラフは、資料を質的に(意味的に複数の項目に)分類したときに、各項目間の大きさを比較するために用いる。項目を横軸、各項目の大きさを縦軸に表現する(横軸、縦軸は逆でも良い)。
棒で表すことで、各項目の大きさや、大きい値(小さい値)を持つ項目、各項目間の関係などが把握しやすくなる。
[編集] 柱状グラフ(ヒストグラム)
柱状グラフ(ヒストグラム)は、棒グラフの一種で、資料を量的に(大きさを複数の階級に区分し、各要素がどの階級に属するかという指標で)分類した時に、各階級の散らばりの様子を見るために用いる。柱状で表すことで、集団の偏りや各階級間の散らばりの様子が把握しやすくなる。
品質管理などにおいて、度数分布表から度数分布を図示するときによく用いられる。度数が増えるにしたがって、グラフの形状は柱状から曲線へと近づいてゆく。この曲線を度数分布曲線という。
[編集] 円グラフ
円グラフは、資料を特定の項目に分類した時、その一項目での割合を比較する時によく用いられる。円で全体を表すことで、ある項目内・分野内での割合の大小が直感的に把握しやすく、プレゼンテーションなどでよく利用される。又、円グラフでは、全体の数値を360として表現することも少なくない。
他方で、厳密な比較には向かないため、専門分野ではむしろ使用されない。
[編集] 統計グラフで分かること・統計グラフ選択の目安
先に、統計グラフを適切に活用すれば、「統計データの特徴(増減等)をつかむこと」や、「得られた統計データを系統だてて比較すること」ができると述べたが、より詳細には、「相関」、「推移」、「分布」、「比較」、「内訳」の表現、検討、分析が出来る。
[編集] 理科系の研究分野における統計グラフの活用
理科系の研究分野においても、データの整理や分析の一環として、統計図表を作成する必要がある局面は多数ある。具体的には、他の分野とあまりかわらず、「実験ノート上などの一次的な記録物や計算紙などの上でのデータの簡易的な分析」、「実験、調査後に行う本格的なデータの分析」、「論文、講演のスライド等の公表用の資料」等様々な状況がありえる。そして、理科系の分野においても、
- 「何を分析するのか」、「何を主張するのか」、「何を検定するのか」といった目的意識
- 研究目的に照らして適切に取得、処理された統計データそのもの
がなければ統計図表の作成が不可能であるという事情は同じである。
理科系の分野においては、
- 物理量同士の関係(特に相関関係)を論じる場合が殆どだということ
- 華美な装飾が嫌われる傾向にあるということ
- 使われる統計グラフの種類が他の分野に比べて少ないこと
- しかしながら論文中で重要な役割を担い、適宜参照しなければ論文の内容が分からなくなるほど重要であること
などが、他の分野に比べ特徴的である。従来は印刷等の都合からグラフの多用は嫌われたが、最近では、「図とグラフとその脚注だけで論文の内容が大まかにわかるようにせよ」と説く本も出てきて、現状は概ねそのようになってきていると思われる。
理科系の研究分野では、物理量同士の相関を議論することが主であるため、実際に用いられるグラフの殆どが散布図で、そのほか等高線図等の広い意味でのカラーグラフ(2D,3D)、棒グラフである。棒グラフはヒストグラムの提示に用いられるのが殆どである。
理科系の分野では、本来的に、「データは連続的な量として取得されているはず」という暗黙の前提があり、物理、化学、工学問わず「物理量同士の相関」を見ることが主な目的であるため、理想的には「関数グラフ」のようなものを得たいという考えが暗にある。そのため圧倒的大多数において散布図を用いて
- 2種類(あるいは3種類)のデータの相関を散布図にまとめる
- そのデータに最もフィットし、現象論的にもっともらしい回帰曲線を描く(アレニウスプロット等)
という処理が行われる。作成される散布図は、少数のデータから全体像を推測する場合には、「実際のデータの測定値」をそのまま散布図上に書き込むことが多い。データのラベルが離散的で、かつデータの量が充分多数で、そのデータの分布が正規分布に従っている場合には、ラベルごとの平均値のみをプロットし、それに適切なエラーバーをつける方法で作成されることが多い。
理科系の分野では、コンピュータ技術の進展により、統計グラフと画像(写真)の区別が曖昧になってきているという傾向がある。デジタル化された画像は、(空間座標,色)の2種類の系列からなる情報の相関関係を2次元的あるいは3次元的に示したある種のカラーグラフの一種でしかなく、実際「カラーグラフとして作成された等高線図等」等と解像度や、数字の羅列としてのデータ自体のみからでは区別がつかない。
初等教育の過程で重視される「折れ線グラフ」は、ロードマップ等の未来技術予測等には多用されるものの、
- 自然科学、特に物理学において時間的推移(時系列)とは「時間と測定結果の相関」に過ぎないこと
- Excel、Origin等の一部のグラフ作成機能を有するソフトウェアでは、「散布図の各点を棒で結ぶ」という方法で折れ線グラフが作成できること
- 特にExcelでは、仕様上「折れ線グラフ」では、「目盛り間隔は必ず等間隔」とされていて、ある特定の時間のデータが欠落した場合等に不自由するが、散布図として作成すればそのような問題が生じないこと
等の理由から殆どの場合は散布図にとってかわられている。
[編集] データの存在しない場合
データのないグラフが描かれる場合もある。例えばある考えを主張する場合、それを説明するために、言葉で行うのが普通であるが、おそらくデータがあればこうなる、という形でグラフが活用されることがある。
例えば、島嶼生態学における種数平衡説は、海洋島における生物の種数を島へ新たに入植する種数と島で絶滅する種数の間の平衡によって決定されると論ずるが、前者については大陸からの距離が遠くなるほど低くなる、また後者は島が小さいほど高くなるということは容易に想像できる。これをグラフ化すれば、両者の曲線が中程の特定の点で交差し、そこがその島の種数の平衡点にあたることになるだろうことが容易に理解できる。この場合、実際にその曲線がどのような形であるかは実際の調査が必要であろうが、いずれにせよ右上がり、右下がりであれば議論が成立するので、グラフを作成することは虚偽にならない範囲でそれにわかりやすさをもたらす効果がある。
[編集] 学校教育等における統計図表に関する指導
最近では統計グラフの作成、解釈は、統計グラフの解釈はノート作成、プレゼンテーション技術、文章技術などと並び、調査活動を行ううえで必要なアカデミックスキルの一つだと考えられるようになってきた。しかし、統計グラフの作成、解釈に関する系統だった指導というのは、あまりおこなわれていない。
小学校における算数の時間などに、「棒グラフ」や「折れ線グラフ」などの扱いを習い、高等学校の教科書には「統計」の項目があり、そこでも簡単に触れられる。また、小、中、高を通じて、地理の時間には、社会統計の扱いを白地図などを用いて学ぶ。小中高の理科の時間にも、「実験データの整理」などという意味合いで教えられることがある。大学では、学生実験などにおいて実験ノート指導などと平行して指導される。
公務員試験などでは、「資料解釈」という科目として出題される。システムアドミニストレータ試験においても、「状況に応じた適切なグラフ選択」の問題が出題される。また、品質管理などの現場で教育されることがあり、品質管理関係の教材には、グラフの選択などに対して詳しい検討を行っているものがある。
[編集] 参考文献
- ^ a b 内田 治 (著) グラフ活用の技術 データの分析からプレゼンテーションまで (単行本)
- ^ a b 南川利雄(著) 表とグラフの作り方(単行本)
- ^ a b c d e 山本 義郎 (著) レポート・プレゼンに強くなるグラフの表現術 (講談社現代新書) (新書)
- ^ a b c d http://www.pref.chiba.jp/syozoku/b_toukei/graph-con/gr_tsukurikata.html
- ^ 見延 庄士郎(著),『理系のためのレポート論文完全ナビ』(2006/12)
- ^ 実験データを正しく扱うために
- ^ 吉村忠与志,「厳選例題Excelで解く問題解決のための科学計算入門』
- ^ a b David Carr Baird・加藤幸弘・千川道幸・近藤康『実験法入門』ピアソンエデュケーション(2004/12)
- ^ a b http://office.microsoft.com/ja-jp/excel/HA012337371041.aspx?pid=CH100648751041
- ^ a b http://www.hulinks.co.jp/support/kaleida/plot.html#01
- ^ a b http://www.lightstone.co.jp/products/origin/graphselect.htm
- ^ 無論、本記事に示すグラフのいくつかがそうであるように、グラフの使い方自体を議論する場合には、架空のデータを用いることは問題ない。