暮らしに役立つQC七つ道具(5) ―― 散布図:「傾向」を「推理」する
この連載では,ソフトウェア開発の品質管理(QC:Quality Control)において使われている七つの技法「QC七つ道具」について解説している.今回は,二つの項目をプロットすることで相関関係を直感的に把握するのに役立つ「散布図」を取り上げる.散布図は,二つの項目の原因‐結果の関係を推測するのに役立つ.(編集部)
●七つ道具その5: 散布図
今回取り上げるQC七つ道具は,「散布図」です.散布図とは,二つの項目を対にしてデータを取り,点としてプロットしたものです.項目間の相関関係を調べることで,問題点を抽出したり,傾向をつかむことができます.また,結果を期待する方向に持っていくために,入力(要因)をどう変更するかをさぐるためにも使われます.上手に使えば,仮説,検証のサイクルを回すことができる非常に強力なツールです.
以下,散布図の例を図1に示します.
[図1] 散布図の例(月別平均気温とビール消費量)
項目間の相関は,以下の5種類に分類できます.
- 相関がある(正の相関,負の相関)
- 相関がない
- 相関の可能性がある
- 相関以外に異常点がある
- 相関が判断できない
散布図は非常に強力なツールですが,気をつけなければならない注意事項が二つあります.その一つめは異常点です.誤差とみなされてしまいがちですが,そこに「問題」が隠れている「可能性」があるため,発生した「理由」を確認することが大切になります.そして二つめの注意事項は,「誤った結論」を導く可能性です.関連のない項目間で散布図を書いても,相関が存在するように見えてしまうことがあるのです.
そのため,散布図を作る際には,以下の三つを意識することが重要です.
- 二つの項目を選んだ理由(=仮説)は何か?
- 二つの項目は,入力-出力の関係になっているか?
- 二つの項目は,原因-結果の関係になるだろうか?
また,ほかの解析手段を用いて相関の検証を行うことも,「誤った結論」を導かないための有効な手段です.