本日は『統計的な考え方「QC7つ道具:散布図」』をお伝えいたします。
散布図とは?
散布図は、縦軸、横軸に2項目の量や大きさ等を対応させ、データを点でプロットしたものである。各データは2項目の量や大きさ等を持ったものである。日本工業規格では「二つの特性を横軸と縦軸とし,観測値を打点して作るグラフ表示」と定義している。
(Wikipediaより引用)
散布図は、特性とその要因とを対にしたり、関連のありそうな二つの特性又は要因同士を対にしてとったデータを、二つの軸の交点にプロットした図です。
特性と要因、ある特性と他の特性、一つの特性における二つの要因、といった二つの変数間の関係を表した点グラフで、取り上げた変数間の相関関係を知るのに用いられ、対になったデーターをプロットして、原因と結果の関係、結果と結果の関係、原因と原因の関係などデーター相互の関係をみるグラフです。
散布図の特徴
散布図は、2種類のデータの関係を視覚化して整理します。
例えば、右図のように、身長と体重の関係を調査する場合を考えます。一人一人の身長と体重の1対のデータをプロットすると、この2つのデータの実際の関係が視覚化できます。
又、それぞれ個々のバラツキの姿ではよく見えない「太り気味・やせ気味」といった新しい観点のバラツキの姿・形も発見できます。
製造本部では、品質は工程で造り込むという考え方のもと、特性要因図にある特性を要因で管理します。この際、特性を縦軸、要因を横軸にした散布図にて、関係の姿を把握することが重要なポイントになります。
散布図は、横軸と縦軸にそれぞれ別の量をとり、データが当てはまるところにプロットするグラフです。2つの量に関係があるかどうかをみるのに非常に便利なグラフです。
散布図の目的
散布図は、2つのデータの関係を調べる手法です。2つの変数の対になったデータを用いてそれぞれの変数を軸にとり、サンプルをプロットしたグラフです。これは、次の変数間の関係を見るときなどに適しています。
- 品質特性と変動要因の関係
- ある品質特性と他の品質要因の関係
散布図では、次のような点に注意しなければなりません。
- 外れ値の有無の検討:外れ値
- 層別の必要性:層別散布図(層ごとの散布図)
- xとyの関係:相関関係(相関係数)・回帰直線・同時分布と周辺分布
散布図の狙い
- 影響を与える要因が明らかになる
特性要因図で抽出した要因が特性と相関があれば、その要因が原因となっている可能性が考えられます。 - 加工条件の最適化が図れる
ある製品の溶接打点数と電流値に相関があるのなら、欲しい電流値に対する適切な打点数を散布図により把握することができます。 - 簡単な管理方法を選択できる
手間やコストがかかる管理方法に対して、相関がある簡単な管理方法があるなら変更するメリットがあります。
散布図の用途
- 特性のバラツキに影響を与える要因が何かを捉えることができます。
- 特性と要因との関係を把握し、特性の平均レベルを所与の値とするための要因の水準値を調べることができます。
- 本来の特性の測定に時間や工数がかかる場合や、測定によって製品の機能が損なわれる破壊検査など。
のような場合に、本来の特性と関連が強くその代わりとなるような特性(代用特性)を探します。
そして、散布図は特性要因図を用いて明らかにした、要因が真の要因かどうかを検証するために有効なツールです。要因解析などの検証のステップでよく用いられます。度数分布を示すヒストグラムが、原料成分の量や製品の不純物のそれぞれの分布の姿をとらえる道具であるのに対して、散布図は対になったデータ相互の関係を見るので、2 次元のヒストグラムともいわれています。
例えば、2 つのデータの関係には、
- 結果(特性)と結果(特性)との関係
稼働率と生産台数・タクトタイムと生産台数など - 原因(要因)と結果(特性)との関係
気温と消費電力量・製造条件と不良率・加工温度と鋼材強度など - 原因(要因)と原因(要因)との関係
穎粒製品粉砕時の圧力と温度、鋼材の強度に対する加工温度と冷却速度など
これらの関係を調べ、改善の手がかりを掴むために、散布図を作成し検討を行います。対応のある2つのデータにおいて、一方の値に応じて他方のデータが連動して変化する場合、これらの間に相関があるということです。
散布図の種類
①:強い正の相関関係 | ②:弱い正の相関関係 | ③:強い負の相関関係 |
Xが増加するとYも増加する関係が強い。この場合Xを管理すればYを決めることが出来る。 | Xの増加につれてYも増加するがバラツキがある関係。Yに影響を与える要因が他にもある。 | Xの増加につれてYが減少。強い正の関係と反対の関係。 |
④:弱い負の相関関係 | ⑤:相関がない | ⑥:直線的でない相関関係 |
弱い正の相関関係と反対の関係。 | Yの増減はXの増減に関係なく変化。YにはX以外の要因が関係している。 | Xの増加によりYが増減するが直線的ではない場合。 |
散布図のまとめ方
- 「必要なデータの収集」
関係あるかを調べたい2種類のデータを集めます。データをそれぞれxyとし、要因と特性の場合は要因をx、特性をyとします。データ数が少ないと関係がハッキリ掴めないので最低30個以上のデータを集めます。 - 「収集したデータからxy、それぞれの最大値と最小値を求めます。」
- 「横軸と縦軸を設定し、座標軸と目盛を決め、グラフの座標軸を作ります。」
グラフ用紙に横軸をx、縦軸をyとして線を引き、縦軸と横軸に目盛を取ります。縦軸は上に行くほど大きい値、横軸は右に行くほど大きい値にします。対のデータのうち、一方が原因系(x)ならば横軸に、他方が結果系(y)ならば縦軸に座標軸を決めます。 - 「データをプロット」
データをグラフ上にプロットします。横軸にxの測定値を、縦軸にyの測定値をとり、交わる位置に点を打ちます。同じデータがあって点が重なるときは、先の点のすぐそばに後の点を並べて打つなど工夫しましょう。 - 「必要事項を記入」
データ期間、目的、データ数(n)、目的、製品名、工程名、作成部署、作成者、作成年月日などを記入します。
散布図を見るときの注意事項
- 「異常点はないか?」
多くの点のちらばりから離れた点が現れる場合があります。この時、まずこの対のデータの履歴を調べ「何か明確な原因があるか?」を調べます。例えば、測定誤差とか、不良品の混入、原材料の変更による変化、設備故障などなど4Mに変化があったのではないか?の検討を行いましょう。その原因が判明すれば、その点に異常原因を明記し、散布図の関係はその点を除外して判断するようにしましょう。 - 「層別の必要性はないか?」
例えば、全体としてみると相関がありそうだが、層別してみると相関がない場合や、逆に全体としてみると相関がなさそうだが、層別してみると相関がある場合などがあります。ですので、対のデータの履歴を調べ、層別因子がある場合は,点の印を変えたり,色分けするなどして判別しやすく工夫するようにしましょう。
まとめ
散布図には、2項目の分布、相関関係を簡単に把握できるという特長があります。データを集めてもその関係性や相関関係が見えないと解析できません。
多くの企業がデータ収集を行っても、結果が出る改善まで繋がらないのは、効果的な解析ができてないからです。今回の散布図の事例があなたの事業の役に立てれば幸いです。