Instant Engineering

エンジニアの仕事効率を上げる知識をシェアするWeb記事/機械設計/TPS/QC品質管理

ヒストグラムとは?作り方と見方をわかりやすく解説

ヒストグラムとは?作り方と見方をわかりやすく解説

製造現場で「工程のばらつきを見える化したい」と思ったことはありませんか。

数値データをただ眺めていても、分布の全体像はなかなかつかめません。

そこで威力を発揮するのが、ヒストグラムです。

ヒストグラムは、データを一定の区間(階級)に分け、各区間に含まれる個数を棒の高さで表したグラフです。
QC7つ道具の1つとして、品質管理の現場で広く使われています。

しかし、「棒グラフとの違いがわからない」「階級数はどう決めればいいのか」といった疑問を持つ方も多いのではないでしょうか。

本記事では、ヒストグラムの基本から作り方・見方・エクセルでの作成手順・工程能力指数との関係までを徹底解説します。

 

 

1. ヒストグラムとは

ヒストグラムの基本形

ヒストグラムとは、連続的な数値データを一定の区間(階級)ごとに区切り、各階級に含まれるデータの個数(度数)を棒の高さで表したグラフです。

英語では「histogram」と表記します。
イギリスの統計学者カール・ピアソンが1895年に考案したとされています。
語源については「歴史的な(historical)図表(diagram)」という説が有力ですが、諸説あります。

日本では、JIS Z 8101-1(統計的品質管理用語)においてヒストグラムの定義が規定されています。
製造業の品質管理部門で使われる場合は、このJIS規格に準拠した作成方法が求められます。

 

ヒストグラムの最大の特徴は、データの分布の形状を一目で把握できる点にあります。

平均値や標準偏差といった数値だけでは見えない「データの散らばり方」や「偏り」を、視覚的にとらえることができます。

 

たとえば、ある工程で加工した部品100個の外径を測定したとします。

平均値が 25.00 mm であったとしても、データが 24.90~25.10 mm に集中しているのか、24.50~25.50 mm に広く散らばっているのかは、平均値だけでは判断できません。

ヒストグラムを描けば、この「散らばりの姿」が棒の高さと幅のパターンとして一瞬で見えてきます。
これこそが、ヒストグラムが品質管理の基本ツールとして100年以上使われ続けている理由です。

 

ヒストグラムを正しく読むために知っておきたいのが「3シグマルール」です。

正規分布に従うデータでは、平均値から標準偏差1つ分(±1σ)の範囲に全データの約 68.3% が含まれます。
±2σ の範囲には約 95.4%、±3σ の範囲には約 99.7% が含まれます。

つまり、ヒストグラムの形状が正規分布に近ければ、±3σ の外にはデータがほとんど存在しないということです。
この性質は、後述する工程能力指数(Cp、Cpk)の計算において重要な前提となります。

 

ヒストグラムの基本用語

ヒストグラムを正しく理解するために、以下の用語を押さえておきましょう。

  • 階級(クラス):データを区切る区間のことです。たとえば「10.0~10.5 mm」のように一定幅で設定します。全階級の幅を等しくするのが原則です。
  • 階級幅:各階級の範囲の大きさです。上の例では 0.5 mm が階級幅になります。階級幅が広すぎるとデータの特徴が潰れ、狭すぎると棒がバラバラになります。
  • 度数:各階級に含まれるデータの個数です。ヒストグラムでは、この度数が棒の高さとして描画されます。
  • 度数分布表:階級ごとの度数を一覧表にまとめたものです。ヒストグラムを描く前に必ず作成します。
  • 相対度数:各階級の度数を全データ数で割った値です。全体に対する割合を示すため、データ数が異なるグループ同士の比較に有効です。
  • 累積度数:最小の階級から順に度数を足し合わせた値です。「ある値以下のデータが全体の何%を占めるか」を知りたいときに使います。

 

相対度数は次の式で計算します。

 f_i = \dfrac{n_i}{N}

ここで  n_i は各階級の度数、 N は全データ数です。
すべての階級の相対度数を合計すると、必ず 1(= 100%)になります。

 

ヒストグラムのメリットとデメリット

ヒストグラムには多くのメリットがありますが、万能なツールではありません。
メリットとデメリットを理解したうえで、適切に活用することが大切です。

 

ヒストグラムのメリット

  • データの分布を直感的に把握できる。数表や平均値だけでは見えない全体像が一目でわかります。
  • 異常やばらつきの問題を素早く発見できる。二山型や離れ小島型などの異常パターンは、ヒストグラムで初めて見えることが多いです。
  • 作成に特別なソフトウェアが不要。エクセルや手書きでも作成でき、誰でもすぐに使い始められます。
  • 工程能力指数(Cp、Cpk)との組み合わせで、定量的な品質評価に発展させられます。

 

ヒストグラムのデメリット

  • 時間的な変化を表現できない。データの時系列変動を見たい場合は管理図が適しています。
  • 階級数や階級幅の設定によって見え方が大きく変わる。不適切な設定をすると、データの真の姿を見誤る恐れがあります。
  • データ数が少ないと信頼性が低い。最低30個以上、理想的には50~100個のデータが必要です。
  • 2つの変数間の関係は表現できない。変数間の相関を調べたい場合は散布図を使います。

 

このように、ヒストグラムは「分布の全体像を把握する」という目的に特化したツールです。
目的に応じて管理図や散布図などの他のQCツールと使い分けることが、効果的な品質管理の鍵になります。

 

QC7つ道具としてのヒストグラム

ヒストグラムは、QC7つ道具の1つに数えられています。

QC7つ道具とは、品質管理活動で使われる7種類の基本ツール群です。
パレート図、特性要因図、チェックシート、管理図、散布図、層別、そしてヒストグラムで構成されます。

これらのツールは単独でも有効ですが、組み合わせることで強力な分析が可能になります。

たとえば、ヒストグラムで分布の異常を発見し、特性要因図で原因を追求し、管理図で工程の安定性を監視するといった流れが代表的です。
問題の発見から原因の特定、対策の効果確認まで、一貫した品質管理サイクルを回すことができます。

 

QC7つ道具の中でも、ヒストグラムは「工程の現状を把握する」という最初のステップで使われることが多いツールです。

まずヒストグラムで全体像を掴み、そこから詳細な分析に進むという流れを意識しておくと、品質管理活動がスムーズに進みます。

 

ヒストグラムの活用場面

ヒストグラムは、製造業の品質管理をはじめ、さまざまな場面で活用されています。

工程のばらつきを把握したいとき、規格値に対する余裕を確認したいとき、異常値の有無をチェックしたいときに威力を発揮します。

具体的には、以下のような場面で使われます。

  • 新しい工程を立ち上げたとき、初期のばらつきを把握するため
  • 不良品が増加した際、分布の偏りや異常パターンを確認するため
  • 工程改善の前後で、ばらつきがどう変化したかを比較するため
  • 受入検査で、納入品のロットがどのような分布を持つかを確認するため
  • 工程能力指数(Cp、Cpk)を計算する前に、正規分布に近いかを判断するため

 

また、ヒストグラムは製造業だけでなく、幅広い分野で活用されています。

医療分野では患者の血圧値や検査値の分布を確認するために、金融分野では株価の日次リターンの分布を分析するために使われます。
教育分野でもテストの得点分布を確認するためにヒストグラムが用いられています。

このように、データの分布を把握したいあらゆる場面でヒストグラムは活躍します。
とりわけ製造業では、品質管理の「入口」として欠かせないツールです。

 

たとえば、射出成形の工程で不良率が急に上がったとします。
このとき、まず製品寸法のヒストグラムを作成して分布を確認します。

もし分布が二山型を示していれば、「2つの異なる条件のデータが混在している」と推測できます。
金型のキャビティ別にデータを分けてみれば、どちらのキャビティに問題があるかが一目瞭然です。

このように、ヒストグラムは問題の「あたり」をつけるための強力な初動ツールとなります。

 

関連記事

instant.engineer

 

2. ヒストグラムと棒グラフの違い

ヒストグラムと棒グラフの違い

ヒストグラムと棒グラフは見た目がよく似ていますが、本質的にまったく異なるグラフです。
この違いを正しく理解していないと、データの解釈を誤る可能性があります。

ここでは両者の違いを5つの観点から明確に整理します。

 

比較項目 ヒストグラム 棒グラフ
扱うデータ 連続データ(長さ、重さ、時間など) 離散データ(カテゴリ、名称など)
横軸の意味 数値の範囲(階級) 項目名(カテゴリ)
棒の間隔 隙間なし(連続性を表現) 隙間あり(独立した項目)
棒の並び順 数値の大きさ順(固定) 任意の順序(大きい順など)
面積の意味 度数に比例(面積が重要) 高さだけが意味を持つ

 

扱うデータの種類が根本的に異なる

最も根本的な違いは、扱うデータの種類です。

ヒストグラムは連続データ(量的データ)を対象とします。
部品の寸法、製品の重量、加工時間、引張強度など、測定値として得られる連続的な数値が該当します。

一方、棒グラフは離散データ(質的データ・カテゴリデータ)を対象とします。
製品Aと製品Bの売上比較、各工場の不良率比較、月別の生産台数といった「項目ごとの大きさの比較」に使います。

 

この違いを簡単に覚えるコツがあります。

横軸に並ぶものが「数直線のような連続した数値」であればヒストグラム、「名前やカテゴリ」であれば棒グラフです。
たとえば「24.0~24.5 mm」のような数値範囲が並ぶのはヒストグラム、「A工場・B工場・C工場」のような名前が並ぶのは棒グラフです。

 

棒の間隔が持つ意味

最も視覚的にわかりやすい違いは「棒の間隔」です。

ヒストグラムは連続データを扱うため、棒と棒の間に隙間がありません
隙間がないことで「データが途切れなく連続している」ことを視覚的に表現しています。

もし隣り合う階級の間に隙間が空いていたら、「その範囲にはデータが存在しない」と誤解されてしまいます。
ヒストグラムで棒の隙間をゼロにすることは、単なるデザインの問題ではなく、データの連続性を正しく表現するための必須条件です。

 

一方、棒グラフはカテゴリごとの大きさを比較するためのグラフです。
棒の間に隙間を設け、「各項目が独立している」ことを示しています。

Excelでヒストグラムを作成すると、初期設定で棒の間に隙間が入ることがあります。
その場合は「系列の書式設定」から「要素の間隔」を0%に設定して、隙間をなくす必要があります。

 

横軸の順序と面積の意味

ヒストグラムでは横軸の順序を変更できません。
数値の大きさ順に並んでいることに意味があり、この順序を変えると分布の形状が崩れてしまいます。

棒グラフでは、大きい順に並べ替えたり、時系列で並べたりと、目的に応じて順序を自由に変更できます。
たとえばパレート図では、頻度の大きい順に並べることで「重点項目」を一目で把握できるようにしています。

 

もう1つの重要な違いは「面積」の扱いです。

ヒストグラムでは棒の面積が度数に比例します。
すべての階級幅が等しい場合は高さだけで判断できますが、階級幅が不等間隔の場合は面積で判断する必要があります。

棒グラフでは棒の高さだけが意味を持ち、幅には情報がありません。
この違いは、データを正確に読み取るうえで非常に重要です。

 

実務で混同しやすいケース

実務で最も混同しやすいのは、「月別の不良品数」をグラフにする場面です。

1月・2月・3月と月ごとの不良品数を比較するだけであれば、これは棒グラフです。
各月は独立したカテゴリであり、棒の間に隙間を設けるのが正しい表現です。

一方、不良品の寸法偏差を「0.00~0.05 mm」「0.05~0.10 mm」のような連続区間で集計して本数を数えた場合は、ヒストグラムが適切です。

「何を集計しているか」ではなく「横軸が何を表しているか」で判断するのがポイントです。

 

もう1つ注意すべき点があります。
棒グラフの一種であるパレート図とヒストグラムを混同するケースです。

パレート図は、不良項目などのカテゴリを頻度の大きい順に並べた棒グラフに、累積比率の折れ線を重ねたものです。
横軸はカテゴリ名であり、データは離散的です。

ヒストグラムは数値データの連続的な分布を表すグラフです。
パレート図は「どの項目が多いか」を見るツール、ヒストグラムは「データがどう散らばっているか」を見るツールと覚えておけば迷いません。

 

3. ヒストグラムの作り方

ヒストグラム作成の3ステップ

ヒストグラムの作成は、大きく3つのステップで進めます。
「データ収集」「階級の設定」「度数の集計」の順番です。

ここでは、部品の外径寸法50個分を測定したデータを例に、具体的な手順を解説します。

 

ステップ1:データを収集する

まず、分析対象のデータを集めます。

ヒストグラムを作成するうえで、データ数は最低でも30個以上が望ましいとされています。
データ数が少なすぎると分布の形状が安定せず、信頼性のある判断ができません。

JIS Z 9041-1 では、工程能力調査に用いるデータ数として50~100個を推奨しています。
工程能力を精密に評価したい場合は、100個以上のデータを収集するのが理想的です。

 

データ収集時に注意すべきポイントがいくつかあります。

  • 同一条件のデータを集める:機械、作業者、ロット、時間帯などの条件を揃えます。異なる条件のデータが混ざると、二山型など本来の分布とは異なる形状が現れてしまいます。
  • 時系列を記録する:データを収集した順番を記録しておくと、後から管理図を作成して時間的な変化も確認できます。
  • 測定器の精度を確認する:ヒストグラムの階級幅よりも測定器の分解能が粗いと、歯抜け型が現れる原因になります。

 

ここでは、以下の条件で50個のデータが得られたとします。

測定対象:外径寸法、最大値:26.8 mm、最小値:23.5 mm、範囲(レンジ):3.3 mm

 

ステップ2:階級を設定する

次に、データを区切る階級を設定します。

階級数の決め方にはいくつかの方法がありますが、ここではスタージェスの公式を使います(詳細は次のセクションで解説します)。

データ数 n = 50 の場合、スタージェスの公式から階級数は約7になります。

 

階級幅は、次の式で求めます。

 h = \dfrac{x_{\max} - x_{\min}}{k}

ここで  x_{\max} は最大値、 x_{\min} は最小値、 k は階級数です。

今回の例では次のように計算できます。

 h = \dfrac{26.8 - 23.5}{7} \approx 0.47

実務ではキリの良い数値に丸めるのが一般的です。
この場合は階級幅を 0.5 mm とします。

 

階級の始点は、最小値よりもわずかに小さい値を設定するのがコツです。
今回は最小値が 23.5 mm なので、始点を 23.5 mm とします。

こうすることで、境界値にちょうど一致するデータの扱いに迷わなくなります。
JIS では「下限値以上、上限値未満」というルールで各階級にデータを振り分けるのが標準です。

 

ステップ3:度数を集計して度数分布表を作る

各階級にデータが何個入るかを数え、度数分布表を作成します。

 

階級 (mm) 階級の代表値 度数 相対度数 累積相対度数
23.5~24.0 23.75 3 0.06 0.06
24.0~24.5 24.25 5 0.10 0.16
24.5~25.0 24.75 12 0.24 0.40
25.0~25.5 25.25 14 0.28 0.68
25.5~26.0 25.75 9 0.18 0.86
26.0~26.5 26.25 5 0.10 0.96
26.5~27.0 26.75 2 0.04 1.00

 

階級の代表値は、各階級の中央の値です。
次の式で計算します。

 m_i = \dfrac{\text{下限値} + \text{上限値}}{2}

たとえば「23.5~24.0」の代表値は (23.5 + 24.0) / 2 = 23.75 です。

 

累積相対度数を見ると、25.5 mm 以下のデータが全体の 68% を占めていることがわかります。
このように、度数分布表からはヒストグラムでは見えにくい累積的な情報も読み取れます。

 

度数分布表が完成したら、横軸に階級、縦軸に度数をとってヒストグラムを描きます。
各階級の棒を隙間なく並べ、棒の高さが度数を表すようにします。

この例では、25.0~25.5 mm の階級が最も度数が高く(14個)、中心付近にデータが集中した正規分布に近い形状が読み取れます。

 

よくある失敗と対処法

ヒストグラムの作成時によくある失敗をいくつか紹介します。

1つ目は「データ数が少なすぎる」ケースです。
10~20個程度のデータでヒストグラムを作ると、たまたまの偏りが「分布の特徴」に見えてしまいます。
最低30個、できれば50個以上のデータを集めてから作成しましょう。

2つ目は「異なる条件のデータを混ぜてしまう」ケースです。
午前と午後、A号機とB号機など、条件が異なるデータを一緒にすると、本来は一般型の工程でも二山型に見えてしまいます。
データ収集時に条件を記録しておけば、後から層別して正しい分布を確認できます。

3つ目は「外れ値を確認せずにそのまま描く」ケースです。
入力ミスや測定ミスによる外れ値が1つ混ざるだけで、階級の範囲が大きく広がり、分布の形状が潰れてしまいます。
作成前にデータの最大値・最小値を確認し、明らかな異常値がないかチェックする習慣をつけましょう。

 

4. ヒストグラムの階級数と階級幅の決め方

データ数と推奨階級数の関係

ヒストグラムの品質を左右する最も重要な要素が階級数です。

階級数が少なすぎるとデータの特徴が潰れてしまい、多すぎると棒がバラバラになって分布の傾向が見えなくなります。
適切な階級数を選ぶことが、意味のあるヒストグラムを作るための鍵です。

ここでは、代表的な2つの決定方法と、実務での使い分けを解説します。

 

スタージェスの公式

最も広く使われている方法がスタージェスの公式です。

 k = 1 + 3.322 \log_{10} n

ここで  k は階級数、 n はデータ数です。

この公式は、データが正規分布に従うという仮定のもと、最適な階級数を導出したものです。
製造工程で得られるデータの多くは正規分布に近い形状を示すため、品質管理の現場ではまずこの公式を使うのが定石です。

 

いくつかのデータ数に対する推奨階級数を示します。

データ数 n スタージェスの公式による計算値 推奨階級数(四捨五入)
30 5.9 6
50 6.6 7
100 7.6 8
200 8.6 9
500 10.0 10

 

この表からわかるように、データ数が10倍に増えても階級数はせいぜい2~3しか増えません。
対数関数の特性により、階級数の増加は緩やかです。

この「緩やかさ」がスタージェスの公式の強みであり、データ数が多くても階級が細かくなりすぎないため、安定した分布形状が得られます。

 

平方根選択法

もう1つの代表的な方法が平方根選択法です。

 k = \sqrt{n}

スタージェスの公式に比べて計算が簡単なため、手計算で素早く見積もりたいときに便利です。
電卓さえあればすぐに求められるのが最大のメリットです。

ただし、データ数が大きくなると階級数も急激に増えてしまう傾向があります。
たとえば n = 500 の場合、平方根選択法では約22階級となり、棒が細かくなりすぎて分布の傾向が読み取りにくくなることがあります。

一方、データ数が少ない場合(n = 30~50 程度)では、スタージェスの公式とほぼ同じ結果が得られるため、どちらを使っても問題ありません。

 

フリードマン=ダイアコニスの法則

データが正規分布に従わない場合に有効なのが、フリードマン=ダイアコニスの法則です。
この方法では、階級数ではなく階級幅を直接求めます。

 h = 2 \times IQR \times n^{-1/3}

ここで IQR は四分位範囲(第3四分位数 − 第1四分位数)、n はデータ数です。

 

四分位範囲は外れ値の影響を受けにくいため、データに極端な値が含まれている場合でも安定した階級幅が得られます。

スタージェスの公式は正規分布を前提としているため、右すそ引き型や離れ小島型のデータでは最適な階級幅にならないことがあります。
そのような場合は、フリードマン=ダイアコニスの法則を試してみると良い結果が得られることが多いです。

エクセルでは QUARTILE 関数を使って IQR を計算し、上記の式に代入すれば簡単に求められます。

 

スタージェスの公式と平方根選択法の比較

比較項目 スタージェスの公式 平方根選択法
計算式  k = 1 + 3.322 \log_{10} n  k = \sqrt{n}
前提条件 正規分布を仮定 特になし
増加の仕方 データ数が増えても緩やかに増加 データ数に応じて大きく増加
適用範囲 30~500個に最適 30~100個に有効
実務での位置づけ 品質管理の標準手法 簡易的な見積もり

 

実務での階級数の決め方

実務では、以下の手順で階級数を決めるのが効率的です。

まず、スタージェスの公式で階級数を算出し、その値でヒストグラムを描いてみます。

もし分布の特徴がうまく表現されない場合は、階級数を1~2増減させて微調整します。
階級数を増やすと細かい特徴が見え、減らすと大まかな傾向が把握しやすくなります。

 

一般的な目安として、5個未満では少なすぎ、20個以上では多すぎると考えてよいでしょう。
最終的には「分布の形状が最も読み取りやすい階級数」を選ぶことが大切です。

なお、階級幅は測定値の最小目盛りの整数倍にすると、実務的に扱いやすくなります。
たとえば 0.01 mm 単位で測定しているデータなら、階級幅を 0.05 mm や 0.10 mm のようなキリの良い値に設定します。

また、複数のヒストグラムを比較する場合は、すべてのヒストグラムで階級幅と階級の始点を統一することが重要です。
階級設定が異なるヒストグラム同士を比較すると、分布の形状の違いが階級設定の違いなのか、実際のデータの違いなのかが判別できなくなります。

 

5. ヒストグラムから読み取る統計量

ヒストグラムと統計量の関係

ヒストグラムの形状からは、さまざまな統計量を読み取ることができます。
ここでは、品質管理で特に重要な3つの統計量と、その読み方のポイントを解説します。

 

平均値(中心の位置)

平均値は、データ全体の「中心」を表す代表的な指標です。

 \bar{x} = \dfrac{1}{n} \sum_{i=1}^{n} x_i

ヒストグラム上では、分布の山のピーク付近が平均値に相当します。
正規分布に近い形状であれば、最も高い棒の位置がほぼ平均値です。

 

品質管理において、平均値は「工程の狙い値」と比較して評価します。

たとえば、外径の規格が 25.00 ± 0.50 mm の場合、規格中心は 25.00 mm です。
ヒストグラムのピークが 25.00 mm 付近にあれば、工程の狙いは適切といえます。

もしピークが 24.80 mm や 25.20 mm にずれていれば、工程全体が一方向に偏っていることを意味します。
この場合は、機械のセッティングや治具の位置合わせを見直す必要があります。

 

標準偏差(ばらつきの大きさ)

標準偏差は、データが平均値からどの程度散らばっているかを示す指標です。

 s = \sqrt{\dfrac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2}

ヒストグラム上では、標準偏差が小さいほど分布が狭く尖った形になり、大きいほど広く平たい形になります。

 

品質管理では、平均値のずれとばらつきの大きさを分けて考えることが重要です。

平均値が規格中心にあっても、ばらつきが大きければ規格外れが発生します。
逆に、ばらつきが小さくても平均値がずれていれば、やはり不良品が出てしまいます。

ヒストグラムを使えば、「中心のずれ」と「ばらつきの広がり」の両方を同時に視覚的に確認できます。
この「同時に見える」という点が、ヒストグラムの最大の強みです。

 

標準偏差とヒストグラムの幅の関係を、もう少し具体的に説明します。

前述の3シグマルールにより、正規分布に近い分布であれば、ヒストグラムの山の裾野は平均値から約 ±3σ の範囲に収まります。

つまり、ヒストグラムの横幅(最小値から最大値までの範囲)をおおよそ 6 で割れば、標準偏差の概算値を得ることができます。
この簡易推定は「レンジ法」と呼ばれ、現場での素早い判断に役立ちます。

 

変動係数(相対的なばらつき)

変動係数(CV: Coefficient of Variation)は、標準偏差を平均値で割って百分率で表した指標です。

 CV = \dfrac{s}{\bar{x}} \times 100\ (\%)

変動係数は、単位や平均値の大きさが異なるデータ同士のばらつきを比較したいときに役立ちます。

たとえば、外径 25 mm の部品と外径 250 mm の部品では、同じ標準偏差 0.1 mm でもばらつきの「深刻さ」はまったく異なります。

前者の CV は 0.4%、後者の CV は 0.04% です。
変動係数を使えば、前者の方が相対的に10倍ばらついていることが一目でわかります。

 

歪度と尖度(分布の形状を数値化する)

ヒストグラムの形状をさらに定量的に評価するための指標として、歪度(わいど)と尖度(せんど)があります。

歪度は、分布の左右の非対称性を表す指標です。

 \text{歪度} = \dfrac{1}{n} \sum_{i=1}^{n} \left(\dfrac{x_i - \bar{x}}{s}\right)^3

歪度が 0 に近ければ左右対称(一般型)、正の値であれば右すそ引き型、負の値であれば左すそ引き型の傾向があります。

 

尖度は、分布の「尖り具合」を表す指標です。

 \text{尖度} = \dfrac{1}{n} \sum_{i=1}^{n} \left(\dfrac{x_i - \bar{x}}{s}\right)^4 - 3

正規分布の尖度は 0 です。
正の値であれば正規分布より尖った分布(裾が重い)、負の値であれば正規分布より平たい分布を意味します。

 

歪度と尖度は、ヒストグラムの「見た目」を数値で裏付けるための補助指標です。
特に、データが正規分布に従っているかどうかを定量的に判断する際に役立ちます。

エクセルでは SKEW 関数(歪度)と KURT 関数(尖度)で簡単に計算できます。

 

品質管理における変動係数の一般的な判定基準を示します。

CV の範囲 判定 アクション
5% 以下 優秀 現状維持。安定した工程です。
5~10% 良好 問題なし。ただし改善の余地はあります。
10~20% 要注意 ばらつきの原因を調査し、改善を検討します。
20% 以上 要改善 工程に大きな問題がある可能性があります。

 

ただし、この判定基準はあくまで一般的な目安です。
製品の要求精度や業界の基準によって、適切な CV の範囲は異なります。

 

実例:ヒストグラムから統計量を読み取る

ステップ3で作成した度数分布表のデータを使って、実際に統計量を計算してみましょう。

50個の外径データから、平均値 = 25.13 mm、標準偏差 = 0.78 mm が得られたとします。

変動係数を計算すると、次のようになります。

 CV = \dfrac{0.78}{25.13} \times 100 \approx 3.1\ (\%)

CV = 3.1% ですので、先ほどの判定基準では「優秀」に該当します。
ばらつきは十分に小さく、工程は安定していると判断できます。

 

ヒストグラム上でこのデータを確認すると、分布の中心が 25.13 mm 付近にあり、ほぼ左右対称の一般型を示しています。

±1σ(24.35~25.91 mm)の範囲に約 68% のデータが含まれ、±2σ(23.57~26.69 mm)の範囲にほぼ全データが収まっていることが確認できます。

このように、ヒストグラムの形状と統計量を組み合わせることで、工程の状態をより正確に評価できます。
数値だけで判断するのではなく、必ずヒストグラムで「目で見て」確認することが、品質管理の鉄則です。

 

6. ヒストグラムの6つの型と見方

ヒストグラムの6つの型

ヒストグラムを描くと、データの分布にはいくつかの典型的なパターン(型)が現れます。
各型が何を意味しているのかを知っておくことで、工程の問題をいち早く発見できます。

ここでは、代表的な6つの型とそれぞれの原因・対処法を解説します。

 

一般型(正規分布型)

中央にピークがあり、左右対称に裾野が広がる形です。
正規分布に近い、最も理想的な分布パターンです。

工程が安定しており、ばらつきが偶然誤差のみで構成されていることを示しています。
この型が確認できれば、工程能力指数(Cp、Cpk)による定量的な評価に進むことができます。

 

一般型が得られた場合のチェックポイントは2つあります。

1つ目は、分布の中心が規格の中心と一致しているかどうかです。
ずれている場合は、Cpk の値が Cp より低くなり、片側の規格に余裕がなくなります。

2つ目は、分布の裾野が規格限界の内側に十分収まっているかどうかです。
裾野が規格限界に近い場合は、ばらつきの低減が必要です。

 

二山型(双峰型)

ピークが2つある分布です。
異なる条件で生産されたデータが混ざっている可能性を示唆しています。

たとえば、2台の機械で加工した部品を混合してヒストグラムを描くと、それぞれの機械の平均値付近にピークが現れます。
あるいは、昼勤と夜勤で作業者が異なる場合にも、この型が現れることがあります。

 

二山型が現れた場合は、層別(データをグループごとに分割して分析する手法)を行うべきです。

機械別・作業者別・ロット別・時間帯別などでデータを分け、それぞれのヒストグラムを作成して個別に評価します。
層別後に各グループが一般型を示せば、混合が原因であったことが確認できます。

このとき、それぞれのグループの平均値を揃えることが改善策の方向性になります。

 

離れ小島型

メインの分布から離れた位置に、小さな山が孤立して存在する形です。

測定ミス、異なるロットの混入、あるいは工程で一時的な異常が発生した可能性を示しています。
材料の取り違え、治具の緩み、温度条件の急変なども原因として考えられます。

 

離れ小島型が確認されたら、まず該当するデータを特定し、いつ・どの条件で発生したかを調査します。

明らかな異常値であれば除外したうえで、残りのデータであらためてヒストグラムを作成します。
ただし、異常値を「都合が悪いから」という理由で安易に除外してはいけません。

除外する場合は、その根拠(測定ミスの記録、ロット番号の違いなど)を必ず明記します。

 

歯抜け型(くし歯型)

棒の高さが交互に高低を繰り返す、櫛の歯のような形です。

この型は、階級幅の設定が不適切である場合によく現れます。
測定器の分解能に対して階級幅が細かすぎるケースが典型的です。

たとえば、デジタルノギスの表示が 0.01 mm 刻みなのに、階級幅を 0.01 mm に設定すると、丸めの影響で偶数階級と奇数階級の度数に偏りが生じます。

 

歯抜け型が現れたら、まず階級幅を広げてみましょう。
測定器の分解能の 5~10 倍を階級幅の目安にするとうまくいくことが多いです。

それでも改善しない場合は、データの丸め処理や測定方法に問題がないかを確認します。

 

なお、左すそ引き型(右偏り型)も存在します。
右側にピークがあり左方向に長い裾野を持つ形で、右すそ引き型とは鏡像の関係にあります。
加工硬度の上限値付近に集中するデータなどで見られることがあります。

 

右すそ引き型(左偏り型)

左側にピークがあり、右方向に長い裾野を持つ形です。

寿命データ、故障時間、加工時間、表面粗さなど、理論上の下限値(0 や正の最小値)が存在するデータでよく見られます。
これらのデータは0未満にはならないため、分布が非対称になります。

 

この型が現れた場合、データは正規分布に従っていません。
対数正規分布やワイブル分布など、適切な分布モデルを選択する必要があります。

正規分布を前提とした Cp や Cpk をそのまま計算すると、工程能力を過大評価してしまうリスクがあります。
非正規データに対しては、データを対数変換してから分析するなどの工夫が必要です。

 

絶壁型(切り落とし型)

分布の片側が急激に切り落とされたような形です。

これは、規格外のデータが選別・除去されている場合に現れます。
全数検査で規格外品を取り除いた後のデータでよく見られるパターンです。

 

絶壁型のヒストグラムは、見かけ上は規格内に収まっていても、工程自体のばらつきが大きいことを示唆しています。

選別検査に依存している状態は、不良品の流出リスクが高く、コストもかかります。
選別に頼るのではなく、工程そのものの改善(ばらつきの低減や平均値の調整)が根本的な解決策です。

もし絶壁型が現れたら、検査前のデータ(選別前の全データ)を使ってヒストグラムを作り直し、工程本来のばらつきを評価しましょう。

 

ヒストグラムの型を見分けるポイント

6つの型を紹介しましたが、実際のデータでは教科書どおりの形にならないこともあります。
判断に迷ったときは、次のポイントを意識してみてください。

まず、ピークの数に着目します。
ピークが1つなら一般型・右すそ引き型・絶壁型のいずれか、2つなら二山型、メインの山と離れた小さい山があれば離れ小島型です。

次に、左右の対称性を確認します。
左右対称であれば一般型、非対称であれば右すそ引き型(または左すそ引き型)や絶壁型の可能性があります。

最後に、棒の高さの規則性を見ます。
棒の高さが交互に上下していれば歯抜け型です。

 

型の判定は「正解を当てる」ことが目的ではありません。
ヒストグラムの形状から「工程に何が起きているか」を推理し、次のアクション(層別、階級幅の変更、測定方法の見直しなど)につなげることが重要です。

 

関連記事

instant.engineer

 

7. ヒストグラムをエクセル(Excel)で作る方法

Excelでのヒストグラム作成フロー

ヒストグラムはエクセル(Excel)を使って簡単に作成できます。
ここでは、3つの作成方法と、よくあるトラブルの対処法を紹介します。

 

方法1:Excel標準グラフ機能

Excel 2016以降では、標準のグラフ機能にヒストグラムが搭載されています。
最も手軽な方法で、データさえあれば数クリックでヒストグラムが完成します。

手順は以下のとおりです。

  • セルにデータを入力し、データ範囲を選択します
  • 「挿入」タブ →「統計グラフの挿入」→「ヒストグラム」を選択します
  • 自動的にヒストグラムが作成されます
  • 横軸をダブルクリックして「軸の書式設定」を開きます
  • 「ビンの幅」または「ビンの数」を指定して階級幅を調整します
  • タイトルや軸ラベルを設定して仕上げます

 

この方法は手軽ですが、いくつかの注意点があります。

まず、Excelが自動設定する階級幅は必ずしも最適ではないため、スタージェスの公式で計算した階級数に合わせて手動で調整することをおすすめします。

また、初期設定では棒の間に隙間が入っていることがあります。
「系列の書式設定」から「要素の間隔」を 0% に設定して、隙間をなくしてください。

 

方法2:分析ツールアドイン

より細かく階級を設定したい場合は、Excelの「分析ツール」アドインを使う方法が有効です。

「データ」タブ →「データ分析」→「ヒストグラム」を選択し、入力範囲とデータ区間(ビン範囲)を指定します。

この方法では、階級の境界値を自分で自由に設定できます。
JIS規格に沿った精密なヒストグラムが作成可能です。

 

「データ分析」メニューが表示されない場合は、アドインを有効にする必要があります。
「ファイル」→「オプション」→「アドイン」→「設定」から「分析ツール」にチェックを入れてください。

 

ヒストグラム作成時のExcel設定のポイント

Excelでヒストグラムを作成する際に、見栄えと正確さの両面で押さえておきたいポイントをまとめます。

  • 棒の隙間をゼロにする:ヒストグラムでは棒同士に隙間があってはいけません。「系列の書式設定」→「要素の間隔」を 0% に設定します。
  • 横軸のラベルを階級境界値にする:Excel標準機能では「24.0-24.5」のような範囲表示になりますが、分析ツールを使えば境界値を自分で指定できます。
  • 縦軸は0から始める:度数の棒の高さを正しく比較するために、縦軸は必ず0から表示します。途中省略は誤解の元です。
  • 規格限界線を追加する:グラフに USL と LSL の縦線を追加すると、分布と規格の関係が一目で把握できます。「挿入」→「図形」→「直線」で追加します。

 

方法3:FREQUENCY関数を使う方法

FREQUENCY関数を使えば、度数分布表を自分で作成し、そこから棒グラフとしてヒストグラムを描くことができます。
この方法は階級の設定を完全にコントロールできるため、JIS規格に厳密に準拠したヒストグラムを作りたいときに最適です。

 

手順を具体的に示します。

まず、A列にデータ(例:50個の外径寸法)を入力します。
次に、C列に階級の上限値(ビン範囲)を入力します。

たとえば、階級幅を 0.5 mm とした場合は「24.0, 24.5, 25.0, 25.5, 26.0, 26.5, 27.0」と入力します。

 

D列に度数を出力します。
D列の出力範囲を選択した状態で、数式バーに次の式を入力します。

 \text{=FREQUENCY(A1:A50, C1:C7)}

入力後、Ctrl + Shift + Enter を同時に押して配列数式として確定します。
Microsoft 365 や Excel 2021 以降では、Enter キーだけで自動的にスピルされます。

 

度数が計算されたら、D列の度数データを選択して棒グラフ(集合縦棒)を挿入します。
横軸のラベルをC列の階級値に変更し、「要素の間隔」を 0% にすれば完成です。

この方法の最大のメリットは、度数分布表が手元に残ることです。
相対度数や累積相対度数も簡単に追加計算できるため、報告書向けの詳細な分析に向いています。

 

3つの方法の使い分け

方法 メリット デメリット おすすめ場面
標準グラフ機能 最速で作成できる 階級設定の自由度が低い 素早く分布を確認したいとき
分析ツール ビン範囲を自由に設定可能 アドインの有効化が必要 JIS準拠の精密なヒストグラム
FREQUENCY関数 度数分布表も同時に得られる 手順がやや多い 報告書用の詳細分析

 

エクセルでヒストグラムを作るときのよくあるトラブルと対処法

Excelでヒストグラムを作成する際に、初心者がよくつまずくポイントとその解決策を紹介します。

 

トラブル1:「データ分析」メニューが見つからない

分析ツールアドインが無効になっている場合、「データ」タブに「データ分析」ボタンが表示されません。

「ファイル」→「オプション」→「アドイン」を開き、下部の「管理」で「Excelアドイン」を選択して「設定」をクリックします。
「分析ツール」にチェックを入れて「OK」を押せば有効化されます。

 

トラブル2:棒の間に隙間ができてしまう

Excel標準のヒストグラムグラフでは、初期設定で棒の間隔が 0% でないことがあります。

棒を右クリック →「データ系列の書式設定」→「系列のオプション」→「要素の間隔」を 0% に変更します。
この設定を忘れると、見た目が棒グラフと同じになってしまいます。

 

トラブル3:階級幅が不適切で分布がわかりにくい

Excelの自動設定では、スタージェスの公式とは異なるアルゴリズムで階級幅が決まります。
その結果、棒が多すぎたり少なすぎたりして分布の形状が読み取りにくくなることがあります。

横軸をダブルクリックして「軸の書式設定」を開き、「ビンの幅」を手動で入力してください。
スタージェスの公式で計算した値(データ50個なら7階級 → ビン幅 = レンジ ÷ 7)を使うのがおすすめです。

 

トラブル4:横軸の表示が範囲ではなく境界値になる

Excel 2016以降の標準ヒストグラムでは、横軸に「\[24.0, 24.5)」のような区間表記が使われることがあります。

見慣れない表記で読みにくい場合は、「軸の書式設定」→「ラベルの形式」で調整するか、FREQUENCY関数を使った方法に切り替えて自分で軸ラベルを設定するのが確実です。

 

Googleスプレッドシートでの作成

Excelが手元にない場合は、Googleスプレッドシートでもヒストグラムを作成できます。

データ範囲を選択して「挿入」→「グラフ」→「グラフの種類」で「ヒストグラム」を選ぶだけです。
「カスタマイズ」タブの「ヒストグラム」セクションでバケットサイズ(階級幅)を設定できます。

ただし、Googleスプレッドシートにはエクセルの「分析ツール」に相当する機能がありません。
度数分布表を同時に作成したい場合は、FREQUENCY関数を使う方法が有効です。

 

8. ヒストグラムと工程能力指数の関係

ヒストグラムと工程能力指数

ヒストグラムで分布の形状を確認したら、次のステップとして工程能力指数を算出するのが一般的な流れです。

工程能力指数とは、「工程のばらつきが規格幅に対してどの程度余裕を持っているか」を数値化した指標です。
代表的な指標として Cp と Cpk の2つがあります。

 

Cp(工程能力指数)

Cp は、工程のばらつきと規格幅の比率を示す指標です。
平均値が規格の中心にあると仮定した場合の「工程の潜在能力」を表します。

 C_p = \dfrac{USL - LSL}{6\sigma}

ここで USL は上側規格限界、LSL は下側規格限界、 \sigma は工程の標準偏差です。

 

Cp の値と工程の状態の関係を示します。

Cp の値 工程の状態 不良率の目安
0.67 未満 能力不足 4.56% 以上
0.67~1.00 やや不足 0.27~4.56%
1.00~1.33 ほぼ十分 0.007~0.27%
1.33~1.67 十分 極めて低い
1.67 以上 過剰品質の可能性 ほぼゼロ

 

Cp = 1.0 の場合、工程のばらつき( 6\sigma)がちょうど規格幅と等しいことを意味します。
一般的な製造業では、Cp ≧ 1.33 以上を合格ラインとしているケースが多いです。

自動車業界などの高い信頼性が求められる分野では、Cp ≧ 1.67 を要求されることもあります。

 

Cpk(片側工程能力指数)

Cpk は、平均値の偏りを考慮した工程能力指数です。
Cp が「ばらつきの大きさ」のみを評価するのに対し、Cpk は「ばらつき+平均値のずれ」の両方を評価します。

 C_{pk} = \min\left(\dfrac{USL - \bar{x}}{3\sigma},\ \dfrac{\bar{x} - LSL}{3\sigma}\right)

この式は、上側と下側それぞれの余裕を計算し、小さい方の値を採用するという考え方です。
つまり、Cpk は「最も厳しい側の余裕」を示しています。

 

Cpk は常に Cp 以下の値になります。

Cp と Cpk が等しければ、平均値が規格の中心にあることを意味します。
両者の差が大きいほど、平均値の偏りが大きいことを示しています。

たとえば、Cp = 1.50 で Cpk = 0.90 であれば、「ばらつき自体は十分に小さいが、平均値のずれによって工程能力が低下している」と判断できます。
この場合、ばらつきの低減ではなく平均値の調整が改善の方向性になります。

 

計算例:Cp と Cpk を求める

先ほどの外径データを使って、実際に工程能力指数を計算してみましょう。

条件は次のとおりです。
規格:25.00 ± 3.00 mm(USL = 28.00 mm、LSL = 22.00 mm)、平均値 = 25.13 mm、標準偏差 = 0.78 mm

 

まず Cp を計算します。

 C_p = \dfrac{28.00 - 22.00}{6 \times 0.78} = \dfrac{6.00}{4.68} \approx 1.28

次に Cpk を計算します。

 C_{pk} = \min\left(\dfrac{28.00 - 25.13}{3 \times 0.78},\ \dfrac{25.13 - 22.00}{3 \times 0.78}\right) = \min(1.23,\ 1.34) = 1.23

Cp = 1.28、Cpk = 1.23 という結果が得られました。

Cp と Cpk の差は 0.05 と小さいため、平均値の偏りはほとんどありません。
ただし、Cp = 1.28 は一般的な合格ライン(1.33)をわずかに下回っています。

この場合は、ばらつきをもう少し低減させること(標準偏差を 0.75 mm 以下にすること)が改善目標になります。

 

工程能力指数の計算は、エクセルでも簡単に実行できます。
AVERAGE 関数と STDEV.S 関数で平均値と標準偏差を求め、上記の式に代入するだけです。

セルに計算式を組んでおけば、新しいデータを入力するたびに Cp と Cpk が自動更新されるため、継続的な工程管理に便利です。

 

Cp と Cpk の使い分け

比較項目 Cp Cpk
評価対象 ばらつきのみ ばらつき+平均値のずれ
平均値の偏り 考慮しない 考慮する
値の関係 常に Cpk 以上 常に Cp 以下
使用場面 工程の潜在能力を評価 工程の実力を評価
改善の方向性 ばらつきの低減が必要 ばらつき低減 or 平均値調整

 

ヒストグラムと工程能力指数の連携

実務では、まずヒストグラムを作成してデータが正規分布に近いことを確認し、そのうえで Cp と Cpk を算出します。

この「正規分布の確認」が非常に重要です。

ヒストグラムが二山型や離れ小島型を示している場合は、データが正規分布に従っていません。
そのまま Cp や Cpk を計算しても、値は信頼できません。

まず層別や異常値の除去を行い、正規分布に近い状態にしてから工程能力を評価します。

 

また、ヒストグラムに規格限界線(USL と LSL)を重ね描きすると、分布と規格の関係を直感的に把握できます。

分布の裾野が規格限界の内側に十分な余裕をもって収まっていれば、工程能力は良好です。
裾野が規格限界に接近または超えていれば、改善が必要です。

 

このように、ヒストグラムと工程能力指数は密接に連携した分析ツールです。
ヒストグラムは「工程の姿を見る目」、工程能力指数は「工程の実力を測る物差し」と考えるとわかりやすいでしょう。

 

関連記事

instant.engineer

 

ヒストグラムに関するよくある質問

Q. ヒストグラムのデータ数は何個必要ですか?

最低でも30個以上が望ましく、JIS Z 9041-1 では工程能力調査に50~100個を推奨しています。
データ数が少ないと分布の形状が安定せず、本来の分布とは異なるパターンが現れることがあります。

 

Q. ヒストグラムの階級数に正解はありますか?

唯一の正解はありません。
スタージェスの公式で算出した値を出発点とし、±1~2の範囲で微調整して「分布の特徴が最も見やすい階級数」を選ぶのが実務的な方法です。

 

Q. エクセルで作ったヒストグラムの棒に隙間ができてしまいます。

棒を右クリックして「データ系列の書式設定」を開き、「要素の間隔」を0%に設定してください。
ヒストグラムでは棒同士に隙間があってはならないため、この設定は必須です。

 

Q. ヒストグラムが正規分布に従わない場合、どうすればよいですか?

まず、異なる条件のデータが混在していないか(層別の必要性)を確認します。
層別しても正規分布にならない場合は、対数正規分布やワイブル分布など他の分布モデルを検討するか、ノンパラメトリックな手法を用います。
工程能力指数を算出する際は、正規分布を前提とした Cp / Cpk ではなく、パーセンタイル法を使うのが適切です。

 

まとめ

本記事では、ヒストグラムの基本から作り方・見方・エクセルでの作成方法・工程能力指数との関係までを解説しました。

 

ヒストグラムは、連続データの分布を視覚化するためのグラフです。
QC7つ道具の1つとして、品質管理の現場で最も頻繁に使われるツールの1つです。

棒グラフとは異なり、棒同士に隙間がなく、データの連続性を表現しています。
扱うデータの種類、横軸の意味、面積の意味など、両者には根本的な違いがあります。

 

作成の手順は「データ収集」「階級設定」「度数集計」の3ステップです。
階級数はスタージェスの公式( k = 1 + 3.322 \log_{10} n)で算出するのが標準的な方法です。

完成したヒストグラムからは、平均値・標準偏差・変動係数といった統計量を読み取り、工程の状態を評価できます。

 

分布の型(一般型、二山型、離れ小島型、歯抜け型、右すそ引き型、絶壁型)を正しく識別することで、工程に潜む問題を早期に発見できます。

特に二山型は層別の必要性を、絶壁型は選別に頼った品質管理の危険性を示唆する重要なシグナルです。

 

ヒストグラムで正規分布を確認した後に工程能力指数(Cp、Cpk)を算出することで、工程の定量的な評価が可能になります。
Cp はばらつきの大きさを、Cpk はばらつきと平均値のずれの両方を評価する指標です。

 

ヒストグラムの作成から工程能力の評価までの流れを整理すると、次のようになります。

  • ステップ1:同一条件のデータを50個以上収集する
  • ステップ2:スタージェスの公式で階級数を決め、度数分布表を作成する
  • ステップ3:ヒストグラムを描き、分布の型を確認する
  • ステップ4:一般型であれば、平均値・標準偏差を計算する
  • ステップ5:工程能力指数(Cp、Cpk)を算出し、規格に対する余裕を定量評価する

 

エクセル(Excel)を使えば、標準グラフ機能・分析ツール・FREQUENCY関数の3通りの方法でヒストグラムを作成できます。
まずは標準グラフ機能で素早く分布を確認し、必要に応じて分析ツールやFREQUENCY関数で精密なヒストグラムに仕上げるのが効率的です。

 

品質管理の基盤となるヒストグラムを正しく活用し、工程改善に役立てていただければ幸いです。

 

関連記事

instant.engineer