Instant Engineering

エンジニアの仕事効率を上げる知識をシェアするWeb記事/QC統計手法/公差設計・解析/TPS

MTBF,MTTR,MTTFとは? 計算式と違いを解説

製造業の現場において、「いつ設備が止まるかわからない」「修理にどれくらい時間がかかるか読めない」という状況は、生産計画を崩壊させる最大のリスクです。

設備の稼働状況を正確に把握し、改善につなげるためには、勘や経験だけではなく、客観的な数値指標が不可欠です。

その代表格が、MTBF(平均故障間隔)、MTTR(平均修復時間)、MTTF(平均故障寿命)の3つの指標です。

これらの指標は、単なるスペック表の数値ではありません。「設備がどれだけ効率的に稼働し(生産性)」、「故障からどれだけ早く復旧できるか(保全性)」、「いつ買い替え時が来るか(資産管理)」を判断するための、極めて重要な経営判断材料となります。

特に近年の製造業では、スマートファクトリー化やIoT導入が進んでいますが、それらの基礎となるのも「信頼性工学」に基づくこれらのデータです。

本記事では、これらの指標の定義や計算方法といった基礎知識から、バスタブ曲線に基づいた保全戦略、直列・並列システムの信頼性計算、そしてTPM(全員参加の生産保全)への応用まで、実務で即戦力となる知識を徹底解説します。

 

 

MTBF(平均故障間隔)とは

MTBF(Mean Time Between Failures)は、信頼性工学やメンテナンスの分野で最も基本かつ重要な指標で、システムや機器が故障してから次に故障するまでの平均的な動作時間を示します。

日本語では「平均故障間隔」と訳されます。

特に製造業やIT業界で重要な役割を果たし、機器の「壊れにくさ」=信頼性を定量的に評価するための基準となります。

MTBFは、ある機械やシステムが修理されてから正常に稼働し、次に故障して停止するまでの平均時間を表しており、この時間が長ければ長いほど、その設備は安定して稼働していることを意味します。

 

MTBFは、次の計算式で求めることができます。

 

 MTBF = \dfrac{総稼働時間}{故障の回数}

 

総稼働時間:機器が正常に稼働している時間の合計(故障停止時間を除く)

故障の回数:指定された期間内に発生した故障の回数

 

具体例:

ある工場で使われる生産機械が毎日24時間稼働しているとします。

この機械が年間に10回の故障を経験し、故障による停止時間の合計が40時間だったと仮定します。この場合、総稼働時間は8,760時間(24時間×365日)から40時間を引いた8,720時間となります。

MTBFは 8,720時間 ÷ 10回 = 872時間 となります。

これは約36日ごとに1回の故障が発生することを意味します。

 

MTBFは修理系(修理しながら長期間使うシステムや機械)で使う指標であり、互いに隣り合う故障期間の動作時間の平均値です。

この数値が大きいほど信頼性の高いシステムであるといえます。

”信頼性”とは、JIS Z 8115によれば「アイテムが与えられた条件で規定の期間中、要求された機能を果たす性質」と定義されています。

 

また、MTBFは故障率λ(件/時間)の逆数で表すことができます。

 

 故障率 λ = \dfrac{1}{MTBF}

 

MTBFを理解するための「バスタブ曲線」と対策

MTBFを正しく活用し、向上させるためには、故障の発生パターンを示す「バスタブ曲線(故障率曲線)」の概念を深く理解しておく必要があります。

機械の故障率は一定ではなく、時間の経過とともに以下の3つの期間を経て変化します。それぞれの期間で取るべき対策が異なります。

 

1. 初期故障期間(Early Failure Period)

稼働開始直後の時期です。設計ミス、製造上の欠陥、あるいは据付時の調整不足などにより、高い確率で故障が発生します。

  • 特徴:時間の経過とともに故障率は下がっていく(DFR:Decreasing Failure Rate)。
  • 必要な対策:
    • バーンイン(エージング):出荷前や本稼働前に一定時間試運転を行い、潜在的な欠陥をあぶり出して除去する。
    • スクリーニング:検査基準を厳しくし、不良品をライン投入前に排除する。
    • 初期流動管理:稼働直後は保全担当者を張り付かせ、不具合に対し即座に設計フィードバックを行う。

 

2. 偶発故障期間(Random Failure Period)

初期不良が取り除かれ、システムが安定して稼働している時期です。故障は突発的・ランダムに発生し、予測が困難です。

  • 特徴:故障率は低く一定である(CFR:Constant Failure Rate)。一般的にMTBFはこの期間の数値を指します。
  • 必要な対策:
    • 冗長化(Redundancy):重要な機能を二重化し、片方が壊れてもシステム全体は止まらないようにする。
    • ポカヨケ:オペレーターの誤操作による突発故障を防ぐ仕組みを入れる。
    • 負荷軽減:定格能力ギリギリではなく、余裕を持った運転条件(ディレーティング)で使用する。

 

3. 摩耗故障期間(Wear-out Failure Period)

長期間の使用により、部品の摩耗、疲労、劣化が進み、再び故障率が上昇する時期です。

  • 特徴:時間の経過とともに故障率が上がる(IFR:Increasing Failure Rate)。
  • 必要な対策:
    • 予防保全(TBM:Time Based Maintenance):MTBFが短くなる前に、一定期間や一定回数で部品を交換する。
    • 予知保全(CBM:Condition Based Maintenance):振動や温度を監視し、寿命が尽きる直前で交換する。
    • オーバーホール・更新:設備自体の寿命と判断し、大規模修繕やリプレースを行う。

 

MTBF(平均故障間隔)活用時の注意点

注意点として、MTBFは過去のデータに基づいて算出されるため、あくまで「統計的な期待値」に過ぎないという点です。

「MTBFが1000時間だから、次は絶対に1000時間動く」という保証ではありません。特にデータ数が少ない場合、異常値(外れ値)の影響を大きく受ける可能性があります。

また、頻繁にメンテナンスが行われるシステムや、使用環境が頻繁に変わるシステムに対しては、単純なMTBFの比較だけでは不十分な場合があります。

MTBFは、機械の稼働を安定させ、ダウンタイムを減らすための最重要指標ですが、これを使用する際には、現場の定性的な情報(「異音がしていた」「オペレーターが変わった」など)も加味して分析することが重要です。

 

MTTR(平均修復時間)とは

MTTR(Mean Time To Repair)は、故障が発生した際に、システムや機器が復旧するまでの平均的な時間を示す指標です。

システムが故障してから、原因を特定し、部品を交換し、調整を行い、完全に修復されて再び正常に稼働するまでの全プロセスにかかる時間を測定し、その平均値を算出します。

 

MTTRは、以下のような状況で使われます。

・機械や設備の故障修理

・ITシステムやネットワークの障害対応

・製品のメンテナンス

MTTRが短いほど、故障や障害からの復旧が迅速に行われ、システムのダウンタイムが短く抑えられることを示します。

つまり、MTTRとは故障したときの修理のしやすさの"整備性(Maintainability)"を表す指標です。

 

MTTRは、次の計算式で求められます。

 

 MTTR = \dfrac{総修理時間}{修理の回数}


総修理時間:設備やシステムが故障してから修復完了までの全修理時間の合計

修理の回数:同じ設備やシステムに対する修理が行われた回数

 

具体例)ある製造工場で使用している機械が、月に5回故障し、それぞれの修理にかかった時間が2時間、3時間、1.5時間、4時間、2.5時間だったとします。

この場合、MTTRは次のように計算されます:

 

 MTTR = \dfrac{2+3+1.5+4+2.5}{5} =  \dfrac{13}{5} = 2.6時間


つまり、この機械が故障した際、平均して2.6時間で修理が完了していることがわかります。

 

MTTRの内訳分解と短縮のポイント

MTTRを単に「修理作業の時間」と捉えていては、劇的な改善は望めません。現場改善の視点では、MTTRはさらに以下の4つのステップに分解して管理すべきです。

  1. 発見時間(Detection Time):故障が発生してから、オペレーターやシステムが異常に気づくまでの時間。
  2. 手配・待機時間(Delay Time):保全部門へ連絡し、担当者が現場に到着し、必要な工具や部品を揃えるまでの時間。
  3. 診断時間(Diagnosis Time):どこが悪いのか原因を特定する時間。※ここが最もスキル差が出やすく、時間がかかる部分です。
  4. 実修理・復旧時間(Repair/Recovery Time):部品交換や調整を行い、再稼働を確認する時間。

【改善のヒント】

  • 発見時間の短縮:アンドン(表示灯)の設置、異常検知センサーの導入。
  • 待機時間の短縮:予備部品(スペアパーツ)の定位置管理、工具のセット化、保全マンの連絡体制整備。
  • 診断時間の短縮:トラブルシューティングマニュアルの作成、過去の故障履歴のデータベース化、ベテラン技能の伝承。
  • 実修理時間の短縮:ユニット交換化(Assy交換)、ボルトレス化などの設備改善(MP設計)。

 

MTTR(平均修復時間)の重要性

1. システムの可用性向上:

MTTRが短いほど、システムが故障から迅速に復旧できることを示します。

これにより、システムの可用性が向上し、業務の中断を最小限に抑えることができます。

製造業では、1分でもダウンタイムが長引けば、生産ロスやコストが積み重なります。

MTTRを短縮することで、故障やトラブルからの復旧が早まり、稼働率を高めることができます。

 

2. メンテナンスの効率化と技能向上:

MTTRを分析することで、修復プロセスのボトルネックや非効率な作業を特定できます。

また、担当者ごとにMTTRを分析することで、「誰が診断に時間がかかっているか」といったスキルマップの作成や教育計画にも活用できます。

 

3. コスト削減(機会損失の最小化):

修理時間が長引くほど、人件費はもちろん、生産できなかったことによる「機会損失(Opportunity Loss)」が膨れ上がります。

MTTRの短縮は、この見えにくい巨大なコストの削減に直接つながります。

 

MTBFとMTTRの関係:稼働率(Availability)

ここまで個別に見てきましたが、経営視点で最も重視すべきは、これらを組み合わせた「稼働率(アベイラビリティ)」です。

稼働率は、システムが利用可能な時間の割合を示し、以下の式で表されます。

 

   稼働率(Availability) = \dfrac{MTBF}{MTBF + MTTR}

 

この式は非常に強力なメッセージを持っています。稼働率を上げる(100%に近づける)ためには、2つのアプローチしかないということです。

  1. MTBFを大きくする(分母と分子を大きくする):故障しない強い設備を作る、予防保全を行う。
  2. MTTRを小さくする(分母を小さくする):故障してもすぐに直せる体制を作る。

どちらのアプローチがコスト対効果が高いかは、設備の特性によります。高価な部品交換が必要でMTBFを延ばすのが難しい場合は、予備品を完璧に揃えてMTTRを極限まで短くする、という戦略も正解の一つです。

 

直列システムと並列システムの信頼性計算

実際の工場では、設備単体ではなく、複数の工程がつながった「ライン」として稼働しています。

ここで重要になるのが、直列(シリーズ)と並列(パラレル)の考え方です。

直列システム(シリーズ)

工程A → 工程B → 工程C と流れる一般的なラインです。どれか一つでも止まれば、ライン全体が止まります。

全体の信頼性(稼働率)は、各装置の信頼性の掛け算になります。

   R_{system} = R_A × R_B × R_C

例えば、稼働率90%(0.9)の装置が3台直列につながっている場合、

   0.9 × 0.9 × 0.9 = 0.729

となり、ライン全体の稼働率は約73%まで低下します。工程が長くなればなるほど、個々のMTBFを高く維持しないと、全体の稼働率は維持できません。

並列システム(パラレル:冗長化)

同じ機能を持つ装置を複数用意し、片方が壊れてももう片方で生産を続けられる状態です。

全体の信頼性は以下の式で計算されます(2台並列の場合)。

   R_{system} = 1 - (1 - R_A) × (1 - R_B)

同じく稼働率90%の装置を2台並列にした場合、

   1 - (1 - 0.9) × (1 - 0.9) = 1 - 0.1 × 0.1 = 1 - 0.01 = 0.99

となり、全体の稼働率は99%へと劇的に向上します。

ボトルネック工程や、絶対に止められない重要工程に対しては、MTBFを上げる努力とともに、設備を並列化(冗長化)してシステム全体の信頼性を担保することが有効です。

 

MTTF(平均故障寿命)とは

MTTF(Mean Time To Failure)は、修理が不可能な製品やシステム(例:単純な部品や消耗品)が故障するまでの平均時間を示す指標です。

「平均故障寿命」と呼ばれ、MTBFと混同されがちですが、決定的な違いは「修理して再利用するかどうか」です。

MTTFは、主に次のような製品や設備に使用されます。

  • 電子部品(抵抗、コンデンサ、トランジスタなど)
  • 一回限りの使用が前提の消耗品(電球、ベアリング、ガスケット、ブレーキパッド)
  • 構造上修理が不可能なユニット

MTTFは、製品が故障するまでの時間の平均を求めるため、次の計算式が使われます。

 

 MTTF = \dfrac{合計稼働時間}{故障した製品の回数}

合計稼働時間:全ての製品が稼働した合計時間

故障した製品の数:故障が発生した製品や部品の数

 

具体例)100個の抵抗器をテストし、それぞれの稼働時間が異なるものの、全体での合計稼働時間が50,000時間だったとします。

そのうち20個が故障した場合、MTTFは次のように計算されます。

 

 MTTF = \dfrac{50,000}{20} = 2,500時間

 

この場合、1つの抵抗器が平均して2,500時間稼働することがわかります。

MTBFとMTTFの使い分けまとめ

指標 日本語訳 対象 概念
MTBF 平均故障間隔 修理可能なシステム
(モーター、ロボット、工作機械)
「直しながら使い続ける」
信頼性の指標
MTTF 平均故障寿命 修理しない部品・消耗品
(電球、ベアリング、ICチップ)
「壊れたら終わりの寿命」
耐久性の指標

 

指標に基づいた保全方式の選定

MTBFとMTTRのデータを蓄積することで、最適な保全方式を選択することができます。

1. MTBFが短く、MTTRも短い場合(よく壊れるが、すぐ直る)
チョコ停などがこれに当たります。設備改善(Kaizen)を行い、MTBFを延ばすことが最優先です。

2. MTBFが短く、MTTRが長い場合(よく壊れるし、直すのに時間がかかる)
最悪の状態です。生産への影響が甚大であるため、予備機の導入(並列化)や、設計自体の見直しが必要です。

3. MTBFが長く、MTTRが短い場合(めったに壊れず、すぐ直る)
理想的な状態です。過剰なメンテナンスコストをかけず、状態監視(CBM)や事後保全(BM)で対応するのも手です。

4. MTBFが長く、MTTRが長い場合(めったに壊れないが、壊れると大ごと)
重要設備に多いパターンです。定期的なオーバーホール(TBM)を計画的に行い、絶対に壊さない管理が求められます。

 

TPMとOEE(設備総合効率)への展開

製造業の現場改善活動であるTPM(Total Productive Maintenance:全員参加の生産保全)において、MTBFとMTTRはOEE(設備総合効率)を算出・改善するための基礎データとなります。

OEEは以下の3つの要素で構成されます。

  1. 時間稼働率(停止ロス):MTBFとMTTRが直接影響するのはここです。
  2. 性能稼働率(速度ロス):チョコ停や速度低下。
  3. 良品率(不良ロス):工程能力(Cp, Cpk)の世界。

MTBFを延ばし、MTTRを短縮することは、OEEの「時間稼働率」を向上させることに他なりません。

単に「故障が減った」と喜ぶだけでなく、「それによってOEEが〇%向上し、生産能力が〇個増えた」と金額換算できるレベルまで落とし込むことで、経営層にも響く改善活動となります。

 

まとめ:データを活用した「予知保全」の時代へ

MTBF、MTTR、MTTFは、工場の健康状態を示すバロメーターであり、これらを正しく計測・分析することが、強い製造現場を作る第一歩です。

そして現在は、IoTやAIを活用したDX(デジタルトランスフォーメーション)の時代です。

これまでは「壊れてからMTBFを計算する(過去の結果)」だけでしたが、これからは振動センサーや電流値を常時監視し、「今の傾向だとあと〇時間で故障する(未来のMTBF予測)」を行う「予知保全」へと進化しつつあります。

基礎となるこれらの指標の意味を深く理解し、最新技術と組み合わせることで、故障ゼロ・不良ゼロの究極のラインを目指していきましょう。