ディスク・ドライブは何年使えるのですか。 短い答えです。
25,000 台以上のディスク ドライブを常時回転させている会社が、なぜその寿命を知らないのでしょうか。 Backblazeは、5年以上にわたって、信頼性の高い無制限のオンライン・バックアップを提供してきました。 過去4年間は、良い統計が取れるだけのドライブがありましたが、私たちが購入したドライブの74%78%は、4年以上生きているのです。 つまり、26% 22%のドライブが最初の4年間で故障しており、最初の4年間のドライブの故障率については詳しい情報がありますが、その先がどうなるかはまだわかっていません。 では、ドライブの寿命はどのくらいなのでしょうか?
Backblazeでのドライブの使われ方
Backblazeでは、データを保存するために多くのハードディスクを使用しています。 45台のドライブが各Backblaze Storage Podに搭載され、Storage Podは当社のデータセンター内のラックに搭載されています。 新しい顧客が契約すると、さらにディスクドライブを購入し、テストし、デプロイします。
デプロイされる前に、各Backblaze Storage Podは、その中のすべてのドライブのテストも含めて、テストされます。 最近、Andyは、このテストに失敗したディスク・ドライブであるStephenについて投稿しました。 Andy の投稿では、Backblaze が Storage Pod のセットアップ、負荷テスト、およびデプロイに使用するプロセスについて説明しています。
解析におけるハード ドライブの種類
Backblaze は「コンシューマグレード」のハード ドライブを標準としています。 ハードディスク・ドライブ会社は、これらのドライブはRAIDアレイやデータ・センター環境の24時間365日の作業負荷で動作するようには設計されていないと述べていますが、Backblazeはソフトウェア冗長性を使用してデータを保護します。 今後のブログ記事では、「消費者向け」と「企業向け」のハードディスク・ドライブを比較した統計を掘り下げます。
圧倒的に多いのは、「生」または「内蔵」ハードディスク・ドライブです。 しかし、タイのドライブ危機により、内蔵ハード ドライブを妥当な価格で販売することがほぼ不可能になったため、Backblaze はハード ドライブの養殖を開始しました。 このため、この分析に含まれるドライブのうち約6ペタバイトは、もともと「外付け」ハードディスク・ドライブで、エンクロージャから「シャック」されたものでした。
ハードディスクの数
以下のグラフは、Backblazeデータセンター内のドライブの年齢分布を示しています。 チャートの形は、ほとんどが会社の成長と、顧客ベースの拡大に伴うドライブの追加を反映したものです。 全体として、それほど多くのドライブが故障しているわけではありません。
故障率
故障率のデータに飛び込む前に、故障率が何を意味するかを少し明らかにしておくとよいでしょう。 一見したところ、故障率100%は最悪の状態だと思うかもしれません。 すべてのドライブが故障しているのです! しかし、それがすべてではありません。
ディスク ドライブ サプライヤーが、6 か月間は 100% 信頼できるドライブを提供するが、その時点ですべて故障してしまうとします。 年間の故障率はどのくらいでしょうか。 100 台のドライブを常時稼働させなければならない場合、すべてのスロットのドライブを年に 2 回交換する必要があります。 つまり、毎年200台のドライブを交換しなければならないので、年間故障率は200%になります。 つまり、少なくとも理論上は、最悪の故障率は存在しないのです。 すべてのドライブが1時間使用しただけで故障した場合、年間故障率は876,000%になります。 幸いなことに、Backblaze が入手するドライブはそれよりも信頼性が高いものです。
The Bathtub Curve
信頼性エンジニアは、予想される故障率を説明するのに Bathtub Curve と呼ばれるものを使用します。 この考え方は、欠陥は 3 つの要因から生じるというものです。 (1) 「幼児死亡率」をもたらす工場出荷時の欠陥、(2) ランダム故障、(3) 使用頻度が高くなると摩耗する部品。 以下のチャート (Wikimedia Commons からの引用) は、これらの 3 つの要因によって、バスタブ型の故障率曲線がどのように生じるかを示しています。
この理論は Backblaze が経験する現実と一致しています。 下のグラフは、ドライブの寿命の各四半期における故障率を示しています。 最初の 18 か月間は、故障率は 5% 前後で推移し、その後しばらく低下し、3 年目くらいになると大幅に上昇します。 9966>
平均寿命の計算
ハード ディスク ドライブの平均寿命はどのくらいでしょうか。 その質問に答えるには、まず「平均寿命」の意味を決める必要があります。
人の平均寿命を測定する場合、通常はある年齢での平均残存年数を用います。 つまり、2010年の世界の新生児の平均寿命が67.2歳であると言うとき、それらの新生児が120年か130年で人生を終えるまで待つと、彼らの寿命の平均は67.2歳になると言うことです。
ディスクドライブについては、そのすべてが10歳前に摩耗することもあり得ます。 あるいは20年、30年持つものもあるかもしれません。 もし、そのうちのいくつかが長く長く生きると、平均を計算するのが難しくなります。
近いうちに計算できるようになるであろう、より有用性の高い数値は、新しいドライブの寿命の中央値です。 言い換えれば、半分のドライブが何歳で故障したかということです。 その答えが何なのか、見当がつき始めています。
Disk Drive Survival Rates
インターネット上では、”ハード ドライブはどのくらいもつのか” という質問への答えを得ることは意外に難しいのです。
得られた逸話は、有益な情報を与えてくれません。
- tomshardware.com より引用。 「ハードディスクは機械的なものなので、いずれは故障します……私は、ドライブが DOA で届いたり、1 日で死んだり、10 年もったものがあります。 ドライブの寿命を知る方法はありません」
- CNET より。 “5 年についてはわかりません。 私の WD は 2 年で死にました。」
Google の調査には、故障率に関する興味深い情報があります。 彼らは、温度はあなたが考えるほど重要ではなく、ドライブの SMART チェックがドライブ故障の予測にあまり適していないことを発見しました。
CMU の研究では、メーカーの平均故障間隔 (MTBF) の評価が誇張されていることを発見しました。
以下のグラフは、Backblaze において、異なる年数でまだ生きているドライブの割合を示しています:
- 最初の 1 年半は、ドライブは年間 5.1% で故障します。
- 次の 1 年半では、ドライブの故障は少なくなり、年間約 1.4% です。
- しかし 3 年後、故障率は年間 11.8% に急上昇します。 一見したところ、ほとんどのドライブがすでに死亡しており、すべてのドライブが来年中に死亡する予定であるように見えます。 しかし、底を 0 にしてチャートを描き直すと、Backblaze がこれまでに購入したすべてのドライブの約 80% がまだ動作していることがわかります!
How Long WILL THE Hard Drives Last?
5年以上経ったドライブはどうなるのでしょうか。 Google と CMU のチームのどちらも、5 年以上経過したドライブに関するデータを提示していませんが、CMU の論文の結論には、5 年後に故障率が上がると主張する刺激的なコメントがあります。
Backblaze では、5 年間稼動しており、インストールするドライブはすべて新しいドライブなので、それより古いドライブのデータはありません。 ドライブが 5 年、6 年、7 年、8 年と経過したときに何が起こるか、楽しみです。
前のグラフの線を外挿して、ドライブの半分が死亡した時点を推定すると、次のような予測結果が得られます:
ドライブの寿命の中央値は 6 年以上となるでしょう。
Backblaze がスタートしたとき、消費者グレードのディスク ドライブはデータ センターで持ちこたえられないのではないかという懸念がありました。 この 6 年間の中央値寿命が本当であれば、半数以上のドライブが 6 年間使用できるということになり、そのような懸念は杞憂に終わりました。 私たちは、今後も四半期ごとにこの統計を更新していく予定です。 したがって、今後数年間は、ハードディスク・ドライブの寿命の中央値に関する確かなデータを入手することができます。 答えは、ブログでご確認ください。
11月14日: 更新
失礼しました。 転記ミスにより、第2段落のパーセンテージが誤っており、必要以上に悲観的になっていました。 78%(74%ではない)のドライブが4年後にまだ生きているのです。 中央値で6年という予測は、この変更によって影響を受けません。 鋭い目を持つFredericが間違いを見つけてくれたことに感謝します。-Brian
プリント