Combien de temps durent les disques durs ? La réponse courte est : Nous ne le savons pas encore, mais c’est plus long que vous ne le pensez.
Pourquoi une entreprise qui fait tourner plus de 25 000 disques en permanence ne sait-elle pas combien de temps ils durent ? Backblaze fournit une sauvegarde en ligne fiable et illimitée depuis plus de cinq ans. Au cours des quatre dernières années, nous avons eu suffisamment de disques pour fournir de bonnes statistiques, mais 74% 78% des disques que nous achetons vivent plus de quatre ans. Ainsi, alors que 26% 22% des disques tombent en panne au cours de leurs quatre premières années, et que nous disposons d’informations détaillées sur les taux de défaillance des disques au cours de ces quatre premières années, nous ne savons pas encore ce qui se passera au-delà. Alors, combien de temps les disques durent-ils ? Continuez à lire.
Comment les disques sont utilisés chez Backblaze
Backblaze utilise beaucoup de disques durs pour stocker des données. 45 disques sont montés dans chaque Pod de stockage Backblaze, et les Pods de stockage sont montés dans des racks dans nos centres de données. Au fur et à mesure que de nouveaux clients s’inscrivent, nous achetons plus de disques, nous les testons et nous les déployons. Nous en sommes maintenant à 75 pétaoctets de stockage en nuage.
Avant d’être déployé, chaque Pod de stockage Backblaze est testé, notamment sur tous les disques qu’il contient. Récemment, Andy a publié un article sur Stephen, un lecteur de disque qui a échoué à ce test. Le post d’Andy décrit le processus que Backblaze utilise pour configurer, tester en charge et déployer un Storage Pod.
Types de disques durs dans l’analyse
Backblaze a standardisé les disques durs de « qualité grand public ». Bien que les entreprises de disques durs affirment que ces disques ne sont pas conçus pour fonctionner dans des matrices RAID ou la charge de travail 24×7 d’un environnement de centre de données, Backblaze utilise la redondance logicielle pour protéger les données. Dans un prochain billet de blog, nous approfondirons les statistiques comparant les disques durs « grand public » et « d’entreprise ».
De loin, la majorité de ces disques durs sont des disques durs « bruts » ou « internes ». Cependant, comme la crise des disques thaïlandais a rendu presque impossible la vente de disques durs internes à des prix raisonnables, Backblaze a commencé à exploiter des disques durs. Ainsi, environ six pétaoctets des disques dans cette analyse étaient à l’origine des disques durs « externes » qui ont été « écrabouillés » hors de leurs boîtiers.
Nombre de disques durs
Le graphique ci-dessous montre la répartition par âge des disques dans les centres de données de Backblaze. La forme du graphique est surtout le reflet de la croissance de l’entreprise et de l’ajout de disques au fur et à mesure que la base de clients augmente. Dans l’ensemble, il n’y a pas tant de disques qui échouent.
Taux d’échec
Avant de plonger dans les données sur les taux d’échec, il est utile de passer un peu de temps à clarifier ce que signifie exactement un taux d’échec. À première vue, on pourrait penser qu’un taux d’échec de 100 % est le pire possible. Chaque disque est en panne ! Ce n’est pas toute l’histoire, cependant.
Imaginez que vous avez un fournisseur de disques qui fournit des disques qui sont fiables à 100% pendant six mois, mais qui tombent tous en panne à ce moment-là. Quel est le taux d’échec annuel ? Si vous devez faire fonctionner 100 disques en permanence, vous devrez remplacer le disque de chaque emplacement deux fois par an. Cela signifie que vous devrez remplacer 200 disques chaque année, ce qui porte le taux de défaillance annuel à 200 %. Ainsi, en théorie du moins, il n’y a pas de pire taux de défaillance possible. Si chaque disque tombait en panne après une heure d’utilisation, le taux de défaillance annuel serait de 876 000 %. Heureusement, les lecteurs que Backblaze obtient sont plus fiables que cela.
La courbe de la baignoire
Les ingénieurs en fiabilité utilisent quelque chose appelé la courbe de la baignoire pour décrire les taux de défaillance attendus. L’idée est que les défauts proviennent de trois facteurs : (1) les défauts d’usine, qui entraînent une « mortalité infantile », (2) les défaillances aléatoires et (3) les pièces qui s’usent, ce qui entraîne des défaillances après une longue utilisation. Le graphique ci-dessous (adapté de Wikimedia Commons) montre comment on peut s’attendre à ce que ces trois facteurs produisent une courbe de taux d’échec en forme de baignoire.
La théorie correspond à la réalité que connaît Backblaze. Le graphique ci-dessous montre le taux d’échec des disques dans chaque trimestre de leur vie. Pendant les 18 premiers mois, le taux de défaillance tourne autour de 5 %, puis il diminue pendant un certain temps, avant d’augmenter considérablement à peu près au bout de trois ans. Nous ne constatons pas autant de « mortalité infantile », mais il semble bien que trois ans soit le point où les disques commencent à s’user.
Calcul de l’espérance de vie
Quelle est l’espérance de vie d’un disque dur ? Pour répondre à cette question, nous devons d’abord décider ce que nous entendons par « espérance de vie ».
Lorsque l’on mesure l’espérance de vie des personnes, la mesure habituelle est le nombre moyen d’années restantes à un âge donné. Ainsi, lorsque nous disons que l’espérance de vie des nouveau-nés dans le monde en 2010 est de 67,2 ans, nous disons que si nous attendons que toutes ces nouvelles personnes aient vécu leur vie en 120 ou 130 ans, la moyenne de leur durée de vie sera de 67,2.
Pour les lecteurs de disques, il se peut qu’ils s’usent tous avant d’avoir 10 ans. Ou il se peut que certains d’entre eux durent 20 ou 30 ans. Si certains d’entre eux vivent longtemps, très longtemps, cela rend difficile le calcul de la moyenne. De plus, quelques valeurs aberrantes peuvent déséquilibrer la moyenne et la rendre moins utile.
Le nombre que nous pourrons bientôt calculer, et celui qui est le plus susceptible d’être utile, est la durée de vie médiane d’un nouveau disque. En d’autres termes, à quel âge la moitié des disques sont-ils tombés en panne ? Nous commençons à avoir une idée de ce que sera la réponse.
Taux de survie des disques durs
Sur internet, il est étonnamment difficile d’obtenir une réponse à la question « Combien de temps durera un disque dur ? ». Ce que vous trouverez, ce sont surtout des histoires anecdotiques, ou peut-être des références aux études de Google et de la CMU, qui ne répondent pas vraiment à la question.
Les anecdotes que vous obtenez ne vous donnent aucune information utile :
- De tomshardware.com : « Les disques durs sont mécaniques et finissent donc par tomber en panne… J’ai eu des disques qui arrivent DOA, certains meurent après un jour, et certains qui ont duré 10 ans. Il n’y a tout simplement aucun moyen de savoir combien de temps un disque dur va vivre. »
- De CNET : « Je ne sais pas pour les 5 ans. Mon WD est mort après 2 ans. »
L’étude de Google contient des informations intéressantes sur les taux de défaillance. Ils ont découvert que la température n’a pas autant d’importance que vous pourriez le penser, et que les contrôles SMART d’un disque ne sont pas très bons pour prédire la défaillance d’un disque.
L’étude deCMU a découvert que les cotes de temps moyen entre les défaillances (MTBF) des fabricants sont exagérées. Les disques tombent en panne beaucoup plus souvent que le MTBF ne l’indique.
Le graphique ci-dessous montre le pourcentage de disques chez Backblaze qui sont encore en vie à différents âges :
- Pendant la première année et demie, les disques tombent en panne à 5,1% par an.
- Pendant l’année et demie suivante, les disques tombent MOINS en panne, à environ 1,4% par an.
- Après trois ans cependant, les taux de défaillance montent en flèche à 11,8% par an.
La plupart des disques sont encore en vie
Le graphique ci-dessus pourrait être trompeur. Au premier coup d’œil, il semble que la plupart des disques soient déjà morts et que tous soient en passe de mourir au cours de l’année prochaine. Cependant, si vous redessinez le graphique avec le bas à 0, vous pouvez voir que près de 80 % de tous les disques que Backblaze a jamais achetés sont toujours en fonctionnement !
Combien de temps les disques durs vont-ils durer ?
Que se passe-t-il avec les disques lorsqu’ils ont plus de cinq ans ? Ni Google ni l’équipe de la CMU n’ont présenté de données sur les disques de plus de cinq ans, bien que l’article de la CMU comporte un commentaire alléchant dans sa conclusion, affirmant que les taux de défaillance augmentent après cinq ans. Aucune base pour cette affirmation n’est fournie, cependant.
À Backblaze, nous sommes en place et en activité depuis cinq ans, et tous les disques que nous installons sont des disques neufs, donc nous n’avons pas non plus de données pour les disques plus anciens que cela. Nous sommes impatients de découvrir ce qui se passera lorsque les lecteurs auront cinq, six, sept et huit ans.
Si vous extrapolez la ligne du graphique précédent pour estimer le point auquel la moitié des lecteurs sont morts, vous obtenez une prédiction :
La durée de vie médiane d’un lecteur sera de plus de six ans.
Lorsque Backblaze a commencé, il y avait des inquiétudes sur le fait que les disques de qualité grand public ne tiendraient pas le coup dans un centre de données. Si cette durée de vie médiane de six ans est vraie, cela signifie que plus de la moitié des disques dureront six ans, et que ces inquiétudes n’étaient pas fondées. Nous avons l’intention de continuer à mettre à jour ces statistiques tous les trimestres. Ainsi, au cours des deux prochaines années, nous disposerons de données précises sur la durée de vie médiane des disques durs. Restez à l’écoute du blog pour découvrir les réponses.
14 novembre : Mise à jour
Ma faute : Suite à une erreur de transcription, les pourcentages du deuxième paragraphe étaient erronés, et étaient plus pessimistes que nécessaire. 78% (et non 74%) des lecteurs sont encore en vie après quatre ans. La projection d’une durée de vie médiane de six ans n’est pas affectée par ce changement. Merci à Frederic, l’œil vif, d’avoir repéré l’erreur.-Brian