Cât durează unitățile de disc? Răspunsul scurt este: Nu știm încă, dar este mai mult decât ați putea bănui.
De ce o companie care ține mai mult de 25.000 de unități de disc învârtindu-se tot timpul nu știe cât durează? Backblaze oferă backup online fiabil și nelimitat de peste cinci ani. În ultimii patru ani, am avut destule unități de discuri pentru a furniza statistici bune, dar 74% 78% dintre discurile pe care le cumpărăm trăiesc mai mult de patru ani. Așadar, în timp ce 26% 22% dintre unități se defectează în primii patru ani și avem informații detaliate despre ratele de defecțiune ale unităților în primii patru ani, nu știm încă ce se va întâmpla dincolo de această perioadă. Așadar, cât de mult durează unitățile? Continuați să citiți.
Cum sunt folosite hard disk-urile la Backblaze
Backblaze folosește o mulțime de hard disk-uri pentru stocarea datelor. 45 de unități sunt montate în fiecare Backblaze Storage Pod, iar Storage Pod-urile sunt montate în rafturi în centrele noastre de date. Pe măsură ce noi clienți se înscriu, noi cumpărăm mai multe unități de disc, le testăm și le implementăm. Am ajuns acum la 75 de petabytes de stocare în cloud.
Înainte de a fi implementat, fiecare Backblaze Storage Pod este testat, inclusiv teste pe toate discurile din el. Recent, Andy a postat despre Stephen, o unitate de disc care nu a trecut aceste teste. Postarea lui Andy descrie procesul pe care Backblaze îl folosește pentru a configura, testa și implementa un Storage Pod.
Tipuri de hard disk-uri în analiză
Backblaze a standardizat hard disk-urile de „calitate pentru consumatori”. În timp ce companiile producătoare de hard disk-uri spun că aceste unități nu sunt concepute pentru a funcționa în matrice RAID sau pentru volumul de lucru 24×7 al unui mediu de centru de date, Backblaze folosește redundanța software pentru a proteja datele. Într-o postare viitoare pe blog, vom aprofunda statisticile care compară hard disk-urile „de consum” și „de întreprindere”.
De departe, majoritatea acestor hard disk-uri sunt hard disk-uri „brute” sau „interne”. Cu toate acestea, deoarece criza unităților thailandeze a făcut aproape imposibilă găsirea de hard disk-uri interne de vânzare la prețuri rezonabile, Backblaze a început să exploateze hard disk-uri. Astfel, aproximativ șase petabytes din unitățile din această analiză au fost inițial hard disk-uri „externe” care au fost „scoase” din carcasele lor.
Număr de hard disk-uri
Graficul de mai jos arată distribuția pe vârste a hard disk-urilor din centrele de date Backblaze. Forma graficului reflectă în mare parte creșterea companiei și adăugarea de unități pe măsură ce baza de clienți a crescut. În general, nu foarte multe unități se defectează.
Ratele de defectare
Înainte de a ne scufunda în datele privind ratele de defectare, merită să petrecem puțin timp pentru a clarifica ce înseamnă exact o rată de defectare. La prima vedere, ați putea crede că o rată de eșec de 100% este cea mai rea posibilă. Fiecare unitate se defectează! Totuși, aceasta nu este întreaga poveste.
Imaginați-vă că aveți un furnizor de unități de disc care furnizează unități care sunt 100% fiabile timp de șase luni, dar apoi toate se defectează în acel moment. Care este rata anuală de eșec? Dacă trebuie să țineți 100 de unități în funcțiune în permanență, va trebui să înlocuiți unitatea din fiecare slot de două ori pe an. Aceasta înseamnă că va trebui să înlocuiți 200 de unități în fiecare an, ceea ce face ca rata anuală de eșec să fie de 200%. Deci, cel puțin în teorie, nu există cea mai rea rată de eșec posibilă. Dacă fiecare unitate s-ar defecta după o oră de utilizare, rata anuală de eșec ar fi de 876.000%. Din fericire, unitățile pe care le primește Backblaze sunt mai fiabile decât atât.
Curba Bathtub Curve
Inginerii de fiabilitate folosesc ceva numit Curba Bathtub Curve pentru a descrie ratele de eșec preconizate. Ideea este că defectele provin din trei factori: (1) defecte din fabrică, ceea ce duce la „mortalitate infantilă”, (2) defecțiuni aleatorii și (3) piese care se uzează, ceea ce duce la defecțiuni după multă utilizare. Graficul de mai jos (adaptat de la Wikimedia Commons) arată cum se poate aștepta ca acești trei factori să producă o curbă a ratei de eșec în formă de cadă.
Teoria se potrivește cu realitatea pe care o experimentează Backblaze. Graficul de mai jos arată rata de eșec a unităților în fiecare sfert din viața lor. În primele 18 luni, rata de eșec se învârte în jurul valorii de 5%, apoi scade pentru o vreme și apoi crește substanțial în jurul valorii de trei ani. Nu observăm atât de multă „mortalitate infantilă”, dar se pare că trei ani este punctul în care unitățile încep să se uzeze.
Calcularea speranței de viață
Ce este speranța de viață a unei unități de hard disk? Pentru a răspunde la această întrebare, trebuie mai întâi să decidem ce înțelegem prin „speranța de viață.”
Când se măsoară speranța de viață a oamenilor, măsura obișnuită este numărul mediu de ani rămași la o anumită vârstă. Astfel, atunci când spunem că speranța de viață a nou-născuților din lume în 2010 este de 67,2 ani, spunem că, dacă așteptăm până când toți acești oameni noi își vor fi trăit viața în 120 sau 130 de ani, media duratei lor de viață va fi de 67,2.
Pentru unitățile de disc, se poate întâmpla ca toate să se uzeze înainte de a împlini 10 ani. Sau se poate ca unele dintre ele să dureze 20 sau 30 de ani. Dacă unele dintre ele trăiesc foarte, foarte mult timp, va fi greu de calculat media. De asemenea, câteva valori aberante pot arunca media în aer și o pot face mai puțin utilă.
Numărul pe care îl vom putea calcula în curând și cel care are mai multe șanse să fie util este durata de viață mediană a unei unități noi. Cu alte cuvinte, la ce vârstă au cedat jumătate dintre unități? Începem să ne facem o idee despre care va fi răspunsul.
Ratele de supraviețuire ale unităților de disc
Pe internet, este surprinzător de greu să obții un răspuns la întrebarea „Cât va dura un hard disk?”. Ceea ce veți găsi sunt în mare parte povești anecdotice, sau poate referințe la studiile Google și CMU, niciuna dintre acestea nu răspunde cu adevărat la întrebare.
Anecdotele pe care le obțineți nu vă oferă nicio informație utilă:
- De la tomshardware.com: „Hard disk-urile sunt mecanice și, prin urmare, vor ceda în cele din urmă… Am avut hard disk-uri care au ajuns DOA, unele au murit după o zi, iar altele care au rezistat 10 ani. Pur și simplu nu există nicio modalitate de a spune cât timp va trăi o unitate.”
- De la CNET: „Nu știu ce să zic de 5 ani. WD-ul meu a murit după 2 ani.”
Studiul Google are câteva informații interesante despre ratele de eșec. Ei au descoperit că temperatura nu contează atât de mult pe cât ați putea crede și că verificările SMART ale unei unități nu sunt foarte bune pentru a prezice eșecul unității.
Studiul MCU a descoperit că ratingurile de timp mediu între defecțiuni (MTBF) ale producătorilor sunt exagerate. Unitățile se defectează mult mai mult decât ar indica MTBF.
Graficul de mai jos arată procentul de unități de la Backblaze care sunt încă în viață la diferite vârste:
- Pentru primul an și jumătate, unitățile se defectează cu 5,1% pe an.
- Pentru următorul an și jumătate, unitățile se defectează MAI PUȚIN, la aproximativ 1,4% pe an.
- După trei ani, însă, ratele de defecțiuni cresc vertiginos la 11,8% pe an.
Majoritatea unităților sunt încă în viață
Graficul de mai sus ar putea fi înșelător. La prima vedere, se pare că majoritatea unităților au murit deja și că toate sunt pe cale să moară în următorul an. Cu toate acestea, dacă redesenați graficul cu partea de jos la 0, puteți vedea că aproape 80% din toate unitățile pe care Backblaze le-a cumpărat vreodată sunt încă în funcțiune!
Cât vor rezista hard disk-urile?
Ce se întâmplă cu unitățile atunci când sunt mai vechi de cinci ani? Nici Google, nici echipa de la CMU nu au prezentat date despre unități mai vechi de cinci ani, deși lucrarea de la CMU are un comentariu ispititor în concluzia sa care susține că ratele de defecțiune cresc după cinci ani. Totuși, nu este furnizată nicio bază pentru această afirmație.
La Backblaze, suntem în funcțiune de cinci ani, iar toate unitățile pe care le instalăm sunt unități noi, așa că, de asemenea, nu avem date pentru unități mai vechi de atât. Așteptăm cu nerăbdare să aflăm ce se va întâmpla atunci când unitățile vor deveni vechi de cinci, șase, șapte și opt ani.
Dacă extrapolați linia din graficul anterior pentru a estima punctul în care jumătate dintre unități au murit, obțineți o predicție:
Viața medie de viață a unei unități va fi de peste șase ani.
Când Backblaze a început, au existat unele îngrijorări legate de faptul că unitățile de disc de calitate de consum nu ar rezista într-un centru de date. Dacă această durată de viață mediană de șase ani este adevărată, înseamnă că mai mult de jumătate dintre discuri vor rezista șase ani, iar acele îngrijorări au fost nefondate. Intenționăm să continuăm să actualizăm aceste statistici trimestrial. Astfel, în următorii doi ani, vom avea date concrete cu privire la durata medie de viață a hard disk-urilor. Rămâneți conectați la blog pentru a afla răspunsurile.
Nov 14: Actualizare
Greșeala mea: Din cauza unei erori de transcriere, procentele din al doilea paragraf au fost greșite și au fost mai pesimiste decât era necesar. 78% (nu 74%) dintre unități sunt încă în viață după patru ani. Proiecția unei durate de viață medii de șase ani nu este afectată de această modificare. Mulțumim lui Frederic, cu ochiul ager, pentru că a sesizat eroarea.-Brian
.