Hogyan tartanak a lemezmeghajtók? A rövid válasz a következő:
Miért nem tudja egy olyan cég, amely több mint 25 000 lemezmeghajtót tart állandóan pörögve, hogy meddig bírják? A Backblaze több mint öt éve nyújt megbízható és korlátlan online biztonsági mentést. Az elmúlt négy évben elég meghajtónk volt ahhoz, hogy jó statisztikát tudjunk készíteni, de az általunk vásárolt meghajtók 74% 78%-a négy évnél tovább él. Tehát míg a meghajtók 26%-a 22%-a meghibásodik az első négy év alatt, és részletes információkkal rendelkezünk a meghajtók első négy év alatti meghibásodási arányáról, azt még nem tudjuk, hogy mi történik ezen túl. Tehát meddig tartanak ki a meghajtók? Olvasson tovább.
Hogyan használják a meghajtókat a Backblaze-nél
A Backblaze sok merevlemezt használ az adatok tárolására. Minden Backblaze Storage Podba 45 meghajtót szerelünk, a Storage Podokat pedig az adatközpontjainkban lévő állványokba szereljük. Ahogy új ügyfelek regisztrálnak, újabb lemezmeghajtókat vásárolunk, teszteljük és telepítjük őket. Jelenleg már 75 petabájtnyi felhőtárolónál tartunk.
A telepítés előtt minden Backblaze Storage Podot tesztelünk, beleértve a benne lévő összes meghajtó tesztelését. Nemrégiben Andy írt Stephenről, egy olyan lemezmeghajtóról, amely megbukott ezen a tesztelésen. Andy bejegyzése leírja a Backblaze által a Storage Podok beállításához, terheléses teszteléséhez és telepítéséhez használt folyamatot.
A merevlemezek típusai az elemzésben
A Backblaze szabványosította a “fogyasztói minőségű” merevlemezeket. Bár a merevlemezgyártók szerint ezeket a meghajtókat nem RAID-tömbökben vagy az adatközponti környezet 24×7-es munkaterheléséhez tervezték, a Backblaze szoftveres redundanciát használ az adatok védelmére. Egy következő blogbejegyzésben a “fogyasztói” és “vállalati” merevlemezeket összehasonlító statisztikákba fogunk belemerülni.
Ezek a merevlemezek messze a legtöbbje “nyers” vagy “belső” merevlemez. Mivel azonban a thaiföldi meghajtóválság miatt szinte lehetetlenné vált elfogadható áron megvásárolható belső merevlemezeket találni, a Backblaze elkezdett merevlemezeket farmolni. Így az elemzésben szereplő meghajtók mintegy hat petabájtja eredetileg “külső” merevlemez volt, amelyeket “kivettek” a burkolatukból.
Keménylemezek száma
Az alábbi ábra a Backblaze adatközpontjaiban lévő meghajtók kormegoszlását mutatja. A diagram alakja leginkább a vállalat növekedését tükrözi, és a meghajtók hozzáadását az ügyfélkör növekedésével. Összességében nem sok meghajtó hibásodik meg.
Kiesési arányok
Mielőtt belemerülnénk a hibaarányokra vonatkozó adatokba, érdemes egy kicsit tisztázni, hogy mit is jelent pontosan a hibaarány. Első pillantásra azt gondolhatnánk, hogy a 100%-os hibaarány a lehető legrosszabb. Minden meghajtó meghibásodik! Ez azonban nem a teljes történet.
Képzelje el, hogy van egy lemezmeghajtó-beszállítója, aki hat hónapig 100%-ban megbízható meghajtókat szállít, de aztán az összes meghibásodik. Mennyi az éves meghibásodási arány? Ha 100 meghajtót kell folyamatosan üzemben tartanod, akkor évente kétszer kell kicserélned a meghajtót minden slotban. Ez azt jelenti, hogy évente 200 meghajtót kell cserélnie, ami 200%-os éves meghibásodási arányt jelent. Tehát, legalábbis elméletben, nincs a lehető legrosszabb meghibásodási arány. Ha minden meghajtó egy óra használat után meghibásodna, az éves hibaarány 876 000% lenne. Szerencsére a Backblaze által beszerzett meghajtók ennél megbízhatóbbak.
A Bathtub-görbe
A megbízhatósági mérnökök a várható hibaarányok leírására a Bathtub-görbe nevű módszert használják. Az elképzelés szerint a hibák három tényezőből erednek: (1) gyári hibákból, amelyek “csecsemőhalandóságot” eredményeznek, (2) véletlenszerű meghibásodásokból, és (3) elhasználódó alkatrészekből, amelyek sok használat után meghibásodást eredményeznek. Az alábbi (a Wikimedia Commonsból átvett) diagram azt mutatja, hogy e három tényező várhatóan kád alakú hibaarány-görbét eredményez.
Az elmélet megfelel a Backblaze által tapasztalt valóságnak. Az alábbi diagram a meghajtók meghibásodási arányát mutatja az életük egyes negyedéveiben. Az első 18 hónapban a meghibásodási arány 5% körül mozog, majd egy ideig csökken, majd a három év körül jelentősen emelkedik. Nem látunk ekkora “csecsemőhalandóságot”, de úgy tűnik, hogy a három év az a pont, amikor a meghajtók elkezdenek elhasználódni.
A várható élettartam kiszámítása
Milyen hosszú egy merevlemez-meghajtó várható élettartama? A kérdés megválaszolásához először el kell döntenünk, hogy mit értünk “várható élettartam” alatt.”
Az emberek várható élettartamának mérésekor a szokásos mértékegység az adott életkorban hátralévő évek átlagos száma. Amikor tehát azt mondjuk, hogy a világon 2010-ben az újszülöttek várható élettartama 67,2 év, azt mondjuk, hogy ha megvárjuk, amíg az összes új ember 120 vagy 130 év alatt leéli az életét, akkor az élettartamuk átlaga 67,2 év lesz.
A lemezmeghajtók esetében előfordulhat, hogy mindegyik elhasználódik, mielőtt 10 éves lenne. Vagy lehet, hogy néhányuk 20 vagy 30 évig bírja. Ha néhányuk hosszú-hosszú ideig él, az megnehezíti az átlag kiszámítását. Emellett néhány kiugró érték is megdöntheti az átlagot, és kevésbé használhatóvá teszi azt.
A szám, amelyet hamarosan ki tudunk számítani, és amely valószínűleg hasznosabb lesz, az egy új meghajtó medián élettartama. Más szóval, hány éves korban ment tönkre a meghajtók fele? Kezdünk elképzelést kapni arról, hogy mi lesz a válasz.
Platform meghajtók túlélési aránya
Az interneten meglepően nehéz választ kapni arra a kérdésre, hogy “Meddig tart egy merevlemez?”. Amit találsz, azok többnyire anekdotikus történetek, vagy esetleg hivatkozások a Google és a CMU tanulmányaira, amelyek közül egyik sem ad igazi választ a kérdésre.
A kapott anekdoták nem adnak hasznos információt:
- A tomshardware.com-tól: “A merevlemezek mechanikusak, és így előbb-utóbb meghibásodnak… Voltak már olyan meghajtók, amelyek DOA érkeztek, néhányan egy nap után meghaltak, és voltak, amelyek 10 évig kitartottak. Egyszerűen nem lehet megmondani, hogy egy meghajtó meddig fog élni.”
- A CNET-től: “Nem tudom az 5 évet. Az én WD-m 2 év után meghalt.”
A Google tanulmánya érdekes információkat tartalmaz a meghibásodási arányokról. Azt találták, hogy a hőmérséklet nem számít annyira, mint gondolnánk, és hogy a meghajtó SMART-ellenőrzései nem túl jók a meghajtó meghibásodásának előrejelzésében.
A CMU tanulmánya szerint a gyártók MTBF (Mean Time Between Failures) minősítései eltúlzottak. A meghajtók sokkal többet hibásodnak meg, mint amennyit az MTBF jelezne.
Az alábbi diagram a Backblaze-nél a különböző életkorokban még élő meghajtók százalékos arányát mutatja:
- A meghajtók az első másfél évben évente 5,1%-ban hibásodnak meg.
- A következő másfél évben a meghajtók kevésbé hibásodnak meg, körülbelül 1,4% évente.
- Három év után azonban a meghibásodások aránya 11,8%-ra emelkedik évente.
A legtöbb meghajtó még életben van
A fenti diagram félrevezető lehet. Ránézésre úgy tűnik, hogy a legtöbb meghajtó már elpusztult, és mindegyik a következő egy éven belül el fog pusztulni. Ha azonban átrajzolja a diagramot úgy, hogy az alja 0-nál van, láthatja, hogy a Backblaze által valaha vásárolt meghajtók közel 80%-a még mindig működik!
Meddig tartanak a merevlemezek?
Mi történik a meghajtókkal, ha öt évnél idősebbek? Sem a Google, sem a CMU csapata nem mutatott be adatokat az öt évnél idősebb meghajtókról, bár a CMU tanulmányának következtetésében van egy kínzó megjegyzés, amely azt állítja, hogy a meghibásodási arány öt év után emelkedik. Ennek az állításnak azonban nincs alapja.
A Backblaze-nél már öt éve működünk, és minden általunk telepített meghajtó új meghajtó, így az ennél régebbi meghajtókról sincsenek adataink. Kíváncsian várjuk, mi lesz, ha a meghajtók öt, hat, hét és nyolc évesek lesznek.
Ha extrapoláljuk az előző diagram vonalát, hogy megbecsüljük azt a pontot, amikor a meghajtók fele elpusztul, akkor a következő előrejelzést kapjuk:
A meghajtók átlagos élettartama több mint hat év.
A Backblaze indulásakor voltak olyan aggodalmak, hogy a fogyasztói minőségű lemezmeghajtók nem bírják ki egy adatközpontban. Ha ez a hatéves átlagos élettartam igaz, akkor ez azt jelenti, hogy a meghajtók több mint fele hat évig bírja, és ezek az aggodalmak alaptalanok voltak. Szándékunkban áll továbbra is negyedévente frissíteni ezeket a statisztikákat. Így az elkövetkező néhány évben kemény adatokkal rendelkezünk majd a merevlemezek medián élettartamáról. Maradjon a blogon, hogy megtudja a válaszokat.
Nov 14: Frissítés
Az én hibám: Egy átírási hiba miatt a második bekezdésben szereplő százalékos adatok tévesek voltak, és a kelleténél pesszimistábbak. A meghajtók 78%-a (nem 74%-a) négy év után is életben van. A hatéves átlagos élettartamra vonatkozó előrejelzést ez a változás nem befolyásolja. Köszönöm az éles szemű Fredericnek, hogy észrevette a hibát.-Brian