Kuinka kauan levyasemat kestävät? Lyhyt vastaus on:
Miksi yritys, joka pitää yli 25 000 levyasemaa pyörimässä koko ajan, ei tiedä, kuinka kauan ne kestävät? Backblaze on tarjonnut luotettavaa ja rajoittamatonta verkkovarmuuskopiointia yli viiden vuoden ajan. Viimeisten neljän vuoden aikana meillä on ollut tarpeeksi asemia hyvien tilastojen laatimiseen, mutta 74 % 78 % ostamistamme asemista elää pidempään kuin neljä vuotta. Vaikka siis 26 % 22 % asemista vikaantuu ensimmäisten neljän vuoden aikana, ja meillä on yksityiskohtaista tietoa asemien vikaantumisasteesta ensimmäisten neljän vuoden aikana, emme vielä tiedä, mitä tapahtuu sen jälkeen. Kuinka kauan asemat siis kestävät? Jatka lukemista.
Miten levyjä käytetään Backblazessa
Backblaze käyttää paljon kiintolevyjä tietojen tallentamiseen. Jokaiseen Backblaze Storage Podiin asennetaan 45 kiintolevyä, ja Storage Podit on asennettu telineisiin datakeskuksissamme. Kun uusia asiakkaita tulee, ostamme lisää levyasemia, testaamme niitä ja otamme ne käyttöön. Meillä on nyt 75 petatavua pilvitallennustilaa.
Ennen käyttöönottoa jokainen Backblaze Storage Pod testataan, mukaan lukien kaikkien siinä olevien asemien testit. Andy kirjoitti hiljattain Stephenistä, levyasemasta, joka ei läpäissyt tätä testausta. Andyn postauksessa kuvataan prosessi, jota Backblaze käyttää Storage Podin perustamiseen, kuormitustestiin ja käyttöönottoon.
Kiintolevyjen tyypit analyysissä
Backblaze on standardoinut ”kuluttajaluokan” kiintolevyt. Vaikka kiintolevyvalmistajat sanovat, että näitä kiintolevyjä ei ole suunniteltu toimimaan RAID-matriiseissa tai datakeskusympäristön 24×7-työkuormaan, Backblaze käyttää ohjelmistoredundanssia tietojen suojaamiseen. Tulevassa blogikirjoituksessa perehdymme tilastoihin, joissa verrataan ”kuluttaja-” ja ”yrityskiintolevyjä”.
Ylivoimaisesti suurin osa näistä kiintolevyistä on ”raakoja” tai ”sisäisiä” kiintolevyjä. Koska Thaimaan kiintolevykriisin vuoksi oli kuitenkin lähes mahdotonta löytää sisäisiä kiintolevyjä myytäväksi kohtuulliseen hintaan, Backblaze alkoi viljellä kiintolevyjä. Näin ollen noin kuusi petatavua tämän analyysin kiintolevyistä oli alun perin ”ulkoisia” kiintolevyjä, jotka ”irrotettiin” koteloistaan.
Kiintolevyjen määrä
Alla olevasta kaaviosta käy ilmi Backblazen tietokeskuksissa olevien kiintolevyjen ikäjakauma. Kaavion muoto kuvastaa lähinnä yrityksen kasvua ja asemien lisäämistä asiakaskunnan kasvaessa. Kaiken kaikkiaan ei kovin moni asema vikaannu.
Vikaantumisasteet
Ennen kuin sukellamme vikaantumisastetta koskeviin tietoihin, on syytä käyttää hieman aikaa sen selventämiseen, mitä vikaantumisaste tarkalleen ottaen tarkoittaa. Ensi silmäyksellä voisi ajatella, että 100 prosentin epäonnistumisaste on pahin mahdollinen. Jokainen asema vikaantuu! Se ei kuitenkaan ole koko tarina.
Kuvittele, että sinulla on levyasematoimittaja, joka toimittaa asemia, jotka ovat 100-prosenttisen luotettavia kuuden kuukauden ajan, mutta sitten kaikki vikaantuvat siinä vaiheessa. Mikä on vuotuinen vikaantumisprosentti? Jos sinun on pidettävä 100 asemaa jatkuvasti käynnissä, sinun on vaihdettava asema jokaiseen paikkaan kaksi kertaa vuodessa. Tämä tarkoittaa, että sinun on vaihdettava 200 asemaa vuodessa, jolloin vuotuinen vikaantumisaste on 200 %. Pahinta mahdollista vikaantumisastetta ei siis ainakaan teoriassa ole. Jos jokainen asema pettäisi yhden tunnin käytön jälkeen, vuotuinen vikaantumisaste olisi 876 000 %. Onneksi Backblazen hankkimat asemat ovat tätä luotettavampia.
Kylpytynnyrikäyrä
Luotettavuusinsinöörit käyttävät odotettavissa olevien vikaantumisprosenttien kuvaamiseen jotain, jota kutsutaan nimellä kylpytynnyrikäyrä. Ideana on, että viat tulevat kolmesta tekijästä: (1) tehtaan vioista, jotka johtavat ”lapsikuolleisuuteen”, (2) satunnaisista vioista ja (3) kuluvista osista, jotka johtavat vioittumiseen pitkän käytön jälkeen. Alla oleva kaavio (muokattu Wikimedia Commonsista) osoittaa, miten näiden kolmen tekijän voidaan odottaa tuottavan kylpyammeen muotoisen vikaantumisasteen käyrän.
Teoria vastaa Backblazen kokemaa todellisuutta. Alla olevassa kaaviossa näkyy asemien vikaantumisaste niiden elinkaaren kullakin neljänneksellä. Ensimmäiset 18 kuukautta vikaantumisaste liikkuu noin 5 prosentin tuntumassa, sitten se laskee jonkin aikaa ja nousee sitten huomattavasti noin kolmen vuoden kohdalla. ”Lapsikuolleisuutta” ei ole havaittavissa kovin paljon, mutta näyttää siltä, että kolme vuotta on piste, jossa asemat alkavat kulua loppuun.
Eliniän laskeminen
Mikä on kiintolevyaseman elinajanodote? Jotta voimme vastata tähän kysymykseen, meidän on ensin päätettävä, mitä tarkoitamme ”elinajanodotteella”.
Mittaillessamme ihmisten elinajanodotetta tavallinen mittari on tietyssä iässä jäljellä olevien vuosien keskimääräinen määrä. Kun siis sanomme, että vastasyntyneiden elinajanodote maailmassa vuonna 2010 on 67,2 vuotta, sanomme, että jos odotamme, että kaikki nämä uudet ihmiset ovat eläneet elämänsä loppuun 120 tai 130 vuotta, heidän elinikänsä keskiarvo on 67,2 vuotta.
Kiekkolevyjen osalta voi olla, että kaikki ne kuluvat loppuun ennen kuin ne ovat 10-vuotiaita. Tai voi olla, että jotkut niistä kestävät 20 tai 30 vuotta. Jos jotkut niistä elävät pitkän, pitkän ajan, se vaikeuttaa keskiarvon laskemista. Myös muutama poikkeava luku voi vääristää keskiarvoa ja tehdä siitä vähemmän käyttökelpoisen.
Luku, jonka pystymme pian laskemaan ja joka on todennäköisemmin käyttökelpoinen, on uuden aseman eliniän mediaani. Toisin sanoen, minkä ikäisenä puolet asemista on vikaantunut? Alamme saada käsitystä siitä, mikä vastaus on.
Disk Drive Survival Rates
Internetissä on yllättävän vaikea saada vastausta kysymykseen ”Kuinka kauan kiintolevy kestää?”. Löydät lähinnä anekdoottisia tarinoita tai ehkä viittauksia Googlen ja CMU:n tutkimuksiin, joista kumpikaan ei oikeastaan vastaa kysymykseen.
Saamasi anekdootit eivät anna sinulle mitään hyödyllistä tietoa:
- From tomshardware.com: ”Kiintolevyt ovat mekaanisia ja siten lopulta vikaantuvat… Minulla on ollut kiintolevyjä, jotka saapuvat DOA:na, jotkut kuolevat päivän jälkeen ja jotkut ovat kestäneet 10 vuotta. Ei ole mitään keinoa sanoa, kuinka kauan asema elää.”
- CNET:stä: ”En tiedä viidestä vuodesta. Minun WD:ni kuoli 2 vuoden jälkeen.”
Googlen tutkimuksessa on mielenkiintoista tietoa vikaantumisasteista. He havaitsivat, että lämpötilalla ei ole niin paljon merkitystä kuin voisi luulla, ja että aseman SMART-tarkistukset eivät ole kovin hyviä aseman vikaantumisen ennustamisessa.
CMU:n tutkimuksessa havaittiin, että valmistajien keskimääräiset vikaantumisaika-arvot (MTBF) ovat liioiteltuja. Asemat vikaantuvat paljon enemmän kuin MTBF-arvo antaisi ymmärtää.
Alla olevassa kaaviossa on esitetty Backblazessa elossa olevien asemien prosenttiosuus eri ikäkausina:
- Ensimmäisten puolentoista vuoden aikana asemat vikaantuvat 5,1 %:lla vuodessa.
- Seuraavien puolentoista vuoden aikana asemat vikaantuvat VÄHINTÄÄN, noin 1,4 % vuodessa.
- Kolmen vuoden jälkeen vikaantumisprosentti kuitenkin räjähtää 11,8 %:iin vuodessa.
Most Drives Are Still Alive
Ylläoleva kaavio voi olla harhaanjohtava. Ensisilmäyksellä näyttää siltä, että suurin osa asemista on jo kuollut ja kaikki ovat kuolemassa seuraavan vuoden aikana. Jos kaavio kuitenkin piirretään uudelleen siten, että alareuna on 0, nähdään, että lähes 80 % kaikista Backblazen koskaan hankkimista asemista on edelleen toiminnassa!
Kuinka kauan kiintolevyt kestävät?
Mitä asemille tapahtuu, kun ne ovat yli viisi vuotta vanhoja? Google tai CMU:n tiimi eivät esittäneet tietoja yli viisi vuotta vanhoista kiintolevyistä, vaikka CMU:n artikkelin johtopäätöksessä on houkutteleva kommentti, jossa väitetään, että vikaantumisprosentti nousee viiden vuoden jälkeen. Tälle väitteelle ei kuitenkaan anneta mitään perusteita.
Backblaze on ollut toiminnassa viisi vuotta, ja kaikki asentamamme asemat ovat uusia asemia, joten meillä ei myöskään ole tietoja tätä vanhemmista asemista. Odotamme mielenkiinnolla, mitä tapahtuu, kun asemista tulee viiden, kuuden, seitsemän ja kahdeksan vuoden ikäisiä.
Jos ekstrapoloit edellisen kaavion viivan ja arvioit, missä vaiheessa puolet asemista on kuollut, saat ennusteen:
Aseman mediaanielinaika on yli kuusi vuotta.
Kun Backblaze aloitti, oltiin huolissaan siitä, että kuluttajaluokan levyasemat eivät kestäisi datakeskuksessa. Jos tämä kuuden vuoden mediaanielinaika pitää paikkansa, se tarkoittaa, että yli puolet asemista kestää kuusi vuotta, ja nuo huolet olivat aiheettomia. Aiomme jatkaa näiden tilastojen päivittämistä neljännesvuosittain. Näin ollen meillä on parin seuraavan vuoden aikana kovalevyjen mediaanielinkaarta koskevia tarkkoja tietoja. Pysy blogissa, niin saat vastaukset selville.
Marraskuu 14: Päivitys
Moinen moka: Kirjoitusvirheen vuoksi toisen kappaleen prosenttiluvut olivat vääriä ja tarpeettoman pessimistisiä. 78 % (ei 74 %) asemista on yhä elossa neljän vuoden kuluttua. Tämä muutos ei vaikuta ennusteeseen kuuden vuoden keskimääräisestä eliniästä. Kiitos tarkkasilmäiselle Fredericille virheen havaitsemisesta.-Brian