Hur länge håller disketter? Det korta svaret är: Vi vet inte än, men det är längre än du kan gissa.
Varför vet inte ett företag som låter mer än 25 000 diskettstationer snurra hela tiden hur länge de håller? Backblaze har tillhandahållit tillförlitlig och obegränsad säkerhetskopiering online i över fem år. Under de senaste fyra åren har vi haft tillräckligt många diskar för att tillhandahålla bra statistik, men 74 % 78 % av de diskar vi köper lever längre än fyra år. Så även om 26 % 22 % av hårddiskarna går sönder under de första fyra åren, och vi har detaljerad information om felfrekvensen för hårddiskar under de första fyra åren, vet vi ännu inte vad som kommer att hända efter det. Så hur länge håller hårddiskar? Fortsätt läsa.
Hur hårddiskar används hos Backblaze
Backblaze använder många hårddiskar för att lagra data. 45 hårddiskar monteras i varje Backblaze Storage Pod, och Storage Pods monteras i rack i våra datacenter. När nya kunder registrerar sig köper vi fler hårddiskar, testar dem och installerar dem. Vi är uppe i 75 petabyte molnlagring nu.
För att distribueras testas varje Backblaze Storage Pod, inklusive tester av alla diskar i den. Nyligen skrev Andy om Stephen, en hårddisk som inte klarade testet. Andys inlägg beskriver den process som Backblaze använder för att konfigurera, belastningstesta och distribuera en Storage Pod.
Typer av hårddiskar i analysen
Backblaze har standardiserat på hårddiskar av ”konsumentkvalitet”. Även om hårddiskföretag säger att dessa hårddiskar inte är utformade för att fungera i RAID-matriser eller för den 24×7-arbetsbelastning som råder i en datacentermiljö, använder Backblaze mjukvaruredundans för att skydda data. I ett framtida blogginlägg kommer vi att fördjupa oss i statistiken som jämför hårddiskar av ”konsumentkvalitet” och hårddiskar av ”företagskvalitet”.
De allra flesta av dessa hårddiskar är ”råa” eller ”interna” hårddiskar. Men eftersom den thailändska hårddiskkrisen gjorde det nästan omöjligt att hitta interna hårddiskar till försäljning till rimliga priser började Backblaze odla hårddiskar. Ungefär sex petabyte av hårddiskarna i denna analys var alltså ursprungligen ”externa” hårddiskar som ”plockades ut” ur sina höljen.
Antal hårddiskar
Diagrammet nedan visar åldersfördelningen av hårddiskarna i Backblazes datacenter. Diagrammets form är främst en avspegling av företagets tillväxt och att det tillkom hårddiskar i takt med att kundbasen växte. Totalt sett är det inte så många enheter som går sönder.
Felprocent
För att dyka ner i uppgifterna om felprocent är det värt att ägna lite tid åt att klargöra vad exakt en felprocent innebär. Vid en första anblick kan man tro att en felprocent på 100 % är det värsta tänkbara. Varje enhet går sönder! Det är dock inte hela sanningen.
Föreställ dig att du har en leverantör av hårddiskar som tillhandahåller hårddiskar som är 100 % tillförlitliga i sex månader, men som sedan alla går sönder vid den tidpunkten. Vad är den årliga felprocenten? Om du måste ha 100 hårddiskar igång hela tiden måste du byta ut hårddisken i varje fack två gånger om året. Det innebär att du måste byta ut 200 hårddiskar varje år, vilket gör att den årliga felfrekvensen blir 200 %. Åtminstone i teorin finns det alltså ingen värsta möjliga felfrekvens. Om varje enhet skulle gå sönder efter en timmes användning skulle den årliga felfrekvensen vara 876 000 %. Lyckligtvis är de hårddiskar som Backblaze får mer tillförlitliga än så.
The Bathtub Curve
Tillförlitlighetsingenjörer använder något som kallas Bathtub Curve för att beskriva förväntade felfrekvenser. Tanken är att fel kommer från tre faktorer: (1) fabriksfel som leder till ”spädbarnsdödlighet”, (2) slumpmässiga fel och (3) delar som slits ut, vilket leder till fel efter mycket användning. Diagrammet nedan (anpassat från Wikimedia Commons) visar hur dessa tre faktorer kan förväntas ge en badkarformad kurva för felfrekvens.
Teorin stämmer överens med den verklighet som Backblaze upplever. Diagrammet nedan visar felfrekvensen för hårddiskar under varje fjärdedel av deras livslängd. Under de första 18 månaderna svävar felprocenten runt 5 %, sedan sjunker den ett tag för att sedan stiga rejält ungefär efter tre år. Vi ser inte så mycket ”spädbarnsdödlighet”, men det ser ut som om tre år är den punkt där hårddiskarna börjar slitas ut.
Beräkning av livslängd
Vad är den förväntade livslängden för en hårddisk? För att besvara den frågan måste vi först bestämma vad vi menar med ”förväntad livslängd”.
När man mäter människors förväntade livslängd är det vanliga måttet det genomsnittliga antalet år som återstår vid en viss ålder. Så när vi säger att den förväntade livslängden för nyfödda i världen år 2010 är 67,2 år, säger vi att om vi väntar tills alla dessa nya människor har levt sina liv på 120 eller 130 år, kommer den genomsnittliga livslängden att vara 67,2.
För diskettdiskar kan det hända att alla diskettdiskar kommer att slitas ut innan de är 10 år gamla. Eller så kan det vara så att några av dem håller i 20 eller 30 år. Om några av dem lever väldigt, väldigt länge blir det svårt att beräkna genomsnittet. Dessutom kan några få outliers kasta bort genomsnittet och göra det mindre användbart.
Det tal som vi snart kommer att kunna beräkna, och det som med större sannolikhet kommer att vara användbart, är medianlivslängden för en ny hårddisk. Med andra ord, vid vilken ålder har hälften av enheterna gått sönder? Vi börjar få en aning om vad svaret kommer att bli.
Diskettöverlevnadsfrekvens
På internet är det förvånansvärt svårt att få svar på frågan ”Hur länge håller en hårddisk?”. Det du hittar är mestadels anekdotiska berättelser, eller kanske hänvisningar till Googles och CMU:s studier, men ingen av dem svarar egentligen på frågan.
De anekdoter du får ger dig ingen användbar information:
- Från tomshardware.com: ”Jag har haft hårddiskar som kommit DOA, några som dött efter en dag och några som klarat sig i 10 år. Det finns helt enkelt inget sätt att säga hur länge en hårddisk kommer att leva.”
- Från CNET: ”Jag vet inte om 5 år. Min WD dog efter 2 år.”
- Under de första ett och ett halvt åren går enheterna sönder med 5,1 % per år.
- Under de följande ett och ett halvt åren går enheterna sönder MINDRE, med cirka 1,4 % per år.
- Efter tre år skjuter emellertid felprocenten i höjden till 11,8 % per år.
Googles studie innehåller en del intressant information om felprocenten. De fann att temperaturen inte spelar så stor roll som man kan tro och att SMART-kontrollerna av en enhet inte är särskilt bra på att förutsäga fel på enheten.
CMU:s studie fann att tillverkarnas medeltid mellan fel (MTBF) är överdrivna. Enheterna går sönder mycket mer än vad MTBF-angivelsen indikerar.
Diagrammet nedan visar procentandelen enheter hos Backblaze som fortfarande lever vid olika åldrar:
De flesta enheterna lever fortfarande
Diagrammet ovan kan vara vilseledande. Vid en första anblick verkar det som om de flesta enheterna redan har dött och alla är på väg att dö inom det närmaste året. Men om du ritar om diagrammet med botten vid 0 kan du se att nästan 80 % av alla de hårddiskar som Backblaze någonsin har köpt fortfarande fungerar!
Hur länge håller hårddiskarna?
Vad händer med hårddiskarna när de är äldre än fem år? Varken Google eller CMU-teamet presenterade några uppgifter om hårddiskar som är äldre än fem år, även om CMU-artikeln har en lockande kommentar i sin slutsats där det hävdas att felfrekvensen ökar efter fem år. Det finns dock ingen grund för det påståendet.
På Backblaze har vi varit igång i fem år, och alla hårddiskar vi installerar är nya hårddiskar, så vi har inte heller några uppgifter om hårddiskar som är äldre än så. Vi ser fram emot att ta reda på vad som kommer att hända när enheterna blir fem, sex, sju och åtta år gamla.
Om du extrapolerar linjen från det föregående diagrammet för att uppskatta vid vilken tidpunkt hälften av enheterna har dött, får du en förutsägelse:
Medianlivslängden för en enhet kommer att vara över sex år.
När Backblaze startade fanns det vissa farhågor om att diskdiskar av konsumentkvalitet inte skulle hålla i ett datacenter. Om denna medianlivslängd på sex år stämmer innebär det att mer än hälften av diskarna kommer att hålla i sex år, och dessa farhågor var ogrundade. Vi har för avsikt att fortsätta att uppdatera denna statistik kvartalsvis. Under de närmaste åren kommer vi således att ha hårda uppgifter om medianlivslängden för hårddiskar. Håll dig uppdaterad på bloggen för att få reda på svaren.
Nov 14: Uppdatering
Mitt fel: På grund av ett transkriptionsfel var procentsatserna i andra stycket felaktiga och mer pessimistiska än nödvändigt. 78 procent (inte 74 procent) av enheterna lever fortfarande efter fyra år. Prognosen om en medianlivslängd på sex år påverkas inte av denna ändring. Tack till Frederic för att han upptäckte felet.-Brian