Lektion i datahistorik: RAID-tekniken

den 8 november 2021 av Ontrack

RAID Technology

När det kommer till IT-branschen är det inte ofta som en teknik som utvecklades för flera årtionden sedan fortfarande är betydelsefull nog för att användas i stor utsträckning av administratörer och andra användare. Även moderna servrar och lagringssystem kör  RAID-teknik – framför allt på företag, men allt oftare i NAS-konsumentsystem. RAID har överlevt i över 30 år, och har en viktig roll inom datalagring än i dag. Varför är det så? Kul att du frågade.

Låt oss börja från början.

1987, under sin studietid vid University of California i Berkeley (USA), myntade David Patterson, Garth A. Gibson och Randy Katz termen RAID. Året därpå publicerade de en artikel om redundanta arrayer med billiga diskar i anslutning till SIGMOD-konferensen i juni 1988. Dåförtiden var hårddiskar fortfarande relativt dyra och det var inte bara vanligt att försöka effektivisera datalagringen, utan rentav nödvändigt. Dessutom använde företagen gigantiska stordatorer eftersom den stationära datorn inte riktigt gjort sitt intåg på arbetsplatserna än. Situationen förändrades emellertid i takt med att persondatorn ökade i popularitet.

Så, hårddiskarna till de första persondatorerna var betydligt billigare än dem som användes i stordatorsystemen, och är anledningen till att Garth, Gibson och Katz utvecklade RAID-konceptet. De var övertygade om att flera anslutna, och billigare, hårddiskar kunde överträffa en enda stordatorhårddisk i fråga om prestanda. Och även om användningen av flera hårddiskar skulle medföra en högre felfrekvens, skulle det gå att konfigurera dem för redundans så att tillförlitligheten i en sådan array vida överträffade den hos en stor enstaka stordatordisk.

Så här fungerar RAID-lagring

RAID baseras på konceptet att data distribueras, eller replikeras, över flera billiga eller oberoende enheter. Enheterna i systemet är konfigurerade så att data kan delas upp eller replikeras mellan två eller flera enheter för belastningsfördelning eller för att hjälpa till att återställa data om en enhet får problem. Tekniskt sett kan detta åstadkommas med någon av två metoder: med en maskinvarulösning (en dedikerad RAID-styrenhet) eller med en programvarulösning, som vanligtvis ingår i moderna operativsystem. Maskinvarubaserade system hanterar RAID oberoende av värddatorn med hjälp av en RAID-styrenhet, så operativsystemet vet inte hur RAID fungerar rent tekniskt och ser hela lagringssystemet som om det var en enda volym ansluten till värddatorn.

Förutom dessa tekniska implementeringar bygger RAID-konceptet på följande tre grundläggande principer:

  1. Paritet – Ett sätt att distribuera information i ett RAID-system som gör att data kan återställas i händelse av diskfel.
  2. Redundans – Dupliceringen av kritiska komponenter i systemarkitekturen för att öka tillförlitligheten och skydda vid fel. Enkelt förklarat kan flera komponentfel inträffa innan hela systemet får problem, och i fallet med RAID-system är komponenterna enheterna.
  3. Spegling – När samma data dupliceras från en disk till en annan. Striping är en annan metod där data skrivs på flera diskar. Olika RAID-konfigurationer använder en eller flera av dessa tekniker, beroende på systemkraven.

Baserat på dessa principer har följande RAID-standardnivåer utvecklats:

  • RAID 0 använder striping och är den mest grundläggande RAID-nivån. Den ger ingen redundans, men ökar prestanda. Data fördelas jämnt mellan minst två diskar och med varje disk som läggs till ökar läs-/skrivprestanda och lagringskapaciteten på en enskild enhet. Om en enhet får problem finns det ingen möjlighet för RAID-styrenheten att återskapa den.
  • RAID 1 använder spegling, som, som namnet antyder, speglar samma data på två diskar, och ger RAID-redundans på den lägsta nivån. RAID 1 kan fördubbla läsprestanda på en enskild enhet, men ökar inte skrivhastigheten. Den här nivån tolererar att en disk slutar fungera.
  • RAID 5 är en vanlig konfiguration och är en bra kompromiss mellan tillförlitlighet och prestanda. Den här nivån ger högre läshastighet, men ökar inte skrivprestanda. RAID 5 introducerar paritet, som tar upp utrymmet på totalt en disk. Den här nivån kan hantera ett diskfel. Om en reservdisk (hot spare) har konfigurerats som en femte enhet kan den vara en inaktiv disk i systemet som inga data sparas till. Om en disk får problem kan data återskapas till reservdisken med hjälp av data i paritet mellan de andra enheterna. När alla data har återskapats kan du ta bort den defekta enheten och ersätta den med en ny, som blir den nya reservdisken.
  • RAID 6 bygger vidare på konceptet med RAID 5 och tillför ytterligare redundans med dubbelparitet. Det gör att data kan återskapas även om två diskar i arrayen slutar fungera. Dubbel paritet sprids ut mellan alla diskar och tar upp utrymmet på två enheter.

Med tiden har många fler RAID-nivåer utvecklats, framför allt av RAID-systemtillverkare. Idag har vi RAID-nivåer som sträcker sig från RAID 0 ända till RAID 61 och ännu högre, med större företag som utvecklar anpassade RAID-nivåer för att ge stöd för olika tillämpningar och infrastrukturkrav.

Diskfel och farorna med RAID

Om ett diskfel inträffar i en RAID 1- eller  RAID 5-konfiguration är det viktigt att säkerställa att alla data från de återstående diskarna har säkerhetskopierats innan den fallerande enheten byts ut. Ofta, särskilt om diskar från samma tillverkningsserie användes i lösningen, är risken för att en till disk får problem relativt stor. Och det är här faran med RAID ligger:

Även med alla fördelar som RAID erbjuder, inklusive bättre prestanda och datasäkerhet, glömmer användarna lätt att RAID inte är en säkerhetskopia. RAID kan användas i kombination med säkerhetskopior, så att hela lagringssystemet blir mycket säkrare, men RAID ska aldrig användas i stället för en säkerhetskopia. Om ett RAID-system till exempel slutar fungera på grund av problem med RAID-maskinvarustyrenheten är det nämligen betydligt mer komplicerat att få igång RAID-systemet igen och återställa förlorade data.

NAS-system har blivit mer prisvärda för hemanvändare. De använder de inbyggda RAID-konfigurationerna i kombination med annan avancerad lagringsteknik, såsom deduplicering, för att få ut maximalt med utrymme ur deras system. Men det har sitt pris – systemen är ofta felinställda och om det uppstår ett fel kraschar hela systemet.

Vare sig du är en hemanvändare eller IT-administratör på ett företag är det viktigt att du tänker igenom vilken RAID-nivå som passar dina behov, eller huruvida RAID ens behövs. Slarv i början kan leda till allvarliga problem, stora kostnader och kanske även dataförlust. 

Nya metoder för att lagra data utforskas, uppfinns och utvecklas hela tiden, men om vi ser till dess meriter är det högst troligt att RAID kommer att finnas kvar ett bra tag till.

Om du behöver hjälp med RAID-dataåterställning är du välkommen att  höra av dig till experterna på Ontrack.

img_600x600_shirtontrack

Ring för omedelbar hjälp!