Leksjon i datahistorie: RAID teknologi

mandag 8. november 2021 av Ontrack

RAID Technology

Når det kommer til IT-industrien, skjer det ikke ofte at en teknologi som ble utviklet for flere tiår siden fremdeles betraktes som viktig nok til fortsatt bruk av administratorer og sluttbrukere. Selv moderne servere og lagringssystemer kjører på   RAID teknologi- stort sett i bedrifter, men den er blitt utbredt i forbrukernes NAS-systemer også. RAID har overlevd i mer enn 30 år, og spiller fremdeles en ledende rolle innen datalagring til denne dag. Hvorfor det? Fint du spurte.

La oss starte fra begynnelsen.

I 1987 klekket David Patterson, Garth A. Gibson og Randy Katz ut termen RAID mens de var ved University of California i Berkeley. Følgende år publiserte de artikkelen “Case for Redundant Arrays of inexpensive Disks” i anledning av SIGMOD konferansen i juni 1988. På den tiden var harddisker fremdeles ganske dyre og å prøve holde datalagring "slankt" var ikke bare vanlig, men en nødvendighet. I tillegg brukte bedrifter stormaskiner, da stasjonære datamaskiner ikke var blitt vanlige på arbeidsplasser ennå. Dette begynte å endre seg da populariteten for personlige datamaskiner økte.

Konsekvent ble  harddisker for de første ikke-stordatamaskinene mye billigere enn de brukt i storsystemer, og dette ble årsaken til at Garth, Gibson og Katz kunne utvikle konseptet om RAID. De argumenterte med at flere sammenkoblede, og billigere, harddisker kunne gi større ytelse enn en enkelt, toppharddisk for en stormaskin. Og selv om bruken av mange harddisker betød at feilfrekvensen ville øke, var det mulig å konfigurere dem for redundans, slik at påliteligheten til en slik matrise ville overgå påliteligheten til en enkelt stormaskinstasjon.

RAID-lagring forklart

RAID er basert på konseptet om at data spredes eller kopieres over flere billige eller uavhengige stasjoner. Stasjonere innen systemet konfigureres for at data kan deles opp eller kopieres over to eller flere disker for lastfordeling eller for å gjøre det lettere å gjenopprette data hvis stasjonen bryter sammen. Det finnes to tekniske måter å oppnå dette på: enten med en maskinvareløsning (en dedikert RAID-kontroller), eller med en programvareløsning, som typisk inkluderes i moderne operativsystemer. Maskinvare-baserte systemer administrerer RAID uavhengig fra vertsdatamaskinen som bruker RAID-kontrollen, slik at operativsystemet er ukjent med de tekniske funksjonene til RAID, og bare ser hele lagringssystemet som om det var et enkelt volum koblet til vertsdatamaskinen.

Foruten disse tekniske implementeringen, er RAID-konseptet basert på følgende tre grunnleggende prinsipper:

  1. Paritet - en måte å distribuere informasjon gjennom et RAID-system, som tillater datalagring i tilfelle en stasjon bryter sammen.
  2. Redundans - dupliseringen av kritiske komponenter innenfor systemarkitekturen, for å øke pålitelighet og som sikkerhetsmekanisme. Kort fortalt, tillater det at flere komponenter kan feile, før hele systemet feiler, og i et RAID-systems tilfelle er disse komponentene stasjonene.
  3. Speiling - når samme data kopieres fra en stasjon til en annen. Striping betyr en annen metode, hvor dataen skrives over flere stasjoner samtidig. Diverse RAID-oppsett bruker en eller flere av disse teknikkene, avhengig av systemkrav.

Basert på disse prinsippene, har man utviklet følgende standard RAID-nivåer:

  • RAID 0 bruker striping og er det mest grunnleggende RAID-nivået. Det gir ingen redundans, men den øker ytelsen. Lese/skrive ytelse og lagringskapasitet økes over en enkelt stasjon når data stripes over minst to stasjoner og med hver stasjon som legges til. Hvis en stasjon bryter sammen, har RAID-kontrolleren ingen mulighet til å bygge den opp igjen.
  • RAID 1 bruker speiling, som speiler data over to stasjoner, slik uttrykket antyder, og gir derfor det laveste nivået av redundans innen RAID-systemet. RAID 1 kan doble leseytelsen over en enkelt stasjon, men gir ingen økning i skrivehastighet. Dette nivået kan tillate at en stasjon bryter sammen.
  • RAID 5 er en vanlig konfigurasjon og det leverer et anstendig kompromiss mellom pålitelighet og ytelse. Det gir økning i lesehastigheter, men ingen økning i skrivehastighet. RAID 5 introduserer paritet, som totalt krever all plassen på en stasjon. Dette nivået kan håndtere at en stasjon bryter sammen. Hvis du har en hot reservedel konfigurert som 5. disk, kan denne sitte som en inaktiv stasjon i systemet, uten at noe data lagres til det. Hvis en stasjon feiler, kan dataen gjenopprettes til den hotte reservedelen ved hjelp av paritet over andre stasjoner. Når dataen er gjenopprettet, kan du fjerne den sammenbrutte stasjonen og erstatte den med en ny en, som blir en ny hot reservedel.
  • RAID 6 tar konseptet til RAID 5 og legger til mer redundans med dobbel-paritet. Dette tillater gjenoppretting av data selv om to disker feiler innen matrisen. Dobbel-pariteten er spredt over alle stasjonene og tar plassen til to disker.

Over årene er mange flere RAID-nivåer blitt utviklet, hovedsakelig av produsenter av RAID-systemer. TI dag har vi RAID-nivåer som strekker seg fra RAID 0 til RAID 61 og videre, hvor store bedrifter utvikler tilpassede RAID-nivåer som støtter forskjellige applikasjoner og krav til infrastruktur.

Stasjonsfeil og farene ved RAID

Hvis stasjonsfeil forekommer i en RAID 1 eller   RAID 5-konfigurasjon, så bør ikke brukeren erstatte den sammenbrutte disken før all data fra de gjenværende diskene har backup. I mange tilfeller er muligheten for at en stasjon til vil bryte sammen høyere, særlig når løsningsstasjonene kommer fra samme produsent. Og her ligger faren i konseptet:

Selv med alle fordelene som RAID tilbyr, inkludert bedre ytelse og datasikkerhet, pleier brukere å glemme at RAID ikke er et backup-system. RAID kan brukes i kombinasjon med backups, slik at hele lagringssystemet blir mer sikkert, men et RAID-system skal aldri brukes istedenfor et backup-system.. Tvert imot, når et RAID-system feiler pga. f.eks. feilfunksjon i maskinvaren som fungerer som RAID-kontroller, er det mye mer komplisert å få RAID opp og kjøre igjen og å gjenopprette tapte data.

NAS-systemer er blitt rimeligere for hjemmebrukere. De bruker innebygde RAID-konfigurasjoner i kombinasjon med andre avanserte lagringssystemer, som deduplikasjon, for å få så mye plass som mulig ut av systemet sitt. Men dette har sin pris: i mange tilfeller er disse systemene ukorrekt satt opp, og når det skjer et sammenbrudd, vil hele systemet bryte sammen.

Enten du er hjemmebruker eller IT-administrator for en bedrift, er det viktig å overveie nøye hvilket RAID-nivå som passer til dine behov, eller om et RAID-system er nødvendig i det hele tatt. Husk at uaktsomhet i begynnelsen kan føre til alvorlige problemer, høye kostnader og til slutt mulig datatap. 

Det forskes fortsatt på ne måter for datalagring, og nye løsninger blir oppfunnet og videreutviklet hele tiden, men gitt hvor nyttig RAID har vist seg å være, er det ikke sannsynlig at det forsvinner med det samme.

Hvis du har behov for datagjenoppretting fra et RAID-system, så ikke nøl med å  kontakte ekspertene hos Ontrack..