Forstå hvordan RAID Lagring fungerer

8. november 2021 af Ontrack Team

 

Redundant Array of Independent Disks (RAID) er en betegnelse, der bruges til datalagringssystemer, der spreder og/eller replikerer data på tværs af flere drev. RAID-teknologien har revolutioneret virksomhedens datalagring og blev designet med to hovedmål: øge datapålidelighed og øge I/O (input/output) ydeevne.

Desværre er RAID-lagring ikke en perfekt teknologi, og resultatet er, at datatab stadig kan forekomme med disse systemer. I dette indlæg vil vi forklare, hvordan RAID-niveauer fungerer, og hvordan data kan lagres (og tabes) med denne type lagring.

 

Hvordan virker RAID?

 

Et RAID-system kombinerer fysiske diske til én simpel logisk enhed ved hjælp af speciel hardware eller software. RAID-løsninger med hardware kan komme i en række forskellige stilarter, lige fra indlejret i bundkortet eller tilføjede kort til store NAS- eller SAN-servere til virksomheder. Operativsystemet (OS) af denne type opsætning er ikke opmærksom på de tekniske funktioner i RAID, så softwareløsninger implementeres typisk i OS.

RAID bruges almindeligvis på servere, men kan også bruges på arbejdsstationer. Sidstnævnte er typisk for lagerfølsomme computere, som dem der bruges til video- og lydredigering, hvor høj lagerkapacitet og høj dataoverførselshastighed er et krav.

 

Ofte brugte termer i RAID-lagring

 

Lad os tage et kig på nogle af de almindelige tekniske udtryk, der bruges til at beskrive aspekter af RAID-lagring:

  • RAID – En teknologi, der understøtter forskellige harddiskkonfigurationer for at opnå størrelsesydelse, pålidelighed og større volumenstørrelser gennem konsolidering af diskurser og paritetsberegninger.

  • Paritet – Distribueret information, der tillader datagendannelse gemt i et RAID-system, selvom disken går ned.

  • Spejling – Når data fra 1 eller flere harddiske kopieres til en anden fysisk disk(er).

  • Striping – En metode, hvor data kan skrives på tværs af flere diske samtidigt. I eksemplet nedenfor skrives data på tværs af flere harddiske i sekventiel rækkefølge, indtil de når den sidste disk. Så hopper den tilbage til den første disk og begynder endnu en strimmel osv.

  • Blok – En blok er den logiske plads på hver disk, hvor dataene skrives, og den samlede plads, der tildeles af RAID-kontrollerne.

  • Venstre/højre symmetri – Symmetri i et RAID-system styrer, hvor meget data og paritet, der distribueres gennem diskene. Der er fire hovedstile af symmetri, der kan bruges, afhængigt af RAID-forhandleren. Nogle virksomheder skaber også deres egne proprietære stilarter afhængigt af forretningsbehov.

  • Hot reserve – Der er forskellige metoder til at håndtere disknedbrud i et RAID-system. En metode involverer brugen af ​​en "hot reserve", som er en reservedisk, der kan bruges i stedet for en ødelagt disk.

  • Degraderet tilstand – Dette sker, når en disk i RAID-systemet bliver ulæselig. Disken betragtes derefter som beskadiget og trukket ud af RAID-systemet. Nye data og paritet skrives derefter til de resterende diske i RAID-systemet. Hvis nogen data vil blive hentet fra den beskadigede disk, vil de blive fundet ved hjælp af paritet fra de andre diske. Dette fald i diske forringer ydeevnen af ​​RAID-systemet.

Lad os nu udforske tre nøglebegreber i RAID (spejling, striping og fejlkobling) og undersøge, hvordan nogle af de mest almindelige niveaukonfigurationer fungerer.

RAID-lagringsniveauer

Som tidligere nævnt involverer spejling kopiering af data til mere end én disk, og stripping opstår, når data er opdelt på mere end én disk, mens fejlkobling opstår, når overflødige data lagres, som en måde at opdage problemer og måske løse dem (kendt som fejltolerance). En eller flere af disse teknikker kan bruges i forskellige RAID-layouts, afhængigt af systemkravene.

Standard RAID-konfigurationer omtales som niveauer. Fem niveauer blev oprindeligt oprettet, men mange variationer har udviklet sig, herunder flere indlejrede niveauer og mange ikke-standardiserede (for det meste proprietære) niveauer. Industrien har allerede set flere niveauer udvikle sig fra RAID 0 til RAID 51 (og videre). Fordi forskellige niveauer har forskellige typer redundans, er der normalt en afvejning mellem fejltolerance og ydeevne, afhængigt af applikationen.

Grundlæggende RAID-niveauer kan omfatte:

  • RAID 0 – Ofte omtalt som ‘striping’, dette betragtes som det mest grundlæggende RAID-niveau. det giver ingen redundans, men fremragende ydeevne. Data er streget over mindst to diske, og med hver disk tilføjet, vil læse-/skriveydelse og lagerkapacitet blive øget over en enkelt disk.

  • RAID 1 – Dette niveau kaldes også ‘spejling’, som spejler de samme data over to diske (som navnet antyder), og giver det laveste niveau af redundans i RAID. Dette niveau giver op til dobbelt læseydelse over en enkelt disk, men ingen stigning i skrivehastigheden. Gemte data er altid tilgængelige, hvis en disk stadig fungerer.

  • RAID 5 – Dette er standardkonfigurationen, der tilbyder et anstændigt kompromis mellem sikkerhed og ydeevne. Det kræver mindst tre diske og giver læsehastighedsfordele, men ingen stigning i skriveydeevne. RAID 5 introducerer ‘paritet’ til arrayet, som optager pladsen på en disk i alt. Dette niveau kan også tolerere et disknedbrud.

  • RAID 6 – Dette tager konceptet med RAID 5 et skridt videre - det kræver minimum fire diske, hvor dobbeltparitet er indført, hvilket betyder, at data kan gendannes, selvom to diske kollapser inde i arrayet.

Moderne RAID-arrays

Der er mange måder at få mere ud af dit RAID-system på. Men i betragtning af den meget komplekse og tekniske tilgang til moderne arrays (og hvordan de kan bruges sammen med andre komplekse systemer til betydelige effektivitets- og omkostningsbesparelser, såsom virtualisering), er det ikke ualmindeligt, at en af ​​disse teknologier går i stykker. Dette kan forårsage betydelige datatab på grund af sammenkobling af flere systemer og kan som følge heraf koste virksomheder millioner i nedetid.

Moderne RAID-arrays kan også bruge flere filsystemer, såsom BTRFS eller ZFS på hardwareniveau, med NTFS eller HFS beregnet til virtualiseringsapplikationsunderstøttelse.

RAID data Recovery - udfordringer:

RAID-arrays er meget komplekse. Dette intensiveres ofte inden for en virksomheds IT-strukturer, da RAID-systemer mest bruges i forretningskritiske applikationer, hvor tilgængelighed og effektivitet er afgørende faktorer. Yderligere teknologier, såsom virtualisering eller databaseapplikationer, kan også være katastrofale for en virksomhed, hvis systemet går ned.

Fra et datarekonstruktionsperspektiv bliver det normalt nødvendigt at rekonstruere RAID-filsystemet og omgå eventuelle fysiske fejl, samt at få adgang til enhver eksisterende virtualiseret arkitektur. Denne proces gør rekonstruktionsforsøg komplekse og tidskrævende, men datarekonstruktion kan være vellykket i mange tilfælde.

Forbered dig på disknedbrud

Desværre kan (og vil) diske gå ned på et tidspunkt i deres liv. Hvis der opstår et nedbrud, der involverer individuelle diske (forudsat at det er et RAID 1 eller større system), kan den beskadigede disk erstattes med en ny, og datalagringen kan genopbygges uden datatab. Men hvis diskfejlen overstiger RAID-redundanskapaciteten, bør en professionel RAID-datarekonstruktionsspecialist  kontaktes med det samme for at få den bedste chance for datagendannelse. Det er meget vigtigt, at din valgte specialist har de nødvendige værktøjer og ekspertise til at udføre gendannelse fra enhver konfigurations- eller datatabssituation. Du bør overveje, om de har direkte partnerskaber med forhandlere af lagerløsninger og udviklerfærdigheder for at imødekomme nye eller tilpassede konfigurationer.

Har du oplevet RAID-datatab for nylig? Kontakt eksperterne hos Ibas Ontrack for at få hjælp til at gendanne dine kritiske data. Vores personale eller til rådighed 24/7/365 for at hjælpe dine behov, fra hverdagssager til situationer med datatab en gang i livet.