Tietojenkäsittelyhistorian oppitunti: RAID-tekniikka

maanantai 8. marraskuuta 2021 - Ontrack

RAID Technology

IT-alalla on suhteellisen harvinaista, että vuosikymmeniä sitten kehitettyä tekniikkaa pidetään edelleen sen verran tärkeänä, että järjestelmänvalvojat ja muut käyttäjät edelleen käyttävät sitä laajasti. Jopa nykyaikaiset palvelimet ja tallennusjärjestelmät käyttävät RAID-tekniikkaa. Enimmäkseen sitä käytetään yrityksissä, mutta se on yleistynyt myös kuluttajien NAS-järjestelmissä. RAID on pysynyt käytössä yli 30 vuotta – ja sillä on edelleen tärkeä rooli tietojen tallentamisessa tänäkin päivänä. Mistä tämä johtuu? Hyvä, että kysyit.

Aloitetaan ihan alusta.

Vuonna 1987 David Patterson, Garth A. Gibson ja Randy Katz keksivät termin RAID Kalifornian yliopistossa Berkeleyssä. Seuraavana vuonna he julkaisivat tutkielman nimeltään Case for Redundant Arrays of inexpensive Disks (vikasietoisten asemien edut edullisissa levyissä) SIGMOD-konferenssissa kesäkuussa 1988. Kiintolevyt olivat tuolloin vielä varsin kalliita, joten tietojen tallennusratkaisujen pitäminen kevyenä ei ollut vain yleistä, vaan myös välttämätöntä. Lisäksi yritykset käyttivät yhä valtavia keskustietokoneita, sillä pöytäkoneet eivät olleet vielä levinneet laajalti työpaikoilla. Tämä alkoi kuitenkin muuttua, kun henkilökohtaisten tietokoneiden käyttö yleistyi.

Tämän johdosta kiintolevyt ensimmäisille ei-keskustietokoneille olivat paljon halvempia kuin keskustietokoneissa käytetyt – ja näin ollen se oli syy sille, miksi Garth, Gibson ja Katz kehittivät RAID-konseptin. He uskoivat, että useat liitetyt ja halvemmat kiintolevyt päihittäisivät yhden huipputason keskuskoneen kiintolevyn suorituskyvyltään. Ja vaikka useiden kiintolevyjen käyttö merkitsi virheprosentin lisääntymistä, ne oli mahdollista määrittää vikasietoisiksi siten, että tällaisen ryhmän luotettavuus voisi huomattavasti ylittää minkä tahansa suuren yksittäisen keskustietokoneen kiintolevyn luotettavuuden.

RAID-tallennus selitettynä

RAID perustuu ajatukseen siitä, että data leviää tai replikoituu useiden halpojen tai itsenäisten asemien kesken. Järjestelmän asemat on määritetty niin, että tiedot voidaan jakaa tai replikoida kahdelle tai useammalle asemalle kuorman jakamista tai tietojen palauttamista varten, jos asemassa ilmenee vika. On kaksi teknistä tapaa saavuttaa tämä: joko laitteistoratkaisulla (oma RAID-ohjain) tai ohjelmistoratkaisulla, joka tyypillisesti sisältyy nykyaikaisiin käyttöjärjestelmiin. Laitteistopohjaiset järjestelmät hallitsevat RAIDia itsenäisesti isäntätietokoneesta RAID-ohjaimen avulla, joten käyttöjärjestelmä ei ole tietoinen RAIDin teknisestä toiminnasta, vaan näkee koko tallennusjärjestelmän ikään kuin se olisi yksi isäntätietokoneeseen kytketty taltio.

Näiden teknisten toteutusten lisäksi RAID-konsepti perustuu seuraaviin kolmeen perusperiaatteeseen:

  1. Pariteetti on tapa jakaa tietoa RAID-järjestelmässä, mikä mahdollistaa tietojen palauttamisen aseman vian sattuessa.
  2. Vikasietoisuus tarkoittaa kriittisten komponenttien päällekkäisyyttä järjestelmäarkkitehtuurin luotettavuuden lisäämiseksi ja toimintavarmuuden takaamiseksi. Pohjimmiltaan tämä mahdollistaa sen, että useissa komponenteissa voi esiintyä vikoja, ennen kuin koko järjestelmä epäonnistuu – ja RAID-järjestelmien tapauksessa komponentteja ovat asemat.
  3. Peilaaminen tarkoittaa sitä, kun samat tiedot kopioidaan levyltä toiselle. Lomitus (raidoitus) on toinen tapa, jossa tiedot kirjoitetaan useille levyille. Eri RAID-kokoonpanoissa voidaan käyttää yhtä tai useampaa näistä tekniikoista järjestelmän vaatimusten mukaan.

Näiden periaatteiden pohjalta on kehitetty seuraavat RAID-vakiotasot:

  • RAID 0käyttää lomitusta ja on yksinkertaisin RAID-taso. Se ei tarjoa vikasietoisuutta, mutta se parantaa suorituskykyä. Tiedot lomitetaan vähintään kahdelle levylle, ja jokaisen lisätyn levyn myötä luku- ja kirjoitusnopeus parantuu ja tallennuskapasiteetti kasvaa. Jos yksi asema epäonnistuu, RAID-ohjain ei voi rakentaa sitä uudelleen.
  • RAID 1käyttää peilausta, joka, kuten nimestä voi päätellä, peilaa samat tiedot kahdelle levylle, joten se tarjoaa alhaisimman RAID-vikasietoisuustason. RAID 1 voi kaksinkertaistaa lukusuorituskyvyn yhdellä asemalla, mutta se ei lisää kirjoitusnopeutta. Tämä taso sallii yhden aseman epäonnistumisen.
  • RAID 5on yleinen kokoonpano, joka tarjoaa hyvän kompromissin luotettavuuden ja suorituskyvyn välillä. Se lisää lukunopeuksia, mutta ei lisää kirjoitussuorituskykyä. RAID 5 tuo kokoonpanoon pariteetin, joka vie kokonaan yhden levyn tilan. Tämä taso pystyy käsittelemään yhden levyvian. Jos sinulla on hot spare -vara-asema, joka on määritetty viidenneksi asemaksi, tämä voi olla järjestelmän käyttämättömänä asemana, eikä siihen ole tallennettu tietoja. Jos yksi levy epäonnistuu, tiedot voidaan rakentaa uudelleen hot spare -vara-asemalle muiden asemien pariteetissa olevien tietojen avulla. Kun tietojen uudelleenrakentaminen on valmis, voit poistaa viallisen aseman ja korvata sen uudella, josta tulee uusi hot spare -vara-asema.
  • RAID 6 perustuu RAID 5 -konseptiin, mutta se lisää vikasietoisuutta kaksoispariteetilla. Tämä mahdollistaa tietojen luomisen uudelleen, vaikka kokoonpanon kaksi levyä epäonnistuisi. Kaksoispariteetti jakautuu kaikille levyille ja vie kahden aseman tilan.

Vuosien varrella (pääasiassa) RAID-järjestelmien valmistajat ovat kehittäneet monia muita RAID-tasoja. Nykyään meillä on RAID-tasoja RAID 0:sta aina RAID 61:een ja sitä pidemmällekin. Lisäksi usein suuryritykset luovat mukautettuja RAID-tasoja tukemaan erilaisia sovelluksia ja infrastruktuurivaatimuksia.

Asemaviat ja RAID-ratkaisun vaarat

Jos levyvirhe tapahtuu RAID 1- tai RAID 5 -kokoonpanossa, käyttäjän ei tule vaihtaa viallista asemaa ennen kuin on varmistettu, että kaikki tiedot jäljellä olevilta levyiltä on varmuuskopioitu. Monissa tapauksissa, varsinkin kun ratkaisussa käytetään levyjä, jotka on valmistettu samassa tuotantoerässä, mahdollisuus sille, että myös toinen levy vioittuu pian, on melko suuri. Ja tässä piilee tämän tekniikan vaara:

vaikka RAID tarjoaakin monia etuja, esimerkiksi paremman suorituskyvyn ja tietojen suojauksen, käyttäjät usein unohtavat sen, että RAID ei ole varmuuskopio.RAIDia voidaan käyttää yhdessä varmuuskopioiden kanssa, mikä tekee koko tallennusjärjestelmästä paljon turvallisemman, mutta RAIDia ei tule koskaan käyttää varmuuskopion sijasta. Päinvastoin, kun RAID-järjestelmä epäonnistuu esimerkiksi viallisen RAID-laitteisto-ohjaimen takia, RAIDin saaminen takaisin käyttöön ja kadonneiden tietojen palauttaminen on paljon monimutkaisempaa.

NAS-järjestelmistä on tullut edullisempia kotikäyttäjille. Niissä käytetään sisäisiä RAID-kokoonpanoja yhdessä muiden kehittyneiden tallennustekniikoiden kanssa, esimerkiksi päällekkäisyyksien poistamisen kanssa, jotta saadaan mahdollisimman paljon tilaa järjestelmään. Tällä on kuitenkin hintansa: monissa tapauksissa nämä järjestelmät on määritetty väärin, jolloin vian ilmetessä koko järjestelmä hajoaa.

Olitpa sitten kotikäyttäjä tai yrityksen IT-järjestelmänvalvoja, on tärkeää harkita tarkasti, mikä RAID-taso sopii tarpeisiisi tai onko RAID ylipäänsä tarpeen. Muista, että huolimattomuus alkuvaiheissa voi johtaa vakaviin ongelmiin, korkeisiin kustannuksiin ja mahdolliseen tietojen menetykseen.

Uusia tapoja tallentaa tietoja tutkitaan, keksitään ja kehitetään jatkuvasti ajan myötä, mutta historian perusteella on todennäköistä, että RAID ei katoa vielä mihinkään lähitulevaisuudessa.

Jos tarvitset RAID-tietojen palautusta, älä epäröi ottaa yhteyttä Ontrackin asiantuntijoihin .