De fire vanligste årsakene til tapte data i virtuelle systemer

tirsdag 2. juli 2019 av Tormod Nymoen

Slettede virtuelle disker på grunn av brukerfeil er en klassiker. Her er gode råd når uhellet er ute.

De verste datatapene skyldes IT-eksperter som gjør uheldige feil. Arbeidspresset fører til feil de ellers ikke ville gjort. Ibas Ontrack har i en europeisk undersøkelse avdekket at:

  • Mer enn åtte av ti (84 prosent) sier de har gjort tabber som har resultert i datatap.
  • Over halvparten sier hovedårsaken var stress og overarbeid.
  • 77 prosent føler seg overarbeidet, og peker på økte arbeidstimer.

I halvparten av tilfellene slapp IT-ekspertene unna med skrekken, fordi dataene ble gjenopprettet etter en omstart av systemene. Heldigvis var det kun 3 prosent som tapte dataene for alltid.

Vil du lese mer om gjenoppretting av data i virtuelle miljø? Last ned gratis whitepaper på norsk

Fire feil som går igjen

Slettet eller “forsvunnet” virtuell maskin: Ved mistanke om datatap må første handling være å dokumentere alt="" man husker/vet om den slettede eller forsvunne maskinen. Viktig informasjon er størrelse på disk, tykk eller tynn provisjonering, navnet på maskinen, filsystemet, og hvilket innhold som fantes på maskinen. Deretter er det viktig å stoppe ytterligere aktivitet på det aktuelle systemet, og skru av andre aktive virtuelle maskiner. Her er det enormt viktig at man ikke flytter aktive virtuelle maskiner til og fra den berørte disken uten først å ha konsultert en spesialist på teknisk gjenoppretting. Dette kan føre til rekonstruksjonsjobben blir mye større, pluss at risikoen for datatap øker. Om det handler om en virtuell maskin med tapte eller forsvunne snapshots handler det om å stenge ned maskinen raskest mulig.

Korrupte VMFS metadata eller utilgjengelig fillager (Datastore): Aldri forsøk å gjenskape filene, og om du jobber med LUN-et selv må du være sikker på at du kun bruker lese-tilgang.

Mekaniske diskfeil og utfordringer med Raid/lagring: Om disken lager merkelige mekaniske lyder må den skrus av umiddelbart, og kyndige eksperter bør konsulteres. Når disker fjernes fra RAID-et er det viktig at man noterer ned hvor i systemet de befant seg. Om systemet feiler midt i en gjenskapingsprosess er det viktig at man ikke forsøker igjen. Heller ikke flytt virtuelle maskiner til og fra et RAID man mistenker er i ferd med å feile. Hvis strømmen skal skrus av på RAID-et må administrator først være sikker på at alle virtuelle instanser er skrudd av først.

Korrupte gjeste-OS: Ikke kjør kommandoer som CHKDSK eller defragmenter disker man mistenker er korrupt. Om virtulle maskiner viser illevarslende tegn kan problemet sitte i lagringssystemet. Skru av maskinene og ta kontakt med en ekspert på gjenoppretting snarest.

Dette bør dere ha

  • Definerte planer og prosesser for gjenoppretting etter datatap
  • Godt synlige «føre var»-plakater med anbefalte handlinger når uhell inntreffer
  • Sikkerhetskopier som man er trygge på
  • Lett tilgjengelig kontaktinformasjon til gjenopprettingsspesialister
  • Jevnlige sjekker av systemer, lagring, maskinvare og status på arkiv/sikkerhetskopier
  • Jevnlig kursing og trening på beredskap og handlinger ved datatap
  • Kunnskapen til å vite hvor dere skal stoppe. Ukyndig knoting gjør gjerne vondt verre

Vil du vite mer om hvordan vi jobber? Last ned gratis whitepaper her