Stisni me nežno
Ena od teh tehnologij je tudi kompresija podatkov, ki je prisotna na trgu že dalj časa. V računalniški in informacijski terminologiji je kompresija podatkov proces kodiranja podatkov, pri katerem je rezultat manjše število bitov, kot jih je imela izvorna informacija. Vendar ta tehnologija ni bila v splošni uporabi, temveč se je uporabljala večinoma v večjih in kompleksnejših sistemih, poleg tega pa je bil stranski učinek zmanjšanje performans sistema. Za kompresijo podatkov na napravah, kot so trakovi za arhiviranje ali VTL, je v velikih primerih potrebno uporabljati dodatno in drago strojno opremo.
Podjetje NetApp je z zadnjo različico operacijskega sistema DataONTAP uvedel na svoje diskovne sisteme poleg drugih funkcionalnosti tudi kompresijo. Kompresija podatkov se izvaja takoj, ko podatki pridejo na primarni diskovni sistem, s tem da ima proces kompresije minimalen učinek na performanse samega diskovnega istema. Zaradi tega podjetje NetApp nudi to tehnologijo brezplačno na vseh svojih diskovnih sistemih z operacijskim sistemom DataOntap 8.1 brez kakršnekoli dodatne strojne opreme.
KAJ JE KOMPRESIJA PODATKOV
Tehnologija kompresije podatkov je ena od funkcionalnosti operacijskega sistema DataONTAP 8.1 in jo NetAppove stranke prejmejo brezplačno. Na diskovnem sistemu se lahko kompresirajo katerikoli podatki, ne glede na vrsto aplikacij ali uporabe (datoteke uporabnikov, virtualno okolje, LUNi,…). Kompresija se lahko izvaja na primarnem diskovnem sistemu, sekundarnem diskovnem sistemu ali pa na diskovnem sistemu, ki je namenjen arhiviranju. Glavna prednost uporabe kompresije je zmanjševanje porabe prostora, ne glede na vrsto diskovnega sistema.
Kompresija se ne izvaja na celotni datoteki. V primeru, da bi se izvajala na celotni datoteki, bi se proces zelo upočasnil. Predvsem bi bil slab učinek v primeru velikih datotek.
V izogib temu NetApp izvaja kompresijo na majhni skupini blokov naenkrat. To je tudi ključna prednost, v čemer se Netappova kompresija loči od drugih proizvajalcev in je bolj učinkovita. Ko pride zahteva po branju, mora krmilnik prebrati in dekompresirati samo majhno skupino blokov in ne celotno datoteko. S tem se optimizira branje in omogoča večjo učinkovitost pri kompresiji podatkov. Algoritem kompresiranja podatkov razdeli datoteko na 32KB »chunke«, ki se imenujejo »kompresijske skupine«. Vsaka taka skupina vsebuje podatke samo iz ene datoteke.
PISANJE PODATKOV
Ko se pojavi zahteva po zapisu podatkov in je narejena kompresijska skupina ter so podatki še v NVRAMU, se izvede test, če je ta skupina primerna za kompresijo. Kompresija se izvede v primeru, da je rezultat kompresije vsaj 25% in je blok večji od 8K. Če je zahteva zavrnjena, se podatki takoj zapišejo na disk. V primeru, da so podatki primerni za kompresijo, se izvede na njih kompresija in nato sledi zapis na diske. Ker kompresirani podatki zasedejo manj prostora na disku, to pomeni tudi manj I/O operacij za vsak zapis. Posledično to prinese krajši čas zapisa na diske in skrajšan čas, potreben za arhiviranje teh podatkov.
BRANJE PODATKOV
Ko se pojavi zahteva po branju podatkov iz diskov, sistem prebere samo kompresijske skupine, ki vsebujejo zahtevane podatke in ne celotnega datotečnega zapisa. Tako proces branja zmanjša število I/O operacij, ki so potrebne za branje enakih nekompresiranih podatkov ter manjši »overhead«.
VPLIV NA PERFORMANSE
Kljub temu, da se pri procesu kompresije pojavlja majhen vpliv na performanse, jih ni možno odpraviti. Pred vklopom kompresije je potrebno narediti izračun vpliva na performanse, da ne bo prevelikega vpliva na delovanje obstoječe produkcije.
Vpliv na performanse pri izvajanju kompresije podatkov imajo naslednji faktorji: tip aplikacije, zmožnost kompresije podatkov, tip dostopa do podatkov (sekvenčni ali naključni dostop), povprečna velikost datoteke, stopnja sprememb, količina podatkov, ki uporablja kompresijo, model strojne opreme, obstoječa obremenitev sistema, tip diskov in njihova hitrost, število diskov v agregatu
Vse zgoraj naštete faktorje je potrebno upoštevati pred implementacijo kompresije podatkov. Predvsem je treba upoštevati dejstvo, da se malenkostno zmanjšajo performanse na račun prihranka diskovnega prostora.
Prijavi napako v članku