Kako ravnati z nestrukturiranimi podatki?
Svetovni proizvajalec Dell EMC se na množično povečanje nestrukturiranih podatkov kupcev odziva s posodobitvijo tehnologij, in sicer s sistemi Elastic Cloud Storage (ECS), s katerimi zagotavlja shranjevanje objektov in z omrežnimi pomnilniškimi sistemi PowerScale (Isilon).
Po nasvet, kako izbrati najboljšo rešitev za obvladovanje nestrukturiranih podatkov, smo se obrnili na podjetje S&T Slovenija, prejemnika laskavega naziva proizvajalca Dell Technologies »Partner of the Year« na področju t. i. Adriatik regije. O krotenju eksplozivne rasti podatkov smo se pogovarjali s prodajnim svetovalcem Damjanom Krebljem, ki nosi pomembno vlogo pri številnih projektih prenov podatkovnih centrov za slovenske naročnike in se vsakodnevno sooča z izzivi naročnikov, ki želijo izkoristiti vse, kar lahko moderni podatkovni centri ponudijo.
Kaj sploh so strukturirani in nestrukturirani podatki? Kako se razlikujejo?
Strukturirani podatki običajno vsebujejo vse tipe podatkov, ki so združeni tako, da jih je lažje iskati in predstavljajo visoko organizirane informacije. Pogosto jih najdemo v urejenih podatkovnih skladiščih. Iskanje in urejanje nestrukturiranih podatkov pa je bistveno težje.
Nestrukturirani podatki imajo svojo notranjo strukturo, vendar jih v prvotni obliki ne moremo urediti v razpredelnico ali bazo podatkov. Vključujejo vse, kar je zunaj meja strukturiranih podatkov. Lahko jih ustvari človek ali stroj; lahko je to besedilo ali slike. Čeprav so neukrotljivi, so hkrati izjemno dragoceni. V nasprotju s strukturirani podatki, ki se shranjujejo v podatkovnih skladiščih, se ta vrsta podatkov shranjuje v t. i. podatkovnih jezerih.
Ker nestrukturirani podatki po naravi ne sledijo določeni obliki, zagotovo potrebujejo drugačen sistem shranjevanja. Kateri je najbolj primeren in zakaj?
Poznamo kar nekaj sistemov za shranjevanje podatkov – datotečni, blokovni in objektni sistemi. Datotečni in blokovni sistemi so primerni za strukturirane podatke, medtem ko nestrukturirani podatki potrebujejo zmogljivost objektnega sistema shranjevanja.
Objektno shranjevanje datoteki doda izčrpne metapodatke in vse postavi v t. i. pomnilniško okolje. Ti metapodatki so ključnega pomena za shranjene objekte, saj zagotavljajo poglobljeno analizo podatkov in uporabno vrednost podatkov v pomnilniškem prostoru. Prednosti tovrstnega objektnega sistema so neskončna razširljivost, hitrejše iskanje podatkov, nižji stroški in optimizacija virov.
Količina nestrukturiranih podatkov se povečuje: na letni ravni trenutno predstavljajo več kot 80 % vseh podatkov povprečnega podjetja. To pomeni, da se podjetja srečujejo z vse večjimi stroški shranjevanja in upravljanja vseh nakopičenih informacij. Tradicionalne rešitve, med njimi tudi javne rešitve v oblaku, so postale predrage in zapletene za uvajanje ter upravljanje v obsegu, ki ga zahtevajo podjetja.
Če oblačno shranjevanje ni primerno na dolgi rok, kakšna je potem prihodnost shranjevanja podatkov?
Kot že rečeno, so objektni sistemi shranjevanja najbolj primerni za nestrukturirane podatke. Med njimi izstopa platforma ECS proizvajalca Dell EMC, ki omogoča visoko prilagodljivost, zajemanje, shranjevanje, zaščito in upravljanje nestrukturiranih podatkov v okviru podatkovnega centra vašega podjetja.
Med razširljivimi rešitvami za shranjevanje podatkov je tudi sistem Isilon, ki ga lahko prilagodite ne glede na velikost vašega nestrukturiranega podatkovnega okolja. Sistem Isilon se enostavno integrira s storitvami v oblaku in z vgrajeno podporo za analitiko podatkov omogoča, da izkoristite ves podatkovni kapital za pospešitev digitalne preobrazbe vašega podjetja.
Največji sovražnik digitalizacije so kibernetski napadi. Kako se soočate z novodobno težavo?
Današnji podatki zahtevajo preprosto, učinkovito in prilagodljivo zaščito. Naprave PowerProtect DD (Data Domain) vašemu podjetju omogočajo, da zaščitite, upravljate in obnavljate podatke v velikem obsegu. So najprimernejši namenski sistemi za shranjevanje podatkov, ki v kombinaciji z orodjem za varnostno kopiranje podatkov Dell EMC PowerProtect Data Manager nudijo najvišjo stopnjo varnosti vaših varnostnih kopij podatkov. Z vključeno funkcionalnostjo »Retention Lock« imamo možnost zaklepa varnostnih kopij podatkov v skladu s politiko varnostnega kopiranja. S takim načinom zaklepa se varnostne kopije ščiti pred okužbo z zlonamerno kodo, napako sistemske administracije ali celo pred sabotažo.
Neodvisna svetovna analitska hiša Gartner že vrsto let uvršča sisteme PowerProtect DD (Data Domain) v kvadrant vodilnih. Sistemi PowerProtect DD so implementirani v različnih IT okoljih z zadovoljnimi skrbniki. Zadovoljstvo skrbnikov se odraža tudi v visokem številu implementiranih sistemov. Na svetovni ravni imajo sistemi Data Domain v kategoriji namenskih deduplikacijskih naprav največji tržni delež.
Več o rešitvah za shranjevanje podatkov na spletni strani snt.si/podatkovni-center/.
Prijavi napako v članku