Programiranje

Podatkovne mreže v pomnilniku in podatkovne baze v pomnilniku

Sprejemanje računalništva v pomnilniku se še naprej pospešuje. Zrele rešitve omogočajo organizacijam, da dosežejo hitrost in obseg obdelave zbirke podatkov, ki sta potrebna za njihovo digitalno preobrazbo in pobude za večkanalno izkušnjo strank. Na primer, investicijsko podjetje Wellington Management je s pomočjo računalniške platforme v pomnilniku pospešilo in prilagodilo svojo evidenco naložb (IBOR), ki je edini vir resnice za pozicije vlagateljev, izpostavljenost, vrednotenja in uspešnost. Vse transakcije trgovanja v realnem času, vsa povezana dejavnost računa, podatki tretjih oseb, kot so tržne ponudbe, in vsa povezana zaledna dejavnost tečejo skozi IBOR v realnem času. IBOR podpira tudi analizo uspešnosti, ocene tveganja, skladnost s predpisi in drugo. Na različnih testih je nova platforma delovala vsaj desetkrat hitreje kot starejši sistem podjetja, zgrajen neposredno na relacijski bazi podatkov Oracle.

Nikita Ivanov je tehnični direktor pri GridGain Systems, ki razvija računalniške rešitve v pomnilniku.

Gartner napoveduje, da bo do leta 2019 75 odstotkov razvoja aplikacij v oblaku uporabljalo računalništvo v pomnilniku ali storitve, ki uporabljajo računalnike v pomnilniku, da bodo glavni razvijalci lahko izvajali visoko zmogljive in obsežno razširljive aplikacije. Vendar pa morajo razvijalci, ki so novi v računalniških tehnologijah v pomnilniku, razviti razumevanje različnih strategij za dodajanje tehnologije v svoje arhitekture. V večini primerov se morajo najprej odločiti, ali bodo uvedli podatkovno mrežo v pomnilniku ali bazo podatkov v pomnilniku. Ta odločitev bo temeljila predvsem na tem, ali nameravajo pospešiti obstoječe aplikacije, nameravajo razviti nove ali popolnoma prearktificirati obstoječe ali videti priložnost za oboje. Razmisliti morajo tudi o tem, katera plast bo služila kot sistem zapisa, računalniški sloj v pomnilniku ali osnovni podatkovni sloj.

Raziščimo računalniške tehnologije v pomnilniku, potrebne za izvajanje teh strategij.

Podatkovna omrežja v pomnilniku

Podatkovna mreža v pomnilniku (IMDG) kopira podatke na osnovi diska iz zbirk podatkov RDBMS, NoSQL ali Hadoop v RAM, kjer obdelava poteka brez zamud, ki jih povzroča neprestano branje in zapisovanje diska. Podatkovna mreža v pomnilniku, vstavljena med aplikacijo in podatkovnimi plastmi, je razporejena na gruči vozlišč strežnika in deli razpoložljivi pomnilnik in CPU gruče. Ne glede na to, ali je razporejena v javnem ali zasebnem okolju v oblaku, lokalno ali v hibridnem okolju, lahko podatkovno mrežo v pomnilniku prilagodite preprosto z dodajanjem novega vozlišča v gručo. Nekatera podatkovna omrežja v pomnilniku lahko podpirajo transakcije SQL in ACID ANSI-99, napredno zaščito, strojno učenje in izvorne integracije Spark, Cassandra in Hadoop.

Podatkovna mreža v pomnilniku je preprosta in stroškovno učinkovita rešitev za obstoječe aplikacije. Vendar pa številna omrežja podatkov v pomnilniku zahtevajo, da se vsi podatki v osnovni podatkovni bazi, ki temelji na disku, prilegajo v pomnilnik, kar zahteva, da podjetje nabavi dovolj pomnilnika za shranjevanje vseh podatkov. Ker je pomnilnik še vedno dražji od diska, lahko veliko podjetij raje nekatere podatke hrani le na disku. Nove arhitekture, osredotočene na pomnilnik, to rešijo z obdelavo celotnega nabora podatkov, tudi če so nekateri podatki shranjeni na disku. Ta zmožnost "trajnega shranjevanja" omogoča, da količina podatkov preseže količino pomnilnika. To pomeni, da je mogoče podatke optimizirati, tako da so vsi podatki na disku, vendar pogosteje uporabljeni podatki tudi se nahaja v pomnilniku, medtem ko se redko uporabljeni podatki nahajajo samo na disku. Druga ključna prednost je, da lahko sistem po trajnem zagonu sistem s trajno shrambo začne takoj obdelovati nabor podatkov na disku, ne da bi čakal, da se nabor podatkov naloži v pomnilnik.

Workday, ponudnik rešitev za finance in HR SaaS, ki servisira podjetja Fortune 50, je opisal, kako uporablja podatkovno mrežo v pomnilniku za obdelavo približno 189 milijonov transakcij na dan in doseže največ 289 milijonov na dan. Za primerjavo, Twitter obravnava približno 500 milijonov tweetov na dan.

Baza podatkov v pomnilniku

Baza podatkov v pomnilniku (IMDB) je najprimernejša za nove ali preoblikovane aplikacije. Je samostojna zbirka podatkov, ki deluje v pomnilniku, in podpira API-je za obdelavo podatkov, kot so ANSI-99 SQL, ključ-vrednost, računanje in strojno učenje. Prednost baze podatkov v pomnilniku pred mrežo podatkov v pomnilniku je, da se arhitektura zmanjša s treh plasti (aplikacija, v pomnilniku in podatki) na dve. Pomanjkljivost je, da je ni mogoče uporabiti za obstoječo aplikacijo brez dviga in premika nabora podatkov iz obstoječe baze podatkov. Poleg tega, ker baza podatkov v pomnilniku služi kot sistem zapisa, mora rešitev vključevati strategijo za zaščito podatkov v primeru izpadov. Ta strategija je lahko podobna trajni zmogljivosti shranjevanja, o kateri so razpravljali v podatkovnih mrežah v pomnilniku, ali pa vključuje uporabo nehlapnega RAM-a, nove tehnologije, ki bo v prihodnosti verjetno igrala vse pomembnejšo vlogo.

Danes večja banka s 135 milijoni strank uporablja podatkovno bazo v pomnilniku s trajno zmogljivostjo shranjevanja za razvoj arhitekture spletnega merila, ki lahko obdeluje do 1,5 PB podatkov, skupaj z zahtevanim obsegom transakcij. Ta rešitev služi kot sistem snemanja in se ne nahaja na obstoječi shrambi podatkov.

Računalniške platforme v pomnilniku

Organizacije, ki razvijajo dolgoročno strategijo, ki vključuje pospeševanje obstoječih aplikacij in uvajanje novih, se lahko odločijo za računalniško platformo v pomnilniku, ki združuje razširljivost IMDG s popolnimi zmogljivostmi relacijske baze podatkov IMDB. Računalniško platformo v pomnilniku je zato mogoče uporabiti za pospeševanje obstoječih aplikacij ali pa je osnova za ustvarjanje novih ali prerazporejenih aplikacij, ki lahko izkoristijo porazdeljeno računalništvo in trajno shrambo.

Poleg odločitve, katera tehnologija najbolje ustreza njihovim potrebam, bi morale organizacije razmisliti, ali potrebujejo dodatne podporne tehnologije v pomnilniku, kot so:

  • Mehanizem pretočne analitike za upravljanje celotne zapletenosti pri pretoku podatkov in obdelavi dogodkov.
  • Okvir za neprekinjeno učenje, ki temelji na poglobljenem učenju in služi kot gradnik za tisto, kar Gartner imenuje med procesom HTAP (hibridna transakcijska / analitična obdelava); to je sposobnost uporabe strojnega učenja ali analize globokega učenja v operativnih podatkih v realnem času.

Računalniško tehnologijo v pomnilniku zdaj uporabljajo vodilna digitalna podjetja in se bo v prihodnosti še bolj uporabljala. Prej ko boste dobro razumeli strategije uvajanja in zmožnosti računalništva v pomnilniku, prej boste lahko svoji organizaciji pomagali do konkurenčne prednosti, ki jo potrebuje.

$config[zx-auto] not found$config[zx-overlay] not found