Programiranje

Osmišljanje Microsoftove strategije baze podatkov grafov

Traja nekaj časa, toda Microsoftov nakup LinkedIna v vrednosti 26 milijard dolarjev končno začne kazati nekaj zanimivih rezultatov, podatki LinkedIna pa se začnejo prikazovati v orodjih, kot je Outlook. To je prvi znak Microsofta, ki uporablja graf odnosov socialnega omrežja, zapleten nabor podatkov, ki je bil razlog za eno največjih Microsoftovih pridobitev v Silicijevi dolini.

Pod pokrovom socialno omrežje, kot je LinkedIn, ni nič drugega kot ogromna podatkovna baza grafov NoSQL, ki uporablja pristop brez shem za upravljanje polstrukturiranih podatkov. Vsako vozlišče v grafu je posameznik z vsemi njegovimi podatki o profilu. Vsako vozlišče je povezano z drugimi, deset ali sto za ljudi z nekaj povezavami, tisoče za zelo povezane posameznike. Poizvedbe prečkajo te povezave in vam omogočajo, da poiščete vse ljudi, ki jih poznate, ki delajo na umetni inteligenci ali imajo sedež v Ontariu ali so nekoč delali v LinkedInu.

Grafične zbirke podatkov povsod: Microsoft Graph, Common Data Service, Cosmos DB in Security Graph

Interes Microsofta za podatke, ki temeljijo na grafih, je jasen. Izvršni direktor Satya Nadella je API-je Office 365, ki je temelj tistega, kar danes imenujejo Microsoft Graph, označil za "najpomembnejšo" stavo podjetja. Vsekakor je zelo močno orodje in odpiranje vsem omogoča organizacijam, da raziščejo, kako se razvijajo njihove notranje skupine in kako se korporativno znanje hrani v dokumentih in pogovorih - skupaj z orodji za razkritje teh informacij in njihovo uporabo.

V Microsoftovem grafikonu je veliko podatkov z orodji za obveščanje potrošnikov in poslovnih informacij. Elementi, povezani z Microsoftovimi računi, kot sta novi tok dejavnosti in grafikon naprav, so osnova za funkcije gostovanja v napravah, kot so orodja Continue on My PC, ki so bila nedavno izdana za iOS in Android (podobno kot Applova zmožnost Handoff, ki temelji na računu iCloud v iOS-u). in katere Microsoft spodbuja razvijalce Universal Window Platform (UWP), naj v svojo kodo vgradijo kot del Project Rome in prihajajoče funkcije Windows Timeline.

Toda Microsoft Graph in LinkedIn nista edina Microsoftova grafa z API-ji:

  • Dynamics 365 ima Common Data Service, način opisovanja standardnih elementov v podjetju. S storitvijo Common Data Service lahko razširite standardno shemo s svojim modelom stranke ali vašimi izdelki.
  • Potem je tu še Cosmos DB, ki se razteza v oblaku, ki gradi na zbirki podatkov dokumentov JSON z različnimi nabori API, vključno s tistim za razvoj in upravljanje lastnih baz podatkov grafov v obsegu.
  • Čeprav ni popolnoma javen, se Microsoftov varnostni graf uporablja za ocenjevanje in upravljanje groženj, izpostavljenih vašim aplikacijam, z orodji, kot je funkcija pogojnega dostopa Azure Active Directory.

Microsoftov drugačen pristop: poizvedovanje po več grafih

Stvari, ki postanejo zanimive, so uporaba grafskih poizvedb v več grafih in njihova uporaba za pridobivanje vpogledov, ki lahko pomagajo pri sprejemanju poslovnih odločitev. Pogosto sem govoril o ideji "pravočasnih informacij": prave informacije ob pravem času, dostavljene pravim ljudem, da se lahko pravilno odločijo za pravi poslovni rezultat. Zmožnost poizvedovanja po robovih grafa in ne na vozlišču vam omogoča razumevanje odnosov med elementi, ki je ključni dejavnik pri zagotavljanju vrste informacijske podpore, ki jo potrebuje sodobno podjetje.

Microsoft s podporo več grafov ponuja alternativo tradicionalnim orodjem za podporo odločanju, ki temeljijo na zbirkah podatkov. Z mešanjem notranjih podatkov o osebju in dokumentov na Microsoftovem grafu, zunanjih odnosov prek LinkedIna, osnovnih poslovnih informacij v storitvi Dynamics 365 Common Data Service in sheme po meri v gostujočem oblaku Cosmos DB lahko naredite zapletene poizvedbe z več grafom, ki se osredotočajo na ne samo kot posamezna vozlišča v teh grafih, ampak tudi na povezavah med vozlišči. Tako lahko delate z veliko bolj zapletenimi odnosi kot tisti, ki so izpostavljeni v relacijskih zbirkah podatkov.

To je mogoče izpostaviti v novem orodju Bing for Business, ki dodaja informacije iz poslovnega imenika Active Directory in drugih virov v iskanja Bing, ko je uporabnik prijavljen v račun Azure Active Directory. Rezultati se dinamično generirajo iz poizvedb Microsoft Graph, ki vrnejo podrobnosti, na primer o tem, kje je nekdo v organizacijski shemi, skupaj s povezano vsebino iz širšega spleta in iz dokumentov, ki jih imajo v skupni rabi.

Gre za drugačen način razkritja informacij, ki so na voljo v Microsoftovem orodju Delve, in sicer iz aplikacije, ki jo je bilo treba zagnati, preden lahko pošljete poizvedbo v brskalnik, ki je vedno odprt. Kot panoga smo v brskalnik vključili iskanje, zato je logično, da je to eno od orodij, s katerimi raziskujemo grafe, na katerih temeljijo naša podjetja.

Začetna izdaja Bing for Business se osredotoča na Microsoftov graf, skupaj z orodji, ki skrbnikom omogočajo dodajanje posebnih intranetnih povezav za določene poizvedbe. Ko iščete trenutno politiko stroškov, se usmerite k ustreznim samopostrežnim orodjem. Prihodnje izdaje bodo prinesle več Microsoftovih grafov, ki bodo zaklenili funkcijo pogojnega dostopa na podlagi iskanj in razkrili zunanje odnose prek LinkedIna.

Napaka Microsoftovih grafov: uporabljajo različne slovnice poizvedb

Čeprav se splošna vizija Microsoftovih različnih lastnosti, ki temeljijo na grafih, začenja jasno postavljati, še vedno obstaja nekaj težav pri poizvedovanju iz več virov. Čeprav vsi ponujajo API-je REST, se osnovni jeziki poizvedb lahko razlikujejo. Na primer, Microsoft Graph v svojih API-jih uporablja lastno slovnico poizvedb, medtem ko CosmosDB gradi na široko uporabljenem poizvedbenem jeziku grafov Apache Gremlin.

Poizvedbe, ki temeljijo na API, so ponavadi sorazmerno preproste in osredotočene na določena iskanja. Bolj zapletene poizvedbe običajno obravnavamo z uporabo jezikov, specifičnih za domeno, kot je Gremlin, ki so zasnovani za uporabo z grafičnimi bazami podatkov. Ena bolj zanimivih lastnosti Gremlina je njegova sposobnost ustvarjanja novih zemljevidov iz osnovnih podatkov, ki jih lahko razčlenite in uporabite v svojih aplikacijah. Gremlin lahko obvlada tudi ujemanje vzorcev, pa tudi delo z obsežnimi orodji za analizo podatkov, kot je Hadoop; tako da ga lahko uporabite za pošiljanje poizvedb iz Azureovega orodja za velike podatke HDInsight skupaj z vašimi grafi, ki jih gosti Cosmos DB.

Če želimo izkoristiti vse različne lastnosti grafov Microsofta, bomo potrebovali skupno platformo za poizvedbe, ki bo lahko poizvedbe sprejemala in razširila v različnih virih, asinhrono obdelala odgovore in zagotovila, da bodo poizvedbe ustrezno oblikovane tako, da ciljno usmerjeni API-ji.

Lahko bi ustvarili svoj lastni multigrafski poizvedbeni mehanizem, vendar je to res nekaj, kar mora Microsoft zagotoviti, morda kot storitev Azure. Tako ga je mogoče integrirati z obstoječimi naročninami in z znanimi načini preverjanja pristnosti bodisi za uporabnike bodisi za aplikacije.

$config[zx-auto] not found$config[zx-overlay] not found