Programiranje

Oracleova odprtokodna knjižnica strojnega učenja Java

Da bi zadovoljil potrebe podjetij v prostoru strojnega učenja, Oracle daje svojo knjižnico strojnega učenja Tribuo Java brezplačno pod odprtokodno licenco.

S Tribuom želi Oracle olajšati gradnjo in uvajanje modelov strojnega učenja v Javi, podobno kot se je že zgodilo s Pythonom. Tribuo, ki je izšel pod licenco Apache 2.0 in ga razvil Oracle Labs, je dostopen iz GitHub in Maven Central.

Tribuo ponuja standardno funkcionalnost strojnega učenja, vključno z algoritmi za razvrščanje, združevanje v skupine, odkrivanje nepravilnosti in regresijo. Tribuo vključuje tudi cevovode za nalaganje in pretvorbo podatkov in ponuja niz ocen za podprte naloge napovedovanja. Ker Tribuo zbira statistične podatke o vložkih, lahko Tribuo na primer opiše obseg vsakega vnosa. Poimenuje tudi funkcije, upravljanje ID-jev funkcij in izhodnih ID-jev pod pokrovom, da se izogne ​​konfliktom in zmedi pri veriženju modelov, nalaganju podatkov in predstavitvi vhodov.

Model Tribuo ve, kdaj prvič vidi funkcijo, ki je še posebej uporabna pri delu z obdelavo naravnega jezika. Modeli vedo, kaj so izhodi, pri čemer so izhodi močno vtipkani. Razvijalcem se ni treba spraševati, ali je float verjetnost, nazadovala vrednost ali ID grozda. Pri Tribuu je vsak od njih ločen tip; model lahko opiše tipe in obsege, za katere ve. Uporaba močno tipiziranih vhodov in izhodov pomeni, da Tribuo lahko spremlja postopek izdelave modela, od točke, ko se podatki nalagajo prek vlakov / preskusov ali preoblikovanja nabora podatkov, do usposabljanja in ocenjevanja modelov. Ti podatki o sledenju so vključeni v vse modele in ocene.

Sistem za poreklo Tribuo lahko ustvari konfiguracijo, ki obnovi cevovod za usposabljanje za reprodukcijo modela ali ocene. Prilagojeni model je mogoče zgraditi na novih podatkih ali hiperparametrih. Tako uporabniki vedno vedo, kaj je model Tribuo, od kod je prišel in kako ga ustvariti.

Oracle vidi, da Tribuo zapolnjuje vrzel na trgu strojnega učenja za poslovne aplikacije. Na primer, medtem ko Googlova knjižnica TensorFlow ponuja osnovne algoritme za globoko učenje, Tribuo ponuja več algoritmov strojnega učenja, od katerih so nekateri v TensorFlowu, nekateri pa ne, hkrati pa zagotavlja tudi vmesnik za TensorFlow, je dejal Oracle's Adam Pocock, glavni član tehničnega osebja Oracle Labs. Medtem ko je analitični stroj Apache Spark namenjen velikim, porazdeljenim sistemom, je Tribuo namenjen manjšim izračunom, ki se lahko namestijo na en stroj, je dejal Pocock.

Tribuo poleg TensorFlow-a ponuja tudi vmesnike za XGBoost in izvajalno okolje ONNX, kar omogoča, da se modeli, shranjeni v formatu ONNX ali usposobljeni v TensorFlow in XGBoost, namestijo skupaj z domačimi modeli Tribuo. Podpora za format modela ONNX omogoča uvajanje modelov na Javi modelov, usposobljenih z uporabo priljubljenih knjižnic Python, kot je PyTorch.

Tribuo deluje na Javi 8 ali novejši. Oracle sprejema prispevke kode v Tribuo v skladu s pogodbo o sodelovanju Oracle. Tribuo je bil že uporabljen v podjetju Oracle v izdelku Fusion Cloud ERP, na primer za inteligentno prepoznavanje dokumentov.

$config[zx-auto] not found$config[zx-overlay] not found