Watson wannabes: 4 odprtokodni projekti za strojno inteligenco

V zadnjem letu je Watson kot del novih podjetniških storitev, ki jih je IBM spodbujal k svoji ponovni iznajdbi, postal manj trik, ki zmaguje z "ogroženostjo", in bolj orodje. Prav tako ostaja IBM-ova lastniška stvaritev.

Kakšne so možnosti za ustvarjanje sistema strojnega učenja v naravnem jeziku po naročilu Watsona, čeprav z odprtokodnimi komponentami? To se je do neke mere že zgodilo - deloma zato, ker je bil Watson sam zgrajen nad obstoječim odprtokodnim delom, drugi pa so podobne sisteme razvijali vzporedno z Watsonom. Tukaj je pogled na štiri take projekte.

DARPA DeepDive

Največja blagovna znamka skupine, projekt DARPA DeepDive, ni namenjen posnemanju Watsonovega sistema poizvedb v navadnem jeziku, temveč Watsonovi sposobnosti, da sčasoma izboljša človeško odločanje s človeškimi smernicami.

Projekt je razvil predvsem Christopher Re, profesor na univerzi v Wisconsinu, odprtokodni projekt (Apache 2.0). Po poročanju EE Times je glavni cilj DeepDive ustvariti avtomatiziran sistem za razvrščanje nestrukturiranih podatkov - v enem primeru kategoriziranje člankov v tehničnih revijah. Tisti, ki nameravajo uporabiti DeepDive, bi morali poznati SQL in Python, vendar sistem že lahko pridobiva podatke iz številnih običajnih virov, kot so spletne strani ali dokumenti PDF.

Apache UIMA

Nestrukturirano upravljanje informacij (UIMA) je standard za izvajanje analize besedilnih vsebin. Watson je uporabil izvedbo UIMA, vendar vam za uporabo UIMA ni treba iti skozi Watson. Dejansko je bila IBM-ova arhitektura UIMA odprtokodna in jo vzdržuje Apache Foundation. Ponuja podporo za več programskih jezikov, občasno pa se dodajajo posodobitve (nazadnje oktobra 2014).

Takšen Apache UIMA je daleč od popolne rešitve strojnega učenja; to je le en - čeprav pomemben - del celote, ki jo je ustvaril IBM. Če ne želite uporabiti golih kosti, lahko izberete enega od njegovih izvedenih projektov, na primer YodaQA, ki za obdelavo uporablja UIMA in Wikipedijo uporablja kot primarni vir podatkov.

OpenCog

OpenCog "želi raziskovalcem in razvijalcem programske opreme zagotoviti skupno platformo za izdelavo in izmenjavo programov umetne inteligence." Cilj projekta, ki je odprt pod licenco GNU Affero, je spodbuditi nič manj kot tisto, kar njegovi ustvarjalci imenujejo "splošno inteligentni" sistemi, umetna inteligenca, ki ima široko, človeškemu razumevanju svet namesto posebnosti, osredotočene na domeno (na primer zelo dober v šahu, ampak nič drugega).

Ustvarjalci OpenCoga trdijo, da se njihov okvir že uporablja v "aplikacijah v naravnem jeziku, tako za raziskave kot tudi za komercialne korporacije." To je nekoliko bolj oddaljeno od konceptov umetne inteligence v nebu in bližje praktični domeni Q&A, v kateri živi Watson.

OAQA (odprto napredovanje sistemov za odzivanje na vprašanja)

Kot že ime pove, je poslanstvo OAQA "odprt napredek pri inženiringu sistemov za odzivanje na vprašanja - jezikovnih programskih sistemov, ki zagotavljajo neposredne odgovore na vprašanja, zastavljena v naravnem jeziku." Sliši se kot eden od Watsonovih ciljev? Ja, še posebej, ker sta OAQA skupaj ustanovila IBM in univerza Carnegie Mellon. Tako kot Apache UIMA tudi OAQA izvaja okvir UIMA, vendar ga ne mislite na rešitev, ki je pripravljena za uporabo; to je komplet orodij.

Ena najpomembnejših pomanjkljivosti vsakega projekta je, kot lahko uganite, ta, da niso na voljo v skoraj tako dodelanem ali poliranem paketu kot Watson. Medtem ko je Watson zasnovan za takojšnjo uporabo v poslovnem okviru, gre za surove komplete orodij, ki zahtevajo težka dvigovanja.

Poleg tega so bile Watsonove storitve že predhodno usposobljene s kuriranim nizom podatkov iz resničnega sveta. S temi sistemi boste morali zagotoviti vire podatkov, kar se lahko izkaže za veliko večji projekt kot samo programiranje.

DARPA DeepDive

Apache UIMA

OpenCog

OAQA (odprto napredovanje sistemov za odzivanje na vprašanja)

Morda vam bo všeč tudi