Programiranje

Pregled: Google Cloud AI prižge strojno učenje

Google ima enega največjih skladov strojnega učenja v panogi, ki se trenutno osredotoča na svojo platformo Google Cloud AI in Machine Learning Platform. Google je pred leti izdal TensorFlow kot odprtokodni, vendar je TensorFlow še vedno najbolj zrel in pogosto citiran okvir globokega učenja. Podobno je Google pred leti izdal Kubernetes kot odprtokodno, vendar je še vedno prevladujoč sistem za upravljanje zabojnikov.

Google je eden izmed najboljših virov orodij in infrastrukture za razvijalce, podatkovne znanstvenike in strokovnjake za strojno učenje, toda v preteklosti Google AI ni bil tako privlačen za poslovne analitike, ki nimajo resnih podatkov ali programskega ozadja. To se začne spreminjati.

Google Cloud AI in platforma za strojno učenje vključuje gradnike AI, platformo in pospeševalnike AI ter rešitve AI. Rešitve AI so dokaj nove in so namenjene poslovnim menedžerjem in ne znanstvenikom podatkov. Vključujejo lahko svetovanje pri Googlu ali njegovih partnerjih.

Gradnike AI, ki so vnaprej usposobljeni, a prilagodljivi, je mogoče uporabljati brez natančnega znanja programiranja ali znanosti o podatkih. Kljub temu jih usposobljeni znanstveniki podatkov pogosto uporabljajo iz pragmatičnih razlogov, predvsem zato, da opravijo stvari brez obsežnega usposabljanja za modele.

Platforma AI in pospeševalniki so na splošno namenjeni resnim podatkovnim znanstvenikom in zahtevajo znanje kodiranja, poznavanje tehnik priprave podatkov in veliko časa za usposabljanje. Priporočam, da se tja odpravite šele po preizkusu ustreznih gradnikov.

V ponudbah umetne inteligence Google Cloud še vedno manjka nekaj povezav, zlasti pri pripravi podatkov. Najbližja stvar storitve Google Cloud za uvoz in obdelavo podatkov je zunanja storitev Cloud Dataprep podjetja Trifacta; Preizkusil sem ga pred letom dni in bil sem premalo. Inženiring funkcij, vgrajen v tabele Cloud AutoML, pa se obeta, zato bi bilo koristno, če bi imeli tovrstne storitve na voljo za druge scenarije.

Spodnja spodnja stran umetne inteligence je povezana z etiko in odgovornostjo (ali pomanjkanjem le-teh), skupaj z vztrajnimi pristranskostmi modelov (pogosto zaradi pristranskih podatkov, ki se uporabljajo za usposabljanje). Google je svoja načela umetne inteligence objavil leta 2018. Delo je v teku, vendar je osnova za napotke, o čemer je razpravljalo nedavno objava v spletnem dnevniku o odgovorni umetni inteligenci.

Na trgu umetne inteligence je veliko konkurence (več kot ducat prodajalcev) in veliko konkurence na trgu javnih oblakov (več kot pol ducata verodostojnih prodajalcev). Da bi bile primerjave primerne, bi moral napisati članek vsaj petkrat daljši od tega, tako da, kolikor sovražim, da jih izpuščam, bom moral večino primerjav izdelkov izpustiti. Za najbolj očitno primerjavo lahko povzamem: AWS naredi večino tega, kar počne Google, in je tudi zelo dober, vendar na splošno zaračunava višje cene.

Gradniki Google Cloud AI

Gradniki Google Cloud AI so enostavne komponente, ki jih lahko vključite v svoje programe za dodajanje vida, jezika, pogovora in strukturiranih podatkov. Številni gradniki AI so vnaprej usposobljene nevronske mreže, vendar jih je mogoče prilagoditi s prenosom učenja in iskanjem nevronskih mrež, če ne ustrezajo vašim potrebam. Tabele AutoML so nekoliko drugačne, saj avtomatizirajo postopek, s katerim bi podatkovni znanstvenik poiskal najboljši model strojnega učenja za tabelarni nabor podatkov.

AutoML

Storitve Google Cloud AutoML zagotavljajo prilagojene globoke nevronske mreže za prevajanje jezikovnih parov, klasifikacijo besedila, zaznavanje predmetov, klasifikacijo slik ter klasifikacijo in sledenje video objektov. Za usposabljanje potrebujejo označene podatke, vendar ne zahtevajo večjega znanja o poglobljenem učenju, učenju prenosov ali programiranju.

Google Cloud AutoML prilagodi Googlove preizkušene visoko natančne globoke nevronske mreže za vaše označene podatke. Namesto da začne z učenjem modelov iz vaših podatkov iz nič, AutoML izvaja samodejno učenje globokega prenosa (kar pomeni, da se začne z obstoječo globoko nevronsko mrežo, usposobljeno za druge podatke) in iskanje nevronske arhitekture (kar pomeni, da najde pravo kombinacijo dodatnih mrežnih slojev ) za prevajanje v jezikovni par in druge zgoraj naštete storitve.

Na vsakem področju ima Google že eno ali več vnaprej usposobljenih storitev, ki temeljijo na globokih nevronskih mrežah in ogromnih naborih označenih podatkov. Ti morda dobro delujejo za vaše podatke nespremenjene in jih preizkusite, da prihranite čas in denar. Če ne storijo tistega, kar potrebujete, vam Google Cloud AutoML pomaga ustvariti model, ki to počne, ne da bi morali vedeti, kako izvesti učenje prenosa ali oblikovati nevronske mreže.

Prenosno učenje ponuja dve veliki prednosti pred treningom nevronske mreže od začetka. Najprej zahteva veliko manj podatkov za usposabljanje, saj je večina slojev omrežja že dobro usposobljena. Drugič, trenira veliko hitreje, saj optimizira samo končne sloje.

Medtem ko so bile storitve Google Cloud AutoML včasih predstavljene skupaj v paketu, so zdaj navedene skupaj z njihovimi osnovnimi vnaprej usposobljenimi storitvami. Kar večina drugih podjetij imenuje AutoML, izvajajo Google Cloud AutoML Tables.

Preberite celoten pregled storitve Google Cloud AutoML

Tabele AutoML

Običajni postopek znanosti o podatkih za številne težave z regresijo in klasifikacijo je ustvariti tabelo podatkov za usposabljanje, očistiti in pripraviti podatke, izvesti inženiring funkcij in poskusiti usposobiti vse ustrezne modele na transformirani tabeli, vključno s korakom za optimizacijo hiperparametri najboljših modelov. Tabele Google Cloud AutoML lahko samodejno izvedejo celoten postopek, ko ročno določite ciljno polje.

Tabele AutoML samodejno iščejo po Googlovem živalskem vrtu z vzorčnimi živalskimi vrtovi po strukturiranih podatkih, da bi našli najboljši model za vaše potrebe, od linearnih / logističnih regresijskih modelov za enostavnejše nabore podatkov do naprednih globinskih, celostnih in arhitekturno-iskalnih metod za večje in bolj zapletene. Avtomatizira inženiring funkcij za širok spekter primitivnih podatkov v obliki tabele - kot so številke, razredi, nizi, časovni žigi in seznami - in vam pomaga zaznati in poskrbeti za manjkajoče vrednosti, odstopanja in druge pogoste težave s podatki.

Njegov brezkodiran vmesnik vas vodi skozi celoten življenjski cikel strojnega učenja, tako da vsi v vaši ekipi olajšajo izdelavo modelov in njihovo zanesljivo vključitev v širše aplikacije. Tabele AutoML nudijo obsežne vhodne podatke in funkcije razložljivosti vedenja modela, skupaj z varovali za preprečevanje pogostih napak. Tabele AutoML so na voljo tudi v okoljih API in prenosnih računalnikov.

Tabele AutoML tekmujejo z Driverless AI in številnimi drugimi izvedbami in okviri AutoML.

Vision API

API Google Cloud Vision je vnaprej usposobljena storitev strojnega učenja za kategorizacijo slik in pridobivanje različnih funkcij. Slike lahko razvrsti v tisoče predhodno usposobljenih kategorij, od generičnih predmetov in živali, ki jih najdemo na sliki (na primer mačka), do splošnih pogojev (na primer mrak) do določenih znamenitosti (Eifflov stolp, Veliki kanjon), in prepoznati splošne lastnosti slike, na primer njene prevladujoče barve. Lahko izolira območja, ki so obrazi, nato na obraze uporabi geometrijsko (usmerjenost obraza in mejnike) in čustvene analize, čeprav obrazov ne prepozna kot pripadnike določenih ljudi, razen znanih osebnosti (za kar je potrebna posebna licenca za uporabo). Vision API uporablja OCR za zaznavanje besedila znotraj slik v več kot 50 jezikih in različnih vrstah datotek. Prav tako lahko prepozna logotipe izdelkov in zazna vsebino za odrasle, nasilje in medicino.

Preberite celoten pregled API-jev Google Cloud Machine Learning

API za video inteligenco

API za Google Cloud Video Intelligence samodejno prepozna več kot 20.000 predmetov, krajev in dejanj v shranjenem in pretočnem videu. Prav tako razlikuje spremembe prizora in izvleče bogate metapodatke na ravni videoposnetka, posnetka ali kadra. Poleg tega z zaznavanjem in izvlečenjem besedila uporablja OCR, zazna eksplicitno vsebino, avtomatizira zaprte napise in podnapise, prepozna logotipe ter zazna obraze, osebe in pozi.

Google priporoča API za video inteligenco za pridobivanje metapodatkov za indeksiranje, organiziranje in iskanje vaše video vsebine. Lahko prepisuje videoposnetke in ustvarja podnapise ter označuje in filtrira neprimerno vsebino, vse stroškovno bolj učinkovito kot človeški prepisovalci. Primeri uporabe vključujejo moderiranje vsebine, priporočila za vsebino, medijske arhive in kontekstualne oglase.

API naravnega jezika

Obdelava naravnega jezika (NLP) je velik del "skrivne omake", zaradi katere vnos v Iskanje Google in Google Assistant deluje dobro. Google Cloud Natural Language API isto tehnologijo izpostavi vašim programom. Izvaja lahko sintaksno analizo (glej spodnjo sliko), ekstrakcijo entitete, analizo sentimenta in klasifikacijo vsebine v 10 jezikih. Jezik lahko določite, če ga poznate; v nasprotnem primeru bo API poskusil samodejno zaznati jezik. Ločen API, ki je trenutno na voljo na zahtevo za zgodnji dostop, je specializiran za vsebino, povezano z zdravstvom.

Preberite celoten pregled API-jev Google Cloud Machine Learning

Prevajanje

Google Cloud Translation API lahko prevede več kot sto jezikovnih parov, samodejno zazna izvorni jezik, če ga ne določite, in je na voljo v treh okusih: osnovni, napredni in prevajanje medijev. API za napredno prevajanje podpira glosar, paketno prevajanje in uporabo prilagojenih modelov. API za osnovni prevod je v bistvu tisto, kar uporablja potrošniški vmesnik Google Translate. AutoML Translation vam omogoča, da z učenjem prenosov trenirate modele po meri.

API za prevajanje medijev prevaja vsebino neposredno iz zvoka (govora), zvočnih datotek ali tokov, v 12 jezikov in samodejno generira ločila. Obstajajo ločeni modeli za video in zvok telefonskih klicev.

Preberite celoten pregled API-jev Google Cloud Machine Learning

$config[zx-auto] not found$config[zx-overlay] not found