Programiranje

Tipkovnica? Kako čudno

Nastopila je doba glasovnega iskanja in programske opreme, ki jo upravljamo z glasom. Kot razvijalec živim in umrem s tipkovnico, vendar že vidim znake: Tako kot mnogi ljudje na primer govorim s telefonom Android (na primer »Navigate to Lowes [or Starbucks or Harris Teeter]«) dobite navodila.

V poročilu Mary Treek Internet Internet Trends 2016 poroča, da so se poizvedbe za Google Voice od leta 2010 povečale za sedemkrat. Opazila sem tudi, da moj 12-letni sin skoraj vsa svoja iskanja opravlja z glasom - in moje dekle mi redno piše na ta način. Prav tako je podjetje, v katerem delam, Lucidworks, nedavno objavilo novo partnerstvo z IBM-om za vključitev Watsona in zmožnosti pretvorbe besedila v govor v naš izdelek za iskanje v podjetju.

Tehnologija deluje veliko bolje kot včasih in jo je lažje vključiti v aplikacije. Če razvijate za Android ali iOS, se lahko enostavno vključite v API-je za prepoznavanje govora. Toda prepoznavanje govora se ne začne in konča s preprostimi ukazi za pretvorbo besedila v besedilo in glasom.

Razumevanje namena iskanja je zelo kontekstualna naloga, zlasti pri govorjenem jeziku. Poleg tega ljudje običajno uporabljajo več besed v naravnem govorjenem jeziku kot takrat, ko se soočajo z iskalno vrstico. V govorjenem jeziku je več "šumnih besed" kot pri običajnem besedilnem iskanju.

To so pomembni izzivi umetne inteligence. Ko pa premagamo težavo s kontekstom, se bodo razvijalci naučili, da je mogoče z glasom narediti več kot z besedilom. Čustveni kontekst bo igral svojo vlogo. Če iščete bencinsko črpalko, ali želite najcenejšo ali najbližjo? Čustvena vsebina vašega glasu bi to lahko pomenila. Seveda boste morda razjasnili, vendar vam morda ne bo treba.

Vaša zgovorna prihodnost

Epoha, ki jo poganja glas, ni samo iskanje. Vplivalo bo na celoten način našega komuniciranja z računalniki. V ne tako oddaljeni prihodnosti bodo tipkovnice veljale za "čudne", kot jih je Scotty slavno opisal v "Star Trek IV".

Toda ta premik zahteva tudi povsem nov uporabniški vmesnik. Tukaj je ponazoritev tega, kar mislim: ko je izšel Windows 95, je IBM v svoje računalnike vključil glasovne ukaze. Takrat sem delal kot prodajalec v Office Depot in hitro se je pokazalo, kako nepraktični so glasovni ukazi. Okenski vmesnik sploh ni bil primeren za to obliko interakcije.

Mislim, kako hudiča premaknete okno s poti drugega okna in mu spremenite velikost tako, da se učinkovito prilega na zaslon z glasovnimi ukazi? Saj ne. Ta okna (in verjetno tudi Windows) popolnoma odstranite. Glasovno uporabniški vmesnik ne uporablja istih motivov. Na "Star Trek" nikoli ne vidite okenskega vmesnika.

Ko že govorimo o "Star Trek", ko ljudje začnejo kodirati ali delati nekaj tehničnega, vedno preklopijo na otipni vmesnik (v redu, ne ravno otipljiv - bolj je videti kot mikrovalovna tipkovnica, prekrita z art nouveau upodobitvami vezja). Toda ali je potrebna regresija pri »tipkanju«? Res je, ne znam si predstavljati uporabe glasovnega vmesnika za kodiranje v Scali. Mogoče se bodo razvili novi jeziki (brez oklepajev, za razliko od Scale - in mojih člankov), ki so posebej primerni za glas.

Spletna mesta zagotovo ne bodo videti enako in bodo ponujala nove navigacijske paradigme. Rekli boste »pokažite mi ponudbe na čevljih« in to, kar dobite nazaj, bo verjetno bolje organizirano in bolj kontekstualno občutljivo kot vaše povprečno spletno mesto (»ponudbe« && »čevlji«). Poleg tega se ne bom želel veliko pomikati ali izgovarjati "naslednja stran", zato bo treba interakcije prilagoditi. Sistem bi že moral vedeti, da si želim moške čevlje in ne želim čevljev s trdo peto zaradi moje Ahilove tetive. Mogoče ve, da imam raje temne barve. Mogoče sem to povedal ali morda analiziralo moje vedenje.

Je to spletno mesto sploh? Seveda, če kupujem čevlje, bom želel vizualno predstavitev, če pa govorim, morda stroj govori nazaj. Mogoče mi pokaže čevlje, nato vpraša: "Ali iščete določeno vrsto čevljev? Za kakšen namen so ti čevlji? Ali jih nosite na pohodu ali na zabavo?"

Obdobje glasovnega iskanja bo spremenilo vse, od tega, kako komuniciramo s stroji, do tega, kako kodiramo. Številne tehnologije, ki jih potrebujemo, so nam danes že na voljo, druge pa še ni treba izumiti. Učinek na uporabniške vmesnike bi lahko bil močnejši od prehoda z bušilic na tipkovnice.

Ta obsežna sprememba ne bo prišla naenkrat. Danes ni dan, da bi zavrgli tipkovnico. Morda pa je dan, da začnete razmišljati o prenovi vašega spletnega mesta, ki bo resnično dostopno glasu.

$config[zx-auto] not found$config[zx-overlay] not found