Razumevanje naravnega jezika je prihodnost A.I. Prepoznavanje govora

$config[ads_kvadrat] not found

How to build a time machine | Frederic Kaplan | TEDxCaFoscariU

How to build a time machine | Frederic Kaplan | TEDxCaFoscariU
Anonim

S prihodom Amazonove dosledne zmožnosti Alexa in Sirija, da prevzame več opravil (in postane vedno bolj vdor), se mnogi sprašujejo: kaj je naslednje za razumevanje naravnega jezika in pogovorne govorne vmesnike?

V tej dirki je več podjetij. Tu je Wit.ai, podjetje Facebook je pridobilo - lahko se igrate z demo. (Preizkusite ta ukaz: »Želim gledati mačke.«) Apple ima svoj HomeKit in z njim počne, kar Apple najbolje počne - brca. Amazon je tudi spredaj z Eho in Echo Dot, opremljenim z Alexa.

Eno podjetje, ki je vroče na poti razumevanja naravnega jezika, je MindMeld. MindMeld ponuja svoje zmožnosti razumevanja naravnega jezika drugim podjetjem, ki želijo dodati inteligentne glasovne vmesnike svojim izdelkom, storitvam ali napravam. Podjetje s sedežem v San Franciscu daje partnerjem infrastrukturo in možnosti prilagajanja tako, da imajo lahko njihove naprave svoje, natančno nastavljene osebne pomočnike. MindMeld je pred kratkim napovedal takšno partnerstvo s Spotify, vendar sodeluje tudi z avtomobilskimi podjetji, agencijami za obrambo, podjetji za e-poslovanje in še več. (In seveda ne more deliti veliko posebnosti takšnih partnerstev.)

Inverse je govoril z Sam Vasishtom MindMeld o stanju na področju prepoznavanja glasu - vendar je hitro poudaril, da je »prepoznavanje glasu«, kot podjetje, zdaj »svetovna tema«. Danes gre le za razumevanje naravnega jezika. »Prepoznavanje glasu je skoraj doseglo svoj vrh: po 50-ih letih razvoja lahko AI zdaj učinkovito prepoznajo govor. Ti sistemi so na delovnem mestu skoraj boljši od človeka in bodo kmalu presegli preproste smrtnike.

Naslednji korak, ki ga je mogoče predvideti, je - kot otrokov razvoj - naučiti te sisteme razumeti jezik, ki ga lahko zdaj prepoznajo. Ta človek govori besede; to so besede »je daleč od:« Razumem, kaj pravi ta človek; dovolite mi, da pomagam."

In ta nadaljnji korak in razvoj zahtevata interpretacijo pomena: Posnemanje načina, kako človeški um obdeluje verbalne informacije. Ta enačba ima dva dela. Prva je namera: kakšen je človekov cilj ali želja pri govoru tega stavka? Računalnik, ki lahko izvleče namen iz govorjenega stavka, lahko »razume«, na katerega želi človek vplivati x ali interakcijo y. Ta proces je prepleten z drugim delom enačbe: Entity. A.I. vedeti, kako določiti obravnavano entiteto, predmet človekovega namena.

Da bi to storili, MindMeld ni (kot sem predvideval ali upal), da zaposli filozofov. Zaposluje strokovnjake s področja naravnega jezika, vendar velik del A.I. Proces »učenja« je sam po sebi razmeroma prosti. Če sistem naučite razumeti naročila za kavo, morate sistemu pokazati različne načine, kako bi ljudje verjetno naročali kavo.

"Želel bi moko."

"Lahko prosim, da imam skodelico Joe?"

"Samo velika kava zame."

In tu prihajajo strokovnjaki za naravni jezik - jezikoslovci. Toda tudi to ni več potrebno, ker lahko podatke zbirajo množice. Ta orodja vam omogočajo, da na tisoče ljudi vprašate isto vprašanje in pripravite njihove odgovore. Nato boste te odzive podali v A.I. in voila: A.I. se lahko odzovejo na široko paleto možnih preiskav. »Od tisočih poizvedb lahko zdaj v bistvu strojno spoznamo, kako bi lahko ustvarili milijarde drugih poizvedb,« pravi Vasisht.

Inverse Vasishta, ki je že dolgo prisoten v A.I. in razumevanje naravnega jezika, da bi špekulirali z nami.

Ali lahko MindMeld sodeluje v razširjenem dialogu? Na primer, če bom zastavil nadaljnje vprašanje, ali bo A.I. razumeti in se še naprej odzivati?

Da. To je del načrta. Če nekdo postavi vprašanje, ki je nepopolno - tako, na primer, če naročim kavo, in ne določim velikosti kave, ki jo želim, se bo vrnil in rekel: »Kakšna velikost kave imaš? hočeš?"

Ali pričakujete napredek na Turingovem testu?

Mislim, da smo zelo blizu nje. Mislim, IBM Watson je Nevarnost! in mislim, da je bil to res dober primer. Na tej točki smo: postaja zelo blizu. Tako kot zdaj, v smislu prepoznavanja govora, smo na točki, kjer so stroji tako dobri kot človeška bitja, mislim, da bomo - zagotovo v naslednjih treh do petih letih - na točki, kjer večina teh pogovorov sistemi bodo obravnavani kot dobri kot ljudje.

Kakšne stvari za avtomatizacijo doma MindMeld?

Našo tehnologijo lahko uporabimo za vse vrste izdelkov, vse vrste storitev, vse vrste podatkovnih področij. Ena izmed teh je avtomatizacija doma. V domu imate nadzor razsvetljave, termostat, varnostne sisteme, avdio sisteme, video sisteme, vse te vrste stvari. Lahko upravljamo kateri koli sistem pod pogojem, da obstaja ustrezen vmesnik.

Kaj bi želel, da bi se povezal z MindMeldom v svojem domu?

Mislim, da bolj napredni primeri uporabe - kot je pogovor z mojim Spotify - om, da bi rekli »Predvajaj me seznam predvajanja Rolling Stones« ali »Igraj mi klasično glasbo zvečer« - te vrste stvari bi bilo … super.

Karkoli bolj nepričakovanega ali out-of-the-box, ki ga želite nadzorovati s svojim glasom?

Stvari, ki sem vam jih opisal, so stvari, ki so po mojem mnenju neizbežne. Z drugimi besedami, to se bo zgodilo zelo kmalu. Mislim, da se to ne bo zgodilo takoj, kot so mikrovalovne pečice, kavni avtomati in hladilniki. Obvladovanje takšnih naprav - tako lahko rečem, »Ali je moj aparat za kavo pripravljen za kavo? Vklopite aparat za kavo "in če ga niste pripravili, se mora vrniti in reči" Žal mi je, ampak vaš aparat za kavo ni pripravljen "- taka inteligenca še ne obstaja. To bo sveti gral: kjer vam lahko vsaka naprava govori in vam pove, kaj lahko in kaj ne more. Toda še nismo še tam.

Kaj misliš, da je industrija nazaj?

Zdaj so to izjemno poceni aparati. Mislim, to so naprave, ki jih lahko kupite za skoraj nič. Pred desetimi leti so stali še veliko več.Torej, gradnja novih funkcij je nekaj, kar prispeva k stroškom teh naprav. Navsezadnje je trenutna vrednostna trditev zelo močna; večina teh proizvajalcev ni nagnjena k dodajanju novih funkcij, razen če so na zelo nizki ceni.

Mislim, da je to en vidik tega. Drugi vidik tega je, da govorimo o tem, da so te naprave povezane. Torej, za povezavo teh naprav mora biti več kot le primer uporabe glasu. Mora obstajati več zmožnosti, ki jih je treba voziti na tej povezavi, preden postanejo sposobne preživeti.

Ali poznate katero koli podjetje, ki dela na tej zadnji zmogljivosti?

Veliko polprevodniških podjetij se ukvarja z zelo poceni mikrofoni. Vrsta stvari, ki jo lahko v bistvu vgradite - po zelo nizki ceni - na skoraj vsako napravo ali aplikacijo - ki bi omogočila, da bi bil vhod za glas. In ni vam treba stati poleg teh naprav - lahko govorite od 10 čevljev. Gradimo to sposobnost - mislim, da je to izhodišče. In mislim, da bo ljudem omogočilo, da začnejo polagati mikrofone na naprave, nato pa bodo sledile druge napredne zmogljivosti. Toda od zdaj ne poznam nobenega podjetja, ki bi izdelovalo takšno pametno kavo, pametno mikrovalovno pečico ali pralni stroj.

Kakšna je vaša najboljša ocena, kdaj imamo popolnoma pametne domove, popolnoma pametne apartmaje?

Danes imamo dejansko skoraj vse bistvene podsisteme v hiši, ki jih ljudje želijo avtomatizirati, ki jih je mogoče avtomatizirati. To vključuje luči, termostate, varnostne sisteme, garažna vrata, ključavnice prednjih vrat - take stvari. Vse to je mogoče storiti. Vprašanje je v resnici okoli cenovnih točk. Te so še vedno na ceni, kjer so v glavnem zgodnji posvojitelji in ljudje, ki za njih resnično potrebujejo. Toda cene na te stvari se zelo hitro znižajo. Mislim, da bomo te podsisteme verjetno dobili na množični trg v naslednjih nekaj letih.

Druge stvari, o katerih sem govoril - avtomatiziranje zelo poceni aparatov - mislim, da so to najverjetneje v petih do sedmih letih. Več kot deset let pred tem postane resničnost. Ampak, kot sem že rekel, so to stvari, ki bodo zahtevale številne druge stvari. In to se lahko zgodi prej, če se te različne sestavine prej združijo.

Kaj misliš, da bi izgledalo kot stanovanje v New Yorku ali San Franciscu v, recimo, 2050?

2050! Vau. Mislim, da bomo popolnoma tam. Stvari, ki jih vidimo v znanstvenofantastičnih filmih - kjer lahko precej govorite z vsakim sistemom v vaši hiši in nadzirate vse z glasom - mislim, da bodo te vrste zmogljivosti široko razširjene. Zagotovo v mestih, kot sta New York in San Francisco.

$config[ads_kvadrat] not found