To se zgodi, ko se Donald Trump srečuje z umetno inteligenco

AI Learns to Become an Influencer on Twitter using 10000+ Tweets [Natural Language Processing]

AI Learns to Become an Influencer on Twitter using 10000+ Tweets [Natural Language Processing]
Anonim

Bradley Hayes, podoktorski sodelavec na MIT-u, ki opravlja raziskave na področju robotike, je pravkar obrnil Donalda “Drumpf” Trumpa v robota. Programiral je ponavljajočo se nevronsko mrežo - umetno inteligenco -, da bi preučil in posnemal govore republikanskih kandidatov.

Hayesova "dnevna služba", pravi, je "raziskave, osredotočene na povezovanje človeka-robota: oblikovanje algoritmov, ki omogočajo robotom, da delajo skupaj in se učijo od ljudi, tako da so ljudje varnejši, učinkovitejši in učinkovitejši pri svojem delu." @DeepDrumpf je »stranski projekt«. Navdih je deloma črpal iz »fantastične skice« Johna Olivera. (»Upajmo, da bo to videl - upajmo, da bo to videl in cenil.«)

Inverse govoril s Hayesom o tem domoljubnem prizadevanju.

Kaj vas je še spodbudilo, da naredite @DeepDrumpf?

Prišlo je iz pogovora za kosilo z nekaterimi mojimi kolegi, ki opravljajo tudi raziskave robotike in se ukvarjajo s strojnim učenjem. Govorili smo o različnih statističnih tehnikah modeliranja, ki so bile dejansko pomembne za naše raziskave.Izkazalo se je, da ista tehnika, ki je v ozadju DeepDrumpf, deluje na številnih robotičnih področjih, ker je to tehnika modeliranja, ki se poskuša naučiti strukturo sekvenčnih informacij ali zaporednih podatkov. Naravni jezik je odličen primer zaporednih podatkov, pri katerih je struktura stavka precej dosledna: obstajajo pravila in osnovna struktura vseh podatkov, ki jih dobivate.

Podeduj 100 milijonov? In zdaj gradim po vsem svetu. In malo se ohladim.

- DeepDrumpf (@DeepDrumpf) 4. marec 2016

Različni raziskovalec na Stanfordu je napisal tečaj o nevronskih mrežah in zlasti objavil članek z naslovom »Nerazumna učinkovitost ponavljajočih se nevronskih omrežij«. Tako je napisal ta fantastični uvod v tehniko statističnega modeliranja in veliko ljudje so pokazali, da ima to nerazumno moč, da predstavlja strukturo v pisanju besedilnih podatkov v prosti obliki.

Videl sem članek, ki je primerjal kompleksnost govora različnih političnih prvakov. Članek je govoril o tem, kako Trump uporablja bolj poenostavljen jezik, in to je velik hit z njegovimi demografskimi glasovi in ​​njegovimi oboževalci. Z političnega vidika je to resnično super, saj je vaše sporočilo jasno in v razumevanju najširšega možnega občinstva; s stališča strojnega učenja to pomeni, da je to lahko najbolj primeren model, ki ga lahko naredimo.

Ali ste slišali za kodirni jezik, imenovan »Ponovno spet Python«?

Veš, videl sem ga včeraj. TrumpPython ali kaj takega? To sem videl. Prebral sem članek o tem, šel sem na njihovo stran GitHub, vendar še nisem imel časa, da bi se z njim še igral. Ampak izgleda odlično.

Ali se lahko kaj naučimo o Trumpovih jezikovnih težnjah, ali kaj podobnega, iz vašega A.I.?

Ja, možno je v tem smislu, da, če pogledamo rezultate iz modela, to kaže na strukturo, ki jo je model naučil iz podatkov. Tako bodo vrste ponavljanja, vrste stvari, ki izhajajo iz modela, povedale - potencialno - o določenih stvareh, ki so neločljivo povezane z njegovimi govornimi vzorci in njegovim sporočilom.

Kansas Vsi so rekli: "Ne potrebujem ničesar. Imeli so grozno državo in imajo posebno infrastrukturo, naša država potrebuje bogate.

- DeepDrumpf (@DeepDrumpf) 4. marec 2016

Tega ne boste nujno potrebovali iz samega računa v storitvi Twitter, predvsem zato, ker vam Twitter omogoča samo 140 znakov. In ker ni veliko podatkov, ki so šli v model, in tudi delno zato, ker so prepisi iz razprav - kjer se kandidati (in še posebej Trump) nagibajo k temu, da se prekinejo - to povzroča te prekinitve v rezultatih.

Še vedno je potrebno malo ročnega dela, da lahko v bistvu vzamemo steno besedila iz tega modela, nato pa gremo skozi to besedilo in izberemo najboljši sosednji 140 znakov, nato pa to objavimo.

To je posel. Naš predsednik je Obamacare. zdaj, v tem je to, kar ni. Najlepša hvala. Nismo navijačica, zanimivo je

- DeepDrumpf (@DeepDrumpf) 4. marec 2016

Torej na tej točki ne gre za zelo malo roke?

Učinkovito se uči kot porazdelitev verjetnosti in iz nje lahko vzorec. To pomeni, da imate svoj model in ga lahko vprašate za pismo. In če ga vprašate za dovolj črk v vrsti, vam bodo dali stvari, ki so podobne angleščini. Ali, še bolje, nekatere od njih so podobne tistim, ki bi jih Trump pravzaprav lahko rekel - ker je bil treniran z njim. Torej, splošni proces, ki sem mu sledil, je: vzel bi iz tega, recimo, 500 ali 1000 znakov. To bi mi dalo steno besedila s 500 ali 1000 znakov vredno, mislim, ramblings, in potem, od znotraj tega, bom samo izbrati najboljši blok 140 znakov, ki je smiselna. Ali najboljši stavek, ki izhaja iz njega in se zdi nekako pomemben.

Na primer, sinoči sem ga uporabil za živo razpravo. Torej, ena od stvari, ki jo lahko narediš s takšnim modelom, je, da jo lahko napolniš. Zato, ker vam model daje samo en znak naenkrat, ima to odvisnost od znakov, ki so pred njimi - črk, ki jih je pred tem izpisal. Tako se učijo besede, tako zajame strukturo stavkov in nekatere elemente slovnice.

Recimo, da začnem stavek s 'Romney je' in ga nato vprašam za naslednjih tisoč znakov. Temu pravimo polnjenje. Dali bo vse, kar želi, vendar bo začetni del zaporedja določil tako, da je "Romney …"

Je to sklicevanje na tweete z oklepaji?

Prav.

Romney je orodje. To vam želim povedati. Verjetno so zadnja stvar, ki jo potrebujemo v vodji. Ne moremo tega.

- DeepDrumpf (@DeepDrumpf) 3. marec 2016

Ena od stvari, za katero upam, da bom naredil, ko bo proces nekoliko bolj čist - in to bo samo še več podatkov - je, da začnejo delovati z drugimi kandidati. Če pogledate račun v storitvi Twitter, sledijo drugi glavni kandidati. Navsezadnje se bo, upajmo, začel odzivati ​​nanje in jih morda izpodbijati. Toda to je bolj stvar projektov za vikend.

@realDonaldTrump Prav zdaj bodo plačevali, in kot, absolutno. Res sem bogata. Oh, želim jih podpreti in jih imeti.

- DeepDrumpf (@DeepDrumpf) 3. marec 2016

Ali lahko pojasnite, kaj je ponavljajoča se nevronska mreža v poenostavljenem, nespecializiranem jeziku?

Seveda - poskusili bomo. Nevronska mreža na splošno vnaša nekaj vnosa, potem pa nekaj naredi matematiko v sredini in daje izhod. Na splošno je to samo klasifikator. Torej, glede na nekaj vnosa, vam bo povedal, kateri razred ustreza vhodu. Priljubljen primer bi bil - osnovna nevronska mreža - podali boste sliko mačke in želite, da vam pove, da - če je, kot je mačka, pes ali letalo ali avto - želite da bi rekel, da "Ok - z velikim zaupanjem - to je mačka, ki si mi jo pravkar dal."

To je naloga klasifikacije na visoki ravni. To je podoben koncept, toda namesto da bi bili mačka, pes, avto, so razredi posamezne črke abecede in ločila. Torej je to vnos, potem pa je matematika, ki temelji na tem, kar se je naučila - tako da se vse učenje zgodi »na sredini«, imenovali ga bomo - in vam daje razvrstitev na koncu. Torej, kot, to pismo.

Stvar, ki jo naredi ponavljajoče nevronska mreža je ta, da se izhod iz prejšnjih korakov vključi v naslednji korak kot del modela. Dejstvo, da mi je model dal "M", bo prispevalo k naslednjemu preletu modela. Torej bi vam lahko dala »a«, nato pa »k«, nato pa »e«, ker poskuša izreči „ponovno narediti Ameriko veliko“, ker je to v podatkih veliko.

Ali ste še posebej ponosni na tweete DeepDrumpf do sedaj?

Ja, pravzaprav. Imam par, ki ga še nisem objavil, vendar -

Exclusive.

Točno tako. Od tistih, ki so objavljeni, sem še posebej zadovoljen z „to, kar ISIS ne potrebuje“.

Jaz sem tisto, kar ISIS ne potrebuje.

- DeepDrumpf (@DeepDrumpf) 3. marec 2016

Poglejmo… sem ga posadil z „nisem rasističen, toda…“ in nadaljevanje tega je bilo »verjeti«, kar sem mislil, da je precej odlično. To sem nameraval rešiti, ko je postalo relevantno, če bi postalo relevantno.

Po teh besedah ​​ni nič dobrega.

Bi raje glasovali za Donalda Trumpa ali glasovali za @DeepDrumpf?

Mislim, da obstajajo kompromisi z vsako od teh odločitev.