Ta algoritem lahko pove, če ste pijani na Twitterju

Algoritmi Tutorial 2 Osnovni zadatak

Algoritmi Tutorial 2 Osnovni zadatak
Anonim

V določenih urah noči je Twitter zakladnica za opijeno vedenje.

Podobno kot pri pijanem pisanju je veliko ljudi, ki besedo-bruhajo toliko, kot lahko priznajo v 140 znakov. Preverjanje škode v vnosu obvestil je lahko prav tako boleče (ali morda bolj odvisno od tega, kar je bilo rečeno) kot mačka. To se zgodi najboljšim od nas. Celo Adele je nekoč bila članica pijanega Twitterja in je morala svoj račun predati svojim predstavnikom.

Toda vaši privrženci niso edini, ki berejo vaše pijanke. Inženirji Univerze v Rochesterju so ustvarili algoritem za strojno učenje, ki najde vaše pijanke. Algoritem lahko identificira žarišča za pitje in vedenje zaradi pijanja, ki lahko pomagajo razumeti vprašanja javnega zdravja, povezana z alkoholom, in vodijo boljše sociološke študije.

Nikoli ne bo na Twitterju, medtem ko bo pijan. Izgledala sem neumno. Čeprav ne brišemo tweetov.

- Josef (@JosefCrowther) 16. marec 2016

Če hitro iščete v storitvi Twitter, boste videli, da je težko izolirati tweete, povezane z uporabniki alkohola in tweetov, ki so jih poslali, ko so dejansko pili. To je bila prva stvar, ki jo je raziskovalna skupina naredila - trenirati njihov algoritem, da bi opazili razlike. Algoritem je prav tako natančnejši od drugih algoritmov za strojno učenje pri iskanju domače lokacije uporabnikov Twitterja.

Sem omenil … pijan sem, dame, jk … Ampak res sem pijan XD

- Entoan (@EntoanThePack) 13. marec 2016

Študija, objavljena 10. marca, razkriva algoritem v akciji, saj so raziskovalci zbrali okoli 11.000 geolociranih tweetov na dveh področjih: New York City in predmestje občine Monroe, ki vključuje mesto Rochester. Algoritem je filtriral ključne besede, povezane z alkoholom - pijan, zabava, pivo - in za analizo tweetov uporabil Amazon's Mechanical Turk, storitev množenja, ki usklajuje naloge človeške inteligence. Raziskovalci so nastavili tudi parametre, s katerimi bi algoritem našli tweete, ki so jih poslali uporabniki. Kot bi pričakovali, je bilo v New Yorku veliko več tweetsov, povezanih s pitjem kot v okrožju Monroe.

Raziskovalci verjamejo, da ima algoritem veliko širšo uporabo: lahko analizira človeška gibanja, odnose med demografijo, sosedsko strukturo in zdravstvenimi pogoji v različnih regijah. »Naši rezultati kažejo, da lahko tweet-i nudijo močne in drobne elemente dejavnosti, ki se dogajajo v mestih,« so zapisali raziskovalci v študiji.

Potem je #martinimonday popolnoma narobe in zdaj sem pijan pri delu.

- Christina McGrath (@xtinamcgrath) 7. marec 2016

Torej Mogoče pijanosti ni tako slabo, če pomaga raziskovalcem izvedeti več o človekovem vedenju? Lahko si sodnik.