Denne algoritmen kan fortelle om du er full på Twitter

En forbedret omborstigning som flyselskap nekter å ta i bruk

En forbedret omborstigning som flyselskap nekter å ta i bruk
Anonim

På bestemte tider av kvelden er Twitter en skattekiste for beruset oppførsel.

I likhet med fullstendig teksting, er det ganske mange mennesker som uttrykker oppkast så mye som de kan bekjenne til 140 tegn. Det kan være like smertefullt å sjekke skaden i en varslingsfeed (eller kanskje mer avhengig av hva som ble sagt) enn en bakrus. Det skjer med det beste av oss. Selv Adele pleide å være medlem av drukket Twitter, og måtte overføre kontoen til hennes representanter.

Men dine etterfølgere er ikke de eneste som leser dine drunkne tweets. University of Rochester ingeniører opprettet en maskinlæringsalgoritme som finner dine drunkne tweets. Algoritmen kan identifisere drikking hotspots og full oppførsel, som kan bidra til å forstå alkoholrelaterte folkehelseproblemer og utføre bedre sosiologiske studier.

Aldri kommer på Twitter mens drukket. Jeg så dum ut. Ikke slett tweets skjønt.

- Josef (@JosefCrowther) 16. mars 2016

Hvis du gjør et raskt søk på Twitter, ser du at det er vanskelig å isolere tweets relatert til alkohol og tweets brukere som sendes når de faktisk drikker. Det var det første som forskergruppen gjorde - trene sin algoritme for å se forskjellene. Algoritmen er også mer nøyaktig enn andre maskinlæringsalgoritmer ved å plukke opp Twitter-brukerens hjemsted.

Nevnte jeg … Jeg er full 😉 damer 😘 jk … Men jeg er virkelig full XD

- Entoan (@EntoanThePack) 13. mars 2016

Studien publisert 10. mars avslører algoritmen i aksjon som forskerne samlet rundt 11 000 geolokerte tweets på to områder: New York City og forstedene til Monroe County, som inkluderer byen Rochester. Algoritmen filtrerte alkoholrelaterte søkeord - drukket, fest, øl - og brukte Amazons mekaniske Turk, en crowdsourcing-tjeneste som koordinerer menneskelige etterretningsoppgaver, for å analysere tweets. Forskerne satte også opp parametere for å få algoritmen til å finne tweets sendt når brukerne kom hjem. Som man kunne forvente, var det mye flere tweets i New York City forbundet med å drikke enn i Monroe County.

Forskerne mener at algoritmen har en mye bredere søknad: den kan analysere menneskelig bevegelse, forhold mellom demografi, nabolagsstruktur og helsemessige forhold i ulike regioner. "Våre resultater viser at tweets kan gi kraftige og finkornede tegn på aktiviteter som skjer i byer," forskerne skrev i studien.

Tok #martinimonday helt feil vei, og nå er jeg full på jobben.

- Christina McGrath (@xtinamcgrath) 7. mars 2016

Så kan være full teksting er ikke så ille om det hjelper forskere å lære mer om menneskelig atferd? Du kan være dommeren.