Dette er hva som skjer når Donald Trump møter kunstig intelligens

Boomerang Trick Shots | Dude Perfect

Boomerang Trick Shots | Dude Perfect
Anonim

Bradley Hayes, en postdoktorlig medarbeider hos MIT som gjør robotforskning, har nettopp slått Donald "Drumpf" Trump inn i en robot. Han programmerte et tilbakevendende neuralt nettverk - en kunstig intelligens - å studere og etterligne republikansk-ish kandidatens taler.

Hayes "dagjobb", sier han, er "forskning fokusert på menneskelig robotteaming: utforming av algoritmer som lar robotene samarbeide med og lære av mennesker slik at mennesker kan være tryggere, mer effektive og mer effektive i jobben sin." @DeepDrumpf er et "sideprosjekt." Han trakk inspirasjon, delvis, fra John Olivers "fantastiske skisse". ("Forhåpentligvis ser han dette - forhåpentligvis vil han se dette og sette pris på det.")

Omvendt snakket med Hayes om dette patriotiske forsøket.

Hva mer inspirerte deg til å lage @DeepDrumpf?

Det kom fra en lunsjtidssamtale med noen av mine kolleger som også gjør robotforskning og håndterer maskinlæring. Vi snakket om noen ulike statistiske modelleringsteknikker som faktisk var relevante for vår forskning.Det viser seg at samme teknikk som ligger bak DeepDrumpf, fungerer i mange robotteknologier, fordi det er en modelleringsteknikk som prøver å lære strukturen av sekvensiell informasjon eller sekvensielle data. Naturlig språk er et godt eksempel på sekvensielle data, hvor setningens struktur er ganske konsistent: det er regler, og det er underliggende struktur for alle dataene du får.

Erver 100 millioner? Og nå bygger jeg over hele verden. Og jeg har litt kul.

- DeepDrumpf (@DeepDrumpf) 4. mars 2016

En annen forsker ved Stanford skrev et kurs om neurale nettverk, og ga spesielt ut en artikkel med tittelen "Den urimelige effekten av tilbakevendende nevrale nettverk." Så skrev han opp denne fantastiske introduksjonen til denne statistiske modelleringsteknikken, og en haug med folk har vist at den har denne urimelige kraften til å representere struktur i denne typen tekstformat med fri form.

Jeg så en artikkel som sammenlignet talkompleksiteten til de ulike politiske frontrunnerne. Artikkelen var å si hvordan Trump bruker mer forenklet språk, og det er en stor hit med sin stemme demografiske og hans fans. Fra et politisk synspunkt, det er veldig bra, fordi det gjør meldingen klar og innen rekkevidde av det bredest mulige publikum; fra et maskinlært synspunkt, betyr det at dette kan være den mest tregbare modellen vi kan lage.

Hadde du hørt om et kodingsspråk som heter "Make Python Great Again"?

Du skjønner, jeg så det i går. TrumpPython eller noe sånt? Jeg så det. Jeg leste en artikkel om det, jeg dro til deres GitHub-side, men jeg har ikke hatt tid til å leke med det ennå. Men det ser bra ut.

Kan vi lære noe om Trumps språklige tendenser, eller noe sånt, fra A.I.?

Ja, det er mulig i den forstand at hvis du ser på produksjonen fra modellen, er det en indikasjon på strukturen som modellen har lært av dataene. Så slags repetisjon, hvilke ting som kommer ut av modellen, vil fortelle deg - potensielt - om visse ting som er iboende av hans talemønstre og hans budskap.

Kansas De sa alle: "Jeg trenger ikke noe. De hadde et fryktelig land, og har den spesielle infrastrukturen, vårt land trenger en rik.

- DeepDrumpf (@DeepDrumpf) 4. mars 2016

Du ville ikke nødvendigvis kunne få det fra Twitter-kontoen selv, for det meste fordi Twitter bare gir deg 140 tegn til å jobbe med. Og fordi det ikke er mye data som har gått inn i modellen, og også delvis fordi transkripsjonene er fra debatter - der kandidatene (og spesielt Trump) har en tendens til å forstyrre seg - det gir disse diskontinuitetene i produksjonen.

Det er fortsatt litt manuell arbeid som kreves for å i utgangspunktet prøve en vegg med tekst fra denne modellen, og deretter gå gjennom den og plukke ut det beste sammenhengende 140-tegns nuggetet, og deretter legge det inn.

Dette er forretningen. Vår president er Obamacare. nå, i dette er det det ikke er. Tusen takk. Vi er ikke en cheerleader vi er interessante

- DeepDrumpf (@DeepDrumpf) 4. mars 2016

Så det er ikke veldig hands-off på dette punktet?

Det lærer effektivt som sannsynlighetsfordeling, og du kan prøve fra det. Hva det betyr er - du har din modell, og du kan spørre om et brev. Og hvis du spør det om nok bokstaver på rad, vil det gi deg ting som ligner engelsk. Eller enda bedre, noen av dem ligner på ting som Trump kanskje hadde sagt - fordi det var trent på ham. Så den generelle prosessen jeg har fulgt er: Jeg vil prøve, si 500 eller 1000 tegn fra den. Det ville bare gi meg en tekstvegg med 500 eller 1.000 tegn verdt, jeg antar, ramblings, og så inne i det, vil jeg bare velge den beste 140-tegnsblokken som gir mening. Eller den beste setningen som kommer ut av det som virker som relevant.

For eksempel, i går kveld brukte jeg det til en slags live-tweet debatten. Og så, en av tingene du kan gjøre med en modell som dette er at du kan prompte den. Så fordi modellen bare gir deg ett tegn om gangen, har den denne avhengigheten av tegnene som har kommet før den - bokstavene som den har skrevet ut tidligere. Slik lærer man ord, det er hvordan det fanger setningsstruktur og visse grammatikkelementer.

Si at jeg starter setningen min med 'Romney er' og deretter spør den om de neste tusen tegnene. Vi kaller det priming. Det vil gi uansett produksjon det vil, men det vil sette den første delen av sekvensen til at "Romney er …"

Er det referanse til disse tweets med brakede setninger?

Helt riktig.

Romney er et verktøy. Jeg vil fortelle deg dette. De er sannsynligvis det siste vi trenger i en leder, det kan vi ikke gjøre.

- DeepDrumpf (@DeepDrumpf) 3. mars 2016

En av de tingene jeg håper å gjøre, når prosessen er litt renere - og det kommer bare til å komme med flere data - er å begynne å få det til å samhandle med de andre kandidatene. Hvis du ser på Twitter-kontoen, følger den de andre primære kandidatene. Til slutt vil det forhåpentligvis begynne å svare på dem og kanskje utfordre dem. Men det er mer av en weekend-prosjekt slags ting.

@realDonaldTrump De skal betale akkurat nå, og liker, absolutt. Jeg er veldig rik. Å, jeg vil støtte og ha dem.

- DeepDrumpf (@DeepDrumpf) 3. mars 2016

Kan du forklare hva et tilbakevendende neuralt nettverk er i forenklet, uspesialisert språk?

Sikker - vi skal prøve. Et neuralnett, generelt, tar noen innspill, så gjør det litt matte i midten, og det gir deg en utgang. Generelt er det bare en klassifikator. Så, gitt noe innspill, vil det fortelle deg hvilken klasse den innspillet tilsvarer. Et populært eksempel ville være - et grunnleggende neuralnett - du gir det et bilde av en katt, og du vil at den skal fortelle deg det - hvis det er som en katt, en hund eller et fly eller en bil, vil du ha det det å si at "Okay - med stor selvtillit - dette er en katt du bare ga meg."

Så det er klassifiseringsoppgaven på høyt nivå. Dette er et lignende konsept, men i stedet for å være katt, hund, bil, klassene er de enkelte bokstavene i alfabetet og tegnsetting. Så det tar et innspill, og så gjør det matte til det basert på hva det er lært - slik at all læring skjer 'i midten', vil vi kalle det - og det gir deg en klassifisering på slutten. Så, som, dette brevet.

Saken som gjør det til en tilbakevendende neuralnet er at utgangen fra tidligere trinn blir matet inn i neste trinn som en del av modellen. Det faktum at modellen ga meg en 'M' vil mate inn i neste gjennomgang av modellen. Så da kan det gi deg en 'a' og deretter en 'k' og deretter en 'e' fordi det prøver å sette ut 'Make America great again', fordi det er representert i dataene mye.

Er du spesielt stolt av noen DeepDrumpf-tweets så langt?

Ja, faktisk. Jeg har et par som jeg ikke har postet ennå, men -

Eksklusiv.

Lapper Nøyaktig. Av de som er postet, er jeg spesielt fornøyd med 'Jeg er hva ISIS ikke trenger.'

Jeg er hva ISIS ikke trenger.

- DeepDrumpf (@DeepDrumpf) 3. mars 2016

La oss se … Jeg gjorde frø det med "Jeg er ikke rasistisk, men …" og fortsettelsen av det var "… tro det", som jeg syntes var ganske utmerket. Jeg skulle redde den for når det ble relevant, hvis det ble relevant.

Ingenting bra kommer etter disse ordene.

Vil du heller stemme på Donald Trump eller stemme for @DeepDrumpf?

Jeg tror det er avvik med hvert av disse valgene.