Tas notiek, kad Donald Trump atbilst mākslīgajam intelektsi

$config[ads_kvadrat] not found

Building an AI Twitter Bot That Learns From Trending Tweets [Tutorial]

Building an AI Twitter Bot That Learns From Trending Tweets [Tutorial]
Anonim

Bradley Hayes, MIT pēcdoktorants, kurš veic robotikas pētījumus, tikko kļuva par Donaldu „Drumpf” Trumpu par robotu. Viņš ieprogrammēja atkārtotu neironu tīklu - mākslīgo intelektu - studēt un sacensties par republikāņu-ish kandidātu runām.

Hayes „dienas darbs”, viņš saka, ir „pētījumi, kas vērsti uz cilvēka-robota apvienošanu: algoritmu izstrāde, kas ļauj robotiem strādāt kopā un mācīties no cilvēkiem, lai cilvēki varētu būt drošāki, efektīvāki un efektīvāki viņu darbā.” @DeepDrumpf ir „blakus projekts.” Viņš daļēji iedvesmoja no Džona Olivera “fantastiskās skices”. ("Cerams, ka viņš to redzēs - cerams, viņš to redzēs un novērtēs.")

Apgrieztā runāja ar Hayes par šo patriotisko centienu.

Kas vēl iedvesmoja jūs padarīt @ Depeprumpfu?

Tā notika sarunā ar pusdienām ar dažiem kolēģiem, kas arī veic robotikas izpēti un nodarbojas ar mašīnu mācīšanos. Mēs runājām par dažām dažādām statistikas modelēšanas metodēm, kas faktiski bija svarīgas mūsu pētījumiem.Izrādās, ka tā pati metode, kas ir aiz DeepDrumpf, darbojas daudzās robotikas jomās, jo tā ir modelēšanas metode, kas mēģina apgūt secīgas informācijas struktūru vai secīgus datus. Dabiskā valoda ir lielisks secīgu datu piemērs, kur teikuma struktūra ir samērā konsekventa: ir noteikumi, un pamatā ir visu saņemto datu struktūra.

Inerit 100 miljoni? Un tagad es būšu visā pasaulē. Un man ir nedaudz atdzist.

- DeepDrumpf (@DeepDrumpf) 2016. gada 4. marts

Stenfordā atšķirīgs pētnieks rakstīja kursu par neironu tīkliem, un, it īpaši, publicēja rakstu ar nosaukumu “Atkārtotu neironu tīklu nepamatots efektivitāte”. Tātad, viņš uzrakstīja šo fantastisko ievadu šai statistikas modelēšanas metodei un virkni cilvēki ir parādījuši, ka tai ir nepamatota vara pārstāvēt struktūru šāda veida brīvās formas teksta datu rakstīšanā.

Es redzēju rakstu, kas salīdzināja dažādu politisko līderu runas sarežģītību. Rakstā bija teikts, kā Trump izmanto vienkāršāku valodu, un tas ir milzīgs hit ar viņa balsošanas demogrāfiskajiem un viņa faniem. No politiskā viedokļa tas ir patiešām liels, jo tas padara jūsu vēstījumu skaidru un saprotamu pēc iespējas plašākai auditorijai; tas nozīmē, ka tas varētu būt vissekmīgākais modelis, ko mēs varam izdarīt.

Vai jūs būtu dzirdējuši par kodēšanas valodu, ko sauc par „Make Python Great Again”?

Jūs zināt, es to redzēju vakar. TrumpPython vai kaut kas tamlīdzīgs? Es to redzēju. Es izlasīju rakstu par to, es devos uz viņu GitHub lapu, bet man vēl nav bijis laika spēlēt. Bet tas izskatās lieliski.

Vai mēs varam uzzināt kaut ko par Trump lingvistiskajām tendencēm vai kaut ko līdzīgu no jūsu A.I.?

Jā, tas ir iespējams tādā nozīmē, ka, ja paskatās no modeļa izejas, tas liecina par struktūru, ko modelis ir iemācījies no datiem. Tātad atkārtojuma veidi, kas izpaužas no modeļa, jums, iespējams, pastāstīs par dažām lietām, kas ir raksturīgas viņa runas modeļiem un viņa vēstījumam.

Kansas Viņi visi teica: „Man nekas nav vajadzīgs. Viņiem bija briesmīga valsts, un tai ir īpaša infrastruktūra, mūsu valstij ir vajadzīgs bagāts.

- DeepDrumpf (@DeepDrumpf) 2016. gada 4. marts

Jūs ne vienmēr varētu to iegūt no Twitter konta, galvenokārt tāpēc, ka Twitter tikai dod jums 140 rakstzīmes, lai strādātu. Un, tā kā modelī nav daudz datu, kā arī daļēji tāpēc, ka transkripti ir no debatēm - kur kandidāti (un jo īpaši Trump) mēdz pārtraukt sevi - tas padara šos izlaidumus iznākumā.

Joprojām ir nedaudz manuāla darba, kas vajadzīgs, lai būtībā ņemtu paraugu no šī modeļa teksta un pēc tam iet caur to un izvēlētos labāko blakus esošo 140 rakstzīmju nugget, un pēc tam ievietojiet to.

Tas tā ir. Mūsu prezidents ir Obamacare. tagad, tas ir tas, kas tas nav. Liels paldies. Mēs neesam jautrs, ko mēs interesējam

- DeepDrumpf (@DeepDrumpf) 2016. gada 4. marts

Tātad šajā brīdī tas nav ļoti praktiski?

Tas efektīvi mācās kā varbūtības sadalījums, un jūs varat no tā izlasīt. Tas nozīmē - jums ir jūsu modelis, un jūs varat lūgt to vēstuli. Un, ja jūs to pieprasāt pietiekami daudz burtu pēc kārtas, tas jums dos lietas, kas līdzinās angļu valodai. Vai, pat labāk, daži no viņiem atgādina Trumpu patiesību, jo tas tika apmācīts. Tātad vispārējais process, ko esmu ievērojis, ir šāds: es no tā izlasītu, piemēram, 500 vai 1000 rakstzīmes. Tas tikai dotu man teksta sienu ar 500 vai 1000 rakstzīmju vērtībām, es domāju, ramblings, un pēc tam, no tā, es tikai izvēlētos labāko 140 rakstzīmju bloku, kam ir jēga. Vai labākais teikums, kas no tā izriet, šķiet, ir būtisks.

Piemēram, pagājušajā naktī es to izmantoju, lai diskusijas notiktu. Un tā, viena no lietām, ko jūs varat darīt ar tādu modeli, jūs varat to darīt. Tātad, tā kā modelis vienlaicīgi piešķir jums tikai vienu rakstzīmi, tam ir šāda atkarība no rakstzīmēm, kas ir pirms tās - burti, kurus tā iznāca iepriekš. Tādā veidā tas uzzina vārdus, kā tas uztver teikuma struktūru un dažus gramatikas elementus.

Sakiet, ka sāku savu teikumu ar “Romney” un pēc tam jautājiet par nākamo tūkstoš rakstzīmju. Mēs to saucam par gruntēšanu. Tā sniegs jebkādu izeju, ko tā vēlas, bet tā noteiks secības sākotnējo daļu, lai “Romney ir…”

Vai tas attiecas uz tiem tweets ar iekavētām frāzēm?

Tieši tā.

Romney ir rīks. Es vēlos jums to pateikt. Viņi, iespējams, ir pēdējā lieta, kas mums vajadzīga vadītājam, mēs to nevaram darīt.

- DeepDrumpf (@DeepDrumpf) 2016. gada 3. marts

Viena no lietām, ko es ceru darīt, kad process būs mazliet tīrāks - un tas tikai notiks ar vairākiem datiem - ir sākt to mijiedarboties ar citiem kandidātiem. Ja paskatās uz Twitter kontu, tas seko citiem primārajiem kandidātiem. Galu galā, cerams, sāksies atbildēt uz viņiem un varbūt tās apstrīdēs. Bet tas ir vairāk par nedēļas nogali-projektu.

@realDonaldTrump Viņi tagad būs jāmaksā, un tāpat kā absolūti. Es esmu ļoti bagāts. Ak, es vēlos atbalstīt un saņemt tos.

- DeepDrumpf (@DeepDrumpf) 2016. gada 3. marts

Vai jūs varat izskaidrot, ko atkārtots neironu tīkls ir vienkāršotā, nespecializētā valodā?

Protams - mēs mēģināsim. Neironu tīkls parasti uzņem kādu ievades metodi, tad tas dara dažus matemātiku vidū, un tas dod jums izeju. Kopumā tas ir tikai klasifikators. Tātad, ņemot vērā zināmu ievadi, tas jums pateiks, kādu klasi šī ievade atbilst. Populārs piemērs būtu - pamata neironu tīkls - jūs piešķirat tam kaķa attēlu, un jūs vēlaties to pateikt, ka - ja tas ir, piemēram, kaķis, suns vai plakne, vai automašīna - jūs vēlaties teikt, ka „Labi - ar augstu pārliecību - tas ir kaķis, ko jūs tikko man devāt.”

Tātad tas ir augsta līmeņa klasifikācijas uzdevums. Tas ir līdzīgs jēdziens, bet, nevis kaķis, suns, automašīna, tās ir alfabēta un pieturzīmes individuālie burti. Tātad tas veic ievadi un pēc tam veic matemātiku, balstoties uz to, ko tas ir iemācījies, tāpēc visa mācīšanās notiek „vidū”, ko mēs to saucam - un tas dod jums klasifikāciju beigās. Tātad, piemēram, šī vēstule.

Lieta, kas padara to par a atkārtojas neironu tīkls ir tas, ka iepriekšējā posma izeja tiek iegūta nākamajā posmā kā modeļa daļa. Fakts, ka modelis man deva “M”, tiks pievienots nākamajam modeļa palaišanai. Tātad, tas varētu dot jums “a” un tad “k” un tad “e”, jo tas mēģina izspiest “Make America great again”, jo tas ir daudz datu.

Vai jūs līdz šim esat īpaši lepni par jebkādiem DeepDrumpf tweets?

Jā, patiesībā. Man ir pāris, ko es vēl neesmu ievietojis, bet -

Ekskluzīvs.

Smejas Tieši tā. No tiem, kas ir publicēti, es esmu īpaši apmierināts ar to, ka man ir vajadzīgs ISIS.

Man ir tas, kas ISIS nav nepieciešams.

- DeepDrumpf (@DeepDrumpf) 2016. gada 3. marts

Redzēsim … Es to sēklu ieskaitīju ar “Es neesmu rasistisks, bet…” un tā turpinājums bija “… ticiet”, ko es domāju, ka tas bija diezgan lielisks. Es gribēju to saglabāt, kad tā kļuva aktuāla, ja tā kļuva aktuāla.

Nekas labs nekad nenotiek pēc šiem vārdiem.

Vai jūs drīzāk balsotu par Donald Trump vai balsotu par @DeepDrumpf?

Es domāju, ka ir kompromisi ar katru no šīm izvēles iespējām.

$config[ads_kvadrat] not found