Princeton Undergrad rada Google Deep Dream-Inspired Deepjazz A.I. Mūzikas veidotājs

$config[ads_kvadrat] not found

Is AI the new Snake Oil?

Is AI the new Snake Oil?
Anonim

Ji-Sung Kim pavadīja pirmās aprīļa pirmās nedēļas nogales, kas bija pieslēgtas kofeīnam un kodē uz sava datora, rīta stundas, kad viņš izstrādāja dziļi mācību mūzikas ģeneratoru. 20 gadus vecajam Princetona datorzinātnes kursam bija tikai 36 stundas, lai pabeigtu deepjazz pirmo hackathon, HackPrinceton, kas notika 1-3. Aprīlī universitātē. Pēc kodēšanas maratona pabeigšanas viņš izveidoja tīmekļa vietni deepjazz un ievietoja avota kodu GitHub.

Bet daudz Kim pārsteiguma dēļ programma tika nošauta. Deepjazz nepārtraukti virzās uz Python un GitHub - sasniedzot tikpat augstu GitHub septīto programmu kopumā. Tas bija pat attēlots HackerNews sākumlapā un joprojām rada rosīgu diskusiju.

„Es nekad neesmu gaidījis, ka mans pirmais projekts būs šis sprāgstviela popularitātes ziņā,” saka Kim Apgrieztā. "Tas ir bijis diezgan traks un jautri."

deepjazz - dziļa mācīšanās džeza paaudze, izmantojot Kerasu un Theano! http://t.co/G5wscglzO7 #python

- Python Trending (@pythontrending) 2016. gada 11. aprīlī

Starp ēšanas, miega un citu kursa darbu pabeigšanu Kim pamatoja, ka viņam vajadzēja aptuveni 12 stundas, lai izstrādātu dziļjazz avota kodu. Tomēr viņš nāca klajā ar ideju par mākslīgā intelekta mūzikas ģeneratoru ilgi pirms HackPrinceton. Vasaras prakses laikā Čikāgas universitātē viņš nonāca pie Google Deep Dream - fotogeneratora, kas interpretē attēla modeļus un pārveido tos par citiem zināmajiem objektiem. Rezultāts ir nenovērtējams attēls, kas izskatās kā savvaļas sapnis.

„Doma par dziļas mācīšanās izmantošanu mākslas interpretēšanai bija man ļoti interesanta,” saka Kim. „Šis Deep Dream ietvars, ko Google prezentēja un publicēja, bija patiešām aizraujošs, jo jūs radāt jaunus mākslas darbus no esošajiem mākslas darbiem.”

Deepjazz izmanto mašīnzināšanu, lai radītu džeza mūziku - “A.I. būvēts, lai padarītu džezu ”kā tās SoundCloud profils. Kims, kurš nav pieņēmis mūzikas teorijas nodarbības, bet septiņus gadus spēlēja klarnetu, savu netradicionālo melodiju dēļ izvēlējās džeza mūziku. A. A. sistēmas mūzika, “var būt dažas neparastas izejas, tāpēc es domāju, ka džezs bija īpaši piemērots idejai par lidojuma radīšanu mūzikā,” viņš saka.

Viņš repurposed esošu mūzikas ģeneratoru, kas ir optimizēts džeza mūzikai, kuru viņa draugs Evans Čovs attīstīja kā JazzML, izmantojot kodu, lai iegūtu atbilstošus datus, bet pārveidotu to par bināro matricu, kas ir saderīga ar divām dziļajām mācību bibliotēkām Keras un Theano.

Sīki džeza sistēma pati par sevi ir divslāņu LSTM, kas ir sava veida mākslīgā neironu tīkla arhitektūra, Kim apraksta. Pēc tam, kad tā uzzina sākotnējo sākotnējo sēklu secību no mūzikas piezīmēm (Kim izmanto Pat Metheny 'un tad es zināju'), tā piešķir piezīmes un ģenerē nākamo piezīmi, pamatojoties uz šīm varbūtībām. Piemēram, ja jūs barojat programmu skalu A, B, C, ir liela varbūtība, ka nākamā piezīme deepjazz radīs D, Kim skaidro.

Vēsturiski kritiķi ir teikuši, ka mākslīgā intelekta mūzikas ģeneratori tiek uztverti, radot dziesmas, kas skaņas ir pārāk robotas un sterilas - trūkst cilvēku dzirdamā mūzika. Jeffrey Bilmes, bijušais MIT students, kurš 1993. gadā rakstīja disertāciju par datoriem, kas reproducē mūzikas ritmus, teica: Apgrieztā novembrī:

“Kad jūs mācāties atskaņot mūziku un mācāties spēlēt džezu, ir lietderīgi intuitīvi saprast, kas ir par mūziku, kas padara to par cilvēku,” sacīja Bilmes. „Cilvēki ir intuitīvas būtnes, un cilvēki bieži nespēj aprakstīt, kā viņi spēj darīt cilvēka lietas. Toreiz es jutos, ka varbūt es pārkāpu svēto zvērestu, definējot šīs lietas datorprogrammām. ”

Kad Kims veica pētījumus par dziļjaku, viņš nonāca pie daudzām sistēmām, kas radīja mūziku, kas izklausījās roboti.

„Mūzika un māksla ir lietas, ko mēs uzskatām par dziļu cilvēku,” saka Kim. "Lai padarītu to skaņu cilvēciskāku un dzīvīgāku, tas ir patiešām grūti kategorizējams." Kim norāda, ka ģeneratori varētu radīt dziesmas, kas skan vairāk cilvēku, programmējot tos mazāk līdzīgi oriģinālam.

Citi izstrādātāji ir sazinājušies ar Kim un ir ieinteresēti paplašināt deepjazz, lai vairāk cilvēku varētu ar to sazināties. Kims kādu dienu redz, ka džjazzs attīstās par improvizācijas partneri, kas var mākslīgi radīt backtrack, lai mūziķis varētu nošķirt. Nākotnē viņš var redzēt lietojumprogrammas, kas rada jaunas, līdzīgas skaņas mūziku jūsu iecienītākajām dziesmām vai var piedāvāt jaunus akordus un mūziķu progresijas.

Kims atzīst, ka viņš joprojām nav tālu no dziļas mācīšanās eksperta, bet viņa pieredze dziļās džeza un apmācības prakses attīstībā un Princeton ir devusi viņam vērtīgu ieskatu šajā jomā.

“A.I. vairs nav sci-fi sapnis. Tas ir kaut kas ļoti reāls, un tas ir kaut kas, kas tuvojas ļoti strauji, ”saka Kim. „Cerams, ka, redzot, ka šis koledžas students, kurš vēl nav augstākais skolnieks, varēja kaut ko izdarīt hackathon ietvaros, tas ir iedrošinājums citiem studentiem, kuri cīnās, lai iekļūtu datorzinātnēs.”

$config[ads_kvadrat] not found