Vai Google "Superhuman" neironu tīkls tiešām var pateikt jebkura attēla atrašanās vietu?

$config[ads_kvadrat] not found

БЛАДШОТ

БЛАДШОТ
Anonim

Attēlu meklēšana ir vieglāka nekā jebkad agrāk. Bet, ja jūs mēģināt atrast kaut ko tādu vietu, kas nav pilnīgi acīmredzama (tā nav Ēģiptes piramīdas vai milzīgais īkšķis skulptūra Parīzē), tas ir grūtāk, nekā jūs domājat - pat ar ģeogrāfiskās atrašanās vietas informāciju, pamatojoties uz to, kas ir attēlā.

Ievadiet Google inženieri Tobias Weyand un pāris kolēģus. Saskaņā ar jaunu žurnāla žurnālu arXiv (izrunātais “arhīvs”), trio ir izveidojusi dziļu mācību mašīnu, kas spēj noteikt gandrīz jebkura fotoattēla atrašanās vietu, pamatojoties tikai uz tā pikseļu analīzi.

Lai iegūtu mašīnu, lai veiksmīgi izpildītu šādu uzdevumu, vēlaties dot tai iespēju intuitēt informāciju, balstoties uz vizuāliem clues. Jūs vēlaties to domāt, citiem vārdiem sakot, kā cilvēks.

Weyand ir izveidojis mākslīgu neironu tīklu - mašīnu sistēmu, kas atdarina smadzeņu neiroloģiskos ceļus, kas ļauj tai mācīties, apstrādāt un atcerēties tādu informāciju kā cilvēks. Šī jaunā sistēma, PlaNet, acīmredzot spēj pārspēt cilvēkus, nosakot attēlu atrašanās vietas neatkarīgi no tā, kāds ir iestatījums - vai tas būtu iekštelpās vai ārpus telpām, un attēloti jebkādi unikāli vai nekonkrēti vizuāli norādījumi.

Kā darbojas PlaNet? Weyand un viņa komanda sadalīja pasaules karti tīklā, kas dažādos reģionos uzlika vairāk nekā 26 000 kvadrātveida formas, atkarībā no tā, cik daudz attēlu tika uzņemts šajās vietās. Blīvās vietās, kur tiek uzņemti daudzi attēli, mazāki laukumi, bet lielāki, attālāki reģioni var sagriezties lielākos laukumos.

Pēc tam komanda izveidoja lielu ģeogrāfisko datu bāzi - gandrīz 126 miljonus dažādu fotogrāfiju. Apmēram 91 miljoni tika izmantoti kā datu kopums, lai mācītu PlaNet, kā noskaidrot, kuru attēlu varētu izvietot kādā pasaules kartē.

Tad neironu tīklam bija uzdots pārējos 34 miljonus attēlu no datubāzes ģeogrāfiski izvietot. Visbeidzot, PlaNet tika iestatīts uz datu kopu, kas sastāv no 2,3 miljoniem ģeogrāfiski iezīmētu attēlu no Flickr.

Rezultāti? PlaNet varēja noteikt izcelsmes valsti par 28,4 procentiem fotogrāfiju un kontinentu par 48 procentiem. Turklāt sistēma varēja noteikt ielas līmeņa atrašanās vietu 3,6% Flickr attēlu un pilsētas līmeņa atrašanās vietu 10,1% apmērā.

Un PlaNet ir labāk nekā lielākā daļa cilvēku - pat lielākie globetrotteri. Weyand piesaistīja 10 labi ceļojušās personas, lai sacenstos ar PlaNet, spēlējot Google ielas attēlā atrasto attēlu atrašanās vietas.

„Kopumā PlaNet uzvarēja 28 no 50 kārtām ar vidējo lokalizācijas kļūdu 1131,7 km, savukārt vidējā cilvēka lokalizācijas kļūda bija 2320,75 km,” rakstīja pētnieki. “Šis maza mēroga eksperiments rāda, ka PlaNet sasniedz pārspīlētu veiktspēju, veicot ielas attēla ainas ģeolokāciju.”

Vai tas ir reāli? Vai Google inženieris patiešām tikai izveidoja „cilvēcisku” A.I. sistēma?

Ja runa ir par attēlu ģeolokāciju, iespējams. Un tas vēl nav pārsteidzoši - A.I. nav būtiski atdarināt cilvēka smadzenes visos veidos, bet pārspēt cilvēka ierobežojumus dažos īpašos veidos, kā izpildīt daudz grūtākus uzdevumus. Tātad šajā ziņā pētnieki raksta patiesību.

Tomēr tas ir posms, lai izsauktu PlaNet par “neironu tīklu”. Ideāla šāda veida tehnoloģijas forma varētu iemācīties daudz vairāk nekā attēla ģeogrāfiskā atrašanās vieta. A.I. sistēmas spēj rakstīt līdzīgas un spēlēt Super Mario, bet tas ir mazs, salīdzinot ar ideālu “meistaru” sistēmu, kas var automātiski kontrolēt un uzturēt dzīvības, pārvaldīt transportu vai enerģētikas infrastruktūru, un daudz ko citu.

$config[ads_kvadrat] not found