Kāpēc A.I. Var cīnīties, lai saprastu arābu valodu

$config[ads_kvadrat] not found

Vai LATVIJĀ pietiek tikai ar KRIEVU valodu?

Vai LATVIJĀ pietiek tikai ar KRIEVU valodu?
Anonim

Mākslīgā intelekta pasaulē dati ir karalis. Jo vairāk jums ir, jo labāki rīki kļūst par sistēmām, kas spēj „uzzināt” vairāk par to, ko gaidīt. Bet atkarībā no platformas A.I. saskaņā ar Miriam Redi, Yahoo Labs pētnieces teikto, dažas valodas var labāk attēlot, nekā citas.

„Piemēram, piemēram, Flickr, kur mēs ņemam mūsu datus, dažas valodas ir ļoti maz pārstāvētas,” sacīja Redi, runājot Londonas Deep Learning sammitā ceturtdien. "Tātad mums ir angļu valoda, miljoniem attēlu angļu valodā, bet mums ir varbūt 100 000 arābu valodu."

Redi komanda strādā pie rīka, kas var identificēt attēlus, kas nav redzami, piemēram, kultūras vērtības un emocionālas konotācijas. Rīks analizē tekstu, kas pievienots publiski pieejamiem attēliem Flickr. Laika gaitā A.I. sāk saprast, kāpēc kāds var atzīmēt attēlu “laimīga puse” vai “neērts brīdis”, bet šīs idejas kļūs arvien precīzākas, jo rīks analizē vairāk attēlu.

„Diemžēl precizitātes noteikšana arābu valodu attēlos ir mazāka, jo mums nav pietiekami daudz datu,” sacīja Redi.

Valodās, kurās bija lielāki datu apjomi, Redi komanda pamanīja dažus interesantus modeļus. Romantiskas valodas, piemēram, franču un spāņu valodas, mēdza izteikties līdzīgā veidā, bet itāļu valoda bija vienīgā valoda, kurā lietotāji identificēja attēlus ar terminu “izvairīšanās no nodokļu maksāšanas”.

Valodu barjeras joprojām ir AI problēmas. pētniekiem. Ikviens, kas izmanto Google tulkojumu, zinās, ka valodu pārslēgšana nekad nav tik vienkārša kā izklausās. Tomēr jauni notikumi maina lietas, un Facebook šovasar paziņo, ka tuvojās sapņojumam par vienvalodu sociālo tīklu, automātiski tulkojot tekstus lietotājiem.

Attīstība valodu barjeru likvidēšanā var palīdzēt veicināt starptautisko saziņu, bet tādiem projektiem kā Redi, nav reālu aizvietotāju cilvēku radītu noskaņojuma datu.

$config[ads_kvadrat] not found