Kā Multi-Armed Bandit nosaka, kādas reklāmas un stāsti ir redzami tiešsaistē

$config[ads_kvadrat] not found

A Multi-Armed Bandit Framework for Recommendations at Netflix | Netflix

A Multi-Armed Bandit Framework for Recommendations at Netflix | Netflix
Anonim

Iedomājieties, ka esat spēlētājs, un jūs stāvat vairāku spēļu automātu priekšā. Jūsu mērķis ir maksimizēt savus laimestus, bet jūs neko nezināt par katras mašīnas piedāvātajām iespējamām priekšrocībām. Tomēr jūs saprotat, ka sviras, ar kurām jūs velkaties, un biežums, ar kādu jūs to izdarīsiet, ietekmēs jūsu azartspēļu iedzeršanas rezultātus.

Šis scenārijs, ar ko katru dienu saskaras Lasvegasas un Atlantic City apmeklētāji (neatkarīgi no tā, cik lielā mērā cilvēki joprojām dodas uz Atlantic City), ir arī klasisks loģikas puzzle, ko sauc par “Multi-Armed Bandit” - spēļu automāti tiek saukti par “One-Armed Bandīti ”, ko izraisa Reno tipa novecošanās, jo viņiem ir viens svira un tiek ņemtas cilvēku naudas. Lai gan nav neviena pareiza veida, lai risinātu Multi-Armed Bandit situācijas - tuvākais kandidāts ir Gittins Index - ir stratēģiskas pieejas šo problēmu risināšanai, ko redzat bez reģistrācijas katru dienu, kad dodaties tiešsaistē. Daudzi algoritmi, kas regulē satura saturu Google un tīmekļa vietnēs, ir veidoti, balstoties uz MAB stratēģijām. Gandrīz visos gadījumos mērķis ir saistīt mācīšanos un rezultātus un maksimizēt abu iespēju potenciālu.

Tiek izmantota daudzu bruņotu bandītu pieeja The Washington Post lai noskaidrotu, kādus fotoattēlus un virsrakstus jūs visticamāk noklikšķināt, un bezvadu tīklos, lai noskaidrotu, kuri optimālie, enerģijas taupīšanas maršruti ir vislabākie. Algoritmi, kas izaug no MBA metodēm, ir ļoti svarīgi šiem uzņēmumiem un daudziem citiem, jo ​​tie būtībā nosaka, kad un kādas reklāmas parādās tiešsaistē.

Izprotot, kādas reklāmas ir jāparāda cilvēkiem, ir sarežģīta problēma, jo ir tik daudz viena bruņojuma bandītu, kas skrien, noklikšķinot uz stuff tiešsaistē. MAB reklāmu algoritmi parasti izmanto strauji mainīgu „mirstīgo multi-bruņotu bandītu problēmu”, kas tiek pielietota ierobežotos laika periodos. Satiksmes datus izmanto, lai izstrādātu arvien efektīvākas metodes.

MAB ir grūti piesaistīt precīzam mērķim, jo ​​ir iespējams izveidot tik daudzas formulas variācijas. Piemēram, K-bruņotajiem bandītiem ir “ieroči”, kas sacenšas, lai iegūtu augstāko paredzamo atalgojumu. Kontekstualizēt bandītus darīt to pašu, bet ar “ekspertu padomiem” - iepriekš savāktie dati par lietotāju - un tīmeklī gatavais nosaukums “ILOVETOCONBANDITS” darbojas tikai pēc iepriekš noteiktu kārtu grafika. Pretstatā tam, klasiskā MAB pieeja nav iespējama blakus informācija, un rezultāts ir atkarīgs tikai no izvēlētās darbības potenciāla.

Lai gan līdz šim visnoderīgākais pieteikums MAB ir saistīts ar internetu, pētnieki strādā, lai atrastu veidu, kā tos piemērot “reālajā dzīvē” (pazīstams kā meatspace) scenārijos. 2015. gada dokumentā Britu Kolumbijas Universitātes pētnieki apsver iespēju piemērot MAB medicīniskajos pētījumos. Mērķis, ja MAB ir iespējams, ir tas, ka MAB algoritms varētu izmērīt konkrētas zāles iedarbību. Acīmredzama problēma ir tā, ka, ja vien nebūtu iespējams izveidot datora modificētu versiju, ar šo pieeju vienkārši būtu pārāk daudz laika. Nav iespējams, ka MAB dizainu varētu ievietot klīniskā izmēģinājumā.

Ideja ir jauka, bet tagad nav iespējama. Līdz brīdim, kad nākotne būs šeit, jūs lielākoties izjutīsiet daudzu bruņotu bandītu klātbūtni, kad izmisīgi mēģināt noklikšķināt no uznirstošajām reklāmām.

$config[ads_kvadrat] not found