Q:
Kaip pusiausvyros koncepcija galėtų informuoti kompiuterinio mokymo projektus?
A:Apskritai pusiausvyra informuos apie mašininį mokymąsi, siekiant stabilizuoti mašininio mokymosi aplinką ir sukurti rezultatus suderinamu deterministinių ir tikimybinių komponentų deriniu.
Ekspertai apibūdina „pusiausvyrą“ kaip situaciją, kai racionalūs mašininio mokymosi sistemos dalyviai pasiekia sutarimą dėl strateginių veiksmų - visų pirma, Nasso pusiausvyra žaidimo teorijoje apima du ar daugiau iš šių racionalių dalyvių, stiprinančių strategijas, pripažįstant, kad nė vienas žaidėjas neturi naudos. pakeisti tam tikrą strategiją, jei kiti žaidėjai nekeičia savo.
Nemokamas atsisiuntimas: mašinų mokymasis ir kodėl tai svarbu |
Ypač populiarus ir paprastas Nash'o pusiausvyros demonstravimas apima paprastą matricą, kurioje du žaidėjai pasirenka dvejetainį rezultatą.
Aukščiau pateiktas būdas yra gana techninis būdas apibūdinti pusiausvyrą ir kaip ji veikia. Daug neoficialus būdas iliustruoti pusiausvyros sampratą, ypač aukščiau pateiktas dviejų racionalių veikėjų, kurių kiekvienas turi dvejetainį pasirinkimą, pavyzdys, yra pagalvoti apie tai, ką jūs galėtumėte pavadinti „ėjimu vienas kito link vidurinės mokyklos prieškambaryje“.
Tarkime, kad du žmonės eina skirtingomis kryptimis žemyn nuo vidurinės mokyklos koridoriaus (arba bet kokio kito tipo zonos), kuriame yra vietos tik dviem žmonėms. Du atviri keliai yra dvejetainiai rezultatai. Jei du racionalūs veikėjai pasirenka skirtingus dvejetainius rezultatus, kurie neprieštarauja vienas kitam, jie praeis pro šalį ir pasisveikins. Jei jie pasirinks du prieštaringus dvejetainius rezultatus - jie vaikščios toje pačioje erdvėje, ir vieną iš jų reikės duoti.
Aukščiau pateiktame pavyzdyje, jei du racionalūs veikėjai pasirenka du suderinamus ir nekonfliktuojančius rezultatus, bendra nuomonė yra ta, kad nė vienas nepasinaudoja pakeisdamas savo strategiją - šiuo atveju jų ėjimo kryptis -, jei kitas asmuo nekeičia savo.
Tai, kas išdėstyta aukščiau, yra pusiausvyra, kurią galima modeliuoti bet kuriame mašininio mokymosi konstrukte. Pateikus šį paprastą pavyzdį, visuomet bus naudingi du racionalūs dalyviai arba, kitaip tariant, du žmonės, einantys vienas šalia kito.
Priešingai, būtų galima pavadinti „pusiausvyra“ - jei du racionalūs veikėjai pasirinks prieštaringus rezultatus, kaip minėta, vienas iš jų turės duoti naudos. Tačiau tai modeliuojanti ML programa gali būti įmesta į begalinę kilpą, jei abu nuspręstų duoti naudos - panašiai kaip du žmonės juda bandydami prisitaikyti vienas prie kito ir vis tiek eina link susidūrimo.
Pusiausvyros, tokios kaip aukščiau viena, paprastai bus naudojamos mašininiame mokyme, siekiant sukurti sutarimą ir stabilizuoti modelius. Inžinieriai ir kūrėjai ieškos scenarijų ir situacijų, kurioms naudinga pusiausvyra, ir stengsis pakeisti ar tvarkyti tuos, kurie to nedaro. Pažvelgus į realius pasaulio pavyzdžius, kurie atitinka ML pusiausvyrą, nesunku pastebėti, kaip tokia analizė mašininio mokymosi sistemoje yra vienareikšmiškai pamokanti, norint išsiaiškinti, kaip modeliuoti žmogaus elgesį kuriant racionalius veikėjus ir agentus. Tai yra tik vienas puikus pavyzdys, kaip pusiausvyra gali būti naudojama pažangiai pritaikant mašininio mokymosi sistemas.
