Turinys:
Apibrėžimas - ką reiškia mokymasis Q?
Kokybinis mokymasis yra algoritmo struktūros, vaizduojančios be modelio armatūros mokymąsi, terminas. Įvertindamas politiką ir naudodamas stochastinį modeliavimą, Q-learning nustato geriausią kelią į priekį Markovo sprendimo procese.
„Techopedia“ paaiškina Q-mokymąsi
Techninis Q mokymosi algoritmo makiažas apima agentą, būsenų rinkinį ir kiekvienos būsenos veiksmų rinkinį.
Q funkcija naudoja svorius įvairiems žingsniams kartu su nuolaidos koeficientu, kad įvertintų atlygį.
Nors tai gali atrodyti kaip paprasta idėja, Q mokymasis yra nepaprastai svarbus daugelio tipų mokymosi stiprinimo ir gilaus mokymosi modeliuose. Vienas geriausių pavyzdžių yra tas, kai giluminis Q mokymasis yra naudojamas padėti mašininio mokymosi programoms išmokti žaidimų strategijas įvairių tipų vaizdo žaidimuose, pavyzdžiui, „Atari“ žaidimuose nuo devintojo dešimtmečio. Konvoliucinis nervų tinklas imasi žaidimų pavyzdžių, kad sudarytų stochastinį modelį, kuris kompiuteriui padėtų žinoti, kaip bėgant laikui geriau žaisti žaidimą.
Kokybiškas mokymasis turi didelę galimybę padėti tobulinti dirbtinį intelektą ir mokytis mašinų.
