Turinys:
- Apibrėžimas - ką reiškia giluminis pastiprinimas?
- „Techopedia“ paaiškina giluminio pastiprinimo mokymąsi
Apibrėžimas - ką reiškia giluminis pastiprinimas?
Giluminis armavimo mokymasis yra sustiprinimasis mokymasis, taikomas giliųjų neuroninių tinklų pagalba. Šis mokymosi būdas apima kompiuterius, veikiančius pagal sudėtingesnius modelius ir ieškančius didelių sąnaudų, siekiant nustatyti optimizuotą kelią ar veiksmą.
„Techopedia“ paaiškina giluminio pastiprinimo mokymąsi
Vienas iš būdų apibūdinti giluminį pastiprinimo mokymąsi yra tas, kad gilus nervų tinklas mokosi stiprinant individualią patirtį.
Tarkime, kad gilusis nervų tinklas nusako vaizdinę žaidimo erdvę ir analizuoja tą žaidimo erdvę per laiko tęstinumą, kad pamatytų, kas vyksta žaidime. Kompiuteris pradeda suprasti, kuo rezultatai grindžiami įvestimis, ir savo ruožtu gali „žaisti protingiau“. Tai susiję su kitomis panašiomis technologinėmis pastangomis, tokiomis kaip gilieji Q tinklai.
Apskritai, mašinų mokymosi ekspertai stumia tokio tipo modelius kaip būdą, kad mašinos galėtų nuolat tobulėti ar mokytis mąstyti panašiau į žmones, nors egzistuoja praktinės kliūtys ir ribos.
