Q:
Kaip inžinieriai gali naudoti gradiento didinimą, kad patobulintų mašinų mokymosi sistemas?
A:Kaip ir kiti skatinimo būdai, gradiento didinimu siekiama keletą silpnų besimokančiųjų paversti vienu stipriu besimokančiuoju, tam tikru skaitmeniniu mokymosi potencialo „sutelkimu“. Kitas būdas, kuriuo kai kurie paaiškina gradiento didinimą, yra tas, kad inžinieriai prideda kintamuosius, kad tikslintų neaiškią lygtį, kad būtų gauti tikslesni rezultatai.
Gradiento didinimas taip pat apibūdinamas kaip „iteracinis“ metodas, o iteracijos gali būti apibūdinamos kaip atskirų silpnų besimokančių asmenų įtraukimas į vieną stiprią besimokančiųjų modelį.
Nemokamas atsisiuntimas: mašinų mokymasis ir kodėl tai svarbu |
Čia yra įtikinamas aprašymas, kaip pažvelgti į tam tikro tipo gradiento didinimo įgyvendinimą, kuris pagerins mašininio mokymosi rezultatus:
Sistemos administratoriai pirmiausia sudarė silpnų besimokančių asmenų grupę. Pavyzdžiui, pagalvokite apie juos kaip subjektų AF masyvą, kiekvienas sėdėjo prie virtualios lentelės ir dirbo, pavyzdžiui, dvejetainėje vaizdo klasifikacijoje.
Aukščiau pateiktame pavyzdyje inžinieriai pirmiausia įvertins kiekvieną silpną mokinį, galbūt savavališkai, priskirdami įtakos lygį A, B, C ir kt.
Tada programa paleis nurodytą treniruočių vaizdų rinkinį. Tuomet, atsižvelgiant į rezultatus, bus persvarstytas silpnas besimokančiųjų skaičius. Jei A atspėjo daug geriau nei B ir C, A įtaka bus atitinkamai padidinta.
Šiame supaprastintame algoritmo patobulinimo aprašyme gana lengva suprasti, kaip sudėtingesnis metodas duos geresnių rezultatų. Silpni besimokantieji „mąsto kartu“ ir, savo ruožtu, optimizuoja ML problemą.
Dėl to inžinieriai gali naudoti „ansamblio“ gradiento didinimo metodą beveik bet kokiame ML projekte, pradedant vaizdo atpažinimu ir baigiant vartotojo rekomendacijų klasifikavimu ar natūralios kalbos analize. Iš esmės tai yra „komandos dvasios“ požiūris į ML ir tas, kuriam sulaukia daug dėmesio iš kai kurių galingų žaidėjų.
Gradiento didinimas dažnai veikia diferencijuojamą nuostolių funkciją.
Kitame modelyje, naudojančiame gradiento didinimą, kita tokio tipo padidinimo funkcija yra sugebėti atskirti klasifikacijas ar kintamuosius, kurie didesniame paveikslėlyje yra tik triukšmas. Atskyrę kiekvieno kintamojo regresijos medį ar duomenų struktūrą į vieno silpno besimokančiojo sritį, inžinieriai gali sukurti modelius, kurie tiksliau „įgarsins“ triukšmo žymenis. Kitaip tariant, pasižymintis asmuo, kurį apima nelaimingas silpnas besimokantysis, bus atstumtas, nes tas silpnas besimokantysis bus persvertas žemyn ir jam bus padaryta mažesnė įtaka.
