Namai Naujienose Kodėl funkcijų pasirinkimas yra toks svarbus mokantis mašinų?

Kodėl funkcijų pasirinkimas yra toks svarbus mokantis mašinų?

Anonim

Q:

Kodėl funkcijų pasirinkimas yra toks svarbus mokantis mašinų?

A:

Funkcijų pasirinkimas yra ypač svarbus mokantis mašinų, visų pirma todėl, kad jis yra pagrindinis būdas nukreipti kintamųjų naudojimą į tai, kas yra efektyviausia ir efektyvesnė tam tikroje mašinų mokymosi sistemoje.

Ekspertai kalba apie tai, kaip funkcijų pasirinkimas ir funkcijų išgavimas veikia siekiant sumažinti matmenų prakeiksmą ar padėti susidoroti su perpildymu - tai yra skirtingi būdai, kaip spręsti pernelyg sudėtingo modeliavimo idėją.

Nemokamas atsisiuntimas: mašinų mokymasis ir kodėl tai svarbu

Kitas būdas tai pasakyti yra tas, kad funkcijų pasirinkimas padeda kūrėjams įrankius naudoti mašinų mokymosi mokymo rinkiniuose naudoti tik aktualiausius ir naudingiausius duomenis, o tai žymiai sumažina sąnaudas ir duomenų kiekį.

Vienas iš pavyzdžių yra idėja išmatuoti sudėtingą formą masteliu. Programai didėjant, ji nustato didesnį duomenų taškų skaičių ir sistema tampa daug sudėtingesnė. Tačiau sudėtinga forma nėra tipiškas duomenų rinkinys, kurį naudoja mašininio mokymosi sistema. Šiose sistemose gali būti naudojami duomenų rinkiniai, kurie turi labai skirtingą skirtingų kintamųjų dispersijos lygį. Pavyzdžiui, klasifikuodami rūšis inžinieriai gali naudoti funkcijų atranką, norėdami ištirti tik tuos kintamuosius, kurie jiems duos tikslingiausius rezultatus. Jei kiekvienam diagramoje nurodytam gyvūnui yra vienodas akių ar kojų skaičius, šie duomenys gali būti pašalinti arba gali būti paimti kiti svarbesni duomenų taškai.

Funkcijų pasirinkimas yra diskriminuojantis procesas, kurio metu inžinieriai nukreipia mašinų mokymosi sistemas link tikslo. Be idėjos pašalinti sistemų sudėtingumą mastu, funkcijų pasirinkimas taip pat gali būti naudingas optimizuojant aspektus, kuriuos ekspertai vadina mašininio mokymosi „šališkumo dispersijos kompromisu“.

Priežastys, kodėl savybių pasirinkimas padeda šališkumo ir dispersijos analizėje, yra sudėtingesnės. Kornelio universiteto tyrimas dėl funkcijų pasirinkimo, šališkumo dispersijos ir pakavimo padeda parodyti, kaip funkcijų parinkimas padeda.

Anot autorių, darbe „nagrinėjamas mechanizmas, kuriuo funkcijų pasirinkimas pagerina prižiūrimo mokymosi tikslumą“.

Tyrime taip pat teigiama:

Empirinė paklaidų / dispersijų analizė, vykstant funkcijų parinkimui, rodo, kad tiksliausias funkcijų rinkinys atitinka geriausią mokymosi algoritmo šališkumo ir dispersijos kompromiso tašką.

Aptardami stiprios ar silpnos atitikties naudojimą, rašytojai kalba apie bruožų pasirinkimą kaip apie „dispersijos mažinimo metodą“ - tai yra prasminga, kai jūs manote, kad dispersija yra iš esmės variacija tam tikrame kintamajame. Jei varianto nėra, duomenų taškas ar masyvas iš esmės gali būti nenaudingas. Jei yra labai didelis dispersija, gali kilti klausimas, ką inžinieriai gali laikyti „triukšmu“ ar nesvarbiais, savavališkais rezultatais, kuriuos mašinų mokymosi sistemai sunku valdyti.

Atsižvelgiant į tai, funkcijų pasirinkimas yra pagrindinė dizaino dalis mokantis mašinų.

Kodėl funkcijų pasirinkimas yra toks svarbus mokantis mašinų?