Turinys:
Apibrėžimas - ką reiškia matmenų mažinimas?
Matmenų mažinimas yra mašinų mokymosi ir statistikos metodų serija, skirta sumažinti atsitiktinių kintamųjų skaičių, į kurį reikia atsižvelgti. Tai apima funkcijų pasirinkimą ir funkcijų išgavimą. Matmenų sumažinimas leidžia daug paprasčiau ir greičiau analizuoti duomenis mašininio mokymosi algoritmams be pašalinių kintamųjų, todėl savo ruožtu mašininio mokymosi algoritmai tampa greitesni ir paprastesni.
„Techopedia“ paaiškina matmenų mažinimą
Dydžio mažinimu bandoma sumažinti atsitiktinių kintamųjų skaičių duomenyse. Dažnai naudojamas K-artimiausių kaimynų metodas. Matmenų mažinimo būdai yra suskirstyti į dvi pagrindines kategorijas: funkcijų parinkimas ir funkcijų ištraukimas.
Funkcijų pasirinkimo metodai suranda mažesnį daugialypių duomenų rinkinio pogrupį, kad būtų sukurtas duomenų modelis. Pagrindinės savybių rinkinio strategijos yra filtras, apklijavimas (naudojant nuspėjamąjį modelį) ir įterptiniai, kurie pasirenka funkciją kurdami modelį.
Funkcijų išskyrimas apima didelių matmenų duomenų pavertimą mažesnių matmenų erdvėmis. Metodai apima pagrindinio komponento analizę, branduolio PCA, grafiko pagrindu sukurtą branduolio PCA, linijinę diskriminuojančią analizę ir apibendrintą diskriminuojančią analizę.
