Q:
Kodėl mašininiam mokymuisi svarbus šališkumas prieš dispersiją?
A:Sąvokų „šališkumas“ ir „dispersija“ supratimas apie mašinų mokymąsi inžinieriams padeda išsamiau sukalibruoti mašinų mokymosi sistemas, kad jos atitiktų numatytą paskirtį. Neobjektyvumas prieš dispersiją yra svarbus, nes jis padeda valdyti kai kuriuos kompromisus, susijusius su mašininio mokymosi projektais, kurie nustato, kokia veiksminga tam tikra sistema gali būti naudojama įmonėje ar kitais tikslais.
Paaiškinant šališkumą prieš dispersiją, svarbu atkreipti dėmesį, kad abi šios problemos gali pakenkti duomenų rezultatams labai skirtingai.
Nemokamas atsisiuntimas: mašinų mokymasis ir kodėl tai svarbu |
Neobjektyvumą galima apibūdinti kaip problemą, dėl kurios atsiranda netikslių klasterių - tai yra situacija, kai mašininis mokymasis gali pateikti daug rezultatų tiksliai, tačiau praleisti žymę tikslumo prasme. Atvirkščiai, dispersija yra informacijos „išsklaidymas“ - tai laukiškumas, duomenys, rodantys rezultatų diapazoną, kai kurie iš jų gali būti tikslūs, tačiau daugelis jų nepatenka į tam tikrą tikslumo zoną, kad bendras rezultatas būtų mažesnis tikslus ir daug „triukšmingiau“.
Tiesą sakant, kai kurie dispersiją apibūdinantys ekspertai paaiškina, kad variantų rezultatai paprastai „seka triukšmą“, kai dideli šališki rezultatai nėra pakankamai platūs norint ištirti duomenų rinkinius. Tai yra dar vienas būdas palyginti šališkumo problemą su dispersijos problema - ekspertai šališkumą sieja su nepakankamu įrengimu, kai sistema gali būti nepakankamai lanksti, kad apimtų optimalių rezultatų rinkinį. Atvirkščiai, dispersija būtų savotiška priešingybė - kai dėl per didelių įrenginių sistema tampa per trapi ir subtili, kad atlaikytų didelius dinaminius pokyčius. Žvelgdami į šališkumą ir dispersiją per šį sudėtingumo objektyvą, inžinieriai gali pagalvoti, kaip optimizuoti sistemos įrengimą, kad ji būtų ne per daug sudėtinga, ne per paprasta, bet ir pakankamai sudėtinga.
Tai yra du būdai, kaip šališkumo ir dispersijos filosofija yra naudinga projektuojant mašininio mokymosi sistemas. Visada svarbu stengtis gauti bendrą rezultatų rinkinį, kuris yra tikslus atsižvelgiant į jų pritaikymą, atsižvelgiant į mašinos paklaidą. Taip pat visada svarbu atsižvelgti į dispersiją bandant suvaldyti labai išsklaidytų ar išsklaidytų rezultatų chaosą ar laukiškumą ir kovoti su triukšmu bet kurioje konkrečioje sistemoje.
