Q:
Kaip inžinieriai gali įvertinti treniruočių komplektus ir testų rinkinius, kad pastebėtų galimą perteklių mokantis mašinų?
A:Norint suprasti, kaip tai daroma, būtina gerai suvokti skirtingų duomenų rinkinių vaidmenis tipiniame mašininio mokymosi projekte. Treniruočių komplektas yra sukurtas tam, kad suteiktų technologijai atskaitos tašką - duomenų bazę, kurią programa naudoja numatydama ir tikėdama sprendimus. Testo komplektas yra tas, kuriame jūs patikrinate, ar mašina naudoja duomenis.
Perpildymas yra mašininio mokymosi sindromas, kai modelis nevisiškai atitinka duomenis ar tikslą.
Nemokamas atsisiuntimas: mašinų mokymasis ir kodėl tai svarbu |
Vienas svarbiausių mašininio mokymosi įsakymų yra tas, kad mokymo duomenys ir testų duomenys turėtų būti atskiri duomenų rinkiniai. Bent jau daugelyje programų yra gana platus sutarimas dėl tam tikrų specifinių problemų, susijusių su to paties rinkinio naudojimu, kurį naudojote mokymui, kad išbandytumėte mašinų mokymosi programą.
Kai kompiuterinio mokymosi programoje naudojamas treniruočių rinkinys, kurį iš esmės būtų galima vadinti įvesties rinkiniu, jis dirba su tuo mokymo rinkiniu, kad galėtų priimti sprendimus dėl prognozuojamų rezultatų. Vienas labai paprastas būdas apie tai galvoti yra tai, kad treniruočių rinkinys yra intelekto skaičiavimo proceso „maistas“.
Dabar, kai bandymams naudojamas tas pats rinkinys, mašina dažnai gali pasiekti puikių rezultatų. Taip yra todėl, kad ji jau matė tuos duomenis anksčiau. Bet pagrindinis kompiuterinio mokymosi tikslas daugeliu atvejų yra pasiekti duomenų, kurie dar nebuvo matomi. Bendrosios paskirties mašininio mokymosi programos yra sukurtos veikti pagal įvairius duomenų rinkinius. Kitaip tariant, mašininio mokymosi principas yra atradimas, ir jūs paprastai negaunate tiek daug, kai naudojate pradinį mokymo rinkinį bandymo tikslams.
Vertindami mokymo komplektus ir bandymų rinkinius dėl galimo netinkamo komplektavimo, inžinieriai gali įvertinti rezultatus ir išsiaiškinti, kodėl programa gali taip elgtis skirtingai, palyginti su šių dviejų rinkinių rezultatais, arba kai kuriais atvejais, kaip mašina gali padaryti per daug gerai dėl pačių mokymo duomenų .
Gerai aprašydamas kai kurias iš šių mašininio mokymosi problemų 2014 m. Kūrinyje, Jasonas Brownlee mašinų mokymosi meistriškume aprašo perteklinį pritaikymą tokiu būdu:
„Labai tikėtina, kad modelis, kuris pasirinktas atsižvelgiant į jo tikslumą treniruočių duomenų rinkinyje, o ne iš tikslumo nematomo bandymo duomenų rinkinyje, yra mažesnis, nematyto bandymo duomenų rinkinio tikslumu“, - rašo Brownlee. "Priežastis ta, kad modelis nėra toks apibendrintas. Jis atitiko mokymo duomenų rinkinio struktūrą (pridėta kursyvu). Tai vadinama pertekliniu pritaikymu ir yra klastingesnė, nei jūs manote."
Kalbant tariant, galima būtų pasakyti, kad specializuodamasi treniruočių duomenų rinkinyje programa tampa per griežta. Tai dar vienas metaforinis būdas pažvelgti, kodėl mašininio mokymosi programa nėra optimaliai naudojama naudojant testų rinkinio mokymo rinkinį. Tai taip pat geras būdas įvertinti šiuos du skirtingus rinkinius, nes rezultatai inžinieriams parodys daug, kaip veikia programa. Norite, kad abiejų modelių tikslumas būtų mažesnis. Norite įsitikinti, kad sistema nėra perpildyta ar „tiksliai suderinta“ su tam tikru duomenų rinkiniu, bet yra bendresnė ir gali augti bei tobulėti vykdant komandą.
