Kaip inžinieriai gali įvertinti treniruočių komplektus ir testų rinkinius, kad pastebėtų galimą perteklių mokantis mašinų?

2026

Kaip inžinieriai gali įvertinti treniruočių komplektus ir testų rinkinius, kad pastebėtų galimą perteklių mokantis mašinų?

Norint suprasti, kaip tai daroma, būtina gerai suvokti skirtingų duomenų rinkinių vaidmenis tipiniame mašininio mokymosi projekte. Treniruočių komplektas yra sukurtas tam, kad suteiktų technologijai atskaitos tašką - duomenų bazę, kurią programa naudoja numatydama ir tikėdama sprendimus. Testo komplektas yra tas, kuriame jūs patikrinate, ar mašina naudoja duomenis.

Perpildymas yra mašininio mokymosi sindromas, kai modelis nevisiškai atitinka duomenis ar tikslą.

Nemokamas atsisiuntimas: mašinų mokymasis ir kodėl tai svarbu

Vienas svarbiausių mašininio mokymosi įsakymų yra tas, kad mokymo duomenys ir testų duomenys turėtų būti atskiri duomenų rinkiniai. Bent jau daugelyje programų yra gana platus sutarimas dėl tam tikrų specifinių problemų, susijusių su to paties rinkinio naudojimu, kurį naudojote mokymui, kad išbandytumėte mašinų mokymosi programą.

Kai kompiuterinio mokymosi programoje naudojamas treniruočių rinkinys, kurį iš esmės būtų galima vadinti įvesties rinkiniu, jis dirba su tuo mokymo rinkiniu, kad galėtų priimti sprendimus dėl prognozuojamų rezultatų. Vienas labai paprastas būdas apie tai galvoti yra tai, kad treniruočių rinkinys yra intelekto skaičiavimo proceso „maistas“.

Dabar, kai bandymams naudojamas tas pats rinkinys, mašina dažnai gali pasiekti puikių rezultatų. Taip yra todėl, kad ji jau matė tuos duomenis anksčiau. Bet pagrindinis kompiuterinio mokymosi tikslas daugeliu atvejų yra pasiekti duomenų, kurie dar nebuvo matomi. Bendrosios paskirties mašininio mokymosi programos yra sukurtos veikti pagal įvairius duomenų rinkinius. Kitaip tariant, mašininio mokymosi principas yra atradimas, ir jūs paprastai negaunate tiek daug, kai naudojate pradinį mokymo rinkinį bandymo tikslams.

Vertindami mokymo komplektus ir bandymų rinkinius dėl galimo netinkamo komplektavimo, inžinieriai gali įvertinti rezultatus ir išsiaiškinti, kodėl programa gali taip elgtis skirtingai, palyginti su šių dviejų rinkinių rezultatais, arba kai kuriais atvejais, kaip mašina gali padaryti per daug gerai dėl pačių mokymo duomenų .

Gerai aprašydamas kai kurias iš šių mašininio mokymosi problemų 2014 m. Kūrinyje, Jasonas Brownlee mašinų mokymosi meistriškume aprašo perteklinį pritaikymą tokiu būdu:

„Labai tikėtina, kad modelis, kuris pasirinktas atsižvelgiant į jo tikslumą treniruočių duomenų rinkinyje, o ne iš tikslumo nematomo bandymo duomenų rinkinyje, yra mažesnis, nematyto bandymo duomenų rinkinio tikslumu“, - rašo Brownlee. "Priežastis ta, kad modelis nėra toks apibendrintas. Jis atitiko mokymo duomenų rinkinio struktūrą (pridėta kursyvu). Tai vadinama pertekliniu pritaikymu ir yra klastingesnė, nei jūs manote."

Kalbant tariant, galima būtų pasakyti, kad specializuodamasi treniruočių duomenų rinkinyje programa tampa per griežta. Tai dar vienas metaforinis būdas pažvelgti, kodėl mašininio mokymosi programa nėra optimaliai naudojama naudojant testų rinkinio mokymo rinkinį. Tai taip pat geras būdas įvertinti šiuos du skirtingus rinkinius, nes rezultatai inžinieriams parodys daug, kaip veikia programa. Norite, kad abiejų modelių tikslumas būtų mažesnis. Norite įsitikinti, kad sistema nėra perpildyta ar „tiksliai suderinta“ su tam tikru duomenų rinkiniu, bet yra bendresnė ir gali augti bei tobulėti vykdant komandą.

Kaip inžinieriai gali įvertinti treniruočių komplektus ir testų rinkinius, kad pastebėtų galimą perteklių mokantis mašinų?

Kaip inžinieriai gali naudoti gradiento didinimą, kad patobulintų mašinų mokymosi sistemas?

Kaip „Occam“ skustuvas taikomas mokantis mašinų?

Kodėl mašinų šališkumas yra problema mokantis mašinų?

Pasirinkta redaktorius

Kas yra duomenų sinchronizavimas? - apibrėžimas iš techopedijos

Kas yra vielos rėmų modeliavimas? - apibrėžimas iš techopedijos

Kas yra belaidis „Firewire“? - apibrėžimas iš techopedijos

Kas yra belaidis ryšys? - apibrėžimas iš techopedijos

Pasirinkta redaktorius

Kas yra kilobitas (kb arba kbit)? - apibrėžimas iš techopedijos

Kas yra programinės įrangos licencijos sutartis? - apibrėžimas iš techopedijos

Kas yra programinės įrangos turto valdymas (sam)? - apibrėžimas iš techopedijos

Kas yra statinė biblioteka? - apibrėžimas iš techopedijos

Pasirinkta redaktorius

Kas yra vyriausiasis medicinos informacijos pareigūnas (cmio)? - apibrėžimas iš techopedijos

Kas yra kompiuterinis gydytojo nurodymas (cpoe)? - apibrėžimas iš techopedijos

Kas yra elektroninis sveikatos įrašas (ehr)? - apibrėžimas iš techopedijos

Kokia yra sveikatos priežiūros informacijos ir valdymo sistemų visuomenė (Hess)? - apibrėžimas iš techopedijos

Pasirinkta redaktorius

Kas yra kidsruby? - apibrėžimas iš techopedijos

Kas yra skaitmeninė įtaka? - apibrėžimas iš techopedijos

Kas yra „Google Play“? - apibrėžimas iš techopedijos

Kas yra plokščiojo maršruto protokolas? - apibrėžimas iš techopedijos

Pasirinkta redaktorius

Kas yra tiesus kabelis? - apibrėžimas iš techopedijos

Kas yra vielos nuėmiklis? - apibrėžimas iš techopedijos

Kas yra padomenis? - apibrėžimas iš techopedijos

Kas yra dinaminė domenų vardų sistema (ddns)? - apibrėžimas iš techopedijos

Populiarios kategorijos