Namai Garsas Kaip maksimalus telkimas padeda „Alexnet“ paversti puikia vaizdų apdorojimo technologija?

Kaip maksimalus telkimas padeda „Alexnet“ paversti puikia vaizdų apdorojimo technologija?

Anonim

Q:

Kaip maksimalus telkimas padeda „AlexNet“ tapti puikia vaizdų apdorojimo technologija?

A:

Naujoviškame konvoliuciniame neuronų tinkle „AlexNet“ maksimalios telkimo koncepcija įterpiama į sudėtingą modelį su keliais konvoliuciniais sluoksniais, iš dalies tam, kad būtų lengviau pritaikyti ir supaprastinti darbą, kurį neuroninis tinklas daro dirbdamas su vaizdais, kuriuos vadina ekspertai. „netiesinė mėginių paėmimo strategija“.

„AlexNet“ yra plačiai laikomas gana dideliu CNN, laimėjusiu 2012 m. ILSVRC („ImageNet“ didelio masto vizualinio atpažinimo iššūkį), kuris laikomas mašinų mokymosi ir neuroninio tinklo progreso įvykiu (kai kas tai vadina kompiuterinio matymo „olimpiada“). ).

Tinkle, kuriame mokymai yra padalijami į du GPU, yra penki konvoliuciniai sluoksniai, trys visiškai sujungti sluoksniai ir keletas maksimalių telkimo elementų.

Iš esmės, maksimalus sutelkimas paima iš neuronų kolekcijos gaunamų rezultatų „baseiną“ ir taiko juos sekančio sluoksnio vertėms. Kitas būdas tai suprasti yra tas, kad maksimalus sutelkimo metodas gali sujungti ir supaprastinti vertes, kad modelis būtų tinkamesnis.

Maksimalus telkimas gali padėti apskaičiuoti nuolydžius. Galima sakyti, kad tai „sumažina skaičiavimo naštą“ arba „susitraukia per daug“ - per mažindama atranką, maksimalus sutelkimas įtraukia tai, kas vadinama „matmenų mažinimu“.

Matmenų sumažinimas susijęs su sudėtingo modelio, kurį sunku paleisti per nervų tinklą, klausimu. Įsivaizduokite sudėtingą formą su daugybe mažų nelygių kontūrų ir kiekviena šios linijos figūra, kurią vaizduoja duomenų taškas. Sumažinę matmenis, inžinieriai padeda mašinų mokymosi programai „atitolinti“ arba atrinkti mažiau duomenų taškų, kad visas modelis būtų paprastesnis. Štai kodėl pažiūrėję į maksimalų telkimo sluoksnį ir jo išvestį, kartais galite pamatyti paprastesnę pikselę, atitinkančią matmenų mažinimo strategiją.

„AlexNet“ taip pat naudoja funkciją, vadinamą ištaisytais linijiniais vienetais (ReLU), o maksimalus kaupimas gali būti papildytas šia technika apdorojant vaizdus per CNN.

Ekspertai ir dalyvaujantys projekte pateikė gausius vaizdinius modelius, lygtis ir kitą detalę, kad parodytų konkretų „AlexNet“ pastatymą, tačiau bendrąja prasme galite galvoti apie „max pooling“ kaip kelių dirbtinių neuronų išvesties sujungimą ar konsolidavimą. Ši strategija yra bendro CNN kūrimo dalis, kuri tapo moderniausių mašinų matymo ir vaizdo klasifikavimo sinonimu.

Kaip maksimalus telkimas padeda „Alexnet“ paversti puikia vaizdų apdorojimo technologija?