Q:
Kas yra geriau, jei AWS yra platforma arba kompiuterio mokymosi algoritmas?
A:Šiomis dienomis daugelis kompanijų integruoja mašininio mokymosi sprendimus į savo analizės įrankių rinkinį, kad patobulintų prekės ženklo valdymą, pagerintų klientų patirtį ir padidintų veiklos efektyvumą. Mašinų mokymosi modeliai yra pagrindinis mašininio mokymosi sprendimų komponentas. Modeliai mokomi naudoti matematinius algoritmus ir didelius duomenų rinkinius, kad sudarytų patikimas prognozes. Du paplitę prognozių pavyzdžiai yra (1) nustatyti, ar finansinių operacijų rinkinys rodo sukčiavimą, arba 2) įvertinti vartotojų požiūrį į produktą remiantis socialinės žiniasklaidos informacija.
„Amazon SageMaker“ yra visiškai valdoma paslauga, leidžianti kūrėjams ir duomenų mokslininkams kurti, mokyti ir diegti mašinų mokymosi modelius. Programoje „SageMaker“ galite naudoti „neįtrauktus“ algoritmus arba pereiti patys sau kelią, kad būtų labiau pritaikytas sprendimas. Abu pasirinkimai galioja ir yra vienodai sėkmingo mašininio mokymosi sprendimo pagrindas.
(Redaktoriaus pastaba: kitas „SageMaker“ alternatyvas galite pamatyti čia.)
Į „SageMaker“ nenaudojamus algoritmus įtraukiami populiarūs, labai optimizuoti pavyzdžiai, skirti vaizdams klasifikuoti, natūraliai kalbai apdoroti ir kt. Visą sąrašą galite rasti čia .
- Neprivalumai: Šie algoritmai buvo iš anksto optimizuoti (ir yra nuolat tobulinami). Galite greitai veikti, bėgti ir dislokuoti. Be to, yra AWS automatinis hiperparametrų derinimas.
- Įvertinimai : Aukščiau paminėti nuolatiniai patobulinimai gali neduoti rezultatų taip nuspėjamai, lyg jūs būtumėte visiškai valdę savo algoritmų įgyvendinimą.
Jei šie algoritmai netinka jūsų projektui, turite tris kitus pasirinkimus: (1) „Amazon“ „Apache Spark Library“, (2) pasirinktinis Python kodas (kuris naudoja „TensorFLow“ arba „Apache MXNet“) arba (3) „atsineškite savo“ ten, kur esate. iš esmės nėra suvaržytos, tačiau norint sukurti ir aptarnauti jūsų modelį, reikės sukurti „Docker“ atvaizdą (tai galite padaryti naudodamiesi čia pateiktomis instrukcijomis).
„Atsinešk savo“ požiūris suteikia visišką laisvę. Tai gali pasirodyti patrauklu duomenų mokslininkams, kurie jau yra sukonstravę pasirinktinio ir (arba) patentuoto algoritminio kodo biblioteką, kuri gali būti nepateikta dabartiniame išoriniame rinkinyje.
- Pristatykite savo pranašumus: leidžia visiškai valdyti visą duomenų mokslo sistemą ir naudoti nuosavybės teises.
- Atkreipkite dėmesį į save: norint mokyti ir aptarnauti gautą modelį, reikalinga dokkerizavimas. Už algoritminių patobulinimų įtraukimą jūs esate atsakingas.
Nepriklausomai nuo jūsų pasirinkto algoritmo, „SageMaker on AWS“ yra požiūris, kurį verta apsvarstyti, atsižvelgiant į tai, kiek daug dėmesio skirta naudojimo paprastumui duomenų mokslo požiūriu. Jei kada bandėte perkelti mašininio mokymosi projektą iš vietinės aplinkos į hostedą, būsite maloniai nustebinti, kaip sklandus „SageMaker“ tai daro. O jei pradedate nuo nulio, jau esate keliais žingsniais arčiau savo tikslo, atsižvelgiant į tai, kiek jau yra po ranka.
