Q:
Kokie yra keturi pagrindai, norint tapti geru duomenų mokslininku?
A:Kaip pabrėžia daugelis ekspertų, norint tapti puikiu duomenų mokslininku, reikia derinti įgūdžius ir patirtį, įgyjant specialiai mokantis ir analizuojant sudėtingą sritį. Šiandien labai reikalingi duomenų mokslininkai, kaip vertingų duomenų išteklių administratoriai ir kuratoriai. Pažvelkime, kokie yra kai kurie iš šių pagrindinių įgūdžių.
Pirmasis iš keturių pagrindinių duomenų mokslininko darbo komponentų yra matematika ir statistika. Gerų duomenų mokslininkai turėtų išmokti susikalbėti apie įvairias matematines sąvokas, susijusias su prižiūrimu ir neprižiūrimu mašinų mokymusi, įskaitant algoritmų tipus, tokius kaip sprendimų medžiai, atsitiktinis miškas, logistinė regresija, grupavimas ir dimensijos taikymas mokantis mašinų (ML). Apskritai, jie turėtų gerai mokėti dirbti su matematinėmis lygtimis ir statistika, naudodamiesi statistinės analizės šaltiniais.
Antrasis pagrindinis duomenų mokslo darbo komponentas yra programavimas ir duomenų bazių valdymas. Asmenys turėtų mokėti mokėti scenarijų kalbas, tokias kaip Python, ir statistines kalbas, tokias kaip R, taip pat turėti patirties ir įgūdžių, susijusių su duomenų bazių ir SQL semantika bei operatyvinėmis technikomis. Žinios apie programinės įrangos komponentus, tokius kaip „Hadoop“, „MapReduce“, „Hive“ ir „Pig“, taip pat patraukli darbdaviams.
Trečiasis pamatinis komponentas norint tapti geru duomenų mokslininku yra duomenų mokslo supratimo ir mašininio mokymosi teorinis ir filosofinis komponentai. Šie asmenys turėtų savarankiškai pradėti spręsti smalsių minčių problemas - galų gale, jie derina neapdorotą kiekybinę analizę ir kūrybingą mašininio mokymosi ir duomenų mokslo procesų supratimą. Užuot buvę vien tik techniniais numeriais, jie turėtų gilintis į tai, ką reiškia kurti kompiuterinio mokymo projektus ir dirbti su duomenų mokslo iniciatyvomis, atsižvelgiant į galutinius tikslus ir rezultatus.
Ketvirtas svarbus mokymosi būti gerų duomenų ramsčiais pagrindas yra darbas su žmonėmis ir galimybė naudoti duomenis kitiems žmonėms suprantamais būdais.
Geri duomenų žinovai gali būti pasakotojai - jie gali kiekybinius duomenis paversti pasakojimais ir įžvalgomis. Iš esmės, jie turėtų turėti gerus bendravimo įgūdžius, kad galėtų pateikti savo darbą prie stalo ir efektyviai jį skleisti kelioms suinteresuotosioms šalims ar atitinkamai auditorijai. Tai yra keletas pagrindinių įgūdžių tipų, kurie sukuria gerą duomenų mokslininką, pasirengusį dalyvauti šiuolaikinėje sparčiai tobulėjančioje ir greitai tobulėjančioje IT pramonėje.
