Q:
Daugiau ne visada yra geriau. Kaip organizacijos gali sumažinti savo duomenų keliamą triukšmą, kad pasiektų tikslią, tikslią analizę?
A:Esant didelėms duomenų sistemoms, vienas didžiausių klausimų įmonėms yra, kaip išlaikyti šiuos projektus tikslingus ir veiksmingus. Daugelis įrankių ir išteklių, sukurtų dideliems duomenims, yra sukurti norint išsiurbti didžiulį informacijos kiekį plačiame tinkle. Jie ne visada yra tokie atidūs, norėdami patobulinti šiuos duomenis ir išlaikyti juos paprastus. Tačiau, siekiant sukurti tikslingesnius ir naudingesnius didžiųjų duomenų projektus, pramonėje atsiranda keletas geriausių praktikų.
Vienas tikslinio didžiųjų duomenų požiūrio ramstis yra naudoti tinkamas programinės įrangos priemones ir išteklius. Ne visos analizės ir didelių duomenų sistemos yra vienodos. Kai kurie gali efektyviau išfiltruoti perteklinius ar nereikšmingus duomenis ir leisti verslui susitelkti ties esminiais faktais, kurie nulems jų pagrindinius procesus ir operacijas.
Kita didelė šio proceso dalis yra susijusi su žmonėmis. Prieš įsitraukdami į didžiųjų duomenų projektą ir ieškodami programinės įrangos programinės įrangos, vykdydami diegimą ir mokydami kitus, centrinė žmonių grupė turi būti atsakinga už procesą ir deleguoti taip pat tyrimų ir „smegenų šturmo“ užduotis. Tai gali paversti didelių duomenų metodą tiksliu chirurginiu metodu, kuris pagerins verslą, netapant pernelyg sunkiu ir nesutrikdant kasdienių operacijų.
Pvz., Darbo grupės ar kitos pagrindinės grupės gali susėsti ir išsamiai išnagrinėti, kaip bus vykdomas įgyvendinimas, kaip verslas pradės vertinti duomenų rinkinius, kaip sudarys kryžmines indeksus sąskaitose, kokį popierių ar skaitmeniniai pristatymai, kuriuos jie naudos skleisti tą informaciją, kaip sudarys naudingas ataskaitas ir pan. Ši informacija apsaugos verslą nuo didelių duomenų pūtimo.
Be to, kai įmonės pradeda įsigyti daugiau pardavėjų paslaugų, daro daugiau didelių duomenų graužimo ir daro IT architektūras sudėtingesnes, jie išmoko atskirti jautriausius duomenis nuo visų kitų.
Vienas iš būdų tai padaryti yra sukurti pakopinę sistemą. Pvz., Pagrindinius klientų ID ir istorijos duomenų rinkinius galima laikyti specialiai prižiūrimoje duomenų bazėje pagal tam tikrą debesies saugos sutartį arba vietoje. Kiti duomenų rinkiniai gali būti mažiau specializuotoje duomenų aplinkoje arba dėl to, kad jie yra mažiau jautrūs duomenų pažeidimams, arba dėl to, kad jie yra mažiau tiesiogiai susiję su verslo analize. Pakopinės ar daugiapakopės sistemos leidžia ekonomiškai efektyviai įgyvendinti didelius duomenis.
Tai yra keletas būdų, kaip verslas sumaniai renkasi didelius duomenis tinkamu būdu. Užuot tiesiog išsiurbę bet kuriuos duomenis, kuriuos gali sugriebti, jie tam tikrus duomenų rinkinius laiko svarbiausiais, kad gautų kuo daugiau verslo žinių ir kuo mažiau pastangų.
