Turinys:
Savo įraše „Hadoop Analytics“: ne taip paprasta keliuose duomenų šaltiniuose, aš aptariau problemas, su kuriomis susiduria organizacijos, bandant naudoti „Hadoop“ duomenims iš kelių vidinių šaltinių saugoti ir analizuoti. Šiame įraše kalbėsiu apie išorinių duomenų įtraukimo į rinkinį iššūkius ir naudą.
Pridėjus išorinių duomenų pagerėja nuspėjamoji analizė
Organizacijos vis labiau nori analizuoti trečiųjų šalių duomenis, nes šie šaltiniai padidina jų matomumą platesnėje rinkoje, padeda numatyti būsimus veiksmus ir generuoja papildomus pardavimo atvejus. Vien tik vidinių duomenų analizė suteikia istorinę klientų ir jų pirkinių perspektyvą, kuri yra naudinga tendencijų ir modelių analizei, tačiau turi ribotą numatomą vertę. Šie vidiniai šaltiniai teikia duomenis, dažnai vadinamus atsilikimo rodikliais, nes jie seka praeities įvykius. Nors atsilikę rodikliai gali patvirtinti, kad tendencija atsiranda ar netrukus įvyks, jie negali lengvai numatyti, kas įvyks, ar aptikti pokyčių rinkoje.
Organizacijos nori derinti pagrindinius rinkos rodiklius iš išorinių šaltinių su vidiniais istoriniais duomenimis ir pardavimo kanalų informacija. Šis derinys suteikia jiems geresnių įžvalgų apie modelius ir tendencijas bei padeda padidinti pasitikėjimą jų nuspėjamaisiais modeliais, kuriuos jie naudoja pardavimo ir rinkodaros programoms, sukčiavimo aptikimui, rizikos analizei ir dar daugiau.
