Duomenų šaltinių derinimas „Hadoop“ yra sudėtingas verslas. Kai kurios to priežastys:
- Problemiški yra individualūs šaltinių scenarijai, kuriuose derinami duomenų šaltiniai.
- Duomenų integravimo ar duomenų mokslo priemonių naudojimas sukelia per daug neapibrėžtumo.
- Pridėti duomenų iš išorinių šaltinių yra beveik neįmanoma.
Šiandien aptarsiu, kaip patobulinta „Hadoop“ analizė naudojant šaltinio-agnostikos technologijas, leidžiančias lengvai derinti vidinius ir išorinius duomenų šaltinius. Be to, kad aprašysiu, kaip veikia šaltinio-agnostikos metodai, taip pat aprašysiu, kodėl „Hadoop“ analitikai reikia integruotos žvalgybos ir žinių perdavimo galimybių, ryšių ir duomenų charakteristikų supratimo bei keičiamo dydžio ir didelio našumo architektūros.
Internetinis seminaras: Reikšmės matricos: Taškų sujungimas „Hadoop“ sistemoje - Registruotis čia |
