Turinys:
Apibrėžimas - ką reiškia įvairovė?
Įvairovė yra 3 V pagrindų komponentas, naudojamas apibrėžti skirtingiems duomenų tipams, kategorijoms ir susijusiam didelės duomenų saugyklos valdymui. Įvairovė suteikia informacijos apie skirtingų didžiųjų duomenų klasių unikalumą ir jų palyginimą su kitų tipų duomenimis.
Techopedia paaiškina įvairovę
Įvairovė apibūdina duomenų, esančių dideliuose duomenyse, pobūdį. Tai apima skirtingus duomenų formatus, duomenų semantiką ir duomenų struktūrų tipus.
Įvairovė yra orientuota į skirtingų metodų, skirtų išspręsti ir valdyti duomenų įvairovę stambiuose duomenyse, teikimą, pavyzdžiui:
- Indeksavimo būdai duomenims susieti su skirtingais ir nesuderinamais tipais
- Duomenų profiliavimas siekiant nustatyti duomenų šaltinių tarpusavio ryšius ir anomalijas
- Duomenų importavimas į visuotinai priimtinus ir tinkamus naudoti formatus, pvz., Išplėstinę žymėjimo kalbą (XML)
- Metaduomenų tvarkymas, siekiant duomenų konteksto nuoseklumo
