Turinys:
Apibrėžimas - ką reiškia „Data Cube“?
Duomenų kubas nurodo trimatį (3D) (arba aukštesnį) verčių diapazoną, kuris paprastai naudojamas paaiškinti vaizdo duomenų laiko seką. Tai yra duomenų abstrakcija, norint įvertinti suvestinius duomenis iš įvairių požiūrių. Tai taip pat naudinga atliekant vaizdavimo spektroskopiją, nes spektriniu požiūriu išspręstas vaizdas vaizduojamas kaip trimatis tūris.
Duomenų kubas taip pat gali būti apibūdinamas kaip daugiamatis dviejų dimensijų lentelių plėtinys. Tai gali būti vertinama kaip identiškų 2-D lentelių, sukrautų viena ant kitos, kolekcija. Duomenų kubeliai naudojami atvaizduoti duomenis, kurie yra per daug sudėtingi, kad juos būtų galima apibūdinti stulpelių ir eilučių lentelėmis. Iš esmės duomenų kubeliai gali būti daug didesni nei 3D, kad apimtų dar daugiau aspektų.
„Techopedia“ paaiškina „Data Cube“
Duomenų kubas paprastai naudojamas norint lengvai interpretuoti duomenis. Tai ypač naudinga pateikiant duomenis kartu su matmenimis kaip tam tikrus verslo reikalavimų rodiklius. Kiekvienas kubo matmuo parodo tam tikras duomenų bazės savybes, pavyzdžiui, dienos, mėnesio ar metų pardavimus. Duomenys, įterpti į duomenų kubą, leidžia analizuoti beveik visus duomenis apie beveik bet kuriuos ar visus klientus, pardavimo agentus, gaminius ir dar daugiau. Taigi duomenų kubas gali padėti nustatyti tendencijas ir analizuoti našumą.
Duomenų kubeliai daugiausia suskirstyti į dvi kategorijas:
- Daugialypis duomenų kubas: dauguma OLAP produktų yra kuriami remiantis struktūra, kurioje kubas modeliuojamas kaip daugialypis masyvas. Šie daugialypiai OLAP (MOLAP) produktai paprastai pasižymi geresniu našumu, palyginti su kitais požiūriais, daugiausia todėl, kad juos galima indeksuoti tiesiogiai į duomenų kubo struktūrą, norint surinkti duomenų pogrupius. Kai matmenų skaičius didesnis, kubas tampa retesnis. Tai reiškia, kad keliose ląstelėse, vaizduojančiose tam tikrus atributų derinius, nebus jokių suvestinių duomenų. Tai savo ruožtu padidina saugojimo reikalavimus, kurie kartais gali pasiekti nepageidaujamą lygį, todėl MOLAP sprendimas yra netinkamas dideliems duomenų rinkiniams, turintiems daug matmenų. Gali padėti glaudinimo būdai; tačiau jų naudojimas gali pakenkti natūraliam MOLAP indeksavimui.
- Reliacinis OLAP: Reliacinis OLAP naudoja santykinių duomenų bazių modelį. ROLAP duomenų kubas yra naudojamas kaip reliacinių lentelių krūva (maždaug dvigubai daugiau nei matmenų kiekis), palyginti su daugialypiu masyvu. Kiekviena iš šių lentelių, vadinama kubo formos ženklu, žymi konkretų vaizdą.
