Turinys:
Apibrėžimas - ką reiškia duomenų profiliavimas?
Duomenų profiliavimas yra metodas, naudojamas duomenims ištirti skirtingais tikslais, pavyzdžiui, tikslumui ir išsamumui nustatyti. Šis procesas tiria duomenų šaltinį, pavyzdžiui, duomenų bazę, kad būtų atskleistos klaidingos duomenų organizavimo sritys. Diegus šią techniką pagerėja duomenų kokybė.
Duomenų profiliavimas taip pat vadinamas duomenų atradimu.
„Techopedia“ paaiškina duomenų profiliavimą
Duomenų profiliavimas yra būdas ištirti duomenų šaltinyje esančius duomenis ir rinkti statistiką bei informaciją apie tuos duomenis. Tokia statistika padeda nustatyti metaduomenų naudojimą ir duomenų kokybę. Šis metodas yra plačiai naudojamas įmonės duomenų saugyklose.
Duomenų profiliavimas paaiškina duomenų struktūrą, ryšį, turinį ir išvedimo taisykles, kurios padeda suprasti metaduomenų anomalijas. Duomenų profiliavimui naudojama įvairių rūšių aprašomoji statistika, įskaitant vidurkį, mažiausią, maksimalų, procentilį, dažnį ir kitus suvestinius duomenis, tokius kaip skaičius ir suma. Papildoma metaduomenų informacija, gauta atliekant profiliavimą, yra duomenų tipas, ilgis, atskirosios vertės, unikalumas ir abstraktus tipo atpažinimas.
