Namai Duomenų bazės Kas yra nešvarūs duomenys? - apibrėžimas iš techopedijos

Kas yra nešvarūs duomenys? - apibrėžimas iš techopedijos

Turinys:

Anonim

Apibrėžimas - Ką reiškia nešvarūs duomenys?

Nešvarūs duomenys nurodo duomenis, kuriuose yra klaidingos informacijos. Jis taip pat gali būti naudojamas nurodant duomenis, kurie yra atmintyje ir dar neįkelti į duomenų bazę. Visiškai pašalinti nešvarius duomenis iš šaltinio yra nepraktiška arba praktiškai neįmanoma.

Šie duomenys gali būti laikomi nešvariais duomenimis:

  • Klaidinantys duomenys
  • Duomenų kopijos
  • Neteisingi duomenys
  • Netikslūs duomenys
  • Neintegruoti duomenys
  • Duomenys, pažeidžiantys verslo taisykles
  • Duomenys be bendro formato
  • Neteisingi skyrybos ar rašybos duomenys

„Techopedia“ paaiškina nešvarius duomenis

Dėl neteisingų duomenų įvedimo nešvarūs duomenys gali būti generuojami dėl netinkamų duomenų tvarkymo ir saugojimo metodų. Kai kurie nešvarių duomenų tipai paaiškinami žemiau:

  • Neteisingi duomenys - norint įsitikinti, kad duomenys teisingi ar teisingi, įvesta vertė turėtų atitikti galiojančias lauko vertes. Pavyzdžiui, mėnesio laukelyje įrašyta vertė turėtų svyruoti nuo 1 iki 12 arba asmens amžius turi būti mažesnis nei 130. Duomenų vertės teisingumas gali būti programiškai užtikrinamas ieškant lentelių arba naudojant redagavimo tikrinimus.
  • Netiksli duomenys - gali būti, kad duomenų vertė gali būti teisinga, bet netiksli. Kartais yra praktiška patikrinti, ar nėra kitų failų ar laukų, ar duomenų vertė yra tiksli atsižvelgiant į kontekstą, kuriame jis naudojamas. Vis dėlto tikslumą dažnai galima patvirtinti tik rankiniu būdu.
  • Verslo taisyklių pažeidimai - duomenys, pažeidžiantys verslo taisykles, yra dar vienas nešvarių duomenų tipas. Pavyzdžiui, įsigaliojimo data visada turi būti prieš pasibaigiant galiojimo laikui. Kitas verslo taisyklių pažeidimo pavyzdys gali būti paciento „Medicare“ draudimo reikalavimas, kai pacientas vis dar gali būti pensinio amžiaus ir neturi teisės į „Medicare“.
  • Nenuoseklūs duomenys - nepatikrintas duomenų dubliavimas lemia duomenų nesuderinamumą. Kiekviena organizacija yra paveikta nenuoseklių ir pasikartojančių duomenų. Tai ypač būdinga kliento duomenims.
  • Neišsamūs duomenys - duomenys, kurių vertės nėra, yra pagrindinis neišsamių duomenų tipas.
  • Pasikartojantys duomenys - dėl pasikartojančio pateikimo, netinkamo duomenų sujungimo ar vartotojo klaidų gali pasikartoti duomenys.

Siekdamos pagerinti duomenų kokybę ir užkirsti kelią nešvariems duomenims, organizacijos turėtų įtraukti metodikas, užtikrinančias duomenų išsamumą, pagrįstumą, nuoseklumą ir teisingumą.

Kas yra nešvarūs duomenys? - apibrėžimas iš techopedijos