Turinys:
Apibrėžimas - ką reiškia nestruktūruoti duomenys?
Nestruktūrizuoti duomenys reiškia bet kokius duomenis, kurie neturi atpažįstamos struktūros. Jis yra neorganizuotas ir neapdorotas bei gali būti ne tekstinis ar tekstinis. Pvz., El. Paštas yra puikus nestruktūruotų tekstinių duomenų pavyzdys. Tai apima laiką, datą, informaciją apie gavėją ir siuntėją bei temą ir t. T., Tačiau el. Pašto turinys nestruktūrizuotas. Nestruktūruoti duomenys taip pat gali būti identifikuojami kaip silpnai struktūruoti duomenys, kai duomenų šaltiniai turi struktūrą, tačiau ne visi duomenų rinkinio duomenys atitinka tą pačią struktūrą.
Į klientą orientuotame versle nestruktūrizuotos formos duomenys gali būti išnagrinėti, siekiant pagerinti santykių rinkodarą ir ryšių su klientais valdymą (CRM). Kadangi socialinės žiniasklaidos programos, tokios kaip „Facebook“ ir „Twitter“, tampa pagrindine, nestruktūrizuotų duomenų plėtra greičiausiai pralenks struktūrizuotų duomenų pažangą.
„Techopedia“ paaiškina nestruktūrizuotus duomenis
Nestruktūrizuoti duomenys - tai duomenys, kurie pateikiami tokia forma, kuri nėra tokia tvarkinga, kaip elementai, tokie kaip skaičiuoklės puslapiai, duomenų bazių lentelės ar kiti linijiniai ar surūšiuoti duomenų rinkiniai. Iš tikrųjų terminas „duomenų rinkinys“ yra naudingas, nes jis yra susietas su duomenimis, esančiais tvarkinguose, prieinamuose masyvuose, be jokio papildomo turinio ir susietiems ar pažymėtiems tam tikroje struktūroje.
Kiti nestruktūruotų tekstinių duomenų pavyzdžiai yra „Word“ dokumentai, „PowerPoint“ pristatymai, momentiniai pranešimai, bendradarbiavimo programinė įranga, dokumentai, knygos, socialinės žiniasklaidos įrašai ir medicinos įrašai. Netekstiniai nestruktūruoti duomenys paprastai kuriami laikmenose, tokiose kaip MP3 garso failai, JPEG atvaizdai ir „Flash“ vaizdo įrašų failai ir kt.
Nestruktūruoti duomenys paprastai neapima iš anksto nustatyto duomenų modelio ir gali ne visai sutapti su reliacinėmis lentelėmis. Nestruktūrizuoti duomenys dažniausiai yra sunkūs. Tačiau tai gali būti skaičiai ir datos, taip pat faktai. Dėl to kyla neaiškumų, kuriuos sunku nustatyti naudojant įprastas programinės įrangos programas.
Jei įmonėje sugeneruotas didžiulis nestruktūrizuotų duomenų kiekis yra prastai valdomas, gali padidėti išlaidos. Duomenys spausdintiniuose dokumentuose arba elektroniniu formatu turi būti nuskaityti, kad paieškos programa galėtų analizuoti idėjas, atsižvelgiant į žodžius, naudojamus tam tikruose kontekstuose. Tai vadinama įmonių arba semantine paieška.
