Turinys:
- Apibrėžimas - ką reiškia nestruktūruota duomenų gavyba?
- „Techopedia“ paaiškina nestruktūruotą duomenų gavybą
Apibrėžimas - ką reiškia nestruktūruota duomenų gavyba?
Nestruktūrizuotas duomenų gavyba yra praktika, kai reikia žiūrėti į palyginti nestruktūrizuotus duomenis ir bandyti iš jų gauti tikslesnius duomenų rinkinius. Tai dažnai susideda iš duomenų rinkimo iš šaltinių, kurie tradiciškai nenaudojami duomenų gavybos veiklai.„Techopedia“ paaiškina nestruktūruotą duomenų gavybą
Apskritai, duomenų gavyba yra praktika, kai reikia surinkti duomenų rinkinius ir bandyti įgyti tam tikram formatui tik vertingiausius informacijos bitus. Paprastai tai yra sunkiau, kai yra palyginti nestruktūruoti duomenys. IT ekspertai nestruktūrizuotus duomenis apibūdina kaip duomenis, kurie nėra tam tikro formato, duomenis, kurie yra „sunkūs teksto“ arba duomenis, kurie yra „paslėpti“ netiksliuose dokumentuose, kurie oficialiai nėra įpareigoti pateikti techninę informaciją.
Nestruktuoto dokumento pavyzdys gali būti laiškas ar susirašinėjimas tarp dviejų ar daugiau šalių. Kasant nestruktūrizuotą duomenų gavybą, technologijos suardytų tą raidę, ieškodamos konkrečių identifikatorių ir informacijos bitų, tokių kaip susijusių šalių pavadinimai, laiškų išsiuntimo datos, susijusių įmonių pavadinimai, valiutos sumos ar kita kiekybinė informacija duomenų bitus arba kodus, priskirtus tam tikriems produktams, paslaugoms ar sandoriams. Tokio tipo duomenys yra iškasami, o po to pateikiami tokiu formatu, kurį įmonės ar kitos šalys gali naudoti greitam informacijos perdavimui ar sukurtoms verslo žvalgybos programoms.
