Turinys:
- Apibrėžimas - ką reiškia žinių atradimas duomenų bazėse (KDD)?
- „Techopedia“ paaiškina žinių atradimą duomenų bazėse (KDD)
Apibrėžimas - ką reiškia žinių atradimas duomenų bazėse (KDD)?
Žinių atradimas duomenų bazėse (KDD) yra naudingų žinių iš duomenų rinkimo atradimo procesas. Ši plačiai naudojama duomenų gavybos technika yra procesas, kuris apima duomenų paruošimą ir atranką, duomenų išvalymą, įtraukiant ankstesnes žinias apie duomenų rinkinius ir aiškių rezultatų aiškinimą remiantis stebimais rezultatais.
Pagrindinės KDD taikymo sritys yra rinkodara, sukčiavimo aptikimas, telekomunikacijos ir gamyba.
„Techopedia“ paaiškina žinių atradimą duomenų bazėse (KDD)
Tradiciškai duomenų gavyba ir žinių atradimas buvo atliekamas rankiniu būdu. Laikui bėgant, duomenų kiekis daugelyje sistemų išaugo iki didesnio nei terabaitų dydžio ir nebegalėjo būti laikomas rankiniu būdu. Be to, sėkmingam bet kokio verslo egzistavimui laikoma, kad būtina atrasti pagrindinius duomenų modelius. Todėl paslėptiems duomenims aptikti ir prielaidoms sukurti buvo sukurtos kelios programinės įrangos priemonės, kurios sudarė dirbtinio intelekto dalį.
KDD procesas pasiekė aukščiausią tašką per pastaruosius 10 metų. Dabar jame yra daugybė skirtingų atradimo būdų, įskaitant induktyvųjį mokymąsi, Bajeso statistiką, semantinių užklausų optimizavimą, žinių įgijimą ekspertų sistemoms ir informacijos teoriją. Pagrindinis tikslas yra iš žemo lygio duomenų išgauti aukšto lygio žinias.
KDD apima daugiadisciplininę veiklą. Tai apima duomenų saugojimą ir prieigą, masyvių duomenų rinkinių didinimo algoritmus ir rezultatų aiškinimą. Duomenų saugojimo ir prieigos prie duomenų saugojimo procesas palengvina KDD procesą. Dirbtinis intelektas taip pat palaiko KDD, atrasdamas empirinius dėsnius iš eksperimentų ir stebėjimų. Duomenyse atpažįstami modeliai turi galioti naujiems duomenims ir turėti tam tikrą tikrumą. Šie modeliai laikomi naujomis žiniomis. Visame KDD procese yra šie žingsniai:
- Nurodykite KDD proceso tikslą iš kliento perspektyvos.
- Supraskite susijusias taikymo sritis ir reikalingas žinias
- Pasirinkite tikslinį duomenų rinkinį arba duomenų pavyzdžių, kuriems atliekamas aptikimas, poaibį.
- Išvalykite ir apdorokite duomenis, nuspręsdami strategijas, kaip tvarkyti trūkstamus laukus, ir pakeiskite duomenis pagal reikalavimus.
- Supaprastinkite duomenų rinkinius pašalindami nepageidaujamus kintamuosius. Tada išanalizuokite naudingas funkcijas, kurios gali būti naudojamos duomenims atvaizduoti, atsižvelgiant į tikslą ar užduotį.
- Norėdami pasiūlyti paslėptus modelius, suderinkite KDD tikslus su duomenų gavybos metodais.
- Pasirinkite duomenų gavybos algoritmus, kad atrastumėte paslėptus modelius. Šis procesas apima sprendimą, kurie modeliai ir parametrai gali būti tinkami visam KDD procesui.
- Ieškokite dominančios struktūros tam tikra reprezentacine forma, kuri apima klasifikavimo taisykles ar medžius, regresiją ir grupavimą.
- Interpretuokite esmines žinias pagal išminuotus modelius.
- Pasinaudokite žiniomis ir įtraukite į kitą sistemą tolimesniems veiksmams.
- Dokumentuokite jį ir sudarykite ataskaitas suinteresuotoms šalims.
