Namai Tendencijos 6 Dideli mitai apie didelių duomenų valdymą

6 Dideli mitai apie didelių duomenų valdymą

Turinys:

Anonim

2014 m. Gegužės mėn. „Forrester Research“ išleido dvi ataskaitas, kuriose padarytos tam tikros išvados apie didžiųjų duomenų aplinkybes. Tyrimų įmonė apklausė daugiau nei 250 rinkodaros ir verslo plėtros vadovų. Anot ataskaitos autorių, didžioji duomenų retorika yra visų laikų aukščiausia, o technologijų pardavėjai nurodo produktus, kurie, atrodo, yra neįtikėtini.


Gartneris sutinka su „Forrester Research“; didelis hype supa didelius duomenis. 2014 m. Rugsėjo mėn. Ataskaitoje „Gartner“ pristato penkis didžiausius duomenų mitus, o „Gartner“ analitikai pateikia savo nuomonę, kas neteisingai suprantama apie didelius duomenis ir jų manipuliavimą. Taigi kokie yra didžiausi didžiųjų duomenų mitai? Pažiūrėkime.

Mitas: Visi yra prieš mus, priimdami didelius duomenis.

Gartneris sako, kad visų laikų susidomėjimas dideliais duomenimis yra aukščiausias. Nepaisant to, nedidelis 13 procentų apklaustųjų turi veikiančias sistemas. Priežastis: dauguma kompanijų dar neturi išsiaiškinti, kaip iš didelių duomenų saugyklų išmatuoti kokią nors vertę. Čia „Gartner“ apklausa yra optimistiškesnė nei „Forrester“ ataskaitoje, kurioje nustatyta, kad tik 9 procentai apklausos dalyvių teigė, kad planuoja per ateinančius metus įdiegti didelio duomenų perdavimo technologijas. (Dideli duomenys gali pasiūlyti daug. Sužinokite daugiau iš 5 realių problemų, kuriuos gali išspręsti didieji duomenys.)

Mitas: turime tiek daug duomenų; mums nereikia jaudintis dėl mažų duomenų trūkumų.

„Gartner“ jaudinasi dėl fobolo, kurį turime žmonės: „Turime tiek daug, tiek mažai, kas blogai, nesvarbu“. Tedas Friedmanas, viceprezidentas ir žymus „Gartner“ analitikas, mano, kad tai yra neteisingas būdas pažvelgti į situaciją.


"Iš tikrųjų, nors kiekvienas atskiras trūkumas daro daug mažesnį poveikį visam duomenų rinkiniui, nei tai padarė, kai buvo mažiau duomenų, trūkumų yra daugiau nei anksčiau, nes yra daugiau duomenų", - teigė Friedmanas. "Todėl bendras nekokybiškų duomenų poveikis visam duomenų rinkiniui išlieka tas pats."


Friedmanas prideda dar vieną nerimo priežastį. Didelių duomenų kaupimas dažnai apima duomenis, gaunamus iš verslo ribų, todėl jų struktūra ir kilmė nežinoma. Tai padidina klaidų tikimybę.

Mitas: Didelių duomenų technologija panaikins duomenų integravimo poreikį.

Yra dvi pagrindinės duomenų analizės strategijos, kurios gali būti taikomos dideliems duomenims: „schema on write“ arba „schema read“. Dar visai neseniai rašymo schema buvo vienintelis naudojamas metodas. Perskaityta schema yra dabartinė duomenų bazės valdymo trauka. Skirtingai nuo rašymo schemos, kuriai reikia struktūrizuoto formato, duomenys neapdoroto formato formatu įkeliami į skaitomas schemas duomenų bazėse. Tada kūrėjai, naudodamiesi nestruktūrizuotomis duomenų bazių platformomis, tokiomis kaip „Hadoop“, sulenkia skirtingus duomenis į naudojamą formatą. Perskaityta schema turi akivaizdžių pranašumų, tačiau, kaip užsimena Gartneris, duomenų integracija turi įvykti tam tikru metu.

Mitas: Naudoti duomenų saugyklą sudėtingesnei analizei yra beprasmiška.

Praleisti laiką duomenų saugyklai sukurti yra beprasmiška daugeliui informacijos valdytojų, ypač kai naujai užfiksuoti duomenys skiriasi nuo duomenų saugykloje esančių. Tačiau „Gartner“ dar kartą perspėja, kad net ir pažangi duomenų analizė naudos duomenų saugyklas ir naujus duomenis, o tai reiškia, kad duomenų integratoriai privalo:

  • Patobulinkite naujus duomenų tipus, kad jie būtų tinkami analizei
  • Nuspręskite, kurie duomenys yra svarbūs, ir kokio lygio duomenų reikia
  • Nuspręskite, kaip kaupti duomenis
  • Supraskite, kad duomenys gali būti tikslinami ne duomenų saugykloje, bet ir kitose vietose

Mitas: duomenų saugyklą pakeis duomenų ežerai.

Duomenų ežerai yra skirtingų duomenų saugyklos, o ne duomenų saugyklos, kuriose duomenys yra struktūrizuoto formato. Duomenų ežero sukūrimas reikalauja mažai pastangų (nereikia formatuoti duomenų), palyginti su duomenų saugyklomis, todėl duomenų ežerai domina.


„Gartner“ pabrėžia, kad neturėti duomenų nėra prasmės - esmė yra galimybė manipuliuoti užfiksuotais duomenimis, kad būtų galima priimti pagrįstus sprendimus. Be to, sudėtinga naudoti (šiek tiek neįrodytus) duomenų ežerus, kad būtų lengviau priimti sprendimus.


„Duomenų saugyklos jau yra pajėgios palaikyti daugybę vartotojų visoje organizacijoje“, - teigė „Gartner“ tyrimų direktorius Nickas Heudeckeris. "Informacijos valdymo lyderiams nereikia laukti, kol duomenų ežerai pasivys". (Sužinokite daugiau apie didelių duomenų priėmimą 7 dalykuose, kuriuos prieš priimdami turite žinoti apie didelius duomenis.)

„Big Data Works“ - gali nebūti naujų duomenų manipuliavimo metodų

Priežastis, kurią „Gartner“ teigė, kad „didžiausi duomenų mitai“ vietoj „didelių duomenų mitų“ paaiškėja perskaičius pranešimą. „Gartner“ nėra didelių duomenų atsarga. „Gartner“ yra apgailėtinas tų, kurie mano, kad naujesni manipuliavimo dideliais duomenimis metodai yra pasirengę „svarbiausiam laikui“.

6 Dideli mitai apie didelių duomenų valdymą