Namai Garsas Kas yra atvirojo kodo didžiųjų duomenų analizė? - apibrėžimas iš techopedijos

Kas yra atvirojo kodo didžiųjų duomenų analizė? - apibrėžimas iš techopedijos

Turinys:

Anonim

Apibrėžimas - ką reiškia atvirojo kodo didžiųjų duomenų analizė?

Atvirojo kodo didžiųjų duomenų analizė reiškia atvirojo kodo programinės įrangos ir įrankių naudojimą didžiuliam duomenų kiekiui analizuoti, siekiant surinkti svarbią ir veiksmingesnę informaciją, kurią organizacija gali naudoti siekdama savo verslo tikslų. Didžiausias atvirojo kodo didžiųjų duomenų analizės veikėjas yra „Apache's Hadoop“ - ji yra plačiausiai naudojama programinės įrangos biblioteka, skirta apdoroti milžiniškus duomenų rinkinius kompiuterių grupėje, naudojant paskirstytą procesą lygiagretumui.

„Techopedia“ paaiškina atvirojo kodo didžiųjų duomenų analizę

Atvirojo šaltinio didžiųjų duomenų analizė naudoja atvirojo kodo programinę įrangą ir įrankius, norėdama vykdyti stambiųjų duomenų analizę, naudodama visą programinės įrangos platformą arba įvairius atvirojo kodo įrankius, skirtus skirtingoms duomenų analizės užduotims. „Apache Hadoop“ yra labiausiai žinoma didžiųjų duomenų analizės sistema, tačiau norint suburti tikrą analizės sistemą, reikalingi kiti komponentai.

„Hadoop“ yra atvirojo kodo „MapReduce“ algoritmo, kurį inicijavo „Google“ ir „Yahoo“, įgyvendinimas, todėl jis yra daugelio analizės sistemų pagrindas šiandien. Daugybė didelių duomenų analizės įrankių naudoja atvirąjį kodą, įskaitant tokias patikimas duomenų bazių sistemas kaip atvirojo kodo „MongoDB“, sudėtinga ir keičiama „NoSQL“ duomenų bazė, labai tinkanti didelių duomenų programoms, taip pat kitos.

Atvirojo kodo didžiųjų duomenų analizės paslaugos apima:

  • Duomenų rinkimo sistema
  • Kontrolinis centras, skirtas klasterių administravimui ir stebėjimui
  • Mašinų mokymosi ir duomenų gavybos biblioteka
  • Paraiškų koordinavimo tarnyba
  • Apskaičiuokite variklį
  • Vykdymo sistema
Kas yra atvirojo kodo didžiųjų duomenų analizė? - apibrėžimas iš techopedijos