Namai Tendencijos Kas yra apache kibirkštis? - apibrėžimas iš techopedijos

Kas yra apache kibirkštis? - apibrėžimas iš techopedijos

Turinys:

Anonim

Apibrėžimas - ką reiškia „Apache Spark“?

„Apache Spark“ yra atvirojo kodo programa, naudojama duomenų analizei. Tai yra dalis didesnio priemonių rinkinio, įskaitant „Apache Hadoop“ ir kitus atvirojo kodo išteklius šiandienos analitikos bendruomenei.

Ekspertai apibūdina šią palyginti naują atvirojo kodo programinę įrangą kaip duomenų analizės klasterio skaičiavimo įrankį. Jis gali būti naudojamas su „Hadoop“ paskirstytųjų failų sistema (HDFS), kuri yra ypatingas „Hadoop“ komponentas, palengvinantis sudėtingą failų tvarkymą.

Kai kurie IT profesionalai apibūdina „Apache Spark“ naudojimą kaip galimą „Apache Hadoop MapReduce“ komponento pakaitalą. „MapReduce“ taip pat yra grupavimo įrankis, kuris padeda kūrėjams apdoroti didelius duomenų rinkinius. Tie, kurie supranta „Apache Spark“ dizainą, pabrėžia, kad kai kuriose situacijose tai gali būti daug kartų greitesnė nei „MapReduce“.

„Techopedia“ paaiškina „Apache Spark“

Tie, kurie praneša apie šiuolaikinį „Apache Spark“ naudojimą, rodo, kad įmonės jį naudoja įvairiais būdais. Dažniausiai naudojamas duomenų kaupimas ir struktūrizavimas. „Apache Spark“ taip pat gali būti naudingas atliekant analitinį kompiuterio mokymąsi ar duomenų klasifikavimą.

Paprastai organizacijos susiduria su iššūkiu patobulinti duomenis efektyviai ir šiek tiek automatiškai, kai „Apache Spark“ gali būti naudojama tokioms užduotims vykdyti. Kai kurie taip pat reiškia, kad „Spark“ naudojimas gali padėti suteikti prieigą tiems, kurie mažiau išmano apie programavimą ir nori įsitraukti į analizės tvarkymą.

„Apache Spark“ apima „Python“ ir susijusių programinės įrangos kalbų API.

Kas yra apache kibirkštis? - apibrėžimas iš techopedijos