Namai Duomenų bazės Kas yra hadoop paskirstytų failų sistema (hdfs)? - apibrėžimas iš techopedijos

Kas yra hadoop paskirstytų failų sistema (hdfs)? - apibrėžimas iš techopedijos

Turinys:

Anonim

Apibrėžimas - ką reiškia „Hadoop“ paskirstytųjų failų sistema (HDFS)?

„Hadoop“ paskirstytų failų sistema (HDFS) yra paskirstytų failų sistema, veikianti naudojant standartinę arba žemos kokybės aparatinę įrangą. Sukurtas „Apache Hadoop“, HDFS veikia kaip standartinė paskirstytų failų sistema, tačiau suteikia geresnį duomenų pralaidumą ir prieigą per „MapReduce“ algoritmą, aukštą toleranciją gedimams ir natūralių didelių duomenų rinkinių palaikymą.

„Techopedia“ paaiškina „Hadoop“ paskirstytų failų sistemą (HDFS)

HDFS saugo didelį kiekį duomenų, talpinamų keliose mašinose, paprastai šimtuose ir tūkstančiuose tuo pačiu metu sujungtų mazgų, ir užtikrina duomenų patikimumą, pakartodamas kiekvieną duomenų egzempliorių kaip tris skirtingas kopijas - dvi vienoje grupėje ir vieną kitoje. Sugedus, šios kopijos gali būti pakeistos.

HDFS architektūra susideda iš grupių, iš kurių kiekviena pasiekiama per vieną „NameNode“ programinės įrangos įrankį, įdiegtą atskirame kompiuteryje, kad būtų galima stebėti ir valdyti tos klasterio failų sistemą ir vartotojo prieigos mechanizmą. Kiti įrenginiai įdiegia vieną „DataNode“ egzempliorių, kad tvarkytų klasterių saugyklas.

Kadangi HDFS parašytas „Java“, jis palaiko „Java“ programų programavimo sąsajas (API), skirtas programų integracijai ir prieinamumui. Jį taip pat galima pasiekti naudojant standartines interneto naršykles.

Kas yra hadoop paskirstytų failų sistema (hdfs)? - apibrėžimas iš techopedijos