Namai Garsas Kaip aš galiu išmokti naudoti hadoop analizuoti didelius duomenis?

Kaip aš galiu išmokti naudoti hadoop analizuoti didelius duomenis?

Anonim

Q:

Kaip aš galiu išmokti naudoti „Hadoop“ analizuoti didelius duomenis?

A:

„Apache“ programinės įrangos rinkinys, žinomas kaip „Hadoop“, tampa labai populiariu šaltiniu dideliems duomenų rinkiniams tvarkyti. Šio tipo duomenų tvarkymo programinės įrangos sistema buvo sukurta tam, kad būtų galima konkrečiais būdais kaupti duomenis, remiantis projektais, kurie gali padaryti kai kuriuos duomenų projektus efektyvesnius. Beje, „Hadoop“ yra tik viena iš daugelio didelių duomenų rinkinių tvarkymo priemonių.

Vienas iš pirmųjų ir pagrindinių būdų sužinoti apie didžiųjų duomenų analizę naudojant „Hadoop“ yra suprasti kai kuriuos aukščiausio lygio „Hadoop“ komponentus ir tai, ką jis daro. Tai apima „Hadoop“ verpalų „išteklių valdymo platformą“, kurią galima pritaikyti tam tikroms tinklo konfigūracijoms, taip pat „Hadoop MapReduce“ funkcijų rinkinį, taikomą dideliems duomenų rinkiniams. Taip pat yra „Hadoop“ paskirstomųjų failų sistema (HDFS), kuri padeda kaupti duomenis paskirstytose sistemose, kad juos būtų galima greitai ir efektyviai indeksuoti ar gauti.

Be to, norintys labiau susipažinti su „Hadoop“, gali ieškoti individualių publikuotų šaltinių specialistams, kurie paaiškina programinę įrangą reliatyviai. Šis Chriso Stucchio pavyzdys asmeniniame tinklaraštyje pateikia puikų taškų rinkinį apie „Hadoop“ ir duomenų skalę. Vienas pagrindinių perėmimų yra tas, kad „Hadoop“ gali būti naudojamas dažniau, nei būtina, ir tai gali būti ne pats geriausias sprendimas individualiam projektui. Peržiūrėję tokio pobūdžio išteklius specialistai galės geriau susipažinti su informacija apie „Hadoop“ naudojimą bet kuriame scenarijuje. Stucchio taip pat pateikia metaforas, kaip Hadoop funkcijas susieti su konkrečiomis fizinėmis užduotimis. Šiame pavyzdyje skaičiuojamas knygų skaičius bibliotekoje, tuo tarpu „Hadoop“ funkcija šią biblioteką gali suskaidyti į skyrius, pateikdama atskirus skaičius, kurie yra sudedami į vieną bendrą duomenų rezultatą.

Išsamesnis būdas, kuriuo specialistai gali daugiau sužinoti apie „Hadoop“ ir jo taikymą dideliems duomenims, yra specialūs mokymo šaltiniai ir programos. Pavyzdžiui, internetinė mokymosi įmonė „Cloudera“, garsi nuotolinių mokymo sesijų teikėja, turi daugybę įdomių „Hadoop“ naudojimo galimybių ir panašių duomenų tvarkymo būdų.

Kaip aš galiu išmokti naudoti hadoop analizuoti didelius duomenis?