Turinys:
Didžiulius duomenis - patrauklų didžiulės apimties struktūrizuotų, nestruktūruotų ar pusiau struktūruotų duomenų pavadinimą - žinoma, sunku surinkti, saugoti, valdyti, bendrinti, analizuoti ir vizualizuoti, bent naudojant tradicines duomenų bazių ir programinės įrangos programas. Štai kodėl didžiosios duomenų technologijos turi galimybę efektyviai ir efektyviai valdyti ir apdoroti didžiulius duomenų kiekius. „Apache Hadoop“ teikia sistemą ir susijusias technologijas, skirtas paskirstytu būdu apdoroti didelius duomenų rinkinius kompiuterių grupėse. Taigi, norėdami iš tikrųjų suprasti didelius duomenis, turite šiek tiek suprasti „Hadoop“. Čia apžvelgsime svarbiausius terminus, kuriuos girdėsite kalbėdami apie Hadoop - ir ką jie reiškia.
Internetinis seminaras: „Didelis lygintuvas“, sutikite „Big Data“: Pagrindinių kompiuterių duomenų išlaisvinimas naudojant „Hadoop & Spark“ Registruotis čia |
Bet pirmiausia pažvelkite, kaip veikia „Hadoop“
Prieš eidami į „Hadoop“ ekosistemą, turite aiškiai suprasti du pagrindinius dalykus. Pirmasis - kaip failas saugomas „Hadoop“; antra, kaip tvarkomi saugomi duomenys. Visos su „Hadoop“ susijusios technologijos daugiausia veikia šiose dviejose srityse ir daro jas patogesnes vartotojui. (Gaukite „Hadoop“ veikimo pagrindus, kaip „Hadoop“ padeda išspręsti didelių duomenų problemą.)
Dabar pereikime prie sąlygų.
