Turinys:
Apibrėžimas - ką reiškia „Apache Nutch“?
„Apache Nutch“ yra interneto tikrinimo programinės įrangos produktas, kurį galima naudoti kaupiant duomenis iš interneto. Jis naudojamas kartu su kitais „Apache“ įrankiais, tokiais kaip „Hadoop“, duomenų analizei.
„Techopedia“ aiškina „Apache Nutch“
„Apache Nutch“ yra atvirojo kodo produktas, licencijuotas „Apache Software Foundation“. Ši kūrėjų bendruomenė turi licencijas įvairiems „Apache“ programinės įrangos įrankiams, galintiems rūšiuoti ir analizuoti duomenis. Viena iš pagrindinių technologijų yra „Apache Hadoop“ - didelis duomenų analizės įrankis, labai populiarus verslo bendruomenėje.
„Nutch“ kartu su tokiais įrankiais kaip „Apache Hadoop“ ir failų saugojimui, analizei ir kitoms funkcijoms yra rinkti ir saugoti duomenis iš interneto naudojant žiniatinklio nuskaitymo algoritmus.
Norėdami surinkti informaciją pagal URL, vartotojai gali pasinaudoti paprastomis „Apache Nutch“ komandomis. Paprastai vartotojai naudoja „Apache Nutch“ kartu su kitu atvirojo kodo įrankiu, sistema, vadinama „Apache Solr“, kuri gali būti duomenų, surinktų kartu su „Apache Nutch“, saugykla.
