Turinys:
Apibrėžimas - ką reiškia „Apache Lucene“?
„Apache Lucene“ yra atviro kodo projektas, skirtas aukšto našumo ir visavertei teksto paieškos sistemos bibliotekai, kuri yra parašyta naudojant „Java“.
Tai yra galimybė dokumentuose ieškoti viso teksto, todėl tai yra technologija, tinkanti bet kuriai programai, kuriai reikalinga ši funkcija, ypač jei tai yra įvairiose platformose.
Pirmą kartą jį sukūrė Doug Cutting 1999 m. Ir 2001 m. Rugsėjį oficialiai tapo „Apache Foundation“ Jakarta šeimos atvirų šaltinių „Java“ projektų dalimi. Jis buvo pakeistas į aukščiausio lygio „Apache“ projektą 2005 m. Vasario mėn.
„Techopedia“ aiškina „Apache Lucene“
„Apache Lucene“ yra labai efektyvus paieškos variklis, kurio pagrindinė loginė architektūra yra „dokumentas, kuriame yra teksto laukai“. Tai suteikia didelį lankstumą ir leidžia „Lucene“ API tapti nepriklausomai nuo bet kokio failo formato.
Bet kuris tekstas iš tokių formatų, kaip „MS Word“, HTML, XML, PDF ir „OpenDocument“, gali būti indeksuojamas tol, kol gali būti išgaunama tekstinė informacija, o tai reiškia, kad jis nieko negali padaryti su vaizdais.
„Lucene“ tinka bet kuriai programai, kuriai reikia viso teksto indeksavimo ir paieškos galimybių, tačiau ji yra plačiai pripažinta kaip puikus įrankis diegiant interneto paieškos variklius ir ieškant vietos vienoje vietoje.
Funkcijos apima:
- Mastelio ir didelio efektyvumo indeksavimas - jis gali apdoroti daugiau nei 150 Gb per valandą naudodamas modernią aparatinę įrangą ir reikalauja tik 1 Mb už krūvą atminties.
- Galingi, tikslūs ir veiksmingi paieškos algoritmai - jame siūlomi daugybė galingų užklausų, tokių kaip frazė, pakaitos simbolis, artumo ir diapazono užklausos. Tai taip pat atliko paiešką ir rūšiavimą pagal bet kurį lauką.
- Kryžminė platforma - grynas „Java“ diegimas, taip pat galimas kitomis programavimo kalbomis.
