Turinys:
Klinikinė genomika yra patraukli tema, kurioje žmonės dirba su pažangiosiomis technologijomis, kad gautų greitus ir tikslius rezultatus. Rinkoje yra daugybė genomo sekas, iš kurių gaminami sekos duomenų petabitai, o sekoskopijos augimas artimiausiu metu leis gauti duomenų exabytes. Čia „Hadoop“ yra puiki platforma sudėtingam genomikos darbo srautui apdoroti. „Hadoop“ gali kaupti ir rūšiuoti didžiulį informacijos kiekį, taip pat gali atlikti reikšmingą analizę. (Norėdami sužinoti, kiek duomenų iš tikrųjų reikia, skaitykite „Supratimas apie bitus, baitus ir jų kartotinius“.)
Genomikos dabartis ir ateitis
Šiandien genomo žemėlapių sudarymas pasiekė savo tobulėjimo viršūnę. Daugelis žmonių, susijusių su genomikos pramone, dvelkia smalsumu, ir kadangi atsiranda naujų galimybių, geresnės technologijos yra valandos poreikis. Genomo sekos nustatymas yra labai daug pasikartojanti ir daug išteklių reikalaujanti užduotis. Vien tik 2013 m. Buvo pagaminta apie 15 duomenų petatavimų duomenų ir tik 2000 sekėjų. Į šį žandikaulį krintančią sumą buvo įtraukta 300 KB sekvenevuotų genomo duomenų. Esant tokiam duomenų pateikimo tempui, galima apskaičiuoti, kad iki 2018 m. Bus pagamintas maždaug vienas duomenų egzempliorius. Taip bus dėl to, kad gausės sekos, kurios sugeneruos vis daugiau duomenų apie vieną bandymą. Kita priežastis yra ypač galingų ir pigių genomo sekos aparatų atsiradimas. Nuo 2008 m. Šių mašinų kaina nuolat mažėjo. Taip yra dėl galingų naujos kartos mašinų, kurios įsivėlė į rinką.
Genomo kartografijos pramonės poreikiai
Duomenims, surinktiems iš žmogaus genomo, apdoroti naudojami sudėtingi algoritmai. Tada šią informaciją reikia saugoti. Ateityje jis gali būti peržiūrėtas, kad būtų galima palyginti su pirminiais duomenimis. 100 GB duomenų apdorojimo ir saugojimo užduotis nėra labai sunki, ypač kai tai darote su galingais įrenginiais, naudojamais sekos centruose. Tyrimai rodo, kad tokį duomenų kiekį galima apdoroti vos per 1000 procesoriaus valandų, todėl tai labai lengva. Esant tokiam techninės pažangos greičiui, akivaizdu, kad genomo pramonė per kelias sekundes greitai perdirbs tūkstančius gigabaitų.
