Q:
Kaip naujos kompiuterinio mokymosi galimybės gali iškasti atsargų dokumentus finansiniams duomenims?
A:Viena iš jaudinančių naujų mašininio mokymosi ir AI ribų yra ta, kad mokslininkai ir inžinieriai imasi įvairių būdų, kaip panaudoti visiškai naujo tipo išteklius, kad būtų galima numatyti akcijų judėjimą ir investicijų rezultatus. Tai yra nepaprastas žaidimų keitiklis finansų pasaulyje ir labai giliai pakeis investavimo strategijas.
Viena iš pagrindinių idėjų išplėsti šio tipo atsargų tyrimus yra skaičiavimo kalbotyra, apimanti natūralios kalbos modeliavimą. Ekspertai tiria, kaip naudoti tekstinius dokumentus, pradedant nuo SEC dokumentų pateikimo ir baigiant akcininkų laiškais, ir baigiant kitais periferiniais tekstiniais ištekliais, siekiant patobulinti ar patikslinti atsargų analizę ar sukurti visiškai naujas analizes.
Nemokamas atsisiuntimas: mašinų mokymasis ir kodėl tai svarbu |
Svarbus atsisakymas yra tai, kad visa tai įmanoma padaryti tik įgyvendinant visiškai naujus neuroninių tinklų, mašininio mokymosi ir natūralios kalbos analizės pasiekimus. Prieš prasidedant ML / AI, skaičiavimo technologijos įvestims „skaityti“ dažniausiai naudodavo linijinį programavimą. Tekstiniai dokumentai buvo per daug nestruktūruoti, kad būtų naudingi. Tačiau per pastaruosius kelerius metus atlikus natūralios kalbos analizės pažangą, mokslininkai nustato, kad įmanoma „išminkyti“ natūralią kalbą, norint gauti kiekybiškai įvertinamus rezultatus arba, kitaip tariant, rezultatus, kuriuos galima kažkaip apskaičiuoti.
Vieni geriausių įrodymų ir naudingiausių jų pavyzdžių yra iš įvairių disertacijų ir daktaro darbų, kuriuos galima rasti internete. 2016 m. Balandžio mėn. Publikuotame dokumente „Mašinų mokymosi ir skaičiavimo kalbotyros taikymas finansinėje ekonomikoje“ Lili Gao išsamiai paaiškina svarbius procesus, būdingus įmonių SEC dokumentų rinkiniams, akcininkų skambučiams ir socialinės žiniasklaidos pranešimams išgauti.
„Prasmingų signalų išskyrimas iš nestruktūrizuotų ir didelių matmenų teksto duomenų nėra lengva užduotis“, - rašo Gao. "Tačiau tobulinant mašininį mokymąsi ir skaičiavimo kalbinius metodus, tekstinius dokumentus galima apdoroti ir statistiškai analizuoti, ir daugelis statistinės teksto analizės programų socialiniuose moksluose pasirodė esanti sėkmingai." Iš Gao diskusijų apie modeliavimą ir kalibravimą abstrakčiai, visas parengtas dokumentas parodo, kaip detaliai veikia kai kurios šio tipo analizės.
Kiti aktyvių projektų šaltiniai yra tokie puslapiai, kaip šis „GitHub“ projekto trumpas aprašymas, ir šis IEEE šaltinis konkrečiai kalba apie vertingos finansinės informacijos gavimą iš „Twitter sentimentų analizės“.
Esmė ta, kad šių naujų NLP modelių panaudojimas skatina greitas naujoves naudojant įvairius tekstinius dokumentus ne tik finansinei analizei, bet ir atliekant kitokius pažangių atradimų tipus, išblukindamas tradiciškai nusistovėjusią ribą tarp „kalbos“ ir "duomenys".
