Turinys:
Apibrėžimas - ką reiškia kalbos sintezė?
Kalbos sintezė yra dirbtinis žmogaus kalbos modeliavimas kompiuteriu ar kitu prietaisu. Balso atpažinimo ir kalbos sintezės priešprieša dažniausiai naudojama teksto informacijai versti į garso informaciją ir tokiose programose kaip balso palaikymo paslaugos ir mobiliosios programos. Be to, jis taip pat naudojamas pagalbinėse technologijose, skirtose padėti regėjimo negalią turintiems asmenims skaityti teksto turinį.
„Techopedia“ paaiškina kalbos sintezę
Homero Dudley VODER, kuris buvo pagrįstas vokalo iš Bell Laboratories, laikomas pirmuoju visiškai funkcionaliu balso sintezatoriumi. Kompiuteris, naudojamas kalbos sintezei, yra žinomas kaip kalbos sintezatorius arba kalbos kompiuteris. Kalbinio kompiuterio kokybė dažnai vertinama pagal jo panašumą į žmogaus balsą. Daugelyje kompiuterių operacinių sistemų kalbų sintezatoriai yra integruoti nuo dešimtojo dešimtmečio pradžios. Sintezuota kalba paprastai sukuriama susiejant įrašytos kalbos fragmentus, kurie yra duomenų bazėje.
Pradinis kalbos sintezės etapas yra išankstinis apdorojimas, kuris pašalina dviprasmybes, susijusias su konkretaus žodžio skaitymo būdu, ir kuris taip pat apima homografų tvarkymą. Kitame kalbos sintezės etape kompiuteris padeda fonemoms paversti tekstą garsų seka. Paskutinis etapas apima žmogaus įrašų arba pagrindinių garso generavimo metodų naudojimą, kad būtų galima imituoti žmogaus balso mechanizmą ir perskaityti visą tekstą. Viena iš populiariausių kalbos sintezės atšakų yra garso ir vaizdo kalbos sintezė arba multimodalinis kalbos sintezė, kurios metu naudojamas animuotas veidas, glaudžiai sinchronizuotas, kad papildytų sintezuotą kalbą. Multimodalinis kalbos sintezė taip pat apima papildomas funkcijas, tokias kaip neverbaliniai užuominos į kalbą, kurios padeda tiksliau perteikti vartotojo žodžius. Daugybė kalbų sintezės sistemų leidžia vartotojams pasirinkti balso tipą, pavyzdžiui, vyrišką ar moterišką.
Dauguma kalbos sintezės sistemų geba labai intelektualiai skaityti tekstus ir juos išvesti, nors kartais ir balsas gali būti niūrus. Kalbos sintezė vis dėlto dar turi išsiugdyti gebėjimą visiškai imituoti platų žmogaus intonacijų ir kadencijų spektrą.
