Namai Programinė įranga Balso atpažinimo technologija: naudinga ar skaudi?

Balso atpažinimo technologija: naudinga ar skaudi?

Turinys:

Anonim

Ar kada nors skambinote į įmonę norėdami gauti pagalbos ar sumokėti sąskaitą, kad jus pasveikintų malonus įrašytas balsas, kuris nori pabendrauti su jumis, bet negali suprasti pusės to, ką sakote? O gal jūs turite „iPhone“ ir nors Siri pirmiausia atrodė kaip geras sąjungininkas, supratote, kad kartais (gerai, būkime sąžiningi, dažnai) ji to tiesiog negauna? Balso atpažinimo technologija (VRT), dar vadinama kalbėjimu prie teksto, patenka į bendrą spąstus: ji gali būti neįtikėtinai šauni (o berniukui, ar mes ją įsišakniję), bet dažniau tai yra dantų šlifavimas. mankšta susierzinus.


Kadaise idėja, kuri priklausė mokslinės fantastikos sričiai, balso atpažinimas išaugo nuo pat kūdikystės 1950-aisiais, kai „Bell Laboratories Audrey“ sistema buvo sukurta atpažinti skaitmenis, pasakytus vienu balsu, į šiuolaikinį šnekamosios elektronikos tinklą, su kuriuo dabar bendraujame. kasdien - su įvairiais rezultatais.

Norėdami kalbėti su žmogumi, prašome paspausti 0

Daugelis šiandienos įmonių dabar naudoja sistemas, vadinamas interaktyviu balso atsakymu (IVR), kad galėtų tvarkyti klientų aptarnavimo skambučius. Dažniausiai naudojami meniu, kuriuose naršoma balsu, tačiau kai kurios įmonės naudoja IVR sistemas, kuriomis galima pasiekti klientų sąskaitos informaciją ir atsakyti į smulkius klausimus. Meniu IVR programinė įranga paprastai turi ribotą žodyną, kuris gali būti ribojamas „taip“, „ne“ ir skaičiais. Sudėtingesnės sistemos gali atpažinti įmonei būdingus žodžius ir frazes.


Šios sistemos populiarėja - bent jau įmonėms - dėl paprastos priežasties: jos yra ekonomiškos. Remiantis 2010 m. „Wall Street Journal“ ataskaita, tipinis kliento skambutis, pasiekiantis agentą, kainuoja nuo 3 iki 9 USD, o skambutis, atliekamas per automatinę sistemą, kainuoja tik nuo penkių iki septynių centų. Ir, be abejo, kompiuterinės programos nepavargsta, skambina sergantys ir nenuvilia klientų (nors klientai tikrai su jais susierzina!).


Laimei, tai ne visada reiškia, kad IVR atima iš darbo žmonių ar bent jau tai, kad visi žmonės dingsta iš skambučių centrų. Šie balso pagalba suaktyvinti pagalbininkai leidžia produktyviau naudoti klientų klientų aptarnavimo tarnybas nukreipiant skambučius ir atsakant į paprastus klausimus.


Žinoma, žmonėms, kurie sąveikauja su šiomis technologijomis, buriavimas ne visada būna sklandus. Technologija padeda gerinti įprastas IVR technologijos problemas, tokias kaip problemų su akcentais, tačiau automatinių sistemų kaupimasis vis dar yra dažna tema internete. Peržiūrėkite šią komedijos sceną apie liftą, kuriame įrengtas balso atpažinimas. Tai pabrėžia nusivylimą, kurį gali sukelti sutrikimai IVR sistemose.

Asmeninio telefono programos: „Siri“, „Google“ dabar

Dauguma žmonių yra susipažinę su išmaniųjų telefonų balso atpažinimu. Nors dauguma naujausių telefonų modelių yra su „VR“, jų populiarumas ir žinomumas padidėjo, kai „Apple“ 2011 m. Pristatė „Siri“, švelniai sarkastišką, balsu suaktyvintą „asmeninį asistentą“, skirtą „iPhone 4S“. „Google“ netrukus sukūrė tiesioginį konkurentą: „Google“. Dabar „Android Jelly Bean“ OS. Abi sistemos turi moteriškus balsus ir sudėtingas atpažinimo funkcijas, leidžiančias vartotojams „susikalbėti“ su savo telefonais atsitiktine kalba.


Nors šios sistemos yra žymiai sudėtingesnės ir funkcionalesnės nei jų pirmtakai, jos taip pat rodo, kad technologija dar turi nueiti ilgą kelią. Anekdotai apie „Siri“ nesėkmę tapo populiaria interneto meme. Vienas vyras netgi pateikė ieškinį „Apple“ dėl melagingos reklamos, susijusios su „Siri“ galimybėmis.


Gal todėl „Apple“ sukūrė „Siri“, kad būtų patobulinta ir informatyvi, tačiau „VR“ programinė įranga taip pat yra šiek tiek nuožmi. Pavyzdžiui, jei kalbėsite apie vieną liūdniausiai pagaminamų intelekto technologijų linijų kino istorijoje iš 1968 m. Filmo „2001: Kosminė odisėja“ - „atverk podiumo durų duris“ - „Siri“ atsakys bet kuria atsakymo linija iš filmo “. Atsiprašau (tavo vardas), bijau, kad negaliu to padaryti “arba, dar labiau sarkastiškas, „ mes, žvalgybos agentai, matyt, niekada taip negyvensime “.


Skambinimas jums vardu yra tik viena iš funkcijų, kuria bandoma padaryti „Siri“ lengvesnį ir šiek tiek žmogiškesnį. VR asistentas gali vykdyti balso komandas skambindamas, priimant diktantą ir siunčiant tekstus, ieškant informacijos internete, ieškant netoliese esančių parduotuvių, pateikiant važiavimo nurodymus ir dar daugiau - nieko nereikia paliesti. Atsakymai vienu metu ištariami telefonu ir rodomi ekrane.


„Google“ dabar „Android Jelly Bean“ platformos VR dalis yra labai panaši į „Siri“. Sistema siūlo tas pačias plačias atpažinimo galimybes, versdama atsitiktinę kalbą į komandas, kurios leidžia vartotojams skambinti, siųsti tekstus, vykdyti paiešką, atlikti skaičiavimus ir konvertavimus, griebti žodžių apibrėžimus, nustatyti žadintuvus, leisti dainas ir gauti žemėlapius bei nuorodas.


Asmeninių balso padėjėjų, tokių kaip „Siri“ ir „Google“ dabar, pranašumai akivaizdūs. Viskas, pradedant skambučiais ir trumpųjų pranešimų perdavimu, baigiant paieška ir pramogomis, yra greitesnė ir lengvesnė. Tiesiog pasakyk, ko nori, ir (dažniausiai) VR programa ją griebia už tave. „VR“ laisvų rankų įranga yra ypač naudinga vairuojant. Ir nors daugelis žmonių atsisakė „Siri“ trūkumų, o rašytojai teigė, kad „Google“ dabar galimybė iš esmės valdyti vartotojų gyvenimus yra gan bauginanti ir šiek tiek įžeidžianti, dauguma žmonių vis tiek mano, kad šios futuristinės technologijos yra gana šaunios.


Žinoma, tokios asmeninių telefonų programos kaip „Siri“ ir „Google“ dabar toli gražu nėra tobulos - nors jos ir parodo, kur ši technologija galėtų būti nukreipta ateityje. Tai reiškia, kad net tada, kai Siri pateikia neteisingą atsakymą, mes greičiausiai juokiamės ir atleisime jai, žinodami, kad kita versija bus daug geresnė.

Kur VR krinta butas

Jei kada nors susidūrėte su IVR, paskambinę į įmonę, galbūt pastebėjote tam tikras bendravimo kliūtis. Kai kurios programos naudoja robotizuotą teksto į kalbą balsą, kuris neteisingai taria žodžius ir daro dalykus sunkiai suprantamus. Kiti turi jautrumo problemų, dėl kurių programinė įranga nesugeba apdoroti to, ką jūs sakote, jei esate per garsus, per minkštas ar nesirūpinate atsargiai.


Be to, daugelis žmonių vis dar nesijaučia patogiai kalbėdami su mašina. Jei atliksite keletą paieškų IVR, susidursite su sąrašais, kuriuos žmonės sugalvojo, kaip apeiti IVR sistemas ir patekti į „tikrą žmogų“. Šie sprendimai svyruoja nuo „nuolat spauskite 0 operatoriui“ iki „prisiekiu prie mašinos, kol ji nenumalšins žmogaus“. Dėl to didžioji dalis pastarojo meto IVR sistemų pokyčių kilo todėl, kad jos būtų labiau patinkančios žmonėms; kad balsai būtų simpatiškesni ir mažiau robotizuoti, sistema palengvintų naršymą ir leistų skambinantiesiems žinoti, kiek laiko viskas užtruks nuo pradžios iki pabaigos. Tai rodo, kad geresnės technologijos yra tik pusė mūšio; kita pusė pritraukia vartotojus į pokalbį su mašina.

Ką turi ateitis

Nepaisant šių iššūkių, balso atpažinimo technologija visą laiką tobulėja. Tokios programos kaip „Siri“ ir „Google“ dabar - trūkumai ir visos - vis dar yra nepaprastai įspūdingos, o kelios įmonės plečia VR galimybes kitoms programoms.


Pavyzdžiui, „Dragon NaturallySpeaking“ kalbėjimo į tekstą programinės įrangos kūrėjai „Nuance“ jau yra sukūrę televizorių ir automobilių balso valdiklius, o šios technologijos versijos yra įtrauktos į kai kuriuos „Samsung“ televizorius ir „SYNC“ pramogų sistemas, naudojamas tam tikrose „Ford“ transporto priemonėse.


Kadangi „Google“ ir „Apple“ ir toliau randa naujų savo balso atpažinimo technologijų naudojimo būdų, tikėtina, kad vis dažniau kalbėsimės su visokiais kasdieniais aparatais, pradedant televizoriais ir baigiant skrudintuvais. Ir dar kartą atrodo, kad mokslinė fantastika buvo teisinga. Turėsime tikėtis, kad protingi rašytojai suklydo dėl vieno dalyko. Jei šios mašinos perims, kitą kartą paprašydami Siri, „atidaryti poodinių įlankos duris“, jūs galite patirti daug nemalonumų.

Balso atpažinimo technologija: naudinga ar skaudi?