Utilizarea sistemelor de recunoaștere vocală

Principalul avantaj al sistemelor de voce sunt ușor de utilizat. Acum, destul de pronouncing scopul apelului, după care sistemul se deplasează în mod automat vocea apelantului la elementul de meniu dorit.

Comercial program de recunoaștere a vorbirii a început la începutul anilor nouăzeci. Ele sunt de obicei folosite de oameni care, din cauza unui prejudiciu de mână nu este în măsură să obțină o cantitate mare de text. Aceste programe (de exemplu, Dragon NaturallySpeaking, VoiceNavigator) vocea utilizatorului este convertit în text, eliberând astfel mâinile. Fiabilitatea transferului de astfel de programe nu este foarte mare, dar de-a lungul anilor le-a îmbunătățit treptat.

Creșterea puterii de dispozitive mobile de calcul și le-a permis să înființeze programe cu funcție de recunoaștere a vorbirii. Printre aceste programe, este demn de remarcat aplicație Microsoft comandă vocală, care vă permite să lucrați cu mai multe aplicații folosind vocea. De exemplu, puteți activa redarea muzicii de pe player-ul, sau pentru a crea un nou document.

Următorul pas a tehnologiilor de recunoaștere vocală poate fi considerată o dezvoltare a așa-numita Silent Speech interface (SSI) (interfață de vorbire tăcut). Aceste sisteme de procesare a vorbirii bazat pe primirea și procesarea semnalelor vocale într-un stadiu incipient de a articula. Această etapă de dezvoltare a recunoașterii vorbirii este cauzată de două dezavantaje semnificative ale sistemelor de recunoaștere moderne: sensibilitate excesivă la zgomot, precum și nevoia de exprimare clară și precisă, referindu-se la sistemul de recunoaștere. O abordare bazată pe SSI, este de a utiliza noile senzori nu sunt afectate de zgomot ca un supliment la semnalele acustice prelucrate.

Astăzi putem identifica cinci domenii principale de utilizare a sistemelor de recunoaștere vocală:

§ apelarea vocală diverse tehnici (telefoane mobile, calculatoare, și așa mai departe.)

Voce - proces de interacțiune și operarea de control al dispozitivului cu ajutorul comenzilor vocale. Sistemele de control vocal sunt ineficiente pentru a introduce text, dar este convenabil să intre komanl, cum ar fi:

Astăzi, există două tipuri de sisteme de recunoaștere vocală - de lucru „pe client» (client-based) și pe principiul „client-server» (client-server). Când se folosește instrucțiunea tehnologie de voce client-server este introdus în dispozitivul de utilizator și transmise prin Internet la un server de la distanță, în cazul în care acesta este procesat și returnat dispozitivul ca o comandă (Google Voice, Vlingo, ave.); din cauza numărului mare de utilizatori pe sistemul de recunoaștere a serverului primește o bază excelentă pentru antrenament. Prima variantă constructivă funcționează pe algoritmi matematici și alte rare (Speereo Software) - în acest caz, comanda este înscris la dispozitivul de utilizator și prelucrate în acesta, în același. Plus de prelucrare „client“ în mobilitate, indiferent de conectare și funcționare a echipamentelor de la distanță. Astfel, sistemul este de lucru „pe client“ pare mai fiabile, dar este limitat la, uneori, puterea dispozitivului pe partea utilizatorului.

Acum, tehnologia este, de asemenea, utilizat SIND (fără a face referire la vocea unei anumite persoane).

[1] Davies. K.H. Biddulph, R. și Balashek, S. (1952) Recunoașterea automată a vorbirii Digits vorbite. J. Acustice. Soc. Am. 24 (6) pp. 637-642