Pentru persoanele cu dizabilități, precum și doar pentru sibariți, dezvoltatorii de sisteme de operare au creat control vocal calculator. Acesta permite utilizatorului să introducă informații prin voce. După pronunțarea anumitor cuvinte, dispozitivul începe recunoașterea vorbirii - transformând semnalul audio în informații digitale. După ce informațiile introduse sunt recunoscute corect - programul trece la algoritmul de acțiune specificat - îndeplinește funcția care este atașată unei anumite comenzi.

Totul este destul de simplu. Vorbirea nu este întotdeauna recunoscută corect, astfel încât programul de control vocal al computerului nu este utilizat intens pentru a rezolva sarcini complexe de gestionare a sistemului de operare. Este folosit pentru a efectua funcții de bază: deschiderea și închiderea fișierelor, căutări locale și în rețea etc.

Istoria dezvoltării controlului vocal

  • Primul sistem de recunoaștere a vocii Audrey a fost creat în anii 1950. Ea a descifrat doar numerele rostite într-o singură voce.
  • În 1962, a fost creat primul sistem de recunoaștere a cuvintelor. Ea a transcris 15 cuvinte în engleză.
  • Odată cu dezvoltarea computerelor în 1990, a fost dezvoltat programul Dragon Dictate. Ea a recunoscut până la 100 de cuvinte pe minut, dar a avut un preț mare.
  • La începutul anilor 2000, pe iPhone a apărut aplicația de recunoaștere a vorbirii Google Voice Search. În 2010, un motor de căutare a fost adăugat la Android.
  • Siri a fost inclus în software Telefon 4S la începutul lunii octombrie 2011;
  • În 2014, a fost introdus Cortana, un asistent vocal pentru Windows.

Cortana și capabilități de intrare vocală până în prezent

Cortana este un asistent virtual în sistemul de operare Windows. Serviciul ajută utilizatorul în planificarea lucrurilor, îi amintește de ele.
La o anumită solicitare, serviciul va ajuta la colectarea de informații specifice, la crearea unei structuri clare și la prezentarea acesteia utilizatorului în cea mai procesată formă posibilă.
Este interesant că imediat când este pornit, asistentul virtual colectează toate informațiile despre solicitările introduse, datele personale, încercând să se adapteze cât mai mult posibil fiecărui utilizator în parte.


Controlul vocal al unui computer cu Windows 7 prin utilizarea unui asistent virtual nu este posibil - este integrat doar în cea de-a zecea versiune. Dar, din păcate, dezvoltatorii nu s-au obosit să lanseze versiunea în limba rusă.
Rolul principal îl joacă căutarea, care în 10-ke poate fi deschisă prin „Start”. Această funcție definește aproape orice interogări. Dacă intrarea nu este recunoscută, puteți introduce comanda corespunzătoare în fereastra pop-up și programul de control vocal al computerului citește informațiile text.

Un moment neplăcut este colectarea tuturor datelor introduse prin tastatură și trimiterea lor către Microsoft.

Programe ale terților

Tip

După finalizarea instalării, treceți la pasul următor - creați cont. Aici trebuie să veniți cu o frază cheie, după care va suna o notificare de activare.


În continuare, va trebui să veniți cu și să creați comenzi vocale, indiferent de scopul lor. Comanda câine poate lansa o aplicație sau poate face cu totul altceva.




Trebuie doar să creați o comandă vocală și să o atribuiți unei anumite acțiuni. Potrivit doar pentru efectuarea operațiunilor de bază - deschiderea fișierelor, folderelor etc. Funcționalitatea este limitată.

vorbitor

Aici funcționalitatea este mai largă decât în ​​Type.


Controlul vocal al unui computer cu Windows 10 oferă utilizatorului posibilitatea de a deschide și închide fișiere, de a face capturi de ecran ale ecranului, de a opri computerul.


Recunoașterea vorbirii durează mult, peste 3-4 secunde. Acest lucru se datorează faptului că vorbirea este mai întâi convertită în text, iar comenzile sunt recunoscute de computer deja din informații textuale.

Laitis

aceasta program gratuit, care vă permite să controlați computerul și să dictați textul. După instalare, trebuie să vă înregistrați și apoi îl puteți folosi pentru plăcerea dumneavoastră.


O funcție interesantă de autocorecție la tastare. Puteți spune „ghilimele” și caracterul corespunzător va apărea în text.

Posibilitati de control vocal prin Yandex.string

Prin utilizarea acestei aplicații, puteți efectua căutări locale sau de rețea pentru informații și fișiere, reporniți sau opriți computerul. Există o funcție pentru a deschide programe și site-uri.
Pentru a utiliza programul, trebuie mai întâi să îl descărcați și să îl instalați.

Dar în timpul instalării, merită să debifați casetele de lângă elementele în care producătorul software-ului oferă să instaleze un browser, să îi modifice setările. În caz contrar, instalarea va dura mai mult și configurația se va schimba în browser.
În cele din urmă, linia este plasată lângă butonul „Start”. Spuneți „Ascultați Yandex” și se va deschide o fereastră.

Spune cererea.

După o pauză, se va deschide o bară de căutare în browser. Este o idee bună să vă gestionați căutarea în acest fel.
În general, controlul vocal al computerului nu a fost încă dezvoltat, deoarece este atras de noi în imaginație. Dar chiar și acele caracteristici care sunt disponibile astăzi sunt deja impresionante și ajută semnificativ la trecerea la un nou nivel de utilizare a computerului.

O zi bună!

Puteți interacționa cu un computer nu numai folosind tastatura și mouse-ul. Controlul comenzilor vocale este, de asemenea, disponibil. Există utilități speciale care vă permit să faceți acest lucru. Funcțiile lor includ nu numai înregistrarea textului din dictare sau transcrierea înregistrărilor audio. Prin intermediul lor, puteți rula aplicații, le puteți folosi și, în general, puteți face orice. Controlul computerului cu vocea facilitează lucrul cu un computer. Comenzile sunt transmise rapid și fără efort. Desigur, dacă ai microfon.

Vă vom prezenta aplicații cu funcționalități similare.

Această caracteristică este încorporată în limba engleză Versiunea Windows. Trebuie să aveți o licență Enterprise sau Ultimate pentru ao utiliza. Dar și în rusificat sisteme de operare Puteți configura controlul vocal și dictarea textului. Utilizați una dintre următoarele aplicații.

Aplicația este ușor de înțeles

Program popular. Deși are dezavantajele sale. Esența muncii sale este simplă: setați o comandă și alegeți ce acțiune ar trebui să efectueze. Luați în considerare configurarea acestei aplicații folosind un exemplu specific.

  1. Descărcați și instalați-l. Există o versiune gratuită și premium. Al doilea trebuie cumpărat pentru a-l încerca pe computer.
  2. Rulați utilitarul. O fereastră de informații cu indicii va apărea în ea.
  3. Panoul său de control are multe funcții diferite. Unele dintre ele au același nume. Este necesar să navigați după imagine, nu după inscripție. Apăsați butonul „Adăugați” - arată o față.
  4. Specificați un nume de profil și un cuvânt cheie pentru a identifica comanda. De exemplu, scrieți „deschis” dacă aveți de gând să configurați lansarea unei aplicații prin voce. Sau „mergi la” pentru a accesa instantaneu un site fără a-i introduce adresa.
  5. Acum trebuie să înregistrăm această comandă sub forma unei imagini sonore. Faceți clic pe butonul cu cercul roșu. Și clar, pronunțați clar fraza dorită în microfon.
  6. Confirmați modificările. Opțiunea specificată va apărea în listă din fereastra Tip. Programul își va aminti ceea ce ați înregistrat pe „recorderul de voce”.
  7. După aceea, specificați ce, de fapt, să îl rulați pentru a executa comanda. Faceți clic pe butonul „Adăugați”, care arată ca o mână cu simbolul „+” (plus).
  8. Selectați formatul datelor: fișiere/utilități, pagini web, unele servicii interne ale sistemului de operare. Puneți casetele de selectare unde doriți.
  9. Găsiți aplicația pe care doriți să o lansați cu vocea dvs. Să fie, de exemplu, Microsoft Word. Deci, puteți începe foarte rapid să editați un text sau să scrieți un articol.
  10. În aceeași fereastră, notați a doua parte a comenzii. Astfel încât în ​​total se dovedește „deschide Cuvântul”. Primul cuvânt va activa Tip, al doilea va activa utilitarul conectat.
  11. Faceți clic pe Adăugați.
  12. Puteți atașa mai multe aplicații la o funcție „deschisă”. Astfel vei controla lansarea lor fără a atinge mouse-ul și alte periferice instalate pe computer.
  13. Dacă este necesar, editați parametri suplimentari.
  14. Pentru a verifica dacă a funcționat sau nu, dă clic pe „Începe să vorbești” și rostește comanda.

Programul funcționează cu limba rusă. Dar nu întotdeauna o recunoaște corect. Este necesar să vorbești tare, clar, cu o voce mecanică.

  • Cunoașterea limbii engleze nu este necesară.
  • Creare rapidă de comandă.
  • Fără recunoaștere a textului.
  • Funcționalitate limitată. Puteți deschide numai utilități și pagini pe Internet.
  • Programul percepe uneori zgomotele străine ca comenzi. Din această cauză, pe PC se întâmplă lucruri ciudate.
  • Nu poți lucra cu playerul.

Speechka

O altă aplicație pentru managementul computerului

  1. La prima pornire, se va deschide o fereastră cu o categorie de alegere: PC sau Internet.
  2. Există, de asemenea, o explicație a combinației de taste pentru a activa utilitarul. Acest lucru poate fi schimbat în setări.
  3. Faceți clic pe „Internet”, de exemplu. Se va deschide o fereastră cu mai multe câmpuri de introducere: pentru textul comenzii și pentru URL-ul site-ului. Puteți scrie cuvântul „Yandex” și adresa acestei pagini.
  4. Faceți clic pe Adăugați.
  5. Țineți apăsate tastele indicate în fereastra principală.
  6. Rostiți comanda astfel încât utilitarul să o „amintească”.
  • Activare prin ambele taste și volumul sunetului.
  • La pornire, puteți calibra microfonul.
  • Funcționalitate limitată.

vorbitor

Interfața este concepută într-un mod minimalist

Comenzile din aplicație sunt configurate folosind cuvinte tipărite, nu dictare. Există un mecanism intern de recunoaștere a textului. Functii principale:

  • Creați capturi de ecran la comandă.
  • Schimbați aspectul tastaturii de pe computer.
  • Deschiderea aplicațiilor și fișierelor.
  • Finalizarea lucrării.
  • Nu poți face o înregistrare audio cu echipa. Utilitarul recunoaște etichetele.
  • Trebuie să utilizați tastatura pentru a o controla. Dacă butonul specificat este folosit în alte scopuri, va fi incomod.
  • Ai nevoie de o conexiune stabilă la internet.

Gorynych

Eroul poveștilor populare rusești te va ajuta

Programul pentru controlul unui computer cu vocea lui „Gorynych” este un produs casnic. Prin urmare, există un modul de recunoaștere a vorbirii „nativ”. Se „adaptă” la timbrul și intonațiile utilizatorului. Cu ajutorul utilitarului, puteți lucra pe deplin în sistem și nu doar să deschideți fișiere și pagini web.

  • Există suport pentru limbile rusă și engleză.
  • recunoașterea textului, intrare vocală oricărui editor.
  • Funcționalitate extinsă.
  • Este necesar să creați în mod independent comenzi pentru fiecare proces. Literal, trebuie să scrieți un dicționar.

Recunoașterea vorbirii Windows

Un program integrat în sistemul de operare englezesc. Pentru a-l utiliza, trebuie să aveți instalat pachetul lingvistic corespunzător. Echipele rusești nu vor lucra cu ea. Pentru a controla un computer cu acesta, va trebui să vorbiți limba acestuia. Pentru a-l accesa în Panou Setări Windows deschideți meniul „Standarde regionale și lingvistice” (se află în categoria „Ore, limbă, regiune”) și setați „Engleză” în toate filele. Dacă totul este corect și aveți instalat pachetul de limbă necesar, Windows se va „transforma” în engleză, iar utilitarul va deveni disponibil. Este mai bine să nu încercați această metodă dacă nu cunoașteți bine o limbă străină.

Această metodă este potrivită dacă vorbiți engleză

Alte utilitati

Există o serie de aplicații pentru gestionarea unor astfel de comenzi:

  • Extensii de browser. Facilitati navigarea pe web. LA Google Chrome o funcție similară este deja încorporată - introducerea vocală în formularele de căutare. Această opțiune este disponibilă pe unele hărți online. Vă permite să găsiți rapid adresa.
  • tipul de voce.
  • RealSpeaker.
  • Discurs web.

Lista de software de recunoaștere și dictare a textului

Controlul vocal este, desigur, bun. Dar utilitățile pentru OCR și tastarea din dictare pot fi utile. Atunci când compilați rapoarte voluminoase, diplome, este mai ușor să vă scrieți gândurile exprimându-le într-un microfon de pe computer. Iată câteva dintre aceste utilități:

  • Dictograf.
  • Dragonul în mod firesc.
  • Perpetuum Mobile.

Un produs care vă permite să dictați text către un computer

Puteți configura comenzi vocale în sistemul de operare. Pentru a face acest lucru, programul corespunzător trebuie să fie instalat pe computer. Cu el, poți lucra pe un computer, întins pe canapea sau în fotoliu. Vei avea mâinile libere. Dacă microfonul este bun și preia chiar și sunete îndepărtate sau liniștite, nu va trebui să stai lângă el. Puteți „vorbi” simultan cu computerul și scrie note într-un caiet, desenați, țineți ceva. Da, chiar și coase și tricotează. Cu comenzi, interacțiunea cu un computer este mult mai ușoară. Pentru a activa unele dintre aceste utilitare, trebuie să apăsați butoanele de pe tastatură, ceea ce nu este foarte convenabil.

Dar există și aspecte negative. Dacă rostiți accidental un cuvânt de comandă, o aplicație care este complet inutilă în acest moment se va deschide sau browserul va merge la un site în locul greșit. Ce să folosiți și dacă să folosiți deloc - depinde de dvs.

Astăzi vom vorbi despre discursul nostru. Ti-ar place controlați computerul prin voce, fără ajutorul degetelor? Și, după cum se spune, prin puterea gândirii! Adevărat, nu vom controla computerul cu puterea gândirii, dar cu puterea vocii este destul de real.

Tastați programul- Acesta este unul dintre cele mai bune software pentru controlul unui computer prin voce. Pe site-urile din comentariile acestui program, opiniile converg.

Adevărat, are neajunsurile ei. Dar mai multe despre asta mai târziu. Apropo, dacă sunteți interesat, citiți recenzia mea.

Puteți descărca programul de aici: http://freesoft.ru/type

Cum să-l folosească? Mai întâi, să-l rulăm și să vedem principalele butoane de control:

Programul ne salută și ne oferă imediat sfaturi despre cum să folosim Type. La început, vom apăsa butonul „adăugați” și vom nota cuvântul, de exemplu, „deschide”. Pentru a face acest lucru, rostiți acest cuvânt în microfon:

Apoi faceți clic pe adăugați. Deci, am salvat cuvântul „Deschide” în program cu vocea noastră. Puteți rosti orice alte cuvinte în microfon. Principalul lucru este să nu te confuzi.

Următorul pas este să adăugați comenzi. Pentru a face acest lucru, mergeți la acest punct:

Apoi bifăm caseta de lângă elementul de care avem nevoie:

Selectați un program, aplicație sau acțiune și faceți clic pe butonul roșu de înregistrare. Dacă computerul a acceptat vocea noastră, faceți clic pe „Adăugați”:

Și acum o comandă vocală va fi vizibilă în profilul nostru. În acest caz, cel care deschide 7-Zip:

Și acum, apăsând butonul final „începe să vorbești”

spunem expresia „deschide Seven Zip”. În cazul meu, totul va funcționa. Și programul 7-zip se va deschide. Vă amintiți această frază: Sim sim deschis? Iată ceva cam la fel.

Programul nu funcționează întotdeauna corect. Acum, puternica limbă rusă nu a fost studiată pe deplin de programatorii lingvistici... Dar totuși, este frumos când un computer te ascultă.

Prin urmare, pentru testare și curiozitate banală, programul Typle este 100% potrivit.

În acest videoclip puteți vedea istoria creării primelor motoare de voce și la ce mai trebuie să lucrăm:

Există nume atât de groaznice ale altor analogi ai programului, cum ar fi Gorynych, Perpetuum, Dictograph, Voice Commander. Dar toți sunt „nu acela”. Nu trece de critica unui program demn.

Mi-a luat 5 minute să stăpânesc acest program. Acesta este un timp destul de lung (în mare parte, înțeleg astfel de programe în 1-2 minute). Dacă aveți întrebări - scrieți. Ne vedem curând, prieteni :)!

Într-o altă încercare de a implementa idei din filme științifico-fantastice, unul câte unul, giganții tehnologiei au început să lucreze la asistenți virtuali. La conferința Google I/O 2016, compania introdus Google Assistant, precum și un analog al Amazon Echo - acasă asistent vocal Acasă Google.

Ultima companie importantă care a intrat în cursa de asistenți virtuali. Să vedem ce concurenți are (inclusiv printre startup-uri).

10 asistenți virtuali: o prezentare generală

Alexei Zenkov

În primul rând, să ne amintim ce este Google Now.

Căutare vocală Google/Google Now

Particularitati: Rapid. Extrem de precis la crearea rutelor. Înspăimântă prin conștientizarea zborurilor, rezervărilor și a altor detalii. cu cineva aplicații terță parte: Gestionați notele, mesajele și redarea muzicii.

Defecte: Uneori te deranjează cu inițiativa excesivă (de exemplu, arată rezultatele jocurilor echipelor care nu te interesează, sau trasee acasă din locuri celebre). Inutil atunci când gestionați o „casă inteligentă”. Lucrările privind integrarea cu aplicații terțe par să se fi blocat.

Nivel umanitate: Nul. Nu este propice pentru comunicare. Nici măcar nu are alt nume decât Google.

Rezumat: Vastele stocuri de date personale și accesul la un motor de căutare ar trebui, teoretic, să facă din Google un lider în industrie, dar compania nici măcar nu și-a dat seama cum să-și folosească avantajele pentru a crea un asistent care să înțeleagă utilizatorul. Astăzi Google Now și căutare vocală ei concurează în condiții egale cu Siri, dar nu au atins încă un nou nivel de dezvoltare.

Și acum - despre concurenți.

Apple Siri

Ce: Un asistent vocal care poate vorbi cu utilizatorul și poate oferi recomandări proactive. Activat prin apăsarea lungă a butonului Acasă și iPad. Asistența pentru asistent a apărut recent pe Apple TV și Apple Watch.

Particularitati: Ușor de utilizat pe dispozitivele iOS. Înțelege vorbirea naturală. Bine informat despre știri, vreme, sport, filme, rute și afaceri locale. Vă poate spune ce să vă uitați la televizor. Capabil să interacționeze cu unele elemente ale „casa inteligentă”.

Defecte: Nu poate interacționa cu majoritatea celorlalte aplicații și servicii. Funcționează mai lent decât unii concurenți.

Nivel umanitate: Nu este capabil să mențină o conversație completă, dar în anumite puncte își demonstrează propria înțelepciune. Vocea feminină sună relativ umană.

Defecte: Se simte grozav pe Windows - platforma de care dezvoltatorii și poate utilizatorii sunt cel mai puțin interesați. Utilizarea asistentului pe Android și iOS este mai dificilă și există mai puține funcții.

Nivel umanitate:Îi plac glumele, mai ales cele banale. Are o listă lungă de răspunsuri pline de spirit la întrebări comune. Poate citi fragmente din Shakespeare.

Rezumat: După ani în care a stat în umbra lui Siri și Google, Cortana a devenit un chatbot mult mai interesant. Microsoft vrea să-și facă propriile asistent vocal inteligență de bază pentru toți ceilalți roboți care vă pot gestiona călătoriile, întâlnirile, listele de activități și alte lucruri, precum și creșterea gradului de integrare cu alte produse Microsoft, cum ar fi Office. Compania își propune să creeze un nou shell pentru calcularea post-PC, dar este prea devreme pentru a spune dacă va reuși sau nu.

Facebook M

Ce: Parțial condus, parțial uman și încă în dezvoltare. M va fi un asistent bazat pe text în mediul Facebook Messenger.

Particularitati: Voi încerca să facă orice cereți.

Defecte: Nu este încă un produs finit și nu va fi pentru mult timp. Disponibil doar pentru un număr mic de utilizatori din San Francisco.

Nivel umanitate: Extrem de mare, deoarece oamenii vor participa la formarea răspunsurilor la întrebări. Potrivit Wired, compania speră că, în timp, M va învăța de la acești operatori și va putea lucra mai independent.

Rezumat:În acest moment, M este doar puțin mai mult decât o idee. Dar, având în vedere interesul Facebook pentru chatbot în general, nu ar fi surprinzător dacă M ar ajunge să devină super-inteligent.

X.ai

Ce: Unul dintre puținii asistenți virtuali cu o singură funcție. Lucrează doar prin e-mail, unde poate face programări la cererea dumneavoastră.

Particularitati:Îți cunoaște programul și preferințele, negociază cu alți participanți pentru tine.

Particularitati: Viv promite că produsul lor va putea înțelege întrebări complexe, precum: „Temperatura din apropierea podului Golden Gate va depăși 20 de grade poimâine după ora 17?”. Se lucrează pentru a asigura compatibilitatea cu aplicațiile de la terți.

Defecte: Până acum, în afară de prezentările pregătite, nu există dovezi că totul funcționează exact așa cum s-a spus.

Nivel umanitate: Valorifică mai mult decât ajutoarele vizuale și răspunsurile concrete descriere detaliata. Inteligența este discutabilă.

Defecte: Posibilitățile de integrare cu aplicații terțe sunt limitate și este imposibil să deschideți serviciul direct pe iOS sau Android. Solicitările pe care asistentul nu le poate recunoaște sunt redirecționate către Ask.com.

Nivel umanitate: Nu este propice pentru conversații lungi, dar știe să răspundă la întrebări suplimentare.

Rezumat: Se pare ca aplicatii mobile Hound există de fapt doar pentru a arăta capabilitățile serviciului Houndify, pe care SoundHound intenționează să-l vândă altor companii. Dacă totul merge, nici nu vom ști că îl folosim.

Ozlo

Ce: AI, a cărei funcție principală în acest moment este căutarea de cafenele, baruri și restaurante. Disponibil pentru un număr limitat de utilizatori.

Particularitati: Găsește și combină date din mai multe surse, inclusiv Yelp și Foursquare, apoi prezintă totul sub formă de carduri convenabile. Încearcă să comunice punând și răspunzând la întrebări ulterioare, cum ar fi „ce locuri sunt deschise acum?” sau „ce este în meniul lor?”

Defecte: Caracteristici limitate, cu excepția cazului în care creatorii lui Ozlo adaugă funcții noi. Când învață, AI depinde foarte mult de utilizatori.

Nivel umanitate: Evita curtoaziile inutile, doar salutări scurte pe nume.

Rezumat: Ozlo nu ar fi diferit de mulți alți chatbot dacă nu ar avea perspectiva de a construi ceva mai mare. Capacitatea de a combina date din mai multe surse într-o singură ieșire este unică, dar nu este încă clar dacă dezvoltatorii vor fi capabili să realizeze întregul potențial pe care îl pretind. Atâta timp cât planul de afaceri al lui Ozlo se limitează doar la aplicație, poate fi o provocare să colectezi datele necesare pentru antrenament.

SpeakToIt Assistant.ai

Ce: Una dintre numeroasele copii ale lui Siri. În magazinul de aplicații, căutarea Siri afișează multe programe similare, cum ar fi Comenzi vocale, Secretar vocal și Asistent.

Particularitati: Nu spre deosebire de Siri, dar poate învăța comenzile utilizatorului pentru a activa o listă de funcții.

Defecte: Nu la fel de util ca asistentul încorporat în smartphone-ul tău și nici la fel de convenabil.

Nivel umanitate: Sună destul de nenatural, dar se înfățișează ca un asistent uman al cărui gen și aspect poate fi schimbat.

Rezumat: Unele dintre aceste clone Siri arată ca o relicvă a trecutului, când nu toate Modele de iPhone putea lucra cu asistentul proprietar al Apple și trebuia înlocuit. În orice caz, se pare că creatorii lor sunt conștienți că o astfel de abordare nu le va permite să reușească. De exemplu, SpeakToIt a trecut la crearea unui set de instrumente pe care alți dezvoltatori le-ar putea folosi pentru a-și construi propriile chatbot.