Za osobe sa invaliditetom, kao i samo za sibarite, osmislili su OS programeri glasovna kontrola kompjuter. Omogućava korisniku da unese informacije glasom. Nakon izgovora određenih riječi, uređaj pokreće prepoznavanje govora - pretvara audio signal u digitalnu informaciju. Nakon što je unesena informacija ispravno prepoznata - program nastavlja prema navedenom algoritmu akcije - izvršava funkciju koja je pridružena određenoj komandi.

Sve je prilično jednostavno. Govor se ne prepoznaje uvijek ispravno, pa se kompjuterski program glasovne kontrole ne koristi intenzivno za rješavanje složenih zadataka upravljanja operativnim sistemom. Koristi se za obavljanje osnovnih funkcija: otvaranje i zatvaranje datoteka, lokalne i mrežne pretrage itd.

Istorija razvoja glasovne kontrole

  • Prvi Audrey sistem za prepoznavanje glasa stvoren je 1950-ih godina. Dešifrovala je samo brojeve izgovorene u jedan glas.
  • Godine 1962. stvoren je prvi sistem za prepoznavanje riječi. Transkribovala je 15 engleskih riječi.
  • Razvojem računara 1990. godine razvijen je program Dragon Dictate. Prepoznavala je do 100 riječi u minuti, ali je imala visoku cijenu.
  • Početkom 2000-ih, aplikacija za prepoznavanje govora Google Voice Search pojavila se na iPhoneu. 2010. godine Androidu je dodat pretraživač.
  • Siri je uključena softver Telefon 4S početkom oktobra 2011;
  • 2014. godine predstavljena je Cortana, glasovni asistent za Windows.

Cortana i mogućnosti glasovnog unosa do danas

Cortana je virtuelni asistent u operativnom sistemu Windows. Servis pomaže korisniku u planiranju stvari, podsjeća ga na njih.
Na određeni zahtjev, servis će pomoći da se prikupe određene informacije, da se napravi jasna struktura i prezentuje korisniku u što obrađenom obliku.
Zanimljivo je da virtuelni asistent odmah po uključivanju prikuplja sve informacije o unesenim zahtevima, ličnim podacima, pokušavajući da se što više prilagodi svakom pojedinačnom korisniku.


Glasovna kontrola Windows 7 računara kroz korištenje virtuelnog asistenta nije moguća - integrirana je tek u desetu verziju. Ali, nažalost, programeri se nisu potrudili da izdaju verziju na ruskom jeziku.
Glavnu ulogu igra pretraga, koja se u 10-ke može otvoriti kroz "Start". Ova funkcija definira gotovo sve upite. Ako unos nije prepoznat, možete uneti odgovarajuću komandu u iskačućem prozoru i program za glasovnu kontrolu računara pročita tekstualne informacije.

Neugodan trenutak je prikupljanje svih podataka unesenih preko tastature i njihovo slanje u Microsoft.

Programi trećih strana

tip

Nakon završetka instalacije, prijeđite na sljedeći korak - kreiranje račun. Ovdje morate smisliti ključnu frazu, nakon koje će se oglasiti obavijest o aktivaciji.


Zatim ćete morati osmisliti i kreirati glasovne komande, bez obzira na njihovu svrhu. Komanda pas može pokrenuti aplikaciju ili učiniti nešto sasvim drugo.




Vi samo trebate kreirati glasovnu komandu i dodijeliti je određenoj radnji. Pogodno samo za obavljanje osnovnih operacija - otvaranje datoteka, foldera, itd. Funkcionalnost je ograničena.

zvučnik

Ovdje je funkcionalnost šira nego u Type.


Glasovna kontrola Windows 10 računara pruža korisniku mogućnost otvaranja i zatvaranja datoteka, snimanja ekrana, isključivanja računara.


Prepoznavanje govora traje dugo, preko 3-4 sekunde. To je zbog činjenice da se govor prvo pretvara u tekst, a komande kompjuter prepoznaje već iz tekstualnih informacija.

Laitis

to besplatni program, što vam omogućava da kontrolišete svoj računar i diktirate tekst. Nakon instalacije potrebno je da se registrujete i onda ga možete koristiti za svoje zadovoljstvo.


Zanimljiva funkcija automatskog ispravljanja prilikom kucanja. Možete reći "navodnici" i odgovarajući znak će se pojaviti u tekstu.

Mogućnosti glasovne kontrole putem Yandex.stringa

Korištenjem ove aplikacije možete vršiti lokalnu ili mrežnu pretragu informacija i datoteka, ponovo pokrenuti ili isključiti računalo. Postoji funkcija za otvaranje programa i web lokacija.
Da biste koristili program, prvo ga morate preuzeti i instalirati.

Ali tijekom instalacije vrijedi poništiti okvire nasuprot stavki u kojima proizvođač softvera nudi instaliranje preglednika, promjenu njegovih postavki. U suprotnom, instalacija će trajati duže i konfiguracija će se promijeniti u pretraživaču.
Na kraju, linija se postavlja blizu dugmeta "Start". Recite "Slušaj Yandex" i otvorit će se prozor.

Izgovorite zahtjev.

Nakon pauze, u pretraživaču će se otvoriti traka za pretraživanje. Dobra je ideja ovako upravljati pretragom.
Općenito, kompjuterska glasovna kontrola još nije razvijena, jer nam je privučena u mašti. Ali čak i one karakteristike koje su danas dostupne su već impresivne i značajno pomažu da se pređe na novi nivo upotrebe računara.

ugodan dan!

Možete komunicirati sa računarom ne samo pomoću tastature i miša. Dostupna je i kontrola glasovnim komandama. Postoje posebni uslužni programi koji vam to omogućavaju. Njihove funkcije uključuju ne samo snimanje teksta iz diktata ili transkripciju audio zapisa. Preko njih možete pokretati aplikacije, koristiti ih i općenito - raditi bilo što. Kontrolisanje računara glasom olakšava rad sa računarom. Komande se prenose brzo i bez napora. Naravno, ako imate mikrofon.

Upoznat ćemo vas sa aplikacijama slične funkcionalnosti.

Ova funkcija je ugrađena u engleski jezik Windows verzija. Morate imati Enterprise ili Ultimate licencu da biste je koristili. Ali i na rusifikovanom operativni sistemi Možete podesiti glasovnu kontrolu i diktiranje teksta. Koristite jednu od sljedećih aplikacija.

Aplikacija je laka za razumijevanje

Popularni program. Iako ima svojih nedostataka. Suština njegovog rada je jednostavna: postavljate komandu i birate koju radnju treba da izvrši. Razmislite o postavljanju ove aplikacije koristeći poseban primjer.

  1. Preuzmite i instalirajte ga. Postoji besplatna i premium verzija. Drugi morate kupiti da biste ga isprobali na kompjuteru.
  2. Pokrenite uslužni program. U njemu će se pojaviti informativni prozor sa savjetima.
  3. Njegova kontrolna ploča ima mnogo različitih funkcija. Neki od njih imaju isto ime. Treba se kretati po slici, a ne po natpisu. Pritisnite dugme "Dodaj" - prikazuje se lice.
  4. Navedite ime profila i ključnu riječ za identifikaciju naredbe. Na primjer, napišite "otvoreno" ako ćete podesiti pokretanje neke aplikacije glasom. Ili "idite na" da biste odmah otišli na web lokaciju bez unosa njene adrese.
  5. Sada treba da snimimo ovu komandu u obliku zvučne slike. Kliknite na dugme sa crvenim krugom. I jasno, jasno izgovorite željenu frazu u mikrofon.
  6. Potvrdite promjene. Navedena opcija će se pojaviti na listi u prozoru Type. Program će zapamtiti ono što ste snimili na svom "diktafonu".
  7. Nakon toga navedite šta, u stvari, da ga pokrenete da izvršite naredbu. Kliknite na dugme "Dodaj", koje izgleda kao ruka sa simbolom "+" (plus).
  8. Odaberite format podataka: datoteke/uslužni programi, web stranice, neke interne OS usluge. Stavite potvrdne okvire gdje želite.
  9. Pronađite aplikaciju koju želite pokrenuti svojim glasom. Neka to bude, na primjer, Microsoft Word. Tako možete vrlo brzo početi uređivati ​​neki tekst ili pisati članak.
  10. U istom prozoru zapišite drugi dio naredbe. Tako da ukupno ispadne "otvoriti Riječ". Prva riječ će omogućiti tip, druga će omogućiti povezani uslužni program.
  11. Kliknite Dodaj.
  12. Možete priložiti nekoliko aplikacija jednoj „otvorenoj“ funkciji. Na ovaj način ćete kontrolisati njihovo pokretanje bez dodirivanja miša i drugih perifernih uređaja instaliranih na računaru.
  13. Ako je potrebno, uredite dodatne parametre.
  14. Da provjerite da li radi ili ne, kliknite na "Počni govoriti" i izgovoriti naredbu.

Program radi sa ruskim jezikom. Ali to ne prepoznaje uvijek ispravno. Potrebno je govoriti glasno, jasno, mehaničkim glasom.

  • Nije potrebno poznavanje engleskog jezika.
  • Brzo kreiranje komande.
  • Nema prepoznavanja teksta.
  • Ograničena funkcionalnost. Možete otvarati samo uslužne programe i stranice na Internetu.
  • Program ponekad percipira vanjsku buku kao naredbe. Zbog toga se na PC-u dešavaju čudne stvari.
  • Ne možete raditi sa plejerom.

Speechka

Još jedna aplikacija za upravljanje računarom

  1. Prilikom prvog pokretanja otvoriće se prozor sa izborom kategorije: PC ili Internet.
  2. Tu je i objašnjenje kojom kombinacijom tipki aktivirati uslužni program. Ovo se može promijeniti u postavkama.
  3. Kliknite na "Internet", na primjer. Otvoriće se prozor sa nekoliko polja za unos: za tekst komande i za URL sajta. Možete napisati riječ "Yandex" i adresu ove stranice.
  4. Kliknite Dodaj.
  5. Držite pritisnute tipke naznačene na glavnom prozoru.
  6. Izgovorite naredbu tako da je uslužni program "zapamti".
  • Aktivacija oba tastera i jačine zvuka.
  • Prilikom pokretanja, možete kalibrirati mikrofon.
  • Ograničena funkcionalnost.

zvučnik

Interfejs je dizajniran na minimalistički način

Komande u aplikaciji se konfigurišu pomoću ispisanih riječi, a ne diktata. Postoji interni mehanizam za prepoznavanje teksta. Glavne funkcije:

  • Kreirajte snimke ekrana na komandu.
  • Promenite raspored tastature na računaru.
  • Otvaranje aplikacija i datoteka.
  • Završetak radova.
  • Ne možete napraviti audio snimak sa timom. Uslužni program prepoznaje oznake.
  • Za kontrolu je potrebno koristiti tastaturu. Ako se navedeno dugme koristi u druge svrhe, to će biti nezgodno.
  • Potrebna vam je stabilna internet konekcija.

Gorynych

Pomoći će vam junak ruskih narodnih priča

Program za upravljanje računarom glasom "Gorynych" je domaći proizvod. Stoga postoji "nativni" modul za prepoznavanje govora. "Prilagođava" se tembru i intonaciji korisnika. Pomoću uslužnog programa možete u potpunosti raditi u sistemu, a ne samo otvarati datoteke i web stranice.

  • Postoji podrška za ruski i engleski jezik.
  • Prepoznavanje teksta, glasovni unos bilo kom uredniku.
  • Proširena funkcionalnost.
  • Potrebno je samostalno kreirati komande za svaki proces. Bukvalno, morate napisati rečnik.

Windows prepoznavanje govora

Program ugrađen u engleski OS. Da biste ga koristili, morate imati instaliran odgovarajući jezički paket. Ruski timovi neće raditi s njom. Da biste njime upravljali računarom, moraćete da govorite njegov jezik. Da mu pristupite u panelu Windows postavke otvorite meni "Regionalni i jezički standardi" (nalazi se u kategoriji "Sati, jezik, region") i postavite "Engleski" na svim karticama. Ako je sve ispravno i ako imate instaliran potreban jezički paket, Windows će se "pretvoriti" u engleski, a uslužni program će postati dostupan. Bolje je da ne pokušavate ovu metodu ako ne znate dobro strani jezik.

Ova metoda je prikladna ako govorite engleski

Ostali komunalni programi

Postoji niz aplikacija za upravljanje takvim komandama:

  • Ekstenzije pretraživača. Olakšajte surfovanje webom. AT google chrome slična funkcija je već ugrađena - glasovni unos u formularima za pretragu. Ova opcija je dostupna na nekim online kartama. Omogućava vam da brzo pronađete adresu.
  • glasovni tip.
  • RealSpeaker.
  • Web Speech.

Lista softvera za prepoznavanje teksta i diktiranje

Upravljanje glasom je, naravno, dobro. Ali uslužni programi za OCR i kucanje po diktatu mogu biti korisni. Prilikom sastavljanja obimnih izvještaja, diploma, lakše je zapisati svoje misli tako što ćete ih iznijeti u mikrofon na računaru. Evo nekih od ovih uslužnih programa:

  • Diktograf.
  • Zmaj, prirodno govoreći.
  • Perpetuum Mobile.

Proizvod koji vam omogućava da diktirate tekst računaru

Možete podesiti glasovne komande u OS-u. Da biste to učinili, na računaru mora biti instaliran odgovarajući program. Sa njim možete raditi na računaru, ležeći na kauču ili se izležavati u fotelji. Imaćete slobodne ruke. Ako je mikrofon dobar i hvata čak i udaljene ili tihe zvukove, nećete morati sjediti pored njega. Možete istovremeno "razgovarati" sa računarom i pisati beleške u svesku, crtati, držati nešto. Da, čak i šivati ​​i plesti. Sa komandama, interakcija sa računarom je mnogo lakša. Da biste aktivirali neke od ovih uslužnih programa, morate pritisnuti dugmad na tastaturi, što nije baš zgodno.

Ali postoje i negativni aspekti. Ako slučajno izgovorite komandnu riječ, otvorit će se aplikacija koja je trenutno potpuno nepotrebna ili će pretraživač otići na neku stranicu na pogrešnom mjestu. Šta ćete koristiti i da li ćete uopšte koristiti - na vama je.

Danas ćemo govoriti o našem govoru. Da li bi želio upravljajte računarom glasom, bez pomoći prstiju? I, kako kažu, snagom misli! Istina, nećemo kontrolisati kompjuter snagom misli, ali snagom glasa to je sasvim realno.

Unesite program- Ovo je jedan od najboljih softvera za upravljanje računarom putem glasa. Na stranicama u komentarima na ovaj program mišljenja se slažu.

Istina, ima i svojih nedostataka. Ali više o tome kasnije. Inače, ako ste zainteresovani, pročitajte moju recenziju.

Program možete preuzeti ovdje: http://freesoft.ru/type

Kako ga koristiti? Prvo, pokrenimo ga i vidimo glavne kontrolne tipke:

Program nas pozdravlja i odmah nam daje savjete kako da koristimo Type. Na početku ćemo pritisnuti dugme „dodaj“ i zapisati reč, na primer „otvori“. Da biste to učinili, izgovorite ovu riječ u mikrofon:

Zatim kliknite na dodaj. Dakle, riječ “Otvori” smo sačuvali u programu svojim glasom. Možete izgovoriti bilo koje druge riječi u mikrofon. Glavna stvar je da se ne zbunite.

Sljedeći korak je dodavanje komandi. Da biste to učinili, idite na ovu tačku:

Zatim označimo kućicu pored stavke koja nam je potrebna:

Odaberite program, aplikaciju ili radnju i kliknite na crveno dugme za snimanje. Ako je računar prihvatio naš glas, kliknite na "Dodaj":

I sada će jedna glasovna komanda biti vidljiva na našem profilu. U ovom slučaju, onaj koji otvara 7-Zip:

A sada, pritiskom na poslednje dugme "počni pričati"

kažemo frazu "otvori Seven Zip". U mom slučaju, sve će raditi. I program 7-zip će se otvoriti. Zapamtite ovu frazu: Sim sim otvoren? Evo nešto o istom.

Program ne radi uvijek ispravno. Sada moćni ruski jezik nisu u potpunosti proučili programeri lingvisti... Ali ipak, lijepo je kada vas kompjuter posluša.

Stoga je za testiranje i banalnu radoznalost program Typle 100% prikladan.

U ovom videu možete vidjeti povijest stvaranja prvih glasovnih motora i na čemu još trebamo raditi:

Postoje tako strašna imena drugih analoga programa kao što su Gorynych, Perpetuum, Dictograph, Voice Commander. Ali svi oni “nisu taj”. Nemojte proći kritiku vrijednog programa.

Trebalo mi je 5 minuta da savladam ovaj program. Ovo je dosta dugo (uglavnom takve programe razumijem za 1-2 minute). Ako imate pitanja - pišite. Vidimo se uskoro, prijatelji :)!

U još jednom pokušaju implementacije ideja iz naučnofantastičnih filmova, jedan po jedan, tehnološki giganti počeli su raditi na virtualnim asistentima. Na konferenciji Google I/O 2016, kompanija uveden Google Assistant, kao i analog Amazon Echo - home glasovni asistent Google home.

Poslednja velika kompanija koja je ušla u trku virtuelnih pomoćnika. Hajde da vidimo kakve konkurente ima (uključujući i među startapima).

10 virtuelnih asistenata: pregled

Alexey Zenkov

Prvo, prisjetimo se šta je Google Now.

Google/Google Now glasovno pretraživanje

Posebnosti: Brzo. Izuzetno precizan pri kreiranju ruta. Plaši svojom svjesnošću o vašim letovima, rezervacijama i drugim detaljima. sa nekima aplikacije trećih strana: Upravljajte bilješkama, porukama i reprodukcijom muzike.

Nedostaci: Ponekad vam smeta pretjerana inicijativa (na primjer, prikazuje rezultate igara timova koji vas ne zanimaju ili rute kući sa poznatih mjesta). Beskorisno pri upravljanju "pametnom kućom". Čini se da je rad na integraciji sa aplikacijama trećih strana zastao.

nivo humanosti: Null. Nije pogodno za komunikaciju. Čak nema ni ime osim Googlea.

Sažetak: Ogroman fond ličnih podataka i pristup pretraživaču bi, u teoriji, trebalo da učini Google liderom u industriji, ali kompanija još nije smislila kako da iskoristi svoje prednosti da stvori pomoćnika koji može da razume korisnika. Danas Google Now i glasovna pretraga ravnopravno se takmiče sa Siri, ali još nisu dostigli novi nivo razvoja.

A sada - o konkurentima.

Apple Siri

Šta: Glasovni asistent koji može razgovarati s korisnikom i dati proaktivne preporuke. Aktivira se dugim pritiskom na tipku Home na i iPadu. Podrška za pomoćnika nedavno se pojavila na Apple TV-u i Apple Watch-u.

Posebnosti: Jednostavan za korištenje na iOS uređajima. Razumije prirodni govor. Dobro informisani o novostima, vremenu, sportu, filmovima, rutama i lokalnim poslovima. Mogu vam reći šta da gledate na TV-u. Mogućnost interakcije sa nekim elementima "pametne kuće".

Nedostaci: Ne može komunicirati s većinom drugih aplikacija i usluga. Radi sporije od nekih konkurenata.

nivo humanosti: Nije u stanju da održi pun razgovor, ali u određenim trenucima pokazuje sopstvenu mudrost. Ženski glas zvuči relativno ljudski.

Nedostaci: Odlično se osjeća na Windows-u - platformi za koju su programeri, a možda i korisnici, najmanje zainteresirani. Korištenje asistenta na Androidu i iOS-u je teže, a ima i manje funkcija.

nivo humanosti: Voli viceve, posebno banalne. Spremna je duga lista duhovitih odgovora na uobičajena pitanja. Može čitati odlomke iz Shakespearea.

Sažetak: Nakon godina u senci Siri i Google-a, Cortana je postala mnogo zanimljiviji chatbot. Microsoft želi da napravi svoje glasovni asistent osnovna inteligencija za sve ostale botove koji mogu upravljati vašim putovanjima, sastancima, listama obaveza i drugim stvarima, kao i povećati stepen integracije sa drugim Microsoft proizvodima, kao što je Office. Kompanija ima za cilj da stvori novu ljusku za post-PC računarstvo, ali je prerano reći da li će uspeti ili ne.

Facebook M

Šta: Djelomično vođeni, dijelom ljudski, a još uvijek u razvoju. M će biti tekstualni asistent u okruženju Facebook Messenger.

Posebnosti: Pokušaće da uradi šta god tražite.

Nedostaci: To još nije gotov proizvod i neće biti još dugo. Dostupno samo malom broju korisnika u San Franciscu.

nivo humanosti: Izuzetno visoka, jer će ljudi učestvovati u formiranju odgovora na pitanja. Prema Wiredu, kompanija se nada da će M vremenom učiti od ovih operatera i biti u mogućnosti da radi nezavisnije.

Sažetak: U ovom trenutku, M je samo malo više od ideje. Ali s obzirom na interesovanje Facebooka za chat botove općenito, ne bi bilo iznenađujuće da M na kraju postane super-inteligentan.

X.ai

Šta: Jedan od rijetkih virtualnih asistenata sa samo jednom funkcijom. Radi isključivo putem e-maila, gdje može zakazati termine na vaš zahtjev.

Posebnosti: Poznaje vaš raspored i želje, pregovara sa drugim učesnicima za vas.

Posebnosti: Viv obećava da će njihov proizvod moći da razume složena pitanja, poput: „Hoće li temperatura u blizini mosta Golden Gate prekosutra posle 17 časova preći 20 stepeni?“. U toku je rad na osiguravanju kompatibilnosti sa aplikacijama trećih strana.

Nedostaci: Za sada, osim pripremljenih prezentacija, nema dokaza da sve funkcioniše tačno kako je navedeno.

nivo humanosti: Više vrednuje vizuelna pomagala i konkretne odgovore Detaljan opis. Duhovitost je upitna.

Nedostaci: Mogućnosti integracije sa aplikacijama trećih strana su ograničene, a servis je nemoguće otvoriti direktno na iOS-u ili Androidu. Zahtjevi koje asistent ne može prepoznati se preusmjeravaju na Ask.com.

nivo humanosti: Ne pogoduje dugim razgovorima, ali zna odgovoriti na dodatna pitanja.

Sažetak:Čini se da mobilne aplikacije Hound zapravo postoji samo da bi pokazao mogućnosti usluge Houndify, koju SoundHound planira prodati drugim kompanijama. Ako sve uspije, nećemo ni znati da ga koristimo.

Ozlo

Šta: AI, čija je glavna funkcija u ovom trenutku potraga za kafićima, barovima i restoranima. Dostupan za ograničen broj korisnika.

Posebnosti: Pronalazi i kombinuje podatke iz nekoliko izvora, uključujući Yelp i Foursquare, a zatim sve predstavlja u obliku praktičnih kartica. Pokušava komunicirati postavljanjem i odgovorom na dodatna pitanja, poput "koja su mjesta trenutno otvorena?" ili "šta je na njihovom meniju?"

Nedostaci: Ograničene mogućnosti, osim ako kreatori Ozla ne dodaju nove značajke. Kada uči, AI u velikoj mjeri ovisi o korisnicima.

nivo humanosti: Izbjegava nepotrebne ljubaznosti, samo kratke pozdrave po imenu.

Sažetak: Ozlo se ne bi razlikovao od mnogih drugih chatbotova da nema perspektivu da napravi nešto veće. Sposobnost kombinovanja podataka iz više izvora u jednom izlazu je jedinstvena, ali još nije jasno da li će programeri moći da ostvare puni potencijal za koji tvrde. Sve dok je Ozlov poslovni plan ograničen samo na aplikaciju, prikupljanje podataka potrebnih za obuku može biti izazov.

SpeakToIt Assistant.ai

Šta: Jedna od mnogih kopija Siri. U trgovini aplikacija, traženje Siri otvara mnoge slične programe, kao što su glasovne komande, glasovni sekretar i pomoćnik.

Posebnosti: Nije za razliku od Siri, ali može naučiti korisničke komande za aktiviranje liste funkcija.

Nedostaci: Nije toliko koristan kao ugrađeni pomoćnik u vašem pametnom telefonu, a nije ni tako zgodan.

nivo humanosti: Zvuči prilično neprirodno, ali sebe prikazuje kao ljudskog pomoćnika čiji spol i izgled može se mijenjati.

Sažetak: Neki od ovih Siri klonova izgledaju kao relikt prošlosti, a ne svi iPhone modeli mogao raditi s Appleovim vlasničkim asistentom i trebao ga je zamijeniti. U svakom slučaju, čini se da su njihovi kreatori svjesni da im takav pristup neće omogućiti uspjeh. Na primjer, SpeakToIt je prešao na kreiranje skupa alata koje bi drugi programeri mogli koristiti za pravljenje vlastitih chatbotova.