Per le persone con disabilità, così come solo per i sibariti, gli sviluppatori di sistemi operativi hanno creato controllo vocale computer. Consente all'utente di inserire le informazioni a voce. Dopo aver pronunciato determinate parole, il dispositivo avvia il riconoscimento vocale, convertendo il segnale audio in informazioni digitali. Dopo che le informazioni immesse sono state riconosciute correttamente - il programma procede all'algoritmo di azione specificato - esegue la funzione collegata a un particolare comando.

Tutto è abbastanza semplice. Il parlato non viene sempre riconosciuto correttamente, quindi il programma di controllo vocale del computer non viene utilizzato in modo intensivo per risolvere compiti complessi di gestione del sistema operativo. Viene utilizzato per eseguire le funzioni di base: apertura e chiusura di file, ricerche locali e di rete, ecc.

La storia dello sviluppo del controllo vocale

  • Il primo sistema di riconoscimento vocale Audrey è stato creato negli anni '50. Decifrò solo i numeri pronunciati con una sola voce.
  • Nel 1962 fu creato il primo sistema di riconoscimento delle parole. Ha trascritto 15 parole inglesi.
  • Con lo sviluppo dei computer nel 1990, è stato sviluppato il programma Dragon Dictate. Riconosceva fino a 100 parole al minuto, ma aveva un prezzo elevato.
  • All'inizio degli anni 2000, l'app di riconoscimento vocale Google Voice Search è apparsa su iPhone. Nel 2010 è stato aggiunto un motore di ricerca ad Android.
  • Siri è stato incluso in Software Telefono 4S all'inizio di ottobre 2011;
  • Nel 2014 è stato introdotto Cortana, un assistente vocale per Windows.

Funzionalità di Cortana e input vocale fino ad oggi

Cortana è un assistente virtuale nel sistema operativo Windows. Il servizio aiuta l'utente a pianificare le cose, glielo ricorda.
Ad una determinata richiesta, il servizio aiuterà a raccogliere informazioni specifiche, creare una struttura chiara e presentarle all'utente nella forma più elaborata possibile.
Interessante che subito all'accensione l'assistente virtuale raccolga tutte le informazioni sulle richieste inserite, i dati personali, cercando di adattarsi il più possibile ad ogni singolo utente.


Il controllo vocale di un computer Windows 7 tramite l'uso di un assistente virtuale non è possibile: è integrato solo nella decima versione. Ma, purtroppo, gli sviluppatori non si sono preoccupati di rilasciare la versione in lingua russa.
Il ruolo principale è svolto dalla ricerca, che in 10-ke può essere aperta tramite "Start". Questa funzione definisce quasi tutte le query. Se la voce non viene riconosciuta, è possibile immettere il comando appropriato nella finestra a comparsa e il programma di controllo vocale del computer leggerà le informazioni di testo.

Un momento spiacevole è la raccolta di tutti i dati inseriti tramite la tastiera e l'invio a Microsoft.

Programmi di terze parti

Tipo

Dopo aver completato l'installazione, procedere al passaggio successivo: creare account. Qui devi trovare una frase chiave, dopo di che suonerà una notifica di attivazione.


Successivamente, dovrai inventare e creare comandi vocali, indipendentemente dal loro scopo. Il comando dog può avviare un'applicazione o fare qualcos'altro.




Devi solo creare un comando vocale e assegnarlo a un'azione specifica. Adatto solo per eseguire operazioni di base: apertura di file, cartelle, ecc. La funzionalità è limitata.

oratore

Qui la funzionalità è più ampia rispetto a Type.


Il controllo vocale di un computer Windows 10 offre all'utente la possibilità di aprire e chiudere file, acquisire schermate dello schermo, spegnere il PC.


Il riconoscimento vocale richiede molto tempo, oltre 3-4 secondi. Ciò è dovuto al fatto che il parlato viene prima convertito in testo e i comandi vengono riconosciuti dal computer già dalle informazioni testuali.

Laits

esso programma gratuito, che ti consente sia di controllare il PC che di dettare il testo. Dopo l'installazione, devi registrarti e quindi puoi usarlo a tuo piacimento.


Un'interessante funzione di correzione automatica durante la digitazione. Puoi dire "virgolette" e il carattere corrispondente apparirà nel testo.

Possibilità di controllo vocale tramite Yandex.string

Attraverso l'uso di questa applicazione, è possibile eseguire ricerche locali o di rete di informazioni e file, riavviare o spegnere il computer. C'è una funzione per aprire programmi e siti.
Per utilizzare il programma, devi prima scaricarlo e installarlo.

Ma durante l'installazione, vale la pena deselezionare le caselle di fronte agli elementi in cui il produttore del software offre di installare un browser, modificarne le impostazioni. In caso contrario, l'installazione richiederà più tempo e la configurazione cambierà nel browser.
Infine, la linea viene posizionata vicino al pulsante "Start". Dì "Ascolta Yandex" e si aprirà una finestra.

Pronuncia la richiesta.

Dopo una pausa, nel browser si aprirà una barra di ricerca. È una buona idea gestire la ricerca in questo modo.
In generale, il controllo vocale del computer non è stato ancora sviluppato, poiché è attratto da noi nell'immaginazione. Ma anche le funzionalità oggi disponibili sono già impressionanti e aiutano in modo significativo a passare a un nuovo livello di utilizzo del PC.

Vi auguro una buona giornata!

Puoi interagire con un computer non solo usando la tastiera e il mouse. È disponibile anche il controllo dei comandi vocali. Ci sono utilità speciali che ti consentono di farlo. Le loro funzioni includono non solo la registrazione di testo da dettatura o la trascrizione di registrazioni audio. Attraverso di loro, puoi eseguire applicazioni, usarle e, in generale, fare qualsiasi cosa. Controllare il computer con la voce semplifica il lavoro con un PC. I comandi vengono trasmessi rapidamente e senza sforzo. Certo, se hai un microfono.

Ti presenteremo applicazioni con funzionalità simili.

Questa funzione è incorporata nell'inglese Versione Windows. Devi avere una licenza Enterprise o Ultimate per usarlo. Ma anche in Russified sistemi operativiÈ possibile impostare il controllo vocale e la dettatura del testo. Utilizzare una delle seguenti applicazioni.

L'app è facile da capire

Programma popolare. Anche se ha i suoi svantaggi. L'essenza del suo lavoro è semplice: imposti un comando e scegli quale azione deve eseguire. Prendi in considerazione la configurazione di questa applicazione utilizzando un esempio specifico.

  1. Scaricalo e installalo. C'è una versione gratuita e premium. Il secondo deve essere acquistato per provarlo su un computer.
  2. Esegui l'utilità. Apparirà una finestra informativa con suggerimenti.
  3. Il suo pannello di controllo ha molte funzioni diverse. Alcuni di loro hanno lo stesso nome. È necessario navigare dall'immagine, non dall'iscrizione. Premi il pulsante "Aggiungi": mostra una faccia.
  4. Specificare un nome profilo e una parola chiave per identificare il comando. Ad esempio, scrivi "apri" se intendi impostare l'avvio vocale di alcune applicazioni. Oppure "vai a" per andare istantaneamente su un sito senza inserirne l'indirizzo.
  5. Ora dobbiamo registrare proprio questo comando sotto forma di un'immagine sonora. Fare clic sul pulsante con il cerchio rosso. E chiaramente, pronuncia chiaramente la frase desiderata nel microfono.
  6. Conferma le modifiche. L'opzione specificata apparirà nell'elenco nella finestra Tipo. Il programma ricorderà ciò che hai registrato sul suo "registratore vocale".
  7. Successivamente, specifica cosa, in effetti, eseguirlo per eseguire il comando. Fai clic sul pulsante "Aggiungi", che assomiglia a una mano con un simbolo "+" (più).
  8. Seleziona il formato dei dati: file/utilità, pagine Web, alcuni servizi del sistema operativo interno. Metti le caselle di controllo dove vuoi.
  9. Trova l'applicazione che desideri avviare con la tua voce. Lascia che sia, ad esempio, Microsoft Word. Quindi puoi iniziare molto rapidamente a modificare del testo o scrivere un articolo.
  10. Nella stessa finestra, annota la seconda parte del comando. Così che in totale risulta "aprire la Parola". La prima parola abiliterà il tipo, la seconda abiliterà l'utilità collegata.
  11. Fare clic su Aggiungi.
  12. È possibile allegare più applicazioni a una funzione "apri". In questo modo controllerai il loro avvio senza toccare il mouse e le altre periferiche installate sul computer.
  13. Se necessario, modificare parametri aggiuntivi.
  14. Per verificare se ha funzionato o meno, fai clic su "Inizia a parlare" e pronuncia il comando.

Il programma funziona con la lingua russa. Ma non sempre lo riconosce correttamente. È necessario parlare ad alta voce, chiaramente, con voce meccanica.

  • Non è richiesta la conoscenza della lingua inglese.
  • Creazione rapida dei comandi.
  • Nessun riconoscimento del testo.
  • Funzionalità limitata. È possibile aprire solo utilità e pagine su Internet.
  • Il programma a volte percepisce il rumore estraneo come comandi. Per questo motivo, accadono cose strane sul PC.
  • Non puoi lavorare con il giocatore.

Speechka

Un'altra applicazione per la gestione del computer

  1. Al primo avvio si aprirà una finestra con la scelta della categoria: PC o Internet.
  2. C'è anche una spiegazione di quale combinazione di tasti per attivare l'utilità. Questo può essere modificato nelle impostazioni.
  3. Fare clic su "Internet", ad esempio. Si aprirà una finestra con diversi campi di input: per il testo del comando e per l'URL del sito. Puoi scrivere la parola "Yandex" e l'indirizzo di questa pagina.
  4. Fare clic su Aggiungi.
  5. Tenere premuti i tasti indicati nella finestra principale.
  6. Pronuncia il comando in modo che l'utilità lo "ricordi".
  • Attivazione da entrambi i tasti e volume del suono.
  • All'avvio, puoi calibrare il microfono.
  • Funzionalità limitata.

oratore

L'interfaccia è progettata in modo minimalista

I comandi nell'applicazione vengono configurati utilizzando parole stampate, non dettatura. C'è un meccanismo di riconoscimento del testo interno. Funzioni principali:

  • Crea schermate a comando.
  • Modifica il layout della tastiera sul tuo computer.
  • Apertura di applicazioni e file.
  • Completamento del lavoro.
  • Non è possibile effettuare una registrazione audio con il team. L'utilità riconosce le etichette.
  • Devi usare la tastiera per controllarlo. Se il pulsante specificato viene utilizzato per altri scopi, sarà scomodo.
  • Hai bisogno di una connessione Internet stabile.

Gorynych

L'eroe dei racconti popolari russi ti aiuterà

Il programma per controllare un computer con la voce di "Gorynych" è un prodotto domestico. Pertanto, esiste un modulo di riconoscimento vocale "nativo". Si "adatta" al timbro e alle intonazioni dell'utente. Con l'utilità, puoi lavorare completamente nel sistema e non solo aprire file e pagine Web.

  • C'è il supporto per le lingue russo e inglese.
  • Riconoscimento del testo, input vocale a qualsiasi editore.
  • Funzionalità estesa.
  • È necessario creare in modo indipendente comandi per ogni processo. Letteralmente, devi scrivere un dizionario.

Riconoscimento vocale di Windows

Un programma integrato nel sistema operativo inglese. Per utilizzarlo, è necessario che sia installato il Language Pack appropriato. Le squadre russe non lavoreranno con lei. Per controllare un PC con esso, dovrai parlarne la lingua. Per accedervi nel Pannello Impostazioni di Windows apri il menu "Norme regionali e linguistiche" (si trova nella categoria "Orari, lingua, regione") e imposta "Inglese" in tutte le schede. Se tutto è corretto e hai installato il language pack necessario, Windows "diventerà" in inglese e l'utilità sarà disponibile. È meglio non provare questo metodo se non conosci bene una lingua straniera.

Questo metodo è adatto se parli inglese

Altre utilità

Esistono numerose applicazioni per la gestione di tali comandi:

  • Estensioni del browser. Facilita la navigazione in rete. A Google Chrome una funzione simile è già integrata: input vocale nei moduli di ricerca. Questa opzione è disponibile su alcune mappe online. Ti permette di trovare rapidamente l'indirizzo.
  • tipo di voce.
  • RealSpeaker.
  • Discorso sul web.

Elenco dei software di riconoscimento e dettatura del testo

Il controllo vocale è, ovviamente, buono. Ma le utilità per l'OCR e la digitazione dalla dettatura possono essere utili. Quando si compilano rapporti voluminosi, diplomi, è più facile annotare i propri pensieri esprimendoli in un microfono su un computer. Ecco alcune di queste utilità:

  • Dictogramma.
  • Dragon naturalmente parlando.
  • Mobile perpetuo.

Un prodotto che consente di dettare il testo a un computer

È possibile impostare i comandi vocali nel sistema operativo. Per fare ciò, il programma appropriato deve essere installato sul computer. Con esso, puoi lavorare su un PC, sdraiato sul divano o sdraiato su una poltrona. Avrai le mani libere. Se il microfono è buono e capta anche i suoni distanti o deboli, non avrai bisogno di sederti accanto ad esso. Puoi contemporaneamente "parlare" con il computer e scrivere appunti su un taccuino, disegnare, tenere qualcosa. Sì, anche cucire e lavorare a maglia. Con i comandi, interagire con un PC è molto più semplice. Per attivare alcune di queste utilità, è necessario premere dei pulsanti sulla tastiera, il che non è molto comodo.

Ma ci sono anche aspetti negativi. Se dici accidentalmente una parola di comando, si aprirà un'applicazione che al momento non è completamente necessaria o il browser andrà in qualche sito nel posto sbagliato. Cosa usare e se usare affatto: dipende da te.

Oggi parleremo del nostro intervento. Vorresti controllare il computer con la voce, senza l'aiuto delle dita? E, come si suol dire, con la forza del pensiero! È vero, non controlleremo il computer con il potere del pensiero, ma con il potere della voce è del tutto reale.

Digitare programma- Questo è uno dei migliori software per controllare un computer tramite la voce. Sui siti nei commenti a questo programma, le opinioni convergono.

È vero, ha i suoi difetti. Ma ne parleremo più avanti. A proposito, se sei interessato, leggi la mia recensione.

Puoi scaricare il programma qui: http://freesoft.ru/type

Come usarlo? Per prima cosa, eseguiamolo e vediamo i pulsanti di controllo principali:

Il programma ci dà il benvenuto e ci dà subito dei suggerimenti su come usare Type. All'inizio premeremo il pulsante "aggiungi" e annoteremo la parola, ad esempio "apri". Per fare ciò, pronuncia questa parola nel microfono:

Quindi fare clic su Aggiungi. Quindi, abbiamo salvato la parola "Apri" nel programma con la nostra voce. Puoi pronunciare qualsiasi altra parola nel microfono. L'importante è non confondersi.

Il passaggio successivo consiste nell'aggiungere comandi. Per fare ciò, vai a questo punto:

Quindi selezioniamo la casella accanto all'elemento di cui abbiamo bisogno:

Selezionare un programma, un'applicazione o un'azione e fare clic sul pulsante rosso di registrazione. Se il computer ha accettato la nostra voce, fai clic su "Aggiungi":

E ora un comando vocale sarà visibile nel nostro profilo. In questo caso, quello che apre 7-Zip:

E ora, premendo l'ultimo pulsante "inizia a parlare"

diciamo la frase "apri Seven Zip". Nel mio caso, tutto funzionerà. E si aprirà il programma 7-zip. Ricordi questa frase: Sim sim aperto? Ecco qualcosa più o meno lo stesso.

Il programma non funziona sempre correttamente. Ora la potente lingua russa non è stata completamente studiata dai programmatori linguisti ... Tuttavia, è bello quando un computer ti obbedisce.

Pertanto, per test e curiosità banali, il programma Typle è adatto al 100%.

In questo video potete vedere la storia della creazione dei primi motori vocali e cos'altro dobbiamo lavorare:

Ci sono nomi così terribili di altri analoghi del programma come Gorynych, Perpetuum, Dictograph, Voice Commander. Ma tutti loro sono "non quello". Non passare le critiche di un programma degno.

Mi ci sono voluti 5 minuti per padroneggiare questo programma. Questo è un tempo piuttosto lungo (per lo più, capisco tali programmi in 1-2 minuti). Se hai domande - scrivi. A presto, amici :)!

In un altro tentativo di implementare le idee dei film di fantascienza, uno per uno, i giganti della tecnologia hanno iniziato a lavorare su assistenti virtuali. Alla conferenza Google I/O 2016, l'azienda introdotto Google Assistant, nonché un analogo di Amazon Echo - casa assistente vocale Google casa.

L'ultima grande azienda ad entrare nella gara degli assistenti virtuali. Vediamo quali concorrenti ha (anche tra le startup).

10 assistenti virtuali: una panoramica

Alessio Zenkov

Innanzitutto, ricordiamo cos'è Google Now.

Ricerca vocale di Google/Google Now

Peculiarità: Presto. Estremamente preciso durante la creazione di percorsi. Spaventa con la sua consapevolezza dei tuoi voli, prenotazioni e altri dettagli. con qualche applicazioni di terze parti: Gestisci note, messaggi e riproduzione musicale.

Screpolatura: A volte ti dà fastidio con un'eccessiva iniziativa (ad esempio mostra i risultati delle partite di squadre che non ti interessano, o le rotte verso casa da luoghi famosi). Inutile quando si gestisce una "casa intelligente". Il lavoro sull'integrazione con applicazioni di terze parti sembra essersi bloccato.

Livello di umanità: Nullo. Non favorevole alla comunicazione. Non ha nemmeno un nome diverso da Google.

Riepilogo: Il vasto patrimonio di dati personali e l'accesso a un motore di ricerca dovrebbero, in teoria, fare di Google un leader del settore, ma l'azienda non ha nemmeno capito come sfruttarne i vantaggi per creare un assistente in grado di capire l'utente. Oggi Google Now e ricerca vocale competono ad armi pari con Siri, ma non hanno ancora raggiunto un nuovo livello di sviluppo.

E ora - sui concorrenti.

Mela Siri

Che cosa: Un assistente vocale in grado di parlare con l'utente e fornire consigli proattivi. Attivato premendo a lungo il tasto Home su iPad. Il supporto dell'assistente è apparso di recente su Apple TV e Apple Watch.

Peculiarità: Facile da usare su dispositivi iOS. Capisce il linguaggio naturale. Ben informato su notizie, meteo, sport, film, percorsi e attività commerciali locali. Posso dirti cosa guardare in TV. Capace di interagire con alcuni elementi della “casa intelligente”.

Screpolatura: Impossibile interagire con la maggior parte delle altre applicazioni e servizi. Funziona più lentamente di alcuni concorrenti.

Livello di umanità: Non riesce a mantenere una conversazione completa, ma in certi punti dimostra la propria saggezza. La voce femminile suona relativamente umana.

Screpolatura: Si sente benissimo su Windows, la piattaforma a cui gli sviluppatori, e forse gli utenti, sono meno interessati. Usare l'assistente su Android e iOS è più difficile e ci sono meno funzioni.

Livello di umanità: Ama le battute, soprattutto quelle banali. Ha una lunga lista di risposte spiritose a domande comuni a portata di mano. Sa leggere estratti da Shakespeare.

Riepilogo: Dopo anni passati all'ombra di Siri e Google, Cortana è diventata un chatbot molto più interessante. Microsoft vuole crearne uno proprio assistente vocale informazioni di base per tutti gli altri bot in grado di gestire viaggi, appuntamenti, elenchi di cose da fare e altro, nonché aumentare il grado di integrazione con altri prodotti Microsoft, come Office. L'azienda punta a creare una nuova shell per l'elaborazione post-PC, ma è troppo presto per dire se avrà successo o meno.

Facebook M

Che cosa: In parte guidato, in parte umano e ancora in fase di sviluppo. M sarà un assistente testuale nell'ambiente di Facebook Messenger.

Peculiarità: Proverò a fare quello che chiedi.

Screpolatura: Non è ancora un prodotto finito e non lo sarà per molto tempo. Disponibile solo per un numero limitato di utenti a San Francisco.

Livello di umanità: Estremamente alto, poiché le persone parteciperanno alla formazione delle risposte alle domande. Secondo Wired, l'azienda spera che nel tempo M imparerà da questi operatori e sarà in grado di lavorare in modo più indipendente.

Riepilogo: Al momento, M è solo un po' più di una semplice idea. Ma dato l'interesse di Facebook per i chatbot in generale, non sarebbe sorprendente se M finisse per diventare super intelligente.

Xai

Che cosa: Uno dei pochi assistenti virtuali con una sola funzione. Funziona solo tramite e-mail, dove può fissare appuntamenti su vostra richiesta.

Peculiarità: Conosce il tuo programma e le tue preferenze, negozia con altri partecipanti per te.

Peculiarità: Viv promette che il loro prodotto sarà in grado di comprendere domande complesse, come: "Dopodomani dopo le 17 la temperatura vicino al Golden Gate Bridge supererà i 20 gradi?". Sono in corso lavori per garantire la compatibilità con applicazioni di terze parti.

Screpolatura: Finora, a parte le presentazioni preparate, non ci sono prove che tutto funzioni esattamente come dichiarato.

Livello di umanità: Valorizza più gli aiuti visivi e le risposte concrete descrizione dettagliata. L'arguzia è discutibile.

Screpolatura: Le possibilità di integrazione con applicazioni di terze parti sono limitate ed è impossibile aprire il servizio direttamente su iOS o Android. Le richieste che l'assistente non è in grado di riconoscere vengono reindirizzate su Ask.com.

Livello di umanità: Non favorisce lunghe conversazioni, ma sa come rispondere a domande aggiuntive.

Riepilogo: Sembra che applicazioni mobili Hound in realtà esiste solo per mostrare le capacità del servizio Houndify, che SoundHound prevede di vendere ad altre società. Se tutto funziona, non sapremo nemmeno che lo stiamo usando.

Ozlo

Che cosa: AI, la cui funzione principale al momento è la ricerca di caffè, bar e ristoranti. Disponibile per un numero limitato di utenti.

Peculiarità: Trova e combina i dati da diverse fonti, tra cui Yelp e Foursquare, quindi presenta tutto sotto forma di comode carte. Cerca di comunicare ponendo e rispondendo a domande di follow-up, ad esempio "quali posti sono aperti in questo momento?" o "cosa c'è nel loro menu?"

Screpolatura: Funzionalità limitate, a meno che i creatori di Ozlo non aggiungano nuove funzionalità. Durante l'apprendimento, l'IA dipende fortemente dagli utenti.

Livello di umanità: Evita cortesie inutili, solo brevi saluti per nome.

Riepilogo: Ozlo non sarebbe diverso da molti altri chatbot se non avesse la prospettiva di costruire qualcosa di più grande. La capacità di combinare dati da più fonti in un unico output è unica, ma non è ancora chiaro se gli sviluppatori saranno in grado di realizzare tutto il potenziale che rivendicano. Finché il piano aziendale di Ozlo è limitato alla sola app, può essere una sfida raccogliere i dati necessari per la formazione.

SpeakToIt Assistant.ai

Che cosa: Una delle tante copie di Siri. Nell'App Store, la ricerca di Siri fa apparire molti programmi simili, come Comandi vocali, Segreteria vocale e Assistente.

Peculiarità: Non diversamente da Siri, ma può apprendere i comandi dell'utente per attivare un elenco di funzionalità.

Screpolatura: Non così utile come l'assistente integrato nel tuo smartphone e non così conveniente.

Livello di umanità: Sembra piuttosto innaturale, ma si ritrae come un assistente umano il cui genere e aspetto esteriore può essere cambiato.

Riepilogo: Alcuni di questi cloni di Siri sembrano una reliquia del passato quando non tutti Modelli di iPhone potrebbe funzionare con l'assistente proprietario di Apple e doveva essere sostituito. In ogni caso, sembra che i loro creatori siano consapevoli che un simile approccio non consentirà loro di avere successo. Ad esempio, SpeakToIt è passato alla creazione di una serie di strumenti che altri sviluppatori potevano utilizzare per creare i propri chatbot.