Для людей з обмеженими можливостями, а також просто для сибаритів розробники ОС створили голосове управліннякомп'ютер. Воно дозволяє користувачеві вводити інформацію голосом. Після промовлення певних слів пристрій починає розпізнавання мови - перетворення звукового сигналу цифрову інформацію. Після того, як введена інформація буде коректно розпізнана – програма переходить до заданого алгоритму дії – виконує функцію, яка прикріплена до тієї чи іншої команди.

Все досить просто. Не завжди мова розпізнається коректно, тому для вирішення складних завдань управління операційною системою програма голосового управління комп'ютером інтенсивно не використовується. Вона застосовується для виконання основних функцій: відкриття та закриття файлів, локального та мережевого пошуку та ін.

Історія розвитку голосового управління

  • Першу систему розпізнавання голосу Audrey було створено у 50-х роках ХХ століття. Вона розшифровувала лише цифри, промовлені одним голосом.
  • У 1962 р. була створена перша система розпізнавання слів. Вона розшифровувала 15 англомовних слів.
  • З розвитком комп'ютерів у 1990 р. була розроблена програма Dragon Dictate. Вона розпізнавала до 100 слів за хвилину, але відрізнялася високою ціною.
  • На початку 2000-х років в iPhone з'явився додаток для розпізнавання мовлення Google Voice Search. У 2010 році було додано систему пошуку в Android.
  • Siri була включена в програмне забезпечення Phone 4S на початку жовтня 2011 року;
  • у 2014 р. була представлена ​​Cortana - голосова помічниця для Windows.

Можливості Cortana та голосового введення на сьогоднішній день

"Кортан" - це віртуальний помічник в операційній системі Windows. Сервіс допомагає користувачеві у плануванні справ, нагадує про них.
При певному запиті сервіс допоможе зібрати конкретну інформацію, створити чітку структуру та піднести її користувачеві максимально можливо обробленому вигляді.
Цікаво, що відразу при включенні віртуальний помічник збирає всю інформацію про введені запити, особисті дані, намагаючись максимально адаптуватися під кожного окремого користувача.


Голосове керування комп'ютером Windows 7 за допомогою використання віртуального помічника неможливе – він інтегрований лише у десяту версію. Але, як не шкода, розробники не спромоглися випустити російськомовну версію.
Головну роль відіграє пошук, який у десятці можна відкрити через «Пуск». Ця функція визначає практично будь-які запити. Якщо входження не розпізнане – можна ввести відповідну команду у спливаюче вікно і програма голосового керування комп'ютером рахує текстову інформацію.

Неприємний момент – збирання всіх даних, введених через клавіатуру, та їх відправлення до «Майкрософт».

Сторонні програми

Typle

Після виконання установки переходимо до наступного кроку – створюємо обліковий запис. Тут необхідно вигадати ключову фразу, після чого прозвучить повідомлення про активацію.


Далі потрібно буде придумати та створити голосові команди, незалежно від їхнього призначення. Команда «собака» може запускати програму або виконувати зовсім іншу дію.




Просто потрібно створити голосову команду та закріпити її за певною дією. Підійде лише для виконання базових операцій – відкриття файлів, папок та ін. Функціонал обмежений.

Speaker

Тут функціонал ширший, ніж у Typle.


Голосове керування комп'ютером Windows 10 надає користувачеві можливість відкривати та закривати файли, робити знімки стану екрана, вимикати ПК.


Розпізнавання мови відбувається досить довго, понад 3-4 секунди. Це пов'язано з тим, що спочатку мова перетворюється на текст, а команди розпізнаються комп'ютером з текстової інформації.

Laitis

Це безкоштовна програмаяка дозволяє як керувати ПК, так і диктувати текст. Після встановлення необхідно зареєструватися і далі можна користуватися на своє задоволення.


Цікавою є функція автозаміни при наборі тексту. Ви можете сказати «Купочки» і в тексті з'явиться відповідний символ.

Можливості керування голосом через Яндекс.

За допомогою цієї програми можна виконувати локальний або мережевий пошук інформації та файлів, перезавантажити або вимкнути комп'ютер. Присутня функція відкриття програм та сайтів.
Щоб скористатися програмою, необхідно спочатку завантажити та встановити її.

Але при встановленні варто прибрати галочки навпроти пунктів, де виробник софту пропонує встановити браузер, поміняти його налаштування. В іншому випадку, установка займе більше часу і в браузері зміниться конфігурація.
Зрештою рядок розміщується біля кнопки «Пуск». Скажіть «Слухай Яндекс» та відкриється вікно.

Промовте запит.

Після паузи в браузері з'явиться рядок пошуку. Цікаво керувати пошуком таким чином.
У цілому нині, голосове управління комп'ютером поки що не розвинене, оскільки малюється в уяві. Але й ті функції, що є на сьогоднішній день, вже вражають та суттєво допомагають перейти на новий рівень користування ПК.

Чудового Вам дня!

Взаємодіяти з комп'ютером можна не лише за допомогою клавіатури та миші. Доступно також керування голосовими командами. Існують спеціальні утиліти, які дозволяють це зробити. У їх функції входить як запис тексту під диктовку чи розшифровка аудіозаписів. Через них можна запускати додатки, використовувати їх, та й взагалі робити що завгодно. Керування комп'ютером голосом полегшує роботу з ПК. Команди передаються оперативно та без зайвих зусиль. Звісно, ​​якщо у вас є мікрофон.

Ми познайомимо вас із додатками з подібним функціоналом

Така функція вбудована в англомовну версію Windows. Для її використання у вас має бути ліцензія Enterprise або Ultimate. Але й у русифікованих операційні системиможна настроїти керування голосом та диктування тексту. Скористайтеся одним із наведених нижче додатків.

З додатком розібратися нескладно

Популярна програма. Хоча має свої недоліки. Суть її роботи проста: задає команду і вибираєте, яку дію вона повинна виконувати. Розглянемо налаштування цієї програми на конкретному прикладі.

  1. Завантажте та встановіть його. Є безкоштовна та Premiun версія. Другу треба купувати, щоби випробувати її на комп'ютері.
  2. Запустіть утиліту. У ній з'явиться інформаційне вікно із підказками.
  3. На її панелі керування є багато різних функцій. Деякі – з однаковими назвами. Треба орієнтуватися за картинкою, а чи не за написом. Натисніть кнопку "Додати" - на ній зображено обличчя.
  4. Введіть ім'я профілю та ключове слово, яке позначатиме команду. Наприклад, напишіть «відкрити», якщо збираєтеся налаштувати запуск якоїсь програми голосом. Або перейти на, щоб миттєво перейти на якийсь сайт, не вводячи його адресу.
  5. Тепер треба записати цю команду у вигляді звукового образу. Натисніть кнопку з червоним кружком. І чітко, виразно промовте в мікрофон необхідну фразу.
  6. Підтвердьте зміни. Ця опція з'явиться у списку у вікні Typle. Програма запам'ятає те, що ви записали її «диктофон».
  7. Після цього вкажіть, що власне їй запускати для виконання команди. Натисніть кнопку «Додати», яка схожа на руку із символом «+» (плюс).
  8. Виберіть формат даних: файли/утиліти, інтернет-сторінки, якісь внутрішні сервіси операційної системи. Поставте галочки там, де вам потрібно.
  9. Знайдіть ту програму, яку хочете запускати голосом. Нехай це буде, наприклад, Microsoft Word. Так ви зможете дуже швидко розпочати редагування якогось тексту або написання статті.
  10. У тому ж таки вікні запишіть другу частину команди. Щоб у сумі вдалося «відкрити Ворд». Перше слово активуватиме Typle, друге – включатиме прив'язану утиліту.
  11. Натисніть «Додати».
  12. До однієї функції «відкрити» можна причепити кілька програм. Так ви керуватимете їх запуском, не торкаючись миші та інших периферійних пристроїв, встановлених на комп'ютері.
  13. Якщо потрібно, редагуйте додаткові параметри.
  14. Щоб перевірити, чи вийшло чи ні, натисніть на «Почати говорити» і скажіть команду.

Програма працює із російською мовою. Але не завжди правильно його розпізнає. Говорити треба голосно, чітко, механічно.

  • Не потрібні знання англійської мови.
  • Швидке створення команд.
  • Немає розпізнавання тексту.
  • Обмежений функціонал. Можна лише відкривати утиліти та сторінки в інтернеті.
  • Програма іноді сприймає сторонні шуми як команди. Через це на ПК відбуваються дивні речі.
  • Не можна працювати з програвачем.

Speechka

Ще один додаток для керування комп'ютером

  1. При першому запуску з'явиться вікно з вибором категорії: ПК або інтернет.
  2. Там є пояснення, яким поєднанням клавіш треба активувати утиліту. Це можна змінити у налаштуваннях.
  3. Натисніть, наприклад, на Інтернет. Відкриється вікно з кількома полями для введення: для тексту команди та URL сайту. Можна написати слово "Яндекс" та адресу цієї сторінки.
  4. Клацніть «Додати».
  5. Натисніть клавіші, вказані на головному вікні.
  6. Вимовте команду, щоб утиліта її «запам'ятала».
  • Активація як кнопками, так і за гучністю звуку.
  • Під час запуску можна відкалібрувати мікрофон.
  • Обмежений функціонал.

Speaker

Інтерфейс виконаний у мінімалістичному ключі

Команди у додатку налаштовуються за допомогою друкованих слів, а не диктування. Існує внутрішній механізм розпізнавання тексту. Основні функції:

  • Створення скріншотів за командою.
  • Зміна розкладки клавіатури на комп'ютері.
  • Відкриття програм та файлів.
  • Завершення роботи.
  • Можна не робити аудіозапис із командою. Утиліта розпізнає написи.
  • Для керування потрібно використовувати клавіатуру. Якщо кнопка використовується і для інших цілей - буде незручно.
  • Потрібне стабільне інтернет-з'єднання.

Горинич

Герой російських народних казок допоможе вам

Програма для керування комп'ютером голосом «Горинич» – вітчизняний продукт. Тому там "рідний" модуль розпізнавання мови. Він «пристосовується» до тембру та інтонацій користувача. З утилітою можна повноцінно працювати в системі, а не просто відкривати файли та веб-сторінки.

  • Є підтримка російської та англійської мов.
  • Розпізнавання тексту, голосове введенняу будь-які редактори.
  • Розширений функціонал.
  • Потрібно самостійно створювати команди для кожного процесу. У буквальному значенні доведеться записувати словник.

Windows Speech Recognition

Вбудована в англійську програму. Для її використання у вас має бути встановлений відповідний мовний пакет. Російські команди з нею не працюватимуть. Щоб керувати ПК з її допомогою, доведеться говорити її мовою. Щоб отримати доступ до неї в Панелі налаштувань Windowsвідкрийте меню "Мова та регіональні стандарти" (воно знаходиться в категорії "Годинник, мова, регіон") і в усіх вкладках встановіть "Англійська". Якщо все правильно, і у вас встановлений необхідний мовний пакет, Windows перетвориться на англійську, і утиліта стане доступна. Краще не пробувати цей метод, якщо ви погано знаєте чужу мову.

Цей спосіб підійде в тому випадку, якщо ви володієте англійською

Інші утиліти

Є ще ряд додатків для керування такими командами:

  • Розширення для браузерів. Полегшують серфінг по мережі. У Google Chromeвже вбудована подібна функція - голосове введення в пошукові форми. Ця функція є на деяких онлайн-картах. Вона дозволяє швидше знайти адресу.
  • VoiceType.
  • RealSpeaker.
  • Web Speech.

Список програм для розпізнавання тексту та запису під диктовку

Керувати голосом – це, звичайно, добре. Але можуть бути корисними утиліти для розпізнавання тексту та друкування під диктовку. При складанні об'ємних доповідей, дипломів легше записувати свої думки, озвучуючи в мікрофон на комп'ютері. Ось кілька таких утиліт:

  • Диктограф.
  • Dragon Naturally Speaking.
  • Перпетуум-Мобілі.

Продукт, що дозволяє диктувати текст комп'ютеру

У ОС можна настроїти голосові команди. Для цього на комп'ютері має бути встановлена ​​відповідна програма. З нею ви зможете працювати на ПК, лежачи на дивані або розвалившись у кріслі. У вас будуть вільні руки. Якщо мікрофон хороший і вловлює навіть віддалені або тихі звуки, вам не потрібно сидіти поруч із ним. Ви можете одночасно «розмовляти» з комп'ютером та записувати конспект у зошиті, малювати, тримати щось. Та хоч шити та в'язати. З командами взаємодіяти із ПК набагато легше. Для активації деяких подібних утиліт потрібно натискати на клавіатурі, що не дуже зручно.

Але є й негативні аспекти. Якщо ви випадково скажете слово-команду, відкриється зовсім не потрібна зараз програма або оглядач не доречно перейде на якийсь сайт. Чим користуватися і чи взагалі користуватися - вирішувати вам.

Сьогодні мова піде про нашу мову. Хотілося б вам керувати комп'ютером голосомбез допомоги пальців? А, як це кажуть, силою думки! Правда, ми не керуватимемо комп'ютером силою думки, але ось силою голосу цілком реально.

Програма Typle— це одна з найкращих на сьогоднішній день програма для керування комп'ютером через голос. На сайтах у коментарях до цієї програми думки сходяться.

Щоправда є свої недоліки. Але про це трохи згодом. До речі, якщо вас цікавить читайте мій огляд.

Завантажити програму можна тут: http://freesoft.ru/typle

Як її використовувати? Спочатку запустимо її і подивимося головні кнопки управління:

Програма вітає нас і відразу нам даються підказки, як використовувати Typle. Спочатку натиснемо кнопку «додати» і запишемо слово, наприклад «відкрий». Для цього промовимо це слово в мікрофон:

Потім тиснемо додати. Отже, ми зберегли у програмі своїм голосом слово «Відкрий». Ви можете говорити у мікрофон будь-які інші слова. Головне – не заплутатися.

Наступним кроком буде додавання команд. Для цього перейдемо до цього пункту:

Потім ми встановлюємо галочку навпроти того пункту, який нам потрібен:

Вибираємо програму, програму або дію і натискаємо на червону кнопку запису. Якщо комп'ютер сприйняв наш голос, тиснемо «Додати»:

І тепер буде видно у нашому профілі одну голосову команду. В даному випадку та, яка відкриває 7-Zip:

І тепер, натиснувши на завершальну кнопку «почати говорити»

говоримо фразу «відкрий Севен Зіп». У моєму випадку все спрацює. І програма 7-zip відкриється. Пам'ятаєте таку фразу: Цим цим відкрийся? Ось це щось приблизно таке саме.

Програма не завжди працює адекватно. Зараз могутня російська мова не до кінця вивчена програмістами-лінгвістами… Але все-таки приємно, коли тебе слухається комп'ютер.

Тому для тестування та банальної цікавості програма Typle підійде на всі 100%.

У цьому відео можна побачити історію створення перших голосових движків і те, над чим нам слід попрацювати:

Є такі страшні назви інших аналогів програми, як Горинич, Перпетуум, Диктограф, Voice Commander. Але всі вони – «не того». Не проходять критики гідної програми.

На освоєння цієї програми у мене пішло 5 хвилин. Це досить тривалий час (в основному, в таких програмах я розуміюся за 1-2 хвилину). Якщо виникнуть запитання, пишіть. До швидких зустрічей, друзі :)!

У ході чергової спроби реалізувати ідеї з фантастичних фільмів техногіганти один за одним розпочали роботу над віртуальними асистентами. На конференції Google I/O 2016 компанія представила Google Assistant, а також аналог Amazon Echo – домашній голосовий помічник Google Home.

Остання з великих компаній входить у гонку віртуальних помічників. Давайте розберемося, які має конкуренти (зокрема і серед стартапів).

10 віртуальних помічників: огляд

Олексій Зіньков

Спочатку згадаємо, що таке Google Now.

Голосовий пошук Google/Google Now

особливості:Швидкий. Вкрай точний при створенні маршрутів. Лякає своєю поінформованістю про ваші перельоти, бронювання та інші подробиці. з деякими сторонніми додатками: керувати нотатками, повідомленнями та відтворенням музики.

Недоліки:Іноді набридає надмірна ініціативність (наприклад, показує результати ігор команд, які вам нецікаві, або маршрути додому з відомих місць). Марний при управлінні «розумним будинком». Робота над інтеграцією зі сторонніми програмами, схоже, призупинилася.

Рівень людяності:Нульовий. Не сприяє спілкуванню. Він не має навіть імені, крім Google.

Резюме:Великі запаси особистих даних і доступ до пошукового движка, в теорії, повинні були зробити Google лідером галузі, проте компанія поки що навіть не змогла зрозуміти, як використовувати свої переваги та створити асистента, який може зрозуміти користувача. На сьогодні Google Now та голосовий пошукна рівних суперничають із Siri, але нового рівня розвитку поки що не досягли.

А тепер – про конкурентів.

Apple Siri

Що:Голосовий помічник, який вміє розмовляти з юзером і давати проактивні поради. Активується довгим натисканням на кнопку «Додому» на iPad. Нещодавно з'явилася підтримка асистента на Apple TV та Apple Watch.

особливості:Легко користуватися пристроями з iOS. Розуміє природне мовлення. Добре обізнаний про новини, погоду, спорт, кіно, маршрути та місцеві компанії. Може підказати, що можна подивитися по телевізору. Вміє взаємодіяти з деякими елементами «розумного дому».

Недоліки:Не вміє взаємодіяти з більшістю інших програм та сервісів. Працює повільніше за деяких конкурентів.

Рівень людяності:Не здатний підтримувати повноцінну розмову, але у певні моменти демонструє свою мудрість. Жіночий голос звучить порівняно по-людськи.

Недоліки:Відмінно почувається на Windows - платформі, яка найменше цікава розробникам, а, можливо, і користувачам. Користуватися помічником на Android та iOS складніше, а функцій менше.

Рівень людяності:Любить жарти, особливо банальні. Має напоготові довгий список дотепних відповідей на загальні питання. Може читати витяги із Шекспіра.

Резюме:Після кількох років перебування в тіні Siri та Google Cortana стала набагато цікавішим чат-ботом. У Microsoft хочуть зробити своє голосового помічникабазовим інтелектом для всіх інших роботів, здатним керувати вашими подорожами, зустрічами, списками справ та іншими речами, а також збільшити рівень інтеграції з іншими продуктами Microsoft, наприклад, з Office. Компанія ставить собі за мету створити нову оболонку для обчислювальних технологій епохи пост-ПК, але поки рано судити, вийде вона це чи ні.

Facebook M

Що:Частково управляється, частково людьми, і поки що перебуває у розробці. M буде помічником з текстовим управлінням у середовищі Facebook Messenger.

особливості:Постарається зробити все, що ви попросите.

Недоліки:Поки що не є готовим продуктом, і ще довго не стане. Доступний лише невеликій кількості користувачів у Сан-Франциско.

Рівень людяності:Вкрай високий, оскільки у формуванні відповідей на питання братимуть участь люди. За даними Wired, у компанії сподіваються, що з часом M навчиться у цих операторів і зможе працювати незалежніше.

Резюме:На даний момент M – це трохи більше, ніж просто ідея. Але, враховуючи інтерес Facebook до чат-ботів загалом, буде не дивно, якщо саме M зрештою стане надінтелектом.

X.ai

Що:Один із небагатьох віртуальних асистентів, які мають лише одну функцію. Працює тільки через e-mail, де може призначати зустрічі на ваше прохання.

особливості:Знає ваш розклад та переваги, домовляється з іншими учасниками за вас.

особливості: Viv обіцяють, що їхній продукт зможе розуміти складні питання, такі як: «Чи буде температура біля мосту “Золоті ворота” вище 20 градусів післязавтра після 5 години вечора?». Ведеться робота щодо забезпечення сумісності із сторонніми додатками.

Недоліки:Поки що окрім підготовлених презентацій немає доказів, що все працює саме так, як заявлено.

Рівень людяності:Візуальні засоби та конкретні відповіді цінує вище, ніж докладний опис. Наявність дотепності під питанням.

Недоліки:Можливості інтеграції зі сторонніми програмами обмежені, а відкрити сервіс безпосередньо на iOS або Android неможливо. Запити, які помічник не може розпізнати, перенаправляються на Ask.com.

Рівень людяності:Не сприяє довгим розмовам, але вміє відповідати на додаткові питання.

Резюме:Схоже що мобільні додатки Hound насправді існують тільки для того, щоб показати можливості сервісу Houndify (додавання функції голосового асистента в будь-які програми - прим. ред.), який SoundHound планує продавати іншим компаніям. Якщо все вийде, ми навіть не знатимемо, що користуємося саме ним.

Ozlo

Що:ІІ, головна функція якого на даний момент – пошук кафе, барів та ресторанів. Доступний для обмеженої кількості користувачів.

особливості:Знаходить та об'єднує дані з кількох джерел, серед яких Yelp та Foursquare, а потім подає все у формі зручних карток. Намагається спілкуватися, задаючи і відповідаючи на додаткові запитання, наприклад, «які місця відкриті зараз?». або «що у них у меню?»

Недоліки:Обмежені можливості, якщо творці Ozlo не додадуть нові функції. Під час навчання ІІ сильно залежить від користувачів.

Рівень людяності:Уникає зайвих люб'язностей, лише коротко вітає на ім'я.

Резюме: Ozlo нічим не відрізнявся б від багатьох інших чат-ботів, якби в ньому не було перспектив створення чогось більшого. Здатність поєднувати дані з кількох джерел у єдиній видачі унікальна, проте поки що неясно, чи зможуть розробники реалізувати весь потенціал, про який заявляють. А поки що бізнес-план Ozlo обмежується лише додатком, зі збором необхідних для навчання даних можуть виникнути проблеми.

SpeakToIt Assistant.ai

Що:Одна з багатьох копій Siri. У магазині програм пошук за запитом Siri видає безліч подібних програм, наприклад Voice Commands, Voice Secretary та Assistant.

особливості:Мало чим відрізняється від Siri, але може вивчити команди користувача для активації списку функцій.

Недоліки:Не такий корисний, як вбудований помічник у вашому телефоні, і не так комфортний.

Рівень людяності:Звучить досить неприродно, але зображує себе як асистент-людина, чия стать і зовнішній виглядможна міняти.

Резюме:Деякі з цих клонів Siri виглядають пережитком минулого, коли не всі моделі iPhoneмогли працювати з фірмовим асистентом від Apple і потребували заміни. У будь-якому випадку, схоже, що їхні творці усвідомлюють, що такий підхід не дозволить досягти успіху. Наприклад, SpeakToIt перейшли до створення набору інструментів, за допомогою яких інші розробники могли б створити своїх чат-ботів.