Для людей с ограниченными возможностями, а также просто для сибаритов, разработчики ОС создали голосовое управление компьютером. Оно позволяет пользователю вводить информацию при помощи голоса. После проговаривания определенных слов устройство начинает распознавание речи - преобразование звукового сигнала в цифровую информацию. После того, как введенная информация будет корректно распознана – программа переходит к заданному алгоритму действия – выполняет функцию, которая прикреплена к той или иной команде.

Все достаточно просто. Не всегда речь распознается корректно, поэтому для решения сложных задач по управлению операционной системой программа голосового управления компьютером интенсивно не используется. Она применяется для выполнения основных функций: открытия и закрытия файлов, локального и сетевого поиска и пр.

История развития голосового управления

  • Первая система распознавания голоса Audrey была создана в 50-х годах ХХ века. Она расшифровывала лишь цифры, проговоренные одним голосом.
  • В 1962 г была создана первая система распознавания слов. Она расшифровывала 15 англоязычных слов.
  • С развитием компьютеров в 1990 г была разработана программа Dragon Dictate. Она распознавала до 100 слов в минуту, но отличалась высокой ценой.
  • В начале 2000-х годов в iPhone появилось приложение для распознавания речи Google Voice Search. В 2010 году была добавлена система поиска в Android.
  • Siri была включена в программное обеспечение Phone 4S в начале октября 2011 г;
  • в 2014 г была представлена Cortana - голосовая помощница для Windows.

Возможности Cortana и голосового ввода на сегодняшний день

«Кортана» - это виртуальный помощник в операционной системе Windows. Сервис помогает пользователю в планировании дел, напоминает о них.
При определенном запросе сервис поможет собрать конкретную информацию, создать четкую структуру и преподнести ее пользователю в максимально возможно обработанном виде.
Интересно, что сразу при включении виртуальный помощник собирает всю информацию о введенных запросах, личных данных, пытаясь максимально адаптироваться под каждого отдельного пользователя.


Голосовое управление компьютером Windows 7 посредством использования виртуального помощника невозможно – он интегрирован только в десятую версию. Но, как ни жаль, разработчики не удосужились выпустить русскоязычную версию.
Главную роль отыгрывает поиск, который в 10-ке можно открыть через «Пуск». Эта функция определяет практически любые запросы. Если вхождение не распознано – можно ввести соответствующую команду во всплывающее окно и программа голосового управления компьютером считает текстовую информацию.

Неприятный момент – сбор всех данных, введенных через клавиатуру, и их отправка в «Майкрософт».

Сторонние программы

Typle

После выполнения установки переходим к следующему шагу – создаем учетную запись. Здесь необходимо придумать ключевую фразу, после чего прозвучит уведомление об активации.


Дальше нужно будет придумать и создать голосовые команды, независимо от их предназначения. Команда «собака» может запускать приложение или выполнять совсем другое действие.




Просто нужно создать голосовую команду и закрепить ее за определенным действием. Подойдет только для выполнения базовых операций – открытия файлов, папок и пр. Функционал ограничен.

Speaker

Здесь функционал более широкий, нежели в Typle.


Голосовое управление компьютером Windows 10 предоставляет пользователю возможность открывать и закрывать файлы, делать снимки состояния экрана, выключать ПК.


Распознавание речи происходит довольно долго, свыше 3-4 секунд. Это обусловлено тем, что сначала речь преобразуется в текст, а команды распознаются компьютером уже с текстовой информации.

Laitis

Это бесплатная программа, которая позволяет как управлять ПК, так и диктовать текст. После установки необходимо зарегистрироваться и дальше можно пользоваться в свое удовольствие.


Интересна функция автозамены при наборе текста. Вы можете сказать «Кавычки» и в тексте появится соответствующий символ.

Возможности управления голосом через Яндекс.строку

Посредством использования этого приложения можно выполнять локальный или сетевой поиск информации и файлов, перезагрузить или выключить компьютер. Присутствует функция открытия программ и сайтов.
Чтобы воспользоваться программой, необходимо сначала скачать и установить ее.

Но при установке стоит убрать галочки напротив пунктов, где производитель софта предлагает установить браузер, поменять его настройки. В противном случае установка займет больше время и в браузере изменится конфигурация.
В конечном итоге строка размещается около кнопки «Пуск». Скажите «Слушай Яндекс» и откроется окно.

Проговорите запрос.

После паузы в браузере откроется строка поиска. Занимательно управлять поиском таким образом.
В целом, голосовое управление компьютером пока не развито, так как рисуется нам в воображении. Но и те функции, что имеются на сегодняшний день, уже впечатляют и существенно помогают перейти на новый уровень пользования ПК.

Отличного Вам дня!

Взаимодействовать с компьютером можно не только при помощи клавиатуры и мыши. Доступно также управление голосовыми командами . Существуют специальные утилиты, которые позволяют это сделать. В их функции входит не только запись текста под диктовку или расшифровка аудиозаписей. Через них можно запускать приложения, использовать их, да и вообще - делать что угодно. Управление компьютером голосом облегчает работу с ПК. Команды передаются оперативно и без лишних усилий. Конечно, если у вас есть микрофон.

Мы познакомим вас с приложениями с подобным функционалом

Такая функция встроена в англоязычную версию Windows. Для её использования у вас должна быть лицензия Enterprise или Ultimate. Но и в русифицированных операционных системах можно настроить управление голосом и диктовку текста. Воспользуйтесь одним из следующих приложений.

С приложением разобраться несложно

Популярная программа. Хотя и имеет свои недостатки. Суть её работы простая: задаёте команду и выбираете, какое действие она должна выполнять. Рассмотрим настройку этого приложения на конкретном примере.

  1. Загрузите и установите его. Есть бесплатная и Premiun версия. Вторую надо покупать, чтобы испробовать её на компьютере.
  2. Запустите утилиту. В ней появится информационное окно с подсказками.
  3. На её панели управления есть много различных функций. Некоторые - с одинаковыми названиями. Надо ориентироваться по картинке, а не по надписи. Нажмите кнопку «Добавить» - на ней изображено лицо.
  4. Задайте имя профиля и ключевое слово, которое будет обозначать команду. К примеру, напишите «открыть», если собираетесь настроить запуск какого-то приложения голосом. Или «перейти на», чтобы мгновенно перейти на какой-то сайт, не вводя его адрес.
  5. Теперь надо записать эту самую команду в виде звукового образа. Нажмите на кнопку с красным кружком. И чётко, внятно произнесите в микрофон нужную фразу.
  6. Подтвердите изменения. Заданная опция появится в списке в окне Typle. Программа запомнит то, что вы записали на её «диктофон».
  7. После этого укажите, что, собственно, ей запускать для выполнения команды. Нажмите кнопку «Добавить», которая похожа на руку с символом «+» (плюс).
  8. Выберите формат данных: файлы/утилиты, интернет-страницы, какие-то внутренние сервисы ОС. Поставьте «галочки» там, где вам нужно.
  9. Найдите то приложение, которое хотите запускать голосом. Пусть это будет, например, Microsoft Word. Так вы сможете очень быстро приступить к редактированию какого-то текста или написанию статьи.
  10. В том же окне запишите вторую часть команды. Чтобы в сумме получилось «открыть Ворд». Первое слово будет активировать Typle, второе - включать привязанную утилиту.
  11. Нажмите «Добавить».
  12. К одной функции «открыть» можно прицепить несколько приложений. Так вы будете управлять их запуском, не прикасаясь к мыши и другим периферийным устройствам, установленным на компьютере.
  13. Если надо, отредактируйте дополнительные параметры.
  14. Чтобы проверить, получилось или нет, нажмите на «Начать говорить» и скажите команду.

Программа работает с русским языком. Но не всегда правильно его распознаёт. Говорить надо громко, чётко, механическим голосом.

  • Не нужны знания английского.
  • Быстрое создание команд.
  • Нет распознавания текста.
  • Ограниченный функционал. Можно лишь открывать утилиты и страницы в интернете.
  • Программа иногда воспринимает посторонние шумы как команды. Из-за этого на ПК происходят странные вещи.
  • Нельзя работать с плеером.

Speechka

Еще одно приложение для управления компьютером

  1. При первом запуске откроется окно с выбором категории: ПК или интернет.
  2. Там же есть пояснение, каким сочетанием клавиш надо активировать утилиту. Это можно изменить в настройках.
  3. Нажмите, к примеру, на «Интернет». Откроется окно с несколькими полями для ввода : для текста команды и для URL сайта. Можно написать слово «Яндекс» и адрес этой страницы.
  4. Кликните «Добавить».
  5. Зажмите клавиши, указанные на главном окне.
  6. Произнесите команду, чтобы утилита её «запомнила».
  • Активация как клавишами, так и по громкости звука.
  • При запуске можно откалибровать микрофон.
  • Ограниченный функционал.

Speaker

Интерфейс выполнен в минималистическом ключе

Команды в приложении настраиваются при помощи печатных слов, а не диктовки. Есть внутренний механизм распознавания текста. Основные функции:

  • Создание скриншотов по команде.
  • Смена раскладки клавиатуры на компьютере.
  • Открытие приложений и файлов.
  • Завершение работы.
  • Можно не делать аудиозапись с командой. Утилита распознаёт надписи.
  • Для управления надо использовать клавиатуру. Если заданная кнопка используется и для других целей - будет неудобно.
  • Нужно стабильное интернет-соединение.

Горыныч

Герой русских народных сказок поможет вам

Программа для управления компьютером голосом «Горыныч» - отечественный продукт. Поэтому там «родной» модуль распознавания речи. Он «приспосабливается» к тембру и интонациям пользователя. С утилитой можно полноценно работать в системе, а не просто открывать файлы и веб-страницы.

  • Есть поддержка русского и английского языков.
  • Распознавание текста, голосовой ввод в любые редакторы.
  • Расширенный функционал.
  • Надо самостоятельно создавать команды для каждого процесса. В буквальном смысле придётся записывать словарь.

Windows Speech Recognition

Встроенная в английскую ОС программа. Для её использования у вас должен быть установлен соответствующий языковой пакет. Русские команды с ней работать не будут. Чтобы управлять ПК с её помощью, придётся говорить на её языке. Для получения доступа к ней в Панели настроек Windows откройте меню «Язык и региональные стандарты » (оно находится в категории «Часы, язык, регион») и во всех вкладках установите «Английский». Если всё правильно, и у вас установлен необходимый языковой пакет, Windows «превратится» в английскую, и утилита станет доступна. Лучше не пробовать данные метод, если вы плохо знаете чужой язык.

Данный способ подойдет в том случае, если вы владеете английским

Прочие утилиты

Есть ещё ряд приложений для управления такими командами:

  • Расширения для браузеров. Облегчают сёрфинг по сети. В Google Chrome уже встроена подобная функция - голосовой ввод в поисковые формы. Эта опция есть на некоторых онлайн-картах. Она позволяет быстрее найти адрес.
  • VoiceType.
  • RealSpeaker.
  • Web Speech.

Список программ для распознавания текста и записи под диктовку

Управлять голосом - это, конечно, хорошо. Но могут оказаться полезными утилиты для распознавания текста и печати под диктовку. При составлении объёмных докладов, дипломов легче записывать свои мысли, озвучивая их в микрофон на компьютере. Вот несколько таких утилит:

  • Диктограф.
  • Dragon Naturally Speaking.
  • Перпетуум-Мобиле.

Продукт, позволяющий диктовать текст компьютеру

В ОС можно настроить голосовые команды . Для этого на компьютере должна быть установлена соответствующая программа. С ней вы сможете работать на ПК, лёжа на диване или развалившись в кресле. У вас будут свободны руки. Если микрофон хороший и улавливает даже отдалённые или тихие звуки, вам не потребуется рядом с ним сидеть. Вы можете одновременно «разговаривать» с компьютером и записывать конспект в тетради, рисовать, держать что-то. Да хоть шить и вязать. С командами взаимодействовать с ПК намного легче. Для активации некоторых подобных утилит нужно нажимать кнопки на клавиатуре, что не очень удобно.

Но есть и отрицательные аспекты. Если вы случайно скажете слово-команду, откроется совершенно не нужное сейчас приложение или обозреватель не к месту перейдёт на какой-то сайт. Чем пользоваться и пользоваться ли вообще - решать вам.

Сегодня речь пойдет о нашей речи. Хотелось бы вам управлять компьютером голосом , без помощи пальцев? А, как это говорят, — силой мысли! Правда, мы не будем управлять компьютер силой мысли, но вот силой голоса вполне реально.

Программа Typle — это одна из лучших на сегодняшний день программа для управления компьютером через голос. На сайтах в комментариях к этой программе мнения сходятся.

Правда есть свои недочеты. Но об этом чуть позже. Кстати, если вас интересует — читайте мой обзор.

Скачать программу можно здесь: http://freesoft.ru/typle

Как же ее использовать? В начале запустим ее и посмотрим главные кнопки управления:

Программа нас приветствует и сразу нам даются подсказки, как использовать Typle. В начале нажмем кнопку «добавить» и запишем слово, например «открой». Для этого произнесем это слово в микрофон:

Затем жмем добавить. Итак, мы сохранили в программе своим голосом слово «Открой». Вы можете говорить в микрофон любые другие слова. Главное — не запутаться.

Следующим шагом будет добавление команд. Для этого перейдем в этот пункт:

Потом мы устанавливаем галочку напротив того пункта, который нам нужен:

Выбираем программу, приложение или действие и нажимаем на красную кнопку записи. Если компьютер воспринял наш голос, жмем «Добавить»:

И теперь будет видна в нашем профиле одна голосовая команда. В данном случае та, которая открывает 7-Zip:

И теперь, нажав завершающую кнопку «начать говорить»

говорим фразу «открой Севен Зип». В моем случае, все сработает. И программа 7-zip откроется. Помните такую фразу: Сим сим откройся? Вот это что-то приблизительно такое же.

Программа не всегда работает адекватно. Сейчас могучий русский язык не до конца изучен программистами-лингвистами… Но все-таки приятно, когда тебя слушается компьютер.

Поэтому для тестирования и банального любопытства программа Typle подойдет на все 100%.

В этом видео можно увидеть историю создания первых голосовых движков и то, над чем еще нам следует поработать:

Есть такие страшные названия других аналогов программы, как Горыныч, Перпетуум, Диктограф, Voice Commander. Но все они — «не того». Не проходят критику достойной программы.

На освоение этой программы у меня ушло 5 минут. Это довольно-таки длительное время (в основном, в таких программах я разбираюсь за 1-2 минуту). Если возникнут вопросы — пишите. До скорых встреч, друзья:)!

В ходе очередной попытки реализовать идеи из фантастических фильмов техногиганты один за другим приступили к работе над виртуальными ассистентами. На конференции Google I/O 2016 компания представила Google Assistant, а также аналог Amazon Echo - домашний голосовой помощник Google Home.

Последняя из крупных компаний вступает в гонку виртуальных ассистентов. Давайте разберемся, какие у нее есть конкуренты (в том числе и среди стартапов).

10 виртуальных ассистентов: обзор

Алексей Зеньков

Для начала вспомним, что такое Google Now.

Голосовой поиск Google/Google Now

Особенности: Быстрый. Крайне точен при создании маршрутов. Пугает своей осведомленностью о ваших перелетах, бронированиях и других подробностях. с некоторыми сторонними приложениями: управлять заметками, сообщениями и воспроизведением музыки.

Недостатки: Иногда надоедает излишней инициативностью (например, показывает результаты игр команд, которые вам неинтересны, или маршруты до дома из известных мест). Бесполезен при управлении «умным домом». Работа над интеграцией со сторонними приложениями, похоже, приостановилась.

Уровень человечности: Нулевой. Не располагает к общению. У него нет даже имени, кроме Google.

Резюме: Обширные запасы личных данных и доступ к поисковому движку, в теории, должны были сделать Google лидером отрасли, однако компания пока даже не смогла понять, как использовать свои преимущества и создать ассистента, который может понять пользователя. На сегодня Google Now и голосовой поиск на равных соперничают с Siri, но нового уровня развития пока не достигли.

А теперь - о конкурентах.

Apple Siri

Что: Голосовой ассистент, который умеет разговаривать с пользователем и давать проактивные рекомендации. Активируется долгим нажатием на кнопку «Домой» на и iPad. Недавно появилась поддержка ассистента на Apple TV и Apple Watch.

Особенности: Легко пользоваться на устройствах с iOS. Понимает естественную речь. Хорошо осведомлен о новостях, погоде, спорте, кино, маршрутах и местных компаниях. Может подсказать, что посмотреть по телевизору. Умеет взаимодействовать с некоторыми элементами «умного дома».

Недостатки: Не умеет взаимодействовать с большинством других приложений и сервисов. Работает медленнее некоторых конкурентов.

Уровень человечности: Не способен поддерживать полноценную беседу, но в определенные моменты демонстрирует собственную мудрость. Женский голос звучит сравнительно по-человечески.

Недостатки: Отлично себя чувствует на Windows – платформе, которая меньше всего интересна разработчикам, а, возможно, и пользователям. Пользоваться помощником на Android и iOS сложнее, а функций меньше.

Уровень человечности: Обожает шутки, особенно банальные. Имеет наготове длинный список остроумных ответов на общие вопросы. Может читать выдержки из Шекспира.

Резюме: После нескольких лет пребывания в тени Siri и Google Cortana стала намного более интересным чат-ботом. В Microsoft хотят сделать своего голосового ассистента базовым интеллектом для всех остальных ботов , способным управлять вашими путешествиями, встречами, списками дел и другими вещами, а также увеличить степень интеграции с другими продуктами Microsoft, например, с Office . Компания ставит себе цель создать новую оболочку для вычислительных технологий эпохи пост-ПК, но пока рано судить, получится у нее это или нет.

Facebook M

Что: Частично управляется , частично людьми, и пока еще находится в разработке. M будет ассистентом с текстовым управлением в среде Facebook Messenger.

Особенности: Постарается сделать все, что вы попросите.

Недостатки: Пока еще не является готовым продуктом, и еще долго им не станет. Доступен только небольшому количеству пользователей в Сан-Франциско.

Уровень человечности: Крайне высокий, поскольку в формировании ответов на вопросы будут участвовать люди. По данным Wired, в компании надеются, что со временем M научится у этих операторов и сможет работать более независимо.

Резюме: На данный момент M – это лишь чуть больше, чем просто идея. Но, учитывая интерес Facebook к чат-ботам в целом, будет неудивительно, если именно M в итоге станет сверхинтеллектом.

X.ai

Что: Один из немногих виртуальных ассистентов, имеющих только одну функцию. Работает только через e-mail, где может назначать встречи по вашей просьбе.

Особенности: Знает ваше расписание и предпочтения, договаривается с другими участниками за вас.

Особенности: Viv обещают, что их продукт сможет понимать сложные вопросы, такие как: «Будет ли температура около моста “Золотые ворота” выше 20 градусов послезавтра после 5 часов вечера?». Ведется работа по обеспечению совместимости со сторонними приложениями.

Недостатки: Пока, кроме подготовленных презентаций, нет доказательств, что все работает именно так, как заявлено.

Уровень человечности: Визуальные средства и конкретные ответы ценит выше, чем подробное описание. Наличие остроумия под вопросом.

Недостатки: Возможности по интеграции со сторонними приложениями ограничены, а открыть сервис напрямую на iOS или Android невозможно. Запросы, которые ассистент не может распознать, перенаправляются на Ask.com.

Уровень человечности: Не располагает к долгим беседам, но умеет отвечать на дополнительные вопросы.

Резюме: Похоже, что мобильные приложения Hound на самом деле существуют только для того, чтобы показать возможности сервиса Houndify (добавление функции голосового ассистента в любые приложения - прим. ред.), который SoundHound планирует продавать другим компаниям. Если все получится, мы даже не будем знать, что пользуемся именно им.

Ozlo

Что: ИИ, главная функция которого на данный момент – поиск кафе, баров и ресторанов. Доступен для ограниченного количества пользователей.

Особенности: Находит и объединяет данные с нескольких источников, среди которых Yelp и Foursquare, а затем преподносит все в форме удобных карточек. Пытается общаться, задавая и отвечая на дополнительные вопросы, к примеру «какие места открыты сейчас?» или «что у них в меню?»

Недостатки: Ограниченные возможности, если только создатели Ozlo не добавят новые функции. При обучении ИИ сильно зависит от пользователей.

Уровень человечности: Избегает лишних любезностей, только кратко приветствует по имени.

Резюме: Ozlo ничем не отличался бы от множества других чат-ботов, если бы в нем не было перспектив создания чего-то большего. Способность совмещать данные из нескольких источников в единой выдаче уникальна, однако пока неясно, смогут ли разработчики реализовать весь потенциал, о котором заявляют. А пока бизнес-план Ozlo ограничивается только приложением, со сбором необходимых для обучения данных могут возникнуть проблемы.

SpeakToIt Assistant.ai

Что: Одна из множества копий Siri. В магазине приложений поиск по запросу Siri выдает множество подобных программ, к примеру Voice Commands, Voice Secretary и Assistant.

Особенности: Мало чем отличается от Siri, но может выучить пользовательские команды для активации списка функций.

Недостатки: Не так полезен, как встроенный ассистент в вашем смартфоне, и не так удобен.

Уровень человечности: Звучит довольно неестественно, но изображает себя в качестве ассистента-человека, чей пол и внешний вид можно менять.

Резюме: Некоторые из этих клонов Siri выглядят пережитком прошлого, когда не все модели iPhone могли работать с фирменным ассистентом от Apple и нуждались в замене. В любом случае, похоже, что их создатели осознают, что такой подход не позволит добиться успеха. К примеру, SpeakToIt перешли к созданию набора инструментов, с помощью которых другие разработчики могли бы сделать собственных чат-ботов.