Набор текста голосом: проверенные программы и онлайн-сервисы

Развитие технологий распознавания речи предоставляет пользователям новые возможности взаимодействия с различными устройствами. Понемногу привыкаем к голосовым помощникам, но с помощью голоса можно не только узнавать погоду или включать музыку, но и писать большие объемы текста.

Содержание

1 Что такое голосовой ввод текста
2 Проверка и настройка микрофона
3 Программы для голосового ввода
4 Веб-сервисы и приложения для голосового ввода

Что такое голосовой ввод текста

Голосовой ввод текста — это функция, основанная на технологии распознавания речи. Программа голосового ввода берет произносимые слова и преобразует их в письменный текст.

Не путайте голосовой ввод с голосовым управлением. Вторая технология позволяет пользователю без помощи рук выполнять любые действия на устройстве, например включать музыку или запускать приложения. Голосовой ввод, с другой стороны, решает более ограниченную задачу: набор текста с помощью голоса.

Голосовой ввод применим в разных ситуациях:

перевести аудиофайлы в текстовый формат, например, расшифровать интервью или записать лекцию;
сохраняем большой объем устного текста в файл, ведь мы говорим гораздо быстрее, чем пишем;
для преодоления физических ограничений, когда невозможно набирать текст на клавиатуре.

Чтобы использовать голосовой ввод, вам нужен только микрофон. Владельцы ноутбуков могут использовать встроенный микрофон на устройстве, а владельцы настольных компьютеров могут использовать микрофон на веб-камерах, которые подключаются к ПК.

В принципе, для голосового ввода подойдет любой микрофон, если говорить четко и не слишком быстро. Никакой специальной аппаратной настройки также не требуется. Достаточно убедиться, что система воспринимает звук через микрофон.

Проверка и настройка микрофона

Прежде всего, подключите микрофон к компьютеру. Если вы хотите использовать встроенное устройство или веб-камеру ноутбука, вам не нужно ничего подключать. Затем найдите значок динамика на панели уведомлений. Его можно скрыть под галочкой.

значок динамика в трее

Щелкните правой кнопкой мыши значок динамика и выберите «Записывающие устройства». Появится список оборудования, которое можно использовать для записи звука. Ваш микрофон также должен быть в этом списке, независимо от того, подключен ли он отдельно или встроен в ноутбук.

выбрать записывающее устройство

Если список записывающих устройств пуст, щелкните правой кнопкой мыши пустое место и установите флажки «Показать отключенные устройства» и «Показать отключенные устройства». После того, как микрофон появится в списке, нажмите правой кнопкой мыши на его меню и выберите опцию «Активировать». Также убедитесь, что он установлен в качестве устройства по умолчанию.

включи микрофон

Убедиться, что система улавливает звук с микрофона, очень просто: скажите ему что-нибудь. Если справа появятся зеленые полосы, все готово для голосового ввода. Попробуйте говорить тише или громче — вы заметите, как меняется количество зеленых полосок в зависимости от громкости голоса.

индикатор громкости голоса

При желании можно попробовать изменить настройки микрофона по умолчанию, добившись некоторого улучшения качества записи. Для этого:

Щелкните правой кнопкой мыши микрофон.
Откройте его свойства.
Перейдите на вкладку «Уровни».
Установите громкость и усиление на максимум.
Откройте вкладку «Улучшения».
Включите шумоподавление и эхоподавление.

Количество вариантов обновления зависит от того, какая звуковая карта установлена в вашем компьютере. К сожалению, некоторые из них не имеют никаких настроек, кроме регулировки громкости и усиления. Но для голосового ввода это не критично; главное, что система в принципе воспринимает звук через микрофон.

Программы для голосового ввода

Если вы планируете использовать голосовой ввод постоянно, то наиболее удобным решением будет установка одной из программ, предоставляющих такую возможность.

Dictate для MS Office

В 2017 году разработчики Microsoft выпустили плагин Dictate. Он доступен для бесплатной установки на Windows 8.1/10 в MS Office 2013 и более ранних версиях. После установки Диктата в Word, PowerPoint и Outlook появляется дополнительный раздел, позволяющий включить микрофон и использовать распознавание речи для чтения текста.

Через какое-то время Microsoft прекратила поддержку плагина, интегрировав распознавание речи в Office 365 и Windows 10. Если вы используете эту версию пакета приложений, вы сможете без проблем проговаривать любой текст через микрофон.

Как это сделать:

Открытое слово.
Нажмите комбинацию клавиш Win+H.
Нажмите на значок микрофона и продиктуйте текст.

Распознавание работает, только если соответствующая функция включена в «Параметры:

включить распознавание речи в word

Несмотря на заявленную поддержку русского языка, качество его распознавания оставляет желать лучшего. Программа правильно пишет простые предложения, но часто спотыкается на сложных предложениях. Так что даже не стоит рассчитывать говорить бесконечно: для получения приемлемого результата нужно делать паузы и четко произносить все окончания. Распознавание аудиофайлов здесь не поддерживается; для этого нужны другие программы.

Расширение Dictate больше нельзя скачать с официальной страницы Microsoft, но оно остается на других сайтах. Однако загрузка из сторонних источников может быть опасной из-за вирусных угроз. Если у вас нет подписки на Office 365, мы рекомендуем использовать другое программное обеспечение для голосового ввода.

MSpeech

MSpeech — простая программа для обработки речи и преобразования речевого потока в текст, способная распознавать более 50 языков, включая русский.

После установки и запуска сворачивается в системный трей. Чтобы вызвать ее оттуда, щелкните правой кнопкой мыши значок программы и выберите опцию «Показать».

голосовое управление

Для управления записью здесь используются две кнопки: «Старт» и «Стоп».

Самые важные функции программы скрыты в ее настройках. Нажмите на одноименную кнопку, чтобы перейти в этот раздел. Здесь вы можете:

Включите автоматический запуск приложения вместе с системой.
Выберите основной и дополнительный языки распознавания.
Установите свои собственные команды для запуска других программ. Например, ключевое слово «Интернет» откроет Mozilla Firefox.
Назначьте горячие клавиши для управления записью.
Включить передачу текста в другие программы: редакторы, офисные приложения, браузеры и т.д.

голосовые настройки

Для работы Mspeech требуется подключение к Интернету, поскольку он использует API Google Voice.

Speechpad

Speechpad — это служба, которую можно использовать в браузере или интегрировать с операционными системами Windows и Linux для добавления голосового ввода в другие программы, такие как Блокнот или офисные приложения.

Если вы хотите использовать голосовой ввод в Google Chrome, в том числе писать сообщения и заполнять другие формы, выполните следующие действия:

Установите расширение Speechpad в Chrome.
После установки нажмите на иконку плагина на верхней панели, чтобы открыть его настройки.
Выберите язык голосового ввода.
Нажмите «Сохранить» и перезапустите браузер.
Откройте любой сайт с текстовой формой. Это может быть поисковая строка Яндекса или диалог в социальной сети.
Щелкните правой кнопкой мыши на поле и выберите опцию «Speechpad».

Если голосовой ввод поддерживается, форма станет розовой. Также необходимо дать разрешение на использование микрофона, после чего можно будет диктовать текст.

голосовой ввод текста вконтакте

Чтобы распространить сервис на другие Windows-приложения, необходимо установить дополнительный модуль интеграции.

Скачайте модуль и распакуйте архив.
Запустите файл install_host.bat.
Подпишитесь на голосовую почту.
Войдите в свою учетную запись и нажмите кнопку «Включить пробный период».
Откройте веб-сайт голосового блокнота.
Установите флажок «Интеграция с ОС».
Нажмите «Включить запись».
Запустите любое приложение с помощью текстового редактора (например, Word) и надиктуйте текст.

Интеграция с системой является платной услугой. Вы можете проверить его работу без покупки лицензии, но для постоянного использования необходима подписка: один месяц — 100 рублей, 3 месяца — 250 рублей, 1 год — 800 рублей.

Voco

Voco — это платное приложение Windows для распознавания речи и преобразования ее в текстовый формат. Он даже поддерживает пунктуацию с помощью специальных команд.

голосовой ввод в воко

Эта программа использует встроенные словари для проверки орфографии. Кроме того, вы можете научить его новым выражениям, поделившись своими письмами и документами.

повысить точность распознавания

Стоимость лицензии:

Базовый — 1718 руб. Бесплатные обновления в течение 1 года. Продление подписки на обновления — 559 рублей ежегодно.
Профессиональный — 14 136 руб. Продление подписки на обновления — 4937 рублей ежегодно.
Компания — от 50 749 руб. Продление подписки на обновления — 17 786 рублей ежегодно.

Voco.Basic идеально подходит для домашнего использования. Однако он не распознает аудиозаписи или тематические словари. Эти функции доступны только в более ранних версиях.

Веб-сервисы и приложения для голосового ввода

Чтобы время от времени использовать голосовой ввод, вы можете сделать это без установки специальных программ на свой компьютер. Скорее всего, вас устроят возможности веб-сервисов и расширений для браузера.

Google Docs

Простой инструмент голосового ввода доступен в Google Docs, сервисе для работы с текстовыми документами. Вам просто нужно иметь учетную запись Gmail, чтобы использовать его.

Как использовать голосовой ввод в Документах Google:

Откройте сайт поисковой системы Google.
Войдите в свою учетную запись Google или зарегистрируйте новый профиль.
Нажмите на пунктирный квадрат, чтобы открыть меню услуг.
Нажмите «Еще», чтобы увидеть полный список.
Перейдите в «Документы».
В поле «Создать документ» нажмите «Пустой файл».

На экране появится текстовый редактор Google. Чтобы включить голосовой ввод, разверните меню «Инструменты» и выберите соответствующую опцию. Слева появится виджет с микрофоном. Выберите язык, на котором вы будете говорить, а затем щелкните значок микрофона, чтобы включить распознавание. Значок должен стать красным. Если браузер запрашивает разрешение на использование микрофона, предоставьте его.

Запуск голосового ввода также доступен с помощью сочетания клавиш Ctrl+Shift+S. Функция работает с набором языков по умолчанию.

нажми на кнопку и говори

После настройки начните говорить — Google Docs распознает вашу речь и преобразует ее в текст. Произносить знаки препинания и новую строку в словах, четко произносить окончания слов; иначе придется долго исправлять текст.

Speechpad

Speechpad — это бесплатный сервис, который работает только в браузере Chrome. Выше мы описали, как настроить интеграцию с Windows. Впрочем, для написания небольшого фрагмента текста это и не обязательно: веб-интерфейс голосового блокнота отлично справится с этой задачей.

Откройте сайт Speechpad.ru.
Прокрутите главную страницу до окна редактора.
Выберите язык ввода.
Нажмите кнопку «Включить запись» и разрешите использование микрофона.
Диктовать текст.

печатать на голосовой клавиатуре

Рядом с кнопкой «Включить запись» вы увидите окно предварительного просмотра. Показывает, что будет добавлено в документ.

Вы можете ставить знаки препинания и переходить на новую строку своим голосом или кнопками, расположенными между полем предварительного просмотра и редактором. При наведении курсора на каждую кнопку появляется текст голосовой команды, к которой она применяется, например «вопросительный знак» или «открывающая квадратная скобка».

Окончательный документ доступен для скачивания в формате TXT.

VoiceNote

VoiceNote — еще одна служба преобразования речи в текст, которая работает только в Google Chrome. При попытке запустить его в другом браузере появляется сообщение об ошибке.

Для голосового ввода через VoiceNote вы можете использовать живую демонстрацию или отдельное приложение Chrome.

Как использовать голосовую заметку:

Откройте редактор.
Нажмите на значок глобуса и выберите язык ввода.
Нажмите на значок микрофона.
Разрешить использование записывающего устройства.
Диктовать текст.

Голосовая заметка

Правила ввода здесь стандартные: знаки препинания можно произносить в словах, а также переводить текст на новую строку голосом.

Полученный документ доступен для сохранения в формате TXT.

TalkTyper

TalkTyper — онлайн-редактор голосового ввода. Его главное преимущество — поддержка 37 языков. Однако TalkTyper, как и сервисы выше, работает только в Google Chrome.

Обсуждение Typer

Принцип ввода текста в этом редакторе ничем не отличается от других: вы указываете язык, нажимаете на значок микрофона и разрешаете его использование. Знаки препинания и новая строка произносятся в словах.

Результат обработки текста в TalkTyper можно сохранить в виде документа в формате TXT, скопировать в буфер обмена, распечатать, отправить по электронной почте, твитнуть и перевести на другой язык.

Voice Notepad

Голосовой блокнот — это еще одна служба преобразования речи в текст, которая работает только в Chrome. Поддерживает более 120 языков ввода. В остальном его функционал аналогичен вышеперечисленным сервисам: голосовая пунктуация, сохранение документа в формате TXT, копирование в буфер обмена, отправка по почте или печать и т.д.

Голосовой блокнот

Особенность онлайн-сервисов в том, что все они работают только в Google Chrome. Это связано с тем, что они основаны на лицензированной Google технологии распознавания речи. Другие браузеры не поддерживают его или поддерживают с ограничениями. Например, Speechpad можно запустить в Яндекс.Браузере, но во внешней среде он часто работает с ошибками. Так что если вы не пользуетесь Google Chrome, проще всего установить на компьютер одну из программ голосового ввода и забыть о хлопотах.