Page 1 of 1

Программы распознавания речи. Перевод речи в текст.

PostPosted: 03 Jul 2012, 17:46
by Nibiru

Программы распознавания речи.
Перевод речи в текст - возможно ли это?


Работа с текстом предполагает набор больших его объемов на клавиатуре. Как могли бы ускорить работу копирайтеров, авторов книг, переводчиков и других людей программы преобразования речи в текст, позволяющие просто надиктовывать текст в редактор!

Существует много софта такого рода, в том числе и для русского языка. Но стоит ли его использовать, работает ли он? Ответ – нет.

Наиболее удачными оказались разработки в этой области для английского языка, потому что он довольно прост по сравнению с другими. Но даже эти программы являются хоть и успешными, но все же экспериментами, потому что не обеспечивают стопроцентного распознавания.

С русским языком все намного сложнее. Сейчас не существует ни одной программы распознавания речи, позволяющей достичь хоть какого-то приемлемого результата. Не верьте рекламе, утверждающей, что с помощью их продукта вы сможете набирать по 500 знаков в минуту. На деле все наоборот – вы будете тщетно пытаться добиться «угадывания» программой простейшего слова, произнося его множество раз.

Даже если вы создадите для работы программы идеальные условия, которые она запрашивает – хорошая звуковая карта, качественная гарнитура (наушники + микрофон), отсутствие посторонних шумов, четкое членораздельное произношение слов, подстройка под ваш голос – все равно пользы от нее не будет.

Русскоязычные программы для перевода речи в текст – это популярный (но отнюдь не полезный) Горыныч, Диктограф (или Микросервис), Перпетуум-Мобиле, Комбат. Если хотите побаловаться, можете скачать их и попробовать.

Довольно впечатляющие результаты показывает «Программа пофонемного распознавания речи». Но она не позволяет переводить распознанные слова в текстовый редактор. Она распознает только слова, уже имеющиеся в ее словаре, а это около двадцати слов. Словарь можно самостоятельно дополнять, но для этого нужно записать в специальный файл транскрипцию слова, используя особенные обозначения фонем. Это очень долго и не имеет смысла, раз уж нельзя диктовать в редактор. Если дописать модуль перевода распознанных слов в текст, научить программу распознавать речь без выдержки пауз между словами (а это и есть самая сложная задача) или хотя бы сделать требуемые паузы минимальными и создать большой словарь, то может получиться высококачественный программный продукт.

В нынешнее время достижения в области речевых технологий (этим занимаются многие предприятия), эффективно используемые на практике, не связаны с диктовкой текста. Индустрия речевых технологий ориентирована на голосовую идентификацию пользователей (пароли и безопасность), управление различными электронными устройствами (от персонального компьютера до самолета) с помощью голоса, программы для незрячих, шумоочистку, логопедию и др. Даже лидер в этой области, российская компания «Центр речевых технологий», работающая уже более двадцати лет, не берется (во всяком случае, пока) за выпуск программного обеспечения по переводу речи в текст.

Так что пока остается учиться быстро печатать и надеяться на лучшее.