«Камчатский форум» logo

Здравствуйте, гость ( Вход | Регистрация )

 
Ответить · Открыть тему
> Преобразование речи человека в текст, Очень Важно!!!
alse-kam
05.03.2007, 14:04
Сообщение #1


Отличившийся участник
****

Награды: 2
Группа: ?????????
Сообщений: 421
Регистрация: 07.12.2006

Репутация: 3 [ - / + ]


Кто-нибудь сталкивался (использовал) какое-нибудь ПО для преобразования человеческой речи в текст. Интересует любая инфа, особенно личный опыт использования ПО. Программа необходима для слабослышащих людей. Например входящий сигнал через микрофон, а в результате текст на экране. Ну типа субтитров что-ли.
Буду рад любой информации, особенно если есть личный опыт.


--------------------
Ищу человека хорошо знающего математику
Офлайн · Карточка · Приват
^
Капаец
06.03.2007, 7:20
Сообщение #2


Под ноги не смотрит
*******

Награды: 4
Группа: VIP
Сообщений: 2 533
Регистрация: 03.03.2006

Репутация: 28 [ - / + ]


Ищи по словам: система распознавания речи "Горыныч" или " Dragon"
Извини , что без ссылок sad.gif Утро! Время! Побежал!


--------------------
Единственная справка, что ты не можешь - это умер. Всем показываешь - ВОТ! Я сдох!

здесь каждый хочет стать депутатом!
чтоб ездить по штатам и эмиратам...
а я хочу - стать пулей в стволе!
чтоб помнили, суки, всегда обо мне!
Офлайн · Карточка · Приват
^
Ilya V. Rudomilov
06.03.2007, 7:33
Сообщение #3


Путяра, пшёл вон!
*******

Награды: 9
Группа: ??????
Сообщений: 14 825
Регистрация: 30.03.2004

Репутация: 36 [ - / + ]


Цитата
Буду рад любой информации, особенно если есть личный опыт.

На практике сам не использовал, последний раз интересовался темой года 3-4 назад. Тогда лидером по русскому языку был "Горыныч". Почитать информацию и скачать его можно тут - http://art.bdk.com.ru/govor/gorinich.php?a=gorinich Оф. страничка Горыныча - http://www.nd.ru/voice/

Не уверен, что в настоящее время программа продолжает развиваться.

А вообще зачем это вам? На словах все красиво, а вот на деле не выше 60-70% распознавания, причем при очень хороших условиях, ровной и настроенной речи.


--------------------
Обязательно к изучению - мой блог о моей жизни в Чехии! И хватит спрашивать "Почему же Чехия?.." - все ответы описаны уже.
Офлайн · Карточка · Приват
^
L@mer
06.03.2007, 11:45
Сообщение #4


Ветеран
******

Награды: 3
Группа: ??????
Сообщений: 1 368
Регистрация: 25.11.2005

Репутация: 20 [ - / + ]


Изучал данный вопрос, когда P-166/32 - был супер комп. Цель была максимально упростить и автоматизировать ввод текстовой информации. Результат - хорошее владение клавиатурой дает существенно лучший результат. С той поры тему забросил, могу предположить, что алгоритмы стали лучше, но ИМХО дальше команд управления они не прошли.
Цитата

Программа необходима для слабослышащих людей. Например входящий сигнал через микрофон, а в результате текст на экране.

Если можно подробнее о целях и постановке задачи, вполне возможно есть альтернативные варианты реализации в контексте Вашей ситуации.


--------------------
Я бы изменил мир, но бог не дал исходников...
Изображение
Офлайн · Карточка · Приват
^
alse-kam
06.03.2007, 13:18
Сообщение #5


Отличившийся участник
****

Награды: 2
Группа: ?????????
Сообщений: 421
Регистрация: 07.12.2006

Репутация: 3 [ - / + ]


Цитата(Ilya V. Rudomilov @ 06.03.2007, 8:33)

А вообще зачем это вам?


Цитата(LСобакаmer @ 06.03.2007, 12:45)

Если можно подробнее о целях и постановке задачи, вполне возможно есть альтернативные варианты реализации в контексте Вашей ситуации.


Суть проблемы:
большинство слабослышащих людей (я один из них) хуже либо вобще не воспринимают определенный диапазон частот > обычно высокие и часть средних, если не воспринимаются низкие, то это уже полная глухота. При передачи речи, например через телефон, получается часть букв не воспринимается. Слова, фразы и предложения достраиваются по смыслу, что не очень легко. Типа игра "поле чудес". Женские и детские голоса воспринимаются всегда хуже. При личном общении значительно проще, т.к. недостающая информация частично считывается с губ собеседника.
Хотелось бы облегчить общение в ситуации когда собеседника рядом нет. Например тот же разговор по телефону. Предполагаю, что телефон каким либо образом можно завести на компьтер. ПО обрабатывает речь и выдает текст на экране. Или например разговор (лекцию) можно записать на цифровой диктафон. Прослушивать ее в обычном режиме достаточно проблематично, а вот если скинут на комьютер и обработать в тест....
это что хотелось бы получить по минимуму)
В каком то фильме видел использование ПО наоборот > набираешь на клавиатуре, а на выходе в телефонную сеть выходит речь. Здесь ситуация обратная.

PS спасибо за ссылку на горыныча. обязательно ознакомлюсь)


--------------------
Ищу человека хорошо знающего математику
Офлайн · Карточка · Приват
^
L@mer
06.03.2007, 14:19
Сообщение #6


Ветеран
******

Награды: 3
Группа: ??????
Сообщений: 1 368
Регистрация: 25.11.2005

Репутация: 20 [ - / + ]


to NSP:
Алгоритм распознавания речи с определенной погрешностью можно настроить на достаточно стабильный голос и дикцию. А вот телефон это помехи, разные голоса, мне кажется в данный момент времени весьма сложно реализуемо. Приведенный Вами пример это реальность, но и реализация такой схемы в 10 раз проще.
Позвольте порекомендовать Вам специальный телефон - http://www.ixbt.com/news/market/index.shtml?07/25/74
Вполне возможно данный прибор поможет Вам.
Для себя тему не закрыл, если появятся интересные мысли, то выскажусь.


--------------------
Я бы изменил мир, но бог не дал исходников...
Изображение
Офлайн · Карточка · Приват
^
Ilya V. Rudomilov
13.03.2007, 4:39
Сообщение #7


Путяра, пшёл вон!
*******

Награды: 9
Группа: ??????
Сообщений: 14 825
Регистрация: 30.03.2004

Репутация: 36 [ - / + ]


Цитата
Суть проблемы:большинство слабослышащих людей (я один из них) хуже либо вобще не воспринимают определенный диапазон частот > обычно высокие и часть средних, если не воспринимаются низкие, то это уже полная глухота. При передачи речи, например через телефон, получается часть букв не воспринимается. Слова, фразы и предложения достраиваются по смыслу, что не очень легко. Типа игра "поле чудес". Женские и детские голоса воспринимаются всегда хуже. При личном общении значительно проще, т.к. недостающая информация частично считывается с губ собеседника. Хотелось бы облегчить общение в ситуации когда собеседника рядом нет. Например тот же разговор по телефону. Предполагаю, что телефон каким либо образом можно завести на компьтер. ПО обрабатывает речь и выдает текст на экране. Или например разговор (лекцию) можно записать на цифровой диктафон. Прослушивать ее в обычном режиме достаточно проблематично, а вот если скинут на комьютер и обработать в тест....это что хотелось бы получить по минимуму)В каком то фильме видел использование ПО наоборот > набираешь на клавиатуре, а на выходе в телефонную сеть выходит речь. Здесь ситуация обратная.

Уверен, что вам не удастся достичь той эффективности, которая вам необходима. Причин тому множество:
1. Недостаточно громкая (громко говорят по телефону очень редкие люди) и неровная речь
2. Помехи в телефонной линии
3. Отсутствие настройки программы - без наговаривания хотя бы в течение 10 минут тестовых фраз программа будет работать ужасно плохо.

В настоящее время невозможно обеспечить качественное распознавание речи даже одного человека, который говорит очень ровно, внятно, разборчиво на качественный микрофон.

Можете попробовать поставить Горыныча - сразу поймете, что это гиблое дело.


--------------------
Обязательно к изучению - мой блог о моей жизни в Чехии! И хватит спрашивать "Почему же Чехия?.." - все ответы описаны уже.
Офлайн · Карточка · Приват
^
alse-kam
13.03.2007, 17:14
Сообщение #8


Отличившийся участник
****

Награды: 2
Группа: ?????????
Сообщений: 421
Регистрация: 07.12.2006

Репутация: 3 [ - / + ]


Цитата(Ilya V. Rudomilov @ 13.03.2007, 5:39)

Можете попробовать поставить Горыныча - сразу поймете, что это гиблое дело.

Я ознакомился с программой Горыныч. смысла ее устанавливать нет, предназначение ее другое -это явно видно по описанию.


--------------------
Ищу человека хорошо знающего математику
Офлайн · Карточка · Приват
^
Acden
29.11.2007, 2:48
Сообщение #9


Участник
**

Группа: ?????????
Сообщений: 74
Регистрация: 22.08.2006

Репутация: 0 [ - / + ]


Цитата(NSP @ 13.03.2007, 18:14)

Я ознакомился с программой Горыныч. смысла ее устанавливать нет, предназначение ее другое -это явно видно по описанию.


Зря Вы так. Сравнивал разные проги. Эта лучшая для распознования русской речи и представления её в письменной форме. Дракон, правда, лучше - но она очень сложная, долго учить русскому.


--------------------
Изображениемой хостер и регистратор доменов. Вопросы о профессиональном хостинге и регистрации доменов - в ЛС.
Офлайн · Карточка · Приват
^
lord
03.12.2007, 15:22
Сообщение #10


Ветеран
******

Награды: 3
Группа: VIP
Сообщений: 1 015
Регистрация: 12.08.2007

Репутация: 13 [ - / + ]


сталкивался с распознаванием речи по телефону. когда звонли в службу потдержки мелкомягких. удивительно хорошо распознает и общается по телефону. интересно как это у них технически реализовано.


--------------------
Женщины как соль.... с ними не сладко..... без них не вкусно....
Офлайн · Карточка · Приват
^
Орёл
04.12.2007, 1:11
Сообщение #11


Элита
*******

Награды: 8
Группа: VIP
Сообщений: 1 619
Регистрация: 23.11.2004

Репутация: 35 [ - / + ]


Я знаю, что Deep Blue тоже удивительно хорошо играл в шахматы smile.gif Увы, у нас дома не Deep Blue smile.gif Пока эта задача для компьютеров сложна. А в принципе, даже если и не сложна, то стоимость ПО будет зашкаливать очень и очень сильно...

LСобакаmer, тот телефон не подходит для людей для людей с невритом (или нейросенсорной тугоухостью), у них не в барабанной перепонке дело, а в ослаблении проводимости звукового нерва. Обычно как раз проблема и возникает в высоких частотах. Что и говорит alse-kam.



Сообщение отредактировал Орёл - 04.12.2007, 1:16


--------------------
Феб часть молитвы благосклонно встретил,
Другую часть ее развеял ветер.
Офлайн · Карточка · Приват
^
Lalynda
30.12.2007, 1:27
Сообщение #12


Отличившийся участник
****

Награды: 2
Группа: ?????????
Сообщений: 426
Регистрация: 24.10.2006

Репутация: 6 [ - / + ]


Цитата(NSP @ 05.03.2007, 15:04)

Кто-нибудь сталкивался (использовал) какое-нибудь ПО для преобразования человеческой речи в текст. Интересует любая инфа, особенно личный опыт использования ПО. Программа необходима для слабослышащих людей. Например входящий сигнал через микрофон, а в результате текст на экране. Ну типа субтитров что-ли.
Буду рад любой информации, особенно если есть личный опыт.

Я увлекаюсь аудиокнигами, также интересуюсь программами, которые предназначены для людей с расстройствами зрения и слуха. У меня установлена Koob Audio и движок Speech Cube, качество получше Говорилки, более выразительное и четкое. Но это на любителя. Главное предназначение подобных говорилок - доступ к печатной продукции всех слабовидящих и слепых людей. Надо это понимать, и уважать тех, кто создаёт такие программы. Уже имеются новые разработки, где тексты диалогов передаются на два голоса, добавляется музыкальное сопровождение. Имеется большая библиотека аудиокниг, которая все время пополняется. Но аудиокниги, объёмом до 500 МБ, не очень-то скачаешь. Имеются и другие разработки, например "говорящий браузер". Вроде бы есть сайты, где аудиокниги имеют размер почти такой же, как их текстовые файлы, сегодня попробую поискать. Ага, вот они: http://herald.starstage.net/hall.htm - это сайт, где предлагаются аудиокниги и программа для их чтения. Прога бесплатная , но за книжки надо платить. А это сайт любителей аудиокниг: http://abook-club.ru/forum/index.php?act=SF&f=6 Вот еще пара сайтов в тему, очень интересные фишки, вплоть до "говорящей" мышки: http://govorilovo.narod.ru/ и www.speech-soft.ru - точно, здесь вроде бы то, что нужно smile.gif

Офлайн · Карточка · Приват
^
Скорпион
30.12.2007, 8:28
Сообщение #13


Элита
*******

Награды: 2
Группа: ?????????
Сообщений: 1 858
Регистрация: 01.12.2006

Репутация: 11 [ - / + ]


Спасибо за ссылки, иду читать.
Офлайн · Карточка · Приват
^
kate0309
03.11.2011, 23:40
Сообщение #14


Гость








http://speetech.com
· ·
^
skorpion
18.12.2011, 20:35
Сообщение #15


Наблюдатель


Группа: ?????????
Сообщений: 5
Регистрация: 18.12.2011

Репутация: 0 [ - / + ]


Речь перевожу в текст обычным переписыванием.

Сообщение отредактировал skorpion - 18.12.2011, 20:36
Офлайн · Карточка · Приват
^
Ilya V. Rudomilov
20.12.2011, 15:09
Сообщение #16


Путяра, пшёл вон!
*******

Награды: 9
Группа: ??????
Сообщений: 14 825
Регистрация: 30.03.2004

Репутация: 36 [ - / + ]


Уже изобретен Google Voice Engine, работает неплохо вполне.


--------------------
Обязательно к изучению - мой блог о моей жизни в Чехии! И хватит спрашивать "Почему же Чехия?.." - все ответы описаны уже.
Офлайн · Карточка · Приват
^
Imperio
26.12.2011, 5:50
Сообщение #17


Гость








Цитата(NSP @ 05.03.2007, 14:04)

Кто-нибудь сталкивался (использовал) какое-нибудь ПО для преобразования человеческой речи в текст. Интересует любая инфа, особенно личный опыт использования ПО. Программа необходима для слабослышащих людей. Например входящий сигнал через микрофон, а в результате текст на экране. Ну типа субтитров что-ли.
Буду рад любой информации, особенно если есть личный опыт.


Хорошая бесплатная программа распознавания речи, которая позволяет разговаривать с компьютером.Помогает конвертировать длинные речи в текст Dictation 5.92
· ·
^
Empirik
21.08.2012, 6:22
Сообщение #18


Гость








Цитата(Ilya V. Rudomilov @ 20.12.2011, 15:09)

Уже изобретен Google Voice Engine, работает неплохо вполне.


Скажи а у тебя есть примеры его использования? Именно для прикладных целей ?
· ·
^

Ответить · Открыть тему
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 



Код кнопки 88x31 Текстовая версия Русская версия Invision Power Board v2.1.7 © 2006  IPS, Inc.