Russian

Flat
Автоматическое создание базы для улучшения качества
User: Victor
Date: 2/22/2010 1:46 pm
Views: 16446
Rating: 61

К сожалению, качество распознавания оставляет желать лучшего. :-( Каждый раз просить человека, что то записать и выслать Вам, практически не реально. Они просто делать этого не будут... Лень... :-( Слишком сложно! Простому пользователю это не объяснишь...

Поэтому резонный вопрос, а есть ли алгоритм или программа, способная автоматизировать процесс улучшения качества распознавания в sphinx4.

Например, некая программа устанавливается на Internet сервер, человек заходит туда, надиктовывает, что требуется и далее система sphinx4 сама дообучается и качественно распознает его голос? От человека требуется только зайти и произнести, некоторые слова. И не более!!! Это хоть и не многие, но думаю в состоянии сделать... По степенно, база и наберется.

Если программы нет. Может есть какое то описание, алгоритма как, такую программу можно написать? Входные, выходные форматы?

Буду рад услышать Ваши предложения и замечания по данному вопросу!

 

Re: Автоматическое создание базы для улучшения качества
User: nsh
Date: 2/22/2010 2:30 pm
Views: 235
Rating: 38

> Поэтому резонный вопрос, а есть ли алгоритм или программа, способная автоматизировать процесс улучшения качества распознавания в sphinx4.

Есть такая программа:

http://www.dev.voxforge.org/projects/Main/browser/Trunk/SpeechSubmission/VFSpeechSubmission

Попробовать эту программу можно здесь:

http://www.voxforge.org/ru/read

> Может есть какое то описание, алгоритма как, такую программу можно написать? Входные, выходные форматы?

Описание алгоритма тоже есть

http://www.speech.cs.cmu.edu/sphinxman/fr4.html

Re: Автоматическое создание базы для улучшения качества
User: Visitor
Date: 2/22/2010 4:18 pm
Views: 4402
Rating: 22

Спасибо за ответ.

1. Как можно исходники, этой программы скачать одним файлом? Я java код понимаю лучше чем английский язык... :-(

2. Можно ли список вопросов, который входит в программу менять? Для улучшения распознавания некоторых слов или фраз.

3. Как полученный результат интегрировать в sphinx4 на лету?

 

Re: Автоматическое создание базы для улучшения качества
User: nsh
Date: 2/22/2010 4:27 pm
Views: 226
Rating: 18

> Как можно исходники, этой программы скачать одним файлом? Я java код понимаю лучше чем английский язык... :-(

svn checkout http://www.dev.voxforge.org/svn/Main/Trunk/SpeechSubmission/VFSpeechSubmission

> Можно ли список вопросов, который входит в программу менять? Для улучшения распознавания некоторых слов или фраз.

Можно

> Как полученный результат интегрировать в sphinx4 на лету?

Скопировать файлы?

 

Re: Автоматическое создание базы для улучшения качества
User: Visitor
Date: 2/22/2010 5:28 pm
Views: 180
Rating: 23

Апплет конечно на Java, но сервеная часть на php... :-(

1. Есть ли вариант с java servlet или jsp?

2. А что в конечном итоге она в файловую систему записывает? Просто wav файлы, с определенными именами? Можно ссылку на пример архива, что она на сервере формирует?

3. Как эти файлы в sphinx4 импортировать?

Re: Автоматическое создание базы для улучшения качества
User: nsh
Date: 2/22/2010 5:35 pm
Views: 235
Rating: 22

> Есть ли вариант с java servlet или jsp?
Нет

> А что в конечном итоге она в файловую систему записывает? Просто wav файлы, с определенными именами? Можно ссылку на пример архива, что она на сервере формирует?

http://www.voxforge.org/home/listen

> Как эти файлы в sphinx4 импортировать?

http://www.speech.cs.cmu.edu/sphinx/tutorial.html

 

Re: Автоматическое создание базы для улучшения качества
User: Visitor
Date: 2/22/2010 6:24 pm
Views: 255
Rating: 22

Если я правильно понял tutorial, то программы, которая автоматически дообучала бы sphinx4 по созданному апплетом архиву нет?

И судя по tutorial Все делается ручками? :-(

Re: Автоматическое создание базы для улучшения качества
User: Visitor
Date: 2/24/2010 7:31 am
Views: 2271
Rating: 18

Не получил ответа на предыдущее сообщение?

Поясню ситуацию. По задаче, которая передо мной стоит, распознавать надо разные голоса в основном ранее не известные ранее системе.

Качество распознавания, у Вас хромает. Поэтому единственным решением, мне кажется, дообучать новым голосам на лету прямо on-line. Благо дело пользователи на это пойти могут.

Если для этого требуется человек, который ручками будет что то делать, то ничего не получится... :-( Если есть программа или ее можно написать, то можно попробовать.


Так есть программа обеспечивающая полный цикл или алгоритм (не инструкция с общими понятиями)? Программы, которая просто запишет звуковой файл мало...

 

Re: Автоматическое создание базы для улучшения качества
User: Manimaran
Date: 10/11/2016 4:26 am
Views: 2068
Rating: 0
Сообщение
PreviousNext