Russian

Flat
А как делаются пофонемные разметки в аудио файлах.
User: tealex
Date: 9/8/2009 7:48 am
Views: 18140
Rating: 15

после того как начитывается текст.

Там же должна быть пофонемная разметка.

Автоматически делается или в ручную?

Какое разделение фонем используется? (всмысле какой набор фонем) .

Подходят ли аудио книги для этого?

Почему нет проекта не S2T а Phonetic Search ?

 

Много вопросов ? :)

Re:А как делаются пофонемные разметки в аудио файлах.
User: nsh
Date: 9/8/2009 9:53 am
Views: 260
Rating: 13

> после того как начитывается текст.

Никак не делаются

> Там же должна быть пофонемная разметка.

Не должна

> Автоматически делается или вручную?

Если такая разметка нужна, её можно сделать автоматически.

> Какое разделение фонем используется? (всмысле какой набор фонем) .


Используемый набор аллофонов (это не фонемы) находится в файле в etc/msu_ru_nsh.phone.

> Подходят ли аудио книги для этого?

Для чего этого?

> Почему нет проекта не S2T а Phonetic Search ?

Почему люди не летают?

Re:А как делаются пофонемные разметки в аудио файлах.
User: tealex
Date: 9/8/2009 2:00 pm
Views: 239
Rating: 13

> Автоматически делается или вручную?

Если такая разметка нужна, её можно сделать автоматически.

================

разве разметка не нужна для обучения ??

> Какое разделение фонем используется? (всмысле какой набор фонем) .
Используемый набор аллофонов (это не фонемы) находится в файле в etc/msu_ru_nsh.phone.

====

круто

как имея текст получить последовательность аллофонов ?

> Подходят ли аудио книги для этого?

Для чего этого?

=======

у аудио книги есть текст + аудио

подходят ли они как моделии обучения? почему ?

> Почему нет проекта не S2T а Phonetic Search ?

Почему люди не летают?

====

те его нет почему ?

потому что никто не делает .... или потому что большая разница между Phonetic Search и S2T


мне казалось там разница не очень большая ....

Re:А как делаются пофонемные разметки в аудио файлах.
User: nsh
Date: 9/8/2009 3:06 pm
Views: 642
Rating: 15

 

> разве разметка не нужна для обучения?


Разметка на аллофоны не нужна, только транскрипция уровня слов.


> Как имея текст получить последовательность аллофонов?

Поставить аллофоны для каждого слова из словаря или использовать специализированную программу.

> подходят ли они как модели обучения? почему?


Для обучения модели аудиокниги используются. В данной

базе они больше 70% составляют.

> потому что никто не делает .... или потому что большая разница между Phonetic Search и S2T. мне казалось там разница не очень большая ....

Разницы между распознаванием и поиском нет. Тем не менее, доступного ПО по индексации и поиску нет. На вопрос "почему" я затрудняюсь ответить.

 

Re: Re:А как делаются пофонемные разметки в аудио файлах.
User: tealex
Date: 9/8/2009 3:35 pm
Views: 249
Rating: 15

> разве разметка не нужна для обучения?


Разметка на аллофоны не нужна, только транскрипция уровня слов.

====

где можно посмотреть какие алгоритмы используются для получения разметки уровня слов ? Или нужно копаться в исходниках программ? Каких программ ?


> Как имея текст получить последовательность аллофонов?

Поставить аллофоны для каждого слова из словаря или использовать специализированную программу.

===========

где можно помотреть алгоритмы ? Или нужно копаться в исходниках программ? Каких программ ? Для русского языка.

> подходят ли они как модели обучения? почему?
Для обучения модели аудиокниги используются. В данной

базе они больше 70% составляют.

========

Разметка уровня слов была сделана автоматически?

 

> потому что никто не делает .... или потому что большая разница между Phonetic Search и S2T. мне казалось там разница не очень большая ....

Разницы между распознаванием и поиском нет. Тем не менее, доступного ПО по индексации и поиску нет. На вопрос "почему" я затрудняюсь ответить.

=====================

А вообще есть ли надобность в аудиозаписях размеченным по аллофонам/фонемам для s2t  ? для Phonetic Search как я представляю без них никак.  Вообще я такие записи кроме загадочной RuSpeech не знаю и тем более лежащие в свободном доступе.

Re: Re:А как делаются пофонемные разметки в аудио файлах.
User: nsh
Date: 9/8/2009 4:49 pm
Views: 260
Rating: 15

> где можно посмотреть какие алгоритмы используются для получения разметки уровня слов ? Или нужно копаться в исходниках программ? Каких программ ?

Хм, алгоритмы для получения разметки уровня слов это алгоритмы распознавания речи. Посмотреть информацию о них можно в книжке. Spoken Language Processing например:

http://dsp-book.narod.ru/SLP1.djvu

http://dsp-book.narod.ru/SLP2.djvu

> Как имея текст получить последовательность аллофонов?
Поставить аллофоны для каждого слова из словаря или использовать специализированную программу.

Алгоритмы преобразования текста в аллофоны описаны в литературе. Например, вот такая статься описывает детали http://www.philol.msu.ru/~otipl/SpeechGroup/publications/2001/stat_kaz.doc

Реализацию этих алгоритмов можно найти в синтезаторе русской речи.

> Разметка уровня слов была сделана автоматически?

Для тренировки базы разметка делается вручную.

> А вообще есть ли надобность в аудиозаписях размеченным по аллофонам/фонемам для s2t? для Phonetic Search как я представляю без них никак. Вообще я такие записи кроме загадочной RuSpeech не знаю и тем более лежащие в свободном доступе.

Большой надобности нет.

Re: Re:А как делаются пофÃ
User: tealex
Date: 9/8/2009 5:28 pm
Views: 239
Rating: 18

> Как имея текст получить последовательность аллофонов?
Поставить аллофоны для каждого слова из словаря или использовать специализированную программу.

Алгоритмы преобразования текста в аллофоны описаны в литературе. Например, вот такая статься описывает детали http://www.philol.msu.ru/~otipl/SpeechGroup/publications/2001/stat_kaz.doc

Реализацию этих алгоритмов можно найти в синтезаторе русской речи.

========

Спасибо за doc.

Можно название или сылку на синтезатор.

> Разметка уровня слов была сделана автоматически?

Для тренировки базы разметка делается вручную.

=============

МММ. Какая то путаница.

Я правильно понимаю что для тренировки базы , необходима разметка по словам (начало-конец) . И это операция сейчас не делается автоматически.Те это ручная операция и если она будет автоматизированна то  распознование может быть улучшенно, за счёт большей базы?

Это верно как для русского так и для английского языков ?

Тогда я не понял про то что вы говорили про автоматическую разметку. И почему она не годится для тренировки.


С какой точностью нужна разметка по словам ? сотые секунд , тысячные?

Нужны ли ещё базы для улучшения качества ?

Нужны ли допустим размеченные аудио книги. Или для улучшения базы нужны другие источники аудио данных(телевидение , радио ....).

Те те записи которые люди записывают через зайт (java аплет ) он потом вручную размечается ?

Re:А как делаются пофонемные разметки в аудио файлах.
User: nsh
Date: 9/9/2009 11:11 am
Views: 3374
Rating: 15

> Можно название или сылку на синтезатор.

Festival/msu_ru_nsh_clunits

http://festlang.berlios.de/docu/doku.php?id=russianru

> Я правильно понимаю что для тренировки базы , необходима разметка по словам (начало-конец) .

Нет. То, как выглядит база можно посмотреть, скачав её на этом сайте. База состоит из большого числа коротких записей (5-10с) и текста к каждой из записей.

> Нужны ли ещё базы для улучшения качества ?

Единственная цель этого ресурса - собрать дополнительные базы для улучшения качества.

 

Re: Re:А как делаются пофонемные разметки в аудио файлах.
User: Visitor
Date: 11/15/2014 2:21 am
Views: 4230
Rating: 7

> где можно посмотреть какие алгоритмы используются для получения разметки уровня слов ? Или нужно копаться в исходниках программ? Каких программ ?

Хм, алгоритмы для получения разметки уровня слов это алгоритмы распознавания речи. Посмотреть информацию о них можно в книжке. Spoken Language Processing например:

http://dsp-book.narod.ru/SLP1.djvu

http://dsp-book.narod.ru/SLP2.djvu

> Как имея текст получить последовательность аллофонов?
Поставить аллофоны для каждого слова из словаря или использовать специализированную программу.

Алгоритмы преобразования текста в аллофоны описаны в литературе. Например, вот такая статься описывает детали http://www.philol.msu.ru/~otipl/SpeechGroup/publications/2001/stat_kaz.doc

Реализацию этих алгоритмов можно найти в синтезаторе русской речи.

> Разметка уровня слов была сделана автоматически?

Для тренировки базы разметка делается вручную.

> А вообще есть ли надобность в аудиозаписях размеченным по аллофонам/фонемам для s2t? для Phonetic Search как я представляю без них никак. Вообще я такие записи кроме загадочной RuSpeech не знаю и тем более лежащие в свободном доступе.

Большой надобности нет.

PreviousNext