Алгоритм оценки параметров авторегрессионной модели элементарных речевых единиц


https://doi.org/10.18255/1818-1015-2013-2-23-33

Полный текст:


Аннотация

Рассмотрена задача оценки параметров авторегрессионной модели элементарных речевых единиц типа фонем. Предложен итерационный алгоритм поиска авторегрессионной модели фонемы, заданной множеством ее реализаций, в основе которого лежит метод Ньютона, предназначенный для численной минимизации функций. Для этого были получены аналитические выражения для градиента и гессиана величины информационного рассогласования Кульбака–Лейблера между моделями авторегрессии. В ходе экспериментальных исследований на наборе фонем английского языка показано, что разработанный алгоритм, по сравнению с алгоритмом выбора эталона фонемы на основе критерия минимума суммы информационных рассогласований, требует меньших вычислительных затрат на больших объемах данных, а число необходимых итераций слабо зависит от объема входных данных. Кроме того, предложенный алгоритм позволяет находить такие модели фонем, которые обеспечивают более высокую вероятность правильного распознавания.


Об авторе

Иван Вадимович Губочкин
Нижегородский государственный лингвистический университет им. Н.А. Добролюбова
Россия

канд. техн. наук, старший преподаватель,

603155, Россия, г. Нижний Новгород, ул. Минина, д. 31а.

Автор более 20 публикаций. Научные интересы – автоматическая обработка и распознавание речевых сигналов, обработка изображений



Список литературы

1. Picone J. Signal Modeling Techniques in Speech Recognition // Proceedings of the IEEE. Vol. 81, No. 9. P. 1215 – 1246.

2. Савченко В.В. Автоматическая обработка речи по критерию минимума информационного рассогласования на основе метода обеляющего фильтра // Радиотехника и электроника. 2005. Т. 50, № 3. С. 309 – 314 (Savchenko V.V. Avtomaticheskaya obrabotka rechi po kriteriyu minimuma informatsionnogo rassoglasovaniya na osnove metoda obelyayushchego filtra // Radiotekhnika i elektronika. 2005. T. 50, 3. S. 309 – 314 [in Russian]).

3. Savchenko V.V. Autoregressive Model for Recognition of Speech Signals Based on Theoretical Information Approach // VI International Congress on Mathematical Modeling. N. Novgorod: University of N. Novgorod, 2004. P. 347.

4. Савченко В.В., Акатьев Д.Ю., Шерстнев С.Н. Метод оптимального обучающего словаря в задаче распознавания речевых сигналов по критерию минимального информационного рассогласования // Известия высших учебных заведений России. Радиоэлектроника. 2006. Вып. 5. С. 10 – 14 (Savchenko V.V., Akatev D.Yu., Sherstnev S.N. Metod optimalnogo obuchayushchego slovarya v zadache raspoznavaniya rechevykh signalov po kriteriyu minimalnogo informatsionnogo rassoglasovaniya // Izvestiya vysshikh uchebnykh zavedeny Rossii. Radioelektronika. 2006. Vyp. 5. S. 10 – 14 [in Russian]).

5. Савченко В.В., Акатьев Д.Ю., Карпов Н.В. Автоматическое распознавание элементарных речевых единиц методом обеляющего фильтра // Известия высших учебных заведений России. Радиоэлектроника. 2007. Вып. 4. С. 11 – 19 (Savchenko V.V., Akatev D.Yu., Karpov N.V. Avtomaticheskoe raspoznavanie elementarnykh rechevykh edinits metodom obelyayushchego filtra // Izvestiya vysshikh uchebnykh zavedeny Rossii. Radioelektronika. 2007. Vyp. 4. S. 11 – 19 [in Russian]).

6. Савченко В.В., Пономарев Д.А. Оптимизация фонетической базы данных по группе дикторов на основе информационной теории восприятия речи // Информационные технологии. 2009. №12. С. 7 – 12 (Savchenko V.V., Ponomarev D.A. Optimizatsiya foneticheskoy bazy dannykh po gruppe diktorov na osnove informatsionnoy teorii vospriyatiya rechi // Informatsionnye tekhnologii. 2009. 12. S. 7 – 12 [in Russian]).

7. Савченко В.В. Информационная теория восприятия речи // Известия высших учебных заведений России. Радиоэлектроника. 2007. Вып. 6. С. 3 – 9. (Savchenko V.V. Informatsionnaya teoriya vospriyatiya rechi // Izvestiya vysshikh uchebnykh zavedeny Rossii. Radioelektronika. 2007. Vyp. 6. S. 3 – 9 [in Russian])

8. Пшеничный Б.Н., Данилин Ю.М. Численные методы в экстремальных задачах. М.: Наука, 1975 (Pshenichny B. N., Danilin Yu. M. Numerical Methods in Extremal Problems. MIR Publishers, Moscow, Russia, 1978.).

9. Fisher William M., Doddington George R. and Goudie-Marshall Kathleen M. The DARPA Speech Recognition Research Database: Specifications and Status // Proceedings of DARPA Workshop on Speech Recognition. 1986. P. 93 – 99.

10. Маpпл С. Л. Цифpовой спектpальный анализ и его пpиложения. М.: Миp, 1990. 584 с. (Marple Jr S. L. Digital spectral analysis with applications. Englewood Cliffs, NJ, PrenticeHall, Inc., 1987. 512 p.)


Дополнительные файлы

Для цитирования: Губочкин И.В. Алгоритм оценки параметров авторегрессионной модели элементарных речевых единиц. Моделирование и анализ информационных систем. 2013;20(2):23-33. https://doi.org/10.18255/1818-1015-2013-2-23-33

For citation: Gubochkin I.V. An Algorithm for Parameters Estimation of Autoregressive Model of Basic Speech Units. Modeling and Analysis of Information Systems. 2013;20(2):23-33. (In Russ.) https://doi.org/10.18255/1818-1015-2013-2-23-33

Просмотров: 309

Обратные ссылки

  • Обратные ссылки не определены.


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1818-1015 (Print)
ISSN 2313-5417 (Online)