An Algorithm for Parameters Estimation of Autoregressive Model of Basic Speech Units
https://doi.org/10.18255/1818-1015-2013-2-23-33
Abstract
The article considers the problem of estimating autoregressive model parameters of elementary speech units such as phonemes. It is suggested an iterative algorithm based on the Newton numerical minimization technique to search an autoregressive model of phonemes specified its multiple samples. For this purpose the analytical expressions of the gradient and the Hessian of Kullback–Leibler information divergence between autoregressive models were computed. Experimental studies on a set of English phonemes showed that the developed algorithm requires less computational effort for large amounts of data, and iterations count depends little on the amount of input data as opposed to reference phoneme selection algorithm based on the criterion of a minimum sum of information divergence. Moreover, the proposed algorithm allows finding models of phonemes, which provide a higher probability of correct recognition.
About the Author
I. V. GubochkinRussian Federation
канд. техн. наук, старший преподаватель,
Minin st., 31a, Nizhny Novgorod, 603155, Russia
References
1. Picone J. Signal Modeling Techniques in Speech Recognition // Proceedings of the IEEE. Vol. 81, No. 9. P. 1215 – 1246.
2. Савченко В.В. Автоматическая обработка речи по критерию минимума информационного рассогласования на основе метода обеляющего фильтра // Радиотехника и электроника. 2005. Т. 50, № 3. С. 309 – 314 (Savchenko V.V. Avtomaticheskaya obrabotka rechi po kriteriyu minimuma informatsionnogo rassoglasovaniya na osnove metoda obelyayushchego filtra // Radiotekhnika i elektronika. 2005. T. 50, 3. S. 309 – 314 [in Russian]).
3. Savchenko V.V. Autoregressive Model for Recognition of Speech Signals Based on Theoretical Information Approach // VI International Congress on Mathematical Modeling. N. Novgorod: University of N. Novgorod, 2004. P. 347.
4. Савченко В.В., Акатьев Д.Ю., Шерстнев С.Н. Метод оптимального обучающего словаря в задаче распознавания речевых сигналов по критерию минимального информационного рассогласования // Известия высших учебных заведений России. Радиоэлектроника. 2006. Вып. 5. С. 10 – 14 (Savchenko V.V., Akatev D.Yu., Sherstnev S.N. Metod optimalnogo obuchayushchego slovarya v zadache raspoznavaniya rechevykh signalov po kriteriyu minimalnogo informatsionnogo rassoglasovaniya // Izvestiya vysshikh uchebnykh zavedeny Rossii. Radioelektronika. 2006. Vyp. 5. S. 10 – 14 [in Russian]).
5. Савченко В.В., Акатьев Д.Ю., Карпов Н.В. Автоматическое распознавание элементарных речевых единиц методом обеляющего фильтра // Известия высших учебных заведений России. Радиоэлектроника. 2007. Вып. 4. С. 11 – 19 (Savchenko V.V., Akatev D.Yu., Karpov N.V. Avtomaticheskoe raspoznavanie elementarnykh rechevykh edinits metodom obelyayushchego filtra // Izvestiya vysshikh uchebnykh zavedeny Rossii. Radioelektronika. 2007. Vyp. 4. S. 11 – 19 [in Russian]).
6. Савченко В.В., Пономарев Д.А. Оптимизация фонетической базы данных по группе дикторов на основе информационной теории восприятия речи // Информационные технологии. 2009. №12. С. 7 – 12 (Savchenko V.V., Ponomarev D.A. Optimizatsiya foneticheskoy bazy dannykh po gruppe diktorov na osnove informatsionnoy teorii vospriyatiya rechi // Informatsionnye tekhnologii. 2009. 12. S. 7 – 12 [in Russian]).
7. Савченко В.В. Информационная теория восприятия речи // Известия высших учебных заведений России. Радиоэлектроника. 2007. Вып. 6. С. 3 – 9. (Savchenko V.V. Informatsionnaya teoriya vospriyatiya rechi // Izvestiya vysshikh uchebnykh zavedeny Rossii. Radioelektronika. 2007. Vyp. 6. S. 3 – 9 [in Russian])
8. Пшеничный Б.Н., Данилин Ю.М. Численные методы в экстремальных задачах. М.: Наука, 1975 (Pshenichny B. N., Danilin Yu. M. Numerical Methods in Extremal Problems. MIR Publishers, Moscow, Russia, 1978.).
9. Fisher William M., Doddington George R. and Goudie-Marshall Kathleen M. The DARPA Speech Recognition Research Database: Specifications and Status // Proceedings of DARPA Workshop on Speech Recognition. 1986. P. 93 – 99.
10. Маpпл С. Л. Цифpовой спектpальный анализ и его пpиложения. М.: Миp, 1990. 584 с. (Marple Jr S. L. Digital spectral analysis with applications. Englewood Cliffs, NJ, PrenticeHall, Inc., 1987. 512 p.)
Review
For citations:
Gubochkin I.V. An Algorithm for Parameters Estimation of Autoregressive Model of Basic Speech Units. Modeling and Analysis of Information Systems. 2013;20(2):23-33. (In Russ.) https://doi.org/10.18255/1818-1015-2013-2-23-33