Hypernasal Speech Detection by Acoustic Analysis of Unvoiced Plosive Consonants

  • Alexander Sepúlveda-Sepúlveda Universidad Nacional de Colombia, Manizales
  • Edilson Delgado-Trejos Ingeniero Electrónico. M. Sc. en Automatización Industrial. Ph. D. en Ingeniería LI Automática. Académico Investigador del Centro de Investigación, Instituto Tecnológico Metropolitano, Medellín
  • Santiago Murillo-Rendón Estudiante Ingeniería Electrónica. Universidad Nacional de Colombia, Manizales
  • Germán Castellanos-Domínguez Ingeniero en Telecomunicaciones. Ph. D. En Ingeniería. Profesor asociado al Departamento de Ingeniería Eléctrica, Electrónica y Computación de la Universidad Nacional de Colombia, Manizales
Keywords: Acoustic analysis, speech analysis, hypernasality, unvoiced stop consonants and rademacher complexity.

Abstract

People with a defective velopharyngeal mechanism speak with abnormal nasal resonance (hypernasal speech). Voice analysis methods for hypernasality detection commonly use vowels and nasalized vowels. However to obtain a more general assessment of this abnormality it is necessary to analyze stops and fricatives. This study describes a method with high generalization capability for hypernasality detection analyzing unvoiced Spanish stop consonants. The importance of phoneme-by-phoneme analysis is shown, in contrast with whole word parametrization which includes irrelevant segments from the classification point of view. Parameters that correlate the imprints of Velopharyngeal Incompetence (VPI) over voiceless stop consonants were used in the feature estimation stage. Classification was carried out using a Support Vector Machine (SVM), including the Rademacher complexity model with the aim of increasing the generalization capability. Performances of 95.2% and 92.7% were obtained in the processing and verification stages for a repeated cross-validation classifier evaluation.

Author Biographies

Alexander Sepúlveda-Sepúlveda, Universidad Nacional de Colombia, Manizales
Ingeniero Electrónico. M. Sc en Automatización Industrial. Estudiante de doctorado en ingeniería LI Automática. Universidad Nacional de Colombia, Manizales
Edilson Delgado-Trejos, Ingeniero Electrónico. M. Sc. en Automatización Industrial. Ph. D. en Ingeniería LI Automática. Académico Investigador del Centro de Investigación, Instituto Tecnológico Metropolitano, Medellín
Instituto Tecnológico Metropolitano, Medellín
Santiago Murillo-Rendón, Estudiante Ingeniería Electrónica. Universidad Nacional de Colombia, Manizales
Universidad Nacional de Colombia, Manizales
Germán Castellanos-Domínguez, Ingeniero en Telecomunicaciones. Ph. D. En Ingeniería. Profesor asociado al Departamento de Ingeniería Eléctrica, Electrónica y Computación de la Universidad Nacional de Colombia, Manizales
Universidad Nacional de Colombia, Manizales
How to Cite
Sepúlveda-Sepúlveda, A., Delgado-Trejos, E., Murillo-Rendón, S., & Castellanos-Domínguez, G. (2009). Hypernasal Speech Detection by Acoustic Analysis of Unvoiced Plosive Consonants. TecnoLógicas, (23), 223-237. https://doi.org/10.22430/22565337.242

Downloads

Download data is not yet available.
Published
2009-12-20
Section
Articles