Hypernasal Speech Detection by Acoustic Analysis of Unvoiced Plosive Consonants

  • Alexander Sepúlveda-Sepúlveda Universidad Nacional de Colombia, Manizales
  • Edilson Delgado-Trejos Instituto Tecnológico Metropolitano, Medellín
  • Santiago Murillo-Rendón Universidad Nacional de Colombia, Manizales.
  • Germán Castellanos-Domínguez Universidad Nacional de Colombia, Manizales
Palabras clave: Análisis acústico, análisis del habla, hipernasalidad, consonantes oclusivas sordas y complejidad Rademacher

Resumen

Las personas con un mecanismo velofaringeo defectuoso hablan con una resonancia nasal anormal (habla hipernasal). Métodos de análisis de voz para detección de hipernasaliad comúnmente usan las vocales y las vocales nasales. Sin embargo para obtener una evaluación más general de esta anormalidad es necesario analizar las paradas y las fricativas. Este estudio describe un método con alta capacidad de generalización para detección de hipernasalidad análisis de las consonantes oclusivas sordas españolas. Se muestra la importancia del análisis fonema por fonema, en contraste con la parametrización de la palabra completa que incluye segmentos irrelevantes desde el punto de vista de la clasificación. Los parámetros que correlacionan la incompetencia velofaringea (VPI) sobre las consonantes oclusivas sordas se usa en la fase de estimación de características. La clasificación se llevó a cabo usando una Maquina de Vector de Soporte (SVM), incluyendo el modelo de complejidad Rademacher con el objetivo de aumentar la capacidad de generalización. Rendimientos del 95.2% y del 92.7% fueron obtenidos en las etapas de elaboración y verificación para una repetida evaluación y clasificación de validación cruzada.

Biografía del autor/a

Alexander Sepúlveda-Sepúlveda, Universidad Nacional de Colombia, Manizales
Ingeniero Electrónico. M. Sc en Automatización Industrial. Estudiante de doctorado en ingeniería LI Automática. Universidad Nacional de Colombia, Manizales
Edilson Delgado-Trejos, Instituto Tecnológico Metropolitano, Medellín
Ingeniero Electrónico. M. Sc. en Automatización Industrial. Ph. D. en Ingeniería LI Automática. Académico Investigador del Centro de Investigación, Instituto Tecnológico Metropolitano, Medellín
Santiago Murillo-Rendón, Universidad Nacional de Colombia, Manizales.
Estudiante Ingeniería Electrónica. Universidad Nacional de Colombia, Manizales.
Germán Castellanos-Domínguez, Universidad Nacional de Colombia, Manizales
Ingeniero en Telecomunicaciones. Ph. D. En Ingeniería. Profesor asociado al Departamento de Ingeniería Eléctrica, Electrónica y Computación de la Universidad Nacional de Colombia, Manizales
Cómo citar
[1]
A. Sepúlveda-Sepúlveda, E. Delgado-Trejos, S. Murillo-Rendón, y G. Castellanos-Domínguez, «Hypernasal Speech Detection by Acoustic Analysis of Unvoiced Plosive Consonants», TecnoL., n.º 23, pp. 223–237, dic. 2009.

Descargas

Los datos de descargas todavía no están disponibles.
Publicado
2009-12-20
Sección
Artículos

Métricas