Carlos Alfredo Lazaro Carrascosa PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 341

UNIVERSIDAD POLITÉCNICA DE MADRID

Escuela Técnica Superior de Ingenieros


Informáticos

Descripción de parámetros glóticos basados en


el modelado de los pliegues vocales para la
detección de patología de la voz

Tesis doctoral

Carlos Alfredo Lázaro Carrascosa


Licenciado en Informática

2015
DEPARTAMENTO DE ARQUITECTURA, TECNOLOGÍA Y
SISTEMAS INFORMÁTICOS

Escuela Técnica Superior de Ingenieros Informáticos

Descripción de parámetros glóticos basados en


el modelado de los pliegues vocales para la
detección de patología de la voz

Tesis doctoral

Autor: Carlos Alfredo Lázaro Carrascosa


Licenciado en Informática

Director: Pedro Gómez Vilda


Doctor en Informática

2015
Tribunal nombrado por el Magnífico y Excelentísimo Sr.
Rector de la Universidad Politécnica de Madrid el día __
de __________ de 2015.

Presidente:_______________________________________________

Vocal:____________________________________________________

Vocal:____________________________________________________

Vocal:____________________________________________________

Secretario:_______________________________________________

Suplente:_________________________________________________

Suplente:_________________________________________________

Realizado el acto de defensa y lectura de la tesis el día


___ de ___________ de _____ en la Escuela Técnica Superior
de Ingenieros Informáticos.

Calificación:___________________

EL PRESIDENTE LOS VOCALES

EL SECRETARIO
Agradecimientos

Me gustaría expresar mi sincero agradecimiento a mi director, Pedro


Gómez Vilda. He aprendido mucho de él, no sólo de ciencia, ha
demostrado tener una gran paciencia y ha sido un placer poder
trabajar juntos.

Muchas y especiales gracias a Víctor Nieto. Su apoyo constante y sus


buenos consejos han sido fundamentales para poder llevar a término
este trabajo.

Gracias a todas las personas con las que me he cruzado en la Facultad


de Informática durante estos años: Agustín, Frank, Alfonso, Rafa, Victoria,
Luismi, Cristina, Mariano, José Luis, Noelia, Carmen, Antonio, Virginia...
Estupendos compañeros, siempre dispuestos a echar una mano, o a
debatir sobre docencia o investigación, o a compartir buenos ratos.
Muchas gracias, y como seguro que me dejo a alguno, que no me lo
tenga en cuenta y que se sienta incluido.

Gracias a mis compañeros y compañeras de la Universidad Rey Juan


Carlos. En el día a día, vuestra ayuda ha sido también importante.
Dedicada a mi familia
Al mejor profesor, mi abuelo Manolo
Resumen

Las patologías de la voz se han transformado en los últimos tiempos en una


problemática social con cierto calado. La contaminación de las ciudades, hábitos como
el de fumar, el uso de aparatos de aire acondicionado, etcétera, contribuyen a ello.
Esto alcanza más relevancia en profesionales que utilizan su voz de manera frecuente,
como, por ejemplo, locutores, cantantes, profesores o teleoperadores.

Por todo ello resultan de especial interés las técnicas de ayuda al diagnóstico que
son capaces de extraer conclusiones clínicas a partir de una muestra de la voz grabada
con un micrófono, frente a otras invasivas que implican la exploración utilizando
laringoscopios, fibroscopios o videoendoscopios, técnicas en cualquier caso mucho
más molestas para los pacientes al exigir la introducción parcial del instrumental citado
por la garganta, en actuaciones consideradas de tipo quirúrgico.

Dentro de aquellas técnicas se ha avanzado mucho en un período de tiempo


relativamente corto. En lo que se refiere al diagnóstico de patologías, hemos pasado
en los últimos quince años de trabajar principalmente con parámetros extraídos de la
señal de voz –tanto en el dominio del tiempo como en el de la frecuencia– y con
escalas elaboradas con valoraciones subjetivas realizadas por expertos a hacerlo
también con parámetros procedentes de estimaciones de la fuente glótica. La
importancia de utilizar la fuente glótica reside, a grandes rasgos, en que se trata de
una señal vinculada directamente al estado de la estructura laríngea del locutor y
también en que está generalmente menos influida por el tracto vocal que la señal de
voz. Es conocido que el tracto vocal guarda más relación con el mensaje hablado, y su
presencia dificulta el proceso de detección de patología vocal.

Estas estimaciones de la fuente glótica han sido obtenidas a través de técnicas de


filtrado inverso desarrolladas por nuestro grupo de investigación. Hemos conseguido,
además, profundizar en la naturaleza de la señal glótica: somos capaces de
descomponerla y relacionarla con parámetros biomecánicos de los propios pliegues
vocales, obteniendo estimaciones de elementos como la masa, la pérdida de energía o
la elasticidad del cuerpo y de la cubierta del pliegue, entre otros. De las componentes
de la fuente glótica surgen también los denominados parámetros biométricos,
relacionados con la forma de la señal, que constituyen por sí mismos una firma
biométrica del individuo. También trabajaremos con parámetros temporales,
relacionados con las diferentes etapas que se observan dentro de la señal glótica
durante un ciclo de fonación. Por último, consideraremos parámetros clásicos de
perturbación y energía de la señal.

En definitiva, contamos ahora con una considerable cantidad de parámetros


glóticos que conforman una base estadística multidimensional, destinada a ser capaz
de discriminar personas con voces patológicas o disfónicas de aquellas que no
presentan patología en la voz o con voces sanas o normofónicas.

xi
Esta tesis doctoral se ocupa de varias cuestiones: en primer lugar, es necesario
analizar cuidadosamente estos nuevos parámetros, por lo que ofreceremos una
completa descripción estadística de los mismos. También estudiaremos cuestiones
como la distribución de los parámetros atendiendo a criterios como el de normalidad
estadística de los mismos, ocupándonos especialmente de la diferencia entre las
distribuciones que presentan sujetos sanos y sujetos con patología vocal. Para todo
ello emplearemos diferentes técnicas estadísticas: generación de elementos y
diagramas descriptivos, pruebas de normalidad y diversos contrastes de hipótesis,
tanto paramétricos como no paramétricos, que considerarán la diferencia entre los
grupos de personas sanas y los grupos de personas con alguna patología relacionada
con la voz.

Además, nos interesa encontrar relaciones estadísticas entre los parámetros, de


cara a eliminar posibles redundancias presentes en el modelo, a reducir la
dimensionalidad del problema y a establecer un criterio de importancia relativa en los
parámetros en cuanto a su capacidad discriminante para el criterio patológico/sano.
Para ello se aplicarán técnicas estadísticas como la Correlación Lineal Bivariada y el
Análisis Factorial basado en Componentes Principales. Por último, utilizaremos la
conocida técnica de clasificación Análisis Discriminante, aplicada a diferentes
combinaciones de parámetros y de factores, para determinar cuáles de ellas son las
que ofrecen tasas de acierto más prometedoras.

Para llevar a cabo la experimentación se ha utilizado una base de datos equilibrada


y robusta formada por doscientos sujetos, cien de ellos pertenecientes al género
femenino y los restantes cien al género masculino, con una proporción también
equilibrada entre los sujetos que presentan patología vocal y aquellos que no la
presentan. Una de las aplicaciones informáticas diseñada para llevar a cabo la recogida
de muestras también es presentada en esta tesis.

Los distintos estudios estadísticos realizados nos permitirán identificar aquellos


parámetros que tienen una mayor contribución a la hora de detectar la presencia de
patología vocal. Alguno de los estudios, además, nos permitirá presentar una
ordenación de los parámetros en base a su importancia para realizar la detección. Por
otra parte, también concluiremos que en ocasiones es conveniente realizar una
reducción de la dimensionalidad de los parámetros para mejorar las tasas de
detección. Por fin, las propias tasas de detección constituyen quizá la conclusión más
importante del trabajo.

Todos los análisis presentes en el trabajo serán realizados para cada uno de los dos
géneros, de acuerdo con diversos estudios previos que demuestran que los géneros
masculino y femenino deben tratarse de forma independiente debido a las diferencias
orgánicas observadas entre ambos. Sin embargo, en lo referente a la detección de
patología vocal contemplaremos también la posibilidad de trabajar con la base de
datos unificada, comprobando que las tasas de acierto son también elevadas.

xii
Abstract

Voice pathologies have become recently in a social problem that has reached a
certain concern. Pollution in cities, smoking habits, air conditioning, etc. contributes to
it. This problem is more relevant for professionals who use their voice frequently:
speakers, singers, teachers, actors, telemarketers, etc.

Therefore techniques that are capable of drawing conclusions from a sample of the
recorded voice are of particular interest for the diagnosis as opposed to other invasive
ones, involving exploration by laryngoscopes, fiber scopes or video endoscopes, which
are techniques much less comfortable for patients.

Voice quality analysis has come a long way in a relatively short period of time. In
regard to the diagnosis of diseases, we have gone in the last fifteen years from working
primarily with parameters extracted from the voice signal (both in time and frequency
domains) and with scales drawn from subjective assessments by experts to produce
more accurate evaluations with estimates derived from the glottal source. The
importance of using the glottal source resides broadly in that this signal is linked to the
state of the speaker's laryngeal structure. Unlike the voice signal (phonated speech)
the glottal source, if conveniently reconstructed using adaptive lattices, may be less
influenced by the vocal tract. As it is well known the vocal tract is related to the
articulation of the spoken message and its influence complicates the process of voice
pathology detection, unlike when using the reconstructed glottal source, where vocal
tract influence has been almost completely removed.

The estimates of the glottal source have been obtained through inverse filtering
techniques developed by our research group. We have also deepened into the nature
of the glottal signal, dissecting it and relating it to the biomechanical parameters of the
vocal folds, obtaining several estimates of items such as mass, loss or elasticity of cover
and body of the vocal fold, among others. From the components of the glottal source
also arise the so-called biometric parameters, related to the shape of the signal, which
are themselves a biometric signature of the individual. We will also work with
temporal parameters related to the different stages that are observed in the glottal
signal during a cycle of phonation. Finally, we will take into consideration classical
perturbation and energy parameters.

In short, we have now a considerable amount of glottal parameters in a


multidimensional statistical basis, designed to be able to discriminate people with
pathologic or dysphonic voices from those who do not show pathology.

This thesis addresses several issues: first, a careful analysis of these new parameters
is required, so we will offer a complete statistical description of them. We will also
discuss issues such as distribution of the parameters, considering criteria such as their
statistical normality. We will take special care in the analysis of the difference between
distributions from healthy subjects and the distributions from pathological subjects. To
reach these goals we will use different statistical techniques such as: generation of
descriptive items and diagramas, tests for normality and hypothesis testing, both

xiii
parametric and nonparametric. These latter techniques consider the difference
between the groups of healthy subjects and groups of people with an illness related to
voice.

In addition, we are interested in finding statistical relationships between


parameters. There are various reasons behind that: eliminate possible redundancies in
the model, reduce the dimensionality of the problem and establish a criterion of
relative importance in the parameters. The latter reason will be done in terms of
discriminatory power for the criterion pathological/healthy. To this end, statistical
techniques such as Bivariate Linear Correlation and Factor Analysis based on Principal
Components will be applied. Finally, we will use the well-known technique of
Discriminant Analysis classification applied to different combinations of parameters
and factors to determine which of these combinations offers more promising success
rates.

To perform the experiments we have used a balanced and robust database,


consisting of two hundred speakers, one hundred of them males and one hundred
females. We have also used a well-balanced proportion where subjects with vocal
pathology as well as subjects who don´t have a vocal pathology are equally
represented. A computer application designed to carry out the collection of samples is
also presented in this thesis.

The different statistical analyses performed will allow us to determine which


parameters contribute in a more decisive way in the detection of vocal pathology.
Therefore, some of the analyses will even allow us to present a ranking of the
parameters based on their importance for the detection of vocal pathology. On the
other hand, we will also conclude that it is sometimes desirable to perform a
dimensionality reduction in order to improve the detection rates. Finally, detection
rates themselves are perhaps the most important conclusion of the work.

All the analyses presented in this work have been performed for each of the two
genders in agreement with previous studies showing that male and female genders
should be treated independently, due to the observed functional differences between
them. However, with regard to the detection of vocal pathology we will consider the
possibility of working with the unified database, ensuring that the success rates
obtained are also high.

xiv
Índice general

Índice de tablas............................................................................................ xvii

Índice de figuras.......................................................................................... xxx

1. Introducción........................................................................................... 1
1.1. Organización del presente documento..................................... 2
1.2. Motivaciones y características generales del presente
estudio....................................................................................... 3
1.3. Hipótesis de partida................................................................... 7
1.4. Objetivos.................................................................................... 8
1.5. Revisión de los análisis directo y perceptual para la detección
de patología vocal..................................................................... 9
1.5.1. Instrumental utilizado en la inspección directa del
aparato fonador........................................................... 9
1.5.2. Análisis perceptual o subjetivo de lavoz...................... 11
2. Producción y fisiología de la voz............................................................ 15
2.1. Teorías de la fonación ............................................................... 16
2.1.1. Antecedentes históricos............................................... 16
2.1.2. Teoría de Van den Berg................................................ 18
2.2. Modelos de representación de los pliegues vocales................. 20
2.3. Modelado acústico.................................................................... 23
2.4. Revisión del uso de parámetros acústicos procedentes de la
señal de voz en la detección de patología vocal....................... 27
3. Parámetros glóticos presentes en el estudio......................................... 37
3.1. Estimación de la señal glótica –mediante filtrado inverso– y
parametrización........................................................................ 38
3.2. Parámetros glóticos clásicos de perturbación y energía........... 43
3.3. Parámetros glóticos biométricos.............................................. 46
3.4. Parámetros glóticos biomecánicos........................................... 51
3.5. Parámetros glóticos temporales............................................... 53
3.6. Revisión del uso de parámetros glóticos en la detección de
patología vocal.......................................................................... 54
4. Patologías vocales, bases de datos y herramientas para la ayuda al
diagnóstico............................................................................................. 59
4.1. Patologías vocales: clasificación y características generales.... 60
4.2. Bases de datos frecuentemente utilizadas y herramientas
para la ayuda al diagnóstico...................................................... 65
4.3. Base de datos y herramienta empleada para el estudio.......... 71
5. Métodos analíticos utilizados en el estudio........................................... 75
5.1. Naturaleza de los datos: descriptivos, normalidad y
homocedasticidad.................................................................... 76
5.2. Pruebas de comparación de distribuciones.............................. 80
5.2.1. Prueba t de Student..................................................... 81
5.2.2. Prueba U de Mann-Whitney......................................... 81
5.2.3. Prueba de Kolmogorov-Smirnov para dos muestras.... 82

xv
5.2.4. Prueba de las rachas de Wald-Wolfowitz..................... 82
5.2.5. Prueba de reacciones extremas de Moses................... 83
5.2.6. Tamaño del efecto........................................................ 83
5.3. Estudios de correlación lineal bivariada................................... 85
5.4. Análisis Factorial basado en componentes principales............. 87
5.5. Análisis Discriminante............................................................... 90
6. Experimentación y resultados............................................................... 95
6.1. Descripción de los parámetros y características generales de
la distribución de los mismos.................................................... 96
6.1.1. Resultados de las pruebas de normalidad................... 97
6.1.2. Resultados de los diagramas de caja............................ 103
6.1.3. Resultados de las pruebas de diferencia en las
distribuciones............................................................... 108
6.2. Relación entre los parámetros e importancia relativa de los
mismos...................................................................................... 120
6.2.1. Resultados de las pruebas de correlación bivariada..... 120
6.2.2. Resultados de las pruebas de análisis factorial............ 140
6.3. Detección de los sujetos en base a la presencia de patología
vocal.......................................................................................... 150
7. Contribuciones, conclusiones y líneas futuras....................................... 171
7.1. Contribuciones y conclusiones.................................................. 172
7.2. Líneas futuras............................................................................ 176

Referencias documentales.......................................................................... 177

Apéndice 1: Desarrollo de una herramienta para la captura,


almacenamiento y análisis visual de la señal de voz............... 197
Apéndice 2.1: Análisis descriptivo general de los parámetros.................... 201
Apéndice 2.2: Análisis descriptivo de los parámetros: diagramas de caja.. 215
Apéndice 2.3: Análisis descriptivo de los parámetros: normalidad............. 233
Apéndice 2.4: Análisis descriptivo de los parámetros: homogeneidad de
varianzas............................................................................... 249
Apéndice 3: Pruebas de diferencias de medias (t-test) de los
parámetros.............................................................................. 261
Apéndice 4: Contrastes no paramétricos de los parámetros...................... 267
Apéndice 5: Pruebas de correlación (τ-Kendall) de los parámetros............ 277
Apéndice 6: Análisis factorial de los parámetros......................................... 297

xvi
Índice de tablas

Tabla 1-1. Patologías principales presentes en la base de


datos utilizada.......................................................... 7
Tabla 1-2. Patologías orgánicas asociadas a las listadas en la
Tabla 1-1 presentes en la base de datos utilizada... 7
Tabla 3-1. Parámetros de perturbación y de energía
utilizados en el estudio. Los parámetros 1-7 están
estimados a partir de la fuente glótica. El
parámetro 8 está estimado a partir de la onda
mucosa y de la onda acústica promedio. Los
parámetros 9-14 están estimados a partir de la
onda mucosa. La numeración establecida es de
carácter interno....................................................... 45
Tabla 3-2. Parámetros biométricos utilizados en el estudio.
Todos los parámetros están estimados a partir de
la envolvente de la densidad espectral de potencia
de la fuente glótica. La numeración establecida es
de carácter interno, y tiene en cuenta el resto de
parámetros con los que se trabaja en esta tesis...... 49
Tabla 3-3. Parámetros biomecánicos utilizados en el estudio.
Los parámetros 35-40 están estimados a partir de
la envolvente de la densidad espectral de potencia
de la onda acústica promedio. Los parámetros 41-
46 están estimados a partir de la envolvente de la
densidad espectral de potencia de la onda
mucosa. La numeración establecida es de carácter
interno, y tiene en cuenta el resto de parámetros
con los que se trabaja en esta tesis......................... 52
Tabla 3-4. Parámetros temporales utilizados en el estudio.
Todos los parámetros están estimados a partir de
la fuente glótica y de la onda mucosa. La
numeración establecida es de carácter interno, y
tiene en cuenta el resto de parámetros con los
que se trabaja en esta tesis...................................... 54
Tabla 4-1. Patologías vocales frecuentes, junto con una breve
descripción............................................................... 63
Tabla 4-2. Otras herramientas relacionadas con el
tratamiento de la voz............................................... 70
Tabla 5-1. Valores descriptivos calculados para todos los
sujetos, para el subconjunto de sujetos con
patología vocal y para el subconjunto de sujetos
normofónicos........................................................... 76
Tabla 5-2. Valores descriptivos calculados para todos los
sujetos...................................................................... 80

xvii
Tabla 5-3. Interpretación cualitativa de los valores del
tamaño del efecto, según Cohen (Cohen, J., 1988). 84
Tabla 5-4. Interpretación cualitativa de los valores del
tamaño del efecto y relación con el coeficiente de
correlación, según Hopkins (Hopkins, W.G., 2000).. 84
Tabla 5-5. Escala de interpretación de los valores de
correlación de Bisquerra (Bisquerra,R., 1987)......... 86
Tabla 6-1. Normalidad de los parámetros en la base de datos
femenina y masculina según la prueba de
Kolmogorov-Smirnov............................................... 97
Tabla 6-2. Normalidad de los parámetros en la base de datos
femenina y masculina según la prueba de
Kolmogorov-Smirnov, modificación de Lilliefors..... 98
Tabla 6-3. Normalidad de los parámetros en la base de datos
femenina y masculina según la prueba de Saphiro-
Wilk.......................................................................... 99
Tabla 6-4. Normalidad de los parámetros en la base de datos
femenina y masculina según las pruebas de
Kolmogorov-Smirnov, Kolmogorov-Smirnov,
modificación de Lilliefors y Saphiro-Wilk................. 101
Tabla 6-5. Proporción de los parámetros que se ajustan a la
distribución normal en la base de datos femenina:
todos los casos, casos normofónicos y casos
patológicos. En la última fila y en la última
columna, suma de los valores.................................. 102
Tabla 6-6. Proporción de los parámetros que se ajustan a la
distribución normal en la base de datos masculina:
todos los casos, casos normofónicos y casos
patológicos. En la última fila y en la última
columna, suma de los valores.................................. 102
Tabla 6-7. Listado de valores representativos de los
diagramas de caja de los parámetros de la base de
datos femenina........................................................ 103
Tabla 6-8. Listado de parámetros de la base de datos
femenina que cumplen el primero de los tres
criterios establecidos............................................... 104
Tabla 6-9. Listado de parámetros de la base de datos
femenina que cumplen el segundo de los tres
criterios establecidos............................................... 105
Tabla 6-10. Listado de parámetros de la base de datos
femenina que cumplen el tercero de los tres
criterios establecidos............................................... 105
Tabla 6-11. Listado de valores representativos de los
diagramas de caja de los parámetros de la base de
datos masculina....................................................... 106

xviii
Tabla 6-12. Listado de parámetros de la base de datos
masculina que cumplen el primero de los tres
criterios establecidos............................................... 106
Tabla 6-13. Listado de parámetros de la base de datos
masculina que cumplen el segundo de los tres
criterios establecidos............................................... 107
Tabla 6-14. Listado de parámetros de la base de datos
masculina que cumplen el tercero de los tres
criterios establecidos............................................... 107
Tabla 6-15. Listado de códigos de los parámetros de ambas
bases de datos que cumplen cada uno de los tres
criterios establecidos, y alguno de ellos.................. 108
Tabla 6-16. Rechazo de la hipótesis de igualdad de medias
según las pruebas t de Student y Mann-Whitney
en las bases de datos femenina y masculina para
todos los parámetros............................................... 110
Tabla 6-17. Rechazo de la hipótesis de igualdad de
distribuciones según las pruebas de Kolmogorov-
Smirnov (K-S) para dos muestras independientes y
de las rachas de Wald-Wolfowitz (W-W) en las
bases de datos femenina y masculina para todos
los parámetros......................................................... 112
Tabla 6-18. Rechazo de la hipótesis de igualdad de varianzas
según las pruebas de Levene de la varianza y de
las reacciones extremas de Moses en las bases de
datos femenina y masculina para todos los
parámetros.............................................................. 114
Tabla 6-19. Listado de parámetros de la base de datos
femenina que rechazan todas las hipótesis de
igualdad en las distribuciones, según las seis
pruebas realizadas................................................... 115
Tabla 6-20. Listado de parámetros de la base de datos
masculina que rechazan todas las hipótesis de
igualdad en las distribuciones, según las seis
pruebas realizadas................................................... 115
Tabla 6-21. Tamaño del efecto de los parámetros para las
bases de datos femenina y masculina..................... 116
Tabla 6-22. Parámetros de la base de datos femenina
ordenados según el tamaño del efecto................... 118
Tabla 6-23. Parámetros de la base de datos masculina
ordenados según el tamaño del efecto................... 119
Tabla 6-24. Correlaciones consideradas altas y muy altas
presentes en la base de datos femenina, según la
prueba de τ-Kendall................................................. 120

xix
Tabla 6-25. Observamos una fuerte relación entre el Jitter
(002), Desbalance de la masa del cuerpo (038),
Desbalance de la pérdida del cuerpo (039) y
Desbalance de la elasticidad del cuerpo (040), en
la base de datos femenina, todos los casos............. 122
Tabla 6-26. Observamos una fuerte relación entre el Jitter
(002), Desbalance de la masa del cuerpo (038),
Desbalance de la pérdida del cuerpo (039),
Desbalance de la elasticidad del cuerpo (040) y
Pérdida del cuerpo (036) en la base de datos
femenina, casos patológicos.................................... 122
Tabla 6-27. Observamos una fuerte relación entre el Jitter
(002), Desbalance de la pérdida del cuerpo (039) y
Desbalance de la elasticidad del cuerpo (040) en la
base de datos femenina, casos
normofónicos........................................................... 123
Tabla 6-28. Observamos una fuerte relación entre los
parámetros 2º Arm./Frecuencia Fundamental
MWC (009), Frecuencia del origen de la señal (024)
y Frecuencia del primer máximo (026), en la base
de datos femenina, todos los casos......................... 123
Tabla 6-29. Observamos una fuerte relación entre los
parámetros 2º Arm./Frecuencia Fundamental
MWC (009), Frecuencia del origen de la señal (024)
y Frecuencia del primer máximo (026), en la base
de datos femenina, casos patológicos..................... 123
Tabla 6-30. Observamos una fuerte relación entre los
parámetros Frecuencia del primer mínimo (027) y
Frecuencia del segundo máximo (028), en la base
de datos femenina, todos los casos......................... 124
Tabla 6-31. Observamos una fuerte relación entre los
parámetros Frecuencia del primer mínimo (027) y
Frecuencia del segundo máximo (028), en la base
de datos femenina, casos patológicos..................... 124
Tabla 6-32. Observamos una fuerte relación entre los
parámetros Frecuencia del primer mínimo (027) y
Frecuencia del segundo máximo (028), en la base
de datos femenina, casos normofónicos................. 124
Tabla 6-33. Observamos una fuerte relación entre los
parámetros Segunda banda de energía de la MWC
(012), Tercera banda de energía de la MWC (013)
y Cuarta banda de energía de la MWC (014), en la
base de datos femenina, todos los casos................. 125

xx
Tabla 6-34. Observamos una fuerte relación entre los
parámetros Segunda banda de energía de la MWC
(012), Tercera banda de energía de la MWC (013),
Cuarta banda de energía de la MWC (014) y
Primera banda de energía de la MWC (011), en la
base de datos femenina, casos patológicos............. 125
Tabla 6-35. Observamos una fuerte relación entre los
parámetros Amplitud del segundo mínimo (021) y
Amplitud del cuarto máximo (022), en la base de
datos femenina, todos los casos.............................. 126
Tabla 6-36. Observamos una fuerte relación entre los
parámetros Frecuencia del segundo mínimo (030)
y Frecuencia del cuarto máximo (031), en la base
de datos femenina, todos los casos......................... 126
Tabla 6-37. Observamos una fuerte relación entre los
parámetros Frecuencia del segundo mínimo (030)
y Frecuencia del cuarto máximo (031), en la base
de datos femenina, casos patológicos..................... 126
Tabla 6-38. Observamos una fuerte relación entre los
parámetros Frecuencia del segundo mínimo (030)
y Frecuencia del cuarto máximo (031), en la base
de datos femenina, casos normofónicos................. 126
Tabla 6-39. Observamos una fuerte relación entre los
parámetros Amplitud del primer máximo (017) y
Pérdida de la cubierta (042), en la base de datos
femenina, casos patológicos.................................... 127
Tabla 6-40. Observamos una fuerte relación entre los
parámetros Pitch (001), Frecuencia final (032),
Masa del cuerpo (035) y Elasticidad del cuerpo
(037), base de datos femenina, casos
normofónicos........................................................... 127
Tabla 6-41. Observamos una fuerte relación entre los
parámetros Shimmer en amplitud (003), Shimmer
en área (005) y Desbalance en masa de la cubierta
(044), en la base de datos femenina, casos
normofónicos........................................................... 128
Tabla 6-42. Observamos una fuerte relación entre los
parámetros Energía MWC/AAW (008) y Pérdida de
la cubierta (042), en la base de datos femenina,
casos normofónicos................................................. 128
Tabla 6-43. Correlaciones consideradas altas y muy altas
presentes en la base de datos masculina, según la
prueba de τ-Kendall................................................. 129

xxi
Tabla 6-44. Observamos una fuerte relación entre los
parámetros Jitter (002), Desbalance de la masa del
cuerpo (038), Desbalance de la pérdida del cuerpo
(039) y Desbalance de la elasticidad del cuerpo
(040), en la base de datos masculina, todos los
casos........................................................................ 130
Tabla 6-45. Observamos una fuerte relación entre los
parámetros Jitter (002), Desbalance de la masa del
cuerpo (038), Desbalance de la pérdida del cuerpo
(039), Desbalance de la elasticidad del cuerpo
(040) y Pérdida del cuerpo (036), en la base de
datos masculina, casos patológicos......................... 130
Tabla 6-46. Observamos una fuerte relación entre los
parámetros Jitter (002), Desbalance de la pérdida
del cuerpo (039) y Desbalance de la elasticidad del
cuerpo (040), en la base de datos masculina, casos
normofónicos........................................................... 131
Tabla 6-47. Observamos una fuerte relación entre los
parámetros 2º Arm./Frecuencia Fundamental
MWC (009), Frecuencia del origen de la señal (024)
y Frecuencia del primer máximo (026), en la base
de datos masculina, todos los casos........................ 131
Tabla 6-48. Observamos una fuerte relación entre los
parámetros 2º Arm./Frecuencia Fundamental
MWC (009), Frecuencia del origen de la señal (024)
y Frecuencia del primer máximo (026), en la base
de datos masculina, casos patológicos.................... 131
Tabla 6-49. Observamos una fuerte relación entre los
parámetros Segunda banda de energía de la MWC
(012), Tercera banda de energía de la MWC (013)
y Cuarta banda de energía de la MWC (014), en la
base de datos masculina, todos los casos................ 132
Tabla 6-50. Observamos una fuerte relación entre los
parámetros Segunda banda de energía de la MWC
(012) y Tercera banda de energía de la MWC
(013), en la base de datos masculina, casos
patológicos...............................................................
. 132
Tabla 6-51. Observamos una fuerte relación entre los
parámetros Pitch (001) y Elasticidad del cuerpo
(037), en la base de datos masculina, todos los
casos........................................................................ 133
Tabla 6-52. Observamos una fuerte relación entre los
parámetros Pitch (001), Frecuencia final (032),
Masa del cuerpo (035) y Elasticidad del cuerpo
(037), en la base de datos masculina, casos
normofónicos........................................................... 133

xxii
Tabla 6-53. Observamos una fuerte relación entre los
parámetros Frecuencia del segundo mínimo (030)
y Frecuencia del cuarto máximo (031), en la base
de datos masculina, todos los casos....................... 134
Tabla 6-54. Observamos una fuerte relación entre los
parámetros Frecuencia del segundo mínimo (030)
y Frecuencia del cuarto máximo (031), en la base
de datos masculina, casos patológicos................... 134
Tabla 6-55. Observamos una fuerte relación entre los
parámetros Frecuencia del segundo mínimo (030)
y Frecuencia del cuarto máximo (031), en la base
de datos masculina, casos normofónicos............... 134
Tabla 6-56. Bloques de parámetros que presentan una
correlación considerada muy alta en las bases de
datos femenina y masculina, todos los casos.......... 135
Tabla 6-57. Bloques de parámetros que presentan una
correlación considerada muy alta en las bases de
datos femenina y masculina, casos patológicos...... 136
Tabla 6-58. Bloques de parámetros que presentan una
correlación considerada muy alta en las bases de
datos femenina y masculina, casos
normofónicos........................................................... 136
Tabla 6-59. Listado de parámetros utilizados en el estudio,
junto con el índice de correlación que éstos
presentan con la variable que discrimina los
sujetos patológicos de los normofónicos, para la
base de datos femenina. Los parámetros aparecen
ordenados en base al índice de correlación............ 137
Tabla 6-60. Listado de parámetros utilizados en el estudio,
junto con el índice de correlación que éstos
presentan con la variable que discrimina los
sujetos patológicos de los normofónicos, para la
base de datos masculina. Los parámetros
aparecen ordenados en base al índice de
correlación............................................................... 139
Tabla 6-61. Listado de los parámetros agrupados por factores
para todos los casos, sin rotación y para las bases
de datos femenina y masculina............................... 141
Tabla 6-62. Listado de los parámetros agrupados por factores,
casos normofónicos, sin rotación y para las bases
de datos femenina y masculina............................... 142
Tabla 6-63. Listado de los parámetros agrupados por factores,
casos patológicos, sin rotación y para las bases de
datos femenina y masculina.................................... 143

xxiii
Tabla 6-64. Listado de los parámetros agrupados por factores
para todos los casos, rotación varimax y para las
bases de datos femenina y masculina..................... 145
Tabla 6-65. Listado de los parámetros agrupados por factores,
casos normofónicos, rotación varimax y para las
bases de datos femenina y masculina..................... 147
Tabla 6-66. Listado de los parámetros agrupados por factores,
casos patológicos, rotación varimax y para las
bases de datos femenina y masculina..................... 148
Tabla 6-67. Resultado de la primera tanda de pruebas de
análisis discriminante, base de datos femenina...... 152
Tabla 6-68. Resultado de la segunda tanda de pruebas de
análisis discriminante, base de datos femenina...... 153
Tabla 6-69. Resultado de la tercera tanda de pruebas de
análisis discriminante, base de datos femenina...... 154
Tabla 6-70. Resultado de la cuarta tanda de pruebas de
análisis discriminante, base de datos femenina...... 154
Tabla 6-71. Resultado de la quinta tanda de pruebas de
análisis discriminante, base de datos femenina...... 155
Tabla 6-72. Resultado de la sexta tanda de pruebas de análisis
discriminante, base de datos femenina................... 156
Tabla 6-73. Resultado de la séptima tanda de pruebas de
análisis discriminante, base de datos femenina...... 157
Tabla 6-74. Resultado de la primera tanda de pruebas de
análisis discriminante, base de datos masculina..... 159
Tabla 6-75. Resultado de la segunda tanda de pruebas de
análisis discriminante, base de datos masculina..... 160
Tabla 6-76. Resultado de la tercera tanda de pruebas de
análisis discriminante, base de datos masculina..... 160
Tabla 6-77. Resultado de la cuarta tanda de pruebas de
análisis discriminante, base de datos masculina..... 160
Tabla 6-78. Resultado de la quinta tanda de pruebas de
análisis discriminante, base de datos masculina..... 161
Tabla 6-79. Resultado de la sexta tanda de pruebas de análisis
discriminante, base de datos masculina.................. 162
Tabla 6-80. Resultado de la séptima tanda de pruebas de
análisis discriminante, base de datos masculina..... 163
Tabla 6-81. Resultado detallado del estudio correspondiente
al uso de los factores extraídos a todos los
parámetros excepto el número 24 (Frecuencia
Origen Señal), base de datos femenina................... 165
Tabla 6-82. Resultado detallado del estudio correspondiente
al uso de todos los parámetros excepto los
temporales, base de datos masculina...................... 167

xxiv
Tabla 6-83. Resultados de la tasa general para la base de
datos global, y comparativa con la suma de las
tasas de las bases de datos femenina y masculina.. 168
Tabla AP2.1-1. Descriptivos de la base de datos femenina: media,
error típico de la media, mediana, moda,
desviación típica, varianza y asimetría..................... 202
Tabla AP2.1-2. Descriptivos de la base de datos femenina: error
típico de asimetría, curtosis, error típico de
curtosis, amplitud, mínimo, máximo, suma............. 203
Tabla AP2.1-3. Descriptivos de la base de datos femenina:
percentiles 10, 20, 25, 30 y 40................................. 205
Tabla AP2.1-4. Descriptivos de la base de datos femenina:
percentiles 60, 70, 75, 80 y 90................................. 206
Tabla AP2.1-5. Descriptivos de la base de datos masculina: media,
error típico de la media, mediana, moda,
desviación típica, varianza y asimetría..................... 208
Tabla AP2.1-6. Descriptivos de la base de datos masculina: error
típico de asimetría, curtosis, error típico de
curtosis, amplitud, mínimo, máximo, suma............. 209
Tabla AP2.1-7. Descriptivos de la base de datos masculina:
percentiles 10, 20, 25, 30 y 40................................. 211
Tabla AP2.1-8. Descriptivos de la base de datos masculina:
percentiles 60, 70, 75, 80 y 90................................. 212
Tabla AP2.3-1. Resultados de la prueba de Kolmogorov-Smirnov
de la base de datos femenina, todos los sujetos..... 234
Tabla AP2.3-2. Resultados de la prueba de Kolmogorov-Smirnov
de la base de datos femenina, sujetos
normofónicos........................................................... 235
Tabla AP2.3-3. Resultados de la prueba de Kolmogorov-Smirnov
de la base de datos femenina, sujetos con
patología vocal......................................................... 236
Tabla AP2.3-4. Resultados de la prueba de Kolmogorov-Smirnov
de la base de datos masculina, todos los sujetos.... 238
Tabla AP2.3-5. Resultados de la prueba de Kolmogorov-Smirnov
de la base de datos masculina, sujetos
normofónicos........................................................... 239
Tabla AP2.3-6. Resultados de la prueba de Kolmogorov-Smirnov
de la base de datos masculina, sujetos con
patología vocal......................................................... 240
Tabla AP2.3-7. Resultados de las pruebas de Kolmogorov-
Smirnov-Lilliefors y Saphiro-Wilk de la base de
datos femenina, todos los sujetos........................... 242
Tabla AP2.3-8. Resultados de las pruebas de Kolmogorov-
Smirnov-Lilliefors y Saphiro-Wilk de la base de
datos femenina, sujetos normofónicos y con
patología vocal......................................................... 243

xxv
Tabla AP2.3-9. Resultados de las pruebas de Kolmogorov-
Smirnov-Lilliefors y Saphiro-Wilk de la base de
datos masculina, todos los sujetos.......................... 245
Tabla AP2.3-10. Resultados de las pruebas de Kolmogorov-
Smirnov-Lilliefors y Saphiro-Wilk de la base de
datos masculina, sujetos normofónicos y con
patología vocal......................................................... 246
Tabla AP2.4-1. Resultados del test de Levene de homogeneidad
de varianzas de la base de datos femenina............. 250
Tabla AP2.4-2. Resultados del test de Levene de homogeneidad
de varianzas de la base de datos masculina............ 255
Tabla AP3-1. Resultados de la prueba t de diferencia de medias
de la base de datos femenina.................................. 262
Tabla AP3-2. Resultados de la prueba t de diferencia de medias
de la base de datos masculina................................. 264
Tabla AP4-1. Resultados de la prueba U de Mann-Whitney de la
base de datos femenina........................................... 268
Tabla AP4-2. Resultados de la prueba de reacciones extremas
de Moses de la base de datos femenina.................. 269
Tabla AP4-3. Resultados de la prueba de Kolmogorov-Smirnov
para dos muestras de la base de datos femenina... 270
Tabla AP4-4. Resultados de la prueba de las rachas de Wald-
Wolfowitz de la base de datos femenina................. 271
Tabla AP4-5. Resultados de la prueba U de Mann-Whitney de la
base de datos masculina.......................................... 272
Tabla AP4-6. Resultados de la prueba de reacciones extremas
de Moses de la base de datos masculina................. 273
Tabla AP4-7. Resultados de la prueba de Kolmogorov-Smirnov
para dos muestras de la base de datos masculina... 274
Tabla AP4-8. Resultados de la prueba de las rachas de Wald-
Wolfowitz de la base de datos masculina................ 275
Tabla AP5-1-1. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, todos
los casos (primera parte)......................................... 278
Tabla AP5-1-2. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, todos
los casos (segunda parte)........................................ 279
Tabla AP5-1-3. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, todos
los casos (tercera parte).......................................... 280
Tabla AP5-1-4. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, todos
los casos (cuarta parte)............................................ 280
Tabla AP5-2-1. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, casos
patológicos (primera parte)..................................... 281

xxvi
Tabla AP5-2-2. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, casos
patológicos (segunda parte).................................... 282
Tabla AP5-2-3. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, casos
patológicos (tercera parte)...................................... 283
Tabla AP5-2-4. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, casos
patológicos (cuarta parte)........................................ 283
Tabla AP5-3-1. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, casos
normofónicos (primera parte)................................. 284
Tabla AP5-3-2. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, casos
normofónicos (segunda parte)................................ 285
Tabla AP5-3-3. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, casos
normofónicos (tercera parte).................................. 286
Tabla AP5-3-4. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, casos
normofónicos (cuarta parte).................................... 286
Tabla AP5-4-1. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, todos
los casos (primera parte)......................................... 287
Tabla AP5-4-2. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, todos
los casos (segunda parte)........................................ 288
Tabla AP5-4-3. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, todos
los casos (tercera parte).......................................... 289
Tabla AP5-4-4. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, todos
los casos (cuarta parte)............................................ 289
Tabla AP5-5-1. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, casos
patológicos (primera parte)..................................... 290
Tabla AP5-5-2. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, casos
patológicos (segunda parte).................................... 291
Tabla AP5-5-3. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, casos
patológicos (tercera parte)...................................... 292
Tabla AP5-5-4. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, casos
patológicos (cuarta parte)........................................ 292

xxvii
Tabla AP5-6-1. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, casos
normofónicos (primera parte)................................. 293
Tabla AP5-6-2. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, casos
normofónicos (segunda parte)................................ 294
Tabla AP5-6-3. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, casos
normofónicos (tercera parte).................................. 295
Tabla AP5-6-4. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, casos
normofónicos (cuarta parte).................................... 295
Tabla AP6-1. Estructura factorial de la base de datos femenina,
todos los casos, sin rotación, a partir de la matriz
de componentes...................................................... 298
Tabla AP6-2. Estructura factorial de la base de datos femenina,
todos los casos, rotación varimax, a partir de la
matriz de componentes rotada............................... 299
Tabla AP6-3. Estructura factorial de la base de datos femenina,
casos patológicos, sin rotación, a partir de la
matriz de componentes........................................... 300
Tabla AP6-4. Estructura factorial de la base de datos femenina,
casos patológicos, rotación varimax, a partir de la
matriz de componentes rotada............................... 301
Tabla AP6-5. Estructura factorial de la base de datos femenina,
casos normofónicos, sin rotación, a partir de la
matriz de componentes........................................... 302
Tabla AP6-6. Estructura factorial de la base de datos masculina,
casos normofónicos, rotación varimax, a partir de
la matriz de componentes rotada............................ 303
Tabla AP6-7. Estructura factorial de la base de datos masculina,
todos los casos, sin rotación, a partir de la matriz
de componentes...................................................... 304
Tabla AP6-8. Estructura factorial de la base de datos masculina,
todos los casos, rotación varimax, a partir de la
matriz de componentes rotada............................... 305
Tabla AP6-9. Estructura factorial de la base de datos masculina,
casos patológicos, sin rotación, a partir de la
matriz de componentes........................................... 306
Tabla AP6-10. Estructura factorial de la base de datos masculina,
casos patológicos, rotación varimax, a partir de la
matriz de componentes rotada............................... 307
Tabla AP6-11. Estructura factorial de la base de datos masculina,
casos normofónicos, sin rotación, a partir de la
matriz de componentes........................................... 308

xxviii
Tabla AP6-12. Estructura factorial de la base de datos masculina,
casos normofónicos, rotación varimax, a partir de
la matriz de componentes rotada............................ 309

xxix
Índice de figuras

Fig. 1-1. Imagen de un laringoscopio (tomado de Guzmán, M.,


2014)..................................................................................... 10
Fig. 1-2. Imagen de un fibroscopio (tomado de Guzmán, M.,
2014)..................................................................................... 10
Fig. 1-3. Versión del cuestionario VR-QOL (tomado de Hogikyan, N.
D. & Sethuraman, G., 1999).................................................. 13
Fig. 1-4. Versión del cuestionario VHI atendiendo a los aspectos
social, físico y psicológico, respectivamente (tomado de
Kandogan, T. & Sanal, A., 2005)............................................ 14
Fig. 2-1. Espejo laringoscopio de Manuel García (tomado de
Fernández-González, S. et al 2006b)..................................... 18
Fig. 2-2. División simplificada de los pliegues vocales en dos capas
principales: cuerpo (body) y cubierta (cover) (tomado de
Martino,L.J., 2014)................................................................ 19
Fig. 2-3. Ciclo idealizado de vibración de los pliegues vocales.
Advertir que la parte inferior de los pliegues vocales guía
el movimiento de la parte superior, creando un
movimiento ondulatorio en la cubierta de los pliegues
conocido como onda mucosa (tomado de Story, B.H.,
2002)..................................................................................... 20
Fig. 2-4. Modelo de una masa de los pliegues vocales (tomado de
Flanagan, J.L. & Landgraf, L., 1968)....................................... 21
Fig. 2-5. Modelo de dos masas de los pliegues vocales (tomado de
Herbst, C.T. et al, 2013)......................................................... 22
Fig. 2-6. Modelo de tres masas de los pliegues vocales (tomado de
Story, B.H., 2002).................................................................. 23
Fig. 2-7. Triángulo vocálico del castellano, que muestra sus cinco
vocales cardinales................................................................. 25
Fig. 2-8. Modelo de concatenación de tubos del tracto vocal............ 25
Fig. 2-9. Modelo de producción de voz de Fant.................................. 26
Fig. 2-10. Ejemplo de espectro LPC en voz cantada, realizado con el
programa Dr. Speech (tomado de Huang, D.Z. & Watson,
C., 1998)................................................................................. 28
Fig. 2-11. Espectrograma de las palabras inglesas nineteenth
century, pronunciadas por una voz masculina (tomado de
Wikipedia, 2014i).................................................................. 30
Fig. 2-12. Espectro FFT de la palabra patata, realizado con el
programa lingWAVES (tomado de Villayandre, M. 2012).... 30
Fig. 2-13. Cepstrum correspondiente a un segmento de una vocal
(tomado de Robinson, T., 1998)............................................ 32
Fig. 3-1. Estimación de la derivada de la fuente glótica por
filtrado inverso...................................................................... 39
Fig. 3-2. Señal de voz de entrada (arriba) y estimación de la fuente
glótica (abajo)....................................................................... 39

xxx
Fig. 3-3. Estimación de la fuente glótica (arriba), de la onda acústica
promedio (centro) y de la onda mucosa (abajo)................... 40
Fig. 3-4. Densidad espectral de potencia de la fuente glótica
(arriba), de la onda acústica media (centro) y de la onda
mucosa (abajo)...................................................................... 41
Fig. 3-5. a) Transadmitancia del modelo biomecánico de tres masas
de los pliegues vocales. b) Densidad espectral de potencia
de la onda mucosa para una voz normofónica típica........... 42
Fig. 3-6. La densidad espectral de potencia de la onda mucosa se
puede dividir en cuatro bandas de energía. Los valores de
energía de cada banda corresponden a los parámetros
p11, p12, p13 y p14 (línea de rayas y puntos alternos)........ 45
Fig. 3-7. Densidad espectral de potencia de la fuente glótica y su
envolvente............................................................................ 46
Fig. 3-8. Envolvente de la densidad espectral de potencia de la
fuente glótica, y valores de amplitud y frecuencia que
conforman el primer surco................................................... 47
Fig. 3-9. Representación de algunos parámetros glóticos
biométricos........................................................................... 48
Fig. 3-10. Representación esquemática de los dos primeros surcos
de la envolvente de la densidad espectral de potencia de
la fuente glótica; (a) se corresponde con la forma esperada
de los surcos; (b) representa la forma real, donde se
aprecia que dos de los puntos esperados coinciden............ 50
Fig. 3-11. Representación esquemática de la envolvente de la
densidad espectral de potencia de la fuente glótica; (a) se
corresponde con la forma esperada del inicio de la señal,
donde se diferencian el punto de origen (or) y el primer
mínimo (m1); (b) representa la forma obtenida, donde se
aprecia que los dos puntos en cuestión coinciden............... 50
Fig. 3-12. Puntos singulares en un ciclo de fonación de acuerdo al
modelo L-F............................................................................ 53
Fig. 4-1. Pantalla de la aplicación MDVP, donde se aprecia la
representación vectorial conjunta de los parámetros
analizados............................................................................. 67
Fig. 4-2. Pantalla del módulo de evaluación de la calidad vocal de la
aplicación Dr. Speech 4 (tomado de Zaoming, D. & Huang,
H., 1998)................................................................................ 68
Fig. 4-3. Pantalla del módulo de edición de la aplicación MediVoz
Captura................................................................................. 69
Fig. 4-4. Pantalla de la aplicación WPCVox......................................... 69
Fig. 4-5. Pantalla principal de la aplicación BioMet®Phon.................. 72
Fig. 4-6. Pantalla de introducción de datos y configuración de la
aplicación BioMet®Phon....................................................... 73
Fig. 5-1. Diagrama de caja (boxplot) y sus elementos (tomado de
Pardo, A. & Ruiz, M.Á., 2002)................................................ 78

xxxi
Fig. 5-2. Representación de la función discriminante, de las
distribuciones de dos grupos de variables, de sus
centroides y de la distancia entre los centroides (tomado
de Pardo, A. & Ruiz, M.Á., 2002)........................................... 91
Fig. 6-1. Representación gráfica de los datos correspondientes a los
factores presentes en la tabla 6-73....................................... 158
Fig. 6-2. Representación gráfica de los datos correspondientes a los
parámetros presentes en la tabla 6-73................................. 158
Fig. 6-3. Representación gráfica de los datos correspondientes a los
factores presentes en la tabla 6-80....................................... 164
Fig. 6-4. Representación gráfica de los datos correspondientes a los
parámetros presentes en la tabla 6-80................................. 164
Fig. AP1-1. Captura de pantalla de la herramienta Adobe Audition....... 198
Fig. AP1-2. Captura de pantalla de la herramienta desarrollada............ 199

xxxii
1. Introducción
Capítulo 1: Introducción

1.1. Organización del presente documento

El presente documento contiene en su primer capítulo una introducción en la que


se explican las motivaciones del estudio junto con las características generales del
mismo, la hipótesis de partida, los objetivos de la tesis y el resumen de algunas de las
técnicas más significativas relacionadas con la detección de patologías vocales, que
han servido de punto de partida para desarrollar esta tesis doctoral: el análisis de la
vibración de los pliegues vocales mediante instrumental especializado (generalmente
visual) y el análisis perceptual o subjetivo de la voz.

El segundo capítulo recoge parte de la teoría básica en la que se fundamenta este


trabajo: se repasa el modelo de producción de la voz distinguiendo sus diferentes
componentes y también los distintos modelos propuestos para explicar la vibración de
los pliegues vocales. Finalmente, se concluye con una breve revisión del uso del
análisis acústico basado en el empleo de parámetros recogidos a partir de la señal de
voz para la detección de patología vocal.

El tercer capítulo está dedicado al núcleo de trabajo de la tesis: los parámetros


glóticos de la voz. El capítulo comienza con la descripción del procedimiento utilizado
para estimar las señales glóticas que dan lugar a los parámetros. A continuación
incluye la descripción de los parámetros glóticos específicos utilizados en este trabajo,
descripción que incluye una clasificación en base a su naturaleza –que ya introduce el
capítulo primero–, y el detalle de la técnica de extracción de los mismos. El capítulo
termina con una breve revisión de su uso en el campo de la detección de patología
vocal.

El cuarto capítulo comienza describiendo las patologías más frecuentes relacionadas


con el aparato fonador; después repasa de forma breve las bases de datos más
frecuentemente utilizadas para la detección de patologías vocales, así como las
herramientas que, haciendo uso de estas bases de datos o de otras, proporcionan
algún tipo de ayuda a la tarea diagnóstica. Para concluir, se describen las
características de la base de datos concreta empleada para la experimentación
realizada en este estudio, incluyendo en la descripción los protocolos utilizados para
grabar los registros de voz. También se menciona de forma breve la herramienta
elaborada para construir y analizar esta base de datos.

Podemos observar que el estado del arte del trabajo completo se encuentra
repartido entre los cuatro primeros capítulos: el primero de ellos repasa algunos
elementos relacionados de forma general con el trabajo realizado, mientras que los
tres siguientes se centran en aspectos más específicos que forman el núcleo de la tesis.

El quinto capítulo contiene una breve explicación sobre las características más
importantes de las técnicas estadísticas empleadas en el desarrollo de este trabajo:
métodos descriptivos, test de normalidad, pruebas de diferencia de distribuciones
estadísticas, estudios de correlación, análisis factorial basado en componentes
principales y análisis discriminante, realizadas con el objetivo de presentar una
completa descripción de los parámetros, precisar la importancia relativa de los

2
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

mismos, encontrar relaciones entre ellos y contrastar su capacidad discriminadora en


cuanto a la presencia de patología vocal.

El sexto capítulo ofrece por fin los resultados obtenidos en la experimentación


realizada. En primer lugar muestra los resultados referentes a las características
descriptivas de los parámetros, junto con los relacionados con las pruebas de
normalidad, los diagramas de caja y los test que detectan diferencias entre las
distribuciones del conjunto de sujetos con patología vocal y las distribuciones del
conjunto de sujetos sanos. A continuación expone los resultados de los estudios que
revelan la relación existente entre los parámetros, la importancia relativa que éstos
tienen a la hora de distinguir sujetos con patología vocal de sujetos sin ella y la posible
reducción de la dimensionalidad del problema. Por último, muestra los resultados
obtenidos en la tarea de detección propiamente dicha.

El séptimo y último capítulo está dedicado a las contribuciones y conclusiones del


trabajo, así como a las posibles futuras líneas de investigación que éste abre.

Por último, el documento presenta un conjunto de apéndices. El primero de ellos se


ocupa de describir una herramienta informática diseñada y utilizada para la grabación
de los registros de voz en las condiciones adecuadas. Los restantes apéndices (los
comprendidos entre el segundo y el sexto) contienen información adicional
relacionada con los diferentes estudios estadísticos; en algunas ocasiones esta
información comprenderá el estudio completo, en otras, sin embargo, la gran
extensión de los mismos hace inconveniente su impresión en papel, por lo que el
apéndice incluirá un resumen del estudio o los elementos más importantes del mismo.
En todo caso, la tesis contiene adjunto un disco en el que sí van incluidos todos los
estudios en formato HTML1, de forma exhaustiva.

1.2. Motivaciones y características generales del presente estudio

Las patologías del aparato fonador se han constituido últimamente en una


preocupación que ha alcanzado cierta relevancia dentro de nuestra sociedad; la
calidad vocal es considerada de gran importancia para la población en general, pero
sobre todo para un porcentaje significativo de ella, que utiliza la voz como herramienta
de trabajo: locutores, cantantes, actores, abogados, vendedores, sacerdotes,
profesores, teleoperadores, etc. Como consecuencia de esto también ha aumentado el
interés de la comunidad médica, y científica en general (Gómez, P. et al, 2007), (Gómez
P. et al, 2005c), (Gómez, P. et al, 2011).

Por otra parte, hábitos poco saludables como el consumo de tabaco o el abuso del
alcohol, la exposición frecuente a ambientes polucionados o la contaminación acústica
que se produce en las ciudades, el uso excesivo o el mal uso de aparatos de aire
acondicionado, factores como la alergia o el envejecimiento, etc., contribuyen de
manera importante al hecho de agravar los trastornos vocales (Gómez, P. et al, 2007),
(Gómez, P. et al, 2011).

1
HyperText Markup Language, lenguaje de marcado estándar utilizado para la elaboración de páginas
web.

3
Capítulo 1: Introducción

En general, el hecho de que el diagnóstico de las patologías vocales sea temprano


influye en el éxito de su tratamiento. En este sentido el análisis de la voz resulta
especialmente adecuado, debido a que en determinadas ocasiones las patologías no
presentan síntomas fisiológicos visibles en estadios tempranos, pero sí es posible
observar ligeras perturbaciones en la voz. Por otro lado, la inspección directa
utilizando instrumental especializado como laringoscopios, fibroscopios o
videoendoscopios resulta mucho más costosa e incómoda para el paciente, razón por
la cual el análisis de la voz, que es mucho más rápido, económico y cómodo puede
servir de filtro para decidir si es necesaria o no una posterior intervención más agresiva
(Gómez P. et al, 2005c), (Gómez, P. et al, 2009b).

El presente estudio tiene por lo tanto su raíz en el análisis de la voz, con la intención
de contribuir en la resolución de los problemas arriba mencionados: es conveniente
tratar de realizar un pre-diagnóstico de las patologías vocales de manera rápida,
económica y no invasiva, cosa que además facilitará los diagnósticos tempranos.

En general, el estudio de la voz se ha basado tradicionalmente en métodos


subjetivos de evaluación basados en la percepción por parte de especialistas, en el
análisis acústico de la voz y en la inspección visual directa utilizando laringoscopios,
fibroscopios o video-endoscopios (Gómez P. et al, 2007). Esta tesis, basada en el
segundo de los aspectos citados, es decir, en el análisis acústico de la voz, propondrá
enfoques y estudios que complementan y amplían aquellos realizados anteriormente
en esta misma línea.

En particular, la tesis presentada se centra principalmente en el estudio de


parámetros extraídos de la señal conocida como fuente glótica. Es cierto que
parámetros obtenidos directamente de la señal de voz como las perturbaciones en la
frecuencia fundamental o en la amplitud, o como las relaciones señal-ruido o las
relaciones establecidas entre los primeros armónicos y los formantes se han mostrado
eficaces en cuanto a su capacidad para la detección de patología, pero la presencia del
tracto vocal en la señal analizada provoca cierta contaminación en la misma debido a
las influencias fonético-acústicas que aquél produce (Gómez, P. et al, 2005a). Para
evitar este efecto, nuestro grupo de investigación ha conseguido estimar la señal
conocida como fuente glótica, eliminando del modelo la función de transferencia
asociada al tracto vocal a través del uso de técnicas de filtrado inverso. La fuente
glótica representa directamente el movimiento de los pliegues vocales, y se puede
descomponer a su vez en dos señales diferentes: la onda acústica promedio, asociada
al movimiento del cuerpo del pliegue vocal y la onda mucosa, asociada al movimiento
de la cubierta del pliegue vocal (Gómez, P. et al 2005c).

A partir de las señales glóticas mencionadas se han extraído un conjunto de nuevos


parámetros, que podemos clasificar atendiendo a su naturaleza en los siguientes
grupos (Gómez P. et al, 2009), (Fernández-Baillo, R. et al, 2007), (Fernández-Baillo, R. &
Gómez-Vilda, P., 2009):

4
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

 Parámetros de perturbación y energía: los primeros reflejan las diferencias de


distintos valores característicos de la fuente glótica con respecto a los valores
medios recogidos en su propio entorno; los segundos recogen valores
relacionados con la energía de la onda mucosa o de la onda acústica promedio.
 Parámetros espectrales o biométricos: relacionados con la forma característica
asociada a la envolvente de la densidad espectral de potencia de la fuente
glótica.
 Parámetros biomecánicos: relacionados con características mecánicas asociadas
directamente a los pliegues vocales: masas, pérdidas de energía y elasticidades,
así como sus desbalances. Referidos tanto al cuerpo como a la cubierta de los
pliegues vocales.
 Parámetros temporales: relacionados con puntos singulares extraídos de la
representación en el dominio del tiempo de un ciclo de fonación de la fuente
glótica.

La aportación más importante de la tesis consiste en el análisis estadístico de este


conjunto de parámetros, con un objetivo claro: identificar los parámetros y conjuntos
de los mismos que tienen mayor capacidad discriminadora para detectar presencia de
patología vocal.

También es importante descubrir posibles relaciones entre los parámetros, de cara


a reducir la dimensionalidad del problema, ya que es experimentalmente conocido que
en problemas de clasificación los conjuntos demasiado grandes aumentan la
probabilidad de encontrar redundancias (ruido), pudiendo comprometer los resultados
(Gómez, P. et al, 2005a). Por otro lado es conveniente, desde un punto de vista
computacional, trabajar con un conjunto lo más reducido posible de datos. Además,
las representaciones gráficas, útiles para visualizar resultados, precisan de una
dimensionalidad reducida.

El protocolo utilizado en la experimentación se basará por tanto en los siguientes


pasos:

1. Análisis descriptivo de los parámetros, prestando especial atención a la


separación entre los dos grupos esenciales en nuestro estudio: personas con
patología vocal y personas sanas desde el punto de vista vocal.
2. Análisis de normalidad de los parámetros, teniendo también en cuenta la
distinción realizada en el punto anterior.
3. Prueba paramétrica de diferencia de medias entre los dos grupos mencionados.
Será incluida, además, la medida de análisis complementario tamaño del efecto,
para valorar la relevancia de la diferencia encontrada.
4. Contrastes no paramétricos entre los dos grupos mencionados. En particular,
pruebas de Mann-Whitney, Moses, Kolmogorov-Smirnov y Wald-Wolfowitz.
5. Estudios de correlación lineal bivariada entre los diferentes parámetros, y
también entre cada uno de ellos y la variable que representa el criterio de
pertenencia al grupo de sujetos normofónicos.

5
Capítulo 1: Introducción

6. Análisis Factorial basado en Componentes Principales sobre el conjunto


completo de los parámetros, y también sobre subconjuntos significativos o
destacados de los mismos.
7. Análisis Discriminante, sobre el conjunto completo de los parámetros y sobre
subconjuntos significativos o destacados de los mismos. También aplicaremos
este análisis a los factores obtenidos en el punto anterior.

El protocolo descrito se llevará a cabo utilizando una base de datos robusta y


equilibrada que contiene doscientos sujetos. Cien de ellos corresponden al género
masculino y los restantes cien corresponden al género femenino; a su vez, la mitad de
ellos presentan distintos tipos de patología vocal y la otra mitad corresponde a voces
etiquetadas como normales o normofónicas, de tal modo que contamos con cuatro
grupos diferenciados: cincuenta sujetos masculinos con patología vocal, cincuenta
sujetos masculinos sin ella, cincuenta sujetos femeninos con patología vocal y
cincuenta sujetos femeninos sin ella (Gómez P. et al, 2009).

La distinción entre géneros resulta de especial importancia debido a las diferencias


orgánicas existentes entre ambos. En general, el estudio tiene en cuenta las diferentes
recomendaciones conocidas al respecto que afirman que las muestras deben contener
representantes tanto masculinos como femeninos, pero que las diferencias físicas
deben ser tenidas en cuenta (Ruiz, M.T. & Verbrugge, L.M., 1997). Sin embargo, en los
estudios de detección haremos algunas pruebas complementarias en los que la base
de datos se utiliza de manera global, sin distinguir los géneros. Comprobaremos que,
en tales casos, los resultados obtenidos son también bastante satisfactorios.

Este estudio está centrado en las patologías de la voz. Sin embargo, este concepto
es amplio, pues incluye alteraciones procedentes de disfunciones orgánicas de la
laringe, así como problemas funcionales, respiratorios, neurológicos, de resonancia,
congénitos o psiquiátricos. La presente tesis se centrará sobre todo en la disfonía
resultado de patologías de la voz basadas en alteraciones orgánicas de la laringe,
incluso más específicamente, de los pliegues vocales2. Los pliegues vocales son
estructuras frágiles que juegan un papel crucial en el proceso de producción de voz, y
un gran porcentaje de las enfermedades vocales se debe a algún tipo de alteración o
mal funcionamiento de ellos (Gómez, P. et al, 2011). Sin embargo, el estudio también
puede incluir otro tipo de patologías vocales, siempre y cuando manifiesten una
perturbación en los parámetros utilizados.
De acuerdo con lo anterior, y de forma general, cabe mencionar que las posibles
patologías principales que podemos encontrar en los sujetos que forman la base de
datos utilizada son de alguna de las categorías que aparecen en la tabla 1-1 (Dworkin,
J.P. & Meleca, R.J., 1997).

2
Aún así, en lo que resta de documento hablaremos genéricamente de “patologías vocales” o de
“patologías de la voz”, refiriéndonos exclusivamente a las que aquí tratamos.

6
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla 1-1. Patologías principales presentes en la base de datos utilizada.


Angioma Laringitis infecciosa
Carcinoma Nódulos/micronódulos
Disfonía espasmódica Parálisis unilateral
Edema/Edema de Reinke Parálisis bilateral
Granuloma de contacto Paresia
Hematoma Pólipo
Laringitis no infecciosa crónica Quiste
Laringitis no infecciosa por reflujo Sulcus

Además, podemos encontrar las siguientes patologías orgánicas asociadas a las


anteriores en la tabla 1-2.

Tabla 1-2. Patologías orgánicas asociadas a las listadas en la Tabla 1-1


presentes en la base de datos utilizada.
Defecto de cierre Participación de bandas ventriculares
Hiato longitudinal Lesión de contacto
Hiperfunción

Por último, destacaremos que el presente estudio incluye la elaboración de una


aplicación informática completa que facilita los estudios estadísticos realizados: se
trata de una herramienta que captura la señal de voz y que se preocupa de medir
aspectos relacionados con la calidad de la voz grabada, filtrando aquellas señales
inválidas para el estudio. También se caracteriza por su facilidad de manejo, cuestión
especialmente apropiada teniendo en cuenta que puede ser utilizada por personas con
poca experiencia en el uso de programas informáticos, y por su capacidad de
integrarse en una página web y de enviar los ficheros grabados a un servidor central
para su posterior análisis (Santos, R., 2005).

1.3. Hipótesis de partida

Los parámetros glóticos extraídos suponen una aportación en sí mismos por parte
de nuestro grupo de investigación, por lo que demandan un completo estudio
estadístico de cara a establecer relaciones entre ellos, a reducir la dimensionalidad del
problema y a determinar su importancia relativa para las tareas de detección. Este
estudio será realizado bajo un enfoque descriptivo-exploratorio, sin utilizar hipótesis
previas.

Por otro lado, los parámetros utilizados frecuentemente en el análisis objetivo y no


invasivo de la voz realizado para detectar presencia de patología vocal se basan
precisamente en la propia señal de voz. Esta señal se caracteriza por tener fuertes
influencias fonético-acústicas debido a la presencia del tracto vocal. El presente
estudio trabaja exclusivamente con parámetros extraídos a partir de la fuente glótica,
libre de estas influencias, por lo que esperamos obtener mejores resultados en la
detección de patología vocal.

7
Capítulo 1: Introducción

1.4. Objetivos

Los objetivos marcados para la consecución del trabajo son los siguientes:

 Realizar y presentar un completo estudio estadístico-descriptivo de los


parámetros glóticos empleados en el estudio.

 Realizar y presentar diferentes estudios estadístico-inferenciales conocidos sobre


los parámetros glóticos empleados en el estudio, buscando diferencias entre los
grupos con patología vocal y normofónico.

 Realizar y presentar un estudio de correlación lineal bivariada sobre los


parámetros glóticos empleados en el estudio; por una parte, de todos los
parámetros entre sí, y por otra, de cada parámetro con la variable que
representa el criterio de pertenencia al subconjunto de sujetos normofónicos.

 Aplicar el conocido método de reducción de la dimensionalidad Análisis Factorial


basado en Componentes Principales sobre los parámetros glóticos empleados en
el estudio, presentando los resultados.

 Tratar de, a partir de los dos objetivos anteriores, alcanzar conclusiones acerca
de las posibles relaciones establecidas entre los parámetros glóticos empleados
en el estudio y acerca de la importancia relativa de los mismos.

 Aplicar el conocido método de clasificación Análisis Discriminante sobre


diferentes conjuntos de parámetros glóticos y de factores empleados en el
estudio, con el criterio “presencia o ausencia de patología vocal”, presentando
los resultados.

 Tratar de, a partir del objetivo anterior, alcanzar conclusiones acerca de la


idoneidad de los diferentes conjuntos de parámetros glóticos y factores
analizados desde el punto de vista de su capacidad para detectar individuos que
presentan patología vocal.

 Diseñar e implementar una herramienta informática de manejo sencillo que sea


útil para realizar captura de la voz en condiciones favorables para el posterior
análisis.

 Presentar el método de extracción de la señal glótica y de sus componentes, y de


los parámetros extraídos de ellas que se utilizarán en el estudio.

 Describir los parámetros glóticos empleados en el estudio, clasificándolos


previamente por su naturaleza.

8
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

1.5. Revisión de los análisis directo y perceptual para la detección de patología


vocal

El diagnóstico de la patología de la voz se ha basado en el análisis visual directo


desde que Manuel P. Rodríguez García inventara el espejito laringoscópico a mediados
del siglo XIX (Tucker, H.M., 1993), (Fernández-González, S. et al, 2006b), (García-Ruiz,
J., 2010a).
Desde entonces, el instrumental empleado para el propósito que nos ocupa no ha
dejado de evolucionar: endoscopios, videoestroboscopios, videokimógrafos,
electroglotógrafos, etc. Sólo en las últimas décadas la detección basada en el análisis
acústico de la voz ha incrementado su importancia (Baken, R.J. & Orlikoff, R., 2000),
debido fundamentalmente a la necesidad de establecer diagnósticos tempranos
mediante técnicas no invasivas. Como hemos apuntado arriba, la calidad vocal es
considerada de gran importancia en nuestros tiempos, y lesiones en el aparato fonador
pueden llegar a ocasionar graves problemas de comunicación que afectan a la calidad
de vida de los individuos. En casos extremos estos trastornos pueden llevar a la
depresión clínica y a la falta de interés por la vida (Gómez, P. et al, 2011), (Chu, E.A. &
Kim, Y.J., 2008). Estos hechos, junto con los ya expuestos en el apartado 1.2, han
motivado el desarrollo científico de diferentes técnicas orientadas a la ayuda al
diagnóstico de las patologías de la voz, de bajo coste y no agresivas para el paciente: el
ya mencionado análisis acústico, desarrollado a partir de parámetros de la propia señal
de voz o a partir de parámetros glóticos y el análisis perceptual o subjetivo, basado en
la audición del sujeto por parte de oídos expertos. Esta última técnica permite,
además, no sólo distinguir entre voces normales o disfónicas, es capaz también de
ofrecer una gradación de la posible patología (aunque también existen estudios
basados en análisis acústico que trabajan en esta misma línea (Gómez, P. et al, 2009),
(Gómez, P. et al, 2011)).

Este apartado tiene un doble propósito. En primer lugar repasaremos de forma


breve aquellos instrumentos especializados empleados con más frecuencia en el
estudio de la vibración de los pliegues vocales de cara el diagnóstico directo de la
patología vocal. Después revisaremos algunas cuestiones relacionadas con el análisis
perceptual o subjetivo.

1.5.1. Instrumental utilizado en la inspección directa del aparato fonador

 Endoscopios, laringoscopios y fibroscopios: En general, los endoscopios son


instrumentos sanitarios en forma de tubo que contienen una luz que permite la
visualización del interior de un órgano hueco, introduciéndolo a través de una
cavidad natural, una lesión o una pequeña incisión quirúrgica. Los laringoscopios
(ver figura 1-1) son endoscopios que están específicamente diseñados para la
observación de la laringe y los pliegues vocales. Los fibroscopios, por su parte
(ver figura 1-2), son endoscopios que se caracterizan por su estructura flexible, lo
que permite una fonación más normalizada. Por último, mencionar que si los
endoscopios llevan incorporada una pequeña cámara de vídeo se denominan

9
Capítulo 1: Introducción

videoendoscopios (Wikipedia, 2014b), (Wikipedia, 2014c), (Wikipedia, 2014d),


(Watanabe, J., Bonilla, J.J. & Villanueva, M., 2006).

Fig. 1-1. Imagen de un laringoscopio (tomado de


Marco Guzman, 2014).

Fig. 1-2. Imagen de un fibroscopio (tomado de Marco


Guzman, 2014).

 Videoestroboscopios: permiten visualizar el movimiento vibratorio de los


pliegues vocales en cámara lenta, a través de la iluminación de la laringe con luz
estroboscópica que tiene una frecuencia ligeramente diferente a la de la
vibración de los pliegues vocales. Exigen un período de fonación sostenida para
la sincronización del flash estroboscópico, motivo por el cual no registran el inicio
de la fonación. Además, no son eficaces cuando el individuo padece una
patología que altera el movimiento vibratorio de tal modo que lo convierte en
caótico (casos que por lo general se asocian a patologías graves) o cuando se
producen cambios de frecuencia bruscos en la fonación registrada (por ejemplo,
si se producen toses durante la fonación, o en la voz cantada). En cualquier caso,
los resultados obtenidos a partir de las imágenes estroboscópicas son de gran
valor clínico: permiten detectar lesiones mínimas que pueden ser pasadas por
alto con estudios de endoscopia rígida o fibrolaringoscopia, como pequeñas
áreas de fibrosis o cicatrices. También son capaces de distinguir lesiones que
10
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

pueden confundirse entre ellas en una laringoscopia convencional (aquellas que


son morfológicamente parecidas pero que tienen distinto patrón de vibración)
(Gómez, P., 2002), (Vilaseca-González, I., 2008), (Fernández-González, S. et al,
2006a).

 Videokimógrafos: basados en la tecnología de la televisión de alta velocidad.


Reconstruyen la imagen a velocidades de hasta veinte mil imágenes por
segundo. Permiten visualizar el movimiento de los puntos de un pliegue vocal,
apreciando detalles que no son perceptibles a través del estroboscopio, además
de resolver los problemas arriba mencionados que éste presenta (Gómez, P.,
2002), (Fernández-González, S. et al, 2006a).

 Electroglotógrafos: permiten monitorizar el movimiento de vibración de los


pliegues vocales midiendo las variaciones de impedancia resultantes del paso de
una pequeña corriente alterna a través de los tejidos del cuello por medio de un
par de electrodos de contacto ubicados a ambos lados del cartílago tiroideo a la
altura de los pliegues vocales. Se trata de una técnica no invasiva y la señal
resultante se denomina electroglotograma y es proporcional a la superficie de
contacto entre ambos pliegues en el punto de cierre glótico, resultando muy útil
para determinar la frecuencia fundamental y sus alteraciones. Frecuentemente
van incorporados a los videoestroboscopios, por lo que se suelen combinar los
beneficios de ambas técnicas (Gómez, P., 2002), (Fernández-González, S. et al,
2006a). Algunos autores han parametrizado esta señal con el objetivo de
discriminar voces con patología vocal de voces sanas, obteniendo tasas globales
de acierto superiores al 80% (McGillion, M.A., Ritchings, R.T. & Moore, C. J.,
1998), (McGillion, M.A., 2000), (Ritchings, R.T. et al, 1999), (Ritchings, R.T.,
McGillion, M.A. & Moore, C. J., 2002).

1.5.2. Análisis perceptual o subjetivo de la voz

El análisis perceptual de la voz está basado en la pronunciación por parte del


paciente de determinadas vocales, palabras o frases completas que son escuchadas
por personal especializado: otorrinolaringólogos especializados en disfunciones
vocales, fonetistas, foniatras o logopedas, todos ellos entrenados y como consecuencia
de ello poseedores de lo que denominamos oído clínico, gracias al cual son capaces de
detectar disfonía en la voz del paciente. El análisis perceptual tiene una gran
importancia clínica debido a su ya apuntado carácter no invasivo, y al hecho de que
existen voces que no pueden ser estudiadas mediante la determinación de sus
parámetros acústicos, como las vocalizaciones con fuertes subarmónicos y
modulaciones, además de las voces caóticas o aperiódicas (Núñez Batalla, F. et al,
2004).

Por otra parte, el análisis perceptual también puede ser realizado por personal no
entrenado, como los propios pacientes. En ocasiones los pacientes se autoevalúan
tomando como referencia su propia capacidad para cubrir sus expectativas sociales y
profesionales, lo que puede resultar de interés. Por otro lado, diferentes estudios
demuestran que un nivel de entrenamiento demasiado elevado por parte del

11
Capítulo 1: Introducción

profesional puede conducir a desarrollar la tendencia de evaluar la voz con criterios


excesivamente exigentes. En este sentido se considera que la evaluación por parte de
un otorrinolaringólogo está a medio camino entre la de un foniatra (la más rigurosa) y
la del propio paciente (Fernández-Planas, A.M. et al, 2006), (Rosier, J.F. et al, 1998),
(McGuirt, W.F. et al, 1992).

El análisis perceptual se lleva a cabo habitualmente utilizando la conocida escala


GRBAS (Hirano, M. et al, 1988), que aunque no constituye un estándar de iure ha sido
validada en numerosas ocasiones en diferentes condiciones experimentales
(Dejonckere, P.H. & Lebacq, J., 1996).

La escala GRBAS evalúa cinco aspectos de la voz: el grado general de disfonía


(Grade, G), la rugosidad, ronquera o aspereza (Roughness, R), la presencia de escape
aéreo (Breathiness, B), la astenia o fatiga vocal (Asthenia, A) y la voz tensa o
constreñida (Strain, S). Todos los parámetros son evaluados con alguno de los
siguientes valores: cero (0) indica normalidad; uno (1) indica desviación leve; dos (2)
indica desviación moderada y tres (3) indica desviación intensa 3 (Gómez, P. et al,
2011), (Fernández Planas, A.M. et al, 2006).

El grado general (G) representa la percepción global respecto al grado de disfonía


del paciente. La rugosidad, ronquera o aspereza (R) se caracteriza por la ausencia de
un pitch o frecuencia fundamental estable como consecuencia de rupturas en la
secuencia de los ciclos de fonación, que aparecen y desaparecen intermitentemente
debido a la aperiodicidad de la vibración de los pliegues vocales. La presencia de
escape aéreo (B) se caracteriza porque la estructura armónica de la voz es
parcialmente sustituida por una componente de ruido turbulento, producida como
consecuencia de un cierre imperfecto de los pliegues vocales que provoca un escape
de aire. La astenia o fatiga vocal (A) se caracteriza porque la fonación es débil y la voz
se percibe sin fuerza, fatigada. Por último, la voz tensa o constreñida (S) se caracteriza
porque aparecen dificultades en la fonación asociadas al cierre de los pliegues vocales,
lo que hace que el individuo aumente el esfuerzo de fonación, incorporando
elementos como el estrés o la tensión vocal, que son apreciados en el resultado
(Gómez, P. et al, 2011).

Una de las cuestiones abiertas en la escala GRBAS consiste en el hecho de que las
diferentes características se miden de forma independiente, aunque generalmente se
suelen sumar las puntuaciones obteniendo una valoración global. Sin embargo, el
parámetro G, grado general, también recoge la percepción global de disfonía. Esta
cuestión es analizada desde un punto de vista estadístico en (Dejonckere, P. H. &
Lebacq, J., 1996), aunque el problema aún sigue abierto. Por otro lado, no está del
todo definido cómo contribuye cada uno de los parámetros para un nivel dado de
patología. Por ejemplo, no sabemos si una voz etiquetada con el valor uno (1) tanto en
el parámetro B como en el parámetro R (y con el valor cero (0) en los demás
parámetros) es más o menos disfónica que otra voz etiquetada con el valor dos (2) en
el parámetro R (y con el valor cero (0) en los demás parámetros) (Pedro Gómez Vilda
et al 2011).
3
Cuando hablamos de desviación nos referimos en los tres casos a desviación respecto a la normalidad.

12
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

A pesar de estas connotaciones la escala GRBAS es la más utilizada dentro del


análisis perceptual; otras escalas como The Buffalo Voice Profile (Wilson, D.K., 1987) o
como la VPA (The Vocal Profile Analysis Scheme) (Laver, J. et al, 1981) han ofrecido
peores resultados de fiabilidad, como podemos comprobar en (Webb, A.L. et al, 2007).
También es relativamente frecuente el uso de escalas de diseño propio, que presentan
el problema de la falta de estandarización, o de cuestionarios de calidad de vida como
el Voice-Related Quality of Life (VR-QOL) Measure (Hogikyan, N.D. & Sethuraman, G.,
1999), (Fernández Planas, A.M. et al, 2006) (ver figura 1-3) o el Voice Handicap Index
(VHI) (Jacobson, E.H. et al, 1997), (Fernández Planas, A.M. et al, 2006) (ver figura 1-4),
basados exclusivamente en la autopercepción del propio paciente acerca de aspectos
físicos, psicológicos y sociales relacionados con su propia calidad de voz (Hogikyan, N.
D. & Sethuraman, G., 1999), (Kandogan, T. & Sanal, A., 2005).

Fig. 1-3. Versión del cuestionario VR-QOL (tomado de Hogikyan, N. D. &


Sethuraman, G., 1999).

Mencionar por último que la escala GRBAS ha sido frecuentemente estudiada,


apareciendo alguna variante de la misma. En (Pinho, S.R. & Pontes, P., 2002), por
ejemplo, podemos observar cómo el parámetro G es interpretado como grado de
ronquera y no como grado general de disfonía, obteniendo así la escala RASAT (siglas
correspondientes a Ronquera, Aspereza, Soplosidad, Astenia y Tensión). También
encontramos en (Pinho, S.R. & Pontes, P., 2002) y en (Yamauchi, E.J. et al, 2009) la
ampliación de las escalas GRBAS y RASAT con un nuevo parámetro I correspondiente a
la inestabilidad vocal, y trabajando por lo tanto con las escalas GRBASI y RASATI,
respectivamente.

13
Capítulo 1: Introducción

Fig. 1-4. Versión del cuestionario VHI atendiendo a los aspectos social, físico y
psicológico, respectivamente (tomado de Kandogan, T. & Sanal, A., 2005).

14
2. Producción y fisiología de la voz
Capítulo 2: Producción y fisiología de la voz

2.1. Teorías de la fonación

2.1.1. Antecedentes históricos

La voz, como elemento diferencial de la especie humana y vehículo principal de


comunicación durante siglos, ha sido estudiada desde los orígenes de nuestra
civilización. Ya Platón la definió como “un impacto del aire que llega por los oídos al
alma”. Y Galeno de Pérgamo realizó estudios relacionados con la voz en el siglo II
después de Cristo, aunque hasta finales del siglo XV y principios del XVI no se recogen
los primeros trabajos de disección de la laringe humana, firmados por autores como
Leonardo da Vinci, Andrés Vesalio y Ambroise Paré. Estos trabajos constituyen los
primeros pasos en el conocimiento del aparato fonador, pero, por ejemplo, aún no
reflejan la importancia que los pliegues vocales tienen en el proceso de fonación
(García-Tapia, R., 1996).

En el siglo XVII, durante el Renacimiento, surge un auténtico interés por conocer la


fisiología laríngea. Fabricius d´Aquapendente, en sus obras de los primeros años del
siglo “De Laryngis Vocis Instrumento”, “De Locutione et ejus instrumentis” y “De
Brotorum loquela”, mantuvo que no es imprescindible la unión de dos cuerpos sólidos
para producir sonido, ya que los cuerpos blandos también lo producen al paso de un
flujo aéreo. Definió además el sonido de la voz como una alteración del estado del aire,
de una vibración, como consecuencia de una compresión. Realizó aportes muy
significativos en la morfología de los elementos relacionados con la fonación, y
consideró a la laringe humana como un tubo de órgano, pero más perfecto, puesto
que puede modificar sus dimensiones y contribuir así a la formación de los tonos.

Otra importante aportación del siglo XVII fue realizada por Bernard Lamy, que
intuyó el funcionamiento de los pliegues vocales en su obra “La réthorique ou l´art de
parler”, publicada en 1675 (Lamy, B., 1741).

Claude Perrault publicó en 1680 “Du bruit (et) De la musique des anciens”, donde
recoge ideas bastante ajustadas a la realidad que hoy conocemos. Perrault dividió los
sistemas sonoros en dos categorías: instrumentos de percusión e instrumentos por
verberación, situando al órgano productor de voz entre estos últimos. Para él la voz es
un ruido producido por la salida violenta del aire que en su paso hacia el exterior frota
las dos membranas que configuran la glotis. Además, explica la generación de las
distintas tonalidades de la voz por las variaciones de longitud y de tensión de los
pliegues vocales.

Denis Dodart, discípulo de Perrault, publicó una memoria en 1700 titulada


“Memoire sur les causes de la voix de l’homme et de ses différents tons”, en la que da
continuidad al trabajo de su maestro: concluye que la materia de la voz es el aire
contenido en los pulmones, empujado desde abajo hacia arriba por la acción muscular
torácica, y que la voz se produce exclusivamente en la glotis. La concavidad de la boca
no forma parte en la producción de la voz, pero por las diferentes consistencias de sus
partes contribuye al aliño de las resonancias bajas, dando a la voz el carácter agradable
que posee al oído del ser humano. Destaca además en su trabajo la definición del

16
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

ligamento vocal al que califica de estructura indispensable para la regulación de la


tensión del pliegue vocal. Determina como hecho fundamental que los pliegues
vocales se alargan a medida que aumenta la frecuencia y que cuanto más se alargan
más se aproximan sus bordes; esta propiedad le lleva a identificar a la laringe con los
instrumentos de lengüeta.

Antoine Ferrein, considerado como el iniciador de la fisiología experimental de la


laringe, en un estudio publicado en 1741 llamado “Sur l’organe immédiat de la voix et
de ses différens tons” llega a la conclusión de que en la laringe existen unas
estructuras comparables a cuerdas de violín que vibran por la acción de la corriente de
aire pulmonar, que ejerce la función del arco. Por analogía denominó a estas
estructuras cuerdas vocales, comparándolas también con las cuerdas dobles del
clavicordio. Concluyó además que modificando la tensión de estas cuerdas o pliegues
vocales se obtienen sonidos más o menos agudos.

Henri Dutrochet y Françoise Magendie, ya a principios del siglo XIX, compararon la


laringe con las boquillas vibrantes de los instrumentos de viento, además de realizar
nuevos avances en la anatomía funcional del aparato fonador.

Liskovious, en 1814, demostró que el movimiento vibratorio del pliegue vocal es


sobre todo horizontal, basándose en que si se toca un pliegue vocal con un estilete
apenas se modifica el sonido producido (Le Huche, F. & Allali, A., 2004), (Jackson-
Menaldi, M.C.A., 1992).

Félix Savart, en el estudio “Memorias sobre la voz humana” publicado en 1825


comparó la laringe con el reclamo de los pajareros: un pequeño tubo de sección
cuadrangular que colocado entre dientes y labios genera con la aspiración del aire
sonidos similares a los que produce la laringe humana.

Johanes Müller, profesor de fisiología en Berlín, presentó en 1837 a partir de sus


experimentos con lengüetas membranosas elásticas y con laringes aisladas obtenidas
de animales y cadáveres humanos un conjunto de conclusiones que siguen siendo
vigentes, y que dieron pie a la posterior teoría mioelástica de la fonación de Van den
Berg y al modelo fuente-filtro de Fant, que explican el comportamiento vibrador de los
pliegues vocales, y que combinados con el concepto cuerpo-cubierta de Minoru Hirano
amplían el conocimiento relacionado con la fonación humana hasta límites cercanos al
que se tiene hoy en día. Estas conclusiones fueron las siguientes:

 Los pliegues vocales aducidos en contacto uno con otro vibran al paso del aire
produciendo el sonido denominado voz.
 La ausencia en la preparación anatómica de epiglotis y bandas ventriculares
reduce el volumen del sonido emitido.
 El tono asciende cuando aumenta la tensión de los pliegues vocales.
 Cuando la tensión de los pliegues vocales se mantiene, un aumento de la presión
del aire significa un ascenso del tono equivalente a una quinta.

17
Capítulo 2: Producción y fisiología de la voz

Además, Müller realizó una valoración de la diferencia existente entre el registro de


pecho y el de falsete.
Las teorías de Müller no fueron completamente aceptadas por sus coetáneos, que
durante todo el siglo XIX mantuvieron la idea de comparar la laringe humana con
instrumentos de viento de diferentes tipos.

Como conclusión del apartado cabe mencionar que todos los procedimientos de
experimentación realizados durante los siglos comprendidos entre el XVI y el XIX
fueron realizados sobre laringes de cadáveres y sobre laringes artificiales. Sin embargo,
el procedimiento que más información real proporciona es la visión de cualquier
fenómeno desde su inicio hasta su culminación en su situación fisiológica normal,
hecho que sólo fue posible a partir de 1854 gracias a la invención del espejo laríngeo
(ver figura 2-1) por parte del pedagogo vocal Manuel Patricio Rodríguez García,
acontecimiento que se considera como el punto de partida de la laringología como
especialidad clínica (Wikipedia, 2014g), (American Otological Society, 1905).

Fig. 2-1. Espejo laringoscopio de Manuel García (tomado de Fernández-González, S.


et al, 2006b).

El lector interesado puede revisar, además de a las fuentes anteriormente citadas, a


(Fernández-González, S. et al, 2006b), (García-Ruiz, J., 2010a) y (Fernández-González, S.
& García-Tapia, R., 2013).

2.1.2. Teoría de Van den Berg

En 1958 Janwillem Van den Berg expuso la teoría más aceptada hasta la fecha sobre
la producción de la voz: su teoría mioelástica y aerodinámica (Van den Berg, J., 1958).
La teoría de Van den Berg tiene su antecedente en la teoría mioelástica enunciada por
Ewald en 1898, también denominada actualmente “teoría mioelástica primitiva” (Le

18
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Huche, F. & Allali, A., 2004), (García-Ruiz, J., 2010a), y se desarrolla en parte como
respuesta a la teoría neurocronáxica de Husson publicada en 1950 (Le Huche, F. &
Allali, A., 2004). En realidad, la teoría de Van den Berg evolucionará incluyendo las
aportaciones de diferentes investigadores a lo largo de distintos años comprendidos
entre 1958 y 1976: el propio Van den Berg, Smith, Cornut y Lafon, Perelló, Vallancien,
Liberman, Hirano y Wyke realizaron aportaciones significativas, sustituyendo en
ocasiones el nombre original por el de teoría mucoondulatoria, teoría mioelástica
perfeccionada o teoría impulsional (Le Huche, F. & Allali, A., 2004), (García-Ruiz, J.,
2010a).
De acuerdo con la teoría general de Van den Berg, durante la fonación los pliegues
vocales se aproximan lo suficiente como para provocar que la presión pulmonar
aumente lo bastante como para forzar la separación de los pliegues (es decir, la
apertura glótica). Ello hace que se emita un breve pulso de flujo de aire glótico, que
reduce la presión pulmonar, y que junto a las fuerzas elásticas de recuperación induce
un nuevo cierre glótico. La sucesión de estos fenómenos establece el régimen de
vibración de los pliegues vocales durante la fonación (Gómez, P., 2002), (Story, B. H.,
2002).
Liberman, en 1968, ofrece una explicación más detallada del ciclo vibratorio de los
pliegues vocales, afirmando que dos tipos de fuerzas actúan sobre ellas:
 Fuerzas aerodinámicas y aeroestáticas desplazan los pliegues vocales de su
posición de aducción en su preparación para la fonación.
 Fuerzas del tejido que actúan restituyendo los pliegues a su posición de
aducción.

Fig. 2-2. División simplificada de los pliegues vocales


en dos capas principales: cuerpo (body) y cubierta
(cover) (tomado de Martino, L.J, 2014).
En esencia este comportamiento es un proceso biomecánico, que según la teoría
miomucoviscoelástica de Hirano (Hirano, M., 1974) se fundamenta en los conceptos de
cuerpo y cubierta del pliegue vocal, y en el de onda mucosa. En realidad, el pliegue
vocal está constituido por cinco capas que, desde un punto de vista mecánico, pueden

19
Capítulo 2: Producción y fisiología de la voz

agruparse en tres: la cubierta, formada por el epitelio y la lámina propia superficial; la


transición, formada por el ligamento vocal (lámina propia intermedia y profunda) y el
cuerpo, formado por el músculo tiroaritenoideo (Godino Llorente, J.I., 2002).
Sin embargo, para destacar el concepto y la importancia de la onda mucosa nos
basta con una simplificación de la clasificación anterior, realizada por Hirano, y según
la cual los diferentes tejidos que forman el pliegue vocal se agrupan en dos tipos de
estructuras con diferente comportamiento biomecánico: la cubierta (cover en inglés:
epitelio y capas superficial e intermedia de la lamina propia) y el cuerpo (body en
inglés: capa profunda de la lamina propia y las fibras del músculo tiroaritenoideo) (ver
figura 2-2).
La cubierta es muy elástica y está diseñada para garantizar un choque elástico de un
pliegue contra otro, aunque carece de capacidad de contracción. El cuerpo es más
rígido y puede contraerse para ajustar la rigidez y concentración de masa vibrante. En
un ciclo de vibración los pliegues empiezan a separarse por la parte subglótica, y una
vez separados se vuelven a unir también por la parte subglótica (ver figura 2-3). Esta
diferencia de fase produce un movimiento en la cubierta en forma de onda viajera,
que se denomina onda mucosa, ya que los pliegues vocales están compuestos de una
doble capa vibratoria, es decir, se les considera un vibrador de doble estructura
(Gómez, P., 2002). Dejonckere profundizó en este asunto en su teoría
osciloimpedancial publicada en 1981 (Le Huche, F. & Allali, A., 2004), (García-Ruiz, J.,
2010a).
El concepto de onda mucosa resulta de gran importancia en el desarrollo de este
trabajo. La presencia o ausencia de la misma dentro de la señal glótica constituye por
sí mismo un indicador de patología vocal, y, como veremos, muchos de los parámetros
utilizados en el estudio están directamente relacionados con ella.

Fig. 2-3. Ciclo idealizado de vibración de los pliegues vocales. Advertir que la parte
inferior de los pliegues vocales guía el movimiento de la parte superior, creando un
movimiento ondulatorio en la cubierta de los pliegues conocido como onda mucosa
(tomado de Story, B.H., 2002).

2.2. Modelos de representación de los pliegues vocales

En el apartado anterior hemos comprobado que el movimiento vibratorio de los


pliegues vocales representa un elemento clave en la producción de la voz. Este
movimiento vibratorio es autosostenido, tal y como explica la teoría de Van den Berg y

20
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

la aportación de Hirano referente a la onda mucosa. Cabe añadir que la presencia del
tracto vocal también contribuye a que se produzca la oscilación (Story, B.H., 2002).
A partir de las teorías expuestas se han desarrollado diferentes modelos que
representan el comportamiento de los pliegues vocales. Estos modelos permiten
realizar síntesis de voz, profundizando en el conocimiento de la fonación. Además, dan
lugar al análisis de parámetros biomecánicos como la masa o la elasticidad de los
pliegues vocales, de gran interés en el objetivo de la detección de patologías vocales.

El modelo más sencillo de representación de los pliegues vocales consiste en


simplificar todo el tejido de cada pliegue considerándolo como una única masa.
Asumimos además de forma también simplificada que la masa que representa el
pliegue vocal sólo puede desplazarse de forma transversal, según el eje horizontal x
que observamos en la figura 2-4. La masa se conecta a una pared rígida a través de
elementos resorte-amortiguador, que tratan de considerar la elasticidad del tejido y
las pérdidas de energía debidas a la viscosidad y a la fricción, respectivamente (Story,
B.H., 2002), (Flanagan, J.L. & Landgraf, L., 1968).

Fig. 2-4. Modelo de una masa de los pliegues


vocales (tomado de J. L. Flanagan y L. Landgraf,
1968).

El principal inconveniente de este modelo reside en que al disponer de un solo


grado de libertad no es posible representar la onda mucosa, elemento que contribuye
de forma importante a la oscilación sostenida del sistema. Por tanto, es imprescindible
acoplar al modelo el tracto vocal para crear las condiciones necesarias en las que la
velocidad del tejido y la presión intra-glótica se encuentren en fase y permitan iniciar y
mantener la oscilación (Story, B.H., 2002).
El modelo de una masa no suele ser suficiente para realizar investigaciones
completas, pero es una herramienta pedagógica útil para comprender alguno de los
principios fundamentales de la oscilación automantenida (Story, B.H., 2002), (Titze,
I.R., 1994). Poco después de su introducción se propuso una versión ligeramente más
compleja en la que el pliegue vocal es representado por dos masas (Story, B.H., 2002),
(Ishizaka, K. & Flanagan, J.L., 1972). Como en el caso anterior, solo se permite

21
Capítulo 2: Producción y fisiología de la voz

desplazamiento lateral a cada masa, que está conectada con una pared rígida a través
de sendos sistemas resorte-amortiguador. Además, las dos masas están unidas entre sí
a través de otro sistema similar. Los dos grados de libertad presentes permiten
representar tanto la onda mucosa como el movimiento lateral global (ver figura 2-5).

Este modelo, a diferencia del anterior, sí proporciona las condiciones necesarias


para que la oscilación se produzca incluso sin la presencia del tracto vocal, a pesar de
que también representa una gran simplificación de la estructura real del tejido. A
causa de su sencillez y de su razonable aproximación a los datos fisiológicos reales, el
modelo de dos masas ha sido ampliamente utilizado en estudios de simulación y
síntesis de la vibración de los pliegues vocales (Story, B.H., 2002).

Fig. 2-5. Modelo de dos masas de los pliegues


vocales (tomado de Herbst, C.T. et al, 2013).
Una limitación que comparten los modelos de una y dos masas reside en que
ninguno de ellos representa de manera adecuada la conocida estructura en dos capas
de los pliegues vocales propuesta por Hirano. En el modelo de una masa la cuestión es
evidente (todo el tejido se representa como una única masa compacta), y en el modelo
de dos masas, aunque la masa inferior suele ser más gruesa y pesada que la superior
para intentar simular los efectos del cuerpo del pliegue vocal, esta circunstancia no
permite una oscilación conjunta del cuerpo y de la cubierta, de modo que el modelo de
dos masas se comporta esencialmente como un modelo “de cubierta”, y no tanto
como un modelo “de cuerpo y cubierta” (Story, B.H., 2002).
Esta limitación propició la introducción del modelo de tres masas (Story, B.H., 2002)
(Story, B.H. & Titze, I.R., 1995), que trató de incorporar el efecto de la estructura
cuerpo-cubierta de los pliegues vocales, pero manteniendo la simplicidad propia de un
sistema de pocas dimensiones. Este último modelo añade al anterior una masa que
hace las veces de cuerpo, y que se conecta a las dos anteriores masas a través de
sendos sistemas resorte-amortiguador. A su vez, otro sistema similar conecta al cuerpo
con una pared rígida lateral (ver figura 2-6). Con este tercer modelo es posible, por
tanto, estudiar las diferencias anatómicas existentes entre el cuerpo y la cubierta de
los pliegues vocales (Story, B.H., 2002).

22
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Fig. 2-6. Modelo de tres masas de los pliegues vocales


(tomado de Brad H. Story 2002).
Se han desarrollado modelos más complejos para simular mejor la estructura en
capas del pliegue vocal, y para tener en cuenta los patrones vibratorios que también se
producen en el plano transversal, ambos aspectos ignorados por las simplificaciones
asumidas en los modelos precedentes. Por ejemplo, el enfoque de dos masas ha sido
modificado de tal modo que cada pliegue vocal se representa como ocho secciones
transversales acopladas, cada una de ellas con dos masas con grados de libertad lateral
y vertical. El modelo, denominado de dieciséis masas, cuenta con dos filas de ocho
masas cada una. Una de las dos filas representa la cubierta, y la otra representa el
ligamento y el músculo vocal de cada pliegue (Story, B.H., 2002), (Titze, I.R., 1973),
(Titze, I.R., 1974), (Childers, D.G., 1999).
La complejidad aumenta si nos referimos a los más recientes modelos mecánicos
continuos, que representan los pliegues vocales no como un conjunto finito de masas,
sino como un medio continuo deformable (Story, B.H., 2002), (Titze, I.R. & Talkin, D.T.,
1979), (Childers, D.G., 1999) y a otros modelos basados en elementos finitos (Story,
B.H., 2002), (Alipour, F., Berry, D.A. & Titze, I.R., 2000). Los numerosos grados de
libertad presentes en estos sistemas pemiten un estudio detallado del complejo patrón
vibratorio que aparece en los pliegues vocales. Sin embargo, estos complicados
modelos han demostrado que la vibración de los pliegues vocales está fuertemente
dominada por únicamente dos o tres modos de vibración, por lo que los modelos
sencillos recogen las características vibratorias suficientes siempre y cuando no sea
necesario el máximo detalle (Story, B.H., 2002).

2.3. Modelado acústico

El modelo lineal de fuente-filtro elaborado en 1960 según la teoría de Fant para la


producción del habla (Fant, G., 1960) es el que se ha utilizado de forma clásica para el
análisis acústico de la voz. Este modelo está formado por tres elementos:

1. Excitación, que se corresponde con el flujo glótico modulado por la vibración de


los pliegues vocales.

23
Capítulo 2: Producción y fisiología de la voz

2. Transmisión, que está condicionada por las resonancias del tracto vocal, formado
por las cavidades supraglóticas: faringe, cavidad oral y cavidad nasal.
3. Radiación, debida a la apertura de la boca y a la posición de los labios.

El modelo se considera lineal e invariante en el tiempo, aunque en realidad el tracto


vocal presenta características no lineales y varía dinámicamente en el tiempo. Estas
suposiciones permiten en una primera instancia simplificar el modelo, separando
claramente excitación de filtrado.

La señal de excitación o glótica aparece con una frecuencia fundamental (pitch) en


los sonidos sonoros o vocálicos. En cambio, en los sonidos sordos o consonánticos esta
señal carece de periodicidad, comportándose prácticamente como ruido aleatorio. El
modelo del funcionamiento de la glotis incluirá, por tanto, un oscilador que genere un
tren de impulsos de frecuencia controlada y un generador de ruido, junto con un
conmutador que permita seleccionar los dos tipos de señales.

En cuanto al tracto vocal, es posible modelarlo como una cavidad cilíndrica


uniforme cuyos extremos son, respectivamente, la glotis y los labios. Este tubo
acústico se comporta como una cavidad resonante que adquiere una gran amplitud de
vibración para ciertas frecuencias de excitación llamadas formantes. Los formantes se
utilizan para distinguir unos sonidos de otros, pues varían de un modo claramente
perceptible en lo que se refiere a sonidos vocálicos. En la figura 2-7 podemos observar
la relación aproximada entre los dos primeros formantes para las cinco vocales del
castellano en los dos géneros, en un gráfico conocido como triángulo vocálico.

El modelo descrito es un modelo idealizado, en el que se supone que no hay


pérdidas en las paredes del tubo, que la viscosidad del gas es nula y que el área es
constante. En cualquier caso, funciona razonablemente bien cuando el sonido emitido
es una vocal neutra. Para contemplar otros casos es necesario considerar modelos más
precisos, como aquellos que utilizan la concatenación de varios tubos acústicos para
representar la no uniformidad del tracto vocal (ver figura 2-8). Además, también es
preciso tener en cuenta el tracto nasal, que también se puede modelar como un tubo
acústico no uniforme acoplado al tracto vocal mediante el velo del paladar (Godino
Llorente, J.I., 2002).

24
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Fig. 2-7. Triángulo vocálico del castellano, que muestra sus cinco vocales cardinales.

Podemos por tanto representar todos los elementos que intervienen en la


producción de voz en un diagrama de bloques como el de figura 2-9. La señal de
excitación se dividirá en dos partes, una formada por un generador de pulsos
uniformes que produce un modelo de pulso glótico para representar los diferentes
sonidos sonoros o vocálicos, y otra formada por un generador de ruido aleatorio para
representar los sonidos sordos o consonánticos. El sistema contará con un conmutador
para alternar ambos tipos de señales, o para incluirlos a la vez. La señal resultante es
después tratada por un filtro digital que simula las propiedades resonantes del tracto
vocal. Por fin, a la salida de éste se colocará un modelo de radiación que describe la
impedancia de radiación vista por la presión de aire cuando abandona los labios.

Fig. 2-8. Modelo de concatenación de tubos del tracto


vocal.

25
Capítulo 2: Producción y fisiología de la voz

Fig. 2-9. Modelo de producción de voz de Fant.

Las características acústicas fundamentales en la señal resultante obtenida son la


intensidad, la frecuencia o altura y el timbre de la voz, que caracterizan lo que
conocemos como tono (García-Ruiz, J., 2010b), (Godino Llorente, J.I., 2002), (Pedro
Gómez Vilda 2002):

 La intensidad está relacionada con la presión subglótica que ejerce el aire


procedente de los pulmones, siendo la primera proporcional al cuadrado de la
segunda. Además, la sincronización entre armónico y formante implica un
notable aumento de la intensidad, fenómeno que se produce en altas
frecuencias (conocido como formante del cantante, en voz cantada).

 La frecuencia o altura está regulada por la acción de los músculos tensores de los
pliegues vocales (cricotiroideo y tiroaritenoideo). En el caso de la voz hablada
con naturalidad los pliegues vocales adoptan una posición de equilibrio fruto del
mínimo esfuerzo producido por estos músculos. El alargamiento o elongación del
pliegue produce un incremento de la frecuencia fundamental de la señal,
acompañado de un aumento de la tensión y una disminución de la elasticidad
del pliegue, por lo que la ondulación disminuye. El mecanismo opuesto es el
acortamiento del pliegue vocal, que provoca una reducción de la frecuencia
fundamental, que implica a su vez una disminución de la tensión. Por su parte, el
tracto vocal actúa como amplificador selectivo de determinadas frecuencias y
como atenuador de otras.

 El timbre es la característica acústica que permite distinguir dos tonos que


presentan la misma frecuencia e intensidad. Depende de las dimensiones y
formantes del tracto vocal, característicos de cada persona. También depende de
las características del cierre de los pliegues vocales, y de las otras características
acústicas mencionadas: la intensidad y la frecuencia.

26
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

2.4. Revisión del uso de parámetros acústicos procedentes de la señal de voz para
la detección de patología vocal

En el capítulo anterior (primero) hemos visto que la exploración directa y el análisis


perceptual son dos de los métodos utilizados para diagnosticar patología vocal.
También apuntábamos entonces que el carácter invasivo del primero unido a la
subjetividad del segundo favorece el uso del análisis acústico como complemento o
como filtro de los anteriores métodos.

El análisis acústico orientado a la detección de patología vocal está basado en


extraer diferentes parámetros de la señal de voz para posteriormente comprobar si
esos parámetros son buenos discriminadores respecto a la presencia de patología
vocal. En el caso de que lo sean será posible construir clasificadores que a partir de la
información paramétrica sean capaces de distinguir si un sujeto se considera libre de
patología vocal o afectado por ella.

Los parámetros utilizados en el estudio experimental de esta tesis proceden de la


fuente glótica, relacionada con la señal de excitación según el modelo de Fant. En el
siguiente capítulo (tercero) nos ocuparemos de esos parámetros, repasando en este
apartado los parámetros relacionados directamente con la señal de voz.

La parametrización de la señal de voz se ha realizado con diversos propósitos:


identificación del locutor (Delgado Romero, C., 2004) (Toledano, D.T. et al, 2013),
reconocimiento del habla (Rabiner, L.R. & Juang, B.H., 1993) (Ortega, A. & Miguel, A,
2013) (Abad, A., 2013) y codificación y compresión del mensaje (Schroeder, M.R, 2004)
están entre ellos. El proceso consiste, a grandes rasgos, en extraer un conjunto de
valores numéricos o coeficientes asociados a los diferentes tramos de una señal de
voz. El hecho de tener que trocear la señal (enventanado) se debe a que los algoritmos
empleados asumen el carácter estacionario de la misma, hecho que no es cierto a
largo plazo en el caso de la voz. Esto trae como consecuencia que como resultado de la
parametrización se obtengan un conjunto de rasgos o de vectores de rasgos variables
en el tiempo.

Los parámetros más utilizados en el campo de la detección de patología vocal se


pueden clasificar en dos grupos (Godino Llorente, J.I., 2002), (Gómez, P., 2006): por
una parte, parámetros de tiempo corto, relacionados a menudo con la parametrización
de la señal de voz orientada al reconocimiento automático del locutor o del mensaje:
coeficientes LPC, transformada FFT, coeficientes cepstrales (LPCC, MFCC y sus
derivadas), etc. Por otra parte, parámetros de tiempo largo4, que tratan de representar
un índice o medida de la calidad vocal: jitter, shimmer, relación armónico-ruido, etc.

Los parámetros de tiempo corto se caracterizan porque no es necesaria la fonación


sostenida de vocales para obtenerlos (se pueden obtener a partir de habla continua), y
porque son menos sensibles a la presencia de patología que los parámetros de tiempo
largo, que a menudo requieren una periodicidad mínima en la señal analizada. Dentro

4
En realidad, los parámetros de tiempo largo también se calculan generalmente en tramos cortos de la
señal, pero como sólo tienen sentido en tramos largos, se suele calcular la media de los resultados.

27
Capítulo 2: Producción y fisiología de la voz

de ellos, los coeficientes LPC (Godino Llorente, J.I., 2002), (Deller, J. R., Proakis, J. G., &
Hansen, J. H., 1993), (Faúndez Zanuy, M., 2000) están relacionados con la técnica de
predicción lineal, útil para codificar la señal y para sintetizar la voz. Es una técnica que
trabaja en el dominio del tiempo y que se basa en predecir el valor de una muestra
como combinación lineal de p muestras anteriores, de acuerdo a la siguiente ecuación:

Al realizar esa estimación se comete un error de predicción. La técnica se basa en


buscar los coeficientes ak que minimicen el valor cuadrático medio de dicho error. Lo
interesante de la técnica consiste en que los coeficientes calculados se corresponden
con los coeficientes del filtro que representa el tracto vocal en el modelo de
producción vocal de Fant visto en el apartado 2.3, lo que habilita a la técnica para
tareas de análisis de voz (detección de formantes y seguimiento de su evolución,
cálculo de la envolvente del espectro –ver figura 2-10–) y también para tareas de
síntesis de voz (recuperación de la señal original, construcción de unidades de síntesis).

Fig. 2-10. Ejemplo de espectro LPC en voz cantada, realizado con el programa Dr.
Speech (tomado de Huang, D.Z. & Watson, C., 1998).

Sin embargo, precisamente por su vinculación al tracto vocal y por tanto a las
características del locutor y del mensaje, y no tanto a los pliegues vocales y a su
vibración –origen más frecuente de los desórdenes vocales–, los coeficientes LPC no
han sido demasiado utilizados en el campo de la detección de patología vocal, aunque
autores como Childers han detectado variabilidad entre los espectros LPC de voces
normales y patológicas (Childers, D.G. & Bae, K.S., 1992). También podemos encontrar
en (Castrillón, O., Castellanos, G. & Daza, G., 2006) un estudio multiparamétrico
destinado a detectar hipernasalidad en niños en el que se utilizan los coeficientes LPC:
después de sucesivas etapas enfocadas a reducir la dimensionalidad del problema los
primeros coeficientes LPC resultaron ser suficientemente discriminantes. Otro ejemplo

28
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

de uso de estos parámetros, también relacionado con la voz infantil, lo encontramos


en (Beceiro, D.I.E. et al, 2009), estudio centrado en la extracción de la frecuencia
fundamental en el llanto infantil para comprobar la diferencia existente en los valores
de ésta en un caso normal y en otro patológico. Además, en (Banci, G. et al, 1986)
encontramos el uso del residuo LPC (entre otros parámetros) para diferenciar, con un
91,6% de tasa de acierto global, voces normales de voces que presentan patología
vocal, y en (Parsa, V. & Jamieson, D.G., 2000) encontramos una comparación entre
parámetros basados en la predicción lineal y otros dependientes de la frecuencia
fundamental, con tasas mejores para los primeros (96,5% de aciertos globales).
También en (Marinaki, M. et al, 2004) se utilizan parámetros LPC para detectar
presencia de dos patologías específicas: parálisis de los pliegues vocales y edema de
los pliegues vocales, aplicando reducción dimensional mediante análisis de
componentes principales y usando y comparando varias técnicas de clasificación. Las
tasas obtenidas fueron de un 85% para la parálisis cordal y de un 73% para el edema
cordal. Por último, en (Cordeiro, H.T., Fonseca, J.M. & Ribeiro, C. M., 2013) se utiliza el
primer pico del espectro LPC como parámetro discriminante, obteniendo tasas de
éxito de un 100% en la clasificación sano/patológico y de un 87% en la clasificación
entre nódulos y edemas de Reinke.

La transformada FFT (Fast Fourier Transform) es el algoritmo habitualmente


empleado para representar la voz en el dominio de la frecuencia. Dada una secuencia
de números complejos que representan la señal en el dominio del
tiempo, obtendremos la secuencia transformada ya en el dominio de la
frecuencia a través de la siguiente ecuación:

Los dos diagramas más empleados a partir del cálculo de la FFT son el
espectrograma, que representa la evolución temporal de los distintos valores
frecuenciales, cuyo valor en intensidad se expresa mediante niveles de colores o grises
(ver figura 2-11) y el propio espectro FFT, que representa el valor en amplitud o
intensidad de los armónicos para una frecuencia dada (ver figura 2-12). También es
habitualmente utilizada la señal conocida como densidad espectral de potencia
(conocida también por su nombre en inglés, power spectral density), que ofrece los
valores de potencia de la señal (eje de ordenadas) para las diferentes frecuencias (eje
de abscisas).

29
Capítulo 2: Producción y fisiología de la voz

Fig. 2-11. Espectrograma de las palabras inglesas nineteenth century,


pronunciadas por una voz masculina (tomado de Wikipedia, 2014i).

Fig. 2-12. Espectro FFT de la palabra patata, realizado con el programa lingWAVES
(tomado de Villayandre, M., 2011).

En cuanto a los parámetros extraídos a partir de esta técnica, en (Kuo, J., Holmberg, E.
B., & Hillman, R.E., 1999) podemos encontrar el uso de distintas relaciones entre
armónicos y armónicos próximos a los formantes. En particular, el estudio incluye los
parámetros H1-A1, H1-A3, A1-A3 y H1-H2, que se corresponden con las diferencias en
amplitud entre distintas combinaciones de los armónicos y de los armónicos más
cercanos al formante , respectivamente. Estos parámetros, combinados con otros
que el autor denomina aerodinámicos y que están asociados a la señal glótica son
utilizados en la técnica estadística de análisis discriminante, obteniendo una buena
separación entre casos que presentan patología vocal (en concreto, nódulos bilaterales
en los pliegues vocales) y casos etiquetados como normales. En (Holmberg, E.B.,
Hillman, R. E., & Perkell, J. S., 1988) se utiliza la diferencia de energía entre los dos
primeros armónicos, el cociente entre los armónicos más próximos al primer y al
tercer formante y los parámetros H1-A1 y H1-A3, encontrando correlación estadística
entre estos parámetros y la presencia o ausencia de determinadas patologías vocales.
Otros autores han analizado la diferencia de energía entre distintas bandas
frecuenciales, encontrando también diferencias entre voces normales y voces con
patología vocal (Hammarberg, B., Fritzell, B., & Schiratzki, H., 1984), (Hammarberg, B.
et al, 1980), (Kitzing, P., 1986).

30
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Otro grupo importante de parámetros son los denominados cepstrales. El cepstrum


(Deller, J.R., Proakis, J.G., & Hansen, J.H., 1993) es una transformada que se define
como:

donde es la transformada inversa de Fourier y es la trama de la que se calcula


su cepstrum, es decir, la señal de voz original. Sabemos que esta señal original se
puede expresar del siguiente modo:

es decir, como la convolución de la señal de excitación y de la respuesta


impulsional del tracto vocal . Si pasamos la igualdad anterior al dominio
transformado de la frecuencia tenemos:

Si en la expresión anterior aplicamos logaritmos, como sucede en la definición de


cepstrum, tenemos:

En definitiva, el cálculo del cepstrum separa la información referente a la excitación


glótica de la referente al tracto vocal. Esta última es de variación lenta, y aparece en
los primeros coeficientes del cepstrum, mientras que la primera aparece en las
frecuencias altas (Faúndez Zanuy, M., 2000). En la figura 2-13 podemos observar una
representación del cepstrum para la pronunciación de una vocal.

El eje de abscisas de la figura 2-13 representa los valores de frecuencia, mientras


que el eje de ordenadas recoge los valores de energía. Podemos observar cómo en el
gráfico aparece destacado el pitch, representado por el primer pico, del que
observamos una amplitud alta y una anchura reducida, lo que se traduce en una alta
estabilidad de la frecuencia. También podemos observar en la figura que el segundo
armónico (representado por el segundo pico) es algo más ancho. Todas estas
características son propias de una alta calidad vocal (Alonso, J.B. et al, 2009).

31
Capítulo 2: Producción y fisiología de la voz

Fig. 2-13. Cepstrum correspondiente a un segmento


de una vocal (tomado de Robinson, T., 1998).
En cuanto a los parámetros relacionados con el cepstrum, destacaremos en primer
lugar los denominados LPCC (LPC-cepstrum), que representan estimaciones de los
coeficientes cepstrales obtenidos a partir de los coeficientes LPC (Godino Llorente, J.I.,
2002). También han sido ampliamente utilizados los coeficientes MFCC (Mel-Frequency
Cepstral Coefficients), obtenidos a través del uso de la escala MEL, en la que las bandas
de frecuencia están espaciadas de forma logarítmica, lo que modela la respuesta
auditiva humana de forma más apropiada que las escalas lineales normalmente
utilizadas para el cálculo, por ejemplo, de la FFT (Godino Llorente, J.I., 2002), (Xu, M. et
al, 2005). También se han empleado las derivadas primera y segunda de los
coeficientes LPCC y MFCC, con el fin de representar la variación en el tiempo de ambos
conjuntos de parámetros (Godino Llorente, J.I., 2002).

Estos parámetros han sido utilizados para la detección de patología vocal: en


(Plante, F. et al, 1993) encontramos un estudio que emplea los valores medios de
vectores LPCC y MFCC, combinándolos con otros parámetros, y utilizando voces
infantiles (de entre 5 y 12 años) sanas y patológicas. El estudio establece valores de
normalidad para cada uno de los parámetros obtenidos a partir de medidas realizadas
en un grupo control, y considera un registro como patológico si al menos uno de los
parámetros excede estos valores considerados normales. Con esta medida se obtuvo
un 89% de tasa global de acierto.

En (Wallen, E.J. & Hansen, J.H., 1996) también se utiliza otro parámetro cepstral: la
amplitud media del pico cepstral principal, para, en combinación con otros
parámetros, y a través de un sistema basado en redes de neuronas artificiales,
identificar pacientes con cáncer de laringe. En esta ocasión la tasa de acierto global fue
del 85,5%. En (Bovbel E.I. & Toumilovich, M.A., 1999) se emplean 24 coeficientes MFCC
en un estudio basado en modelos ocultos de Markov, con, según los autores, buenos
resultados.

En (Godino Llorente, J.I., 2002) se utilizan numerosos parámetros, tanto de tiempo


corto como de tiempo largo, combinados con distintas técnicas de clasificación.

32
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Destacaremos en este apartado los buenos resultados obtenidos con los coeficientes
MFCC, así como la incorporación de la primera y segunda derivada a los estudios. Más
adelante, en (Fraile Muñoz et al, 2008) se utilizan nuevos parámetros cepstrales
propuestos por los autores que obtienen unos resultados similares a los obtenidos con
parámetros MFCC, pero aportan una interpretación física más sencilla. En (Godino-
Llorente, J.I. & Gómez-Vilda, P., 2004) se utilizan de nuevo los parámetros MFCC en
clasificadores basados en redes de neuronas, alcanzando una tasa de acierto global del
96%. En (Godino-Llorente, J.I., Gomez-Vilda, P., & Blanco-Velasco, M., 2006) se vuelven
a utilizar los parámetros MFCC con su primera derivada, demostrando que el uso de la
segunda derivada es prescindible. El estudio emplea para la clasificación el coeficiente
de discriminación de Fisher y el coeficiente F. En (Benba, A., Jilbab, A. & Hammouch,
A., 2014) se utilizan los parámetros MFCC comprimidos mediante cuantización
vectorial para detectar la enfermedad de Parkinson, obteniendo una tasa de éxito del
82%.

Los parámetros de tiempo largo han sido más utilizados en el campo de la detección
de patología vocal. En particular, se ha trabajado ampliamente con tres tipos o familias
de parámetros: los relacionados con la variación de la frecuencia de la señal, los
relacionados con la variación de la amplitud de la señal y los relacionados con la
presencia de ruido en la señal. Los dos primeros grupos se producen porque la
vibración de los pliegues vocales presenta irregularidades, que son mayores en
presencia de patología vocal. Por otro lado, todas estas medidas se suelen realizar con
pronunciación de vocales sostenidas, ya que aunque es posible tomarlas para habla
continua, en este caso se mezclan sonidos sordos con sonoros, por lo que tanto la
variación de las medidas como la presencia de ruido (inherente a los sonidos
consonánticos) será mayor y menos controlable.

En cuanto a los parámetros relacionados con la perturbación de la frecuencia, son


conocidos de forma genérica como jitter, aunque el jitter propiamente dicho se
corresponde con la diferencia entre el valor de un período y del período anterior. Son
ampliamente utilizadas medidas derivadas de esta, como el jitter absoluto, que emplea
la diferencia en valor absoluto, o sobre todo como el jitter absoluto medio (jita), que
calcula el promedio de todos los ciclos en estudio:

siendo N el número de ciclos analizado, y el valor del período del i-ésimo ciclo.

También se utilizan medidas que tratan de minimizar la influencia que la frecuencia


fundamental tiene sobre las medidas de jitter (Godino Llorente, J.I., 2002), así como los
cambios lentos que en aquella se producen incluso en la fonación sostenida de
vocales. Estas medidas son el jitter relativo medio, que es el resultado de dividir el jita
por el período fundamental medio, y las medidas RAP, PPQ y sPPQ, que, en lugar de
trabajar con dos períodos consecutivos calculan la desviación de un período respecto
al período promedio de tres, cinco y ciclos respectivamente, siendo el período en
estudio el correspondiente al ciclo central.
33
Capítulo 2: Producción y fisiología de la voz

Los parámetros relacionados con la perturbación de la amplitud tienen un


tratamiento similar a los recién vistos. En esta ocasión el término genérico que se
utiliza para referirse a ellos es el de shimmer. Para calcular el shimmer propiamente
dicho se mide la amplitud del pico máximo de cada ciclo de la señal, y se resta esta
amplitud con la del ciclo anterior. Son frecuentemente utilizadas, igual que en el caso
de los jitter, medidas como el shimmer relativo medio que elimina el efecto de la
amplitud absoluta o el shimmer promedio en dB, que utiliza la escala en decibelios para
medir las amplitudes:

siendo N el número de ciclos y la amplitud del ciclo i-ésimo, o como las


medidas APQ y sAPQ, que promedian la amplitud de varios ciclos consecutivos.

Los parámetros relacionados con la presencia de ruido en la señal son numerosos, y


existen distintas maneras de calcularlos. Por una parte, la definición de ruido no es
homogénea debido al carácter aleatorio del mismo, y a que su naturaleza es
compartida en la emisión de sonidos sordos y de perturbaciones naturales en la
emisión de las vocales. Por otra parte, los métodos empleados para calcular ciertas
medidas relacionadas con el ruido son diversos, utilizando diferentes dominios de
representación de la señal: temporal, frecuencial y cepstral. Algunas de estas medidas,
frecuentemente utilizadas en la literatura, son la relación HNR (relación armónico-
ruido), que mide la energía armónica respecto a la energía de ruido; la relación NNE
(energía de ruido normalizada), que mide la energía de ruido respecto a la energía
total de la señal; la medida VTI (índice de turbulencia de la voz), que mide la relación
entre la energía espectral de alta frecuencia (2800-5800 Hz) de los valles del espectro,
y la energía armónica en el margen 70-4500 Hz, midiendo por tanto la energía relativa
del ruido de alta frecuencia (Godino Llorente, J.I., 2002); la relación NHR (relación
ruido-armónico, recíproca de la relación HNR) e incluso la medida SPI (índice de
fonación suave), que es un valor promedio del cociente de la energía armónica en
bajas frecuencias respecto a la energía armónica en altas frecuencias, no directamente
relacionada con el ruido pero cuyas medidas se han incorporado frecuentemente en el
estudio de la detección de patología vocal.

En cuanto a los trabajos que han utilizado estos parámetros, cabe destacar en
primer lugar el descrito en (Boyanov, B. & Hadjitodorov, S., 1997), en el que se utilizan
parámetros extraidos a partir de los tres dominios mencionados (temporal, frecuencial
y cepstral) y de distinta naturaleza: perturbación de la frecuencia, perturbación de la
amplitud, medidas de ruido y medidas de energía, entre otros. El trabajo destaca
porque propone una técnica de clasificación basada en redes de neuronas y en análisis
discriminante que ofrece muy buenos resultados, y también porque el artículo incluye
una amplia revisión del estado del arte asociado a los parámetros acústicos utilizados y
al análisis acústico en general.

En (Yanagihara, M., 1967) se presenta una clasificación de la voz en cuatro


categorías diferentes de ronquera en función de parámetros como el ruido presente

34
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

en el formante principal de cada vocal, el ruido de alta frecuencia o la pérdida de


armónicos, también en altas frecuencias.

En el estudio descrito en (Feijoo, S. ernández, C., 1990) se utilizan parámetros


de perturbación, tanto de la amplitud como de la forma de onda y del espectro, y
también medidas de ruido. Los parámetros, obtenidos con una resolución frecuencial
mínima, se utilizaron para tratar de discriminar voces sanas respecto de voces
afectadas de carcinoma de pliegue vocal, y para encontrar correlación entre sus
resultados y los ofrecidos por análisis perceptual realizado por expertos. Los resultados
no parecieron ser muy satisfactorios, aunque apuntaron cierta utilidad para medir la
calidad vocal.

En (Yumoto, E., Gould, W.J., & Baer, T., 1982) encontramos un estudio que trata de
medir la eficacia del parámetro HNR, midiéndolo en 20 personas con patología vocal y
en 42 personas sin ella, haciéndolo en el primer caso tanto antes como después de un
proceso quirúrgico. Los resultados fueron satisfactorios desde el punto de vista
estadístico, obteniendo los siguientes valores medios: grupo normal, 11,9 dB; grupo
postoperatorio, 11,3 dB y grupo preoperatorio, 1,2 dB. Además, los autores
concluyeron que existía correlación entre la medida HNR y una evaluación subjetiva
realizada por expertos basada en el análisis visual del espectrograma. También se
advierte que el método empleado no es válido para pacientes con patologías vocales
graves.
El parámetro HNR también fue analizado por (Wolfe, V., Cornell, R., & Palmer, C.,
1991), extrayendo en esta ocasión su valor en cuatro regiones espectrales diferentes.
También se emplearon otros parámetros, como la frecuencia fundamental o el jitter,
aplicados sobre 49 personas afectadas de diferentes patologías vocales (pólipos,
nódulos, edema, etcétera). Las voces se dividieron en aéreas, roncas y tensas,
obteniendo unas tasas globales de acierto para cada categoría de un 76%, 86% y 80%,
respectivamente. El método clasificador empleado fue el análisis discriminante.

El índice NNE fue probado por (Kasuya, H. et al, 1986a) con una importante muestra
de 250 personas, 64 en el grupo de control (sin patología vocal) y 186 afectadas de
diferentes trastornos vocales. Se destaca la capacidad de discriminación de la medida
para determinadas enfermedades como cáncer glotal, presencia de nódulos en los
pliegues vocales y parálisis recurrente del nervio. En concreto, el índice NNE resultó de
altísima fiabilidad para estadios intermedios y avanzados de cáncer glotal (“los
diferencia perfectamente de los sujetos sanos”), aunque empeoró su rendimiento en
estadios tempranos (22,6% de falsos negativos y 9,4% de falsos positivos). Más tarde,
en (Kasuya, H. et al, 1986b) el parámetro NNE se combina con el cálculo del número de
tramas no sonoras y con los parámetros PPQ y APQ sobre una base de datos de 991
personas afectadas de cáncer. Lo más destacado de los resultados fue el hecho de que
una medida combinada de los parámetros utilizados consiguió detectar el cáncer en
varios casos en los que un análisis perceptual había dado un resultado negativo.
En (Plante, F. et al, 1993) y (Wallen, E.J. & Hansen, J.H., 1996), ya mencionados más
arriba, junto a los parámetros de tiempo corto entonces comentados se emplearon
también perturbaciones de frecuencia y amplitud, además de estimadores de ruido
(NHR, NNE) en el primero de los dos trabajos.

35
Capítulo 2: Producción y fisiología de la voz

En (Alonso et al, 2001) se emplearon también medidas de perturbación de amplitud


y de frecuencia, además de otros parámetros entre los que destacan estadísticos de
alto orden calculados sobre el biespectro propuesto en (Boyanov, B. & Chollet, G.,
1992), dominio en el que sólo se tienen en cuenta los armónicos de la señal para
reducir el coste computacional y facilitar la interpretación de los resultados. El
esquema clasificador correspondió a una arquitectura basada en redes de neuronas,
aplicado sobre un conjunto de 168 personas (100 normales y 68 con patología vocal),
ofreciendo una tasa global de acierto del 98,3%.
También en (Sarriá, M. & Castellanos, G., 2010) se combinan parámetros de tiempo
largo como los índices HNR y NNE con otros de tiempo corto como los coeficientes
MFCC, aunque en esta ocasión el estudio está centrado en la mejora de la técnica de
clasificación empleada.
En (Hariharan, M., Paulraj, M.P., & Sazali, Y., 2010) se propone el uso de 16
parámetros de energía no dependientes de la frecuencia fundamental obtenidos en el
dominio del tiempo y clasificados mediante redes de neuronas. La base de datos
utilizada es la distribuida por Kay Pentax (KayPENTAX Corp., 2011), con 53 muestras de
voz normal y 657 muestras de voz patológica. Los resultados obtenidos superan el 98%
de tasa global de acierto.
Destacaremos también los trabajos de (Gómez García, J.A., 2013) y de (Herzel, H. et
al, 1994). En ellos podemos encontrar un enfoque diferente, aunque también
relacionado con la señal de voz: se trata del análisis dinámico no lineal de series
temporales. Este tipo de estudios considera de forma prioritaria el comportamiento no
lineal de la voz, y en el primero de los casos se han obtenido tasas de éxito del 93,8%,
empleando un subconjunto de la base de datos de KayPENTAX (KayPENTAX Corp.,
2011) formado por 173 sujetos con patología vocal y 53 sujetos sanos, y utilizando un
esquema de clasificación basado en un modelo de mezcla de gaussianas.
En una línea similar a la de los recién mencionados trabajos, (Moro-Velázquez, L.,
Gómez-García, J.A., & Godino-Llorente, J.I., 2014) trabajan con parámetros
relacionados con el análisis dinámico no lineal de series temporales. Pero, además,
estos autores incorporan también nuevos parámetros vinculados al dominio conocido
como modulation spectra, representación bidimensional de la señal en el que las dos
dimensiones son la frecuencia acústica y la frecuencia modulada. La base de datos
empleada es la de KayPENTAX (KayPENTAX Corp., 2011), y el objetivo marcado
consiste en clasificar correctamente el grado de rugosidad o ronquera (índice R de la
escala GRBAS). Para ello se ha empleado un esquema de clasificación basado en un
modelo de mezcla de gaussianas, obteniendo una tasa máxima de acierto del 82%.
Son también destacables diferentes enfoques basados en otras técnicas, como el
uso de parámetros RASTA-PLP (Alsulaiman, M., 2014), el de transformadas wavelet
(Koutsogiannaki, M. et al, 2014) (Muhammad, G. et al, 2014) o el de medidas
relacionadas con teoría de la información como la correntropía (Fontes, A.I. et al,
2014). Las tasas de detección alcanzadas en estos estudios oscilan entre el 92,4% y el
100% de éxito.

36
3. Parámetros glóticos presentes en el estudio
Capítulo 3: Parámetros glóticos presentes en el estudio

3.1. Estimación de la señal glótica –mediante filtrado inverso– y parametrización

Los trabajos revisados en el capítulo anterior están basados en la parametrización


de la señal de voz. Recordemos que el análisis basado en el estudio de estos
parámetros y en su capacidad discriminante respecto a la presencia de patología vocal
tiene ventajas desde el punto de vista económico y de la comodidad del paciente,
pudiendo suponer un filtro eficaz de cara a exploraciones más exhaustivas. Como
hemos visto, la utilización de estos parámetros combinados con diferentes técnicas
estadísticas orientadas a la clasificación ha ofrecido resultados interesantes.
Sin embargo, la señal de voz contiene elementos no relacionados con el origen de
gran parte de los trastornos vocales: los pliegues vocales y su correcta vibración.5
Como hemos visto en el apartado 2.3, la presencia del tracto vocal y el efecto de
radiación en labios contribuyen decisivamente en la generación de la voz, pero al
mismo tiempo añaden complejidad a la señal verdaderamente relacionada con la
vibración de los pliegues vocales: la fuente glótica. La señal electroglotográfica (EGG),
comentada en el capítulo uno, sí está directamente relacionada con el movimiento
vibratorio de los pliegues vocales, pero los parámetros típicos que se extraen de ella,
aunque también útiles (como pudimos observar) no permiten establecer estimaciones
de los elementos dinámicos de los pliegues vocales. Es la estimación de la señal glótica
la que permite obtener este tipo de parámetros biomecánicos, además de otros
biométricos, temporales y de perturbación y energía que, idealmente libres de la
influencia del tracto vocal permiten diferenciar voces sanas y patológicas incluso en
casos en los que las patologías no estén en un estadio avanzado, además de sentar las
bases para, en el caso de que la voz sea patológica, obtener una gradación de la
patología.

La estimación utilizada de la fuente glótica, realizada mediante filtrado inverso, se


basa en el trabajo original de Alku y otros (Alku, P., 1992), (Varho, S. & Alku, P., 1999),
(Akande, O.O. & Murphy, P.J., 2005), (Childers, D.G., 1999), aunque ha sido modificado
por nuestro grupo de investigación, dando como resultado una implementación
iterativa en varios pasos, como podemos ver en la figura 3-1. A continuación
comentaremos brevemente cada uno de estos pasos (Gómez, P. et al, 2005c) (Gómez,
P. et al, 2007):

 El paso 1 consiste en la eliminación del efecto de radiación en labios de la señal


de voz mediante el filtro

 El paso 2 consiste en el empleo del filtro , modelo inverso de la generación


del pulso glótico, con el fin de eliminar la componente glótica de la voz
filtrada por el paso anterior, produciendo una traza de voz desglotalizada .
Cabe mencionar que en la primera iteración no tiene por qué ser una
estimación muy precisa, debido a que será refinada en sucesivas etapas.

5
En general, éstos serán los trastornos tratados en esta tesis, aunque como veremos en el capítulo
cuatro existen ciertas patologías no relacionadas con los pliegues vocales que también pueden ser
detectadas gracias a los parámetros glóticos.

38
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

 El paso 3 consiste en la estimación del modelo del tracto vocal , a partir de


la señal de voz desglotalizada .

 El paso 4 consiste en obtener el modelo inverso del tracto vocal calculado


en el paso anterior y en aplicarlo sobre la señal de voz sin efecto de radiación
, obteniendo como resultado la derivada de la fuente glótica .

 El paso 5 utiliza la señal producida en el paso anterior para reconstruir el modelo


de pulso glótico , que en sucesivas iteraciones podrá ser utilizado para
refinar , repitiendo los pasos dos a cinco tantas veces como sea necesario
(en general, entre tres y cinco iteraciones son suficientes para alcanzar
estimaciones adecuadas de los elementos del sistema).

Una de las señales resultado del proceso es, como hemos visto, la derivada de la
fuente glótica . La integración de esta señal da como resultado la fuente glótica
, objetivo del estudio. Podemos encontrar el proceso completo descrito con más
detalle en (Gómez P. et al, 2004a), además de en las referencias ya citadas.

Fig. 3-1. Estimación de la derivada de la fuente glótica por filtrado inverso.

En la figura 3-2 podemos observar la señal de voz de entrada , y a continuación


la fuente glótica estimada por el procedimiento arriba explicado.

Fig. 3-1. Estimación de la fuente glótica ug(n) por filtrado inverso.

Fig. 3-2. Señal de voz de entrada (arriba) y estimación de la fuente glótica (abajo).

39
Capítulo 3: Parámetros glóticos presentes en el estudio

La fuente glótica obtenida se puede descomponer en la onda acústica promedio


(señal también conocida por las siglas AAW, del inglés Average Acoustic Wave) y la
onda mucosa (señal también conocida por las siglas MWC, del inglés Mucosal Wave
Correlate). La primera de ellas está asociada a la dinámica del cuerpo del pliegue vocal,
mientras que la segunda se puede relacionar con modos de oscilación de orden
superior relacionados principalmente con el comportamiento dinámico de la cubierta
del pliegue vocal, según el modelo de Hirano (Hirano, M., 1974).

La onda mucosa se puede definir como:

siendo el k-ésimo ciclo de .

La señal es precisamente la denominada onda acústica promedio, y su


estimación se lleva a cabo, ciclo a ciclo, como la resta de medio arco sinusoidal con el
mismo semiperíodo que la fuente glótica, utilizando un método adaptativo para
evaluar la amplitud del arco (Pedro Gómez et al 2005). Podemos observar las tres
señales en la figura 3-3.

Fig. 3-3. Estimación de la fuente glótica (arriba), de la onda acústica promedio


(centro) y de la onda mucosa (abajo).

Una vez detectadas las tres trazas el análisis se centrará especialmente en la


densidad espectral de potencia de cada una de ellas, tal y como podemos observar en
la figura 3-4.

40
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Fig. 3-4. Densidad espectral de potencia de la fuente glótica (arriba), de


la onda acústica promedio (centro) y de la onda mucosa (abajo).

En particular, la densidad espectral de potencia de la onda mucosa está directamente


relacionada con el modelado biomecánico del sistema de tres masas. Si en este
sistema buscamos la relación existente entre la fuerza que actúa sobre uno de los
pliegues y la velocidad promedio del pliegue encontramos la transadmitancia, definida
como el módulo del cociente entre la amplitud de la velocidad y la fuerza en el
dominio de la frecuencia. Podemos observar la representación de esta magnitud en la
figura 3-5a, para unos valores dados de los parámetros biomecánicos de masas,
elasticidades y pérdidas. La comparación entre la transadmitancia y la densidad
espectral de potencia de la onda mucosa (figura 3-5b) pone de relieve importantes
características comunes: en bajas frecuencias ambas tienden a tomar valores bajos. En
la zona inmediatamente superior ambas alcanzan un valor máximo seguido de un
mínimo en forma de brecha y de un segundo máximo, formando una estructura de
surco máximo-brecha-máximo. Por último, ambas presentan una suave caída de los
valores a medida que aumenta la frecuencia. Estas semejanzas no son fruto de la
casualidad, son una manifestación de las propiedades biomecánicas del sistema en la
onda mucosa y constituyen una importante aportación de nuestro grupo de
investigación en el campo de la caracterización del aparato fonador, permitiendo
calcular estimaciones de los parámetros biomecánicos de los pliegues vocales a partir
de la densidad espectral de potencia de la onda mucosa mediante un proceso de
reconstrucción basado en la estructura del modelo de tres masas (Gómez, P., 2006),
(Gomez, P. et al, 2004b), (Gómez P. et al, 2004c), (Gómez P. et al 2005).

El conjunto de los parámetros estudiados proceden de la señal o fuente glótica o


bien de alguna de sus componentes: la onda mucosa y la onda acústica promedio. En
algunos casos también pueden proceder de la relación entre ambas componentes.

41
Capítulo 3: Parámetros glóticos presentes en el estudio

Fig. 3-5. a) Transadmitancia del modelo biomecánico de tres masas de los pliegues
vocales. b) Densidad espectral de potencia de la onda mucosa para una voz
normofónica típica.

La técnica general aplicada para obtener los valores de los parámetros (Gómez, P. et
al, 2009b) consiste en obtener segmentos de la señal coincidentes con un ciclo de
fonación, comprendidos desde un pico de cierre hasta el siguiente. En el estudio actual
se han utilizado para la voz masculina tramos de voz de 200 milisegundos que
contienen aproximadamente veinte ciclos de fonación, con una frecuencia
fundamental de 100 Hz y para la voz femenina se han utilizado tramos de la misma
duración que contienen aproximadamente cuarenta ciclos de fonación con una
frecuencia fundamental de 200 Hz.

El correlato deseado (fuente glótica, onda mucosa u onda acústica promedio) se


enventana en marcos de muestras (siendo el número de muestras
correspondiente a cada ciclo de fonación, variable con el pitch) y la densidad espectral
de potencia de cada señal se estima utilizando la transformada rápida de Fourier (fast
Fourier transform, FFT). Para cada parámetro tendremos por lo tanto un promedio de
veinte valores por tramo en el caso de las voces masculinas y de cuarenta valores por
tramo en el caso de las voces femeninas. Podremos estimar la media y la desviación
típica de los parámetros como

42
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

siendo el valor correspondiente para cada parámetro en un ciclo, el


índice correspondiente a cada ciclo de fonación, el índice correspondiente a
cada parámetro y el índice correspondiente a cada locutor, asumiendo
condiciones razonablemente estacionarias correspondientes a la producción estable
de una vocal durante la duración del tramo.

En el presente estudio trabajaremos con el valor medio, de modo que para cada
parámetro contaremos con un vector de observaciones

siendo el índice correspondiente a cada locutor.

Finalmente, el conjunto de parámetros conformarán una matriz

Los parámetros en estudio serán clasificados en cuatro categorías diferentes, de


acuerdo a su naturaleza y forma de obtención: parámetros de perturbación y energía,
parámetros espectrales, parámetros biomecánicos y parámetros temporales. En los
siguientes apartados de este capítulo se profundiza en cada una de estas categorías.

3.2. Parámetros glóticos clásicos de perturbación y de energía

Los parámetros de perturbación y energía procedentes de la señal de voz han sido


ampliamente utilizados en la literatura con relativo éxito, como hemos visto en el
capítulo dos. En general, las señales pertenecientes a sujetos con patología vocal
suelen presentar mayores variaciones tanto en la frecuencia fundamental como en la
amplitud de la señal en estudio. Por otra parte, la relación señal/ruido también se
presenta generalmente como un correlato importante de patología vocal. En este
trabajo incluiremos parámetros de perturbación y de energía procedentes
exclusivamente de la señal glótica y de sus componentes.

Utilizaremos una numeración de carácter interno coherente con las diferentes


publicaciones realizadas por el grupo de investigación para listar y referirnos a todos
los parámetros utilizados en el presente estudio. Las señales empleadas para la
estimación de los parámetros de perturbación y energía serán las tres mencionadas en
el apartado 3.1: la fuente glótica, la onda mucosa y la onda acústica promedio;
especificaremos cuáles son las señales exactas en cada caso.

El primer parámetro incluido en el estudio es el pitch o frecuencia fundamental (p1),


parámetro que se corresponde con el componente frecuencial más bajo de cualquier
sonido, y que en el caso de la voz representa el número de veces que los pliegues
vocales se abren y se cierran por segundo durante la fonación (Suárez, C. et al, 2006).

A continuación se consideran un conjunto de parámetros de perturbación que


recogen la diferencia de distintos índices respecto al valor medio en el segmento de
voz considerado. La señal empleada será, en todos los casos, la fuente glótica. Estos

43
Capítulo 3: Parámetros glóticos presentes en el estudio

índices son, respectivamente, la frecuencia fundamental, la amplitud de la señal, la


agudeza de los picos de cierre y el área de la señal:

 Jitter (p2), estimado como el cociente de la diferencia entre períodos vecinos


respecto a su valor medio en el segmento de voz considerado.
 Shimmer en amplitud (p3), estimado como el cociente de la diferencia entre
amplitudes máximas vecinas respecto a su valor medio en el segmento de voz
considerado.
 Shimmer en esbeltez (p4), estimado como el cociente de la diferencia entre la
agudeza de los picos de cierre vecinos respecto a su valor medio en el segmento
de voz considerado.
 Shimmer en área (p5), estimado como el cociente de la diferencia entre las áreas
vecinas respecto a su valor medio en el segmento de voz considerado.

Los siguientes parámetros a estudiar consideran aspectos relacionados con el cierre


glótico, y la señal empleada para obtenerlos es también la fuente glótica:

 Cociente de la diferencia entre la amplitud del pico de cierre de los ciclos vecinos
respecto a su valor medio en el segmento de voz considerado (p6).
 Cociente de la diferencia entre la esbeltez del pico de cierre de los ciclos vecinos
respecto a su valor medio en el segmento de voz considerado (p7).

Los siguientes parámetros en estudio están relacionados con la energía de las


señales o con la relación entre algunos de sus armónicos, bien entre sí o bien con la
frecuencia fundamental. El primero de ellos se extrae a partir de la onda mucosa y de
la onda acústica promedio, los dos restantes se extraen a partir de la onda mucosa:

 Cociente entre la energía de la onda mucosa respecto a la onda acústica


promedio (p8).
 Cociente entre la posición en frecuencia del segundo armónico de la onda mucosa
y la frecuencia fundamental (p9).
 Cociente entre la amplitud del segundo armónico de la onda mucosa y la
amplitud del primer armónico de la misma señal (p10).

Los últimos parámetros de este apartado son aquellos relacionados


específicamente con la energía de la onda mucosa, y están calculados a partir de la
densidad espectral de potencia de la señal (ver figura 3-6):

 Primera banda de energía asociada a la onda mucosa (p11).


 Segunda banda de energía asociada a la onda mucosa (p12).
 Tercera banda de energía asociada a la onda mucosa (p13).
 Cuarta banda de energía asociada a la onda mucosa (p14).

44
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

En resumen, los parámetros de perturbación y de energía que se utilizarán en este


estudio están listados en la tabla 3-1 (Gómez, P. et al, 2009b), (Gómez, P. et al, 2005c),
(Gómez, P. et al, 2007).

Fig. 3-6. La densidad espectral de potencia de la onda mucosa se puede dividir en


cuatro bandas de energía. Los valores de energía de cada banda corresponden a los
parámetros p11, p12, p13 y p14 (línea de rayas y puntos alternos).

Tabla 3-1. Parámetros de perturbación y de energía utilizados en el


estudio. Los parámetros 1-7 están estimados a partir de la fuente
glótica. El parámetro 8 está estimado a partir de la onda mucosa y
de la onda acústica promedio. Los parámetros 9-14 están estimados
a partir de la onda mucosa. La numeración establecida es de
carácter interno.
Nº Parámetro de perturbación o de energía
1 Pitch
2 Jitter
3 Shimmer asociado a la amplitud
4 Shimmer asociado a la esbeltez
5 Shimmer asociado al área
6 Razón amplitud pico de cierre glótico / vecinos
7 Razón esbeltez pico de cierre glótico / vecinos
8 Razón energía onda mucosa/onda acústica promedio
9 2º armónico / frecuencia fundamental onda mucosa
10 2º armónico / 1er armónico onda mucosa
11 Primera banda de energía de la onda mucosa
12 Segunda banda de energía de la onda mucosa
13 Tercera banda de energía de la onda mucosa
14 Cuarta banda de energía de la onda mucosa

45
Capítulo 3: Parámetros glóticos presentes en el estudio

3.3. Parámetros glóticos biométricos

Los parámetros biométricos se extraen, en general, de la densidad espectral de


potencia de la fuente glótica6 (ver figura 3-7), y constituyen una importante aportación
en el campo de estudio. Por sí mismos constituyen una firma espectral que caracteriza
a los locutores, y que aporta información relevante acerca de la presencia o ausencia
de patología vocal. Además, como veremos, están estrechamente relacionados con los
parámetros biomecánicos asociados al modelo de tres masas de los pliegues vocales.

La densidad espectral de potencia de la fuente glótica presenta un comportamiento


similar en todos los casos analizados: una fuerte subida desde bajas frecuencias hasta
alcanzar un máximo seguido de una lenta caída hasta las altas frecuencias a un ritmo
aproximado de 12 db/octava en voces masculinas, aunque este ritmo puede ser algo
más bajo en voces femeninas (Gómez, P. et al, 2009b).

A lo largo de la caída se pueden apreciar una serie de mínimos locales rodeados de


picos, en forma de “V”. Estos surcos están fuertemente relacionados con la
biomecánica de los pliegues vocales, surgen debido a las antiresonancias producidas
en los tejidos de los pliegues vocales, que se comportan como sistemas de masas y
muelles (ver apartado 2.2). En general, cuanto menos profundo sea el surco, más
pequeño es el valor de los resortes que unen las masas (Gómez, P. et al, 2009b),
(Berry, D.A., 2001).

Fig. 3-7. Densidad espectral de potencia de la fuente glótica y su envolvente.

En la figura 3-8 podemos observar etiquetados los puntos que forman parte del
primer surco en “V”: tenemos un máximo de amplitud y frecuencia , seguido
de un mínimo de amplitud y frecuencia y de un nuevo máximo de amplitud
y frecuencia . Este primer surco tiene una importancia especial: si la señal
utilizada es la fuente glótica ofrece una estimación del acoplamiento existente entre el

6
También es posible utilizar la onda mucosa para obtener estos parámetros.

46
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

cuerpo y la cubierta del pliegue vocal, si por el contrario la señal utilizada es la onda
mucosa podemos obtener una medida del acoplamiento entre los labios subglóticos y
supraglóticos del pliegue vocal (Gómez, P. et al, 2009b), (Svec, J.G. et al, 2000).

Fig. 3-8. Envolvente de la densidad espectral de potencia de la fuente glótica, y


valores de amplitud y frecuencia que conforman el primer surco.

Estos surcos aparecen varias veces más a lo largo de la caída de la curva, en todos
los locutores: en los que no presentan patología la forma de los surcos es bastante
afilada, característica que disminuye en ciertos casos patológicos. Sin embargo, en
patologías específicas como el edema de Reinke el carácter afilado de los surcos
incluso podría aumentar. En todo caso, la desviación del perfil en un caso concreto
respecto a una población normativa se puede relacionar con presencia de patología
(Gómez, P. et al, 2009b).

Los valores obtenidos para los puntos del primer surco obedecen a las siguientes
expresiones (Gómez, P. et al, 2009b):

Las estimaciones de los valores están normalizadas respecto al primer máximo


para reducir la variabilidad intralocutor.

Estos cálculos se pueden extender al cálculo de los puntos correspondientes a los


restantes surcos presentes en la señal:

47
Capítulo 3: Parámetros glóticos presentes en el estudio

con , siendo el índice del surco y el número de surcos totales. Se asume


que y que . En particular, en este estudio recogeremos los valores
correspondientes a los dos primeros surcos.

Por otra parte, el factor slenderness (esbeltez) del surco se define como:

con , siendo el índice del surco y el número de surcos totales.

El factor slenderness está fuertemente vinculado al valor de la elasticidad de los


resortes que unen las correspondientes masas en el modelo biomecánico asociado a
los pliegues vocales, y es una medida de la tensión general en la voz (Gómez, P. et al,
2009b).

También consideraremos los valores de amplitud y frecuencia correspondientes al


origen de la señal, al mínimo inicial presente antes de iniciar la brusca subida y al
punto final de la señal.
En la figura 3-9 podemos observar varios de los parámetros resultantes: los
correspondientes al valor de amplitud del primer máximo (p17), y a los valores de
amplitud y frecuencia del primer mínimo (p18 y p27), segundo máximo (p19 y p28),
segundo mínimo (p21 y p30), tercer máximo (p22 y p31) y punto final de la señal (p23 y
p32).

Fig. 3-9. Representación de algunos parámetros glóticos biométricos.

48
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

En resumen, los parámetros glóticos biométricos que se utilizarán en este estudio


son los listados en la tabla 3-2: (Pedro Gómez Vilda et al, 2009), (Gómez, P. et al,
2005c), (Gómez, P. et al, 2007).
Tabla 3-2. Parámetros biométricos utilizados en el estudio. Todos
los parámetros están estimados a partir de la envolvente de la
densidad espectral de potencia de la fuente glótica. La numeración
establecida es de carácter interno, y tiene en cuenta el resto de
parámetros con los que se trabaja en esta tesis.
Nº Parámetro biométrico
15 Amplitud del origen de la señal (valor relativo)
16 Amplitud del mínimo inicial (valor relativo)
17 Amplitud del primer máximo (valor absoluto)
18 Amplitud del primer mínimo (valor relativo)
19 Amplitud del segundo máximo (valor relativo)
20 Amplitud del tercer máximo (valor relativo)
21 Amplitud del segundo mínimo (valor relativo)
22 Amplitud del cuarto máximo (valor relativo)
23 Amplitud del final de la señal (valor relativo)
24 Frecuencia del origen de la señal (valor relativo)
25 Frecuencia del mínimo inicial (valor relativo)
26 Frecuencia del primer máximo (valor absoluto)
27 Frecuencia del primer mínimo (valor relativo)
28 Frecuencia del segundo máximo (valor relativo)
29 Frecuencia del tercer máximo (valor relativo)
30 Frecuencia del segundo mínimo (valor relativo)
31 Frecuencia del cuarto máximo (valor relativo)
32 Frecuencia del final de la señal (valor relativo)
33 Esbeltez correspondiente al primer surco
34 Esbeltez correspondiente al segundo surco

Es necesario destacar una cuestión importante referida a los valores de algunos de


estos parámetros: entre el segundo máximo del primer surco y el primer máximo del
segundo surco esperábamos encontrar una pequeña diferencia en frecuencia (y
aunque aún más pequeña, quizá una ligera diferencia en amplitud). Las mediciones
empíricas arrojan un resultado diferente: el primer y el segundo surco comparten un
máximo. Esto se traduce en que los valores del parámetro 19 (amplitud del segundo
máximo de la señal) y los del parámetro 20 (amplitud del tercer máximo de la señal)
coinciden plenamente. Lo mismo sucede con los parámetros 28 y 29, referidos a las
frecuencias del segundo y tercer máximo de la señal. Podemos observar esto de una
manera muy esquemática pero suficientemente clara en la figura 3-10.

La parte (a) de la figura recoge la situación esperada, razón por la cual contábamos
con tener cuatro parámetros en cada dimensión preparados para recoger el valor de
los cuatro máximos. La parte (b) recoge la situación real, en la que se aprecia que los
valores de dos de los máximos (el segundo y el tercero) coinciden.

49
Capítulo 3: Parámetros glóticos presentes en el estudio

Fig. 3-10. Representación esquemática de los dos primeros surcos de la envolvente de


la densidad espectral de potencia de la fuente glótica; (a) se corresponde con la forma
esperada de los surcos; (b) representa la forma real, donde se aprecia que dos de los
puntos esperados coinciden.

Una situación parecida se da con los parámetros relacionados con el origen de la


señal y con el mínimo inicial. En efecto, la situación esperada se corresponde con la
presencia de un mínimo cercano al origen de la señal, desde donde ésta inicia su
escalada hasta el primer máximo. Sin embargo, los resultados experimentales nos
dicen que en un porcentaje de los casos medidos muy cercano al 100% la señal
comienza a subir directamente, por lo que los dos puntos referidos son en realidad el
mismo (este porcentaje aumenta aún más si consideramos la medida ciclo a ciclo).
Esto afecta a los parámetros 15 y 16 (valor en amplitud de ambos parámetros) y
también a los parámetros 24 y 25 (valor en frecuencia de ambos parámetros). En la
figura 3-11 podemos observar una representación esquemática de lo explicado; como
en el caso de la figura anterior, el gráfico es esquemático, pero refleja con claridad la
situación expuesta. La parte (a) de la figura recoge la situación esperada, y la parte (b)
muestra la situación obtenida.

Fig. 3-11. Representación esquemática de la envolvente de la densidad espectral de


potencia de la fuente glótica; (a) se corresponde con la forma esperada de la señal,
donde se diferencian el punto de origen (or) y el primer mínimo (m1); (b) representa la
forma obtenida, donde se aprecia que los dos puntos en cuestión coinciden.

La coincidencia de valores que se da en los dos casos presentados será tenida en


cuenta en los estudios estadísticos que se presentan en esta tesis, suprimiendo en
50
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

cada caso una de las dos variables que contienen los valores duplicados. En concreto,
no consideraremos en el estudio a los parámetros 20 y 29, correspondientes al tercer
máximo, pero sí a los parámetros 19 y 28, correspondientes al segundo máximo;
tampoco consideraremos a los parámetros 16 y 25, correspondientes al mínimo inicial,
pero sí a los parámetros 15 y 24, correspondientes al punto origen de la señal. A pesar
de excluir del estudio a los parámetros mencionados mantendremos la numeración
propuesta inicialmente, de cara a mantener la coherencia con los estudios publicados.

3.4. Parámetros glóticos biomecánicos


Los parámetros biomecánicos relacionados con el cuerpo de los pliegues vocales
presentes en el estudio se han obtenido a partir de la densidad espectral de potencia
de la onda acústica promedio. La técnica para su estimación (Gómez, P. et al, 2007) se
basa en el ajuste adaptativo de la señal mencionada con la función de transferencia del
modelo de pliegue vocal de una masa. Partiendo de la hipótesis de que la onda
acústica promedio se determina por la componente dinámica del cuerpo de la cuerda,
la envolvente de su densidad espectral de potencia está directamente relacionada con
el módulo al cuadrado de la admitancia de entrada derivada del modelo de una masa:

siendo la frecuencia angular medida en ,y , respectivamente, los


parámetros asociados a la masa, elasticidad y pérdida del modelo de una masa.

La estimación de los parámetros del modelo se basa en la elección de dos puntos en


la densidad espectral de potencia de la onda acústica promedio, es decir, y
. La masa entonces puede ser estimada como:

La selección de los puntos más adecuados para y es fundamental


para conseguir una estimación precisa y robusta. De acuerdo con todos los casos
analizados se ha comprobado que son buenos candidatos para los dos puntos la
posición del pico principal de resonancia de la señal y la posición del tercer armónico
desde el pico principal, respectivamente.
Con la masa estimada, la elasticidad se puede obtener a partir de la
determinación de la posición del máximo asociado al pico de resonancia :

Por último, el parámetro de pérdida puede ser estimado (con un factor de escala
) como:

donde corresponde al valor del módulo al cuadrado de la impedancia de entrada en


la frecuencia de resonancia asociada al primer máximo de la señal.

51
Capítulo 3: Parámetros glóticos presentes en el estudio

Los parámetros equivalentes correspondientes a la cubierta de los pliegues vocales


se pueden estimar de un modo similar utilizando en esta ocasión la densidad espectral
de potencia de la onda mucosa como señal base (Gómez, P. et al, 2005c).
Por otra parte, es frecuente considerar en los diferentes modelos la simetría de los
pliegues vocales, pero esta asunción no es correcta en la mayoría de los casos. La
asimetría se verá reflejada en el desbalance en los ciclos de fonación vecinos de los
parámetros biomecánicos recién presentados. Parece razonable pensar que este
desbalance será mayor en los casos patológicos que en los normofónicos.
Teniendo en cuenta que las estimaciones de las masas, elasticidades y pérdidas se
producen en el marco de un ciclo de fonación, el desbalance de estos parámetros se
puede definir como:

donde es el índice del del ciclo de fonación y , y son el k-ésimo


ciclo correspondiente a la estimación de la masa, pérdida y elasticidad de una muestra
de voz dada.
En resumen, los parámetros biomecánicos que se utilizarán en este estudio son los
listados en la tabla 3-3 (Pedro Gómez Vilda et al, 2009), (Gómez, P. et al, 2005c),
(Gómez, P. et al, 2007).
Tabla 3-3. Parámetros biomecánicos utilizados en el estudio. Del 35
al 40, estimados a partir de la envolvente de la densidad espectral
de potencia de la onda acústica promedio. Del 41 al 46, estimados a
partir de la envolvente de la densidad espectral de potencia de la
onda mucosa. La numeración establecida es de carácter interno, y
tiene en cuenta el resto de parámetros con los que se trabaja en
esta tesis.
Nº Parámetro biomecánico
35 Masa del cuerpo
36 Pérdida del cuerpo
37 Elasticidad del cuerpo
38 Desbalance de la masa del cuerpo
39 Desbalance de la pérdida del cuerpo
40 Desbalance de la elasticidad del cuerpo
41 Masa de la cubierta
42 Pérdida de la cubierta
43 Elasticidad de la cubierta
44 Desbalance de la masa de la cubierta
45 Desbalance de la pérdida de la cubierta
46 Desbalance de la elasticidad de la cubierta

52
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

3.5. Parámetros glóticos temporales


Los parámetros temporales tienen una especial importancia en los estudios
realizados con el fin de detectar patología vocal a partir de la fuente glótica, tal y como
veremos en el apartado siguiente (3.6). Estos parámetros surgen del estudio de un
único ciclo glótico, en el que podemos observar representadas la fuente glótica, la
onda mucosa, la onda acústica promedio y la derivada de la onda mucosa en la figura
3-12, correspondiente al modelo ideal de Liljencrants-Fant.

Fig. 3-12. Puntos singulares en un ciclo de fonación de acuerdo al modelo L-F.

En la figura podemos observar los puntos singulares que dan lugar a los parámetros
temporales presentes en el estudio. Tres de estos puntos singulares dividen el ciclo de
fonación, de período T, en cuatro fases o intervalos principales:

 Intervalo de retorno ( ). Los pliegues vocales están recién cerrados, y


las condiciones de presión supraglótica se restablecen, llegando de nuevo a
los niveles de reposo de la presión atmosférica. El punto singular se estima
a partir del punto de estabilización de la fuente glótica, y se corresponde
directamente con el parámetro 49 del modelo, llamado punto de
recuperación.
 Intervalo cerrado ( ). Los pliegues vocales siguen cerrados, y las
condiciones de presión se estabilizan. El punto singular marca el inicio de la
apertura de los pliegues vocales, y coincide con un aumento brusco de la
presión. Se corresponde directamente con el parámetro 47 del modelo,
llamado punto de apertura. Este parámetro tiene una especial relevancia, ya
que su posición puede discriminar, además de la presencia o ausencia de
patología vocal, aspectos como el género del locutor (Fernández-Baillo, R.,
Gómez-Vilda, P. & Godino, J.I., 2009).

53
Capítulo 3: Parámetros glóticos presentes en el estudio

 Intervalo abierto ( ). Los pliegues vocales están abiertos. La


presión supraglótica comienza su descenso.
 Intervalo de cierre ( ). Los pliegues vocales, que continúan
abiertos, comienzan su cierre. La presión supraglótica sigue cayendo. El tercer
punto singular de la señal , que marca el inicio del intervalo, se puede
estimar a partir del punto de caída de la presión respecto al nivel de
equilibrio, y se corresponde directamente con el parámetro 48 del modelo,
llamado punto de cierre.

Por otra parte, debido a la importancia de la onda mucosa y a su relación con la


calidad vocal se utilizan como parámetros del modelo dos puntos característicos de la
misma: la posición temporal de los dos primeros máximos de la señal, que
constituirán, respectivamente, los parámetros 50 y 51 del modelo.

En resumen, los parámetros temporales que se utilizarán en este estudio, todos


ellos normalizados respecto al valor del período de la señal, son los listados en la tabla
3-4 (Gómez, P. et al, 2011), (Fernández-Baillo, R. et al, 2007), (Fernández-Baillo &
Gómez-Vilda, P., 2009):

Tabla 3-4. Parámetros temporales utilizados en el estudio. Todos los


parámetros están estimados a partir de la fuente glótica y de la
onda mucosa. La numeración establecida es de carácter interno, y
tiene en cuenta el resto de parámetros con los que se trabaja en
esta tesis.
Nº Parámetro temporal
47 Punto de apertura
48 Punto de cierre
49 Punto de recuperación
50 Posición del primer máximo de la onda mucosa
51 Posición del segundo máximo de la onda mucosa

3.6. Revisión del uso de parámetros glóticos en la detección de patología vocal

La señal glótica, debido a su estrecha relación con el modo de vibración de los


pliegues vocales ha sido analizada en el campo de la detección y clasificación de
patología vocal, aunque la literatura existente es mucho menos abundante que la que
se refiere al estudio de parámetros obtenidos directamente de la señal de voz.

Por otra parte, estos estudios trabajan generalmente con la fuente glótica o con su
derivada, frecuentemente denominada residuo, siendo la obtención y el análisis de
parámetros relacionados con la onda mucosa y la onda acústica promedio una
novedad en el campo, aportada por nuestro grupo de investigación y recogida
principalmente en (Gómez, P. et al, 2004d), (Gómez, P. et al, 2005b).

En (Alku, P., 2003) podemos encontrar un estudio en el que se describen algunos


parámetros glóticos obtenidos mediante filtrado inverso de la señal de voz, y en el que
se destaca que la obtención y utilización de estos parámetros puede ser útil en tres
campos diferentes, aunque relacionados: la producción básica de la voz a través del
54
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

mayor conocimiento del origen de la misma es el primero de ellos, y puede derivar en


cuestiones como el estudio de la intensidad vocal, del estado emocional del locutor o
en investigaciones forenses como la identificación del locutor; el segundo campo que
menciona el autor es precisamente la diagnosis y tratamiento de trastornos vocales;
por último, los parámetros glóticos pueden ser de utilidad en el campo de la síntesis de
voz.
Los parámetros analizados en (Alku, P., 2003) se dividen en tres categorías. En
primer lugar aparecen, entre otros, los parámetros temporales OQ (Open Quotient),
SQ (Speed Quotient) y ClQ (Closing Quotient). El autor destaca la variación de estos
parámetros en función del género, de la fatiga vocal y de la intensidad de la fonación,
entre otras variables. También propone un nuevo parámetro temporal denominado
Normalized Amplitude Quotient (NAQ), que resulta correlar fuertemente con el
parámetro ClQ siendo mucho más robusto que éste en presencia de ruido.
En segundo lugar, el trabajo estudia los denominados parámetros basados en la
amplitud, entre los que se incluyen el DC-offset (componente de señal continua
presente en la fuente glótica), el AC-flow (pico máximo de amplitud presente en la
señal glótica, a partir del DC-offset) y el pico máximo de amplitud negativa presente en
la derivada de la señal glótica (MFDR, Maximum Flow Declination Rate). Como en el
caso anterior, el trabajo incluye relaciones de estos parámetros con los dos géneros y
con la intensidad de la voz. También encuentra correlación entre el cociente del DC-
offset y el AC-flow con voces aspiradas, y entre el parámetro MFDR con
manifestaciones de hiperfunción vocal. Es conveniente destacar que para la obtención
de los dos primeros parámetros es necesario obtener la señal glótica a partir del
filtrado inverso de la señal obtenida en la boca (flujo de aire) mediante el uso de una
máscara de Rothenberg (Rothenberg, M., 1973), (Hertegård, S. & Gauffin, J., 1992).
Por último, Alku estudia parámetros obtenidos en el dominio de la frecuencia, como
la diferencia entre las amplitudes del primer y segundo armónico (H1-H2) o el
parámetro HRF, definido como el cociente entre la suma de las amplitudes de
determinado número de armónicos y la amplitud de la frecuencia fundamental. En el
primer caso encuentra una alta correlación entre este parámetro y el parámetro
temporal ClQ, y en el segundo analiza las diferencias de los valores del parámetro en
función del tipo de fonación (ronca, normal o aspirada).

En (Orr, R., Cranen, B. & Jong, F.I.D., 2003) encontramos un estudio en el que
también se utilizan parámetros glóticos, aunque en esta ocasión con un propósito
diferente: el autor pretende comparar las medidas obtenidas a partir de la señal de voz
con las obtenidas a partir del uso de una máscara de Rothenberg, bajo la hipótesis de
que debería existir una fuerte correlación entre ambas.
Los parámetros escogidos para hacer la experimentación fueron la diferencia entre
los dos primeros armónicos (H1-H2), una medida de la caída de la envolvente espectral
(spectral slope), el cociente de velocidad (SP, Speed Quotient) y el cociente de apertura
(OQ, Open Quotient).
Los resultados no confirmaron la hipótesis, no se encontraron correlaciones entre
los parámetros obtenidos por las dos vías mencionadas. Es conocido que la señal de
voz se puede estimar a partir de una derivada de primer orden de la señal de flujo
aéreo en la boca (Flanagan, J.L., 1972), por lo que ambas señales recogen
esencialmente la misma información, con la excepción de una componente de señal

55
Capítulo 3: Parámetros glóticos presentes en el estudio

continua presente en la fuente glótica. Por estas razones se esperaba, según los
autores, que los parámetros medidos hubieran sido comparables, pero los estudios
estadísticos realizados afirmaron lo contrario.
La explicación ofrecida involucra múltiples causas, una de ellas es la variabilidad
interlocutor, que podría ser reducida formando grupos experimentales del mismo
género, parecida edad, etcétera; otra posible causa para explicar los resultados es la
variabilidad intralocutor, debida posiblemente a la incomodidad que provoca la
máscara y a las propias limitaciones inherentes al uso de la misma: disminución de los
primeros formantes y pérdida de información en altas frecuencias (Rothenberg, M.,
1973), (Rothenberg, M., 1977), (Hertegård, S. & Gauffin, J., 1992), (Badin, P.,
Hertegård, S. & Karlsson, I., 1990).

En (Price, P.J., 1989) encontramos un trabajo centrado en el género y en los modos


de pronunciación (voz normal, chirriante y entrecortada) que utiliza parámetros
glóticos. Estos parámetros son el cociente de apertura, el denominado return quotient
(medida relacionada con el máximo valor de cambio de flujo y con el flujo mínimo) y
valores de energía recogidos en el dominio de la frecuencia.
El estudio cuenta con una base de datos de ocho locutores (cuatro masculinos y
cuatro femeninos) que debieron realizar catorce pronunciaciones: diez normales, dos
chirriantes y dos entrecortadas. Como conclusión principal se destaca el hecho que se
encontraron diferencias tanto entre las pronunciaciones de ambos sexos como entre
las pronunciaciones normales y las que no lo eran, y que ambos tipos de diferencias
fueron similares en magnitud.

En (Kuo, J., Holmberg, E.B., & Hillman, R.E., 1999) se trabaja de manera combinada
con parámetros acústicos clásicos procedentes de la señal de voz (en el dominio de la
frecuencia, en este caso) y con parámetros glóticos extraidos a partir del uso de una
máscara de Rothenberg. El trabajo se ocupa de estudiar, mediante análisis
discriminante, los parámetros o conjuntos de los mismos que son capaces de distinguir
mejor entre voces sanas y voces con presencia de nódulos en los pliegues vocales.
Los parámetros glóticos empleados fueron la presión subglótica, el flujo medio, el
flujo mínimo, el pico máximo de amplitud de la señal glótica sin contabilizar la
componente continua (AC flow), el cociente de apertura y el MFDR (Maximum Flow
Declination Rate).
Los resultados obtenidos indicaron que el uso combinado de todos los parámetros
llevó a una tasa de acierto del 96%. Por separado, los parámetros glóticos alcanzaron
el 95%, mientras que los parámetros acústicos clásicos sólo llegaron al 76%. Estudios
más concretos concluyeron que la presión subglótica combinada con el cociente de
apertura alcanza un 94% de tasa de acierto, constituyéndose ambos en los dos
parámetros más importantes de los analizados.

Destacaremos también el trabajo de (de Oliveira Rosa, M., Pereira, J.C. & Grellet,
M., 2000), en el que los autores extrajeron siete parámetros de la derivada de la
fuente glótica, con el objetivo de estudiar cuáles de ellos discriminan mejor la
presencia de patología vocal.
La base de datos utilizada constaba de 73 locutores, 48 de los cuales presentaron
algún tipo de patología vocal. El número de patologías vocales contempladas fue

56
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

extenso, alcanzando las veintiuna. Entre ellas figuraban el carcinoma, el edema de


Reinke, nódulos, laringitis y pólipos, entre otras.
Los parámetros empleados fueron los siguientes: MSR (Mean Square Residue, suma
del cuadrado de la señal empleada), EX (Excess Coefficient, curtosis de la distribución
de la señal), SFR y SFF (Spectral Flatness of Residue y Spectral Flatness of AR Filter,
respectivamente, medidas relacionadas con la proporción de ruido presente en la
señal), JITTER (perturbación de la frecuencia fundamental), PEAK (medida estadística
relacionada con la frecuencia fundamental) y P/A (Peak of Autocorrelation, mediana
del segundo pico de la autocorrelación normalizada de la señal).
Los parámetros fueron sometidos al test U de Mann-Whitney (Lehmann, E. L., &
D'Abrera, H. J., 2006), y los resultados concluyeron que el parámetro que mejor
discrimina es el JITTER, con un 54,79% de efectividad seguido del SFF, con un 52,52%.
El peor parámetro fue el SFR, con un 36,41% de acierto. Los autores proponen, como
trabajo futuro, un estudio estadístico multivariante que incluya los mejores
parámetros, de cara a conseguir resultados más precisos.

Por último, mencionar que en (Lázaro-Carrascosa, C. & Gómez-Vilda, P., 2014) está
publicado un breve resumen del trabajo realizado en esta tesis, esencialmente
centrado en los resultados más importantes del análisis estadístico llevado a cabo.
Además, en (Lázaro-Carrascosa, C. & Gomez-Vilda, P., 2015a) y en (Lázaro-Carrascosa,
C. & Gomez-Vilda, P., 2015b) encontramos trabajos en los que se ha aplicado parte del
protocolo de experimentación utilizado en esta tesis a un nuevo conjunto de
parámetros, obteniendo resultados satisfactorios.

57
4. Patologías vocales, bases de datos y
herramientas para la ayuda al
diagnóstico
Capítulo 4: Patologías vocales, bases de datos y herramientas de ayuda al diagnóstico

4.1. Patologías vocales: clasificación y características generales

Existe un gran número de patologías de la voz, entendiendo como tales aquellas


que se manifiestan mediante un deterioro en la calidad de la voz (Godino Llorente, J.I.,
2002). Un término muy utilizado para referirse a ellas es el de disfonía, definido por la
Real Academia Española como trastorno cualitativo o cuantitativo de la fonación por
causas orgánicas o funcionales. Sin embargo, es frecuentemente aceptado que la
disfonía está relacionada con la percepción de quien escucha, mientras que la
patología es un término clínico. Aunque ambos conceptos coinciden en un gran
número de ocasiones no se consideran sinónimos: hay patologías que no suenan
disfónicas, y hay disfonías que no obedecen a una causa patológica.

Este apartado no pretende, ni mucho menos, realizar un recorrido exhaustivo por


todas las patologías de la voz. Únicamente deseamos, por una parte, tratar de fijar el
ámbito de actuación de los algoritmos automáticos que son capaces, en mayor o
menor medida, de detectar estas patologías. Por otra, presentamos de forma general
el marco de trabajo que es foco de nuestra investigación. En los próximos párrafos
mencionaremos algunas de las clasificaciones propuestas en la literatura, destacando
el hecho de que no son totalmente rigurosas ni son las únicas existentes. En general,
las fronteras entre los diferentes grupos es difícil de precisar, y algunas patologías
podrían encuadrarse en más de uno de ellos. A continuación mencionaremos algunas
de las patologías más frecuentes, para concluir destacando aquellas propiedades
acústicas comunes que presentan y que dan pie a que puedan ser detectadas
mediante alguna de las técnicas explicadas en alguno de los apartados de esta tesis.

El ICD-10 (International Clasiffication of Diseases, V.10) es la última versión del


listado oficial de enfermedades y patologías publicado por la Organización Mundial de
la Salud (World Health Organization, 2010). Las patologías relacionadas con la voz y el
habla no tienen en esta clasificación un apartado específico, y como consecuencia de
ello no aparecen subdivisiones de las mismas. La búsqueda de los términos voz (voice
en inglés) y habla (speech en inglés) ofrece como resultados varias patologías
encuadradas en alguna de las siguientes categorías: perturbaciones de la voz no
clasificadas en ningún otro apartado, perturbaciones del habla no clasificadas en
ningún otro apartado o dislexia y otras disfunciones simbólicas, no clasificadas en
ningún otro apartado. Otros términos como laringe ofrecen resultados mucho más
amplios, pero también más generales: lesiones, envenenamiento, malformaciones
congénitas, infecciones, quemaduras, neoplasmas, problemas respiratorios, etc.
Por otra parte, la Organización Mundial de la Salud también ofrece otra clasificación
que complementa a la anterior: la clasificación de funcionamiento, discapacidad y
salud (International Classification of Functioning, Disability and Health, ICF) (World
Health Organization, 2013). En esta última clasificación se contemplan los aspectos
funcionales que afectan a la salud de las personas, y las patologías relacionadas con la
voz y el habla adquieren una importancia mayor, apareciendo en lugar destacado en
dos de los grandes grupos que contempla la clasificación: funciones corporales y
estructuras corporales. En (Ma, E.P.M., Yiu, E.M.L. & Abbott, K.V., 2007) se ha llevado a
cabo un estudio de aplicación de la clasificación ICF dedicada exclusivamente a
trastornos vocales.

60
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

En general, es comúnmente aceptado el hecho de dividir las patologías vocales en


dos grandes grupos (siempre atendiendo a la causa, aunque veremos que algunos
autores utilizan también otros criterios), como ya pudimos observar en la definición de
la Real Academia Española: patologías orgánicas y funcionales. Las primeras se
caracterizan porque existe una malformación o lesión en alguno de los elementos del
aparato fonador; las segundas lo hacen porque existe un inadecuado control de la voz,
pero los órganos fonadores están en perfecto estado. Es común, sin embargo, que las
patologías funcionales deriven en orgánicas, lo que abunda en la dificultad de su
clasificación y lo que ha llevado a autores como Le Huche a romper con este criterio
clásico orgánico-funcional, proponiendo un criterio multifactorial en el que intervienen
tres elementos: sobreesfuerzo vocal que se transforma en un hábito y que lleva a
distorsiones de la producción vocal, factores desencadenantes que pueden provocar el
inicio de ese sobreesfuerzo vocal –laringitis aguda, factores psicológicos,
traumatismos– y factores favorecedores que no inician por sí solos el proceso pero que
hay que tenerlos en cuenta a la hora de la prevención –ansiedad, hábitos tóxicos– (Le
Huche, F. & Allali, A., 2004), (Bolettieri, S., 2007).

En la página web www.tuotromedico.com (PulsoMed, S.A., 2014), servicio web


sobre salud acreditado por el Colegio Oficial de Médicos de Barcelona y certificado por
la fundación de salud Health on the Net Foundation (http://www.hon.ch/)
encontramos una sencilla clasificación de patologías vocales, que distingue cinco
grandes grupos:
1. Orgánicas. Alteraciones de la voz producidas por una lesión anatómica en los
órganos de la fonación.
2. Funcionales. Alteraciones de la voz sin lesión anatómica en los órganos
fonatorios. Se dividen en hipercinéticas, caracterizadas por exceso de tensión en
los pliegues vocales, lo que a la larga los debilita e hipocinéticas, caracterizadas
por falta de tensión muscular en los pliegues vocales, lo que provoca un defecto
de cierre.
3. Traumáticas. Provocadas por un traumatismo, como un accidente de tráfico, una
agresión con objeto punzante o una intubación intracraneal.
4. Psicógenas. Provocadas por un trastorno psicológico.
5. Audífonas. Provocadas por un déficit auditivo.

El doctor Jorge González, por su parte, distingue dos categorías: funcionales y


orgánicas, aunque en ambos grupos precisa si existe o no alteración estructural del
órgano emisor (Bolettieri, S., 2007).

Por su parte, Gallardo y Gallego (Gallardo Ruiz, J.R. & Gallego Ortega, J.L., 1993),
(Madrid Fernández, C.F., 2008) utilizan tres criterios diferentes para clasificar las
patologías vocales. El primero de ellos, denominado cuantitativo atiende al grado de
pérdida en la voz, distinguiendo entre la afonía o pérdida total de la voz y la disfonía o
pérdida parcial de la voz, en cualquiera de sus propiedades (tono, timbre, intensidad,
duración). El segundo criterio, denominado topográfico, atiende a la localización de la
lesión, distinguiendo dos grandes grupos: el primero de ellos se denomina
laringofonía, con lesión localizada en la laringe, y se divide en los subgrupos mala
impostación (utilización de un tono inadecuado), ronquera vocal (voz grave y sin
timbre, suele ser consecuencia de gritos excesivos), laringitis funcional (inflamación de

61
Capítulo 4: Patologías vocales, bases de datos y herramientas de ayuda al diagnóstico

la parte superior de la laringe, alteración en las mucosas nasales) y fonastenia (fatiga o


cansancio bucal: voz débil, poco profunda, sin timbre). El segundo grupo de patologías
topográficas se denomina rinofonía, con lesión localizada en las cavidades de la
resonancia (tracto vocal y nasal), y se divide en los subgrupos abiertas (el aire se
escapa por la nariz durante la fonación) y cerradas (se produce una obstrucción nasal).
Por último, el tercer criterio atiende a la causa, y contempla dos grandes grupos:
patologías orgánicas, formado por los subgrupos congénitas, víricas, inflamatorias y
traumáticas y patologías funcionales, que se dividen en hipercinéticas o hipertónicas e
hipocinéticas o hipotónicas.

Cobeta, por su parte (Cobeta, I. & Tapia, R.G., 1996), (Godino Llorente, J.I., 2002)
distingue cinco grandes grupos de patología vocal, atendiendo a la causa que las
provoca: orgánicas, funcionales, por trastornos neurológicos (el aparato fonador
presenta un perfecto estado, pero no se puede controlar la fonación correctamente
debido a trastornos en la coordinación motora causados por daño en las regiones del
sistema nervioso responsables de la producción de voz, conociéndose estas
alteraciones generalmente como disartrias), por trastornos en la resonancia y por
trastornos psiquiátricos o del sector cognitivo de la personalidad (entre otras, dislalias,
disfemia o tartamudez, alteraciones provocadas por trastornos cerebrales o por
miedos irracionales u obsesiones).

Prater y Swift (Prater, R.J. & Swift, R.W., 1986), (Bolettieri, S., 2007) proponen una
clasificación basada en dos conceptos importantes a la hora de hablar de las disfonías:
el abuso vocal y el mal uso vocal. El abuso vocal se refiere a una higiene vocal pobre,
incluyendo conductas que puedan ejercer efectos traumatizantes en los pliegues
vocales: chillar, aclamar, imitar sonidos emitidos por máquinas, aclarar excesivamente
la garganta, inhalar humo, polvo o gases nocivos, etc. El mal uso vocal está relacionado
con un uso incorrecto del tono y de la intensidad en la producción de voz, situaciones
que se suelen dar en ambientes de alto ruido ambiental (Godino Llorente, J.I., 2002).
Prater y Swift dividen las patologías vocales de acuerdo a estas definiciones,
distinguiendo tres grupos: originadas por abuso vocal, debido al mal uso vocal y por
abuso y mal uso.

Gómez Vilda (Gómez, P., 2002) realiza una clasificación centrada en el


comportamiento predominante de los pliegues vocales: lesiones por defecto de cierre
con contacto, lesiones por defecto de cierre sin contacto, lesiones por desequilibrio
mecánico de los pliegues vocales y lesiones por bloqueo de la vibración.

Por último destacaremos la aportación realizada por el Dr. Jorge Perelló,


considerado introductor de la foniatría en España (Bolettieri, S., 2007), (Puyuelo
Sanclemente, M. & Llinás i Miró, M.A., 1992), (Perelló, J. & Miquel, J.A.S., 1973). En
primer lugar, Perelló hace una muy completa clasificación, dividiendo las patologías en
malformaciones laríngeas, inflamaciones, disfonías funcionales, hemorragia
submucosa, voz de bandas, traumatismos, etc. Dentro de las disfonías funcionales, que
son de largo las observadas de modo más frecuente, Perelló distingue dos grandes
grupos: disfonías estrictamente funcionales y disfonías funcionales con lesiones
orgánicas. En el primer grupo incluye la fonoponosis (alteración de la voz producida
por un trabajo excesivo o mal ejecutado, puede ser por exceso –hiperfunción,

62
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

hipertonía– o por defecto –hipofunción, hipotonía–) y la fononeurosis, en la que


incluye las disfonías psicógenas. En el segundo grupo aparecen las disfonías
hipercinéticas (monocorditis vasomotora, calambre vocal, voz de bandas ventriculares,
hemorragia submucosa, úlcera de contacto, eversión ventricular) y las disfonías
hipocinéticas (nódulos, pólipos, edema de Reinke, ambliphonía exaquinesia,
diplofonía).

En la tabla 4-1 profundizamos en algunas de las patologías concretas más comunes,


incluyendo una breve descripción de las mismas que se centra especialmente en los
aspectos acústicos presentes en la voz de las personas afectadas, elementos que
permitirán la ayuda al diagnóstico automático.

Tabla 4-1. Patologías vocales frecuentes, junto con una breve descripción (Gómez, P., 2002),
(Godino Llorente, J.I., 2002).
Patología Descripción
Nódulos de pliegue vocal Patología orgánica, defecto de cierre con contacto. Se
incrementa la masa y la rigidez de la cubierta del pliegue. El
aumento de masa produce un incremento en la aperiodicidad
de la vibración, lo que provoca un aumento del jitter y
shimmer y de la ronquera. Disminuye el rango vocal y el
margen dinámico. La frecuencia fundamental permanece en
márgenes normales. En función del tamaño del nódulo se
aprecia un cierre más o menos defectuoso, con un aumento
de la cantidad de aire que escapa, y un aumento en el nivel
de las componentes ruidosas en las regiones de alta
frecuencia.
Pólipos Patología orgánica, defecto de cierre con contacto.
Características similares a las presentes en los nódulos de
pliegue vocal, con posible ausencia de onda mucosa en
función de las características del pólipo y posible presencia de
asimetría en la fonación.
Parálisis laríngea unilateral Patología funcional, defecto de cierre sin contacto.
Importante componente aéreo en la voz, disminución de los
tiempos fonatorios, imposibilidad para alcanzar los tonos
agudos. La onda mucosa en el lado paralizado está retrasada
en su inicio respecto al lado sano, y es irregular.
Debilitamiento de componentes armónicos y aumento de
presencia de ruido.
Prebisfonía Patología orgánica, defecto de cierre sin contacto. Es el modo
fonatorio de las personas de edad avanzada, pero a menudo
sus características obedecen más a malas condiciones de vida
que al proceso de envejecimiento normal del organismo, por
lo que los síntomas se presentan antes. Aparece fatiga vocal,
aire en la voz y disminución de los rangos vocales y
dinámicos. Se aprecia una cierta irregularidad en la onda
mucosa, además de la presencia de un defecto de cierre
central y posterior. La frecuencia fundamental de los hombres
aumenta, y la de las mujeres disminuye, por disminución
hormonal. Aparece aumento de ruido en el espectrograma,
temblor en la voz y disminución de energía de los armónicos.

63
Capítulo 4: Patologías vocales, bases de datos y herramientas de ayuda al diagnóstico

Patología Descripción
Quistes intracordales Patología orgánica, desequilibrio mecánico de los pliegues
vocales. Signos acústicos similares a los presentados en los
nódulos de pliegue vocal.
Edema de Reinke Patología orgánica, desequilibrio mecánico de los pliegues
vocales. Incremento de la masa del pliegue, aumento de la
aperiodicidad de la vibración, con aumento del jitter y de la
ronquera. Disminución de la rigidez de la cubierta del pliegue.
También desciende la frecuencia fundamental, y aparece una
onda mucosa aumentada. Dependiendo del tamaño y
localización puede interferir más o menos con el cierre,
observándose (si el cierre es afectado) un aumento del
escape de aire y de ruido en el espectrograma. Dependiendo
de que el edema sea bilateral o unilateral el desequilibrio de
masas puede ser más o menos evidente con mayor o menor
presencia de perturbaciones en la voz y disminución del rango
vocal y dinámico.
Laringitis Patología orgánica, bloqueo de la vibración. Inflamación
duradera de la mucosa laríngea, hinchazón o edema de
alguna parte de la laringe. Incremento de la rigidez del
pliegue. La masa sólo se altera significativamente si hay
lesiones asociadas. Aumento del jitter y del shimmer,
disminución del rango vocal y dinámico. Ruido en el
espectrograma. Irregularidad y disminución de la onda
mucosa.
Sulcus vocalis Patología orgánica, bloqueo de la vibración. Aumento de la
rigidez, ausencia de onda mucosa. Reducción del rango
dinámico, frecuencia fundamental más baja de lo normal.
Fatiga vocal.
Carcinoma microinvasor Patología orgánica, bloqueo de la vibración. Grado severo de
disfonía, desaparición de la onda mucosa.
Cicatrizaciones anómalas Patología orgánica, frecuentemente traumática, bloqueo de
la vibración. Ausencia de onda mucosa, limitación del rango
dinámico y vocal. Aumento de las perturbaciones
dependiendo del grado de la lesión y aumento de la
componente de ruido en el espectrograma si coexiste defecto
de cierre.

En la tabla podemos observar que existen determinados rasgos acústicos que se


repiten con frecuencia en las patologías mencionadas: aumento del jitter y shimmer,
disminución del margen dinámico y del rango vocal, disminución, irregularidad o
desaparición de la onda mucosa y presencia de ruido en el espectrograma son los más
destacados. Es importante comentar que el presente trabajo está enfocado en la
detección general de patología vocal, no en la clasificación del tipo de patología
detectado; sin embargo, como veremos en el capítulo siete, los trabajos futuros sí
están relacionados con esta tarea de clasificación. También conviene destacar que los
parámetros glóticos obtenidos por filtrado inverso con los que se trabaja en esta tesis
serán sensibles, en general, a las patologías orgánicas y a aquellas patologías
funcionales que, como la parálisis laríngea unilateral, revelen cambios significativos en
las características acústicas de la voz.

64
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

4.2. Bases de datos frecuentemente utilizadas y herramientas de ayuda al


diagnóstico

El campo de estudio que nos ocupa, es decir, la ayuda al diagnóstico de patologías


vocales necesita de la existencia de bases de datos fiables desde el punto de vista
estadístico que contengan un número de registros suficiente para establecer los
patrones de normalidad relacionados con los parámetros obtenidos. Además, es
conveniente que las bases de datos cuenten con un nivel de estandarización suficiente
para que los diferentes experimentos realizados por los distintos grupos de
investigación puedan ser replicados y comparados. Existen algunas propuestas de
formatos para bases de datos generales de señales biomédicas (Varri, A. et al, 2001),
pero no se ha alcanzado un estándar de iure. Algunos de los motivos que explican esta
falta de estandarización aparecen en (Fourcin, A., 1998): no existen criterios claros que
definan la calidad de voz, no está definido cuál es el material más adecuado a grabar
(las vocales sostenidas permiten un estudio claro, pero no son representativas del
habla de un sujeto; el habla continua es más relevante, pero su estudio es más
dificultoso) y los métodos de análisis dependen en numerosas ocasiones de las
implementaciones concretas de cada grupo de investigación. Además, las condiciones
de grabación también suelen variar (tarjetas empleadas, tipos de micrófono, etc.), lo
que dificulta aún más la compartición de datos. Por otra parte existe una carencia de
bases de datos con un tamaño significativo desde el punto de vista estadístico que
contenga suficientes muestras como para que los patrones de normalidad se puedan
establecer de forma segura. Estos problemas se incrementan si tenemos en cuenta el
factor idiomático: la carencia de bases de datos en castellano es aún mayor. En estas
condiciones, la experimentación realizada en esta tesis se ha realizado utilizando una
base de datos preparada por nuestro grupo de investigación, cuyas características se
describen en el siguiente apartado.

La base de datos comercial disponible más importante es la distribuida por


KayPENTAX, antigua Kay Elemetrics (KayPENTAX Corp., 2011). Contiene más de 1400
muestras de voz recogidas de aproximadamente 700 personas, formadas tanto por
habla continua como por la pronunciación de la vocal ‘ah’ sostenida. Entre las
muestras aparecen diferentes casos de patologías orgánicas, neurológicas,
traumáticas, psíquicas y otras. También encontramos un reducido número de muestras
etiquetadas como normales (aproximadamente medio centenar). Las muestras han
sido grabadas en un entorno controlado, con frecuencias de muestreo de 25 ó 50 KHz
y una resolución de 16 bits por muestra. Los principales problemas que muestra esta
base de datos son tres: su elevado precio, el hecho de que existe multiplicidad en el
etiquetado de las patologías (aparecen registros con varias patologías) y el escaso
número de muestras etiquetadas como normales. A pesar de estos problemas, la firma
distribuidora de esta base de datos es líder mundial en productos relacionados con el
diagnóstico automático, y su exclusividad la ha convertido en un estándar de facto.

Por otro lado, el Departamento de Otorrinolaringología del Hospital Universitario de


Amberes ha grabado una extensa base de datos no comercial que incluye 550 registros
de voces patológicas y 200 registros de voces normales (De Bodt, M. et al, 1998). Cada
registro va acompañado de características personales y clínicas del paciente, junto con

65
Capítulo 4: Patologías vocales, bases de datos y herramientas de ayuda al diagnóstico

medidas aerodinámicas y estroboscópicas, evaluación perceptual y parámetros


acústicos.

También es destacable la base de datos de pacientes sanos grabada por Godino


Llorente (Godino-Llorente, J.I. et al, 2008), que contiene 520 muestras de habla
continua y de fonación sostenida de vocal recogidas en el Hospital Príncipe de Asturias
de Alcalá de Henares, y que se complementa con otras 203 muestras de pacientes que
presentan alguna patología vocal, dentro de un amplio rango de las mismas.

Cabe mencionar que los trabajos de investigación mencionados en los capítulos dos
y tres han utilizado bases de datos propias grabadas para su experimentación que
generalmente cuentan con unas pocas decenas de pacientes. A las mencionadas allí
añadiremos ahora las siguientes referencias, en las que aparecen bases de datos de
similares características: (Cheol-Woo, J. et al, 2001), (Hadjitodorov, S., Boyanov, B., &
Teston, B., 2000), (Martín Álvarez, J.J., 2000), (Nieto, A. et al, 1995) y (Qi, Y. & Hillman,
R.E., 1997).

En cuanto a las herramientas de ayuda al diagnóstico existen varias propuestas,


tanto en el mercado como a nivel de prototipos de laboratorio preparados por grupos
de investigación, que repasaremos a continuación. Algo que comparten todas estas
soluciones es el hecho de estar basadas en el análisis no diferenciado del habla, es
decir, en no eliminar el tracto vocal en el proceso de análisis. Sólo la herramienta
BioMet®Phon, desarrollada por nuestro grupo de investigación, trabaja a partir del
modelado de los pliegues vocales, estructuras biomecánicas responsables últimas de la
producción de voz y estrechamente relacionadas con muchas de las patologías en
estudio.

Mencionaremos en primer lugar los productos de la que probablemente es la


empresa más importante del sector: KayPENTAX, antigua Kay Elemetrics
(http://www.kayelemetrics.com/). Esta empresa ofrece una familia de productos
hardware y software, todos ellos orientados al diagnóstico de las patologías vocales.
En cuanto al hardware, KayPENTAX cuenta con el sistema de adquisición de señal
CSL4500, de cuatro canales, compatible con un PC a través de la interfaz PCI. También
dispone de una versión de bajo coste de dos canales, el sistema CSL4150B, y de un
sistema portátil para recoger parámetros vocales a lo largo de la actividad diaria de un
paciente, el sistema APM (Ambulatory Phonation Monitor).
El producto software más antiguo y relevante de la compañía es el sistema MDVP
(Multi-Dimensional Voice Program), que ofrece medidas de la calidad de la voz a través
de la extracción de 22 parámetros a partir de la fonación sostenida de vocales, entre
los que se incluyen medidas como el jitter absoluto, RAP y PPQ, entre otras. Los
parámetros se representan en una disposición vectorial que refleja la normalidad del
registro (ver figura 4-1). Como complemento al anterior sistema, KayPENTAX ofrece la
herramienta de análisis ADSV (Analysis of Dysphonia in Speech and Voice), que trabaja
también con habla continua, además de algunas aplicaciones orientadas al ámbito del
análisis estadístico de los parámetros, de la educación y del análisis de imágenes
endoscópicas.

66
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Podemos encontrar la explicación detallada de todos estas herramientas y


materiales en (KayPENTAX Corp., 2011b).

Otra de las herramientas que podemos considerar clásica es el Dr. Speech, de Tiger
DRS Inc. (http://www.drspeech.com/). Desde su versión 4, Dr. Speech es una familia de
aplicaciones relacionadas con la evaluación de la calidad vocal, que se caracteriza
porque trabaja con hardware estándar de bajo coste, aunque por otra parte sus
programas sólo funcionan en plataformas Windows®. La suite que compone el
producto está formada por aplicaciones útiles para la propia evaluación de la calidad
vocal, que trabajan con parámetros como la intensidad, la frecuencia fundamental, el
jitter, el shimmer, medidas de ruido, etcétera, y que permiten la valoración de tres
aspectos de la voz: ronquera, dureza en la voz y voz aérea, mediante comparación con
valores de normalidad establecidos a partir de una base de datos (ver figura 4-2).
También encontramos herramientas para la gestión de los pacientes, así como
aplicaciones educativas, orientadas a la rehabilitación logopédica y al análisis de
imágenes endoscópicas (Tiger DRS Inc., 1999).

Fig. 4-1. Pantalla de la aplicación MDVP, donde se aprecia la


representación vectorial conjunta de los parámetros analizados
(tomado de Voice and aging, 2014).

La siguiente solución que mencionaremos es un paquete denominado MediVoz


compuesto por tres aplicaciones: MediVoz Captura, WPCVox y EntrenaVoz. MediVoz
ha sido desarrollado por el grupo de Bioingeniería y Optoelectrónica perteneciente al
Departamento de Ingeniería de Circuitos y Sistemas de la Universidad Politécnica de
Madrid, y es distribuido en España y Portugal por la empresa TGH Endoscopia
(www.tghendoscopia.com).

67
Capítulo 4: Patologías vocales, bases de datos y herramientas de ayuda al diagnóstico

Fig. 4-2. Pantalla del módulo de evaluación de la calidad vocal de la


aplicación Dr. Speech 4 (tomado de Zaoming, D. & Huang, H., 1998).
La primera de las aplicaciones, MediVoz Captura, es una herramienta que se compone
de tres módulos diferenciados aunque integrados: el módulo de captura de datos
permite recoger de manera síncrona las señales de voz, electroglotográfica y
videoendoscópica; el módulo de edición permite manipular las señales capturadas (ver
figura 4-3); el módulo cliente de base de datos permite consultar y modificar los datos
almacenados y editados. La base de datos que utiliza el sistema cuenta con un diseño
relacional, y permite almacenar toda la información relativa al paciente, incluyendo sus
datos personales, anamnesis, sesiones y exploraciones realizadas (Godino-Llorente, J.I.
et al, 2006). Cabe destacar que el trabajo fin de carrera del autor de esta tesis estuvo
relacionado con este proyecto (Lázaro Carrascosa, C., 2000).
La segunda de las aplicaciones, WPCVox (ver figura 4-4), facilita la extracción y
análisis de numerosos parámetros relacionados con la señal de voz: de perturbación
de la frecuencia, de perturbación de la amplitud, medidas de ruido y energía armónica,
etc. La aplicación permite observar la forma de onda y el espectrograma de la señal, y
está orientada a ofrecer una medida de la calidad vocal (Godino-Llorente, J.I. et al,
2008).
La tercera de las aplicaciones, EntrenaVoz, tiene como objetivo evaluar, rehabilitar y
trabajar la estética de la voz (TGH Endoscopia, 2014).
La siguiente solución destacable pertenece a la compañía WEVOSYS y se denomina
LingWaves. Se trata de una aplicación multimodular orientada a la ayuda al
diagnóstico de patologías vocales y al análisis vocal en general. Los diferentes módulos
de los que está formada se ocupan de tareas como la calidad vocal, los trastornos
motores, la rehabilitación logopédica, la representación y análisis de la señal
electroglotográfica, el análisis de múltiples parámetros acústicos (jitter, shimmer,
cepstrum, LPC, etc.), el análisis perceptual y la grabación, etiquetado y filtrado de las
señales, entre otros. La señal de voz se graba a partir de la pronunciación de vocales
sostenidas. El motor de diagnóstico ofrece un índice de la calidad vocal denominado
DSI (Disphonya Severity Index), calculado a partir de los parámetros acústicos, del
tiempo de fonación máxima y de la medida del rango vocal. Podemos encontrar gran
cantidad de información técnica, científica y comercial acerca de todas estas técnicas y
productos en (WEVOSYS, 2012).

68
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Fig. 4-3. Pantalla del módulo de edición de la aplicación MediVoz Captura (tomado de
Medivoz, 2014).

Fig. 4-4. Pantalla de la aplicación WPCVox (tomado de Medivoz, 2014).


La empresa francesa SQLab comercializa la plataforma hardware EVA2, que consiste
en una estación de trabajo equipada con los transductores y sensores aerodinámicos
necesarios para recoger la señal de voz, el flujo aéreo oral y nasal, la presión, el
electroglotograma, etc. La misma empresa dispone de otra plataforma hardware
externa llamada DIANA compatible con cualquier PC a través de una interfaz USB.
Ambos sistemas van acompañado de una suite de aplicaciones software denominada
SESANE, que incluye herramientas de reproducción de la voz, representación gráfica

69
Capítulo 4: Patologías vocales, bases de datos y herramientas de ayuda al diagnóstico

de los valores de parámetros significativos (jitter, shimmer, medidas de ruido, etc.),


medición de la intensidad de la señal, representación del espectrograma y del
electroglotograma, información sobre la duración de la fonación, medidas de
aspirometría y resistencia nasal durante la respiración, etc.
Las aplicaciones ofrecen gran cantidad de información que supone una indiscutible
ayuda en la tarea de diagnóstico, pero no incluyen medidas objetivas de la calidad
vocal. Podemos encontrar más información de todo tipo sobre estos productos en
(SQLab Company, 2013).

La solución aportada por (Cabrera, J. et al, 2014) consiste en un servidor web


(alojado en http://evoice.ulpgc.es) que permite recoger muestras de voz de forma no
presencial, y que se encarga de medir la calidad vocal en base a cuatro características:
estabilidad en la voz, ritmo en el impacto producido entre los pliegues vocales,
problemas de cierre glótico e irregularidades en las masas. La interfaz ofrece una
representación gráfica de las medidas de estas características que indica la desviación
de cada una de ellas respecto a la normalidad, obtenida ésta última a través de
estudios clínicos. Los resultados obtenidos han conseguido significación estadística en
la discriminación entre pacientes sanos y pacientes con patología laríngea.

Mencionaremos para terminar otras aplicaciones y prototipos software dedicados a


la captura y/o al análisis de señal relacionada con la voz, así como a la ayuda al
diagnóstico de patologías vocales. En la tabla 4-2 podemos encontrar una breve
anotación de cada una de ellas.

Tabla 4-2. Otras herramientas relacionadas con el tratamiento de la voz.


Nombre de la Autores o Breve descripción Referencia
aplicación o Empresa
prototipo
Speech Studio Laryngograph Representación y www.laryngograph.com
análisis de la señal
de voz y de algunos
parámetros
acústicos
WaveView Glottal Representación y www.glottal.com
Software Enterprises análisis de la señal
de voz, flujo aéreo y
EGG
Praat Paul Boersma y Tratamiento del www.praat.org
David Weenink habla, síntesis de
voz, análisis.
Wavesurfer KTH Royal Tratamiento del www.speech.kth.se
Institute of habla, análisis y /wavesurfer
Technology representación
(Suecia)

70
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

4.3. Base de datos y herramienta empleada para el estudio

La base de datos empleada para el estudio forma un corpus de cien sujetos de cada
género en los que se reparte de forma equitativa la presencia y ausencia de patología
vocal. Así, la base de datos contiene cincuenta sujetos que denominaremos femeninos
normofónicos, cincuenta sujetos femeninos patológicos, cincuenta sujetos masculinos
normofónicos y cincuenta sujetos masculinos patológicos.

Como podremos comprobar en el capítulo seis en el que se muestran los resultados


de toda la experimentación realizada, la gran mayoría de los estudios trabajan con la
base de datos masculina y con la base de datos femenina de forma independiente. En
general, es conocida la necesidad de contar con muestras masculinas y femeninas para
llegar a conclusiones generales (Ruiz, M.T., & Verbrugge, L.M., 1997); además, en el
campo de estudio que nos ocupa las diferentes características fisiológicas de los dos
sexos así lo aconsejan.

Las edades de los sujetos están comprendidas entre los diecinueve y los cincuenta y
seis años, con una media de 30,02 años y una desviación típica de 9,94 años. La
condición de normalidad ha sido determinada por electroglotografía, video-
endoscopia y evaluación GRBAS (Hirano, M. et al, 1988). Además, previamente se
establecieron algunos criterios que los locutores debían cumplir para cumplir tal
condición:

a) Transmitir la percepción subjetiva de no padecer ninguna patología laríngea.


b) Poseer una voz acorde con el género, edad y grupo cultural del hablante, además
de un adecuado pitch, timbre, volumen y flexibilidad de la dicción.
c) Ser no fumador.
d) No haber sido sometido nunca a ninguna operación quirúrgica relacionada con
alguna patología laríngea.
e) No haber requerido entubaciones endotraqueales en el último año.

En cuanto a los casos patológicos, el conjunto de muestras contiene


aproximadamente la misma cantidad de casos considerados medios (patologías
funcionales) y de casos considerados medios-graves, que incluyen desde defectos de
cierre hasta pólipos, nódulos y edemas de Reinke.

La grabación se realizó con un micrófono de diadema colocado a 10 cm de la boca


del hablante. Las señales se muestrearon a 44.100 Hz, aunque posteriormente se
realizó un proceso de submuestreo (undersampling), dejándolas en 22.050 Hz. La
resolución utilizada fue de 16 bits. Las grabaciones se realizaron utilizando la placa de
sonido externa Creative Studio.

El protocolo de grabación comprende tres pronunciaciones diferentes de la vocal


/a/ con una duración no inferior a tres segundos. Se produjeron después segmentos de
0,2 segundos extraídos de la parte central (la más estable) de la mejor de las
grabaciones (la segunda o la tercera, generalmente). Estos segmentos incluyen un
número variable de ciclos de fonación: aproximadamente veinte en las voces

71
Capítulo 4: Patologías vocales, bases de datos y herramientas de ayuda al diagnóstico

masculinas, con una frecuencia fundamental de 100 Hz y aproximadamente cuarenta


en las voces femeninas, con una frecuencia fundamental de 200 Hz (Pedro Gómez
Vilda et al, 2009).

La extracción y el análisis de la fuente glótica y de la onda mucosa se han realizado


utilizando la herramienta BioMet®Phon, aunque también se han realizado pruebas
preliminares usando la herramienta de captura de señal que describe el apéndice uno.

BioMet®Phon, herramienta desarrollada por varios componentes de nuestro grupo


de investigación (Gómez, P. et al, 2013) proporciona todos los parámetros con los que
se trabaja en esta tesis, y constituye una aplicación pionera en el campo de la medida
de la calidad vocal al trabajar exclusivamente con parámetros glóticos. BioMet®Phon
permite grabar una nueva trama de voz, seleccionar una trama de voz previamente
grabada, analizar la trama seleccionada y comparar sus resultados con otra trama
cualquiera previamente analizada, con un modelo normofónico de locutor para la
obtención de detección y gradación de disfonía o con un modelo universal de locutor
para la obtención de cotejo forense. Los resultados pueden verse por ventanas en
pantalla, presentarse en ventanas individuales, imprimirse como figuras PDF y
almacenarse en hojas de cálculo Excel®.

En la figura 4-5 podemos observar el aspecto de parte de la interfaz de


BioMet®Phon; en particular se trata de la pantalla principal de la aplicación, donde
podemos ver la señal de voz grabada y el resultado del análisis. La figura 4-6 muestra
una pantalla de introducción de datos y de configuración.

Fig. 4-5. Pantalla principal de la aplicación BioMet®Phon.

72
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Fig. 4-6. Pantalla de introducción de datos y configuración de la aplicación


BioMet®Phon.

73
5. Métodos analíticos utilizados en el
estudio
Capítulo 5: Métodos analíticos utilizados en el estudio

5.1. Naturaleza de los datos: descriptivos, normalidad y homocedasticidad

Cada sujeto en estudio cuenta con cincuenta y un valores numéricos que se


corresponden con los cincuenta y un parámetros glóticos considerados, explicados de
forma resumida en el capítulo tres. Como se explicaba en ese capítulo, el valor final de
cada parámetro se corresponde con la media aritmética de los valores obtenidos para
cada uno de ellos en cada ciclo de fonación. Los valores finales de cada parámetro para
los diferentes sujetos de la base de datos forman una matriz constituida por números
reales que será objeto de nuestro estudio.

Para comenzar, como análisis previo, realizaremos un estudio en el que


mostraremos datos y diagramas que describen los parámetros analizados: tendencia
central, dispersión y características generales de la distribución de los datos, entre las
que destacaremos el concepto de normalidad.

Cabe destacar que vamos a distinguir dos escenarios diferentes: por una parte
examinaremos las características de los parámetros de todos los sujetos de forma
global, sin distinguir ningún rasgo en ellos 7; por otra –más interesante–, veremos la
mayor parte de estas características de forma comparada, diferenciando a los sujetos
que presentan patología vocal de aquellos que no lo hacen.

Los datos descriptivos analizados en primer lugar serán los mismos en ambos
escenarios (con alguna pequeña salvedad que explicaremos al final del apartado), y
serán los que aparecen en la tabla 5-1 (Pardo, A. & Ruiz, M.Á., 2002).

Tabla 5-1. Valores descriptivos calculados para todos los sujetos, para el
subconjunto de sujetos con patología vocal y para el subconjunto de sujetos
normofónicos.
Descriptivo Breve explicación
Media Suma de todos los valores, dividido entre el número de valores.
Error típico de Desviación típica dividida entre la raíz cuadrada del número de
la media valores (Morales Vallejo, P., 2011a).
Intervalo de Límites inferior y superior del intervalo, al 95%.
confianza para
la media
Media Media obtenida eliminando el 5% de los casos más grandes y el
truncada 5% de los casos más pequeños.

Estimadores Medias ponderadas, en los que los casos que se alejan de la


M media reciben una penalización. Como la media truncada, son
valores de tendencia central menos sensibles a la presencia de
valores extremos (Palmer, A.L., 1999), (Norusis, M.J., 1993).
Valores Los cinco casos con los valores más pequeños y los cinco casos
extremos con los valores más grandes.

7
Como ya hemos comentado, teniendo siempre en cuenta que los estudios se realizan siempre por
duplicado, actuando tanto sobre la base de datos de sujetos femeninos como sobre la base de datos de
sujetos masculinos, salvo que se indique expresamente lo contrario.

76
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Descriptivo Breve explicación


Mediana Valor por debajo del cual se encuentra el 50% de los casos.
Varianza Suma de los cuadrados de las diferencias entre cada valor y la
media, dividido entre el número de valores menos una unidad.
Desviación Raíz cuadrada de la varianza.
típica
Asimetría y Valores positivos indican que los valores más extremos se
error típico de encuentran por encima de la media. Índices próximos a cero
la asimetría indican simetría. El error típico permite tipificar el valor del
índice e interpretarlo como una puntuación Z con distribución
normal (0,1). Índices tipificados con valores mayores de 1,96
permiten afirmar que existe asimetría.
Curtosis y Valores positivos indican que en la cola de la distribución hay
error típico de acumulados más casos que en la cola de una distribución
la curtosis normal con la misma varianza. El error típico tiene la misma
aplicación que en el caso de la asimetría.
Mínimo Valor más pequeño.
Máximo Valor más grande.
Amplitud Diferencia entre el máximo y el mínimo.
Cuartiles Valores por debajo de los cuales encontramos el 25%, el 50% y
el 75% de los datos, respectivamente.
Rango Diferencia entre el tercer cuartil y el primer cuartil.
intercuartílico
Percentiles 5, Valores por debajo de los cuales encontramos el 5%, el 10%, el
10, 90 y 95 90% y el 95% de los datos, respectivamente.

En segundo lugar, y ya centrándonos en la comparación entre los dos subconjuntos


de sujetos (con patología vocal y normofónicos), de cara a poder examinar las
distribuciones comparadas podremos observarlas a través de tres tipos diferentes de
diagramas: los histogramas, los diagramas tallo-hoja y los diagramas de caja.

Los histogramas son gráficos en los que los valores de las variables se dividen en
intervalos iguales, y a cada intervalo se le asigna una barra con una altura proporcional
a la frecuencia absoluta o porcentual.

Los diagramas tallo-hoja son similares a los histogramas, aunque proporcionan


información más específica (Tukey, J.W., 1977). Se trata de un diagrama formado por
varias líneas, cuya longitud representa el número de casos que pertenecen a cada
intervalo. Cada valor se descompone en dos partes, el primer o primeros dígitos (el
tallo) y el dígito que sigue a los del tallo (las hojas). El ancho del tallo (constante que
debe proporcionar el diagrama) representa la precisión de los datos, de tal modo que,
por ejemplo, un ancho del tallo con valor mil significa que los valores del tallo deben
ser multiplicados por esa cantidad. Por otra parte, cada hoja puede representar uno o
varios casos, situación esta última que debe figurar indicada en el diagrama.

Los diagramas de caja representan una herramienta gráfica especialmente útil para
observar la distribución de los datos de una forma rápida, y lo que es más interesante
en el caso que nos ocupa, para comparar de una forma visual efectiva las
distribuciones de los sujetos que presentan patología vocal y las de los sujetos

77
Capítulo 5: Métodos analíticos utilizados en el estudio

considerados normofónicos. Además, también recogen algunos valores descriptivos


importantes, como las bisagras de Tukey –versión ligeramente diferente de los clásicos
cuartiles: la primera bisagra es el valor que ocupa la posición intermedia entre la
mediana y el valor más pequeño de la distribución, similar al primer cuartil; la segunda
bisagra es la mediana; la tercera bisagra es el valor que ocupa la posición intermedia
entre la mediana y el valor más grande de la distribución, similar al tercer cuartil–
(Pardo, A. & Ruiz, M.Á., 2002), así como los valores considerados atípicos. Permiten
distinguir fácilmente aspectos como la simetría de la distribución: un valor de la
mediana que no esté situado en el centro de la caja indica asimetría en la distribución.
Por otra parte, son diagramas no paramétricos, es decir, permiten analizar y comparar
cualquier tipo de distribución.

En la figura 5-1 podemos observar los datos que destacan los diagramas de caja
empleados. Existen representaciones alternativas en las que los extremos de la caja
representan valores diferentes: el mínimo y el máximo de los valores de la distribución,
una desviación estándar por encima y por debajo de la media, los percentiles 2 y 98 y
los percentiles 9 y 91, respectivamente (Wikipedia, 2014a) (McGill, R., Tukey, J.W. &
Larsen, W.A., 1978).

Fig. 5-1. Diagrama de caja (boxplot) y sus elementos (tomado de


Pardo A. y Ruiz M.A., 2002).

En tercer lugar, presentaremos hasta tres pruebas que contrastan el supuesto de


normalidad tanto para los subconjuntos de sujetos normofónicos y patológicos como
para la distribución conjunta de ambos grupos, así como una prueba que contrasta la
homogeneidad de las respectivas varianzas. A las pruebas de normalidad les
acompañarán los diagramas Q-Q normales y los diagramas Q-Q normales sin tendencia.
La curva de normalidad representa la distribución de los datos por la cual los valores
centrales son los más frecuentes, y a medida que nos alejamos del centro la frecuencia

78
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

disminuye, asemejándose la gráfica obtenida a una campana. La distribución normal


tiene una importancia especial en el estudio de los parámetros, ya que su
cumplimiento es requisito para aplicar determinadas pruebas estadísticas que
utilizaremos en el trabajo.

Uno de los contrastes utilizado para contrastar la hipótesis de que las muestras
obtenidas se ajustan a la distribución normal es el de Kolmogorov-Smirnov
(Kolmogorov, A., 1933), (Smirnov, N.V., 1948) (Wikipedia, 2014e), quizá la prueba más
general y utilizada para estos casos. El test se basa en evaluar un estadístico que
involucra a la distribución empírica y a la distribución teórica, obtenidas a partir de los
datos muestrales y teniendo en cuenta que la distribución a comparar es la normal –el
test puede ser utilizado para contrastar la hipótesis de que la distribución obtenida se
ajusta a cualquier distribución teórica de probabilidad–.
El estadístico de Kolmogorov-Smirnov se distribuye según el modelo de
probabilidad , y se calcula a partir de la diferencia más grande entre la
distribución empírica y la distribución teórica, atendiendo, para una muestra de
tamaño a la siguiente expresión (Pardo, A. & Ruiz, M.Á., 2002):

En el caso habitual en el que se desconozcan la media y la varianza poblacional,


como sucede en nuestro caso, éstas se estimarán a partir de los datos muestrales. En
estos casos la prueba de Kolmogorov-Smirnov resulta demasiado conservadora,
aceptando la hipótesis de normalidad con facilidad (Lohninger, H., 2012). Es frecuente,
de cara a resolver este problema, emplear la conocida como modificación de Lilliefors,
variante de la prueba de Kolmogorov-Smirnov (Lilliefors, H.W., 1967) (Wikipedia,
2014f) (Lohninger, H., 2012).

También, por otra parte, se ofrece la prueba de Saphiro-Wilk (Shapiro, S.S. & Wilk,
M.B., 1965), prueba de gran potencia, sobre todo cuando el tamaño muestral es
reducido (Pardo, A. & Ruiz, M.Á., 2002) (Wikipedia, 2014j) (Lohninger, H., 2012).

Las tres pruebas mencionadas son sensibles a pequeñas desviaciones en la


normalidad, especialmente con muestras grandes y sobre todo la última de ellas, por
lo que es conveniente acompañarlas de algún gráfico de normalidad como los
diagramas Q-Q normal y Q-Q normal sin tendencia (Gnanadesikan, R., 2011).

Los diagramas Q-Q normal representan generalmente los valores de los cuantiles de
la distribución normal esperada, que forman una recta. Los cuantiles correspondientes
a las muestras recogidas también son representados; si se ajustan a la recta
mencionada la distribución en estudio es considerada normal. En nuestro caso, en
lugar de los cuantiles utilizaremos las puntuaciones típicas, obteniendo en la práctica
el mismo resultado. Los diagramas Q-Q normal sin tendencia muestran las diferencias
existentes entre las puntuaciones típicas esperadas y las observadas, es decir, muestra
las distancias existentes entre los puntos observados y la recta modelo del gráfico
anterior. En el eje de abscisas aparecen los valores observados, y en el de ordenadas
las diferencias mencionadas. Estas diferencias deben oscilar de forma aleatoria en

79
Capítulo 5: Métodos analíticos utilizados en el estudio

torno al valor cero en el caso de que la distribución sea normal, apareciendo pautas de
variación no aleatorias en caso contrario (Pardo, A. & Ruiz, M.Á., 2002).

Además, ofrecemos un estudio de homogeneidad de la varianza, también conocido


como homocedasticidad, que contrasta si dos distribuciones tienen la misma varianza.
Este supuesto también es frecuentemente requerido en la aplicación de diferentes
pruebas estadísticas. Para realizarlo se lleva a cabo la prueba de Levene (Levene, H.,
1960), que no precisa que las muestras analizadas presenten normalidad y que
consiste en comparar sus puntuaciones individuales con la media, mediana o media
recortada de su grupo. Acompañan a este estudio los gráficos de dispersión, que
ofrecen una puntuación para cada caso (en el eje de abscisas aparece el logaritmo
natural de la mediana, en el eje de ordenadas aparece el logaritmo natural del rango
intercuartílico). Si estas puntuaciones están alineadas horizontalmente, las varianzas
de los dos grupos serán homogéneas. Sin embargo, es preciso apuntar que debido a
que los gráficos están escalados la percepción visual de alineamiento queda algo
diluida (Pardo, A. & Ruiz, M.Á., 2002).

Tal y como indicábamos al principio de este apartado, también se han calculado


para el conjunto global de parámetros los histogramas de los mismos en una gráfica
que incluye la curva de normalidad superpuesta. Además, este último subestudio
incluye los datos descriptivos y diagramas ya mencionados y calculados para los grupos
de sujetos con patología vocal y sin ella, y algunos adicionales. Podemos ver el listado
de estos últimos en la tabla 5-2.

Tabla 5-2. Valores descriptivos calculados para todos los sujetos.


Descriptivo Breve explicación
Moda Valor que más se repite. En nuestro caso, teniendo en cuenta la naturaleza
de los datos, este valor tiene poca importancia.
Suma Suma de todos los valores
Percentiles 20, Valores por debajo de los cuales encontramos el 20%, el 30%, el 40%, el
30, 40, 60, 70 60%, el 70% y el 80% de los datos, respectivamente.
y 80

5.2. Pruebas de comparación de distribuciones

Las pruebas de comparación de distribuciones nos permiten examinar de una forma


analítica si las distribuciones que forman los datos correspondientes a personas con
patología vocal son diferentes a aquellas que forman los datos correspondientes a
personas sanas desde el punto de vista vocal. Estos datos están referidos a cada uno
de los parámetros en estudio, por lo que de estas pruebas extraeremos información
acerca de los mismos: ¿se obtienen resultados diferentes para un determinado
parámetro si el paciente está sano o si está enfermo? En el apartado 5.1 veíamos
representaciones gráficas de las distribuciones como los diagramas de caja, que
ofrecen una información similar, pero de un modo más visual y aproximado. En este
apartado veremos diferentes pruebas estadísticas, que abordan el problema desde
enfoques diferentes o con supuestos previos distintos.

80
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

5.2.1. Prueba t de Student

La prueba t de Student se ocupa de contrastar la hipótesis de que dos distribuciones


son iguales, a través de la comparación de sus medias. Es apropiada cuando las
distribuciones en estudio se ajustan a la normal o bien cuando las muestras cuentan
con un tamaño grande.

La prueba t es una tipificación de la diferencia entre las dos medias muestrales que
se obtiene restando a esa diferencia su valor esperado en la población y dividiendo el
resultado por el error típico de la diferencia:

El cálculo del error típico de la diferencia varía en función de que podamos o no


asumir la igualdad de varianzas de las muestras. Para resolver este asunto utilizaremos
la prueba de Levene, mencionada en el apartado 5.1. El estadístico resultante se
distribuye en cualquier caso según el modelo de probabilidad t de Student (Pardo, A. &
Ruiz, M.Á., 2002).

5.2.2. Prueba U de Mann-Whitney

La prueba U de Mann-Whitney (Mann, H.B. & Whitney, D.R., 1947) (Pardo, A. &
Ruiz, M.Á., 2002) (Wikipedia, 2014h) es un contraste no paramétrico que tiene el
mismo objetivo que la prueba t de Student. Esta última prueba está indicada para
distribuciones que se ajustan a la normal, aunque también se comporta de un modo
satisfactorio si la muestra es grande. No todos los parámetros en estudio tienen una
distribución normal, y aunque el tamaño de la muestra es relativamente grande,
hemos preferido completar el estudio con un contraste que no dependa de la
distribución de los parámetros.

La prueba U consiste en mezclar las muestras de ambas distribuciones, y ordenarlas


de forma ascendente. Después se asignan rangos a las diferentes muestras (rango 1 a
la muestra más pequeña, rango 2 a la siguiente, y así sucesivamente, hasta rango a la
más grande). Tomando como suma de los rangos asignados a la muestra 1 y
como suma de los rangos asignados a la muestra 2, se calculan los estadísticos y ,
correspondientes respectivamente a la primera y a la segunda muestra. El estadístico
, que se aproxima bastante bien a la distribución normal , corresponderá al
valor más pequeño de ambos.

siendo y , respectivamente, los tamaños de la primera y de la segunda muestra.

81
Capítulo 5: Métodos analíticos utilizados en el estudio

5.2.3. Prueba de Kolmogorov-Smirnov para dos muestras

La prueba de Kolmogorov-Smirnov para dos muestras (Kolmogorov, A., 1933)


(Smirnov, N.V., 1939) (Smirnov, N.V., 1948) (Pardo, A. & Ruiz, M.Á., 2002) es un
contraste no paramétrico utilizado para comprobar si dos distribuciones son iguales. A
diferencia de las dos pruebas anteriores, en esta ocasión no sólo se consideran las
medias, también se tienen en cuenta otras propiedades de la distribución como la
simetría o la varianza.

Para realizar los cálculos se comparan las funciones de distribución de ambas


muestras, y , obtenidas mediante la asignación de rangos a los valores de
, de forma separada para cada muestra a través de la siguiente expresión:

siendo el rango correspondiente a cada observación. Después se calculan las


diferencias entre las dos distribuciones, para obtener finalmente el estadístico de
Kolmogorov-Smirnov para dos muestras, que se distribuye según el modelo de
probabilidad :

5.2.4. Prueba de las rachas de Wald-Wolfowitz

La prueba de las rachas de Wald-Wolfowitz (Wald, A. & Wolfowitz, J., 1940) (Pardo,
A. & Ruiz, M.Á., 2002) es un contraste no paramétrico que tiene objetivos y
características similares a la prueba de Kolmogorov-Smirnov para dos muestras: se
utiliza para comprobar si dos muestras pertenecen a la misma población, y para ello
considera los valores promedio, pero también tiene en cuenta otras características de
las distribuciones, como la asimetría o la varianza.

La prueba consiste en ordenar todas las muestras de ambas distribuciones, como si


fueran una sola, obteniendo el número de rachas como el número de secuencias
pertenecientes a la misma distribución. Un número alto de rachas indica que las
muestras pertenecen a la misma población (las muestras estarán muy entremezcladas)
y, por el contrario, un número bajo de rachas indica que las muestras pertenecen a
diferentes poblaciones. El número de rachas es tipificado para contrastar la
hipótesis, de acuerdo a la igualdad

siendo

82
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

donde es el tamaño de la primera muestra, es el tamaño de la segunda muestra


y . El estadístico se distribuye según el modelo de probabilidad .

5.2.5. Prueba de reacciones extremas de Moses

La prueba de reacciones extremas de Moses (Moses, L.E., 1952) (Pardo, A. & Ruiz,
M.Á., 2002) es, en realidad, un contraste de varianza no paramétrico. Podemos, por
tanto, considerarlo un complemento a la prueba de Levene, en la que ya analizábamos
esta cuestión. Consiste en ordenar las dos muestras mezcladas, asignarles rangos y
analizar la amplitud recortada de los rangos de uno de los grupos, con el fin de
contrastar la hipótesis de que la variabilidad de las dos muestras es la misma, en
cuanto a que no hay diferencias entre los valores extremos de las dos distribuciones.

5.2.6. Tamaño del efecto

Las pruebas de comparación de distribuciones explicadas en los subapartados


anteriores ofrecen como resultado, en el caso de tener éxito, el hecho de que la
diferencia entre las muestras comparadas (sujetos con patología vocal y sujetos sin
ella) sea distinta de cero, en cada caso. 8 En el caso de que esto sea así será posible
extrapolar el resultado a la población de la que procede la muestra.

Sin embargo, estas pruebas no aportan información alguna acerca de si esta


diferencia entre las muestras es grande o pequeña. El tamaño del efecto es una
medida que satisface esta demanda, cuantificando la diferencia obtenida, de tal modo
que será posible decidir si ésta es grande o pequeña. También será posible comparar
las diferencias obtenidas en distintas medidas, o como en nuestro caso, en los distintos
parámetros en estudio. En este sentido el tamaño del efecto resultará de especial
interés, ya que nos permitirá ofrecer una ordenación de los parámetros en base a la
importancia que tienen a la hora de diferenciar los conjuntos en estudio, cuestión que
se hace más relevante en el caso de que encontremos significación estadística (en el
caso de no poder demostrar que la diferencia no es nula el tamaño de la diferencia
también puede tener cierta relevancia, especialmente en muestras pequeñas)
(Morales Vallejo, P., 2011b), (Morales Vallejo, P., 2011c).

Existen al menos dos enfoques para realizar el cálculo del tamaño del efecto. El
primero de ellos propone utilizar directamente el coeficiente de correlación de la
variable con la pertenencia a cada grupo. El segundo, más adoptado por la comunidad
científica y que será el que emplearemos en nuestro estudio consiste en calcular una
diferencia tipificada (índice de Cohen) que atiende a la siguiente fórmula:

8
En realidad concluimos que la probabilidad de que la diferencia sea distinta de cero es muy alta (mayor
de un 95% con el frecuentemente utilizado índice de significación α=0,05)

83
Capítulo 5: Métodos analíticos utilizados en el estudio

donde es la diferencia de medias y es una desviación típica que es posible


calcular de varias formas en función del tipo de experimento a realizar. En nuestro
caso calcularemos la desviación típica combinada de las dos muestras, procedimiento
frecuente a seguir en el caso de una experimentación general. En el caso de que el
tamaño de los dos grupos sea el mismo, cosa que sucede en nuestra experimentación,
la desviación típica combinada atiende a la siguiente fórmula:

donde es la desviación típica del primer grupo y es la desviación típica del


segundo grupo (Morales Vallejo, P., 2011b), (Morales Vallejo, P., 2011c).

Es importante destacar que el índice que utilizaremos en nuestro estudio será en


realidad una pequeña variante del coeficiente de Cohen: se trata de la corrección de
Hedges, índice que para muestras lo suficientemente pequeñas (en este caso la
nuestra lo es) obtiene un valor más preciso e insesgado (Cross Validated, 2013),
(Grissom, R.J. & Kim, J.J., 2005).

En cuanto a la interpretación de los resultados, Cohen (Cohen, J., 1988), (Morales


Vallejo, P., 2011c) propone la escala que podemos observar en la tabla 5.3. Esta escala
se suele tomar de forma orientativa, aunque se considera razonable. Hay que tener en
cuenta que estos valores pueden ser más o menos fáciles de conseguir en función de
datos como el tamaño de la muestra, o del campo concreto de estudio en el que se
trabaje.

Tabla 5.3. Interpretación cualitativa de los valores del


tamaño del efecto, según Cohen (Cohen, J., 1988)
Tamaño del efecto Interpretación cualitativa
Diferencia pequeña
Diferencia moderada
Diferencia grande

Hopkins (Hopkins, W.G., 2000), (Morales Vallejo, P., 2011c) propone otra escala más
exigente, que podemos ver en la tabla 5.4. Esta escala considera tanto el coeficiente
como el coeficiente de correlación entre la variable en estudio y la pertenencia a uno
u otro grupo (ambos coeficientes están relacionados, es posible transformar uno de
ellos en el otro con facilidad).

Tabla 5.4. Interpretación cualitativa de los valores del tamaño del efecto y
relación con el coeficiente de correlación, según Hopkins (Hopkins, W.G., 2000)
Tamaño del efecto Correlación Interpretación cualitativa
Diferencia pequeña
Diferencia moderada
Diferencia grande

84
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

5.3. Estudios de correlación lineal bivariada

El concepto de correlación atiende al grado de variación conjunta existente entre


dos o más variables (Pardo, A. & Ruiz, M.Á., 2002), o a la relación que se establece
entre ellas. En nuestro estudio atenderemos al caso en el que esta relación sea lineal.
Consideraremos, además, la relación establecida entre las variables tomadas por
pares.

El índice más utilizado para el estudio de la correlación es el de Pearson (Pearson,


K., 1894), que hace referencia a la media de los productos cruzados de las
puntuaciones estandarizadas de las dos variables sometidas a estudio. Al trabajar con
medidas estandarizadas, es un índice independiente de la escala utilizada en las
variables, y su valor oscila, en valor absoluto, entre cero y uno (Camacho-Martínez, C.,
2013). El valor cero representa ausencia total de relación entre las variables (en un
diagrama de dispersión9 aparecería una nube de puntos aleatoria), el valor uno
representa correlación perfecta (en un diagrama de dispersión aparecería una recta).
El coeficiente de Pearson tiene un conjunto de requisitos para su aplicación; los más
importantes consisten en que ambas variables deben presentar una relación lineal,
cumplir los principios de normalidad y de homocedasticidad y deben pertenecer a la
misma distribución. Además, la distribución conjunta debe ajustarse a la normal
bivariante y las variables no deben presentar valores atípicos (Sociedad Española de
bioquímica clínica y patología molecular, 2013).

En nuestro estudio contamos con un amplio conjunto de parámetros, de diferente


naturaleza, y en los que en su mayoría no se cumplen todos los requisitos que, según
(Sociedad Española de bioquímica clínica y patología molecular, 2013) –tal y como
acabamos de ver–, son necesarios para realizar la prueba de Pearson. Otros autores
como (Camacho-Martínez, C., 2013) sólo mencionan como requisito para calcular el
índice de Pearson que se pueda presuponer que la relación entre las variables
implicadas sea lineal. En cualquier caso, esto tampoco es garantizable para todos los
posibles pares de las variables en estudio, y consideramos de más interés poder
analizar todos los parámetros en estudio con valores comparables entre sí. Es por ello
por lo que emplearemos un análisis de correlación de tipo no paramétrico, cosa que
garantiza la no existencia de requisitos relacionados con la distribución de los
parámetros para su aplicación. En particular, utilizaremos el índice (Tau) de Kendall
(Kendall, M.G., 1963), basado en el número de inversiones y no inversiones entre
casos, y que atiende a la siguiente expresión cuando, como es el caso, el tamaño
muestral es superior a cuarenta sujetos:

9
Tipo de diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de dos
variables para un conjunto de datos (Entrada de Wikipedia "diagrama de dispersión").

85
Capítulo 5: Métodos analíticos utilizados en el estudio

donde es el número de pares de observaciones (tamaño de la muestra) y es el


número de pares concordantes menos el número de pares discordantes. La escala e
interpretación del índice es la misma que la del coeficiente de Pearson.
El coeficiente de Spearman (Spearman, C., 1904), variante del coeficiente de
Pearson que se utiliza transformando las puntuaciones originales en rangos es una
alternativa también válida dado el carácter no paramétrico y por tanto libre de
restricciones en cuanto a su aplicación, pero los resultados y conclusiones presentados
se tomarán a partir del índice de Tau-Kendall debido a que en el caso de los datos
analizados ha resultado ser una medida más conservadora: en efecto, tanto en el caso
del análisis global de los sujetos como en los casos de los grupos masculino y femenino
hemos comprobado que los índices de correlación obtenidos con la medida de
Spearman son en general sensiblemente más altos que los obtenidos con la medida de
Tau-Kendall. En cualquier caso incluiremos también la matriz de resultados de
Spearman en el apéndice electrónico de esta tesis, a modo descriptivo.

A los índices de correlación calculados les acompañará un test estadístico de


significación (Pardo, A. & Ruiz, M.Á., 2002). Este test nos va a indicar si la relación
encontrada entre las variables, en el caso de ser diferente de cero, es o no atribuible al
azar. La medida influye sobre todo en las relaciones débiles o de correlación baja, es en
estas medidas donde existe una probabilidad mayor de que el valor hallado no sea
significativo. En las conclusiones de nuestro estudio nos centraremos en los casos en
los que los parámetros se relacionen mediante correlaciones altas, y en estos casos el
valor del test de significación siempre rechazará la hipótesis nula de que la correlación
obtenida sea cero, para el tamaño de nuestra muestra. En todo caso, mantendremos el
índice calculado de cara a posibles futuros estudios en los que sean de interés las
relaciones más débiles.

Para definir la fortaleza de las relaciones utilizaremos la escala utilizada por


Bisquerra (Bisquerra, R., 1987), (Gil, J., Rodríguez, G. & García, E., 1995), que podemos
observar en la tabla 5-5.

Tabla 5.5. Escala de interpretación de los valores


de correlación de Bisquerra (Bisquerra, R., 1987).
Valor de la Interpretación
correlación
correlación perfecta
correlación muy alta
correlación alta
correlación moderada
correlación baja
correlación muy baja
correlación nula

Por otra parte, resulta interesante tener en cuenta el coeficiente de determinación,


que está definido como el cuadrado del coeficiente de correlación, y que representa la
proporción de varianza compartida por las variables (Garson, G.D., 2012) (Camacho-
Martínez, C., 2013). La combinación de la interpretación cualitativa que ofrece la
escala de Bisquerra y del valor correspondiente del coeficiente de determinación nos

86
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

ha llevado a considerar de forma principal aquellas correlaciones definidas como muy


altas por Bisquerra, con valores iguales o superiores a 0,8 y con coeficientes de
determinación iguales o superiores a 0,64. En segunda instancia, también tendremos
en cuenta las correlaciones definidas como altas, con valores comprendidos entre 0,6
y 0,8 y con coeficientes de determinación comprendidos entre 0,36 y 0,64.

Para terminar el apartado, y teniendo en cuenta el carácter multidimensional del


estudio, resulta de interés comprobar hasta qué punto el coeficiente de correlación
obtenido entre dos variables puede estar influido por la acción de terceras variables.
Para ello emplearemos el coeficiente de correlación parcial de orden (Pardo, A. &
Ruiz, M.Á., 2002), que precisamente elimina el efecto que terceras variables pudieran
tener en el índice obtenido:

La interpretación del coeficiente de correlación parcial recién mencionado es


sencilla: la correlación hallada entre dos variables se puede considerar espuria o
debida a otros factores cuando el valor calculado resulta ser alto pero el índice de
correlación parcial equivalente no lo es.

5.4. Análisis factorial basado en componentes principales

El análisis factorial (Thurstone, L.L., 1947) (Hair, J. et al, 1999) es una técnica
estadística multidimensional que permite alcanzar dos objetivos: por una parte,
podemos encontrar la estructura en nuestra matriz de datos (si es que existe), o lo
que es lo mismo, podemos agrupar las variables que forman parte de nuestro sistema
en base a las relaciones existentes entre ellas. Por otra parte, permite reducir la
dimensionalidad del problema, ya que estas agrupaciones de las variables originales,
denominadas factores, recogen un porcentaje muy significativo de la información del
sistema empleando en general un número de ellos mucho más reducido que el de las
variables originales. Por otro lado, como veremos en el capítulo de resultados, los
factores han resultado tener más capacidad discriminante que los parámetros
originales en varios de los casos analizados, siempre de cara a la detección de
patología vocal.

El modelo matemático del análisis factorial viene dado por las siguientes ecuaciones
(Salvador, M. & Gargallo, P., 2013):

...

87
Capítulo 5: Métodos analíticos utilizados en el estudio

donde son las variables originales, son los factores comunes,


son los factores únicos o específicos y los coeficientes (con el índice
variando entre 1 y y el índice variando entre 1 y ) son las cargas factoriales.

Antes de realizar un análisis factorial es necesario plantearse una cuestión: ¿las


variables del estudio esconden una estructura factorial? O, expresado en otras
palabras, ¿es adecuado utilizar esta técnica? Para responder a esta pregunta
contamos, en primer lugar, con el cálculo del determinante de la matriz de
correlaciones. Si el valor calculado es próximo a cero es porque las variables están
linealmente relacionadas, por lo que será pertinente realizar un análisis factorial.
Relacionada con esta prueba contamos con el test de esfericidad de Bartlett, que
contrasta la hipótesis nula de que la matriz de correlaciones es una matriz identidad.
También es posible examinar la matriz reproducida, o matriz de correlación extraída
de la solución factorial hallada. Si esta matriz es parecida a la original, el uso de la
técnica es adecuado. Para comprobarlo contamos con la matriz de correlaciones
residuales, que nos ofrece las diferencias entre ambas matrices. En esta última matriz
el número con residuos elevados debe ser mínimo.
Por otra parte, existen otras pruebas como el análisis de la matriz de correlaciones
anti imagen o la medida de adecuación muestral de Kaiser-Meyer-Olkin (KMO), ambas
relacionadas con las correlaciones parciales que se dan entre las variables, que deben
ser lo suficientemente pequeñas para que la solución factorial sea apropiada (Pardo, A.
& Ruiz, M.Á., 2002) (Salvador, M. & Gargallo, P., 2013) (Cubiles, M.D., 2013).

Después de haber realizado las consideraciones previas, para efectuar el análisis


factorial es necesario escoger el método adecuado para estimar o extraer los factores.
Existen varios métodos para realizar esta tarea (Pardo, A. & Ruiz, M. Á., 2002)
(Salvador, M. & Gargallo, P., 2013) (Cubiles, M.D., 2013). En esta tesis hemos utilizado
el método de componentes principales por varias razones: no exige que las variables
originales presenten ninguna distribución, no necesita conocer la matriz de varianzas-
covarianzas y siempre proporciona una solución. Además, es el más frecuentemente
utilizado, y cuando el número de variables es alto (más de 30) y las comunalidades 10
son altas todos los métodos tienden a dar el mismo resultado (Salvador, M. & Gargallo,
P., 2013). El cálculo de los factores a través del método de componentes principales se
basa en los autovalores de la matriz de correlaciones de las variables originales. Se
genera un número de factores igual al de variables, de modo que la varianza total del
modelo queda explicada. Las componentes quedan ordenadas de mayor a menor
según la variabilidad total que recogen de la muestra.
Otros posibles métodos para calcular los factores son mínimos cuadrados no
ponderados, mínimos cuadrados generalizados, máxima verosimilitud, ejes principales,
método alfa y método imagen (Pardo, A. & Ruiz, M.Á., 2002) (Salvador, M. & Gargallo,
P., 2013) (Cubiles, M.D., 2013). Algunos de estos métodos requieren que los datos se
distribuyan según una normal multivariante, o no garantizan la convergencia de la
solución. Por otro lado, las razones arriba apuntadas aconsejaron emplear el método
de componentes principales, por lo que salvo para pruebas informales el resto de
métodos no han sido utilizados en este estudio.
10
la comunalidad de una variable es la proporción de su varianza que puede ser explicada por el modelo
factorial obtenido (Pardo, A. y Ruiz, M.A., 2002).

88
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Una vez realizada la extracción de factores recogeremos un conjunto de resultados


que nos permitirán refinar o interpretar el modelo (Pardo, A. & Ruiz, M.Á., 2002):

 La tabla de comunalidades de cada variable. En general, esta tabla nos va a


indicar si el número de factores elegido es suficiente para explicar de forma
satisfactoria todas las variables que forman parte del estudio. También puede
dar información acerca de si alguna variable debiera quedar fuera del modelo,
para un número de factores dado.

 Los porcentajes de varianza explicada, que nos ayudarán a decidir con cuántos
factores debemos construir el modelo factorial. Estos valores nos indican, factor
a factor, qué porcentaje de la varianza total explica cada uno de ellos, así como el
porcentaje acumulado. Los porcentajes se extraen directamente de los
autovalores de la matriz de varianzas-covarianzas correspondientes a cada
factor. En general, se suelen incluir en los modelos aquellos factores cuyo
autovalor sea mayor que la unidad. Una herramienta gráfica útil que representa
la importancia de cada factor es el gráfico de sedimentación. Este tipo de
gráficos, en los que en el eje de abscisas aparece el número de factor y en el eje
de ordenadas aparece el autovalor correspondiente representa la varianza
explicada por cada factor de forma acumulada a través de una recta. El estudio
sobre el cambio de la pendiente de la recta determinará a partir de qué factor la
información restante no es relevante.

 La solución o estructura factorial. Cuando el método de extracción utilizado es el


de componentes principales, y así es en nuestro caso, la solución factorial se
denomina matriz de componentes. Esta matriz contiene las correlaciones entre
las variables originales y cada uno de los factores o componentes. Estas
correlaciones son también denominadas saturaciones. A partir de la matriz de
componentes podemos observar qué variables están relacionadas con cada
factor, y por lo tanto, qué variables se agrupan entre sí, tratando de encontrar
una interpretación semántica. También es posible observar qué variables
originales tienen más importancia dentro del modelo, sabiendo que los factores
están ordenados respecto al porcentaje de varianza que son capaces de explicar.

Por último, el análisis factorial nos permite realizar rotaciones de los factores de
cara a tratar de mejorar la interpretación del modelo. Estas rotaciones tratan de
cumplir el Principio de Estructura Simple (Thurstone, L.L., 1947) (Salvador, M. &
Gargallo, P., 2006), que dice que el modelo factorial debe cumplir las siguientes
características:

1. Cada factor debe tener unos pocos pesos altos y los otros próximos a cero.
2. Cada variable no debe estar saturada más que en un factor.
3. No deben existir factores con la misma distribución, es decir, dos factores
distintos deben presentar distribuciones diferentes de cargas altas y bajas.

El método de rotación varimax pone el foco en la primera característica: se


encamina a minimizar el número de variables que saturan con carga alta en cada

89
Capítulo 5: Métodos analíticos utilizados en el estudio

factor. En cambio, el método quartimax se concentra en la segunda característica:


procura minimizar el número de factores necesarios para explicar cada variable. El
método equamax busca el equilibrio entre los dos métodos anteriores.

Los tres métodos mencionados se caracterizan porque los factores hallados


continúan siendo ortogonales entre sí después de la rotación, es decir, se consideran
independientes, no existe correlación entre ellos. Sin embargo, también es posible
realizar rotaciones oblicuas, en las que los factores sí estén relacionados (métodos
oblimin directo o promax). Sin embargo, los factores ortogonales son más fáciles de
interpretar, y sobre todo, son más generalizables (Morales Vallejo, P., 2011a).

En el estudio realizado en esta tesis doctoral presentaremos los resultados de una


solución sin rotar, y de una solución rotada de forma ortogonal mediante el método
varimax. Teniendo en cuenta que el objetivo último de la rotación es mejorar la
interpretación de la solución factorial, se han realizado diversas pruebas con todos los
métodos mencionados, llegando a la conclusión de que el método varimax es el que
presenta una estructura más clara. Esta conclusión es alcanzada con frecuencia por
diversos autores, que recomiendan el método, como (Morales Vallejo, P., 2011a),
(Nunnally, J.C., Bernstein, I.H. & Berge, J.M.T., 1994) o (Rennie, K.M., 1997).

5.5. Análisis discriminante

El análisis discriminante (Pardo, A. & Ruiz, M.Á., 2002) es una técnica perteneciente
a la estadística multivariante que permite clasificar a los sujetos de un estudio en
diferentes grupos, utilizando para ello una función matemática denominada función
discriminante, calculada como combinación lineal de un conjunto de variables
independientes que caracterizan a los sujetos de tal modo que permite diferenciar lo
más posible a los distintos grupos. Además, el análisis discriminante permitirá
seleccionar las variables de predicción que contribuyen en mayor medida a explicar las
diferencias entre los grupos (Torrado-Fonseca, M. & Berlanga, V., 2013). En el caso que
nos ocupa, naturalmente, las variables independientes con las que contamos son los
parámetros del estudio, y los grupos de clasificación son dos: personas con patología
vocal y personas normofónicas.

La función discriminante es de la siguiente forma:

siendo las las variables independientes y los los coeficientes que logran que los
sujetos de uno de los grupos consigan puntuaciones máximas en , justo al contrario
que los sujetos del otro grupo. En efecto, la función discriminante busca maximizar la
varianza entre los grupos y minimizar la varianza dentro de los grupos (De la Fuente
Fernández, S., 2011).

En la figura 5-2 (Pardo, A. & Ruiz, M.Á., 2002) podemos observar una
representación de la función discriminante sobre la que aparecen las distribuciones de

90
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

los dos grupos, y también las respectivas medias multivariantes de cada uno,
denominados centroides. La función discriminante debe ser tal que la distancia entre
ambos centroides sea máxima.

Fig. 5.2. Representación de la función discriminante, de


las distribuciones de dos grupos de variables, de sus
centroides y de la distancia entre los centroides (tomado
de Pardo A. y Ruiz M.A., 2002).
La función discriminante, por tanto, tratará de separar los grupos lo máximo
posible. Además, se podrá aplicar a nuevos sujetos, arrojando como resultado una
puntuación discriminante. El sujeto se clasificará en el grupo cuyo centroide esté más
cerca de la puntuación discriminante, según la distancia de Mahalanobis:

donde es la distancia de Mahalanobis, y son dos grupos cualesquiera, es el


número de casos válidos, es el número total de grupos, es la media del grupo
en la i-ésima variable independiente y es un elemento de la inversa de la matriz de
covarianzas intragrupos (Pardo, A. & Ruiz, M.Á., 2002) (Morrison, D.F., 1976).

Además, se establecerá la probabilidad de pertenencia a cada grupo que se


corresponde con su probabilidad a posteriori, calculada a través del teorema de Bayes
(De la Fuente Fernández, S., 2011) (Pardo, A. & Ruiz, M.Á., 2002).

La técnica empleada cuenta con algunos supuestos de aplicación: las matrices de


covarianzas deben ser iguales en todos los grupos (hipótesis de homocedasticidad), no
debe existir colinealidad entre las variables independientes y éstas deben seguir una
distribución normal multivariante.
Para comprobar la hipótesis de homocedasticidad se utiliza el estadístico de Box
(Pardo, A. & Ruiz, M.Á., 2002), que se calcula a partir de las matrices de covarianzas de
los distintos grupos y de la matriz de covarianzas combinada. El estadístico no tiene
distribución muestral conocida, pero se puede transformar en un estadístico .
La multicolinealidad puede ser comprobada con el número o índice de condición
desarrollado por Belsley (Belsley, D.A., 1976) (Uriel Jimenez, E., 2014) (Uriel Jimenez,
E., 2014b). La interpretación de este índice es sencilla: si su valor es mayor de 15, la

91
Capítulo 5: Métodos analíticos utilizados en el estudio

multicolinealidad es problemática. Si excede el valor de 30, el problema pasa a ser muy


serio. También es posible utilizar, como sucederá en nuestro caso, el índice de
tolerancia, definido como la diferencia entre la unidad y el coeficiente de
determinación o coeficiente de correlación múltiple al cuadrado. El índice de
tolerancia de una variable representa la proporción de varianza de esa variable que no
depende del resto de variables del modelo, y en el caso de ser muy pequeño o de que
la inclusión de la variable haga muy pequeña la tolerancia de alguna de las variables ya
incluida entonces la variable en cuestión quedará excluida del modelo (Uriel Jiménez,
E., 2014b) (Pardo, A. & Ruiz, M.Á, 2002) (López, J. et al, 2014) (Fernández Aguerre,
Tabaré, 2013).
La normalidad multivariante se puede contrastar con el estadístico propuesto por
Jarque y Bera (Jarque, C.M. & Bera, A.K., 1980) (Uriel Jimenez, E. 2014), basándose en
los estadísticos de asimetría y curtosis. Sin embargo, en nuestro caso no será
necesario, debido a que un buen número de parámetros originales no se distribuye
como una normal, por lo que es seguro que todos los parámetros, de forma conjunta,
no se distribuirán como una normal multivariante (Marín Diazaraque, J.M., 2011) (De
la Fuente Fernández, S., 2011).
Además, podemos avanzar que los supuestos de homocedasticidad y
multicolinealidad tampoco serán satisfechos en el conjunto de parámetros glóticos en
estudio.11 Sin embargo, autores como Torrado y Berlanga aseguran que el análisis
discriminante "es una técnica robusta que no se ve gravemente afectada si alguno de
los supuestos no se cumple" (Torrado-Fonseca, M., & Berlanga, V., 2013). La misma
línea encontramos en (Marín Diazaraque, J.M., 2011), donde el autor afirma que "(el
análisis discriminante) en la práctica es una técnica robusta y funciona bien aunque las
restricciones no se cumplan". Por último, en (Medina Moral, E., 2014) aparece como
ventaja de la técnica el hecho de que "se ve menos afectada (que otras técnicas) por
incumplimientos de supuestos teóricos necesarios a priori".

Por otra parte, es de gran interés confirmar que los grupos formados estén lo
suficientemente alejados como para que la función discriminante tenga éxito. Existen
varios indicadores para llevar a cabo este propósito, como el índice de correlación
canónica (correlación entre las puntuaciones discriminantes y la pertenencia a los
grupos) o los autovalores (cociente entre la variación intergrupos y la variación
intragrupos) (Pardo, A. & Ruiz, M.Á., 2002). Sin embargo, es más habitual y completo
utilizar para ello el estadístico conocido como lambda de Wilks. La lambda de Wilks se
define como:

donde es la matriz de covarianzas combinada, calculada a partir de las matrices de


covarianzas de cada grupo, y es la matriz de covarianzas total, calculada a partir de

11
Lo veremos en el capítulo siguiente para las diferentes combinaciones de parámetros y factores
sometidas a estudio. Lógicamente, en el caso de los factores, al ser ortogonales, el problema de la
colinealidad no se presenta. En todo caso, como hemos visto, el algoritmo utilizado elimina del modelo
los parámetros cuyo índice de tolerancia sea muy pequeño o cuya inclusión haga muy pequeña la
tolerancia de algún parámetro ya incluido.

92
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

todos los casos como si pertenecieran a un único grupo. La lambda de Wilks permite
contrastar la hipótesis nula de que los centroides de los grupos son iguales, además de
ofrecer un valor comprendido entre cero y uno, donde valores próximos a cero
indicarán una gran diferencia entre los grupos (Pardo, A. & Ruiz, M.Á., 2002).

Para verificar la importancia que tienen los parámetros a la hora de diferenciar a los
grupos utilizaremos la matriz de coeficientes estandarizados, que contiene las
contribuciones netas de cada variable a la función discriminante (es decir,
considerando la relación que existe entre las variables discriminantes). Por su parte, la
matriz de estructura, en la que encontraremos las correlaciones entre las variables y la
función discriminante estandarizada, proporciona la contribución bruta de cada
variable a la función discriminante (es decir, sin considerar la relación que existe entre
las variables discriminantes) (Pardo, A. & Ruiz, M.Á., 2002).

Las pruebas de análisis discriminante realizadas, como veremos en el apartado 6.3,


han sido muy numerosas, por lo que sólo alcanzaremos conclusiones acerca de la
contribución de las variables a la función discriminante, de la separación de los grupos,
de los supuestos de aplicación y de la probabilidad de pertenencia a un grupo o a otro
con los mejores resultados obtenidos desde el punto de vista de la detección en cada
uno de los géneros.12

Por último, cabe destacar que hemos realizado una experimentación completa que
incluye numerosos casos en los que intervienen todos los parámetros glóticos,
subconjuntos presumiblemente relevantes de ellos, y también factores extraídos con
la técnica de análisis factorial descrita en el apartado anterior.
Además, en cada experimento hemos realizado un doble proceso de validación
cruzada: en primer lugar, hemos dividido cada muestra original en submuestras,
para estimar en cada ocasión la función discriminante eliminando una de las
submuestras (fase de entrenamiento) y clasificar después los elementos eliminados,
que no han intervenido en la construcción de la función (fase de clasificación). Estos
elementos reciben el nombre de no seleccionados en las tablas de resultados que
veremos en el capítulo seis. En general, la submuestra ha representado el 10% de los
casos, repitiendo el proceso diez veces y excluyendo cada vez una de las
submuestras13. Hemos utilizado, por tanto, un esquema clásico de entrenamiento-
clasificación, en el que además también ofrecemos los resultados de clasificar los
elementos que sí forman parte del proceso de construcción de la función
discriminante, elementos que reciben el nombre de seleccionados en las tablas de
resultados. En segundo lugar, por otro lado, en cada uno de los estudios realizados
generaremos tantas funciones discriminantes como casos de entrenamiento válidos
tenemos, excluyendo un sólo caso en cada ocasión (en inglés, leave-one-out). A
continuación, clasificaremos el caso excluido utilizando precisamente la función
discriminante que no lo ha tenido en cuenta. La tasa resultado de este proceso recibirá
el nombre de validación cruzada en las tablas de resultados del siguiente capítulo.

12
Naturalmente, los resultados completos estarán disponibles en el disco adjunto a esta tesis.
13
Como veremos en el capítulo seis, también hemos realizado ensayos con diferentes porcentajes y
repeticiones.

93
6. Experimentación y resultados
Capítulo 6: Experimentación y resultados

6.1. Descripción de los parámetros y características generales de la distribución de


los mismos

Los datos calculados para describir los parámetros analizados son muy abundantes,
por lo que es necesario realizar una adecuada organización de los mismos, priorizando
los más importantes. Para ello, en este apartado, así como en el resto del capítulo,
presentaremos y comentaremos aquellos datos más relevantes, los que mejor
resumen cada estudio. En un segundo nivel quedarán los detalles de las pruebas
estadísticas, o la parte más esencial de las mismas si éstas son demasiado extensas,
que aparecerán en los apéndices de este documento. Por último, en un tercer nivel
presentaremos todas las pruebas estadísticas completas realizadas en este trabajo,
incluidas en un disco adjunto. En general, en cada apartado quedará explicado qué
parte de la información es presentada en cada uno de los niveles establecidos.

Como ya comentábamos en el capítulo anterior (apartado 5.1), el análisis


descriptivo realizado sobre la base de datos se puede dividir en dos partes
diferenciadas:

 En primer lugar, disponemos de valores descriptivos referidos a los parámetros


en su conjunto, de forma global, sin realizar ninguna distinción de acuerdo al
carácter patológico o sano de la voz de los sujetos. Estos valores aparecen en el
apéndice 2.1. del presente documento. A estos valores descriptivos añadiremos
la prueba de normalidad realizada para estos parámetros, prueba comentada en
este mismo apartado y cuyos valores exactos aparecen en el apéndice 2.3.
También incluiremos diagramas de caja, diagramas de tallo y hoja y diagramas
Q-Q normal y Q-Q normal sin tendencia, que aparecerán en documentos
electrónicos anexos incluidos en el disco que acompaña a este trabajo.

 En segundo lugar presentamos valores descriptivos y diagramas relacionados con


la distribución de los datos, así como con su normalidad, diferenciando en esta
ocasión aquellos sujetos que presentan patología vocal de aquellos sujetos
normofónicos. De entre estos diagramas, enumerados en el capítulo anterior, en
este apartado comentaremos aquellos que tienen una interpretación visual más
clara: los diagramas de caja o boxplot, que podemos encontrar en el apéndice
2.2. El resto de los diagramas y valores generados aparecen en documentos
electrónicos anexos incluidos en el disco adjunto a este trabajo. Sí incluimos en
este texto las pruebas de normalidad y de homogeneidad de varianzas realizadas
para sujetos normofónicos y con voz patológica, comentadas ambas en este
mismo apartado y cuyos valores están incluidos en los apéndices 2.3. y 2.4.,
respectivamente.

Por otro lado, este apartado también incluye el resumen comentado de los
resultados de los contrastes de medias paramétricos y no paramétricos realizados
sobre el conjunto de los datos. Los resultados completos correspondientes a la prueba
t de Student realizada, perteneciente a la primera categoría, aparecen detallados en el
apéndice tres. Los resultados completos de las pruebas de Mann-Whitney,

96
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Kolmogorov-Smirnov para dos muestras, Moses y Wald-Wolfowitz, pertenecientes a la


segunda, aparecen detallados en el apéndice cuatro.

Destacaremos también, antes de pasar a mostrar y a comentar los resultados, que


como ya ha sido mencionado anteriormente, todas las pruebas de este apartado se
han realizado para las dos bases de datos disponibles, la formada por sujetos de
género masculino y la formada por sujetos de género femenino. Esta circunstancia se
repite en todos los estudios presentados en el resto del capítulo.

6.1.1. Resultados de las pruebas de normalidad

Las tablas 6-1, 6-2 y 6-3 recogen un resumen de los resultados de las pruebas de
normalidad realizadas utilizando, respectivamente, la prueba de Kolmogorov-Smirnov,
la modificación de Lilliefors y la prueba de Saphiro-Wilk (recordemos que los
resultados completos de las pruebas aparecen en el apéndice 2.3). En cada tabla
podemos observar si cada uno de los parámetros supera el test de normalidad en las
seis bases de datos utilizadas: casos no patológicos (N), casos patológicos (P) y
combinación de todos los casos (G), para cada uno de los dos géneros. En el caso de
que el test de normalidad sea superado se marcará la casilla correspondiente con una
'X', quedándose ésta en blanco en caso contrario.

Tabla 6-1. Normalidad de los parámetros en la base de datos femenina y


masculina según la prueba de Kolmogorov-Smirnov.
BD BD
Femenina Masculina
Nº Parámetro de perturbación o de energía G N P G N P
1 Pitch X X X X X X
2 Jitter X
3 Shimmer asociado a la amplitud X X X X X X
4 Shimmer asociado a la esbeltez X X X X X X
5 Shimmer asociado al área X X X X X X
6 Razón Amp. Pico de Cierre Glótico / Vecinos X
7 Razón Esb. Pico de Cierre Glótico / Vecinos X X X
8 Razón Energía MWC/AAW X X X X X
9 2º Arm. / Frecuencia Fundamental MWC
10 2º Arm. / 1er Arm. Onda Mucosa X X X
11 Primera banda de energía de la Onda Mucosa X X X X X X
12 Segunda banda de energía de la Onda Mucosa X X X X X X
13 Tercera banda de energía de la Onda Mucosa X X X X X
14 Cuarta banda de energía de la Onda Mucosa X X X X X
Nº Parámetro biométrico
15 Amplitud del origen de la señal (valor relativo)
17 Amplitud del primer máximo (valor absoluto) X X X X X X
18 Amplitud del primer mínimo (valor relativo) X X X X X X
19 Amplitud del segundo máximo (valor relativo) X X X X X X
21 Amplitud del segundo mínimo (valor relativo) X X X X X X
22 Amplitud del cuarto máximo (valor relativo) X X X X X X
23 Amplitud del final de la señal (valor relativo) X X X X X X
24 Frecuencia del origen de la señal (valor rel.)
26 Frecuencia del primer máximo (valor absoluto)
27 Frecuencia del primer mínimo (valor relativo) X X X X X X

97
Capítulo 6: Experimentación y resultados

BD BD
Femenina Masculina
Nº Parámetro biométrico G N P G N P
28 Frecuencia del segundo máx. (valor relativo) X X X X X X
30 Frecuencia del segundo mín. (valor relativo) X X X X X X
Nº Parámetro biomecánico
31 Frecuencia del cuarto máximo (valor relativo) X X X X X X
32 Frecuencia del final de la señal (valor relativo) X X X X X X
33 Esbeltez correspondiente al primer surco X X X X X X
34 Esbeltez correspondiente al segundo surco X X X X X X
35 Masa del cuerpo X X
36 Pérdida del cuerpo X X X X
37 Elasticidad del cuerpo X X
38 Desbalance de la masa del cuerpo
39 Desbalance de la pérdida del cuerpo X X
40 Desbalance de la elasticidad del cuerpo
41 Masa de la cubierta X X X X
42 Pérdida de la cubierta X X X X
43 Elasticidad de la cubierta X
44 Desbalance de la masa de la cubierta X X X
45 Desbalance de la pérdida de la cubierta X X X X
46 Desbalance de la elasticidad de la cubierta X
Nº Parámetro temporal
47 Punto de Apertura X X X X
48 Punto de Cierre X X X X X X
49 Punto de Recuperación X X X X
50 Posición 1er Máximo Onda Mucosa X X X X
51 Posición 2o Máximo Onda Mucosa X X X X

Tabla 6-2. Normalidad de los parámetros en la base de datos femenina y


masculina según la prueba de Kolmogorov-Smirnov, modificación de
Lilliefors.
BD BD
Femenina Masculina
Nº Parámetro de perturbación o de energía G N P G N P
1 Pitch X X X X
2 Jitter
3 Shimmer asociado a la amplitud X X X X
4 Shimmer asociado a la esbeltez X
5 Shimmer asociado al área X X X X
6 Relación Amp. Pico de Cierre Glótico / Vecinos X
7 Relación Esb. Pico de Cierre Glótico / Vecinos X X
8 Relación Energía MWC/AAW X X X
9 2º Arm. / Frecuencia Fundamental MWC
10 2º Arm. / 1er Arm. Onda Mucosa
11 Primera banda de energía de la Onda Mucosa X X X X X
12 Segunda banda de energía de la Onda Mucosa X X X
13 Tercera banda de energía de la Onda Mucosa X X
14 Cuarta banda de energía de la Onda Mucosa X X X X
Nº Parámetro biométrico
15 Amplitud del origen de la señal (valor relativo)
17 Amplitud del primer máximo (valor absoluto) X X X
18 Amplitud del primer mínimo (valor relativo) X X X X X X
19 Amplitud del segundo máximo (valor relativo) X X X X

98
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

BD BD
Femenina Masculina
Nº Parámetro biométrico G N P G N P
21 Amplitud del segundo mínimo (valor relativo) X X X X X
22 Amplitud del cuarto máximo (valor relativo) X X X X X X
23 Amplitud del final de la señal (valor relativo) X X X X
24 Frecuencia del origen de la señal (valor rel.)
26 Frecuencia del primer máximo (valor absoluto)
27 Frecuencia del primer mínimo (valor relativo) X X X
28 Frecuencia del segundo máx. (valor relativo) X X
30 Frecuencia del segundo mín. (valor relativo) X X X X X X
31 Frecuencia del cuarto máximo (valor relativo) X X X X X X
32 Frecuencia del final de la señal (valor relativo) X X X X
33 Esbeltez correspondiente al primer surco X X X
34 Esbeltez correspondiente al segundo surco X X X X
Nº Parámetro biomecánico
35 Masa del cuerpo X X
36 Pérdida del cuerpo X X
37 Elasticidad del cuerpo X X
38 Desbalance de la masa del cuerpo
39 Desbalance de la pérdida del cuerpo
40 Desbalance de la elasticidad del cuerpo
41 Masa de la cubierta X
42 Pérdida de la cubierta X
43 Elasticidad de la cubierta
44 Desbalance de la masa de la cubierta X
45 Desbalance de la pérdida de la cubierta X X
46 Desbalance de la elasticidad de la cubierta X
Nº Parámetro temporal
47 Punto de Apertura X X X X
48 Punto de Cierre X X X X X
49 Punto de Recuperación X X
er
50 Posición 1 Máximo Onda Mucosa X X
51 Posición 2o Máximo Onda Mucosa X X X

Tabla 6-3. Normalidad de los parámetros en la base de datos femenina y


masculina según la prueba de Saphiro-Wilk.
BD BD
Femenina Masculina
Nº Parámetro de perturbación o de energía G N P G N P
1 Pitch X X X
2 Jitter
3 Shimmer asociado a la amplitud X X
4 Shimmer asociado a la esbeltez X
5 Shimmer asociado al área X
6 Razón Amp. Pico de Cierre Glótico / Vecinos
7 Razón Esb. Pico de Cierre Glótico / Vecinos X X
8 Razón Energía MWC/AAW X
9 2º Arm. / Frecuencia Fundamental MWC
10 2º Arm. / 1er Arm. Onda Mucosa
11 Primera banda de energía de la Onda Mucosa X X X X X
12 Segunda banda de energía de la Onda Mucosa X X X
13 Tercera banda de energía de la Onda Mucosa X X
14 Cuarta banda de energía de la Onda Mucosa X X X X

99
Capítulo 6: Experimentación y resultados

BD BD
Femenina Masculina
Nº Parámetro biométrico G N P G N P
15 Amplitud del origen de la señal (valor relativo)
17 Amplitud del primer máximo (valor absoluto) X X X X
18 Amplitud del primer mínimo (valor relativo) X X X X X X
19 Amplitud del segundo máximo (valor relativo) X X X X X
21 Amplitud del segundo mínimo (valor relativo) X X X X X X
22 Amplitud del cuarto máximo (valor relativo) X X X X X
23 Amplitud del final de la señal (valor relativo) X X X X
24 Frecuencia del origen de la señal (valor rel.)
26 Frecuencia del primer máx. (valor absoluto)
27 Frecuencia del primer mín. (valor relativo) X
28 Frecuencia del segundo máx. (valor relativo) X X X X
30 Frecuencia del segundo mín. (valor relativo) X X X X X
31 Frecuencia del cuarto máximo (valor relativo) X X X X X X
32 Frecuencia del final de la señal (valor relativo) X X X X
33 Esbeltez correspondiente al primer surco X X
34 Esbeltez correspondiente al segundo surco X X
Nº Parámetro biomecánico
35 Masa del cuerpo X X
36 Pérdida del cuerpo X X
37 Elasticidad del cuerpo X
38 Desbalance de la masa del cuerpo
39 Desbalance de la pérdida del cuerpo
40 Desbalance de la elasticidad del cuerpo
41 Masa de la cubierta X
42 Pérdida de la cubierta X
43 Elasticidad de la cubierta
44 Desbalance de la masa de la cubierta
45 Desbalance de la pérdida de la cubierta
46 Desbalance de la elasticidad de la cubierta
Nº Parámetro temporal
47 Punto de Apertura X X X X
48 Punto de Cierre X X X X X
49 Punto de Recuperación X
50 Posición 1er Máximo Onda Mucosa X X
o
51 Posición 2 Máximo Onda Mucosa X X

La prueba de Kolmogorov-Smirnov concluye que siguen la distribución normal un


66% de los casos analizados. La modificación de Lilliefors reduce ese porcentaje al
41,5%. Aún es más exigente la prueba de Saphiro-Wilk, que concede la distribución
normal a un 35,1% de los casos.

La tabla 6-4 combina la información contenida en las tablas 6-1, 6-2 y 6-3. En ella
podemos comprobar si cada uno de los parámetros sigue la distribución normal
superando todas las pruebas consideradas, para cada una de las seis bases de datos
utilizadas. Escogiendo un criterio conservador, comentaremos los resultados sobre la
tabla 6-4, aprovechando de este modo los tres estudios realizados.

100
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla 6-4. Normalidad de los parámetros en la base de datos femenina y


masculina según las pruebas de Kolmogorov-Smirnov, Kolmogorov-
Smirnov, modificación de Lilliefors y Saphiro-Wilk.
BD BD
Femenina Masculina
Nº Parámetro de perturbación o de energía G N P G N P
1 Pitch X X X
2 Jitter
3 Shimmer asociado a la amplitud X X
4 Shimmer asociado a la esbeltez
5 Shimmer asociado al área X
6 Razón Amp.Pico de Cierre Glótico / Vecinos
7 Razón Esb. Pico de Cierre Glótico / Vecinos X X
8 Razón Energía MWC/AAW X
9 2º Arm. / Frecuencia Fundamental MWC
er
10 2º Arm. / 1 Arm. Onda Mucosa
11 1ª banda de energía de la Onda Mucosa X X X X X
12 2ª banda de energía de la Onda Mucosa X X X
13 3ª banda de energía de la Onda Mucosa X X
14 4ª banda de energía de la Onda Mucosa X X X X
Nº Parámetro biométrico
15 Amplitud del origen de la señal (valor rel.)
17 Amplitud del primer máximo (valor absoluto) X X X
18 Amplitud del primer mínimo (valor relativo) X X X X X X
19 Amplitud del segundo máximo (valor relativo) X X X X
21 Amplitud del segundo mínimo (valor relativo) X X X X X
22 Amplitud del cuarto máximo (valor relativo) X X X X X
23 Amplitud del final de la señal (valor relativo) X X X X
24 Frecuencia del origen de la señal (valor rel.)
26 Frecuencia del primer máx. (valor absoluto)
27 Frecuencia del primer mín. (valor relativo) X
28 Frecuencia del segundo máx. (valor relativo) X X
30 Frecuencia del segundo mín. (valor relativo) X X X X X
31 Frecuencia del cuarto máximo (valor relativo) X X X X X X
32 Frecuencia del final de la señal (valor relativo) X X X
33 Esbeltez correspondiente al primer surco X X
34 Esbeltez correspondiente al segundo surco X X
Nº Parámetro biomecánico
35 Masa del cuerpo X X
36 Pérdida del cuerpo X X
37 Elasticidad del cuerpo X
38 Desbalance de la masa del cuerpo
39 Desbalance de la pérdida del cuerpo
40 Desbalance de la elasticidad del cuerpo
41 Masa de la cubierta X
42 Pérdida de la cubierta X
43 Elasticidad de la cubierta
44 Desbalance de la masa de la cubierta
45 Desbalance de la pérdida de la cubierta
46 Desbalance de la elasticidad de la cubierta
Nº Parámetro temporal
47 Punto de Apertura X X X X
48 Punto de Cierre X X X X X
49 Punto de Recuperación X

101
Capítulo 6: Experimentación y resultados

BD BD
Femenina Masculina
Nº Parámetro temporal G N P G N P
50 Posición 1er Máximo Onda Mucosa X X
o
51 Posición 2 Máximo Onda Mucosa X X

Las tablas 6-5 y 6-6 recogen un interesante resumen de los datos del estudio; en
ellas podemos observar la proporción de parámetros que siguen la distribución normal
según las tres pruebas realizadas, distinguiendo a los parámetros por su naturaleza.

Los parámetros biométricos son los que alcanzan un porcentaje más alto de casos
positivos en las pruebas, con un 54,1% en las mujeres y un 45,8% en los hombres. Los
temporales, que son menos numerosos, ocupan el segundo lugar, con un 53,3% en la
base de datos femenina y un 40% en la masculina. Los parámetros de perturbación y
energía arrojan resultados inferiores: 33,3% y 21,4% en mujeres y hombres,
respectivamente. Y los biomecánicos, muy inferiores: la base de datos femenina tiene
un 13,9% de parámetros normales, y la base de datos masculina, sólo un 5,6%.

Tanto en la base de datos femenina como en la masculina se produce la siguiente


circunstancia: los casos normofónicos son los que cuentan con más parámetros que
siguen la distribución normal (53,2% en la femenina y 38,2% en la masculina). En los
casos patológicos estos porcentajes disminuyen (42,6% en la femenina y 27,7% en la
masculina), y se desploman si consideramos todos los casos combinados (17% en
ambas bases de datos). Tomaremos esto como un indicio, aún muy general, de que los
grupos patológicos y normofónicos serán bastante separables.

Tabla 6-5. Proporción de los parámetros que se ajustan a la


distribución normal en la base de datos femenina: todos los casos,
casos normofónicos y casos patológicos. En la última fila y en la
última columna, suma de los valores.
Global Normofónico Patológico
Perturbación 1/14 6/14 7/14 14/42
Biométricos 5/16 10/16 11/16 26/48
Biomecánicos 0/12 5/12 0/12 5/36
Temporales 2/5 4/5 2/5 8/15
8/47 25/47 20/47 53/141

Tabla 6-6. Proporción de los parámetros que se ajustan a la


distribución normal en la base de datos masculina: todos los casos,
casos normofónicos y casos patológicos. En la última fila y en la
última columna, suma de los valores.
Global Normofónico Patológico
Perturbación 1/14 6/14 2/14 9/42
Biométricos 6/16 6/16 10/16 22/48
Biomecánicos 0/12 2/12 0/12 2/36
Temporales 1/5 4/5 1/5 6/15
8/47 18/47 13/47 39/141

102
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Otra conclusión que se aprecia a simple vista en las tablas 6-5 y 6-6 es que de las
dos bases de datos es la femenina la que cuenta con más parámetros que se ajustan a
la normal. La suma de todos los valores alcanza un 37,6% en la base de datos femenina
y un 27,6% en la base de datos masculina. A pesar de esa diferencia, las bases de datos
masculina y femenina tienen un alto número de coincidencias en cuanto a la
normalidad de sus parámetros: hablamos de un 79,4% de los casos.

6.1.2. Resultados de los diagramas de caja

Para poder extraer conclusiones acerca de los diagramas de caja generados (que,
recordemos, aparecen en el apéndice 2-2 de este documento) utilizaremos tres
criterios diferentes. En el primero de ellos destacaremos aquellos parámetros en los
que no existe solapamiento entre los rangos intercuartílicos de las distribuciones de
casos normofónicos y patológicos. En el segundo criterio destacaremos aquellos
parámetros en los que aunque exista este solapamiento, la alta presencia de valores
atípicos presente en los datos patológicos puede ofrecer algún indicio relevante. En el
tercer criterio destacaremos aquellos parámetros que sin cumplir los requisitos
necesarios para encajar en alguno de los dos criterios anteriores también parecen
relevantes de acuerdo a una inspección visual.

En la tabla 6-7 podemos observar los siguientes valores extraídos del análisis de los
diagramas de caja para la base de datos femenina, que representan un resumen de los
mismos: valor no atípico más pequeño, percentil 25, mediana, percentil 75, valor no
atípico más grande, valor atípico extremo más pequeño, valor atípico leve más
pequeño, valor atípico leve más grande y valor atípico extremo más grande. Todos
estos valores han sido recogidos de los diagramas de caja correspondientes a los casos
normofónicos (N en la tabla) y patológicos (P en la tabla), para cada uno de los
parámetros representativos según los critrerios seleccionados. Las casillas en blanco se
corresponden con situaciones en las que no existe ningún valor atípico de la categoría
en cuestión en el correspondiente diagrama. Es importante destacar que los valores
recogidos corresponden a un análisis visual, por lo que son aproximados. Métodos
posteriores tratarán los datos de forma más rigurosa, pero los diagramas de caja son
especialmente indicados para etapas preliminares: arrojan indicios que podrán ser
confirmados en estudios posteriores.

Tabla 6-7. Listado de valores representativos de los diagramas de caja de los


parámetros de la base de datos femenina.
Cód. No Perc. Med. Perc. No Atíp. Atíp. Atíp Atíp.
Par. atíp. 25 75 atíp. más ext. leve leve ext.
más grande más más más más
peq. peq. peq. gran. gran.
02 P 0,005 0,010 0,025 0,035 0,070 0,090 0,130
N Todos los valores, por debajo de 0,020
11 P -14 -8 -5 -2 +4
N -17 -13 -11,5 -9 -5,5
12 P -35 -26 -20 -14 -1
N -40 -35 -32,5 -30 -26 -21
13 P -44 -34 -27 -22 -9
N -50 -43 -40 -38 -34 -30

103
Capítulo 6: Experimentación y resultados

Cód. No Perc. Med. Perc. No Atíp. Atíp. Atíp Atíp.


Par. atíp. 25 75 atíp. más ext. leve leve ext.
más grande más más más más
peq. peq. peq. gran. gran.
14 P -51 -37 -30 -25 -15
N -53 -48 -45 -43 -36 34
19 P -26 -19 -13 -10 -2
N -34 -26 -23 -19 -13 -4
21 P -44 -32 -25 -22 -10
N -50 -41 -37 -35 -28 -19
22 P -32 -23 -19 -15 -5
N -42 -34 -30 -27 -20 -15
23 P -75 -65 -60 -54 -35 -30
N -78 -75 -72 -69 -62 -58
36 P 4 4,30 4,45 4,55 4,65 3,80
N 4,55 4,60 4,63 4,65 4,70 4,50
38 P 0 0,010 0,050 0,100 0,220 0,340 0,625
N Todos los valores, por debajo de 0,010
39 P 0,007 0,015 0,025 0,045 0,085 0,090 0,135
N Todos los valores, por debajo de 0,020
40 P 0,010 0,030 0,080 0,170 0,350 0,550 0,750
N Todos los valores, por debajo de 0,050
41 P 0,008 0,015 0,018 0,021 0,032 0,040 0,043
N 0,007 0,010 0,012 0,015 0,018
44 P 0,020 0,070 0,090 0,150 0,250 0,360
N 0,010 0,030 0,040 0,060 0,100 0,140 0,170
45 P 0,020 0,070 0,110 0,160 0,300
N 0,010 0,030 0,040 0,050 0,075 0,090
46 P 0,020 0,100 0,140 0,250 0,430 0,600 1,000
N Todos los valores, por debajo de 0,100

La tabla 6-8, de acuerdo con el primero de los criterios arriba explicados, recoge los
parámetros en los que no existe solapamiento entre los rangos intercuartílicos
correspondientes a las distribuciones de casos normales y patológicos. En ella se listan
sus nombres, destacando en negrita aquellos en los que la diferencia entre las
distribuciones de los grupos resulta más evidente.
Tabla 6-8. Listado de parámetros de la base de datos
femenina que cumplen el primero de los tres criterios
establecidos.
Cód. Nombre del parámetro
2 Jitter
11 Primera banda de energía de la Onda Mucosa
12 Segunda banda de energía de la Onda Mucosa
13 Tercera banda de energía de la Onda Mucosa
14 Cuarta banda de energía de la Onda Mucosa
19 Amplitud del segundo máximo (valor relativo)
21 Amplitud del segundo mínimo (valor relativo)
22 Amplitud del cuarto máximo (valor relativo)
23 Amplitud del final de la señal (valor relativo)
36 Pérdida del cuerpo
38 Desbalance de la masa del cuerpo
39 Desbalance de la pérdida del cuerpo

104
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Cód. Nombre del parámetro


40 Desbalance de la elasticidad del cuerpo
44 Desbalance de la masa de la cubierta
45 Desbalance de la pérdida de la cubierta
46 Desbalance de la elasticidad de la cubierta

Los siguientes parámetros, cuyos nombres aparecen listados en la tabla 6-9


cumplen el segundo criterio escogido: presentan una distribución casi uniforme, pero
contienen numerosos valores que rompen la homogeneidad de la misma, todos ellos
observados en la muestra patológica.
 Parámetro 09: diez valores atípicos extremos en el diagrama de casos
patológicos comprendidos entre 2,05 y 3,00. Todos los valores normales y
prácticamente el resto de los patológicos valen 2.
 Parámetro 24: diez valores atípicos extremos en el diagrama de casos
patológicos comprendidos entre 0,33 y 0,49. Todos los valores normales y
prácticamente el resto de los patológicos valen 0,5.
 Parámetro 26: diez valores atípicos extremos en el diagrama de casos
patológicos comprendidos entre 2,05 y 3,00. Todos los valores normales y
prácticamente el resto de los patológicos valen 2.

Tabla 6-9. Listado de parámetros de la base de


datos femenina que cumplen el segundo de los tres
criterios establecidos.
Cód. Nombre del parámetro
9 2º Arm. / Frecuencia Fundamental Onda Mucosa
24 Frecuencia del origen de la señal (valor relativo)
26 Frecuencia del primer máximo (valor absoluto)

Por último y de acuerdo con el tercer criterio empleado también destacaremos a


los parámetros de códigos 07, 10, 15, 41, 42 y 43 y listaremos sus nombres en la tabla
6-10. En todos ellos se aprecia visualmente la diferencia entre las distribuciones de los
valores de los sujetos con patología vocal y las de los valores de los sujetos
normofónicos; además, en los cinco últimos casos el solapamiento entre los rangos
intercuartílicos es pequeño o muy pequeño.
Tabla 6-10. Listado de parámetros de la base de datos
femenina que cumplen el tercero de los tres criterios
establecidos.
Cód. Nombre del parámetro
7 Razón Esbeltez Pico de Cierre Glótico / Vecinos
10 2º Arm. / 1er Arm. Onda Mucosa
15 Amplitud del origen de la señal (valor relativo)
41 Masa de la cubierta
42 Pérdida de la cubierta
43 Elasticidad de la cubierta
En cuanto a la base de datos masculina, en la tabla 6-11 aparecen los valores
extraídos del análisis de los diagramas de caja de los parámetros representativos. La
tabla 6-11 tiene la misma estructura que su homóloga en la base de datos femenina
femenina, la tabla 6-7.

105
Capítulo 6: Experimentación y resultados

Tabla 6-11. Listado de valores representativos de los diagramas de caja de los


parámetros de la base de datos masculina.
Cód. No Perc. Med. Perc. No Atíp. Atíp. Atíp Atíp.
Par. atíp. 25 75 atíp. ext. leve leve ext.
más más más más más más
peq. grande peq. peq. gran. gran.
02 P 0,005 0,010 0,0020 0,037 0,075 0,100
N Todos los valores, por debajo de 0,020
11 P -16 -10 -7 -4 +4
N -17 -14 -12,5 -9 -4 -22
12 P -40 -30 -27 -22 -10 -3
N -40 -35 -32 -31 -26 -45
13 P -44 -36 -34 -27 -15 -10
N -49 -43 -42 -38 -35 -50
14 P -49 -41 -33 -30 -17
N -55 -49 -45 -42 -37
22 P -32 -24 -22 -16 -5
N -35 -30 -28 -25 -20 -40
36 P 4,05 4,35 4,50 4,57 4,67
N 4,55 4,60 4,63 4,65 4,69
38* P 0 0,010 0,040 0,100 0,170 0,300 0,720
N Todos los valores, por debajo de 0,020
39 P 0,005 0,017 0,025 0,040 0,085 0,100
N Todos los valores, por debajo de 0,025
40 P 0,010 0,020 0,080 0,160 0,300 0,450 0,800
N Todos los valores, por debajo de 0,050
44 P 0,020 0,070 0,100 0,180 0,250 0,450 0,690
N 0,010 0,030 0,040 0,060 0,100 0,140 0,170
45 P 0,025 0,070 0,100 0,150 0,250 0,340
N 0,010 0,030 0,050 0,070 0,110 0,170
46 P 0,020 0,100 0,150 0,210 0,380 0,420 1,200
N Todos los valores excepto un valor atípico extremo, por debajo de 0,200. Todos los
valores, por debajo de 0,300

El listado de parámetros de la base de datos masculina que cumplen las condiciones


del primer criterio aparece en la tabla 6-12, en la que se ven destacados los
parámetros en los que la diferencia de distribuciones entre los grupos normofónico y
patológico es más acusada.
Tabla 6-12. Listado de parámetros de la base de
datos masculina que cumplen el primero de los tres
criterios establecidos.
Cód. Nombre del parámetro
2 Jitter
11 Primera banda de energía de la Onda Mucosa
12 Segunda banda de energía de la Onda Mucosa
13 Tercera banda de energía de la Onda Mucosa
14 Cuarta banda de energía de la Onda Mucosa
22 Amplitud del cuarto máximo (valor relativo)
36 Pérdida del cuerpo
38 Desbalance de la masa del cuerpo
39 Desbalance de la pérdida del cuerpo

106
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Cód. Nombre del parámetro


40 Desbalance de la elasticidad del cuerpo
44 Desbalance de la masa de la cubierta
45 Desbalance de la pérdida de la cubierta
46 Desbalance de la elasticidad de la cubierta

Los siguientes parámetros cumplen las condiciones del segundo criterio en la base
de datos masculina, y sus nombres aparecen listados en la tabla 6-13:

 Parámetro 09: diez valores atípicos extremos en el diagrama de casos


patológicos comprendidos entre 2,30 y 3,30. Todos los valores normales y
prácticamente el resto de los patológicos valen 2.
 Parámetro 24: nueve valores atípicos extremos en el diagrama de casos
patológicos comprendidos entre 0,33 y 0,45. Todos los valores normales y
prácticamente el resto de los patológicos valen 0,5.
 Parámetro 26: diez valores atípicos extremos en el diagrama de casos
patológicos comprendidos entre 2,35 y 3,30. Todos los valores normales y
prácticamente el resto de los patológicos valen 2.

Tabla 6-13. Listado de parámetros de la base de datos


masculina que cumplen el segundo de los tres criterios
establecidos.
Cód. Nombre del parámetro
9 2º Arm. / Frecuencia Fundamental Onda Mucosa
24 Frecuencia del origen de la señal (valor relativo)
26 Frecuencia del primer máximo (valor absoluto)

Por último, destacaremos también en la base de datos masculina los parámetros en


los que se aprecia visualmente una diferencia clara entre las distribuciones de los
valores de los sujetos con patología vocal y de los sujetos normofónicos, pero sin
encajar en ninguno de los dos criterios anteriores. En esta ocasión, además, el
solapamiento entre los rangos intercuartílicos es pequeño o muy pequeño en todos los
casos. Podemos observar el listado de estos parámetros en la tabla 6-14.
Tabla 6-14. Listado de parámetros de la base de datos
masculina que cumplen el tercero de los tres criterios
establecidos.
Cód. Nombre del parámetro
15 Amplitud del origen de la señal (valor relativo)
19 Amplitud del segundo máximo (valor relativo)
21 Amplitud del segundo mínimo (valor relativo)
23 Amplitud del final de la señal (valor relativo)

A modo de resumen, la tabla 6-15 presenta los códigos de los parámetros que
cumplen cada uno de los criterios establecidos para ambas bases de datos. En ella
podemos observar que existe una alta coincidencia entre los parámetros de las dos
bases de datos. Así, todos los parámetros que cumplen el primer criterio en la base de
datos masculina también lo hacen en la base de datos femenina. No sucede lo mismo
de forma recíproca, pero los tres únicos parámetros que lo impiden (destacados en la
tabla) sí cumplen el tercer criterio en la base de datos masculina, criterio que podemos

107
Capítulo 6: Experimentación y resultados

considerar como una versión relajada del primero de ellos. Por esta razón, las
discrepancias observadas en el tercer criterio, que son mayores, quedan algo
amortiguadas. Por otro lado, el segundo criterio es satisfecho en ambas bases de datos
por los mismos parámetros. Por fin, en la última fila de la tabla reuniremos a todos los
parámetros que cumplen alguno de los criterios, para las dos bases de datos. Podemos
comprobar que ambas bases de datos comparten veinte parámetros en esta última
fila, a los cuales la base de datos femenina añade cinco más (destacados en la tabla),
todos ellos pertenecientes al tercer criterio, que es, como hemos visto, el más
subjetivo de los tres. Estos últimos parámetros (todos los de la última fila de la tabla 6-
15) serán considerados como los mejores de este estudio de cara a su utilización en el
análisis discriminante, cuyos resultados podemos ver en el apartado 6.3.

Tabla 6-15. Listado de códigos de los parámetros de ambas bases de datos que
cumplen cada uno de los tres criterios establecidos, y alguno de ellos.
Código de los Código de los
parámetros, parámetros,
base de datos femenina base de datos masculina
Cumplen el primer criterio 2, 11, 12, 13, 14, 19, 21, 2, 11, 12, 13, 14, 22, 36,
establecido (rangos 22, 23, 36, 38, 39, 40, 38, 39, 40, 44, 45, 46
intercuartílicos no solapados) 44, 45, 46
Cumplen el segundo criterio 9, 24, 26 9, 24, 26
establecido (distribuciones
uniformes, casos atípicos)
Cumplen el tercer criterio 7, 10, 15, 41, 42, 43 15, 19, 21, 23
establecido (distribuciones
visualmente diferentes, rangos
intercuartílicos con ligero
solapamiento)
Cumplen alguno de los tres 2, 7, 9, 10, 11, 12, 13, 2, 9, 11, 12, 13, 14, 15,
criterios anteriores 14, 15, 19, 21, 22, 23, 19, 21, 22, 23, 24, 26, 36,
24, 26, 36, 38, 39, 40, 38, 39, 40, 44, 45, 46
41, 42, 43, 44, 45, 46

En cuanto a la naturaleza de los parámetros, analizando la combinación de los tres


criterios (última fila de la tabla 6-15) podemos observar que destacan el 53,8% de los
parámetros de perturbación y energía en la base de datos femenina (7 de 13) y el
38,5% en la masculina (5 de 13), con todas las bandas de energía de la onda mucosa
incluidas en ambos casos. Entre los parámetros biométricos destacan el 31,2% de los
parámetros analizados en las dos bases de datos (5 de 16). En cuanto a los parámetros
biomecánicos, en la base de datos femenina destacan el 83,3% (10 de 12), por el 58,3%
en la masculina (7 de 12), con todos los desbalances de los elementos biomecánicos
incluidos en ambos casos. Por último, en ninguna de las dos bases de datos destaca
ninguno de los cinco parámetros temporales analizados.

6.1.3. Resultados de las pruebas de diferencia en las distribuciones

Las pruebas que hemos realizado relacionadas con la búsqueda de la diferencia


entre los grupos normofónico y patológico se pueden agrupar por parejas. En efecto, la
prueba de Levene mide la igualdad de varianzas u homocedasticidad, cosa que

108
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

también hace el contraste no paramétrico de Moses. La diferencia de medias es


controlada mediante la prueba t de Student, y también mediante el contraste no
paramétrico de Mann-Whitney. Por último, de la diferencia general entre las
distribuciones utilizando diferentes propiedades estadísticas se ocupan tanto la prueba
de Kolmogorov-Smirnov para dos muestras como el contraste de Wald-Wolfowitz. El
detalle de los cálculos estadísticos de la prueba de Levene aparecen en el apéndice 2-
4. El detalle de los cálculos estadísticos de la prueba t de Student aparece en el
apéndice tres. El detalle de los cálculos estadísticos de las demás pruebas, todas ellas
no paramétricas, figura en el apéndice cuatro.

Analizaremos en primer lugar las pruebas t de Student y la prueba de Mann-


Whitney. La tabla 6-16 presenta un listado de los parámetros en los que la diferencia
de medias entre los grupos patológico y normofónico resulta ser significativa, y
permite comparar tanto los dos procedimientos estadísticos como las dos bases de
datos empleadas. En primer lugar mostraremos algunos resultados generales, después
pasaremos a comentar datos relacionados con cada una de las familias de los
parámetros y terminaremos mencionando datos comparativos entre ambas técnicas y
entre ambas bases de datos. Seguiremos este esquema en los tres estudios realizados:

- El 85,1% de los parámetros de la base de datos femenina presentan una diferencia


de medias significativa, tanto en la prueba t de Student como en la prueba de
Mann-Whitney.
- En la base de datos masculina este valor alcanza el 74,5%, también en ambas
pruebas.

- Parámetros de perturbación o energía: en la base de datos femenina son


significativos 11 de los 14 parámetros según la prueba t de Student y 10 de los 14
parámetros según la prueba de Mann-Whitney. En la base de datos masculina son
significativos 11 de los 14 parámetros según la prueba t de Student y 10 de los 14
parámetros según la prueba de Mann-Whitney.
- Parámetros biométricos: en la base de datos femenina son significativos 14 de los
16 parámetros según la prueba t de Student y también 14 de los 16 parámetros
según la prueba de Mann-Whitney. En la base de datos masculina son significativos
11 de los 16 parámetros según la prueba t de Student y 12 de los 16 parámetros
según la prueba de Mann-Whitney.
- Parámetros biomecánicos: en la base de datos femenina son significativos 10 de los
12 parámetros según la prueba t de Student y 11 de los 12 parámetros según la
prueba de Mann-Whitney. En la base de datos masculina son significativos 10 de
los 12 parámetros según la prueba t de Student y 11 de los 12 parámetros según la
prueba de Mann-Whitney.
- Parámetros temporales: en la base de datos femenina son significativos todos los
parámetros (5 de 5) según la prueba t de Student y lo mismo sucede según la
prueba de Mann-Whitney. En la base de datos masculina son significativos 3 de los
5 parámetros según la t de Student y 2 de los 5 parámetros según la prueba de
Mann-Whitney.

109
Capítulo 6: Experimentación y resultados

- La prueba t de Student y la prueba de Mann-Whitney presentan en la base de


datos femenina un 95,6% de coincidencias, mientras que en la base de datos
masculina coinciden los resultados del 91,5% de los parámetros.
- Las bases de datos masculina y femenina coinciden en el resultado del 80,8% de los
parámetros en la prueba t de Student y en el del 76,6% en la prueba de Mann-
Whitney.

Tabla 6-16. Rechazo de la hipótesis de igualdad de medias según las pruebas t de Student
y Mann-Whitney en las bases de datos femenina y masculina para todos los parámetros.
Nº Parámetro t-Student Mann- T-Student Mann-
Femenino Whitney Masculino Whitney
Femenino Masculino
1 Pitch X X X
2 Jitter X X X X
3 Shimmer asociado a la amplitud X X X X
4 Shimmer asociado a la esbeltez X X
5 Shimmer asociado al área X X X X
6 Amplitud Pico de Cierre Glótico / Vecinos
7 Esbeltez Pico de Cierre Glótico / Vecinos X
8 Energía MWC/AAW
9 2º Arm. / Frecuencia Fundamental MWC X X X X
10 2º Arm. / 1er Arm. Onda Mucosa X X X X
11 Primera banda de energía de la MWC X X X X
12 Segunda banda de energía de la MWC X X X X
13 Tercera banda de energía de la MWC X X X X
14 Cuarta banda de energía de la MWC X X X X
15 Amp. del origen de la señal (valor relativo) X X X X
17 Amp. del primer máximo (valor absoluto) X X
18 Amp. del primer mínimo (valor relativo) X X X X
19 Amp. del segundo máximo (valor relativo) X X X X
21 Amp. del segundo mínimo (valor relativo) X X X X
22 Amp. del cuarto máximo (valor relativo) X X X X
23 Amp. del final de la señal (valor relativo) X X X X
24 Frec. del origen de la señal (valor relativo) X X X X
26 Frec. del primer máximo (valor absoluto) X X X X
27 Frec. del primer mínimo (valor relativo) X X X X
28 Frec. del segundo máximo (valor relativo) X X X X
30 Frec. del segundo mínimo (valor relativo) X X
31 Frec. del cuarto máximo (valor relativo) X X
32 Frec. del final de la señal (valor relativo) X X X
33 Esbeltez correspondiente al primer surco
34 Esbeltez correspondiente al segundo surco X X
35 Masa del cuerpo X
36 Pérdida del cuerpo X X X X
37 Elasticidad del cuerpo X
38 Desbalance de la masa del cuerpo X X X X
39 Desbalance de la pérdida del cuerpo X X X X
40 Desbalance de la elasticidad del cuerpo X X X X
41 Masa de la cubierta X X X X
42 Pérdida de la cubierta X X X X
43 Elasticidad de la cubierta X X X X
44 Desbalance de la masa de la cubierta X X X X
45 Desbalance de la pérdida de la cubierta X X X X
46 Desbalance de la elasticidad de la cubierta X X X X

110
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Nº Parámetro T-Student Mann- T-Student Mann-


Femenino Whitney Masculino Whitney
Femenino Masculino
47 Punto de Apertura X X X X
48 Punto de Cierre X X
49 Punto de Recuperación X X X
50 Posición 1er Máximo Onda Mucosa X X X X
o
51 Posición 2 Máximo Onda Mucosa X X

En segundo lugar analizaremos las pruebas de Kolmogorov-Smirnov para dos


muestras independientes y la prueba de las rachas de Wald-Wolfowitz (pruebas de
Kolmogorov-Smirnov y de Wald-Wolfowitz en el resto del subapartado). La tabla 6-17
presenta los parámetros en los que la diferencia de distribuciones entre los grupos
patológico y normofónico resulta ser significativa, y permite comparar los dos
procedimientos estadísticos, así como las dos bases de datos empleadas.

- El 83% de los parámetros de la base de datos femenina presenta una diferencia de


distribuciones significativa en la prueba de Kolmogorov-Smirnov, mientras que el
68,1% lo hace en la prueba de Wald-Wolfowitz.
- El 70,2% de los parámetros de la base de datos masculina presenta una diferencia
de distribuciones significativa en la prueba de Kolmogorov-Smirnov, mientras que
el 66% de los parámetros lo hace en la prueba de Wald-Wolfowitz.

- Parámetros de perturbación o energía: en la base de datos femenina son


significativos 10 de los 14 parámetros según la prueba de Kolmogorov-Smirnov y 7
de los 14 parámetros según la prueba de Wald-Wolfowitz. En la base de datos
masculina son significativos 11 de los 14 parámetros según la prueba de
Kolmogorov-Smirnov y 7 de los 14 parámetros según la prueba de Wald-Wolfowitz.
- Parámetros biométricos: en la base de datos femenina son significativos 13 de los
16 parámetros según la prueba de Kolmogorov-Smirnov y 11 de los 16 parámetros
según la prueba de Wald-Wolfowitz. En la base de datos masculina son
significativos 9 de los 16 parámetros según la prueba de Kolmogorov-Smirnov y 11
de los 16 parámetros según la prueba de Wald-Wolfowitz.
- Parámetros biomecánicos: en la base de datos femenina son significativos 11 de los
12 parámetros según la prueba de Kolmogorov-Smirnov y también lo son 11 de los
12 parámetros según la prueba de Wald-Wolfowitz. En la base de datos masculina
son significativos 11 de los 12 parámetros según la prueba de Kolmogorov-Smirnov
y 10 de los 12 parámetros según la prueba de Wald-Wolfowitz.
- Parámetros temporales: en la base de datos femenina son significativos los 5
parámetros en estudio según la prueba de Kolmogorov-Smirnov y 3 de los 5
parámetros según la prueba de Wald-Wolfowitz. En la base de datos masculina son
significativos 2 de los 5 parámetros según la prueba de Kolmogorov-Smirnov y 3 de
los 5 parámetros según la prueba de Wald-Wolfowitz.

- La prueba de Kolmogorov-Smirnov y la prueba de Wald-Wolfowitz presentan en la


base de datos femenina un 68,1% de coincidencias, mientras que en la base de
datos masculina coinciden los resultados del 78,7% de los parámetros.

111
Capítulo 6: Experimentación y resultados

- Las bases de datos masculina y femenina coinciden en el resultado del 70,2% de los
parámetros en la prueba de Kolmogorov-Smirnov y en el del 76,6% en la prueba de
Wald-Wolfowitz.

Tabla 6-17. Rechazo de la hipótesis de igualdad de distribuciones según las pruebas de


Kolmogorov-Smirnov (K-S) para dos muestras independientes y de las rachas de Wald-Wolfowitz
(W-W) en las bases de datos femenina y masculina para todos los parámetros.
Nº Parámetro K-S W-W K-S W-W
Feme- Feme- Mascu- Mascu-
nino nino lino lino
1 Pitch X
2 Jitter X X X X
3 Shimmer asociado a la amplitud X X
4 Shimmer asociado a la esbeltez X X
5 Shimmer asociado al área X X
6 Razón Amplitud Pico de Cierre Glótico / Vecinos
7 Razón Esbeltez Pico de Cierre Glótico / Vecinos X X X
8 Razón Energía MWC/AAW X
9 2º Arm. / Frecuencia Fundamental Onda Mucosa X X
er
10 2º Arm. / 1 Arm. Onda Mucosa X X
11 Primera banda de energía de la Onda Mucosa X X X X
12 Segunda banda de energía de la Onda Mucosa X X X X
13 Tercera banda de energía de la Onda Mucosa X X X X
14 Cuarta banda de energía de la Onda Mucosa X X X X
15 Amplitud del origen de la señal (valor relativo) X X X
17 Amplitud del primer máximo (valor absoluto) X X
18 Amplitud del primer mínimo (valor relativo) X X X X
19 Amplitud del segundo máximo (valor relativo) X X X X
21 Amplitud del segundo mínimo (valor relativo) X X X X
22 Amplitud del cuarto máximo (valor relativo) X X X X
23 Amplitud del final de la señal (valor relativo) X X X X
24 Frecuencia del origen de la señal (valor relativo) X X
26 Frecuencia del primer máximo (valor absoluto) X X
27 Frecuencia del primer mínimo (valor relativo) X X X X
28 Frecuencia del segundo máximo (valor relativo) X X X X
30 Frecuencia del segundo mínimo (valor relativo) X X
31 Frecuencia del cuarto máximo (valor relativo) X
32 Frecuencia del final de la señal (valor relativo) X X
33 Esbeltez correspondiente al primer surco X
34 Esbeltez correspondiente al segundo surco X
35 Masa del cuerpo X X
36 Pérdida del cuerpo X X X X
37 Elasticidad del cuerpo X X
38 Desbalance de la masa del cuerpo X X X X
39 Desbalance de la pérdida del cuerpo X X X X
40 Desbalance de la elasticidad del cuerpo X X X X
41 Masa de la cubierta X X X X
42 Pérdida de la cubierta X X X
43 Elasticidad de la cubierta X X X X
44 Desbalance de la masa de la cubierta X X X X
45 Desbalance de la pérdida de la cubierta X X X X
46 Desbalance de la elasticidad de la cubierta X X X X
47 Punto de Apertura X X X X
48 Punto de Cierre X X X

112
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Nº Parámetro K-S W-W K-S W-W


Feme- Feme- Mascu- Mascu-
nino nino lino lino
49 Punto de Recuperación X
er
50 Posición 1 Máximo Onda Mucosa X X X
51 Posición 2o Máximo Onda Mucosa X X

En tercer lugar analizaremos las pruebas de Levene de la varianza y la prueba de las


reacciones extremas de Moses (pruebas de Levene y de Moses en el resto del
subapartado). La tabla 6-18 presenta los parámetros en los que la diferencia de
varianzas entre los grupos patológico y normofónico resulta ser significativa, y permite,
como en los casos anteriores, comparar los dos procedimientos estadísticos y también
las dos bases de datos utilizadas.

- El 57,4% de los parámetros de la base de datos femenina presentan una diferencia


de varianzas significativa en la prueba de Levene, mientras que el 76,6% lo hacen
en la prueba de Moses.
- El 59,6% de los parámetros de la base de datos masculina presentan una diferencia
de varianzas significativa en la prueba de Levene, mientras que el 72,3% de los
parámetros lo hace en la prueba de Moses.

- Parámetros de perturbación o energía: en la base de datos femenina son


significativos 8 de los 14 parámetros según la prueba de Levene y 9 de los 14
parámetros según la prueba de Moses. En la base de datos masculina son
significativos 8 de los 14 parámetros según la prueba de Levene, y también 8 de los
14 parámetros según la prueba de Moses.
- Parámetros biométricos: en la base de datos femenina son significativos 6 de los 16
parámetros según la prueba de Levene y 11 de los 16 parámetros según la prueba
de Moses. En la base de datos masculina son significativos 7 de los 16 parámetros
según la prueba de Levene y 11 de los 16 parámetros según la prueba de Moses.
- Parámetros biomecánicos: en la base de datos femenina son significativos 10 de los
12 parámetros según la prueba de Levene y también lo son los 12 parámetros
según la prueba de Moses. En la base de datos masculina son significativos 9 de los
12 parámetros según la prueba de Levene y 11 de los 12 parámetros según la
prueba de Moses.
- Parámetros temporales. En la base de datos femenina son significativos 3 de los 5
parámetros según la prueba de Levene y 4 de los 5 parámetros según la prueba de
Moses. En la base de datos masculina son significativos 4 de los 5 parámetros
según la prueba de Levene y también 4 de los 5 parámetros según la prueba de
Moses.

- La prueba de Levene y la prueba de Moses presentan en la base de datos femenina


un 76,6% de coincidencias, mientras que en la base de datos masculina coinciden
los resultados del 83% de los parámetros.
- Las bases de datos masculina y femenina coinciden en el resultado del 76,6% de los
parámetros en la prueba de Levene y en el del 80,8% en la prueba de Moses.

113
Capítulo 6: Experimentación y resultados

Tabla 6-18. Rechazo de la hipótesis de igualdad de varianzas según las pruebas de


Levene de la varianza y de las reacciones extremas de Moses en las bases de datos
femenina y masculina para todos los parámetros.
Nº Parámetro Levene Moses Levene Moses
Feme- Feme- Mascu- Mascu-
nino nino lino lino

1 Pitch X
2 Jitter X X X X
3 Shimmer asociado a la amplitud
4 Shimmer asociado a la esbeltez
5 Shimmer asociado al área
6 Razón Amplitud Pico de Cierre Glótico / Vecinos X
7 Razón Esbeltez Pico de Cierre Glótico / Vecinos X X X X
8 Razón Energía MWC/AAW X X
9 2º Arm. / Frecuencia Fundamental Onda Mucosa X X X X
10 2º Arm. / 1er Arm. Onda Mucosa X X
11 Primera banda de energía de la Onda Mucosa X X X
12 Segunda banda de energía de la Onda Mucosa X X X X
13 Tercera banda de energía de la Onda Mucosa X X X X
14 Cuarta banda de energía de la Onda Mucosa X X X X
15 Amplitud del origen de la señal (valor relativo) X X X X
17 Amplitud del primer máximo (valor absoluto) X X X X
18 Amplitud del primer mínimo (valor relativo) X X
19 Amplitud del segundo máximo (valor relativo) X X X
21 Amplitud del segundo mínimo (valor relativo) X X
22 Amplitud del cuarto máximo (valor relativo) X X
23 Amplitud del final de la señal (valor relativo) X X X X
24 Frecuencia del origen de la señal (valor relativo) X X X X
26 Frecuencia del primer máximo (valor absoluto) X X X X
27 Frecuencia del primer mínimo (valor relativo) X X
28 Frecuencia del segundo máximo (valor relativo) X X
30 Frecuencia del segundo mínimo (valor relativo)
31 Frecuencia del cuarto máximo (valor relativo)
32 Frecuencia del final de la señal (valor relativo) X
33 Esbeltez correspondiente al primer surco
34 Esbeltez correspondiente al segundo surco X
35 Masa del cuerpo X
36 Pérdida del cuerpo X X X X
37 Elasticidad del cuerpo X X
38 Desbalance de la masa del cuerpo X X X X
39 Desbalance de la pérdida del cuerpo X X X X
40 Desbalance de la elasticidad del cuerpo X X X X
41 Masa de la cubierta X X X X
42 Pérdida de la cubierta X X X X
43 Elasticidad de la cubierta X X X
44 Desbalance de la masa de la cubierta X X X X
45 Desbalance de la pérdida de la cubierta X X X X
46 Desbalance de la elasticidad de la cubierta X X X X
47 Punto de Apertura X X X X
48 Punto de Cierre X X
49 Punto de Recuperación X X
er
50 Posición 1 Máximo Onda Mucosa X X X
o
51 Posición 2 Máximo Onda Mucosa X X X X

114
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Hemos realizado seis pruebas estadísticas que tienen como objetivo analizar los
parámetros glóticos en estudio, buscando aquellos cuya distribución sea diferente en
el caso de que la muestra obtenida corresponda a sujetos con patología vocal y en el
caso de que corresponda a sujetos normofónicos. Las pruebas miden diferentes
aspectos de la distribución: media, varianza, simetría, etcétera, y aunque son
independientes unas de otras también tienen un carácter complementario, por lo que
resulta de interés destacar aquellos parámetros que indican diferencia en todas las
pruebas realizadas: podemos observar los correspondientes a la base de datos
femenina en la tabla 6-19, y los correspondientes a la base de datos masculina en la
tabla 6-20. Estos parámetros serán considerados como los mejores de este estudio de
cara a su uso en el análisis discriminante, cuyos resultados podemos ver en el apartado
6-3. Por su parte, los parámetros con códigos 4 y 8 (Shimmer asociado a la esbeltez y
Razón Energía Onda Mucosa (MWC) / Onda Acústica Promedio (AAW),
respectivamente) no indican diferencia en ninguna de las pruebas realizadas para la
base de datos femenina, razón por la cual serán considerados como los peores de este
estudio, también de cara a su uso en el análisis discriminante. Lo mismo sucede para la
base de datos masculina con los parámetros de códigos 6, 30, 31, 33, 34 y 35 (Razón
Amplitud Pico de Cierre Glótico / Vecinos, Frecuencia del segundo mínimo, Frecuencia
del cuarto máximo, Esbeltez correspondiente al primer surco, Esbeltez correspondiente
al segundo surco y Masa del cuerpo, respectivamente).

Tabla 6-19. Listado de parámetros de la base de datos femenina que rechazan la hipótesis
de igualdad en las distribuciones según las seis pruebas realizadas.
Nº Parámetro Nº Parámetro Nº Parámetro
2 Jitter 36 Pérdida cuerpo 45 Desbalance pérdida cubierta
11 1ª banda energía MWC 38 Desbalance masa cuerpo 46 Desb. elasticidad cubierta
12 2ª banda energía MWC 39 Desbalance pérdida cuerpo 47 Punto de Apertura
13 3ª banda energía MWC 40 Desb. elasticidad cuerpo 48 Punto de Cierre
14 4ª banda energía MWC 41 Masa de la cubierta 51 Posición 2o Máx. MWC
22 Amplitud 4º máximo 43 Elasticidad de la cubierta
32 Frecuencia final de la 44 Desbalance masa cubierta
señal

Tabla 6-20. Listado de parámetros de la base de datos masculina que rechazan la hipótesis
de igualdad en las distribuciones según las seis pruebas realizadas.
Nº Parámetro Nº Parámetro Nº Parámetro
2 Jitter 28 Frecuencia 2º máximo 44 Desbalance masa cubierta
12 2ª banda energía MWC 36 Pérdida cuerpo 45 Desbalance pérdida cubierta
13 3ª banda energía MWC 38 Desbalance masa cuerpo 46 Desb. elasticidad cubierta
14 4ª banda energía MWC 39 Desbalance pérdida cuerpo 47 Punto de Apertura
15 Amplitud origen señal 40 Desb. elasticidad cuerpo 50 Posición 1er Máximo MWC
19 Amplitud 2º máximo 41 Masa de la cubierta
23 Amplitud final de la 42 Pérdida de la cubierta
señal

Es destacable el alto número de parámetros en los que las distribuciones de sujetos


normofónicos difieren de las distribuciones de sujetos patológicos para todas las
pruebas realizadas: en la base de datos femenina sucede en el 40,4% de los
parámetros, de acuerdo al siguiente reparto en base a su naturaleza: lo hacen 5 de los
14 parámetros de perturbación o energía, 2 de los 16 parámetros biométricos, 9 de los

115
Capítulo 6: Experimentación y resultados

12 parámetros biomecánicos y 3 de los 5 parámetros temporales. En la base de datos


masculina son el 40% de los parámetros los que presentan diferencias significativas en
las seis pruebas, distribuidos del siguiente modo en base a la naturaleza del
parámetro: ocurre en 4 de los 14 parámetros de perturbación o energía, en 4 de los 16
parámetros biométricos, en 9 de los 12 parámetros biomecánicos y en 2 de los 5
parámetros temporales.

Para concluir el subapartado ofreceremos los resultados de la prueba realizada


relacionada con el tamaño del efecto. En la tabla 6-21 podemos observar el valor
alcanzado para cada parámetro en las bases de datos femenina y masculina.
Utilizaremos en la tabla un código de colores que se corresponde con la escala de
Hopkins, mencionada en el capítulo cinco y que recordaremos brevemente aquí: el
color blanco se corresponde con valores del tamaño del efecto inferiores a 0,20 (para
estos valores la diferencia se considera muy pequeña). El color amarillo se corresponde
con valores del tamaño del efecto comprendidos entre 0,20 y 0,62 (valores para los
cuales la diferencia se considera pequeña). El color naranja se corresponde con valores
del tamaño del efecto comprendidos entre 0,63 y 1,14 (valores para los cuales la
diferencia se considera moderada). El color rojo se corresponde con valores del
tamaño del efecto superiores o iguales a 1,15 (para estos valores la diferencia se
considera grande).

Tabla 6-21. Tamaño del efecto de los parámetros para las bases de datos femenina
y masculina.
Nº Parámetro TAMAÑO DEL TAMAÑO DEL
EFECTO B.D. EFECTO B.D.
FEMENINA MASCULINA
1 Pitch 0,54 -1,86
2 Jitter -1,33 -1,74
3 Shimmer asociado a la amplitud -0,77 0,49
4 Shimmer asociado a la esbeltez -0,31 -0,49
5 Shimmer asociado al área -0,82 0,77
6 Razón Amplitud Pico de Cierre Glótico / Vecinos 0,19 0,66
7 Razón Esbeltez Pico de Cierre Glótico / Vecinos 0,47 0,76
8 Razón Energía MWC/AAW -0,11 0,66
9 2º Arm. / Frecuencia Fundamental Onda Mucosa -0,49 -0,69
er
10 2º Arm. / 1 Arm. Onda Mucosa -0,69 0,29
11 Primera banda de energía de la Onda Mucosa -1,57 0,53
12 Segunda banda de energía de la Onda Mucosa -1,70 -0,21
13 Tercera banda de energía de la Onda Mucosa -1,88 1,62
14 Cuarta banda de energía de la Onda Mucosa -2,01 -0,20
15 Amplitud del origen de la señal (valor relativo) 0,76 -0,88
17 Amplitud del primer máximo (valor absoluto) 0,37 -1,45
18 Amplitud del primer mínimo (valor relativo) -1,11 -1,07
19 Amplitud del segundo máximo (valor relativo) -1,53 -1,19
21 Amplitud del segundo mínimo (valor relativo) -1,64 -0,95
22 Amplitud del cuarto máximo (valor relativo) -1,86 -0,66
23 Amplitud del final de la señal (valor relativo) -1,74 -1,39

116
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Nº Parámetro TAMAÑO DEL TAMAÑO DEL


EFECTO B.D. EFECTO B.D.
FEMENINA MASCULINA
24 Frecuencia del origen de la señal (valor relativo) 0,49 -1,58
26 Frecuencia del primer máximo (valor absoluto) -0,49 -1,21
27 Frecuencia del primer mínimo (valor relativo) 0,77 -1,01
28 Frecuencia del segundo máximo (valor relativo) 0,66 0,62
30 Frecuencia del segundo mínimo (valor relativo) 0,76 -0,53
31 Frecuencia del cuarto máximo (valor relativo) 0,66 -0,57
32 Frecuencia del final de la señal (valor relativo) -0,69 -0,42
33 Esbeltez correspondiente al primer surco 0,29 0,21
34 Esbeltez correspondiente al segundo surco 0,53 0,28
35 Masa del cuerpo -0,21 -0,23
36 Pérdida del cuerpo 1,62 1,55
37 Elasticidad del cuerpo -0,20 -0,39
38 Desbalance de la masa del cuerpo -0,88 -0,75
39 Desbalance de la pérdida del cuerpo -1,45 -1,4
40 Desbalance de la elasticidad del cuerpo -1,07 -0,95
41 Masa de la cubierta -1,19 -0,51
42 Pérdida de la cubierta -0,95 -0,87
43 Elasticidad de la cubierta -0,66 -0,41
44 Desbalance de la masa de la cubierta -1,39 -1,02
45 Desbalance de la pérdida de la cubierta -1,58 -1,28
46 Desbalance de la elasticidad de la cubierta -1,21 -0,91
47 Punto de Apertura -1,01 -0,43
48 Punto de Cierre 0,62 -0,26
49 Punto de Recuperación -0,53 -0,44
50 Posición 1er Máximo Onda Mucosa -0,57 -0,73
51 Posición 2o Máximo Onda Mucosa -0,42 0,17

Podemos observar en la tabla 6-21 que prácticamente todas las familias de


parámetros cuentan con elementos en los que la diferencia entre los grupos patológico
y normofónico es grande. Sólo los parámetros temporales presentan unos valores más
bajos. También podemos apreciar que en la base de datos femenina se registran
diferencias algo mayores.

Las tablas 6-22 y 6-23, que mantienen el código de color empleado en la tabla 6-21
ofrecen nuevamente los listados de parámetros de las bases de datos femenina y
masculina, junto con los valores del tamaño del efecto. Pero en esta ocasión los
parámetros aparecen ordenados, lo que resulta de especial interés: podemos
comprobar cuáles ofrecen una mayor diferencia entre los grupos patológico y
normofónico, estableciendo una comparación entre ellos. En los próximos párrafos
comentaremos algunos aspectos sobre los parámetros que presentan las mayores
diferencias.

117
Capítulo 6: Experimentación y resultados

Tabla 6-22. Parámetros de la base de datos femenina ordenados según el


tamaño del efecto.
Nº Parámetro T.E. Nº Parámetro T.E.
Cuarta banda de energía de la Frecuencia del segundo
14 -2,01 30 0,76
Onda Mucosa mínimo (valor relativo)
Tercera banda de energía de la
13 -1,88 10 2º Arm. / 1er Arm. MWC -0,69
Onda Mucosa
Amplitud del cuarto máximo Frecuencia del final de la
22 -1,86 32 -0,69
(valor relativo) señal (valor relativo)
Amplitud del final de la señal Frecuencia del segundo
23 -1,74 28 0,66
(valor relativo) máximo (valor relativo)
Segunda banda de energía de la Frecuencia del cuarto
12 -1,70 31 0,66
Onda Mucosa máximo (valor relativo)
Amplitud del segundo mínimo
21 -1,64 43 Elasticidad de la cubierta -0,66
(valor relativo)
36 Pérdida del cuerpo 1,62 48 Punto de Cierre 0,62
er
Desbalance de la pérdida de la Posición 1 Máximo Onda
45 -1,58 50 -0,57
cubierta Mucosa
Primera banda de energía de la
11 -1,57 1 Pitch 0,54
Onda Mucosa
Amplitud del segundo máximo Esbeltez correspondiente al
19 -1,53 34 0,53
(valor relativo) segundo surco
Desbalance de la pérdida del
39 -1,45 49 Punto de Recuperación -0,53
cuerpo
Desbalance de la masa de la Frecuencia del origen de la
44 -1,39 24 0,49
cubierta señal (valor relativo)
2º Arm. / Frecuencia
2 Jitter -1,33 9 -0,49
Fundamental MWC
Desbalance de la elasticidad de Frecuencia del primer
46 -1,21 26 -0,49
la cubierta máximo (valor absoluto)
Razón Esbeltez Pico de
41 Masa de la cubierta -1,19 7 0,47
Cierre Glótico / Vecinos
Amplitud del primer mínimo Posición 2o Máximo Onda
18 -1,11 51 -0,42
(valor relativo) Mucosa
Desbalance de la elasticidad del Amplitud del primer
40 -1,07 17 0,37
cuerpo máximo (valor absoluto)
Shimmer asociado a la
47 Punto de Apertura -1,01 4 -0,31
esbeltez
Esbeltez correspondiente al
42 Pérdida de la cubierta -0,95 33 0,29
primer surco
Desbalance de la masa del
38 -0,88 35 Masa del cuerpo -0,21
cuerpo
5 Shimmer asociado al área -0,82 37 Elasticidad del cuerpo -0,20
Frecuencia del primer mínimo Razón Amplitud Pico de
27 0,77 6 0,19
(valor relativo) Cierre Glótico / Vecinos
Relación Energía
3 Shimmer asociado a la amplitud -0,77 8 -0,11
MWC/AAW
Amplitud del origen de la señal
15 0,76
(valor relativo)

En la tabla 6-22 podemos comprobar que en la base de datos femenina los


parámetros de energía relacionados con la onda mucosa ocupan lugares muy
destacados. También destacan algunos parámetros biométricos relacionados con la

118
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

amplitud de la señal considerada (la envolvente de la densidad espectral de potencia


de la fuente glótica), así como algunos parámetros biomecánicos, entre los que
mencionaremos los relacionados con los desbalances de determinados parámetros
respecto a los ciclos de fonación vecinos.
De cara al posterior análisis discriminante (ver apartado 6.3) hay que mencionar
que consideraremos a los parámetros marcados en rojo –diferencia grande– como los
mejores de este estudio, y a los cuatro parámetros con tamaño del efecto más bajo
como los peores del mismo.

Tabla 6-23. Parámetros de la base de datos masculina ordenados según el


tamaño del efecto.
Nº Parámetro T.E. Nº Parámetro T.E.
Amplitud del cuarto máximo
1 Pitch -1,86 22 -0,66
(valor relativo)
Razón Amplitud Pico de
2 Jitter -1,74 6 0,66
Cierre Glótico / Vecinos
Tercera banda de energía de la
13 1,62 8 Razón Energía MWC/AAW 0,66
Onda Mucosa
Frecuencia del origen de la señal Frecuencia del segundo
24 -1,58 28 0,62
(valor relativo) máximo (valor relativo)
Frecuencia del cuarto máximo
36 Pérdida del cuerpo 1,55 31 -0,57
(valor relativo)
Amplitud del primer máximo Primera banda de energía de
17 -1,45 11 0,53
(valor absoluto) la Onda Mucosa
Desbalance de la pérdida del Frecuencia del segundo
39 -1,40 30 -0,53
cuerpo mínimo (valor relativo)
Amplitud del final de la señal
23 -1,39 41 Masa de la cubierta -0,51
(valor relativo)
Desbalance de la pérdida de la Shimmer asociado a la
45 -1,28 3 0,49
cubierta amplitud
Frecuencia del primer máximo Shimmer asociado a la
26 -1,21 4 -0,49
(valor absoluto) esbeltez
Amplitud del segundo máximo
19 -1,19 49 Punto de Recuperación -0,44
(valor relativo)
18 Amp. del 1 er mínimo (valor rel.) -1,07 47 Punto de Apertura -0,43
Desbalance de la masa de la Frecuencia del final de la
44 -1,02 32 -0,42
cubierta señal (valor relativo)
27 Frec. del 1 er mín (valor relativo) -1,01 43 Elasticidad de la cubierta -0,41
Amplitud del segundo mínimo
21 -0,95 37 Elasticidad del cuerpo -0,39
(valor relativo)
Desbalance de la elasticidad del
40 -0,95 10 2º Arm. / 1er Arm. MWC 0,29
cuerpo
Desbalance de la elasticidad de la Esbeltez correspondiente al
46 -0,91 34 0,28
cubierta segundo surco
Amplitud del origen de la señal
15 -0,88 48 Punto de Cierre -0,26
(valor relativo)
42 Pérdida de la cubierta -0,87 35 Masa del cuerpo -0,23
Segunda banda de energía de
5 Shimmer asociado al área 0,77 12 -0,21
la Onda Mucosa
Razón Esbeltez Pico de Cierre Esbeltez correspondiente al
7 0,76 33 0,21
Glótico / Vecinos primer surco
Cuarta banda de energía de la
38 Desbalance de la masa del cuerpo -0,75 14 -0,20
Onda Mucosa
er o
50 Pos. 1 Máximo Onda Mucosa -0,73 51 Pos. 2 Máx. Onda Mucosa 0,17
2º Arm. / Frecuencia
9 -0,69
Fundamental Onda Mucosa

119
Capítulo 6: Experimentación y resultados

En la tabla 6-23 observamos en primer lugar que en la base de datos masculina


contamos con una cantidad menor de parámetros en los que la diferencia entre los
grupos normofónico y patológico es considerada grande. Comprobamos que aparecen
también de forma muy destacada parámetros de perturbación y energía, aunque éstos
últimos tienen menos presencia que en la base de datos femenina. Destacan
igualmente algunos parámetros biométricos, aunque en esta ocasión lo hacen tanto
los relacionados con valores de amplitud como los relacionados con valores de
frecuencia. También aparecen parámetros biomecánicos, con mayor presencia de los
relacionados con desbalances.
Por último, mencionar que de cara al análisis discriminante, cuyos resultados
podemos ver en el apartado 6.3, los parámetros marcados en rojo –diferencia grande–
serán considerados como los mejores de este estudio. Por su parte, los ocho
parámetros cuyo tamaño del efecto cuenta con los valores más bajos serán
considerados como los peores parámetros del estudio.

6.2. Relación entre los parámetros e importancia relativa de los mismos

En este apartado agruparemos las dos técnicas estadísticas empleadas que


permiten profundizar en la relación existente entre los parámetros que forman parte
del estudio: la correlación bivariada y el análisis factorial.

6.2.1. Resultados de las pruebas de correlación bivariada

Al igual que en la mayoría de los análisis realizados en este trabajo hemos llevado a
cabo las pruebas de correlación considerando de forma separada a los sujetos
femeninos y a los sujetos masculinos de la base de datos. Además, para cada uno de
estos dos casos contemplaremos tanto el conjunto total de las muestras como los
subconjuntos de personas con patología vocal y de personas normofónicas.
Los resultados presentados consisten en mostrar una tabla general (6-24 en la base
de datos femenina, 6-42 en la base de datos masculina) en la que podemos apreciar,
para cada parámetro, con cuál de los restantes parámetros se establece una
correlación considerada "alta" (con un índice mayor o igual que 0,6) ó "muy alta" (con
un índice mayor o igual que 0,8), según la escala de Bisquerra (Bisquerra, R., 1987). La
prueba realizada fue la de τ-Kendall, tal y como explicamos en el capítulo cinco.

Tabla 6-24. Correlaciones consideradas altas y muy altas presentes en la


base de datos femenina, según la prueba de τ-Kendall.
ALTAS MUY ALTAS
TODOS PATOLÓG. NORMAL TODOS PATOLÓG. NORMAL
001 32,35,37 32,37 - - - 32,35,37
002 36,46 36,38 - 38,39,40 39,40 39,40
003 5 - 44,45 - - 5
004 - - 5,44,45 - - -
005 3,44 - 45 - - 3,44
006 - - - - - -
007 - - - - - -
008 17,42 17,42 17 - - 42

120
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

ALTAS MUY ALTAS


TODOS
PATOLÓG. NORMAL TODOS PATOLÓG. NORMAL
009 - - - 24,26 24,26 -
010 - - - - - -
011 12,13,14 14 - - 12,13 -
012 11,14,23 14 13 13 11,13 -
013 11,23 - 12,14 12,14 11,12,14 -
014 11,12,23 11,12 13 13 13 -
015 - - - - - -
017 8,42 8 8,42 - 42 -
018 19 19 19 - - -
019 18,21,22 18 18,27,28 - - -
021 19 22 22 22 - -
022 19 21 21 21 - -
023 12,13,14 - - - - -
024 - - - 9,26 9,26 -
026 - - - 9,24 9,24 -
027 - - 19 28 28 28
028 30 - - 27 27 27
030 28 - - 31 31 31
031 - - - 30 30 30
032 1,35 1 - - - 1,35,37
033 - - - - - -
034 - - - - - -
035 1,32 - - - - 1,32,37
036 2,38,39,40 2,40 - - 38 -
037 1 1 1 - - 1,32,35
038 36,39 2,39 40 2,40 36,40 -
039 36,38 38,40 - 2,40 2 2,40
040 36,46 36,39 38 2,38,39 2,38 2,39
041 - - - - - -
042 8,17 8 17 - 17 8
043 - - - - - -
044 5,45,46 45,46 3,4,45 - - 5
045 44,46 44 3,4,5,44,46 - - -
046 2,40,44,45 44 45 - - -
047 - - - - - -
048 - - - - - -
049 - - - - - -
050 - - - - - -
051 - - - - - -

A continuación profundizaremos únicamente en el caso en el que la correlación


establecida entre los parámetros sea considerada como "muy alta". Veremos cómo los
diferentes parámetros, en base a esta relación, forman agrupaciones. Hemos
prescindido de las correlaciones consideradas como simplemente "altas" de cara a que
los grupos establecidos no sean tan numerosos y sí más relevantes. En las
agrupaciones de parámetros obtenidas cabe destacar que basta con que un parámetro
presente correlación "muy alta" con alguno de los restantes para ser incluido en el

121
Capítulo 6: Experimentación y resultados

grupo. En ocasiones los grupos de parámetros se repetirán en los tres estudios


realizados (todos los casos, casos patológicos y casos normofónicos), pero en otras
oportunidades no será así, debido a que los parámetros no alcancen el índice de
correlación exigido en alguno de los estudios. Por la misma razón, los parámetros
concretos que forman cada una de las agrupaciones podrán coincidir exactamente en
los tres estudios, o no hacerlo.

En las tablas presentadas a continuación (tablas comprendidas entre la 6-25 y la 6-


41) aparecen los parámetros que, respectivamente, forman parte de los diferentes
agrupamientos obtenidos en cada estudio, junto con los índices de correlación que
presentan entre ellos, para la base de datos femenina. También se incluyen en las
tablas los índices de correlación parcial correspondientes, que darán lugar a un breve
comentario cualitativo sobre la influencia que terceras variables puedan tener sobre
las relaciones analizadas. Los índices de correlación entre los parámetros se dan,
dentro de las celdas de las tablas, en la primera cifra (antes de la barra /), mientras que
los índices de correlación parcial se ofrecen en la segunda cifra (después de la barra).

 PRIMER GRUPO.

Tabla 6-25. Observamos una fuerte relación entre el Jitter


(002), Desbalance de la masa del cuerpo (038), Desbalance de
la pérdida del cuerpo (039) y Desbalance de la elasticidad del
cuerpo (040), en la base de datos femenina, todos los casos.
PAR.002 PAR.038 PAR.039 PAR.040
PAR.002 1
PAR.038 0,810/0,320 1
PAR.039 0,930/0,638 0,766/0,507 1
PAR.040 0,932/0,489 0,860/0,982 0,888/0,348 1

En la tabla 6-25, referida a todos los casos, observamos que la relación establecida
entre los parámetros 038-040 no depende de terceras variables. Las relaciones
establecidas entre los parámetros 002-040, 038-039 y 002-039 sí presentan un cierto
grado de dependencia de terceras variables (menor en el último caso). Por último, las
relaciones establecidas entre los parámetros 002-038 y 039-040 presentan un grado de
dependencia de terceras variables bastante elevado.

Tabla 6-26. Observamos una fuerte relación entre el Jitter (002), Desbalance de la
masa del cuerpo (038), Desbalance de la pérdida del cuerpo (039), Desbalance de la
elasticidad del cuerpo (040) y Pérdida del cuerpo (036) en la base de datos femenina,
casos patológicos.
PAR.002 PAR.038 PAR.039 PAR.040 PAR.036
PAR.002 1
PAR.038 0,755/0,715 1
PAR.039 0,823/0,689 0,601/0,006 1
PAR.040 0,846/0,797 0,895/0,991 0,706/0,116 1
PAR.036 0,627/. 0,843/. 0,474/0,072 0,758/0,686 1

122
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

En la tabla 6-26, referida a los casos patológicos, observamos en primer lugar que el
parámetro 036 se ha incorporado a la agrupación. Además, podemos comprobar que
las relaciones 002-038, 002-039, 002-040 y 036-040 no dependen en gran medida de
terceras variables, y que en las relaciones establecidas entre los parámetros 038-039,
039-040 y 036-039 se detecta una fuerte dependencia de terceras variables, muy
especialmente en el primer caso (relación prácticamente espuria). Por último,
comprobamos que la relación establecida entre los parámetros 038-040 no depende
en absoluto de terceras variables.

Tabla 6-27. Observamos una fuerte relación entre el


Jitter (002), Desbalance de la pérdida del cuerpo
(039) y Desbalance de la elasticidad del cuerpo (040)
en la base de datos femenina, casos normofónicos.
PAR.002 PAR.039 PAR.040
PAR.002 1
PAR.039 0,924/0,674 1
PAR.040 0,916/0,334 0,890/0,466 1

La tabla 6-27, referida a los casos normofónicos, sólo incluye a los parámetros 002,
039 y 040 y en ella observamos que todas las relaciones (002-039, 002-040 y 039-040)
se ven bastante influidas por la presencia de terceras variables, aunque esta influencia
es menor en el caso de la relación establecida entre los parámetros 002 y 039.

 SEGUNDO GRUPO.

Tabla 6-28. Observamos una fuerte relación


entre los parámetros 2º Arm./Frecuencia
Fundamental MWC (009), Frecuencia del
origen de la señal (024) y Frecuencia del primer
máximo (026), en la base de datos femenina,
todos los casos.
PAR.009 PAR.024 PAR.026
PAR.009 1
PAR.024 -0,999/0 1
PAR.026 1/1 -0,999/0 1

Tabla 6-29. Observamos una fuerte relación


entre los parámetros 2º Arm./Frecuencia
Fundamental MWC (009), Frecuencia del origen
de la señal (024) y Frecuencia del primer
máximo (026), en la base de datos femenina,
casos patológicos.
PAR.009 PAR.024 PAR.026
PAR.009 1
PAR.024 -0,999/0 1
PAR.026 1/1 -0,999/0 1

123
Capítulo 6: Experimentación y resultados

En las tablas 6-28 y 6-29 (referidas a todos los casos y a los casos patológicos,
respectivamente) observamos un comportamiento idéntico: la relación que se
establece ente los parámetros 009 y 026 no se ve en absoluto afectada por terceras
variables, mientras que las relaciones que se establecen entre los parámetros 009-024
y 024-026 aparecen como totalmente espurias.

En cuanto a los casos normofónicos, los tres parámetros en cuestión presentan un


valor constante para todos los sujetos.

 TERCER GRUPO.

Tabla 6-30. Observamos una fuerte


relación entre los parámetros Frecuencia
del primer mínimo (027) y Frecuencia del
segundo máximo (028), en la base de
datos femenina, todos los casos.
PAR.027 PAR.028
PAR.027 1
PAR.028 0,867/0,562 1

Tabla 6-31. Observamos una fuerte


relación entre los parámetros Frecuencia
del primer mínimo (027) y Frecuencia del
segundo máximo (028), en la base de
datos femenina, casos patológicos.
PAR.027 PAR.028
PAR.027 1
PAR.028 0,825/0,442 1

Tabla 6-32. Observamos una fuerte


relación entre los parámetros
Frecuencia del primer mínimo (027) y
Frecuencia del segundo máximo (028),
en la base de datos femenina, casos
normofónicos.
PAR.027 PAR.028
PAR.027 1
PAR.028 0,905/790 1

Las tablas 6-30, 6-31 y 6-32 ofrecen una estructura similar. En los tres estudios
(todos los sujetos, sujetos patológicos y sujetos normofónicos, respectivamente) la
correlación que presentan los parámetros se ve afectada cuando consideramos la
influencia del resto de las variables, aunque no de un modo especialmente grande. En
particular, en el tercero de los casos (sujetos normofónicos) la influencia es
relativamente pequeña.

124
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

 CUARTO GRUPO.

Tabla 6-33. Observamos una fuerte relación entre los


parámetros Segunda banda de energía de la MWC
(012), Tercera banda de energía de la MWC (013) y
Cuarta banda de energía de la MWC (014), en la base de
datos femenina, todos los casos.
PAR.012 PAR.013 PAR.014
PAR.012 1
PAR.013 0,829/0,670 1
PAR.014 0,781/0,342 0,858/0,697 1

La tabla 6-33, referida a todos los casos, indica que las relaciones existentes entre
los parámetros 012-013 y 013-014 se ven moderadamente afectadas por la presencia
de terceras variables. La relación entre los parámetros 012-014, en cambio, se ve
bastante más influida por esta presencia.

Tabla 6-34. Observamos una fuerte relación entre los parámetros


Segunda banda de energía de la MWC (012), Tercera banda de energía
de la MWC (013), Cuarta banda de energía de la MWC (014) y Primera
banda de energía de la MWC (011), en la base de datos femenina, casos
patológicos.
PAR.012 PAR.013 PAR.014 PAR.011
PAR.012 1
PAR.013 0,902/0,941 1
PAR.014 0,782/0,890 0,828/0,958 1
PAR.011 0,812/0,629 0,808/0,359 0,725/0,341 1

La tabla 6-34, referida a los casos patológicos, incorpora al grupo el parámetro 011,
e indica que las relaciones existentes entre los parámetros 012-013, 012-014 y 013-014
no se ven afectadas por la presencia de terceras variables. La relación entre los
parámetros 012-011 lo hace de forma moderada. Por último, las relaciones entre los
parámetros 011-013 y 011-014 están bastante influidas por la presencia de terceras
variables.

En los casos normofónicos la correlación que se establece entre estos parámetros


sólo es considerada como máximo "alta" según la escala de Bisquerra (Bisquerra, R.,
1987), por lo que de acuerdo al criterio adoptado y comentado en la introducción del
apartado14 no se profundizará en el estudio.

14
Recordemos aquí que la razón de no considerar las correlaciones menores reside en que favorecemos
el análisis de un número de casos más reducido, además de más relevantes.

125
Capítulo 6: Experimentación y resultados

 QUINTO GRUPO.

Tabla 6-35. Observamos una fuerte


relación entre los parámetros Amplitud
del segundo mínimo (021) y Amplitud del
cuarto máximo 022), en la base de datos
femenina, todos los casos.
PAR.021 PAR.022
PAR.021 1
PAR.022 0,838/0,813 1

La tabla 6-35, referida al conjunto de todos los casos, indica que la relación
existente entre los parámetros 021-022 apenas depende de la influencia de terceras
variables.

En los casos patológicos y normofónicos la correlación que se establece entre estos


parámetros sólo es considerada "alta", por lo que no alcanza el valor estipulado y no se
profundizará en el estudio en ninguno de los dos casos.

 SEXTO GRUPO.

Tabla 6-36. Observamos una fuerte


relación entre los parámetros Frecuencia
del segundo mínimo (030) y Frecuencia del
cuarto máximo (031), en la base de datos
femenina, todos los casos.
PAR.030 PAR.031
PAR.030 1
PAR.031 0,894/0,881 1

Tabla 6-37. Observamos una fuerte relación


entre los parámetros Frecuencia del segundo
mínimo (030) y Frecuencia del cuarto máximo
(031), en la base de datos femenina, casos
patológicos.
PAR.030 PAR.031
PAR.030 1
PAR.031 0,884/0,179 1

Tabla 6-38. Observamos una fuerte relación


entre los parámetros Frecuencia del segundo
mínimo (030) y Frecuencia del cuarto máximo
(031), en la base de datos femenina, casos
normofónicos.
PAR.030 PAR.031
PAR.030 1
PAR.031 0,920/730 1

126
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

La tabla 6-36, referida al conjunto de todos los casos, indica que la relación
existente entre los parámetros 030-031 apenas se ve influida por la presencia de
terceras variables. En cambio, con los mismos parámetros, la tabla 6-37 indica que,
para los casos patológicos la influencia de terceras variables es muy fuerte. Por último,
la tabla 6-38 indica que los casos normofónicos la influencia de terceras variables
existe, pero no es demasiado grande.

 SÉPTIMO GRUPO.

Tabla 6-39. Observamos una fuerte relación


entre los parámetros Amplitud del primer
máximo (017) y Pérdida de la cubierta (042), en
la base de datos femenina, casos patológicos.
PAR.017 PAR.042
PAR.017 1
PAR.042 0,830/0,951 1

La tabla 6-39, referida a los casos patológicos, indica que la relación existente entre
los parámetros 017-042 no se ve influida por la presencia de terceras variables.
En los casos normofónicos y en el conjunto de todos los casos la correlación que se
establece entre estos parámetros no alcanza el valor estipulado, por lo que no se
profundizará en el estudio en ninguno de los dos casos.

 OCTAVO GRUPO.

Tabla 6-40. Observamos una fuerte relación entre los parámetros


Pitch (001), Frecuencia final (032), Masa del cuerpo (035) y Elasticidad
del cuerpo (037), base de datos femenina, casos normofónicos.
PAR.001 PAR.032 PAR.035 PAR.037
PAR.001 1
PAR.032 0,850/0,368 1
PAR.035 0,965/0,503 0,857/0,192 1
PAR.037 0,962/0,966 0,820/0,316 0,928/0,280 1

La tabla 6-40, referida a los casos normofónicos, indica que la relación existente
entre los parámetros 001-037 no se ve afectada por la presencia de terceras variables.
Las relaciones establecidas entre los parámetros 001-035, 001-032 y 032-037 sí se ven
bastante afectadas, y aún alcanzamos un grado mayor de influencia por parte de
terceras variables en las relaciones establecidas entre los parámetros 035-037 y 032-
035.
En el conjunto de todos los casos la correlación que se establece entre estos
parámetros no alcanza el valor estipulado. Lo mismo sucede en los casos patológicos,
por lo que no se profundizará en el estudio en ninguno de los dos casos.

127
Capítulo 6: Experimentación y resultados

 NOVENO GRUPO.

Tabla 6-41. Observamos una fuerte relación entre los


parámetros Shimmer en amplitud (003), Shimmer en
área (005) y Desbalance en masa de la cubierta (044),
en la base de datos femenina, casos normofónicos.
PAR.003 PAR.005 PAR.044
PAR.003 1
PAR.005 0,802/0,549 1
PAR.044 0,794/0,036 0,812/0,767 1

La tabla 6-41, referida a los casos normofónicos, indica que la relación existente
entre los parámetros 003-044 se ve muy afectada por la presencia de terceras
variables. En cambio, la relación existente entre los parámetros 005 y 044 no se ve
apenas afectada por la presencia de terceras variables. Por último, la relación existente
entre los parámetros 003 y 005 se ve moderadamente afectada por la presencia de
terceras variables.

En el conjunto de todos los casos la correlación que se establece entre estos


parámetros sólo es considerada "alta", y en los casos patológicos es aún menor, por lo
que no se profundizará en el estudio en ninguno de los dos casos.

 DÉCIMO GRUPO.

Tabla 6-42. Observamos una fuerte


relación entre los parámetros Energía
MWC/AAW (008) y Pérdida de la
cubierta (042), en la base de datos
femenina, casos normofónicos.
PAR.008 PAR.042
PAR.008 1
PAR.042 0,830/0,698 1
La tabla 6-42, referida a los casos normofónicos, indica que la relación existente
entre los parámetros 008-042 no se ve demasiado afectada por la presencia de
terceras variables.

Tanto en el conjunto de todos los casos como en los casos patológicos la correlación
establecida entre estos parámetros no alcanza el valor estipulado, por lo que no se
profundizará en el estudio en ninguno de los dos casos.

128
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

A continuación podemos observar los resultados obtenidos en la base de datos


masculina en la tabla 6-43:

Tabla 6-43. Correlaciones consideradas altas y muy altas presentes en la base


de datos masculina, según la prueba de τ-Kendall.
ALTA MUY ALTA
TODOS PATOLÓG. NORMAL TODOS PATOLÓG. NORMAL
001 32,35 32,35,37 - 37 - 32,35,37
002 36,38 36,38 - 39,40 39,40 39,40
003 5 5 4,5,44,45 - - -
004 5 - 3,5,44,45,46 - - -
005 3,4 3 3,4,44,45,46 - - -
006 - - - - - -
007 - - - - - -
008 - 17,42 - - - -
009 - - - 24,26 24,26 -
010 - - - - - -
011 12,13 12,13 - - - -
012 11,14 11,14 13 13 13 -
013 11,23 11,14 12,14,23 12,14 12 -
014 12,23 12,13,23 13,23 13 - -
015 - - - - - -
017 42 8,42 - - - -
018 19 19 33 - - -
019 18 18 - - - -
021 22 22 - - - -
022 21 21 - - - -
023 13,14 14 13,14 - - -
024 - - - 9,26 9,26 -
026 - - - 9,24 9,24 -
027 28 28,30,31 28 - - -
028 27,30,31 27,30,31 27 - - -
030 28 27,28 - 31 31 31
031 28 27,28 - 30 30 30
032 1,35,37 1,37 37 - - 1,35
033 - - 18 - - -
034 - - - - - -
035 1,32,37 1 - - - 1,32,37
036 2,38,39,40 2,39,40 - - 38 -
037 32,35 1,32 32 1 - 1,35
038 2,36,39 2,39 - 40 36,40 -
039 36,38 36,38 - 2,40 2,40 2,40
040 36 36 - 2,38,39 2,38,39 2,39
041 - - - - - -
042 17 8,17 - - - -
043 - - - - - -
044 45,46 - 3,4,5,45,46 - - -
045 44,46 - 3,4,5,44,46 - - -
046 44,45 - 4,5,44,45 - - -
047 - - - - - -

129
Capítulo 6: Experimentación y resultados

ALTA MUY ALTA


TODOS PATOLÓG. NORMAL TODOS PATOLÓG. NORMAL
048 - - - - - -
049 - - - - - -
050 - - - - - -
051 - - - - - -

Del mismo modo que en la base de datos femenina, en la base de datos masculina
también hemos identificado bloques de parámetros relacionados atendiendo a la
correlación considerada como muy alta según Bisquerra (Bisquerra, R., 1987).
Podemos observarlos en las tablas comprendidas entre la 6-44 y la 6-55. En estas
tablas aparecen los índices de correlación calculados entre los diferentes parámetros,
junto con los índices de correlación parcial correspondientes, que, como en la base de
datos anterior, darán lugar a un breve comentario cualitativo sobre la influencia que
terceras variables pudieran tener en las relaciones consideradas.

 PRIMER GRUPO.

Tabla 6-44. Observamos una fuerte relación entre los parámetros


Jitter (002), Desbalance de la masa del cuerpo (038), Desbalance de
la pérdida del cuerpo (039) y Desbalance de la elasticidad del cuerpo
(040), en la base de datos masculina, todos los casos.
PAR.002 PAR.038 PAR.039 PAR.040
PAR.002 1
PAR.038 0,726/0,295 1
PAR.039 0,916/0,731 0,745/0,819 1
PAR.040 0,876/0,181 0,819/0,983 0,908/0,774 1

La tabla 6-44, referida a todos los casos, indica que las relaciones establecidas entre
los parámetros 038-039 y 038-040 no se ven influidas por la presencia de terceras
variables. Sí aparece esta influencia, pero de forma ligera, en las relaciones
establecidas entre los parámetros 002-039 y 039-040. Por último, las relaciones
establecidas entre los parámetros 002-038 y 002-040 aparecen muy influidas por la
presencia de terceras variables.
Tabla 6-45. Observamos una fuerte relación entre los parámetros Jitter (002),
Desbalance de la masa del cuerpo (038), Desbalance de la pérdida del cuerpo (039),
Desbalance de la elasticidad del cuerpo (040) y Pérdida del cuerpo (036), en la base
de datos masculina, casos patológicos.
PAR.002 PAR.038 PAR.039 PAR.040 PAR.036
PAR.002 1
PAR.038 0,748/0,635 1
PAR.039 0,910/0,803 0,773/0,968 1
PAR.040 0,828/0,581 0,906/0,997 0,859/0,950 1
PAR.036 0,745/0,600 0,813/0,870 0,727/0,868 0,773/0,862 1

La tabla 6-45, referida a los casos patológicos, añade al grupo el parámetro 036, e
indica que las relaciones establecidas entre los parámetros 038-039, 038-040, 038-036,
039-040, 039-036 y 040-036 no se ven influidas por la presencia de terceras variables.

130
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

En las relaciones establecidas entre los parámetros 002-038, 002-039, 002-040 y 002-
036 sí se aprecia esta influencia, pero de forma leve.

Tabla 6-46. Observamos una fuerte relación entre


los parámetros Jitter (002), Desbalance de la pérdida
del cuerpo (039) y Desbalance de la elasticidad del
cuerpo (040), en la base de datos masculina, casos
normofónicos.
PAR.002 PAR.039 PAR.040
PAR.002 1
PAR.039 0,861/0,888 1
PAR.040 0,815/0,558 0,859/0,871 1

La tabla 6-46, referida a los casos normofónicos, sólo incluye a los parámetros 002,
039 y 040, e indica que las relaciones establecidas entre los parámetros 002-039, y
039-040 no se ven influidas por la presencia de terceras variables. En la relación
establecida entre los parámetros 002-040 y 002-036 sí se aprecia esta influencia, de
forma moderada.

 SEGUNDO GRUPO.

Tabla 6-47. Observamos una fuerte relación


entre los parámetros 2º Arm./Frecuencia
Fundamental MWC (009), Frecuencia del origen
de la señal (024) y Frecuencia del primer máximo
(026), en la base de datos masculina, todos los
casos.
PAR.009 PAR.024 PAR.026
PAR.009 1
PAR.024 -0,998/0 1
PAR.026 1/1 -0,998/0 1

Tabla 6-48. Observamos una fuerte relación


entre los parámetros 2º Arm./Frecuencia
Fundamental MWC (009), Frecuencia del origen
de la señal (024) y Frecuencia del primer máximo
(026), en la base de datos masculina, casos
patológicos.
PAR.009 PAR.024 PAR.026
PAR.009 1
PAR.024 0,996/0 1
PAR.026 1/1 0,996/0 1

En las tablas 6-47 y 6-48 (referidas a todos los casos y a los casos patológicos,
respectivamente) observamos un comportamiento prácticamente idéntico, e idéntico
también al observado en la base de datos femenina para los mismos parámetros: la
relación que se establece ente los parámetros 009 y 026 no se ve en absoluto afectada

131
Capítulo 6: Experimentación y resultados

por terceras variables, mientras que las relaciones que se establecen entre los
parámetros 009-024 y 024-026 aparecen como totalmente espurias.

En los casos normofónicos los tres parámetros tienen también un valor constante
para todos los sujetos.

 TERCER GRUPO.

Tabla 6-49. Observamos una fuerte relación entre


los parámetros Segunda banda de energía de la
MWC (012), Tercera banda de energía de la MWC
(013) y Cuarta banda de energía de la MWC (014), en
la base de datos masculina, todos los casos.
PAR.012 PAR.013 PAR.014
PAR.012 1
PAR.013 0,809/0,580 1
PAR.014 0,716/0,008 0,824/0,477 1

La tabla 6-49, referida a todos los casos, indica que las relaciones establecidas entre
los parámetros 012-013 y 013-014 se ven influidas por la presencia de terceras
variables de forma moderada. La relación establecida entre los parámetros 012-014 se
considera prácticamente espuria.

Tabla 6-50. Observamos una fuerte


relación entre los parámetros Segunda
banda de energía de la MWC (012) y
Tercera banda de energía de la MWC
(013), en la base de datos masculina,
casos patológicos.
PAR.012 PAR.013
PAR.012 1
PAR.013 0,826/0,675 1

La tabla 6-50, referida a los casos patológicos, sólo incluye a los parámetros 012 y
013, e indica que la relación establecida entre ambos se ve influida por la presencia de
terceras variables, pero de forma leve.

En los casos normofónicos la correlación que se establece entre estos parámetros


no alcanza el valor estipulado, por lo que no se profundizará en el estudio.

132
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

 CUARTO GRUPO.

Tabla 6-51. Observamos una fuerte


relación entre los parámetros Pitch (001) y
Elasticidad del cuerpo (037), en la base de
datos masculina, todos los casos.
PAR.001 PAR.037
PAR.001 1
PAR.037 0,829/0,921 1

La tabla 6-51, referida a todos los casos, indica que la relación establecida entre los
parámetros 001-037 no se ve influida por la presencia de terceras variables.
Tabla 6-52. Observamos una fuerte relación entre los
parámetros Pitch (001), Frecuencia final (032), Masa del cuerpo
(035) y Elasticidad del cuerpo (037), en la base de datos
masculina, casos normofónicos.
PAR.001 PAR.032 PAR.035 PAR.037
PAR.001 1
PAR.032 0,827/0,058 1
PAR.035 0,965/0,692 0,831/0,382 1
PAR.037 0,954/0,982 0,784/0 0,920/0,557 1

La tabla 6-52, referida a los casos normofónicos, añade al bloque los parámetros
032 y 035, e indica que la relación establecida entre los parámetros 001-037 no se ve
influida por la presencia de terceras variables. Las relaciones establecidas entre los
parámetros 001-037 y 035-037 sí lo hacen, de forma moderada. Por su parte, la
relación establecida entre los parámetros 032-035 se ve bastante influida por la
presencia de terceras variables. Por último, las relaciones establecidas entre los
parámetros 001-032 y 032-037 se ven muy influidas por la presencia de terceras
variables, en especial la última de ellas, que se puede considerar espuria
En los casos patológicos la correlación que se establece entre estos parámetros no
alcanza el valor estipulado, por lo que no se profundizará en el estudio.

133
Capítulo 6: Experimentación y resultados

 QUINTO GRUPO.

Tabla 6-53. Observamos una fuerte relación entre


los parámetros Frecuencia del segundo mínimo
(030) y Frecuencia del cuarto máximo (031), en la
base de datos masculina, todos los casos.
PAR.030 PAR.031
PAR.030 1
PAR.031 0,905/0,897 1

Tabla 6-54. Observamos una fuerte relación


entre los parámetros Frecuencia del segundo
mínimo (030) y Frecuencia del cuarto máximo
(031), en la base de datos masculina, casos
patológicos.
PAR.030 PAR.031
PAR.030 1
PAR.031 0,909/0,853 1

Tabla 6-55. Observamos una fuerte relación


entre los parámetros Frecuencia del segundo
mínimo (030) y Frecuencia del cuarto máximo
(031), en la base de datos masculina, casos
normofónicos.
PAR.030 PAR.031
PAR.030 1
PAR.031 0,895/0,698 1

Las tablas 6-53, 6-54 y 6-55 (referidas a todos los casos, a los casos patológicos y a
los casos normofónicos, respectivamente) tienen una estructura similar. En ellas se
observa que la relación establecida entre los parámetros 030-031 apenas se ve influida
por el efecto de terceras variables cuando consideramos todos los casos y cuando
consideramos los casos patológicos. En los casos normofónicos esta influencia es algo
mayor, sin llegar a ser grande.

Como resumen del estudio, en las tablas comprendidas entre la 6-56 y la 6-58
podemos observar de forma clara los bloques de parámetros correlacionados en las
bases de datos femenina y masculina, cuando tenemos en cuenta todos los casos,
cuando consideramos únicamente los casos patológicos y cuando trabajamos
únicamente con los casos normofónicos, respectivamente.

Manteniendo el criterio empleado en el estudio, en la tabla sólo aparecerán


agrupados los parámetros siempre y cuando todos ellos mantengan una relación
considerada "muy alta" con al menos uno de los parámetros del bloque. En ese caso,
los parámetros estarán destacados en negrita en la tabla. Sin embargo, cuando esto
sólo suceda en una de las dos bases de datos (masculina o femenina), incluiremos el
bloque en la otra base de datos siempre y cuando todos los parámetros implicados
mantengan una relación considera como "alta" con al menos uno de los parámetros

134
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

restantes del bloque. En este caso, los parámetros afectados no estarán destacados en
la tabla.

Tabla 6-56. Bloques de parámetros que presentan una correlación considerada


muy alta en las bases de datos femenina y masculina, todos los casos.
BASE DE DATOS FEMENINA BASE DE DATOS MASCULINA
001, 037 001, 037
Pitch, Elasticidad del cuerpo.
002, 038, 039, 040 002, 038, 039, 040
Jitter, Desbalance de la masa del cuerpo, Desbalance de la pérdida del cuerpo,
Desbalance de la elasticidad del cuerpo.
009, 024, 026 009, 024, 026
2º Arm./Frecuencia Fundamental MWC, Frecuencia del origen de la señal,
Frecuencia del primer máximo.
012, 013, 014 012, 013, 014
Segunda banda de energía de la MWC, Tercera banda de energía de la MWC,
Cuarta banda de energía de la MWC.
021, 022 021, 022
Amplitud del segundo mínimo, Amplitud del cuarto máximo.
027, 028 027, 028
Frecuencia del primer mínimo, Frecuencia del segundo máximo.
030, 031 030, 031
Frecuencia del segundo mínimo, Frecuencia del cuarto máximo.

Observando la tabla 6-56, referida a todos los casos, podemos comprobar el hecho
de que los bloques son iguales en las dos bases de datos, con el matiz de que en tres
de los casos los bloques presentan una correlación "muy alta" sólo en una de las dos
bases de datos (relación 001-037 en la base de datos masculina y relaciones 021-022 y
027-028 en la base de datos femenina), siendo las correlaciones que se establecen en
cada caso en la otra base de datos únicamente "altas".
En todo caso, podemos apreciar que los bloques están formados frecuentemente
por parámetros de la misma familia: observamos agrupaciones de desbalances de los
parámetros biomecánicos (junto con el jitter), de diferentes parámetros biométricos y
también de parámetros relacionados con la energía. También encontramos un bloque
en el que aparece un parámetro de perturbación/energía (2º Arm./Frecuencia
fundamental Onda Mucosa) relacionado con dos parámetros biométricos (Frecuencia
del origen de la señal y Frecuencia del primer máximo), y un bloque más formado por
el Pitch y la Elasticidad del cuerpo del pliegue vocal, parámetro biomecánico.
También cabe destacar que en el caso de eliminar las relaciones claramente
espurias podríamos suprimir de la tabla el parámetro biométrico 024 (Frecuencia del
origen de la señal) en ambas bases de datos, así como la relación 012-014, únicamente
en la base de datos masculina.

135
Capítulo 6: Experimentación y resultados

Tabla 6-57. Bloques de parámetros que presentan una correlación considerada


muy alta en las bases de datos femenina y masculina, casos patológicos.
BASE DE DATOS FEMENINA BASE DE DATOS MASCULINA
002, 038, 039, 040, 036 002, 038, 039, 040, 036
Jitter, Desbalance de la masa del cuerpo, Desbalance de la pérdida del cuerpo,
Desbalance de la elasticidad del cuerpo, Pérdida del cuerpo.
009, 024, 026 009, 024, 026
2º Arm./Frec. Fundamental MWC, Frec. del origen de la señal, Frec. del 1er máx.
012, 013, 014, 011 012, 013, 014, 011
2ª banda de energía de la MWC, 3ª banda de energía de la MWC, 4ª banda de
energía de la MWC, 1ª banda de energía de la MWC.
017, 042 017, 042
Amplitud del primer máximo, Pérdida de la cubierta.
027, 028 027, 028
Frecuencia del primer mínimo, Frecuencia del segundo máximo.
030, 031 030, 031
Frecuencia del segundo mínimo, Frecuencia del cuarto máximo.
En la tabla 6-57, referida a los casos patológicos, encontramos bloques bastante
parecidos a los de la tabla anterior, que contemplaba a todos los casos. Como
entonces, La base de datos masculina presenta relaciones algo más débiles que la base
de datos femenina, aunque este fenómeno es más acusado en esta ocasión. La
tendencia ya observada por la cual los bloques contienen generalmente parámetros de
la misma familia se confirma, o incluso se refuerza. Aparece además en esta ocasión un
bloque en el que observamos un parámetro biométrico (Amplitud del primer máximo)
y otro biomecánico (Pérdida de la cubierta). En cuanto a las relaciones espurias, en el
caso de prescindir de ellas el parámetro biométrico 024 (Frecuencia del origen de la
señal) podría ser eliminado de la tabla en ambas bases de datos, así como la relación
establecida entre los parámetros 038 y 039, únicamente en la base de datos femenina.
Tabla 6-58. Bloques de parámetros que presentan una correlación considerada
muy alta en las bases de datos femenina y masculina, casos normofónicos.
BASE DE DATOS FEMENINA BASE DE DATOS MASCULINA
002, 039, 040 002, 039, 040
Jitter, Desb. de la pérdida del cuerpo, Desb. de la elasticidad del cuerpo
009, 024, 026 009, 024, 026
2º Arm./Frec. Fundamental MWC, Frec. del origen de la señal, Frec. del 1er máx.
027, 028 027, 028
Frecuencia del primer mínimo, Frecuencia del segundo máximo.
030, 031 030, 031
Frecuencia del segundo mínimo, Frecuencia del cuarto máximo.
001, 032, 035, 037 001, 032, 035, 037
Pitch, Frecuencia final, Masa del cuerpo, Elasticidad del cuerpo
003, 005, 044 003, 005, 044
Shimmer en amplitud, Shimmer en área, Desbalance en masa de la cubierta.
008, 042 -
Energia MWC/AAW, Pérdida de la cubierta.

136
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

En la tabla 6-58, referida a los casos normofónicos, también observamos bloques


similares a los presentes en las tablas 6-56 y 6-57, referidas respectivamente a todos
los casos y a los casos patológicos, aunque esta vez apreciamos alguna diferencia
destacable: en esta ocasión encontramos por primera vez un bloque en la base de
datos femenina cuyos parámetros (008 y 042) no se encuentran relacionados en la
base de datos masculina de forma apreciable. Por otro lado, cabe destacar que el
bloque formado por los parámetros 009, 024 y 026 se caracteriza porque todos los
parámetros tienen un valor constante, que la relación entre los parámetros 032 y 037
podría ser eliminada al ser espuria, y que, como en los estudios anteriores, la base de
datos masculina presenta en general relaciones más débiles que la femenina. Además,
en lo referido a la composición de los bloques podemos observar que la tendencia
observada en las tablas 6-56 y 6-57 se mantiene, pero aparecen también algunas
novedades: encontramos relaciones entre un parámetro de energía (Energía
MWC/AAW) y un parámetro biomecánico (Pérdida de la cubierta); también
observamos un bloque en el que aparecen dos parámetros de perturbación (Shimmer
en amplitud y Shimmer en área) y un parámetro biomecánico (Desbalance masa de la
cubierta) y, por último, tenemos un bloque en el que aparece el pitch junto con dos
parámetros biomecánicos (Masa del cuerpo y Elasticidad del cuerpo) y un parámetro
biométrico (Frecuencia final de la señal).

Todos los índices de correlación de Tau-Kendall calculados aparecen en el apéndice


cinco, para su consulta. Además, en el anexo electrónico podemos encontrar las
matrices de correlación completas, así como los cálculos correspondientes a todas las
correlaciones parciales presentadas. También están incluidos allí, de forma
complementaria, las matrices de correlación correspondientes a los índices de Pearson
y de Spearman.

Concluiremos el estudio aportando un dato de interés: los índices de correlación de


cada uno de los parámetros con el hecho de pertenecer al grupo patológico o al
normofónico. Este hecho está codificado en una variable que toma el valor 0 si el
sujeto presenta normalidad vocal y que toma el valor 1 si el sujeto tiene alguna
patología vocal. Medir la correlación de todos los parámetros con esta variable nos
permite obtener una ordenación de los mismos, en base a los valores obtenidos. Las
tablas 6-59 y 6-60 ofrecen la lista de los parámetros ordenados, junto con los índices
de correlación Tau-Kendall obtenidos para la base de datos femenina y masculina,
respectivamente.

Tabla 6-59. Listado de parámetros utilizados en el estudio, junto con el índice


de correlación que éstos presentan con la variable que discrimina los sujetos
patológicos de los normofónicos, para la base de datos femenina. Los
parámetros aparecen ordenados en base al índice de correlación.
Código Nombre Índice Código Nombre Índice
P.040 Desb. Elast. Cuerpo 0,669 P.036 Pérdida Cuerpo -0,632
P.038 Desb. Masa Cuerpo 0,665 P.045 Desb. Pérdida Cubierta 0,596
P.002 Jitter 0,661 P.014 4ª banda energía MWC 0,591
P.039 Desb. Pérdida Cuerpo 0,658 P.013 3ª banda energía MWC 0,59
P.046 Desb. Elast. Cubierta 0,640 P.023 Amplitud Final Señal 0,586

137
Capítulo 6: Experimentación y resultados

Código Nombre Índice Código Nombre Índice


er
P.044 Desb. Masa Cubierta 0,578 P.027 Frecuencia 1 Mínimo -0,305
P.022 Amplitud 4º Máximo 0,573 P.030 Frecuencia 2º Mínimo -0,303
P.012 2ª banda energía MWC 0,557 P.032 Frecuencia Final Señal 0,298
er
P.021 Amplitud 2º Máximo 0,537 P.010 2º Arm./ 1 Arm. MWC 0,268
P.019 Amplitud 2º Máximo 0,518 P.048 Punto de Cierre -0,258
P.011 1ª Banda Energía MWC 0,496 P.028 Frecuencia 2º Máximo -0,256
P.035 Masa Cuerpo 0,463 P.031 Frecuencia 4º Máximo -0,252
P.041 Masa Cubierta 0,459 P.049 Punto de Recuperación 0,218
P.043 Elast. Cubierta 0,437 P.034 Esbeltez 2º surco -0,215
er o
P.018 Amplitud 1 Mín. 0,404 P.051 Pos. 2 Máx. Onda Mucosa 0,212
P.047 Punto de Apertura 0,393 P.001 Pitch -0,201
P.005 Shimmer área 0,348 P.033 Esbeltez 1er surco -0,161
P.015 Amplitud Origen Señal -0,332 P.004 Shimmer esbeltez 0,121
er
Posición 1 Máximo
P.050 Onda Mucosa 0,329 P.017 Amplitud 1er Máximo -0,119
2º Arm./ Frecuencia
P.009 Fundamental MWC 0,325 P.037 Elasticidad Cuerpo 0,071
Frecuencia Origen Esbeltez Pico de cierre /
P.024 Señal -0,325 P.007 Vecinos -0,032
er
P.026 Frecuencia 1 Máximo 0,325 P.008 Energía MWC/AAW -0,023
Amplitud Pico de cierre /
P.042 Pérdida Cubierta 0,322 P.006 Vecinos -0,009
P.003 Shimmer amplitud 0,320

En la tabla 6-59 podemos observar que los índices de correlación obtenidos no


alcanzan en ningún caso el nivel que a lo largo del estudio hemos considerado "muy
alto" (índice mayor de 0,8). Sí tenemos varios parámetros, en cambio, que alcanzan el
nivel considerado "alto" (índice mayor de 0,6 y menor de 0,8). Entre ellos destacan
muy especialmente los parámetros biomecánicos, sobre todo los relacionados con los
desbalances, que copan las primeras posiciones. También son mencionables los
parámetros de perturbación y energía: el jitter y los relacionados con algunas bandas
de energía de la onda mucosa aparecen en lugares reseñables. Los parámetros
biométricos no destacan especialmente, se reparten de forma bastante homogénea
por toda la tabla, excepto en los primeros lugares. Por su parte, los parámetros
temporales nunca ocupan lugares adelantados en la tabla, y sí encontramos algunos de
ellos en las posiciones finales.

De cara al posterior análisis discriminante (apartado 6.3), los parámetros


considerados como mejores en este estudio se corresponden con los valores
etiquetados como "altos", redondeando en los últimos casos y contando por lo tanto
con los diez primeros parámetros. En cuanto a los peores parámetros, hemos
considerado como tales a los siete últimos parámetros, que son los que no alcanzan el
valor de 0,2.

138
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla 6-60. Listado de parámetros utilizados en el estudio, junto con el índice de


correlación que éstos presentan con la variable que discrimina los sujetos patológicos
de los normofónicos, para la base de datos masculina. Los parámetros aparecen
ordenados en base al índice de correlación.
Código Nombre Índice Código Nombre Índice
P.036 Pérdida cuerpo -0,581 P.005 Shimmer área 0,293
er
P.013 3ª banda energía MWC 0,58 P.050 Posición 1 Máx. Onda Mucosa 0,293
er
P.040 Desb. Elast. Cuerpo 0,567 P.018 Amplitud 1 Mínimo 0,288
er
P.002 Jitter 0,564 P.027 Frecuencia 1 Mínimo -0,272
er
P.038 Desb. Masa Cuerpo 0,563 P.017 Amplitud 1 Máximo -0,252
P.039 Desb. Pérdida Cuerpo 0,557 P.003 Shimmer amplitud 0,231
P.014 4ª banda energía MWC 0,554 P.047 Punto de Apertura 0,211
er
P.012 2ª banda energía MWC 0,526 P.010 2º Arm. / 1 Arm. Onda Mucosa 0,193
P.046 Desb. Elast. Cubierta 0,525 P.028 Frecuencia 2º Máximo -0,19
P.045 Desb. Pérd. Cubierta 0,523 P.041 Masa cubierta 0,182
P.011 1ª banda energía MWC 0,495 P.032 Frecuencia Final Señal -0,17
P.044 Desb. Masa Cubierta 0,487 P.001 Pitch 0,157
P.023 Amplitud Final Señal 0,474 P.008 Energía MWC / AAW -0,141
P.022 Amplitud 4º Máximo 0,449 P.030 Frecuencia 2º Mínimo -0,135
P.015 Amplitud Origen Señal -0,444 P.031 Frecuencia 4º Máximo -0,127
P.043 Elasticidad Cubierta 0,424 P.034 Esbeltez 2º Surco -0,11
P.021 Amplitud 2º Mínimo 0,408 P.049 Punto de Recuperación 0,11
P.019 Amplitud 2º Máximo 0,404 P.007 Esbeltez Pico de Cierre / Vecinos -0,1
2º Arm. / Frec.
P.009 Fundamental MWC 0,374 P.033 Esbeltez 1er surco -0,097
P.024 Frecuencia Origen Señal -0,374 P.006 Amplitud Pico de Cierre / Vecinos -0,084
P.026 er
Frecuencia 1 Máximo 0,374 P.051 Posición 2o Máx. Onda Mucosa 0,068
P.042 Pérdida Cubierta 0,317 P.048 Punto de Cierre 0,064
P.004 Shimmer esbeltez 0,297 P.035 Masa Cuerpo 0,025
P.037 Elasticidad Cuerpo 0,294

En la tabla 6-60 observamos que los índices alcanzan valores más bajos en la base
de datos masculina que en la femenina: en esta ocasión no tenemos correlaciones
"muy altas", y tampoco tenemos correlaciones "altas", siempre según el criterio
utilizado. Sí se mantiene, en cambio, el comportamiento que tienen las familias de los
parámetros en la base de datos femenina: los parámetros biomecánicos, y en
particular sus desbalances son los que ocupan las primeras posiciones; los parámetros
de energía junto con el jitter ocupan lugares avanzados en la tabla; los parámetros
biométricos no destacan especialmente; los parámetros temporales ocupan siempre
lugares retrasados.

139
Capítulo 6: Experimentación y resultados

Los parámetros considerados mejores de cara al posterior análisis discriminante


(apartado 6.3) serán en esta ocasión aquellos que superan el valor de 0,5, es decir, los
diez primeros. Los considerados peores será los dieciséis últimos, que son los que
quedan por debajo del valor de 0,16.

6.2.2. Resultados de las pruebas de análisis factorial

Las pruebas de análisis factorial, como las de correlación, han sido realizadas sobre
los sujetos masculinos y femeninos de la base de datos de forma separada. También en
esta ocasión y para ambos casos trabajaremos tanto sobre el total de las muestras
como sobre los sujetos con patología vocal y sobre los sujetos normofónicos.

Los detalles de todas las pruebas realizadas figuran en el disco anexo, mientras que
en el apéndice seis aparecen las tablas de comunalidades (normales y rotadas) de los
diferentes casos sometidos a estudio.
El primer resultado alcanzado está relacionado con la adecuación de la técnica
sobre los datos empleados. En este sentido, podemos afirmar que en todos los casos
realizados se han obtenido resultados bastante satisfactorios. Los determinantes de las
matrices de correlación son siempre nulos o extremadamente pequeños. Las medidas
KMO, en cambio, no obtienen valores demasiado grandes, tal y como sería deseable.
Sin embargo, las pruebas de esfericidad de Bartlett sí alcanzan los valores requeridos, y
las matrices residuales no contienen valores altos, indicador de que el modelo factorial
es adecuado para explicar los datos. Por otra parte, es destacable el hecho de que las
tablas de comunalidades de todos los casos contienen valores altos en prácticamente
todos los parámetros. En cuanto a la varianza explicada por los factores calculados, no
queda por debajo del 84% en ningún caso. Llegando por fin al núcleo del estudio,
presentamos en las tablas comprendidas entre la 6-61 y la 6-66 las estructuras
factoriales obtenidas en cada caso, lo que permite observar qué parámetros concretos
contribuyen a la constitución de cada factor, destacando por su importancia aquellos
que lo hagan a las de los primeros factores.

140
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla 6-61. Listado de los parámetros agrupados por factores para todos los casos, sin
rotación y para las bases de datos femenina y masculina.
BASES DE DATOS COMPLETAS, SIN ROTACIÓN
Base de datos femenina Base de datos masculina
F1 Amplitud del cuarto máximo (valor relativo) Desbalance de la pérdida del cuerpo
Amplitud del segundo mínimo (valor relativo) Jitter
Desbalance de la pérdida de la cubierta Pérdida del cuerpo
Cuarta banda de energía de la Onda Mucosa Amplitud del segundo máximo (valor relativo)
Desbalance de la masa de la cubierta Amplitud del cuarto máximo (valor relativo)
Tercera banda de energía de la Onda Mucosa Desbalance de la elasticidad del cuerpo
Pérdida del cuerpo Primera banda de energía de la Onda Mucosa
Amplitud del segundo máximo (valor relativo) Tercera banda de energía de la Onda Mucosa
Segunda banda de energía de la Onda Mucosa Amplitud del segundo máximo (valor relativo)
Desbalance de la elasticidad de la cubierta Segunda banda de energía de la Onda Mucosa
Primera banda de energía de la Onda Mucosa Amplitud del segundo mínimo (valor relativo)
Amplitud del segundo máximo (valor relativo) Cuarta banda de energía de la Onda Mucosa
Desbalance de la elasticidad del cuerpo Desbalance de la pérdida de la cubierta
Jitter Amplitud del primer mínimo (valor relativo)
Desbalance de la pérdida del cuerpo Desbalance de la elasticidad de la cubierta
Desbalance de la masa del cuerpo Desbalance de la masa del cuerpo
Amplitud del primer mínimo (valor relativo) Amplitud del origen de la señal (valor relativo)
Frecuencia del primer mínimo (valor relativo) Pérdida de la cubierta
Elasticidad de la cubierta Desbalance de la masa de la cubierta
Frecuencia del segundo mínimo (valor rel.) Amplitud del primer máximo (valor absoluto)
Frecuencia del segundo máximo (valor rel.) Frecuencia del primer máximo (valor abs.)
Shimmer asociado al área 2º Arm. / Frecuencia Fundamental MWC
Esbeltez correspondiente al segundo surco Frecuencia del origen de la señal (valor rel.)
Shimmer asociado a la amplitud Frecuencia del primer mínimo (valor relativo)
Frecuencia del segundo máximo (valor rel.)
Frecuencia del final de la señal (valor relativo)
Elasticidad de la cubierta
F2 Amplitud del primer máximo (valor absoluto) Shimmer asociado al área
Relación Energía MWC/AAW Frecuencia del cuarto máximo (valor relativo)
er er
2º Arm. / 1 Arm. Onda Mucosa 2º Arm. / 1 Arm. Onda Mucosa
Pérdida de la cubierta Posición 2º Máximo Onda Mucosa
Frecuencia del final de la señal (valor relativo) Frecuencia del 2º mínimo (valor relativo)
Masa del cuerpo
Elasticidad del cuerpo
F3 Punto de Apertura Shimmer asociado a la amplitud
Punto de Cierre Shimmer asociado a la esbeltez
2º Arm. / Frecuencia Fundamental MWC Masa del cuerpo
Frecuencia del primer máximo (valor absoluto)
Frecuencia del origen de la señal (valor rel.)
Pitch
Posición 2º Máximo Onda Mucosa
Masa de la cubierta
F4 Frecuencia del cuarto máximo (valor relativo) Relación Energía MWC/AAW
er
Posición 1 Máximo Onda Mucosa
Punto de Apertura
Punto de Cierre
F5 Punto de Recuperación Elasticidad del cuerpo
F6 Posición 1er Máximo Onda Mucosa Masa de la cubierta
Pitch
Esbeltez correspondiente al segundo surco
F7 Esbeltez correspondiente al primer surco Esbeltez correspondiente al primer surco

141
Capítulo 6: Experimentación y resultados

BASES DE DATOS COMPLETAS, SIN ROTACIÓN


Base de datos femenina Base de datos masculina
F8 Shimmer asociado a la esbeltez Esbeltez correspondiente al primer surco
F9 Amplitud del origen de la señal (valor relativo) Razón Amp.Pico de Cierre Glótico / Vecinos
F10 Razón Amp. Pico de Cierre Glótico / Vecinos Punto de Recuperación
F11 Razón Esb. Pico de Cierre Glótico / Vecinos Razón Esbeltez Pico de Cierre Glótico / Vecinos

Tabla 6-62. Listado de los parámetros agrupados por factores, casos normofónicos, sin
rotación y para las bases de datos femenina y masculina.
BASES DE DATOS NORMOFÓNICAS, SIN ROTACIÓN
Base de datos femenina Base de datos masculina
F1 Desbalance de la pérdida de la cubierta Desbalance de la masa de la cubierta
Shimmer asociado a la amplitud Shimmer asociado a la esbeltez
Desbalance de la masa de la cubierta Desbalance de la pérdida de la cubierta
Frecuencia del cuarto máximo (valor rel.) Shimmer asociado al área
Shimmer asociado al área Shimmer asociado a la amplitud
Frecuencia del segundo mínimo (valor rel.) Amplitud del cuarto máximo (valor relativo)
Desbalance de la elasticidad de la cubierta Segunda banda de energía de la MWC
Amplitud del cuarto máximo (valor relativo) Desbalance de la elasticidad de la cubierta
Shimmer asociado a la esbeltez Amplitud del segundo mínimo (valor relativo)
Amplitud del origen de la señal (valor rel.) Amplitud del segundo máximo (valor relativo)
Frecuencia del primer mínimo (valor rel.) Primera banda de energía de la Onda Mucosa
Frecuencia del final de la señal (valor rel.) Frecuencia del cuarto máximo (valor relativo)
Frecuencia del segundo máximo (valor rel.) Tercera banda de energía de la MWC
Razón Amp. Pico de Cierre Glótico / Vecinos Frecuencia del segundo mínimo (valor rel.)
Punto de Apertura Amplitud del primer mínimo (valor relativo)
Frecuencia del segundo máximo (valor rel)
Amplitud del origen de la señal (valor rel.)
Desbalance de la masa del cuerpo
F2 Amplitud del primer máximo (valor abs.) Elasticidad de la cubierta
Elasticidad de la cubierta Pérdida de la cubierta
Amplitud del segundo mínimo (valor rel.) Amplitud del primer máximo (valor absoluto)
Pérdida del cuerpo Razón Energía MWC/AAW
Desbalance de la masa del cuerpo Desbalance de la pérdida del cuerpo
Amplitud del segundo máximo (valor rel.) Desbalance de la elasticidad del cuerpo
Esbeltez correspondiente al segundo surco Posición 1er Máximo Onda Mucosa
er
2º Arm. / 1 Arm. Onda Mucosa Jitter
Pérdida del cuerpo
F3 Desbalance de la elasticidad del cuerpo Pitch
Desbalance de la pérdida del cuerpo Elasticidad del cuerpo
Jitter Masa del cuerpo
Punto de Recuperación Frecuencia del final de la señal (valor relativo)
Amplitud del primer mínimo (valor relativo) Frecuencia del primer mínimo (valor relativo)
Posición 1er Máximo Onda Mucosa
F4 Punto de Cierre Amplitud del segundo máximo (valor relativo)
Pérdida de la cubierta Cuarta banda de energía de la Onda Mucosa
Masa de la cubierta
Relación Energía MWC/AAW
o
F5 Masa del cuerpo Posición 2 Máximo Onda Mucosa
Elasticidad del cuerpo Masa de la cubierta
Pitch Punto de Cierre

142
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

BASES DE DATOS NORMOFÓNICAS, SIN ROTACIÓN


Base de datos femenina Base de datos masculina
F6 Segunda banda de energía de la MWC Esbeltez correspondiente al primer surco
Tercera banda de energía de la MWC
Cuarta banda de energía de la MWC
Primera banda de energía de la MWC
F7 Amplitud del segundo máximo (valor rel.) Punto de Apertura
F8 Razón Esb. Pico de Cierre Glótico / Vecinos Razón Amp. Pico de Cierre Glótico / Vecinos
F9 Esbeltez correspondiente al primer surco Esbeltez correspondiente al segundo surco
Razón Esb. Pico de Cierre Glótico / Vecinos
o
F10 Posición 2 Máximo Onda Mucosa Punto de Recuperación
er
2º Arm. / 1 Arm. Onda Mucosa

Tabla 6-63. Listado de los parámetros agrupados por factores, casos patológicos, sin
rotación y para las bases de datos femenina y masculina.
BASES DE DATOS PATOLÓGICAS, SIN ROTACIÓN
Base de datos femenina Base de datos masculina
F1 Amplitud del segundo mínimo (valor relativo) Amplitud del segundo máximo (valor relativo)
Amplitud del cuarto máximo (valor relativo) Desbalance de la pérdida del cuerpo
Desbalance de la elasticidad de la cubierta Jitter
Desbalance de la masa de la cubierta Amplitud del cuarto máximo (valor relativo)
Tercera banda de energía de la Onda Mucosa Pérdida del cuerpo
Primera banda de energía de la Onda Mucosa Amplitud del primer mínimo (valor relativo)
Cuarta banda de energía de la Onda Mucosa Desbalance de la elasticidad del cuerpo
Amplitud del segundo máximo (valor relativo) Amplitud del segundo mínimo (valor relativo)
Desbalance de la pérdida de la cubierta Amplitud del primer máximo (valor absoluto)
Segunda banda de energía de la Onda Mucosa Amplitud del origen de la señal (valor rel.)
Pérdida del cuerpo Desbalance de la masa del cuerpo
Desbalance de la elasticidad del cuerpo Frecuencia del final de la señal (valor rel.)
Elasticidad de la cubierta 2º Arm. / Frecuencia Fundamental MWC
Desbalance de la masa del cuerpo Frecuencia del primer máximo (valor abs.)
Amplitud del segundo máximo (valor relativo) Primera banda de energía de la Onda Mucosa
Frecuencia del primer mínimo (valor relativo) Pérdida de la cubierta
Frecuencia del segundo mínimo (valor rel.) Frecuencia del origen de la señal (valor rel.)
Jitter Amplitud del segundo máximo (valor relativo)
Punto de Cierre Desbalance de la elasticidad de la cubierta
Amplitud del primer mínimo (valor relativo) Frecuencia del primer mínimo (valor relativo)
Esbeltez correspondiente al segundo surco Posición 2o Máximo Onda Mucosa
Shimmer asociado al área Cuarta banda de energía de la Onda Mucosa
Elasticidad de la cubierta
Razón Energía MWC/AAW
F2 Amplitud del primer máximo (valor absoluto) Shimmer asociado al área
Razón Energía MWC/AAW Segunda banda de energía de la MWC
Pérdida de la cubierta Frecuencia del cuarto máximo (valor relativo)
2º Arm. / 1er Arm. Onda Mucosa Tercera banda de energía de la MWC
Frecuencia del final de la señal (valor relativo) Frecuencia del segundo máximo (valor rel.)
Pitch Frecuencia del segundo mínimo (valor rel.)
er
Masa del cuerpo 2º Arm. / 1 Arm. Onda Mucosa
Elasticidad del cuerpo Masa del cuerpo

143
Capítulo 6: Experimentación y resultados

BASES DE DATOS PATOLÓGICAS, SIN ROTACIÓN


Base de datos femenina Base de datos masculina
F3 Punto de Apertura Punto de Cierre
Frecuencia del origen de la señal (valor rel.)
2º Arm. / Frecuencia Fundamental MWC
Frecuencia del primer máximo (valor absoluto)
o
Posición 2 Máximo Onda Mucosa
Posición 1er Máximo Onda Mucosa
F4 Frecuencia del cuarto máximo (valor relativo) Elasticidad del cuerpo
Frecuencia del segundo máximo (valor rel.) Punto de Apertura
F5 Desbalance de la pérdida del cuerpo Desbalance de la masa de la cubierta
Masa de la cubierta
Desbalance de la pérdida de la cubierta
F6 Punto de Recuperación Pitch
Esbeltez correspondiente al primer surco Shimmer asociado a la amplitud
F7 Amplitud del origen de la señal (valor relativo) Esbeltez correspondiente al primer surco
Shimmer asociado a la amplitud
F8 Masa de la cubierta Posición 1er Máximo Onda Mucosa
Shimmer asociado a la esbeltez
F9 Razón Amp. Pico de Cierre Glótico / Vecinos Punto de Recuperación
F10 Razón Esbeltez Pico de Cierre Glótico / Vecinos Razón Amp. Pico de Cierre Glótico / Vecinos
F11 Shimmer asociado a la esbeltez Esbeltez correspondiente al segundo surco
Razón Esb. Pico de Cierre Glótico / Vecinos

Las tablas 6-61, 6-62 y 6-63 presentan la estructura factorial de las bases de datos
femenina y masculina para todos los casos, para los casos patológicos y para los casos
normofónicos. En los tres casos alcanzamos las mismas conclusiones: las estructuras
factoriales obtenidas presentan una gran acumulación de parámetros en el primer
factor; en los siguientes factores va disminuyendo el número de parámetros de forma
más o menos progresiva hasta llegar a los últimos factores, donde la estructura
factorial se difumina, dándose en varios casos la circunstancia de contar con factores
explicados con un sólo parámetro.
Estas configuraciones no permiten alcanzar conclusiones relevantes, debido al
aspecto caótico que ofrecen, aunque los factores obtenidos sí jugarán un papel
importante en la tarea de detección de patología mediante la técnica de análisis
discriminante, como veremos en el siguiente apartado.
Para obtener una interpretación más clara podemos observar las tablas
comprendidas entre la 6-64 y la 6-66, donde se ha aplicado a las soluciones factoriales
sendas rotaciones con el método varimax. Las soluciones rotadas presentan a los
diferentes parámetros organizados de un modo claro en torno a los factores, como
podemos comprobar en las tablas.

144
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla 6-64. Listado de los parámetros agrupados por factores para todos los casos, rotación
varimax y para las bases de datos femenina y masculina.
BASES DE DATOS COMPLETAS, ROTACIÓN VARIMAX
Base de datos femenina Base de datos masculina
F1 Jitter Tercera banda de energía de la Onda Mucosa
Desbalance de la pérdida del cuerpo Segunda banda de energía de la Onda Mucosa
Desbalance de la elasticidad del cuerpo Cuarta banda de energía de la Onda Mucosa
Desbalance de la masa del cuerpo Primera banda de energía de la Onda Mucosa
Desbalance de la pérdida de la cubierta Amplitud del segundo máximo (valor relativo)
Desbalance de la masa de la cubierta 2º Arm. / 1er Arm. Onda Mucosa
Pérdida del cuerpo
Desbalance de la elasticidad de la cubierta
Amplitud del origen de la señal (valor
relativo)
F2 Frecuencia del segundo máximo (valor rel.) Desbalance de la masa del cuerpo
Frecuencia del primer mínimo (valor relativo) Desbalance de la elasticidad del cuerpo
Frecuencia del cuarto máximo (valor relativo) Elasticidad del cuerpo
Frecuencia del segundo mínimo (valor rel.) Masa del cuerpo
Amplitud del segundo máximo (valor relativo) Jitter
Amplitud del segundo mínimo (valor relativo) Desbalance de la pérdida del cuerpo
Amplitud del cuarto máximo (valor relativo) Pérdida del cuerpo
Esbeltez correspondiente al segundo surco Amplitud del origen de la señal (valor relativo)
F3 Segunda banda de energía de la MWC Frecuencia del cuarto máximo (valor rel.)
Tercera banda de energía de la MWC Frecuencia del segundo mínimo (valor rel.)
Cuarta banda de energía de la MWC Frecuencia del segundo máximo (valor rel.)
Primera banda de energía de la MWC Frecuencia del primer mínimo (valor rel.)
Amplitud del segundo máximo (valor relativo) Amplitud del segundo mínimo (valor rel.)
Amplitud del cuarto máximo (valor rel.)
Amplitud del segundo máximo (valor rel.)
F4 Frecuencia del origen de la señal (valor Frecuencia del primer máximo (valor absoluto)
relativo) 2º Arm. / Frecuencia Fundamental MWC
2º Arm. / Frecuencia Fundamental MWC Frecuencia del origen de la señal (valor
Frecuencia del primer máximo (valor relativo)
o
absoluto) Posición 2 Máximo Onda Mucosa
Elasticidad de la cubierta Elasticidad de la cubierta
Punto de Apertura
Desbalance de la elasticidad de la cubierta
F5 Pérdida de la cubierta Pérdida de la cubierta
Masa de la cubierta Razón Energía MWC/AAW
Amplitud del primer máximo (valor absoluto) Amplitud del primer máximo (valor absoluto)
Razón Energía MWC/AAW Masa de la cubierta
Punto de Cierre Punto de Cierre

F6 Elasticidad del cuerpo Shimmer asociado al área


Masa del cuerpo Shimmer asociado a la amplitud
2º Arm. / 1er Arm. Onda Mucosa Shimmer asociado a la esbeltez
Desbalance de la pérdida de la cubierta
Desbalance de la masa de la cubierta
F7 Pitch Esbeltez correspondiente al primer surco
Frecuencia del final de la señal (valor relativo) Amplitud del primer mínimo (valor relativo)
F8 Shimmer asociado a la esbeltez Pitch
Shimmer asociado a la amplitud Frecuencia del final de la señal (valor relativo)
Shimmer asociado al área Esbeltez correspondiente al segundo surco

145
Capítulo 6: Experimentación y resultados

BASES DE DATOS COMPLETAS, ROTACIÓN VARIMAX


Base de datos femenina Base de datos masculina
F9 Esbeltez correspondiente al primer surco Punto de Recuperación
Amplitud del primer mínimo (valor relativo) Posición 1er Máximo Onda Mucosa
o
F10 Posición 2 Máximo Onda Mucosa Amplitud Pico de Cierre Glótico / Vecinos
Punto de Recuperación
Punto de Apertura
Posición 1er Máximo Onda Mucosa
F11 Razón Amplitud Pico de Cierre Glótico / Razón Esbeltez Pico de Cierre Glótico / Vecinos
Vecinos
Razón Esbeltez Pico de Cierre Glótico /
Vecinos

La tabla 6-64, referida a todos los casos para las bases de datos femenina y
masculina, presenta el listado de los parámetros correspondientes a cada factor
resultado del análisis, con la solución factorial rotada con el método varimax.
Comentaremos a continuación las características más destacadas de los bloques
formados.

En la base de datos femenina, el primer factor agrupa todos los desbalances de los
parámetros biomecánicos. El segundo factor está compuesto exclusivamente por
parámetros biométricos. En el tercer factor encontramos todos los parámetros de
energía. Los parámetros temporales, en su mayoría, se agrupan en torno a uno de los
factores menos importantes, el décimo. Los parámetros de perturbación también
aparecen, en general, concentrados en torno a los últimos factores (con la excepción
del jitter, que aparece en el primer factor).

En la base de datos masculina encontramos todos los parámetros de energía en


torno al primer factor. El segundo factor contiene sobre todo parámetros
biomecánicos, y el tercero acumula únicamente parámetros biométricos. Los
parámetros temporales, sin llegar a destacar demasiado sí aparecen en lugares algo
más reseñables que en la base de datos femenina. Lo mismo sucede con los
parámetros de perturbación, mantienen una tendencia similar en ambas bases de
datos, pero en la masculina encontramos alguno más en lugares destacados.

146
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla 6-65. Listado de los parámetros agrupados por factores, casos normofónicos,
rotación varimax y para las bases de datos femenina y masculina.
BASES DE DATOS NORMOFÓNICAS, ROTACIÓN VARIMAX
Base de datos femenina Base de datos masculina
F1 Desbalance de la masa de la cubierta Desbalance de la pérdida de la cubierta
Shimmer asociado al área Desbalance de la masa de la cubierta
Desbalance de la pérdida de la cubierta Shimmer asociado al área
Shimmer asociado a la amplitud Shimmer asociado a la esbeltez
Shimmer asociado a la esbeltez Desbalance de la elasticidad de la cubierta
Desbalance de la elasticidad de la cubierta Shimmer asociado a la amplitud
F2 Frecuencia del segundo máximo (valor rel.) Pitch
Frecuencia del primer mínimo (valor relativo) Elasticidad del cuerpo
Amplitud del segundo máximo (valor relativo) Masa del cuerpo
Amplitud del primer mínimo (valor relativo) Frecuencia del segundo máximo (valor rel.)
Frecuencia del cuarto máximo (valor relativo) Frecuencia del primer mínimo (valor rel.)
Frecuencia del segundo mínimo (valor rel.) Frecuencia del segundo mínimo (valor rel.)
Amplitud del segundo mínimo (valor relativo) Frecuencia del cuarto máximo (valor rel.)
Esbeltez correspondiente al segundo surco
Amplitud del cuarto máximo (valor relativo)
F3 Desbalance de la elasticidad del cuerpo Relación Energía MWC/AAW
Jitter Pérdida de la cubierta
Desbalance de la pérdida del cuerpo Elasticidad de la cubierta
Desbalance de la masa del cuerpo Posición 1er Máximo Onda Mucosa
Pérdida del cuerpo Amplitud del primer máximo (valor abs.)
Primera banda de energía de la MWC
2º Arm / 1er Arm. Onda Mucosa
Amplitud del origen de la señal (valor rel.)
Amplitud del cuarto máximo (valor relativo)
F4 Pérdida de la cubierta Amplitud del segundo máximo (valor rel.)
Razón Energía MWC/AAW Cuarta banda de energía de la MWC
Amplitud del primer máximo (valor absoluto) Tercera banda de energía de la MWC
Punto de Cierre Segunda banda de energía de la MWC
Masa de la cubierta Frecuencia del final de la señal (valor rel.)
2º ARM / 1er Arm. Onda Mucosa
F5 Pitch Jitter
Elasticidad del cuerpo Desbalance de la pérdida del cuerpo
Masa del cuerpo Desbalance de la elasticidad del cuerpo
Frecuencia del final de la señal (valor relativo) Pérdida del cuerpo
Elasticidad de la cubierta
Punto de Apertura
F6 Cuarta banda de energía de la Onda Mucosa Masa de la cubierta
Tercera banda de energía de la Onda Mucosa Punto de Cierre
o
Segunda banda de energía de la Onda Mucosa Posición 2 Máximo Onda Mucosa
Amplitud del segundo máximo (valor relativo) Esbeltez correspondiente al segundo surco
Primera banda de energía de la Onda Mucosa
F7 Posición 1er Máximo Onda Mucosa Esbeltez correspondiente al primer surco
Punto de Recuperación Amplitud del primer mínimo (valor relativo)
Amplitud del segundo máximo (valor rel.)
Amplitud del segundo mínimo (valor rel.)
F8 Razón Amp. Pico de Cierre Glótico / Vecinos Razón Amp. Pico de Cierre Glótico / Vecinos
Razón Esb. Pico de Cierre Glótico / Vecinos Desbalance de la masa del cuerpo
Amplitud del origen de la señal (valor relativo)
F9 Posición 2o Máximo Onda Mucosa Razón Esb. Pico de Cierre Glótico / Vecinos
Punto de Apertura
F10 Esbeltez correspondiente al primer surco Punto de Recuperación

147
Capítulo 6: Experimentación y resultados

La tabla 6-65 se ocupa exclusivamente de los casos normofónicos, y presenta el


listado de los parámetros correspondientes a cada factor resultado del análisis. Como
en la tabla anterior, la solución factorial ha sido rotada con el método varimax. Cabe
mencionar que para extraer las estructuras factoriales ha sido necesario excluir del
estudio a los parámetros 009, 024 y 026 (cociente entre la posición en frecuencia del
segundo armónico de la onda mucosa y la frecuencia fundamental, frecuencia del
origen de la señal y frecuencia del primer máximo, respectivamente), debido a que
presentan valores constantes, lo que hace imposible la realización de los cálculos
correspondientes. Comentaremos a continuación las características más destacadas de
los bloques formados.

En la base de datos femenina, el primer factor contiene parámetros biomecánicos


(desbalances), pero también aparecen en esta ocasión algunos parámetros de
perturbación. El segundo factor acumula numerosos parámetros biométricos. El tercer
factor cuenta con parámetros biomecánicos (el resto de los desbalances), junto con el
jitter. Los parámetros de energía están en esta ocasión agrupados en torno a un factor
más bajo, el sexto. Los parámetros temporales se encuentran dispersos en los últimos
factores.

En la base de datos masculina, el primer factor tiene las mismas características que
en la base de datos femenina: aparecen algunos desbalances de los parámetros
biomecánicos junto con algunos parámetros de perturbación. El segundo factor cuenta
también con varios parámetros biométricos y con algún parámetro biomecánico. El
tercer factor aglutina varios parámetros de todas las categorías. Las bandas de energía
aparecen mayoritariamente en el cuarto factor, el resto de los desbalances aparecen
en el séptimo factor, y los parámetros temporales se encuentran nuevamente
presentes en los últimos factores.

Tabla 6-66. Listado de los parámetros agrupados por factores, casos patológicos, rotación
varimax y para las bases de datos femenina y masculina.
BASES DE DATOS PATOLÓGICAS, ROTACIÓN VARIMAX
Base de datos femenina Base de datos masculina
F1 Jitter Desbalance de la masa del cuerpo
Desbalance de la pérdida del cuerpo Desbalance de la elasticidad del cuerpo
Desbalance de la elasticidad del cuerpo Jitter
Desbalance de la masa del cuerpo Elasticidad del cuerpo
Desbalance de la masa de la cubierta Masa del cuerpo
Desbalance de la pérdida de la cubierta Pérdida del cuerpo
Pérdida del cuerpo Desbalance de la pérdida del cuerpo
Desbalance de la elasticidad de la cubierta Amplitud del origen de la señal (valor rel.)
Punto de Cierre
F2 Primera banda de energía de la Onda Mucosa Frecuencia del segundo mínimo (valor rel.)
Segunda banda de energía de la Onda Mucosa Frecuencia del segundo máximo (valor rel.)
Tercera banda de energía de la Onda Mucosa Frecuencia del cuarto máximo (valor relativo)
Cuarta banda de energía de la Onda Mucosa Frecuencia del primer mínimo (valor relativo)
Amplitud del segundo máximo (valor relativo) Amplitud del cuarto máximo (valor relativo)
Punto de Cierre Amplitud del segundo mínimo (valor relativo)
Amplitud del segundo máximo (valor relativo)

148
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

BASES DE DATOS PATOLÓGICAS, ROTACIÓN VARIMAX


Base de datos femenina Base de datos masculina
F3 Amplitud del primer máximo (valor absoluto) Tercera banda de energía de la MWC
Pérdida de la cubierta Cuarta banda de energía de la MWC
Pitch Segunda banda de energía de la MWC
Razón Energía MWC/AAW Primera banda de energía de la MWC
Frecuencia del final de la señal (valor relativo) Amplitud del segundo máximo (valor relativo)
Masa de la cubierta
Amplitud del segundo máximo (valor relativo)
F4 Frecuencia del segundo máximo (valor rel.) 2º Arm. / Frecuencia Fundamental MWC
Frecuencia del primer mínimo (valor relativo) Frecuencia del primer máximo (valor abs.)
Frecuencia del cuarto máximo (valor relativo) Frecuencia del origen de la señal (valor rel.)
o
Frecuencia del segundo mínimo (valor rel.) Posición 2 Máximo Onda Mucosa
Esbeltez correspondiente al segundo surco Punto de Apertura
Amplitud del segundo mínimo (valor relativo) Elasticidad de la cubierta
Amplitud del cuarto máximo (valor relativo)
F5 2º Arm. / Frecuencia Fundamental MWC Pérdida de la cubierta
Frecuencia del primer máximo (valor abs.) Relación Energía MWC/AAW
Frecuencia del origen de la señal (valor rel.) Amplitud del primer máximo (valor absoluto)
Elasticidad de la cubierta Razón Amp. Pico de Cierre Glótico / Vecinos
er
2º Arm. / 1 Arm. Onda Mucosa
F6 Elasticidad del cuerpo Shimmer asociado a la amplitud
Masa del cuerpo Shimmer asociado al área
er
2º Arm. / 1 Arm. Onda Mucosa Shimmer asociado a la esbeltez
F7 Esbeltez correspondiente al primer surco Desbalance de la elasticidad de la cubierta
Punto de Recuperación Desbalance de la masa de la cubierta
Amplitud del primer mínimo (valor relativo) Masa de la cubierta
Posición 1er Máximo Onda Mucosa Desbalance de la pérdida de la cubierta
F8 Shimmer asociado a la esbeltez Esbeltez correspondiente al primer surco
Shimmer asociado a la amplitud Amplitud del primer mínimo (valor relativo)
Shimmer asociado al área
F9 Razón Amp. Pico de Cierre Glótico / Vecinos Pitch
Razón Esb. Pico de Cierre Glótico / Vecinos Frecuencia del final de la señal (valor relativo)
o
F10 Posición 2 Máximo Onda Mucosa Punto de Recuperación
Punto de Apertura Posición 1er Máximo Onda Mucosa
F11 Amplitud del origen de la señal (valor relativo) Esbeltez correspondiente al segundo surco
Razón Esb. Pico de Cierre Glótico / Vecinos

La tabla 6-66, por último, se ocupa exclusivamente de los casos patológicos, y


presenta el listado de los parámetros correspondientes a cada factor resultado del
análisis. Como en las dos tablas anteriores, la solución factorial ha sido rotada con el
método varimax. Comentaremos a continuación las características más destacadas de
los bloques formados.

En la base de datos femenina, el primer factor acumula todos los desbalances de los
parámetros biomecánicos. En el segundo factor aparecen las cuatro bandas de energía
de la onda mucosa. El tercer factor está compuesto de parámetros biométricos y
biomecánicos, y de la relación de energía entre la onda mucosa y la onda acústica
promedio. El resto de los parámetros biométricos aparecen mayoritariamente en los
siguientes factores (cuarto y quinto). Los parámetros temporales aparecen en los
últimos factores, con la excepción de uno de ellos –punto de cierre– que encontramos
en el segundo factor. Los parámetros de perturbación también aparecen generalmente
en los últimos factores.

149
Capítulo 6: Experimentación y resultados

En la base de datos masculina, el primer factor cuenta sobre todo con parámetros
biomecánicos, aunque también aparecen parámetros de las demás categorías
(perturbación, biométricos e incluso temporales). El segundo factor está formado
exclusivamente por parámetros biométricos. En el tercer factor aparecen las cuatro
bandas de energía. Los desbalances que no aparecen en el primer factor están en esta
ocasión agrupados en un factor retrasado, el séptimo. Los parámetros temporales se
distribuyen en esta ocasión también en factores adelantados: en el primero (ya
mencionado) y en el cuarto, aunque también con presencia en el décimo factor. Los
parámetros de perturbación aparecen de forma mayoritaria en los factores centrales
(cuarto, quinto y sexto).

6.3. Detección de los sujetos en base a la presencia de patología vocal

El presente apartado está dedicado exclusivamente al estudio que cierra este


trabajo: el análisis discriminante realizado con el objetivo de medir la capacidad de
clasificación que tienen las distintas combinaciones de parámetros y factores
utilizados, respecto al hecho padecer o no una patología vocal. Estas combinaciones
han sido escogidas en base a tres ejes fundamentales: primero, el uso directo de los
parámetros y el uso de factores procedentes de los parámetros; segundo, la naturaleza
de los parámetros y factores, es decir, la familia de la que proceden:
perturbación/energía, biométricos, biomecánicos y temporales; tercero, los resultados
de los estudios estadísticos previos. Como en apartados anteriores, el estudio se divide
en dos partes, la correspondiente a la base de datos femenina y la correspondiente a la
base de datos masculina. Además, en esta ocasión hemos realizado algunas pruebas
utilizando la base de datos global, con los individuos mezclados, de cara a comparar
resultados. A continuación pasamos a comentar los estudios que se han llevado a cabo
utilizando todos los datos disponibles y también teniendo en cuenta la naturaleza de
los parámetros y factores empleados:

 Todos los parámetros disponibles. En primer lugar se utilizaron el 90% de los


sujetos como datos de entrenamiento y el 10% restante como datos de
clasificación, en segundo lugar se varió esta proporción utilizando el 50% de los
datos para entrenamiento y el 50% restante para clasificación (la primera de
estas opciones, es decir, la proporción 90-10 será la utilizada en todos los
estudios, salvo que expresamente se indique lo contrario) 15.
 Parámetros correspondientes a cada una de las distintas familias empleadas en
esta tesis: solo parámetros de perturbación/energía, solo parámetros
biométricos, solo parámetros biomecánicos y solo parámetros temporales.
 Todos los parámetros, excepto los correspondientes a cada una de las distintas
familias empleadas en esta tesis: todos los parámetros excepto los de
perturbación/energía, todos los parámetros excepto los biométricos, todos los
parámetros excepto los biomecánicos y todos los parámetros excepto los
temporales.

15
Recordemos que hablamos del cálculo de la medida de validación cruzada llamada "no seleccionada".
Además, también se calculan las medidas llamadas "seleccionadas", "validación cruzada" (leave-one-out)
y "medida general".

150
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

 Todos los factores extraídos de todos los parámetros. En esta ocasión se


realizaron las siguientes combinaciones en cuanto a los datos empleados como
entrenamiento y clasificación: 90%-10%, 80%-20%, 70%-30%, 60%-40% y 50%-
50%.
 Factores extraídos de los parámetros correspondientes a cada una de las
distintas familias empleadas en esta tesis: factores procedentes únicamente de
los parámetros de perturbación/energía, factores procedentes únicamente de
los parámetros biométricos, factores procedentes únicamente de los parámetros
biomecánicos y factores procedentes únicamente de los parámetros temporales.
 Factores extraídos de todos los parámetros, excepto de los correspondientes a
cada una de las distintas familias empleadas en esta tesis: factores extraídos de
todos los parámetros excepto de los de perturbación/energía, factores extraídos
de todos los parámetros excepto de los biométricos, factores extraídos de todos
los parámetros excepto de los biomecánicos y factores extraídos de todos los
parámetros excepto de los temporales.
 Todos los factores, excepto los correspondientes a cada una de las distintas
familias empleadas en esta tesis: todos los factores excepto los extraídos de los
parámetros de perturbación/energía, todos los factores excepto los extraídos de
los parámetros biométricos, todos los factores excepto los extraídos de los
parámetros biomecánicos y todos los factores excepto los extraídos de los
parámetros temporales.16

A continuación, listaremos los diferentes estudios realizados a partir de los


resultados obtenidos en las diferentes pruebas estadísticas realizadas en los apartados
anteriores. Cabe destacar que hemos realizado un doble estudio, basado en primer
lugar en considerar los mejores parámetros de cada prueba, y en segundo lugar en
considerar todos los parámetros excepto los peores de cada prueba. Sólo en el caso
del estudio relacionado con los diagramas de caja no cabe realizar esta distinción,
debido a que en ese estudio sólo se establecen dos categorías cualitativas para los
parámetros. Todos los estudios han sido realizados con las proporciones
entrenamiento/clasificación 90-10 y 50-50. Todos los estudios se han repetido
utilizando los factores extraídos a partir de los parámetros empleados en cada ocasión.

 Mejores parámetros según el estudio realizado a partir de los diagramas de caja


de los parámetros (ver tabla 6-15).
 Mejores parámetros según el estudio realizado a partir de la diferencia de
distribuciones de los parámetros (ver tablas 6-19 y 6-20).
 Mejores parámetros según el estudio realizado a partir del tamaño del efecto de
los parámetros (ver tablas 6-22 y 6-23).
 Mejores parámetros según el estudio realizado a partir de la correlación de los
parámetros con la variable dicotómica que indica si cada uno de los sujetos tiene
o no patología vocal (ver tablas 6-59 y 6-60).

16
En esta categoría se calcularon por separado los factores correspondientes a cada familia, y se
incluyeron en cada uno de los estudios, dejando fuera los de una familia cada vez. En la categoría
anterior se calcularon todos los factores para cada estudio, dejando fuera en cada ocasión los
parámetros correspondientes a cada familia.

151
Capítulo 6: Experimentación y resultados

 Todos los parámetros excepto los peores según el estudio realizado a partir de la
diferencia de distribuciones de los parámetros (ver tablas 6-19 y 6-20).
 Todos los parámetros excepto los peores según el estudio realizado a partir del
tamaño del efecto de los parámetros (ver tablas 6-22 y 6-23)17.
 Todos los parámetros excepto los peores según el estudio realizado a partir de la
correlación de los parámetros con la variable dicotómica que indica si cada uno
de los sujetos tiene o no patología vocal (ver tablas 6-59 y 6-60).

Los siguientes estudios realizados están relacionados con el análisis factorial cuyos
resultados podemos ver en el apartado 6.2.2, y consisten en utilizar de forma
incremental los diferentes factores que resultan de aplicar la técnica a las bases de
datos de todos los sujetos utilizando la rotación varimax. Así, en un primer estudio se
empleó únicamente el primer factor; en el segundo, los dos primeros; en el tercero, los
tres primeros, y así sucesivamente hasta llegar a los once factores. Las pruebas se
repitieron utilizando, en lugar de los factores, los parámetros vinculados a los mismos.

Para terminar, también se ha realizado una prueba intuitiva en la que se ha


suprimido el parámetro 024 (Frecuencia Origen Señal), de acuerdo a los resultados
obtenidos en el estudio relacionado con la correlación parcial (apartado 6.2.1), y
teniendo en cuenta que se trata de un parámetro cuyos valores son prácticamente
constantes. La prueba se ha realizado tanto con los parámetros como con los factores
asociados.

A continuación mostraremos un conjunto de tablas que resumen los resultados


obtenidos para cada estudio. Naturalmente, los resultados completos tanto de la bases
de datos masculina como de la femenina se encuentran en el anexo incluido en el
disco adjunto. En las tablas siguientes podremos observar el nombre de cada prueba y
los porcentajes de acierto en la clasificación en cuatro casos diferentes: casos
seleccionados, validación cruzada, casos no seleccionados y una medida general
calculada como la media aritmética de los tres valores anteriores. Comenzaremos el
repaso con la base de datos femenina.

Tabla 6-67. Resultado de la primera tanda de pruebas de análisis discriminante, base


de datos femenina.
PRUEBA SELECCIO- VALIDACIÓN NO SELECCIO- MEDIDA
NADOS CRUZADA NADOS GENERAL
Todos 90-10 99,01% 86,44% 87,00% 90,82%
Todos 50-50 100,00% 69,00% 78,00% 82,33%
Factores 90-10 96,04% 95,57% 96,00% 95,87%
Factores 80-20 96,02% 95,02% 96,00% 95,68%
Factores 70-30 96,07% 94,65% 93,30% 94,67%
Factores 60-40 96,33% 94,30% 95,60% 95,41%
Factores 50-50 92,00% 92,00% 96,00% 93,33%

17
En este caso se han realizado algunas pruebas adicionales excluyendo, respectivamente, uno, seis,
ocho, nueve y doce parámetros (aquellos que, en cada caso, ofrecen un valor más bajo del tamaño del
efecto). Recordemos que el estudio original excluyó cuatro parámetros.

152
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

La tabla 6-67 recoge los resultados de las pruebas que implican a todos los
parámetros y a todos los factores extraídos de ellos, variando la proporción de casos
utilizados en la fase de entrenamiento y en la fase de clasificación. Podemos concluir
que el porcentaje en los valores seleccionados es siempre muy alto (por encima del
96%), rozando o alcanzando el 100% en el caso de las pruebas que involucran a los
parámetros. La validación cruzada ofrece mejores resultados en las pruebas que
utilizan factores, circunstancia que se repite en el caso de los valores no seleccionados
y también en el de la medida general, aunque no en el caso de los valores
seleccionados. En cuanto a la proporción entrenamiento/clasificación los resultados
son algo mejores para los casos 90-10, proporción que generalmente se considera más
adecuada. Son muy destacables los valores alcanzados en el caso del uso de factores
con la proporción entrenamiento/clasificación 90-10.

Tabla 6-68. Resultado de la segunda tanda de pruebas de análisis discriminante, base


de datos femenina.
PRUEBA SELECCIO- VALIDACIÓN NO MEDIDA
NADOS CRUZADA SELECCIO- GENERAL
NADOS
Factores
85,56% 84,76% 83,00% 84,44%
PERTURBACIÓN/ENERGÍA
Factores
87,58% 87,03% 87,00% 87,20%
BIOMÉTRICOS
Factores
86,80% 85,22% 86,00% 86,01%
BIOMECÁNICOS
Factores
73,98% 73,09% 74,00% 73,69%
TEMPORALES
Parámetros
87,58% 84,88% 85,00% 85,82%
PERTURBACIÓN/ENERGÍA
Parámetros
93,98% 86,56% 88,00% 89,51%
BIOMÉTRICOS
Parámetros
93,54% 89,78% 90,00% 91,11%
BIOMECÁNICOS
Parámetros
78,79% 75,90% 77,00% 77,23%
TEMPORALES

La tabla 6-68 recoge los resultados de las pruebas en las que se han utilizado
únicamente factores y parámetros pertenecientes a cada una de las familias
empleadas en la tesis. Es destacable el hecho de que los valores obtenidos con los
parámetros son más altos que los obtenidos con los factores prácticamente en todos
los casos.
Por otra parte, podemos observar que los parámetros que por sí solos tienen más
éxito son los biomecánicos y los biométricos, con valores que rondan el 90%. Los de
perturbación y energía alcanzan valores algo menores, moviéndose en torno al 86%.
Los parámetros temporales alcanzan cotas más pequeñas, alrededor del 77%. En todo
caso, todos los resultados obtenidos son apreciables, teniendo en cuenta que
proceden de estudios en los que se han utilizado un número relativamente reducido
de datos.

153
Capítulo 6: Experimentación y resultados

Tabla 6-69. Resultado de la tercera tanda de pruebas de análisis discriminante, base de


datos femenina.
PRUEBA SELECCIO- VALIDACIÓN NO MEDIDA
NADOS CRUZADA SELECCIO- GENERAL
NADOS
Parámetros
96,04% 85,99% 88,00% 90,01%
SIN PERTURBACIÓN/ENERGÍA
Parámetros
97,80% 89,89% 92,00% 93,23%
SIN BIOMÉTRICOS
Parámetros
98,46% 87,78% 88,00% 91,41%
SIN BIOMECÁNICOS
Parámetros
99,01% 87,01% 85,00% 90,34%
SIN TEMPORALES
Factores
92,31% 88,90% 89,00% 90,07%
SIN PERTURBACIÓN/ENERGÍA
Factores
95,46% 92,87% 93,00% 93,78%
SIN BIOMÉTRICOS
Factores
95,81% 93,53% 93,00% 94,11%
SIN BIOMECÁNICOS
Factores
93,98% 92,20% 93,00% 93,06%
SIN TEMPORALES

La tabla 6-69 recoge los resultados de las pruebas en las que se han utilizado todos
los parámetros excepto los de una de las familias en cada ocasión, junto con las
pruebas en las que, con el mismo esquema, se han utilizado los factores
correspondientes en lugar de los parámetros.
Los resultados son siempre algo mejores cuando empleamos factores que cuando
utilizamos parámetros. En el caso del uso de factores, la ausencia de cualquier familia
de parámetros en el modelo empeora los resultados obtenidos 18, aun manteniendo
unas tasas altas (algo menores en el caso de los factores obtenidos al prescindir de los
parámetros de perturbación/energía). En el caso del uso de parámetros, en cambio, los
resultados mejoran cuando prescindimos de los biomecánicos y mejoran aún algo más
cuando lo hacemos de los biométricos. En cambio, si prescindimos tanto de los
parámetros temporales como de los de perturbación/energía, las tasas empeoran
ligeramente.

Tabla 6-70. Resultado de la cuarta tanda de pruebas de análisis


discriminante, base de datos femenina.
PRUEBA SELECCIO- VALIDACIÓN NO MEDIDA
NADOS CRUZADA SELECCIO- GENERAL
NADOS
Parámetros
98,90% 88,13% 86,00% 91,01%
SIN EL 24
Factores
96,15% 95,57% 96,00% 95,91%
SIN EL 24

18
respecto al hecho de utilizarlos todos, tabla 6-67. En el resto del párrafo, las alusiones a los términos
"mejora" o "empeora" se refieren a la misma circunstancia.

154
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

La tabla 6-70 recoge los resultados de la pruebas en la que se han utilizado todos los
parámetros excepto el número 024 (Frecuencia Origen Señal), junto con la prueba en
la que, con el mismo esquema, se han utilizado los factores correspondientes en lugar
de los parámetros. Ambas pruebas mejoran ligeramente los resultados obtenidos en
las pruebas equivalentes en las que no se ha realizado la exclusión del parámetro en
cuestión, alcanzado siempre tasas más altas con los factores.
En esta tabla encontramos el mejor resultado de clasificación obtenido para la base
de datos femenina de todos los estudios realizados, obtenido con la utilización de los
factores extraídos a partir de todos los parámetros excepto el número 024, (Frecuencia
Origen Señal), en una proporción entrenamiento/clasificación de 90-10.
Tabla 6-71. Resultado de la quinta tanda de pruebas de análisis discriminante, base de
datos femenina.
PRUEBA SELECCIO- VALIDACIÓN NO MEDIDA
NADOS CRUZADA SELECCIO- GENERAL
NADOS
Mejores parámetros
98,00% 87,00% 94,00% 93,00%
DIAGRAMAS DE CAJA 50-50
Mejores parámetros
97,12% 91,65% 90,00% 92,92%
DIAGRAMAS DE CAJA 90-10
Mejores factores
92,00% 91,00% 92,00% 91,67%
DIAGRAMAS DE CAJA 50-50
Mejores factores
92,53% 91,65% 92,00% 92,06%
DIAGRAMAS DE CAJA 90-10
Mejores parámetros
98,00% 82,00% 91,00% 90,33%
DIFERENCIA DISTRIBUCIONES 50-50
Mejores parámetros
95,23% 88,57% 91,00% 91,60%
DIFERENCIA DISTRIBUCIONES 90-10
Mejores factores
93,00% 93,00% 92,00% 92,67%
DIFERENCIA DISTRIBUCIONES 50-50
Mejores factores
92,98% 92,87% 93,00% 92,95%
DIFERENCIA DISTRIBUCIONES 90-10
Mejores parámetros
97,00% 90,00% 92,00% 93,00%
TAMAÑO DEL EFECTO 50-50
Mejores parámetros
95,91% 91,43% 90,00% 92,45%
TAMAÑO DEL EFECTO 90-10
Mejores factores
93,00% 88,00% 91,00% 90,67%
TAMAÑO DEL EFECTO 50-50
Mejores factores
91,76% 90,55% 91,00% 91,10%
TAMAÑO DEL EFECTO 90-10
Mejores parámetros
90,00% 84,00% 87,00% 87,00%
CORRELACION CRITERIO SALUD 50-50
Mejores parámetros
90,66% 87,14% 87,00% 88,27%
CORRELACION CRITERIO SALUD 90-10
Mejores factores
88,00% 88,00% 89,00% 88,33%
CORRELACION CRITERIO SALUD 50-50
Mejores factores
87,69% 87,47% 88,00% 87,72%
CORRELACION CRITERIO SALUD 90-10
La tabla 6-71 recoge los resultados de las pruebas en las que se han utilizado los
mejores parámetros según cada uno de los estudios estadísticos realizados en esta
tesis que permiten catalogarlos como tales. Como es habitual, también aparecen los
resultados que ofrecen los factores obtenidos de los mismos parámetros. Además,

155
Capítulo 6: Experimentación y resultados

todas las pruebas se han llevado a cabo utilizando dos proporciones diferentes de
casos de entrenamiento y clasificación: 90-10 y 50-50, respectivamente.
El uso de parámetros o factores arroja resultados similares. En el caso de los
estudios relacionados con los diagramas de caja y con el tamaño del efecto los
parámetros alcanzan valores ligeramente mayores, mientras que en los estudios
relacionados con la diferencia de distribuciones y con la correlación con la variable
dicotómica "patológico-sano" sucede lo contrario. Los resultados son también muy
parecidos en las dos proporciones de casos de entrenamiento y clasificación utilizadas,
obteniendo la opción 90-10 resultados ligeramente mejores en la mayoría de los casos.
En cuanto a los tipos de estudios realizados, en los tres primeros casos (diagramas
de caja, diferencia de distribuciones y tamaño del efecto) obtenemos cotas superiores
que alcanzan o se acercan al 93% en la medida general, mientras que en el último
estudio (correlación con la variable "patológico-sano") superamos el 88%. Cabe
destacar, como en estudios anteriores, la elevada capacidad discriminante de un
conjunto relativamente pequeño de parámetros.
Tabla 6-72. Resultado de la sexta tanda de pruebas de análisis discriminante, base de datos
femenina.
PRUEBA SELECCIO- VALIDACIÓN NO SELECCIO- MEDIDA
NADOS CRUZADA NADOS GENERAL
Sin peores parámetros
100,00% 73,00% 78,00% 83,67%
DIFERENCIA DISTRIBUCIONES 50-50
Sin peores parámetros
99,34% 87,10% 87,00% 91,15%
DIFERENCIA DISTRIBUCIONES 90-10
Sin peores factores
96,00% 90,00% 96,00% 94,00%
DIFERENCIA DISTRIBUCIONES 50-50
Sin peores factores
96,04% 94,54% 96,00% 95,53%
DIFERENCIA DISTRIBUCIONES 90-10
Sin peores parámetros
100,00% 73,00% 84,00% 85,67%
TAMAÑO DEL EFECTO 50-50
Sin peores parámetros
99,23% 87,47% 90,00% 92,23%
TAMAÑO DEL EFECTO 90-10
Sin peores factores
95,00% 90,00% 96,00% 93,67%
TAMAÑO DEL EFECTO 50-50
Sin peores factores
95,47% 93,99% 95,00% 94,82%
TAMAÑO DEL EFECTO 90-10
Sin peores parámetros
99,00% 79,00% 84,00% 87,33%
CORRELACION CRITERIO SALUD 50-50
Sin peores parámetros
98,46% 88,12% 88,00% 91,53%
CORRELACION CRITERIO SALUD 90-10
Sin peores factores
95,00% 90,00% 92,00% 92,33%
CORRELACION CRITERIO SALUD 50-50
Sin peores factores
95,93% 93,21% 94,00% 94,38%
CORRELACION CRITERIO SALUD 90-10
Sin peores factores
96,04% 95,11% 96,00% 95,72%
TAMAÑO DEL EFECTO 50-50 1
Sin peores factores
95,81% 93,44% 94,00% 94,42%
TAMAÑO DEL EFECTO 50-50 6
Sin peores factores
96,04% 94,89% 95,00% 95,31%
TAMAÑO DEL EFECTO 50-50 8
Sin peores factores
96,04% 94,88% 95,00% 95,31%
TAMAÑO DEL EFECTO 50-50 9
Sin peores factores
95,69% 93,65% 95,00% 94,78%
TAMAÑO DEL EFECTO 50-50 12

156
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

La tabla 6-72 recoge los resultados de las pruebas en las que se han suprimido los
peores parámetros, siempre según cada uno de los estudios estadísticos realizado en
esta tesis que permiten catalogarlos como tales. También aparecen en la tabla los
resultados que ofrecen los factores obtenidos de los mismos parámetros. Además,
como en la tabla anterior, todas las pruebas se han realizado utilizando dos
proporciones diferentes de casos de entrenamiento y clasificación: 90-10 y 50-50,
respectivamente. Por último, el estudio relacionado con el tamaño del efecto incluye
algunas pruebas adicionales en las que se han eliminado un número diferente de
parámetros para generar los factores empleados: uno, seis, ocho, nueve y doce
parámetros, respectivamente.
Los factores obtienen mejores resultados que los parámetros en todos los casos, al
igual que sucede con la proporción 90-10 respecto a la 50-50. En cuanto a los estudios
realizados, al prescindir de los peores parámetros en cada uno de ellos se obtienen
resultados muy altos. Destacamos en este sentido el estudio relacionado con la
diferencia de distribuciones utilizando factores y usando la proporción
entrenamiento/clasificación 90-10. En cualquier caso, los resultados son siempre
ligeramente peores que en los estudios en los que se utilizan todos los parámetros o
factores. En la misma línea, las pruebas adicionales relacionadas con el tamaño del
efecto también obtienen tasas cercanas a los mejores resultados obtenidos.

Tabla 6-73. Resultado de la séptima tanda de pruebas de análisis discriminante, base


de datos femenina.
PRUEBA SELECCIO- VALIDACIÓN NO SELECCIO- MEDIDA
NADOS CRUZADA NADOS GENERAL
Factores F1 82,97% 82,75% 83,00% 82,91%
Factores F2 87,13% 85,89% 86,00% 86,34%
Factores F3 88,79% 88,02% 89,00% 88,60%
Factores F4 88,46% 87,69% 89,00% 88,38%
Factores F5 91,65% 90,11% 92,00% 91,25%
Factores F6 92,20% 90,77% 92,00% 91,66%
Factores F7 94,65% 94,09% 94,00% 94,25%
Factores F8 94,99% 94,08% 94,00% 94,36%
Factores F9 94,99% 94,19% 94,00% 94,39%
Factores F10 95,93% 94,88% 96,00% 95,60%
Factores F11 96,04% 95,57% 96,00% 95,87%
Parámetros F1 91,54% 89,12% 89,00% 89,89%
Parámetros F2 92,20% 88,02% 88,00% 89,41%
Parámetros F3 96,81% 89,67% 86,00% 90,83%
Parámetros F4 96,36% 88,90% 89,00% 91,42%
Parámetros F5 96,58% 88,90% 89,00% 91,49%
Parámetros F6 97,24% 88,02% 87,00% 90,75%
Parámetros F7 98,01% 87,91% 85,00% 90,31%
Parámetros F8 98,01% 86,90% 86,00% 90,30%
Parámetros F9 98,13% 87,45% 86,00% 90,53%
Parámetros F10 98,35% 87,78% 88,00% 91,38%
Parámetros F11 98,68% 87,00% 86,00% 90,56%

157
Capítulo 6: Experimentación y resultados

La tabla 6-73 recoge los resultados de las pruebas en las que se han utilizado, de
forma incremental, los diferentes factores obtenidos utilizando todos los parámetros
con la rotación varimax (en la primera prueba se ha empleado únicamente el primer
factor, en la segunda prueba se han empleado los dos primeros factores, y así
sucesivamente). En la tabla aparecen también los resultados de las pruebas realizadas
utilizando los parámetros correspondientes a cada uno de los factores empleados en
las pruebas anteriores.

Fig. 6-1. Representación gráfica de los datos correspondientes a los factores presentes
en la tabla 6-73.

Fig. 6-2. Representación gráfica de los datos correspondientes a los parámetros


presentes en la tabla 6-73.

158
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

En la figura 6-1 podemos observar que se produce un incremento en las tasas a


medida que utilizamos más factores. Esto se produce en todas las medidas. En el caso
de los parámetros no se produce esta circunstancia, los valores tienden a permanecer
constantes, y, salvo en el caso de los datos seleccionados, alcanzan valores menores,
como podemos ver en la figura 6-2.
A continuación pasamos a mostrar y comentar los resultados de la base de datos
masculina.
Tabla 6-74. Resultado de la primera tanda de pruebas de análisis discriminante,
base de datos masculina.
PRUEBA SELECCIO- VALIDACIÓN NO SELECCIO- MEDIDA
NADOS CRUZADA NADOS GENERAL
Todos 90-10 95,66% 82,10% 87,00% 88,25%
Todos 50-50 99,00% 59,00% 73,00% 77,00%
Factores 90-10 88,90% 86,46% 87,00% 87,45%
Factores 80-20 88,78% 86,02% 85,00% 86,60%
Factores 70-30 90,00% 85,70% 85,80% 87,17%
Factores 60-40 90,00% 86,66% 86,70% 87,79%
Factores 50-50 92,00% 82,00% 83,00% 85,67%
La tabla 6-74 recoge los resultados de las pruebas que implican a todos los
parámetros y a todos los factores extraídos de ellos, variando la proporción de casos
utilizados en la fase de entrenamiento y en la fase de clasificación. Las tasas más altas
corresponden al estudio en el que se utilizan todos los parámetros con una proporción
entrenamiento/clasificación de 90-10, resultando ser uno de los estudios más
importantes de la base de datos masculina. El uso de factores también arroja valores
altos, especialmente con las proporciones entrenamiento/clasificación 90-10 y 60-40.
Tabla 6-75. Resultado de la segunda tanda de pruebas de análisis discriminante, base
de datos masculina.
PRUEBA SELECCIO- VALIDACIÓN NO MEDIDA
NADOS CRUZADA SELECCIO- GENERAL
NADOS
Factores
83,53% 82,09% 82,00% 82,54%
PERTURBACIÓN/ENERGÍA
Factores
75,68% 72,98% 72,00% 73,55%
BIOMÉTRICOS
Factores
82,43% 82,21% 82,00% 82,21%
BIOMECÁNICOS
Factores
66,33% 65,22% 65,00% 65,52%
TEMPORALES
Parámetros
87,47% 80,34% 77,00% 81,60%
PERTURBACIÓN/ENERGÍA
Parámetros
90,99% 79,45% 86,00% 85,48%
BIOMÉTRICOS
Parámetros
89,01% 83,78% 85,44% 86,08%
BIOMECÁNICOS
Parámetros
72,98% 68,35% 68,00% 69,78%
TEMPORALES

159
Capítulo 6: Experimentación y resultados

La tabla 6-75 recoge los resultados de las pruebas en las que se han utilizado
únicamente factores y parámetros pertenecientes a cada una de las familias
empleadas en la tesis. Podemos observar que los parámetros se comportan mejor que
los factores, excepto en el caso de los de perturbación/energía. En particular, los
parámetros biométricos y los biomecánicos alcanzan tasas muy elevadas (alrededor
del 85% en la medida general). Por el contrario, tanto los parámetros como los
factores temporales arrojan resultados de clasificación más modestos (alrededor del
65% los primeros, sin alcanzar el 70% los segundos, ambos en la medida general).
Tabla 6-76. Resultado de la tercera tanda de pruebas de análisis discriminante, base de
datos masculina.
PRUEBA SELECCIO- VALIDACIÓN NO MEDIDA
NADOS CRUZADA SELECCIO- GENERAL
NADOS
Parámetros SIN
94,78% 82,44% 84,00% 87,07%
PERTURBACIÓN/ENERGÍA
Parámetros
93,42% 84,33% 84,00% 87,25%
SIN BIOMÉTRICOS
Parámetros
92,97% 75,44% 81,00% 83,14%
SIN BIOMECÁNICOS
Parámetros
95,32% 85,79% 89,00% 90,04%
SIN TEMPORALES
Factores SIN
84,49% 80,66% 79,00% 81,38%
PERTURBACIÓN/ENERGÍA
Factores
89,45% 86,56% 84,00% 86,67%
SIN BIOMÉTRICOS
Factores
89,56% 85,43% 85,00% 86,66%
SIN BIOMECÁNICOS
Factores
89,34% 83,53% 83,00% 85,29%
SIN TEMPORALES
La tabla 6-76 recoge los resultados de las pruebas en las que se han utilizado todos
los parámetros excepto los de una de las familias en cada ocasión, junto con las
pruebas en las que, con el mismo esquema, se han utilizado los factores
correspondientes en lugar de los parámetros. Podemos observar que los parámetros
alcanzan tasas más elevadas que los factores, excepto en el caso de los biomecánicos.
En todo caso, ya sea utilizando parámetros o factores, el hecho de prescindir de
cualquiera de las familias utilizadas mantiene valores muy altos, pero sin llegar a los
alcanzados cuando incluimos estas familias. Esto sucede en todos los casos excepto
cuando prescindimos de los parámetros temporales. En este último caso mejoramos
los resultados obtenidos con todos los parámetros, alcanzando con este estudio los
mejores resultados de toda la base de datos masculina.
Tabla 6-77. Resultado de la cuarta tanda de pruebas de análisis
discriminante, base de datos masculina.
PRUEBA SELECCIO- VALIDACIÓN NO SELECCIO- MEDIDA
NADOS CRUZADA NADOS GENERAL
Parámetros
95,53% 82,77% 86,00% 88,10%
SIN EL 24
Factores
88,90% 86,02% 87,00% 87,31%
SIN EL 24

160
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

La tabla 6-77 recoge los resultados de la pruebas en la que se han utilizado todos los
parámetros excepto el número 024 (Frecuencia Origen Señal), junto con la prueba en
la que, con el mismo esquema, se han utilizado los factores correspondientes en lugar
de los parámetros. Podemos observar que las dos pruebas obtienen resultados muy
similares aunque ligeramente inferiores a los obtenidos en las pruebas equivalentes en
las que se han utilizados todos los parámetros y factores, respectivamente.

Tabla 6-78. Resultado de la quinta tanda de pruebas de análisis discriminante, base de


datos masculina.
PRUEBA SELECCIO- VALIDACIÓN NO MEDIDA
NADOS CRUZADA SELECCIO- GENERAL
NADOS
Mejores parámetros
95,00% 82,00% 80,00% 85,67%
DIAGRAMAS DE CAJA 50-50
Mejores parámetros
91,99% 87,35% 83,00% 87,45%
DIAGRAMAS DE CAJA 90-10
Mejores factores
91,00% 87,00% 84,00% 87,33%
DIAGRAMAS DE CAJA 50-50
Mejores factores
86,01% 85,00% 85,00% 85,34%
DIAGRAMAS DE CAJA 90-10
Mejores parámetros
95,00% 81,00% 74,00% 83,33%
DIFERENCIA DISTRIBUCIONES 50-50
Mejores parámetros
91,65% 86,25% 84,00% 87,30%
DIFERENCIA DISTRIBUCIONES 90-10
Mejores factores
88,05% 87,05% 83,20% 86,10%
DIFERENCIA DISTRIBUCIONES 50-50
Mejores factores
86,58% 83,53% 84,00% 84,70%
DIFERENCIA DISTRIBUCIONES 90-10
Mejores parámetros
88,00% 82,00% 79,00% 83,00%
TAMAÑO DEL EFECTO 50-50
Mejores parámetros
86,67% 81,32% 83,00% 83,66%
TAMAÑO DEL EFECTO 90-10
Mejores factores
86,00% 83,00% 81,00% 83,33%
TAMAÑO DEL EFECTO 50-50
Mejores factores
83,28% 80,77% 82,00% 82,02%
TAMAÑO DEL EFECTO 90-10
Mejores parámetros
93,00% 84,00% 77,00% 84,67%
CORRELACION CRITERIO SALUD 50-50
Mejores parámetros
89,12% 84,10% 81,00% 84,74%
CORRELACION CRITERIO SALUD 90-10
Mejores factores
89,00% 89,00% 80,00% 86,00%
CORRELACION CRITERIO SALUD 50-50
Mejores factores
85,21% 85,09% 85,00% 85,10%
CORRELACION CRITERIO SALUD 90-10

La tabla 6-78 recoge los resultados de las pruebas en las que se han utilizado los
mejores parámetros según cada uno de los estudios realizado en esta tesis que
permiten catalogarlos como tales. Además, también aparecen los resultados que
ofrecen los factores obtenidos de los mismos parámetros. Por otra parte, todas las
pruebas se han realizado utilizando dos proporciones diferentes de casos de
entrenamiento y clasificación: 90-10 y 50-50, respectivamente.
El uso de parámetros o factores arroja resultados muy similares. Lo mismo sucede
con las dos proporciones empleadas de casos de entrenamiento y clasificación. En
cuanto a los tipos de estudios realizados, los relacionados con diagramas de caja y con
161
Capítulo 6: Experimentación y resultados

diferencia de distribuciones alcanzan unas cotas muy elevadas, próximas a las de los
mejores estudios de la base de datos. El estudio relacionado con la correlación de la
variable binaria "patológico-sano" baja ligeramente sus prestaciones, y algo más lo
hace el estudio relacionado con el tamaño del efecto, aun manteniendo valores
apreciables.
Tabla 6-79. Resultado de la sexta tanda de pruebas de análisis discriminante, base de
datos masculina
PRUEBA SELECCIO- VALIDACIÓN NO MEDIDA
NADOS CRUZADA SELECCIO- GENERAL
NADOS
Sin peores parámetros
98,05% 69,35% 73,70% 80,37%
DIFERENCIA DISTRIBUCIONES 50-50
Sin peores parámetros
95,22% 83,11% 81,00% 86,44%
DIFERENCIA DISTRIBUCIONES 90-10
Sin peores factores
89,00% 85,00% 78,00% 84,00%
DIFERENCIA DISTRIBUCIONES 50-50
Sin peores factores
90,21% 87,69% 86,00% 87,97%
DIFERENCIA DISTRIBUCIONES 90-10
Sin peores parámetros
100,00% 67,00% 74,00% 80,33%
TAMAÑO DEL EFECTO 50-50
Sin peores parámetros
96,12% 83,43% 87,00% 88,85%
TAMAÑO DEL EFECTO 90-10
Sin peores factores
91,00% 86,00% 81,00% 86,00%
TAMAÑO DEL EFECTO 50-50
Sin peores factores
88,79% 87,52% 84,00% 86,77%
TAMAÑO DEL EFECTO 90-10
Sin peores parámetros
97,00% 73,00% 80,00% 83,33%
CORRELACION CRITERIO SALUD 50-50
Sin peores parámetros
93,20% 81,98% 84,00% 86,39%
CORRELACION CRITERIO SALUD 90-10
Sin peores factores
91,00% 86,00% 85,00% 87,33%
CORRELACION CRITERIO SALUD 50-50
Sin peores factores
89,67% 86,91% 85,00% 87,19%
CORRELACION CRITERIO SALUD 90-10

La tabla 6-79 recoge los resultados de las pruebas en las que se han suprimido los
peores parámetros, siempre según cada uno de los estudios realizado en esta tesis que
permiten catalogarlos como tales. Aparecen también en la tabla los resultados que
ofrecen los factores obtenidos de los mismos parámetros. Además, como en la tabla
anterior, todas las pruebas se han realizado utilizando dos proporciones diferentes de
casos de entrenamiento y clasificación: 90-10 y 50-50, respectivamente.
Los factores obtienen mejores resultados que los parámetros en todos los casos
excepto en el estudio relacionado con el tamaño del efecto con proporción
entrenamiento/clasificación de 90-10.
En cuanto a las dos proporciones utilizadas, la 90-10 obtiene mejores resultados en
todos los casos excepto en el estudio relacionado con la correlación con la variable
dicotómica "sano-patológico" que utiliza factores.
En cuanto a los estudios estadísticos, todos ellos alcanzan cotas muy elevadas,
cercanas a las de los mejores resultados obtenidos en la base de datos. Destacamos
especialmente el estudio relacionado con el tamaño del efecto empleando parámetros

162
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

y con proporción clasificación/entrenamiento 90-10, ya que obtiene uno de los


mejores resultados de todos los estudios realizados en la base de datos masculina.

Tabla 6-80. Resultado de la séptima tanda de pruebas de análisis discriminante,


base de datos masculina.
PRUEBA SELECCIO- VALIDACIÓN NO SELECCIO- MEDIDA
NADOS CRUZADA NADOS GENERAL
Factores F1 83,31% 80,11% 78,00% 80,47%
Factores F2 88,46% 78,67% 78,00% 81,71%
Factores F3 92,64% 80,22% 80,00% 84,29%
Factores F4 94,41% 83,97% 84,00% 87,46%
Factores F5 94,09% 81,87% 81,00% 85,65%
Factores F6 94,33% 81,87% 81,00% 85,73%
Factores F7 95,24% 81,99% 85,00% 87,41%
Factores F8 95,57% 81,11% 80,00% 85,56%
Factores F9 95,69% 80,33% 81,00% 85,67%
Factores F10 95,70% 80,44% 82,00% 86,05%
Factores F11 95,47% 82,00% 84,00% 87,16%
Parámetros F1 83,42% 83,20% 83,00% 83,21%
Parámetros F2 85,33% 83,86% 86,00% 85,06%
Parámetros F3 85,80% 84,10% 84,00% 84,63%
Parámetros F4 86,69% 84,21% 84,00% 84,97%
Parámetros F5 87,13% 83,88% 84,00% 85,00%
Parámetros F6 88,35% 86,00% 84,00% 86,12%
Parámetros F7 88,24% 84,77% 84,00% 85,67%
Parámetros F8 88,79% 85,00% 85,00% 86,26%
Parámetros F9 89,78% 85,22% 86,00% 87,00%
Parámetros F10 89,01% 86,90% 87,00% 87,64%
Parámetros F11 88,85% 86,46% 87,00% 87,44%

La tabla 6-80 recoge los resultados de las pruebas en las que se han utilizado, de
forma incremental, los diferentes factores obtenidos utilizando todos los parámetros
con la rotación varimax (en la primera prueba se ha empleado únicamente el primer
factor, en la segunda prueba se han empleado los dos primeros factores, y así
sucesivamente). En la tabla aparecen también los resultados de las pruebas realizadas
utilizando los parámetros correspondientes a cada uno de los factores empleados en
las pruebas anteriores.

163
Capítulo 6: Experimentación y resultados

Fig. 6-3. Representación gráfica de los datos correspondientes a los factores


presentes en la tabla 6-80.

Fig. 6-4. Representación gráfica de los datos correspondientes a los


parámetros presentes en la tabla 6-80.
En la figura 6-3 podemos observar que, aunque de un modo irregular, se produce
un incremento en las tasas a medida que utilizamos más factores, circunstancia que se
repite en todas las medidas. En el caso de los parámetros, en cambio, los valores
tienen una tendencia mayor a permanecer constantes, como podemos ver en la figura
6-4. Además, observamos en ambas figuras que los factores alcanzan tasas algo más
elevadas, excepto en el caso de los datos seleccionados.

A continuación presentaremos algunos datos adicionales pertenecientes a los


estudios que han obtenido tasas de clasificación más altas en las bases de datos
femenina y masculina. Incorporaremos el detalle de los diez pasos realizados en cada
estudio, correspondientes a las variaciones producidas en cuanto a los sujetos que

164
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

intervienen en la fase de clasificación y en la de entrenamiento. También ofreceremos


datos de clasificación referidos a los casos patológicos y normofónicos por separado.
Por último, mencionaremos aspectos relacionados con la idoneidad de la aplicación de
la técnica en base a la colinealidad, la heterocedasticidad o la separación de los grupos.
También haremos algún comentario acerca de los parámetros que han resultado más
significativos en los estudios, así como acerca de las probabilidades asociadas con el
veredicto de clasificación ofrecido.

Tabla 6-81. Resultado detallado del estudio correspondiente al uso de los factores
extraídos de todos los parámetros excepto el número 024 (Frecuencia Origen Señal),
base de datos femenina.
Seleccio- Normo- Patoló- Validación Normo- Patoló- No Normo- Patoló-
nados fónicos gicos Cruzada fónicos gicos seleccio- fónicos gicos
nados

Serie 1 95,6 97,8 93,3 95,6 97,8 93,3 100 100 100
Serie 2 96,7 97,8 95,6 96,7 97,8 95,6 90 100 80
Serie 3 95,6 97,8 93,3 95,6 97,8 93,3 100 100 100
Serie 4 95,6 97,8 93,3 95,6 97,8 93,3 100 100 100
Serie 5 95,6 97,8 93,3 94,4 97,8 91,1 100 100 100
Serie 6 95,6 97,8 93,3 95,6 97,8 93,3 100 100 100
Serie 7 97,8 100 95,6 96,7 97,8 95,6 90 100 80
Serie 8 97,8 100 95,6 97,8 100 95,6 80 80 80
Serie 9 95,6 97,8 93,3 94,4 97,8 91,1 100 100 100
Serie 10 95,6 97,8 93,3 93,3 97,8 98,9 100 100 100
Total 96,15 98,24 93,99 95,57 98,02 94,11 96 98 94

En la tabla 6-81 podemos observar el resultado del estudio que mejores resultados
ha obtenido en la base de datos femenina, correspondiente al uso de los factores
extraídos de todos los parámetros utilizados en este trabajo excepto del referido a la
frecuencia del origen de la fuente glótica, parámetro biométrico numerado con el 024.
La medida general alcanza un 95,91% de éxito, la clasificación de valores seleccionados
obtiene el 96,15%, la tasa de validación cruzada llega al 95,57% y la clasificación de
valores no seleccionados alcanza el 96%.

Comprobamos en la tabla que las diez series obtienen valores similares, y, sobre
todo, que la clasificación correcta de casos normofónicos es elevadísima, alcanzando o
superando el 98% en todos los casos. La tasa de acierto de casos patológicos, aún
siendo alta, cae cuatro puntos con respecto a la anterior. Como podemos comprobar
en el anexo incluido en el disco adjunto, esta tendencia se repite en todos los estudios
realizados.
En cuanto a las pruebas relacionadas con la idoneidad de la prueba, podemos
comentar que este estudio supera las pruebas de colinealidad, debido al uso de
factores ortogonales entre sí. En cuanto a la prueba M de Box, es posible rechazar la
hipótesis de igualdad de matrices de varianzas-covarianzas entre los grupos, y por

165
Capítulo 6: Experimentación y resultados

tanto concluir que uno de los grupos es más variable que el otro. Por otro lado, el
estadístico lambda de Wilks19 permite confirmar en todos los casos de forma
significativa que la diferencia entre los grupos es suficientemente grande, ofreciendo
siempre valores inferiores a 0,3. Este resultado lo confirman los autovalores 20, siempre
por encima de 2,5 y también el índice de correlación canónica 21, siempre por encima
de 0,8.

Por otra parte, los parámetros que más importancia tienen a la hora de predecir el
grupo de pertenencia de los sujetos son los siguientes:

 Jitter.
 Desbalance de la pérdida del cuerpo de los pliegues vocales.
 Tercera banda de energía de la onda mucosa.
 Cuarta banda de energía de la onda mucosa.
 Amplitud 1er mínimo de la densidad espectral de potencia de la fuente glótica.
 Amplitud 2º máximo de la densidad espectral de potencia fuente glótica.
 Desbalance de la masa del cuerpo de los pliegues vocales.
 Desbalance de la pérdida de energía del cuerpo de los pliegues vocales.

Los dos primeros parámetros, es decir, el parámetro de perturbación jitter y el


desbalance de la pérdida de energía del cuerpo del pliegue vocal destacan
especialmente en la influencia de predicción. En el listado aparecen, además, dos
bandas de energía de la onda mucosa, además de dos parámetros biométricos y de
dos desbalances más de sendos elementos mecánicos de los pliegues vocales.

Por último, mencionaremos que los modelos ofrecen unas muy altas probabilidades
de pertenencia al grupo al que clasificaron en prácticamente todos los casos.

En la tabla 6-82 podemos observar el resultado del estudio que mejores resultados
ha obtenido en la base de datos masculina, correspondiente al uso de todos los
parámetros empleados en esta tesis excepto los pertenecientes a la familia de los
parámetros temporales. La medida general alcanza el 90,04% de éxito, la clasificación
de valores seleccionados obtiene el 95,32%, la tasa de validación cruzada llega al
85,79% y la clasificación de valores no seleccionados alcanza el 89%.

Las diez series, en general, obtienen resultados similares, y, como en la base de


datos femenina, la clasificación correcta de casos normofónicos es superior a la de los
casos patológicos, manteniendo la tendencia que se produce en todos los estudios.

19
El estadístico toma valores entre 0 y 1. Valores próximos a 0 indican gran diferencia entre los grupos.
20
Los autovalores tienen valor mínimo 0 y no tienen valor máximo. Valores próximos a 0 indican poca
diferencia entre los grupos.
21
Índice de correlación (valor entre 0 y 1). Correlaciones altas son indicadores de buena discriminación.

166
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla 6-82. Resultado detallado del estudio correspondiente al uso de todos los
parámetros excepto los temporales, base de datos masculina.
Seleccio- Normo- Patoló- Validación Normo- Patoló- No Normo- Patoló-
nados fónicos gicos Cruzada fónicos gicos seleccio- fónicos gicos
nados

Serie 1 96,7 95,6 97,8 86,7 91,1 82,2 80 100 60


Serie 2 94,4 95,6 93,3 85,6 91,1 80 100 100 100
Serie 3 94,4 95,6 93,3 86,7 91,1 82,2 90 80 100
Serie 4 94,4 95,6 93,3 86,7 88,9 84,4 90 80 100
Serie 5 93,3 93,3 93,3 85,6 91,1 80 100 100 100
Serie 6 97,8 97,8 97,8 88,9 88,9 88,9 80 80 80
Serie 7 95,6 95,6 95,6 81,1 86,7 75,6 100 100 100
Serie 8 94,4 95,6 93,3 83,3 88,9 77,8 100 100 100
Serie 9 94,4 95,6 93,3 84,4 88,9 80 90 100 80
Serie 10 97,8 97,8 97,8 88,9 91,1 86,7 60 100 20

Total 95,32 95,81 94,88 85,79 89,78 81,78 89 94 84

En cuanto a los estudios relacionados con la colinealidad, el sistema ha descartado a


los parámetros 026 y 040 (frecuencia del primer máximo de la fuente glótica y
desbalance de la elasticidad del cuerpo del pliegue vocal) en todas las series realizadas.
Además, el parámetro 043 (elasticidad de la cubierta del pliegue vocal) se ha suprimido
en nueve de las diez series (todas excepto la cuarta). Por último, el parámetro 046
(desbalance de la elasticidad de la cubierta del pliegue vocal) también fue descartado
en la segunda serie, y el parámetro 024 (frecuencia del origen de la fuente glótica), en
la cuarta serie22.

En general, estos parámetros aparecen de manera frecuente en los descartes


realizados para los diferentes estudios. Podemos ver las variables concretas
descartadas en cada uno de ellos, tanto de las bases de datos masculina como
femenina en el anexo incluido en el disco adjunto.

La prueba M de Box relacionada con la heterocedasticidad no es realizable en el


estudio que nos ocupa, debido a que los determinantes de las matrices de covarianzas
de los casos normofónicos se consideran nulos en los diez casos analizados. En cuanto
al estadístico lambda de Wilks, permite confirmar en todos los casos de forma
significativa que la diferencia entre los grupos es suficientemente grande, ofreciendo
siempre valores inferiores a 0,2. Este resultado es confirmado por los autovalores,
siempre por encima de 3,7 y también por los altos índices de correlación canónica,
siempre por encima de 0,88.
22
Recordemos que explicábamos en el capítulo cinco que el sistema estadístico calcula el denominado
índice de tolerancia (directamente relacionado con la correlación múltiple) para cada variable: en el caso
de ser este índice muy pequeño o si la inclusión de la variable en cuestión hace muy pequeña la
tolerancia de alguna de las variables ya incluida entonces la variable quedará excluida del modelo.

167
Capítulo 6: Experimentación y resultados

En esta ocasión los parámetros más importantes de cara a la predicción del grupo
de pertenencia de los locutores son los siguientes:

 Razón 2o armónico / 1er armónico de la onda mucosa.


 Amplitud 1er mínimo de la densidad espectral de potencia de la fuente glótica.
 Frecuencia origen de la densidad espectral de potencia de la fuente glótica.
 Cuarta banda de energía de la onda mucosa.
 Amplitud 1er máximo de la densidad espectral de potencia de la fuente glótica.
 Amplitud 2o máximo de la densidad espectral de potencia de la fuente glótica.
 Amplitud 2o mínimo de la densidad espectral de potencia de la fuente glótica.
 Frecuencia 2o mínimo de la densidad espectral de potencia de la fuente glótica.
 Esbeltez del 1er surco en V de la densidad espectral de potencia de la fuente
glótica.
 Pérdida de energía del cuerpo de los pliegues vocales.
 Desbalance de la masa del cuerpo de los pliegues vocales.
 Desbalance de la masa de la cubierta de los pliegues vocales.

Los tres primeros parámetros, –el primero de ellos de perturbación y los dos
siguientes biométricos– destacan sobre el resto en cuanto a su influencia de
predicción. En el listado aparecen, además, una banda de energía de la onda mucosa,
hasta cinco parámetros biométricos adicionales y tres parámetros biomecánicos, entre
los que están incluidos dos desbalances de elementos mecánicos de los pliegues
vocales.

Es destacable, además, que como en el caso del mejor estudio de la base de datos
femenina, los modelos ofrecen unas muy altas probabilidades de pertenencia al grupo
al que clasificaron en prácticamente todos los casos.

Por último y para concluir el estudio, aportaremos datos relacionados con algunos
estudios realizados sobre la base de datos global, es decir, con la utilización de los
sujetos de ambos géneros de forma indistinta. De este modo podremos comprobar
que las tasas de clasificación también alcanzan valores elevados, de cara a la
posibilidad de utilizar bases de datos en las que el género no esté etiquetado.

Tabla 6-83. Resultados de la tasa general para la base de datos global, y


comparativa con la suma de las tasas de las bases de datos femenina y
masculina.
PRUEBA MEDIDA MEDIDA
GENERAL BASE GENERAL
DE DATOS SUMA DE
GLOBAL BASES DE
DATOS
MASCULINA Y
FEMENINA
Todos los parámetros 90-10 90,28% 89,54%
Todos los factores 90-10 88,60% 91,66%
Todos los factores 80-20 88,79% 91,14%

168
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

PRUEBA MEDIDA MEDIDA


GENERAL BASE GENERAL
DE DATOS SUMA DE
GLOBAL BASES DE
DATOS
MASCULINA Y
FEMENINA
Todos los factores 70-30 88,57% 90,92%
Todos los factores 60-40 88,56% 91,60%
Todos los factores 50-50 88,17% 89,50%
Factores PERTURBACIÓN/ENERGÍA 85,47% 83,49%
Factores BIOMÉTRICOS 76,02% 80,38%
Factores BIOMECÁNICOS 81,98% 84,11%
Factores TEMPORALES 68,76% 69,60%
Factores SIN PERTURBACIÓN/ENERGÍA 84,74% 85,73%
Factores SIN BIOMÉTRICOS 89,79% 90,22%
Factores SIN BIOMECÁNICOS 88,70% 90,39%
Factores SIN TEMPORALES 88,13% 89,18%
Parámetros PERTURBACIÓN/ENERGÍA 84,32% 83,71%
Parámetros BIOMÉTRICOS 86,40% 87,50%
Parámetros BIOMECÁNICOS 88,00% 88,59%
Parámetros TEMPORALES 71,13% 73,50%
Parámetros SIN PERTURBACIÓN/ENERGÍA 90,01% 88,54%
Parámetros SIN BIOMÉTRICOS 90,45% 90,24%
Parámetros SIN BIOMECÁNICOS 87,77% 87,28%
Parámetros SIN TEMPORALES 88,86% 90,19%

En la tabla 6-83 podemos comprobar que se ha realizado una batería de pruebas


amplia, aunque más reducida que en el caso general. Estas pruebas comprenden el uso
de todos los parámetros y de todos los factores utilizando en este último caso
diferentes combinaciones en cuanto a la proporción de datos empleados para el
entrenamiento y para la clasificación. Además, se incluyen pruebas relacionadas con
los parámetros y los factores relacionados con las diferentes familias en estudio, por
inclusión y por exclusión. Podemos observar en la tabla que las tasas de clasificación
de todos los estudios son elevadas en el caso de la base de datos conjunta o global. En
realidad, son bastante similares a las que resultan de sumar los resultados de las bases
de datos masculina y femenina por separado, llegando a superarlas en algunos casos,
aunque los valores máximos alcanzados corresponden a estudios realizados con estas
últimas.

169
7. Contribuciones, conclusiones y líneas
futuras
Capítulo 7: Contribuciones, conclusiones y lineas futuras

7.1. Contribuciones y conclusiones

Las contribuciones realizadas están relacionadas con los objetivos marcados, y en


general aparecen repartidas por el texto, aunque la mayoría se encuentran en el
capítulo seis, dedicado a la experimentación y resultados. En este apartado
realizaremos un listado resumen de las mismas:

 Se ha presentado el método utilizado para la extracción de la señal glótica y de


sus componentes, la onda mucosa y la onda acústica promedio.

 Se ha presentado el método utilizado para la extracción de los parámetros


glóticos utilizados en el estudio, a partir de las señales mencionadas en la
contribución anterior.

 Se ha presentado una clasificación de los parámetros glóticos extraídos, de


acuerdo a su naturaleza: parámetros de perturbación o energía, parámetros
biométricos, parámetros biomecánicos y parámetros temporales.

 Se ha realizado un completo estudio descriptivo sobre los valores de todos los


parámetros glóticos empleados en el estudio. Destaca en este estudio
descriptivo la utilización de diagramas de caja, que permiten obtener una
primera lista de parámetros prometedores, desde el punto de vista de la
separación de grupos y de la detección.

 Se ha realizado un estudio sobre la normalidad estadística de los parámetros


glóticos en estudio. Para ello, se han considerado tanto las bases de datos
completas como los subconjuntos de casos patológicos y normofónicos.

 Se han realizado diferentes pruebas inferenciales sobre los valores de los


parámetros glóticos empleados en el estudio de cara a estudiar la diferencia
entre los conjuntos de sujetos normofónico y patológico: pruebas de Student,
Levene, Mann-Whitney, Kolmogorov-Smirnov, Moses y Wald-Wolfowitz. Estos
estudios también permiten obtener un listado de parámetros glóticos relevantes.

 Se han realizado pruebas específicas relacionadas con el tamaño del efecto sobre
la diferencia entre las distribuciones de casos patológicos y de casos
normofónicos. Los resultados obtenidos permiten obtener un listado ordenado
de parámetros glóticos relevantes.

 Se han realizado estudios de correlación lineal bivariada sobre los parámetros


glóticos. Estos estudios permiten obtener diferentes agrupaciones de
parámetros glóticos, en las bases de datos completas y también en los
subconjuntos de casos patológicos y normofónicos.

172
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

 Se han realizado estudios de correlación lineal de los parámetros glóticos con la


variable dicotómica que representa la pertenencia a los grupos patológicos y
normofónicos. Los resultados de estos estudios permiten obtener un listado
ordenado de parámetros glóticos relevantes.

 Se han realizado estudios de reducción de la dimensionalidad sobre los


parámetros glóticos. En concreto, se ha aplicado la técnica de análisis factorial
basada en componentes principales. Los estudios se han aplicado sobre las bases
de datos completas y también sobre los subconjuntos normofónicos y
patológicos. Los resultados permiten obtener diferentes agrupaciones de los
parámetros en torno a los factores, siendo especialmente claros los obtenidos de
soluciones rotadas.

 Se han realizado estudios de análisis discriminante sobre diferentes


combinaciones de parámetros glóticos y de factores extraídos de los mismos,
para las bases de datos femenina y masculina, y también para la base de datos
conjunta de ambos géneros.

 Se ha diseñado e implementado una aplicación informática de alta usabilidad


adecuada para realizar captura de la voz en condiciones favorables para el
análisis posterior.

A partir de las contribuciones señaladas se han podido derivar las siguientes


conclusiones:

 Los distintos estudios estadísticos realizados relacionados con la importancia de


los parámetros a la hora de discriminar a los sujetos con voces normofónicas de
los sujetos con voces afectadas de patología vocal revelan que:

- Los parámetros de perturbación no aparecen destacados en los diferentes


estudios realizados, con la excepción del jitter (parámetro 002) y de la razón
entre el segundo y el primer armónico de la onda mucosa (parámetro 010).
- De entre los parámetros de energía, las bandas relacionadas con la
densidad espectral de potencia de la onda mucosa destacan en los distintos
estudios realizados.
- Un número relevante de parámetros biomecánicos destaca en los distintos
estudios realizados, entre los que se cuentan los desbalances de diferentes
elementos mecánicos de los pliegues vocales.
- Un número relevante de parámetros biométricos destaca en gran parte de
los distintos estudios realizados.
- Los parámetros temporales no destacan en prácticamente ninguno de los
estudios realizados.

173
Capítulo 7: Contribuciones, conclusiones y líneas futuras

 Los resultados obtenidos de los diferentes estudios realizados de análisis


discriminante permiten concluir que, para la base de datos femenina, las mejores
combinaciones obtenidas son las siguientes:

1. Utilización de los factores extraídos de todos los parámetros glóticos


excepto del etiquetado con el número 024, frecuencia del origen de la
fuente glótica23 (medida general: 95,91%).
2. Utilización de los factores extraídos de todos los parámetros glóticos
(medida general: 95,87%).
3. Utilización de los factores extraídos de todos los parámetros glóticos
excepto de los considerados peores a partir del estudio que tiene en cuenta
la diferencia de las distribuciones: shimmer asociado a la esbeltez y razón
energía onda mucosa/onda acústica promedio, etiquetados con los
números 004 y 008, respectivamente (medida general: 95,53%).

 Los resultados obtenidos de los diferentes estudios realizados de análisis


discriminante permiten concluir que, para la base de datos masculina, las
mejores combinaciones obtenidas son las siguientes:

1. Utilización de todos los parámetros glóticos excepto los temporales


(medida general: 90,04%).
2. Utilización de todos los parámetros excepto de los considerados peores a
partir del estudio que tiene en cuenta el tamaño del efecto: amplitud del
primer máximo, shimmer asociado a la esbeltez, esbeltez correspondiente
al primer surco, masa del cuerpo, elasticidad del cuerpo, razón amplitud
pico de cierre glótico/vecino y razón energía onda mucosa/onda acústica
promedio, etiquetados con los números 017, 004, 033, 035, 037, 006 y 008,
respectivamente (medida general: 88,85%).
3. Utilización de todos los parámetros glóticos (medida general: 88,25%).

 Los resultados obtenidos de los diferentes estudios realizados de análisis


discriminante permiten concluir que con el uso exclusivo de parámetros glóticos
o factores extraídos de ellos pertenecientes a una sola de las familias utilizadas
en esta tesis se obtienen altas tasas de detección en todos los casos, pero sin
llegar a alcanzar los mejores resultados obtenidos 24.

23
Recordemos que la motivación para eliminar este parámetro nace en los estudios de correlación
parcial.
24
Las tasas obtenidas por los parámetros o factores temporales son sensiblemente inferiores a las del
resto de familias, si bien es cierto que los parámetros temporales son mucho menos numerosos.

174
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

 Los resultados obtenidos de los diferentes estudios realizados de análisis


discriminante permiten concluir que con el uso de la base de datos completa
excluyendo los parámetros glóticos o factores extraídos de ellos pertenecientes a
una sola de las familias utilizadas en esta tesis se obtienen altas tasas de
detección en todos los casos, pero sin llegar a alcanzar los mejores resultados
obtenidos25.

 Los resultados obtenidos de los diferentes estudios realizados de análisis


discriminante permiten concluir que la utilización exclusiva de los considerados
mejores parámetros o factores extraídos de ellos según diferentes análisis
estadísticos (diagramas de caja, diferencia de distribuciones, tamaño del efecto y
correlación con la variable dicotómica que representa la presencia o ausencia de
patología) permite obtener altas tasas de detección en todos los casos, pero sin
llegar a alcanzar los mejores resultados obtenidos.

 Los resultados obtenidos de los diferentes estudios realizados de análisis


discriminante permiten concluir que el uso de la base de datos completa con la
excepción de los considerados peores parámetros o factores extraídos de ellos
según diferentes análisis estadísticos (diagramas de caja, diferencia de
distribuciones, tamaño del efecto y correlación con la variable dicotómica que
representa la presencia o ausencia de patología) permite obtener altas tasas de
detección en todos los casos, pero sin llegar a alcanzar los mejores resultados
obtenidos.

 Los resultados obtenidos de los diferentes estudios realizados de análisis


discriminante permiten concluir que la utilización incremental de los diferentes
factores obtenidos utilizando todos los parámetros y empleando la rotación
varimax26 o de los parámetros correspondientes a cada uno de los factores
empleados en las pruebas anteriores permite obtener altas tasas de detección
en todos los casos, pero sin llegar a alcanzar los mejores resultados obtenidos.

 Los resultados obtenidos de los diferentes estudios realizados de análisis


discriminante permiten concluir que las tasas de detección obtenidas con la base
de datos en la que no distinguimos a los sujetos por su género alcanzan valores
altos y comparables a los obtenidos en las bases de datos en las que sí
distinguimos a los sujetos por su género.

25
De esta conclusión queda excluido el estudio en el que se suprimen los parámetros temporales en la
base de datos masculina, estudio en el que sí se alcanzan los mejores resultados.
26
Recordemos que en la primera prueba se empleó solo el primer factor; en la segunda, los dos
primeros factores, y así sucesivamente.

175
Capítulo 7: Contribuciones, conclusiones y líneas futuras

7.2. Líneas futuras

En este apartado mencionaremos de forma muy breve los posibles trabajos


derivados de la presente tesis o relacionados con ella.

En primer lugar destacaremos que el trabajo realizado involucra a una importante


cantidad de parámetros. En ese sentido, en prácticamente todos los estudios
realizados se han tenido en cuenta todos ellos. Sin embargo, en el estudio relacionado
con el análisis discriminante hemos trabajado con diferentes combinaciones de los
parámetros y de los factores extraídos a partir de ellos. Naturalmente, estas
combinaciones surgen precisamente del resto de los estudios, pero es conveniente
mencionar que, teniendo en cuenta que el objetivo con el que hemos utilizado la
técnica reside en alcanzar tasas de acierto en la clasificación lo más altas posible, cabe
la posibilidad de ampliar las combinaciones utilizadas.
Así, en el estudio relacionado con el del tamaño del efecto o en el relacionado con
la correlación con la variable dicotómica que refleja la presencia o ausencia de
patología es posible ampliar o reducir el número de parámetros etiquetados como
"mejores" o como "peores"; en el estudio relacionado con la diferencia de
distribuciones es posible utilizar los parámetros significativos para cada uno de los test
realizados, o para determinadas combinaciones de ellos; en el estudio relacionado con
los diagramas de caja se pueden establecer otros criterios diferentes para seleccionar
los parámetros más relevantes, etc.

En segundo lugar, pero también relacionado con el análisis discriminante, hay que
comentar que, como expusimos en el capítulo cinco y recordamos aquí de forma muy
breve, la técnica se basa en establecer dos grupos diferenciados y en clasificar nuevos
casos en un grupo o en otro en función de la distancia existente a los centroides de los
grupos. Este enfoque puede ser ampliado aumentando el número de categorías, para
tratar de precisar mejor la patología o el tipo de patología sufrida por el paciente.
Además, existen trabajos relacionados que utilizan un enfoque diferente, basado en
definir de forma lo más precisa posible el concepto de salud vocal, y en catalogar los
nuevos casos como más o menos patológicos en función de lo alejados que se
encuentren de lo considerado como sano. Este tipo de estudios permiten, además,
estimar la gradación de la patología. Encontramos más detalles en (Gómez, P. et al,
2009a) y en (Gómez, P. et al, 2011), y proponemos su continuidad utilizando las
diferentes combinaciones de parámetros que en esta tesis se han revelado como más
discriminantes para realizar los cálculos relacionados con la referencia de salud.

En tercer lugar, cabe utilizar las conclusiones obtenidas en cuanto a la calidad de los
parámetros glóticos para desarrollar una aplicación informática de ayuda al
diagnóstico similar a las expuestas en el capítulo cuatro, aplicación que podría ser
fusionada con la herramienta de captura desarrollada y mencionada en el primer
apéndice. También se plantea la posibilidad de incorporar estas conclusiones a la
herramienta BioMet®Pho, desarrollada por nuestro grupo de investigación.

176
Referencias documentales
Referencias documentales

Abad, A. (2013). The L2F broadcast news transcription system. En Application of Speech
Technologies. Benítez Ortúzar & Pérez Córdoba (eds). Universidad de Granada.

Adobe Systems Incoporated (2014). Sitio web de la aplicación Adobe Audition.


Disponible en https://creative.adobe.com/es/products/audition. Última consulta: 14-
Nov-2014.

Akande, O. O., & Murphy, P. J. (2005). Estimation of the vocal tract transfer function
with application to glottal wave analysis. Speech Communication,46(1), 15-36.

Alipour, F., Berry, D. A., & Titze, I. R. (2000). A finite-element model of vocal-fold
vibration. The Journal of the Acoustical Society of America, 108(6), 3003-3012.

Alku, P. (1992, March). An automatic method to estimate the time-based parameters


of the glottal pulseform. In IEEE International Conference on Acoustics, Speech, and
Signal Processing (Vol. 2, pp 29-32).

Alku, P. (2003). Parameterisation methods of the glottal flow estimated by inverse


filtering. In ISCA Tutorial and Research Workshop on Voice Quality: Functions, Analysis
and Synthesis (pp. 81-87).

Alonso, J. B., De Leon, J., Alonso, I., & Ferrer, M. A. (2001). Automatic detection of
pathologies in the voice by HOS based parameters. EURASIP Journal on Applied Signal
Processing (Vol. 4, pp. 275-284).

Alsulaiman, M. (2014). Voice Pathology Assessment Systems for Dysphonic Patients:


Detection, Classification, and Speech Recognition. IETE Journal of Research, 60(2), 156-
167.

American Otological Society. (1905). The Laryngoscope. Volume 15, 402-403.

Badin, P., Hertegård, S., & Karlsson, I. (1990). Notes on the Rothenberg mask. STL-
QPSR, 31, 1-7.

Baken, R. J., & Orlikoff, R. F. (2000). Clinical measurement of speech and voice. Cengage
Learning.

Banci, G., Monini, S., Falaschi, A., & De Sario, N. (1986). Vocal fold disorder evaluation
by digital speech analysis. Journal of Phonetics, 14(3-4), 495-499.

Belsley, D. A. (1976). Multicollinearity: diagnosing its presence and assessing the


potential damage it causes least squares estimation. NBER Working Paper, (w0154).

Benba, A., Jilbab, A., & Hammouch, A. (2014). Voice analysis for detecting persons with
Parkinson’s disease using MFCC and VQ. In The 2014 International Conference on
Circuits, Systems and Signal Processing.

178
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Berry, D. A. (2001). Mechanisms of modal and nonmodal phonation. Journal of


Phonetics, 29(4), 431-450.

Bisquerra, R. (1987). Introducción a la estadística aplicada a la investigación


educativa. Un enfoque informático con los paquetes BMDP y SPSSX. PPU, Barcelona.

Beceiro, D. I. E., Macías, F. S., Ortiz, D. S. D. C., & Reyes, D. E. J. M. (2009). Adaptación
del diagrama de bloques de un algoritmo para la extracción de la frecuencia
fundamental en el llanto infantil. Ciencia en su PC, (2).

Bolettieri, S. (2007). Clasificación de las disfonías y concepto de diferentes autores para


clasificarlas. Informe técnico. Hospital Enrique Tornú, Buenos Aires, Argentina.

Bovbel, E. I., & Toumilovich, M. A. (1999). Stochastic approach to vocal fold pathology
diagnostics. In MAVEBA (pp. 112-117).

Boyanov, B., & Chollet, G. (1992). Pathological voice analysis using cepstra, bispectra
and group delay functions. In Second International Conference on Spoken Language
Processing (pp. 1039-1042).

Boyanov, B., & Hadjitodorov, S. (1997). Acoustic analysis of pathological voices. A voice
analysis system for the screening of laryngeal diseases.Engineering in Medicine and
Biology Magazine, IEEE, 16(4), 74-82.

Cabrera, J., Alonso, J. B., De León, J., Ferrer, M. A., Henríquez, P., & Travieso, C. M.
(2014). Web server for evaluation of voice quality: e-VOICE. In Proceedings of VII
Jornadas en Tecnologías del Habla and IV Iberian LTech Workshop (IBERSPEECH 2014),
367-376.

Castrillón, O., Castellanos, G. & Daza, G. (2006). Características acústicas en la


identificación de hipernasalidad en niños [on-line]. Auditio: Revista electrónica de
audiología, 2, 31-41.

Camacho-Martínez, C. (2013). Coeficiente Correlación Lineal de Pearson. Apuntes de


Diseño y Análisis de datos en Psicología II. Disponible en
http://personal.us.es/vararey/adatos2/apuntes.htm. Última consulta: 12-Nov-2014.

Childers, D. G. (1999). Speech Processing. John Wiley & Sons, Inc..

Cheol-Woo, J., Kwangin, K., Daehyun, K. & Soogeon, W. (2001). Screening of


pathological voice from ARS using neural networks. Proceedings de Eurospeech´99 (Vol
1, pp. 571-574).

Childers, D. G., & Bae, K. S. (1992). Detection of laryngeal function using speech and
electroglottographic data. IEEE Transactions on Biomedical Engineering, 39(1), 19-25.

179
Referencias documentales

Chu, E. A., & Kim, Y. J. (2008). Laryngeal cancer: diagnosis and preoperative work-
up. Otolaryngologic clinics of North America, 41(4), 673-695.

Cobeta, I., & Tapia, R. G. (1996). Diagnóstico y tratamiento de los trastornos de la


voz. Garsi.

Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences. Lawrence
Erlbaum Associates.

Cordeiro, H. T., Fonseca, J. M., & Ribeiro, C. M. (2013). LPC Spectrum First Peak
Analysis for Voice Pathology Detection. Procedia Technology, 9, 1104-1111.

Cross Validated. (2013). Portal web de preguntas y respuestas relacionadas con


estadística, aprendizaje automático, minería, análisis y visualización de datos.
Disponible en http://stats.stackexchange.com/questions/1850/difference-between-
cohens-d-and-hedges-g-for-effect-size-metrics. Última consulta: 11-Nov-2014.

Cubiles, M.D. (2013). Análisis Factorial. Apuntes. Disponible en


http://personal.us.es/cubiles/curso%20SPSS/Analisis%20factorial.pdf. Última consulta:
11-Nov-2014.

De Bodt, M., Wuyts, F., Heylen, L. & Mertens, F. (1998). Voice database of the Belgian
study group on voice disorders. Proceedings of Voicedata '98 (pp. 104-109).

De la Fuente Fernández, S. (2011). Análisis discriminante. Universidad Autónoma de


Madrid. En Portal Fuenterebollo. Disponible en
http://www.fuenterrebollo.com/Economicas/ECONOMETRIA/SEGMENTACION/DISCRI
MINANTE/analisis-discriminante.pdf. Última consulta: 14-Nov-2014.

de Oliveira Rosa, M., Pereira, J. C., & Grellet, M. (2000). Adaptive estimation of residue
signal for voice pathology diagnosis. IEEE Transactions on Biomedical
Engineering, 47(1), 96-104.

Dejonckere, P. H., & Lebacq, J. (1996). Acoustic, perceptual, aerodynamic and


anatomical correlations in voice pathology. ORL, 58(6), 326-332.

Delgado Romero, C. (2004). La identificación de locutores en el ámbito forense. Tesis


Doctoral. Universidad Complutense de Madrid, Servicio de Publicaciones.

Deller, J. R., Proakis, J. G., & Hansen, J. H. Discrete-time processing of speech signals,
1993. Maxwell Mcmillian, New York.

Dworkin, J. P., & Meleca, R. J. (1997). Vocal pathologies: Diagnosis, treatment, and
case studies. Singular Publishing Group. San Diego, CA.

Fant, G. (1960). Acoustic theory of speech production. Mouton & Co., N.V. Publishers.

180
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Faúndez Zanuy, M. (2000). Tratamiento digital de voz e imagen y aplicación a la


multimedia. Marcombo Boixareu.

Feijoo, S., ernández, C. (1990). Short-term stability measures for the evaluation of
vocal quality. Journal of Speech, Language, and Hearing Research, 33(2), 324-334.

Fernández Aguerre, T. (2004). Multicolinealidad. Apuntes de Estadística II, modelos


lineales. Centro de Estudios Sociológicos de El Colegio de México. Disponible en
http://tabarefernandez.tripod.com/multico.pdf. Última consulta: 14-Noviembre-2014

Fernández-Baillo, R., Gómez-Vilda, P., Ramírez-Calvo, C., & Scola, B. (2007, December).
Pre-post surgery evaluation based on the profile of glottal source. En MAVEBA (pp.65-
68).

Fernández-Baillo, R., & Gómez-Vilda, P. (2009). Identification of functional voice


disorders by biomechanical analysis. En MAVEBA (pp. 73-76).

Fernández-Baillo, R., Gómez, P. & Godino, J.I. (2009). The effects of age on voice based
on the analysis of the glottal source profile. En Proc. de AVFA09, 3rd Advanced Voice
Function Assessment International Workshop (pp. 141-145).

Fernández-González, S. & García-Tapia, R. (2013). Antecedentes históricos. En


Patología de la voz. Cobeta, I., Núñez, F., & Fernández, S., eds. Marge Medica Books.

Fernández-González, S., Sánchez-Ferrandis, N., Vázquez-de-la-Iglesia, F., & Rey-


Martínez, J. (2006). Técnicas digitales para la valoración laringoscópica. Revista de
Medicina de la Universidad de Navarra, 50 (3), 19-30.

Fernández-González, S., Vázquez-de-la-Iglesia, F., Marques-Girbau, M., & Garcia-Tapia-


Urrutia, R. (2006). La historia de la voz. Revista de Medicina de la Universidad de
Navarra, 50 (3), 9-13

Fernández-Planas, A. M., Vilaseca, I., Huerta, P., & Jiménez, C. (2006). Contribución del
análisis fonético acústico en el ámbito clínico: evaluación de la voz en pacientes
tratados de carcinoma laríngeo con láser carbónico. Actas del Primer Congreso
Nacional de Lingüística Clínica. Vol 2: Lingüística y evaluación del lenguaje (pp. 80-96).

Fontes, A. I., Souza, P. T., Neto, A. D., Martins, A. D. M., & Silveira, L. F. (2014).
Classification System of Pathological Voices Using Correntropy.Mathematical Problems
in Engineering, 2014.

Fourcin, A. (1998). Databases and criteria for normal and pathological speech: a
contribution to discussion. In proceedings of Voicedata ’98 (pp. 40-42).

Flanagan, J. L. (1972). Speech analysis: Synthesis and perception. Springer, Berlin.

181
Referencias documentales

Flanagan, J. L., & Landgraf, L. (1968). Self-oscillating source for vocal-tract


synthesizers. IEEE Transactions on Audio and Electroacoustics, 16(1), 57-64.

Fraile Muñoz, R., Godino Llorente, J. I., Sáenz Lechón, N., & Osma Ruiz, V. (2008). Use
of Cepstrum-based parameters for automatic pathology detection on speech. Analysis
of performance and theoretical justification. In International Conference on Bio-
inspired Systems and Signal Processing.

Gallardo Ruiz, J. R. & Gallego Ortega, J. L. (coords). (1993). Manual de logopedia


escolar: un enfoque práctico. Aljibe, D.L.

García-Ruiz, J. (2010). Fisiología Laríngea: Biomecánica vibratoria. Disponible en


http://www.otorrinoweb.com/es/2964.html. Última consulta: 4-Nov-2014.

García-Ruiz, J. (2010). Fisiología Laríngea: Fonación. Disponible en


http://www.otorrinoweb.com/es/2965.html. Última consulta: 4-Nov-2014.

García-Tapia, R. (1996). Antecedentes Históricos. Diagnóstico y tratamiento de los


trastornos de la voz. GARCIA-TAPIA R y COBETA I. Eds. Ponencia de la SEORL. Editorial
GARSI SA, Madrid.

Garson, G. D. (2012). Correlation, from Statnotes: Topics in Multivariate Analysis.


Disponible en http://faculty.chass.ncsu.edu/garson/PA765/correlation.htm. Última
consulta: 10-Nov-2014

Gil, J., Rodríguez, G. & García, E. (1995). Estadística básica aplicada a las Ciencias de la
Educación. Kronos.

Gnanadesikan, R. (2011). Methods for statistical data analysis of multivariate


observations (Vol. 321). John Wiley & Sons.

Godino Llorente, J.I. (2002). Estrategias para la detección automática de patología


laríngea a partir del registro de la voz. Tesis doctoral. Departamento de Arquitectura
y Tecnología de Sistemas Informáticos, Facultad de Informática, Universidad
Politécnica de Madrid.

Godino-Llorente, J. I., & Gomez-Vilda, P. (2004). Automatic detection of voice


impairments by means of short-term cepstral parameters and neural network based
detectors. IEEE Transactions on Biomedical Engineering 51(2), 380-384.

Godino-Llorente, J. I., Gomez-Vilda, P., & Blanco-Velasco, M. (2006). Dimensionality


reduction of a pathological voice quality assessment system based on Gaussian
mixture models and short-term cepstral parameters. IEEE Transactions on Biomedical
Engineering, 53(10), 1943-1953.

182
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Godino-Llorente, J. I., Sáenz-Lechón, N., Osma-Ruiz, V., Aguilera-Navarro, S., & Gómez-
Vilda, P. (2006). An integrated tool for the diagnosis of voice disorders. Medical
engineering & physics, 28(3), 276-289.

Godino-Llorente, J. I., Osma-Ruiz, V., Sáenz-Lechón, N., Cobeta-Marco, I., González-


Herranz, R., & Ramírez-Calvo, C. (2008). Acoustic analysis of voice using WPCVox: a
comparative study with Multi Dimensional Voice Program. European Archives of Oto-
Rhino-Laryngology, 265(4), 465-476.

Gómez, P. (2002). Modelado y clasificación automática de patrones de voz patológica


para su aplicación clínica sobre Internet. Proyecto MAPACI, memoria científico-técnica.

Gómez, P., Díaz, F., Martínez, R., Godino, J. I., Alvarez, A., Rodríguez, F., & Rodellar, V.
(2004). Precise reconstruction of the mucosal wave for voice pathology detection and
classification. In proceedings of EUSIPCO'04 (pp. 297-300).

Gómez, P., Godino, J. I., Díaz, F., Martínez, R., Nieto, V., & Rodellar, V. (2004). A new
mucosal wave correlate detection method as a clue to voice pathology. In International
Conference on Voice Physiology and Biomechanics ICVPB’04 (pp. 59-62).

Gómez P., Godino J. I., Díaz F., Álvarez A., Martínez R. & Rodellar V. (2004).
Biomechanical Parameter Fingerprint in the Mucosal Wave Power Spectral Density.
In Eighth International Conference on Spoken Language Processing (pp. 842-845).

Gómez, P., Godino, J. I., Rodríguez, F., Díaz, F., Nieto, V., Álvarez, A., & Rodellar, V.
(2004, May). Evidence of vocal cord pathology from the mucosal wave cepstral
contents. In Proceedings of IEEE International Conference on Acoustics, Speech, and
Signal Processing (Vol 5, pp. 437).

Gómez, P., Díaz, F., Álvarez, A., Martínez, R., Rodellar, V., Fernández, R., ... &
Fernández, F. J. (2005). PCA of perturbation parameters in voice pathology detection.
En Proc. de EUROSPEECH (Vol. 5, pp. 645-648).

Gómez, P., Godino, J. I., Álvarez, A., Martínez, R., Nieto, V., & Rodellar, V. (2005,
March). Evidence of glottal source spectral features found in vocal fold dynamics.
In Proceedings of IEEE International Conference on Acoustics, Speech, and Signal
Processing (Vol. 5, p. 441).

Gómez, P., Martínez, R., Díaz, F., Lázaro, C., Álvarez, A., Rodellar, V., & Nieto, V. (2005).
Voice pathology detection by vocal cord biomechanical parameter estimation. En
Nonlinear Analyses and Algorithms for Speech Processing, 242-256). Springer Berlin
Heidelberg.

Gómez, P. (2006). Estudio Biométrico de la Onda Glótica para su Aplicación en


Identificación del Locutor y Detección de Patología Laríngea de la Voz. Proyecto
OGILPAV, memoria científico-técnica.

183
Referencias documentales

Gómez, P., Fernández-Baillo, R., Nieto, A., Díaz, F., Fernández, F. J., Rodellar, V., ... &
Martínez, R. (2007). Evaluation of voice pathology based on the estimation of vocal
fold biomechanical parameters. Journal of Voice, 21(4), 450-476.

Gómez, P., Fernández-Baíllo, R., Rodellar, V., & Godino-Llorente, J. I. (2009). Voice
pathology grading by Gaussian mixture models: study cases. In MAVEBA (pp. 45-48).

Gómez, P., Fernández-Baillo, R., Rodellar, V., Nieto, V., Álvarez, A., Mazaira, L. M., ... &
Godino, J. I. (2009). Glottal source biometrical signature for voice pathology detection.
Speech Communication, 51(9), 759-781.

Gómez, P., Fernández-Baillo, R., Rodellar, V., Álvarez, A., Mazaira, L.M., Martínez, R.,
Muñoz, C., Nieto, V., & Godino, J.I. (2011). Evaluation of Voice Pathology Grade from
Glottal Source Parameterization. Informe técnico, Facultad de Informática, U.P.M.

Gómez, P., Rodellar, V., Nieto, V., Martínez, R., Alvarez, A., Scola, B., ... & Fernández,
M. (2013, February). BioMet® Phon: A System to Monitor Phonation Quality in the
Clinics. In eTELEMED 2013, The Fifth International Conference on eHealth,
Telemedicine, and Social Medicine (pp. 253-258).

Gómez García, J. A. (2013). Non-Linear Characterization of pathological sustained


vowel speech signal by using non-uniform embedding. En Application of Speech
Technologies. Benítez Ortúzar & Pérez Córdoba (eds). Universidad de Granada.

Grissom, R. J., & Kim, J. J. (2005). Effect sizes for research: A broad practical approach.
Lawrence Erlbaum Associates Publishers.

Guzmán, M. (2014). Voz profesional y rehabilitación de voz. Portal web. Disponible en


http://www.vozprofesional.cl. Última consulta: 7-Nov-2014

Hadjitodorov, S., Boyanov, B., & Teston, B. (2000). Laryngeal pathology detection by
means of class-specific neural maps. IEEE Transactions on Information Technology in
Biomedicine, 4(1), 68-73.

Hair, J., Anderson, R., Tatham, R. & Black, W. (1999). Análisis Multivariante. Prentice
Hall.

Hammarberg, B., Fritzell, B., Gaufin, J., Sundberg, J., & Wedin, L. (1980). Perceptual and
acoustic correlates of abnormal voice qualities. Acta oto-laryngologica, 90(1-6), 441-
451.

Hammarberg, B., Fritzell, B., & Schiratzki, H. (1984). Teflon Injection in 16 Patients with
Paralytic DysphoniaPerceptual and Acoustic Evaluations. Journal of Speech and Hearing
Disorders, 49(1), 72-82.

184
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Hariharan, M., Paulraj, M. P., & Sazali, Y. (2010). Time-domain features and
probabilistic neural network for the detection of vocal fold pathology. Malaysian
Journal of Computer Science, 23(1), 60-67.

erbst, C. T., erzel, ., Švec, J. G., Wyman, M. T., Fitch, W. T. (2013). Visualization
of system dynamics using phasegrams. Journal of The Royal Society Interface, 10(85),
20130288.

Hertegård, S., & Gauffin, J. (1992). Acoustic properties of the Rothenberg mask. STL-
QPSR, 33(2-3), 009-018.

Herzel, H., Berry, D., Titze, I. R., & Saleh, M. (1994). Analysis of vocal disorders with
methods from nonlinear dynamics. Journal of Speech, Language, and Hearing
Research, 37(5), 1008-1019.

Hirano, M. (1974). Morphological structure of the vocal cord as a vibrator and its
variations. Folia Phoniatrica et Logopaedica, 26(2), 89-94.

Hirano, M., Hibi, S., Yoshida, T., Hirade, Y., Kasuya, H., & Kikuchi, Y. (1988). Acoustic
analysis of pathological voice: some results of clinical application. Acta
otolaryngologica, 105(5-6), 432-438.

Hogikyan, N. D., & Sethuraman, G. (1999). Validation of an instrument to measure


voice-related quality of life (V-RQOL). Journal of Voice, 13(4), 557-569.

Holmberg, E. B., Hillman, R. E., & Perkell, J. S. (1988). Glottal airflow and transglottal air
pressure measurements for male and female speakers in soft, normal, and loud
voice. The Journal of the Acoustical Society of America,84(2), 511-529.

Hopkins, W. G. (2000). A New View of Statistics. Disponible en


http://www.sportsci.org/resource/stats/index.html. Última consulta: 11-Nov-2014.

Huang, D. Z., & Watson, C. (1998). Use and Understanding Voice Lab for Singers. En
página web http://www.drspeech.com/Paper.html. Última consulta: 14-Nov-2014.

Ishizaka, K., & Flanagan, J. L. (1972). Synthesis of Voiced Sounds From a Two‐Mass
Model of the Vocal Cords. Bell system technical journal, 51(6), 1233-1268.

Jackson-Menaldi, M. C. A. (1992). La voz normal. Ed. Médica Panamericana.

Jacobson, B. H., Johnson, A., Grywalski, C., Silbergleit, A., Jacobson, G., Benninger, M.
S., & Newman, C. W. (1997). The voice handicap index (VHI) development and
validation. American Journal of Speech-Language Pathology,6(3), 66-70.

Jarque, C. M., & Bera, A. K. (1980). Efficient tests for normality, homoscedasticity and
serial independence of regression residuals. Economics Letters, 6(3), 255-259.

185
Referencias documentales

Kandogan, T., & Sanal, A. (2005). Voice Handicap Index (VHI) in partial laryngectomy
patients. In KBB Forum (Vol. 4, No. 1, pp. 15-17).

Kasuya, H., Ogawa, S., Mashima, K., & Ebihara, S. (1986). Normalized noise energy as
an acoustic measure to evaluate pathologic voice. The Journal of the Acoustical Society
of America, 80(5), 1329-1334.

Kasuya, H., Masubuchi, K., Ebihara, S., & Yoshida, H. (1986). Preliminary experiments
on voice screening. Journal of Phonetics, 14(3-4), 463-468.

KayPENTAX Corp. (2011). Documentación On-Line de la referencia Disordered Voice


Database and Program, Model 4337. Disponible en:
http://www.kayelemetrics.com/index.php?option=com_product&controller=product&
Itemid=3&cid[]=52&task=pro_details. Última consulta: 9-Nov 2014.

KayPENTAX Corp. (2011b). Listado de productos de la empresa KayPENTAX. Disponible


en:http://www.kayelemetrics.com/index.php?option=com_product&view=product&It
emid=3. Última consulta: 9-Nov-2014.

Kendall, M. G. (1963). Rank correlation methods. Griffin.

Kitzing, P. (1986). LTAS criteria pertinent to the measurement of voice quality. Journal
of phonetics, 14, 477-482.

Kolmogorov, A. N. (1933). Sulla determinazione empirica di una legge di distribuzione.


Giornale dell´ Intituto Italiano degli Attuari, 4, 83-91.

Koutsogiannaki, M., Simantiraki, O., Degottex, G., & Stylianou, Y. (2014, September).
The importance of phase on voice quality assessment. In Proc. Interspeech.

Kuo, J., Holmberg, E. B., & Hillman, R. E. (1999, March). Discriminating speakers with
vocal nodules using aerodynamic and acoustic features. In Proceedings of IEEE
International Conference on Acoustics, Speech, and Signal Processing (Vol. 1, pp. 77-
80).

Lamy, B. (1741). La rhétorique ou l'art de parler. F. Mathey.

Laver, J., Wirz, S., Mackenzie, J., & Hiller, S. (1981). A perceptual protocol for the
analysis of vocal profiles. Edinburgh University Department of Linguistics Work in
Progress, 14, 139-155.

Lázaro Carrascosa, C. (2000). Desarrollo de una aplicación para el vínculo de una base
de datos de pacientes de otorrinolaringología con un editor de señales. Facultad de
Informática, Universidad Politécnica de Madrid.

186
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Lázaro-Carrascosa, C. & Gómez-Vilda, P. (2014). Using glottal parameters for detecting


vocal pathology. In Proceedings of VII Jornadas en Tecnologías del Habla and IV Iberian
LTech Workshop (IBERSPEECH 2014), 51-60.

Lázaro-Carrascosa, C. & Gómez-Vilda, P. (2015a). Assessing a set of glottal features


from vocal fold biomechanics. In Proceedings of International Conference of Non
Linear Speech Processing (NOLISP 2015), Springer Series: "Smart, Innovation, Systems
and Technologies".

Lázaro-Carrascosa, C. & Gómez-Vilda, P. (2015b). Assessing a set of glottal features


from vocal fold biomechanics for detecting vocal pathology. In Proceedings of 4th
International Work Conference on Bioinspired Intelligence (IWOBI 2015, IEEE
Conference), 123-130.

Le Huche, F., & Allali, A. (2004). La voz: Anatomía y fisiología de los órganos de la voz y
del habla (IX, 196 p.). Masson.

Lehmann, E. L., & D'Abrera, H. J. (2006). Nonparametrics: statistical methods based on


ranks (p. 464). New York: Springer.

Levene, H. (1960). Robust tests for equality of variances. Contributions to probability


and statistics: Essays in honor of Harold Hotelling, 2, 278-292.

Lilliefors, H. W. (1967). On the Kolmogorov-Smirnov test for normality with mean and
variance unknown. Journal of the American Statistical Association,62(318), 399-402.

Lohninger, H. (2012). Fundamentals of Statistics. Publicación electrónica. Disponible en


http://www.statistics4u.com/fundstat_eng/index.html Última consulta: 14-Nov-
2013.

López, J., Pérez, A., Zamora, J., Murciano, A., Alonso J., Reviriego, M. & Lahoz, R.
(2014). Coeficiente de correlación múltiple. En Aula virtual de bioestadística.
Universidad Complutense de Madrid. Disponible en http://e-
stadistica.bio.ucm.es/glosario/coef_corre.html. Última consulta: 14-Nov-2014

Ma, E. P. M., Yiu, E. M. L., & Abbott, K. V. (2007, November). Application of the ICF in
voice disorders. In Seminars in speech and language (Vol. 28, No. 04, pp. 343-350). ©
Thieme Medical Publishers.

Madrid Fernández, C.F. (2008). Aspectos diferenciales en el desarrollo de la


comunicación y el lenguaje. Revista DOCES, 3.

Mann, H. B., & Whitney, D. R. (1947). On a test of whether one of two random
variables is stochastically larger than the other. The annals of mathematical statistics,
18, 50-60.

187
Referencias documentales

Marín Diazaraque, J. M. (2011). Análisis Discriminante. Apuntes sobre análisis


multivariado de datos. Universidad Carlos III. Disponible en
https://sites.google.com/site/ramolinacruz41/apuntes. Última consulta: 14-Nov-2014.

Marinaki, M., Kotropoulos, C., Pitas, I., & Maglaveras, N. (2004). Automatic Detection
Of Vocal Fold Paralysis and Edema. In Eighth International Conference on Spoken
Language Processing.

Martín Álvarez, J. J., 2000. Análisis de voz aplicado al diagnóstico de patologías de


fonación. Proyecto fin de carrera. Escuela Técnica Superior de Ingeniería de
Telecomunicación, Universidad Politécnica de Madrid.

Martino, L. J. (2014). Gross Anatomy at A.M.C. Página web. Imagen disponible en


https://academic.amc.edu/martino/grossanatomy/site/NURSES/TUTORIALS/Larynx/im
ages/fold.GIF. Última consulta: 4-Septiembre-2014.

McGill, R., Tukey, J. W., & Larsen, W. A. (1978). Variations of box plots. The American
Statistician, 32(1), 12-16.

McGillion, M. A., 2000. Automatic assessment of voice quality. Tesis doctoral.


Universidad de Manchester.

McGillion, M. A., Ritchings, R. T., & Moore, C. J. (1998). A neural-network-based


approach to objective voice quality assesment. In Research and Development in Expert
Systems XIV, 128-131.

McGuirt, W. F., Blalock, D., Koufman, J. A., & Feehs, R. S. (1992). Voice analysis of
patients with endoscopically treated early laryngeal carcinoma. The Annals of otology,
rhinology, and laryngology, 101(2 Pt 1), 142-146.

Medina Moral, E. (2014). Análisis Discriminante. Apuntes de estadística. Disponible en


http://www.uam.es/personal_pdi/economicas/eva/pdf/discriminante.pdf. Última
consulta: 14-Nov-2014

Medivoz. (2014). MedivozCaptura, WPCVox y EntrenaVox: Herramientas de ayuda al


diagnóstico y rehabilitación de la voz. Página web:
http://www.byo.ics.upm.es/medivoz. Última consulta: 14-Nov-2014.

Morales Vallejo, P. (2011a). El análisis factorial en la construcción e interpretación de


tests, escalas y cuestionarios. En Estadística aplicada a las Ciencias Sociales.
Universidad Pontificia Comillas, Madrid.

Morales Vallejo, P. (2011b). El contraste de medias. Estadística aplicada a las Ciencias


Sociales. En Estadística aplicada a las Ciencias Sociales. Universidad Pontificia Comillas,
Madrid.

188
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Morales Vallejo, P. (2011c). El tamaño del efecto (effect size): análisis complementarios
al contraste de medias. En Estadística aplicada a las Ciencias Sociales. Universidad
Pontificia Comillas, Madrid.

Morales Vallejo, P. (2011d). Estadística inferencial: el error típico de la media. En


Estadística aplicada a las Ciencias Sociales. Universidad Pontificia Comillas, Madrid.

Moro-Velázquez, L., Gómez-García, J. A., & Godino-Llorente, J. I. (2014). Analysis of


complexity and modulation spectra parameterizations to characterizce voice
roughness. In Proceedings of VII Jornadas en Tecnologías del Habla and IV Iberian
LTech Workshop (IBERSPEECH 2014), 71-80.

Morrison, D. F. (1976). Multivariate statistical methods. New York: McGraw-Hill.

Moses, L. E. (1952). A two-sample test. Psychometrika, 17(3), 239-247.

Muhammad, G., Alsulaiman, M., Mahmood, A., Almojali, M., & Abdelkader, B. M.
(2014). Voice Pathology Detection using Multiresolution Technique. Pathology, 70,
103.

Nieto, A., Vegas, A., Gamboa, J., Montojo, J., Cobeta, I. & Kitzing, P. (1995). Jitter and
shimmer in vocal fold nodules, polyps and edemas before and after phonosurgery.
Proceedings of XIIIth International Congress of Phonetic Sciences (Vol. 4, pp. 606-609).

Norusis, M. J. (1993). SPSS for Windows: Base System User's Guide Release 6.0. SPSS
Inc. Links, Chicago, IL.

Nunnally, J. C., Bernstein, I. H., & Berge, J. M. T. (1967). Psychometric theory(Vol. 226).
New York: McGraw-Hill.

Núñez Batalla, F., Corte Santos, P., Sequeiros Santiago, G., Señaris González, B., &
Suárez Nieto, C. (2004). Evaluación perceptual de la disfonía: correlación con los
parámetros acústicos y fiabilidad. Acta Otorrinolaringológica Española, 55(6), 282-287.

Oracle Corporation. (2014). Guía oficial de la tecnología Java Web Start. Disponible en
http://docs.oracle.com/javase/8/docs/technotes/guides/javaws/developersguide/cont
ents.html. Última consulta: 14-Nov-2013.

Orr, R., Cranen, B., & Jong, F. I. D. (2003). An investigation of the parameters derived
from the inverse filtering of flow and microphone signals. In ISCA Tutorial and Research
Workshop on Voice Quality: Functions, Analysis and Synthesis (pp. 35-40).

Ortega, A., & Miguel, A. (2013). Adaptation and normalization techniques (especially)
for automatic speech recognition. En Application of Speech Technologies. Benítez
Ortúzar & Pérez Córdoba (eds). Universidad de Granada.

Palmer, A.L. (1999). Análisis de datos, etapa exploratoria. Madrid: Pirámide.

189
Referencias documentales

Pardo, A., & Ruiz, M. Á. (2002). SPSS 11: Guía para el análisis de datos. Madrid:
McGraw-Hill.

Parsa, V., & Jamieson, D. G. (2000). Identification of pathological voices using glottal
noise measures. Journal of speech, language, and hearing research,43(2), 469-485.

Pearson, K. (1894). Contributions to the mathematical theory of evolution.


Philosophical Transactions of the Royal Society of London. A, 71-110.

Perelló, J. & Miquel, J. A. S. (1973). Alteraciones de la voz: por Jorge Perelló con la
colaboración de José Antonio Salvà Miquel. Editorial Científico-Médica.

Pinho, S. R., & Pontes, P. (2002). Escala de evaluación perceptiva de la fuente glótica:
RASAT. Disponible en http://www.invoz.com.br/paginas/rasat.pdf. Última consulta: 4-
Nov-2014.

Plante, F., Borel, J., Berger-Vachon, C., & Kauffmann, I. (1993). Acoustic detection of
laryngeal diseases in children. In Eurospeech.

Prater, R. J., & Swift, R. W. (1986). Manual de terapéutica de la voz. Salvat Editores.

Price, P. J. (1989). Male and female voice source characteristics: Inverse filtering
results. Speech Communication, 8(3), 261-277.

PulsoMed, S.A. (2014). Portal y enciclopedia médica tuotromedico.com. Disponible en


www.tuotromedico.com. Última consulta: 9-Nov-2014.

Puyuelo Sanclemente, M. & Llinás i Miró, M. A. (1992). Problemas de voz en


docentes. Revista de Logopedia, Foniatría y Audiología, 12(2), 76-84.

Qi, Y., & Hillman, R. E. (1997). Temporal and spectral estimations of harmonics-to-
noise ratio in human voice signals. The Journal of the Acoustical Society of
America, 102(1), 537-543.

Rabiner, L. R., & Juang, B. H. (1993). Fundamentals of speech recognition(Vol. 14).


Englewood Cliffs: PTR Prentice Hall.

Rennie, K. M. (1997). Exploratory and Confirmatory Rotation Strategies in Exploratory


Factor Analysis. In annual meeting of the Southwest Educational Research Association.

Ritchings, R. T., Conroy, G. V., McGillion, M. A., Moore, C. J., Slevin, N., Winstanley, S.,
& Woods, H. (1999). A neural network based approach to objective voice quality
assessment. In Research and Development in Expert Systems XV (pp. 198-209).
Springer London.

Ritchings, R. T., McGillion, M. A., & Moore, C. J. (2001). Pathological voice quality
assesment using artificial neural networks. In MAVEBA (pp. 230-234).

190
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Robinson, T. (1998). Speech Analysis. University of Cambridge. Disponible en


http://svr-www.eng.cam.ac.uk/~ajr/SpeechAnalysis/. Última consulta: 14-Nov-2014.

Rosier, J. F., Grégoire, V., Counoy, H., Octave-Prignot, M., Rombaut, P., Scalliet, P., ... &
Hamoir, M. (1998). Comparison of external radiotherapy, laser microsurgery and
partial laryngectomy for the treatment of T1N0M0 glottic carcinomas: a retrospective
evaluation. Radiotherapy and oncology, 48(2), 175-183.

Rothenberg, M. (1973). A new inverse‐filtering technique for deriving the glottal air
flow waveform during voicing. The Journal of the Acoustical Society of America, 53(6),
1632-1645.

Rothenberg, M. (1977). Measurement of airflow in speech. Journal of Speech,


Language, and Hearing Research, 20(1), 155-176.

Ruiz, M. T., & Verbrugge, L. M. (1997). A two way view of gender bias in
medicine. Journal of epidemiology and community health, 51(2), 106.

Salvador, M., & Gargallo, P. (2006). Análisis factorial. [en línea]. En 5campus.com,
Estadística. Disponible en http://www.5campus.com/leccion/factorial. Última
consulta: 12-Nov-2014.

Santos, R. (2005). Desarrollo de una herramienta para la captura, almacenamiento y


análisis visual de la señal de voz. Trabajo fin de carrera correspondiente a la titulación
Ingeniería Informática de la Universidad Rey Juan Carlos.

Sarriá, M. & Castellanos, G. (2010). Entrenamiento discriminativo por distancia de


Mahalanobis para detección de patologías de voz. Dyna-Medellin, 77(164), 220-228

Schroeder, M. R. (2004). Computer speech: recognition, compression, synthesis (Vol.


35). Springer.

Shapiro, S. S., & Wilk, M. B. (1965). An analysis of variance test for normality (complete
samples). Biometrika, 52 (3-4), 591-611.

Sociedad Española de bioquímica clínica y patología molecular. (2013). Correlación,


notas. En Curso de estadística para el laboratorio clínico. Disponible en
http://www.seqc.es/es/Varios/7/7/Curso_de_Estadistica_para_el_laboratorio_Clinico/
Última consulta: 12-Nov-2014.

SQLab Company. (2013). Listado de productos de la empresa SQLab Company.


Disponible en http://www.sqlab.fr. Última consulta: 10-Nov-2014.

Smirnov, N. V. (1939). Estimate of deviation between empirical distribution functions


in two independent samples. Bulletin Moscow University, 2(2), 3-16

191
Referencias documentales

Smirnov, N. V. (1948). Table for estimating the goodness of fit of empirical


distributions. The Annals of Mathematical Statistics, 19, 279-281.

Spearman, C. (1904). The proof and measurement of association between two


things. The American journal of psychology, 15(1), 72-101.

Story, B. H. (2002). An overview of the physiology, physics and modeling of the sound
source for vowels. Acoustical Science and Technology, 23(4), 195-206.

Story, B. H., & Titze, I. R. (1995). Voice simulation with a body‐cover model of the vocal
folds. The Journal of the Acoustical Society of America, 97(2), 1249-1260.

Suárez, C., Gil Carcedo, L.M., Marco, J., Medina, J.E., Ortega, P. & Trinidad, J. (2006).
Tratado de Otorrinolaringología y Cirugía de Cabeza y Cuello. Editorial Médica
Panamericana.

Švec, J. G., oráček, J., Šram, F., Veselý, J. (2000). Resonance properties of the vocal
folds: in vivo laryngoscopic investigation of the externally excited laryngeal
vibrations. The Journal of the Acoustical Society of America, 108(4), 1397-1407.

TGH Endoscopia, 2014. Página web: www.tghendoscopia.com. Última consulta: 14-


Nov-2014.

Thurstone, L. L. (1947). Multiple Factor Analysis. University of Chicago Press.

Titze, I. R. (1973). The human vocal cords: a mathematical model. Phonetica,28(3-4),


129-170.

Titze, I. R. (1974). The Human Vocal Cords: A Mathematical Model. Phonetica,29(1-2),


1-21.

Tiger DRS Inc. (1999). Suite de productos relacionados con la calidad vocal Dr. Speech
V.4. Disponible en http://www.drspeech.com/. Última consulta: 9-Nov-2013.

Titze, I. R. (1994). Principles of Voice Production. Prentice Hall. Englewood Cliffs, NJ.

Titze, I. R., & Talkin, D. T. (1979). A theoretical study of the effects of various laryngeal
configurations on the acoustics of phonation. The Journal of the Acoustical Society of
America, 66(1), 60-74.

Toledano, D. T., González-Rodrıguez, J., Domınguez, J. G., Garcıa, J. O. (2013).


Applications of Speech Technology: Biometrics. En Application of Speech Technologies.
Benítez Ortúzar & Pérez Córdoba (eds). Universidad de Granada.

Torrado-Fonseca, M., & Berlanga, V. (2013). Análisis Discriminante mediante SPSS.


REIRE. Revista d'Innovació i Recerca en Educació, 6(2), 150-166.

192
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tucker, H. M. (Ed.). The Larynx, 2ª Ed. Thieme Medical Publishers. New York (1993)

Tukey, J. W. (1977). Exploratory data analysis. Addison-Wesley.

Uriel Jiménez, E., 2014. Multicolinealidad. Apuntes de Estadística. Universidad de


Valencia. Disponible en http://www.uv.es/uriel/material/multicolinealidad3.pdf.
Última consulta: 14-Nov-2014.

Uriel Jimenez, E., 2014. Introducción a la econometría. Manual electróncio.


Universidad de Valencia. Disponible en http://www.uv.es/uriel/libroes.htm. Última
consulta: 14-Nov-2014.

Van den Berg, J. (1958). Myoelastic-aerodynamic theory of voice production. Journal of


Speech, Language, and Hearing Research, 1(3), 227-244.

Varho, S., & Alku, P. (1999, July). A new predictive method for all-pole modelling of
speech spectra with a compressed set of parameters. In Proceedings of the 1999 IEEE
International Symposium on Circuits and Systems (Vol. 3, pp. 126-129).

Varri, A., Kemp, B., Penzel, T., & Schlogl, A. (2001). Standards for biomedical signal
databases. Engineering in Medicine and Biology Magazine, IEEE, 20(3), 33-37.

Vilaseca-González, I. (2008). Videolaringoestroboscopia: una técnica para visualizar las


cuerdas vocales. Estudios de fonética experimental, 17, 418-432.

Villayandre, M. Apuntes de Fonética y fonología. 2012. Disponible en


http://fhyc.unileon.es/Milka/FyF/38.pdf. Última consulta: 7-Nov-2014.

Voice and aging. (2014). Página web. Disponible en


http://voiceandaging.weebly.com/index.html. Última consulta: 14-Nov-2014.

Wald, A., & Wolfowitz, J. (1940). On a test whether two samples are from the same
population. The Annals of Mathematical Statistics, 11(2), 147-162.

Wallen, E. J., & Hansen, J. H. (1996, October). A screening test for speech pathology
assessment using objective quality measures. In Proceedings of IEEE Fourth
International Conference on Spoken Language (Vol. 2, pp. 776-779).

Watanabe, J., Bonilla, J. J. & Villanueva, M. (2006). Endoscopía gastrointestinal. Cap. 22


en Tópicos selectos en medicina interna - "Gastroenterología". Sociedad Peruana de
Medicina Interna.

Webb, A. L., Carding, P. N., Deary, I. J., MacKenzie, K., Steen, I. N., & Wilson, J. A.
(2007). Optimising outcome assessment of voice interventions, I: reliability and validity
of three self-reported scales. The Journal of Laryngology & Otology, 121(08), 763-767.

193
Referencias documentales

WEVOSYS. (2012). Listado de productos de la empresa WEVOSYS. Disponible en


http://www.wevosys.com. Última consulta: 10-Noviembre 2014.

Wikipedia, 2014a. Entrada de la enciclopedia 'on-line' Wikipedia: “Box Plot”.


Disponible en http://en.wikipedia.org/wiki/Box_plot. Última consulta: 5-Nov-2014.

Wikipedia, 2014b. Entrada de la enciclopedia 'on-line' Wikipedia: “Endoscopia".


Disponible en http://es.wikipedia.org/wiki/Endoscopia. Última consulta: 5-Nov-2014.

Wikipedia, 2014c. Entrada de la enciclopedia 'on-line' Wikipedia: “Endoscopio".


Disponible en http://es.wikipedia.org/wiki/Endoscopio. Última consulta: 5-Nov-2014.

Wikipedia, 2014d. Entrada de la enciclopedia 'on-line' Wikipedia: “ istoria del


endoscopio". Disponible en http://es.wikipedia.org/wiki/Historia_del_endoscopio.
Última consulta: 5-Nov-2014.

Wikipedia, 2014e. Entrada de la enciclopedia 'on-line' Wikipedia: “Kolmogorov-


Smirnov test”. Disponible en http://en.wikipedia.org/wiki/Kolmogorov-Smirnov_test.
Última consulta: 5-Nov-2014.

Wikipedia, 2014f. Entrada de la enciclopedia 'on-line' Wikipedia: “Lilliefors test”.


Disponible en http://en.wikipedia.org/wiki/Lilliefors_test. Última consulta: 5-Nov-
2014.
Wikipedia, 2014g. Entrada de la enciclopedia 'on-line' Wikipedia: “Manuel Patricio
Rodríguez García”. Disponible en http://es.wikipedia.org/wiki/Manuel_Vicente_García.
Última consulta: 5-Nov-2014.

Wikipedia, 2014h. Entrada de la enciclopedia 'on-line' Wikipedia: “Prueba U de Mann-


Whitney.". Disponible en http://es.wikipedia.org/wiki/Prueba_U_de_Mann-Whitney.
Última consulta: 26-Nov-2014.
Wikipedia, 2014i. Entrada de la enciclopedia 'on-line' Wikipedia: “Spectrogram”.
Disponible en http://en.wikipedia.org/wiki/Spectrogram. Última consulta: 5-Nov-2014.

Wikipedia, 2014j. Entrada de la enciclopedia 'on-line' Wikipedia: “Test de Saphiro-


Wilk”. Disponible en http://es.wikipedia.org/wiki/Test_de_Shapiro-Wilk. Última
consulta: 5-Nov-2014.

Wilson, D. K. (1987). Voice problems of children (3rd ed., pp. 116-124). Baltimore:
Williams & Wilkins.

Wolfe, V., Cornell, R., & Palmer, C. (1991). Acoustic correlates of pathologic voice
types. Journal of Speech, Language, and Hearing Research, 34(3), 509-516.
World Health Organization. (2010). International classification of voice disorders.
Disponible en http://apps.who.int/classifications/apps/icd/icd10online/. Última
consulta: 9-Nov-2014.

194
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

World Health Organization. (2013). International classification of functioning, disability


and health. Disponible en http://www.who.int/classifications/icf/en/. Última consulta:
9-Nov-2014.

Xu, M., Duan, L. Y., Cai, J., Chia, L. T., Xu, C., & Tian, Q. (2005). HMM-based audio
keyword generation. In Advances in Multimedia Information Processing-PCM 2004 (pp.
566-574). Springer Berlin Heidelberg.

Yamauchi, E. J., Imaizumi, S., Maruyama, H., & Haji, T. (2009). Intercultural differences
in evaluation of pathological voice quality: perceptual and acoustical comparisons
between RASATI and GRBASI scales. In INTERSPEECH (pp. 2927-2930).
Yanagihara, N. (1967). Significance of harmonic changes and noise components in
hoarseness. Journal of Speech and Hearing Research, 10(3), 531-541.

Yumoto, E., Gould, W. J., & Baer, T. (1982). Harmonics‐to‐noise ratio as an index of the
degree of hoarseness. The journal of the Acoustical Society of America, 71(6), 1544-
1550.

Zaoming, D. & Huang, H. (1998). Voice Lab in Clinical Practice. En página web
http://www.drspeech.com/Paper.html. Última consulta: 14-Nov-2014.

195
Apéndice 1. Desarrollo de una herramienta para
la captura, almacenamiento y análisis visual de
la señal de voz
Apéndices

Más allá del uso de voces generadas de manera sintética, utilizadas en los
antecedentes de este trabajo y no incluidas en él, o de la utilización de bases de datos
estandarizadas como las presentadas en el capítulo cuatro, la captura de diferentes y
numerosas muestras de voz resulta de gran importancia para la realización de la
experimentación, como también apuntábamos en el capítulo cuatro. Con este objetivo
se desarrolló una aplicación informática ad hoc con el fin de obtener las muestras de
voz (Santos, R., 2005), en el marco de la presente tesis doctoral y de los proyectos de
investigación con los que ha estado relacionada.

En la actualidad existen diversas herramientas capaces de capturar y editar las


señales de voz. Sin embargo, en nuestro caso, resulta de especial interés que el
proceso de captura sea lo más sencillo posible, alejándonos por tanto de las interfaces
complejas que presentan herramientas de uso profesional como el Adobe Audition
(Adobe Systems Incoporated, 2014) y que podemos ver en la figura AP1-1.
Encontramos la razón que explica la búsqueda de esta sencillez en los perfiles de las
personas que utilizarán la aplicación: especialistas en el campo de la salud (no
necesariamente médicos) que no tienen porqué tener una gran experiencia en el
manejo de herramientas informáticas, y pacientes en general.

Fig. AP1-1. Captura de pantalla de la herramienta profesional Adobe Audition.

Por otra parte, estas herramientas profesionales suelen capturar los ficheros para
después almacenarlos en algún tipo de memoria secundaria, pero el protocolo de
grabación establecido en (Gómez, P., 2006) relacionado con el proceso global de
captura y prediagnóstico establece que los ficheros deben poder ser enviados a un
servidor remoto de forma semiautomática para su posterior análisis.

198
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

El programa desarrollado presenta, por lo tanto, un aspecto mucho más informal


que otras aplicaciones comerciales, pero permite realizar su cometido de una manera
muy sencilla: es posible capturar la señal de voz producida por un paciente al leer un
texto en movimiento que aparecerá en pantalla. Tanto el texto en sí como la velocidad
a la que éste aparecerá en pantalla o el tamaño de la letra son elementos
configurables.
La captura es realizada en función de los parámetros de grabación típicos: bits por
muestra y frecuencia de muestreo. Estos parámetros aparecen con valores por
defecto, pero es posible modificarlos.
Una vez que la captura ha sido completada, el sistema estudia la calidad de la señal.
Para ello, en primer lugar, cuenta con un conjunto de parámetros específicos, también
configurables: umbral mínimo de energía para validar una señal, valor de la amplitud a
partir del cual consideramos una señal saturada, número máximo de puntos de
saturación permitidos y porcentaje de la señal útil a cada lado del centro de la misma
(permite descartar los extremos de la señal, si se estima conveniente). En este punto, y
en base al valor de los parámetros específicos, el programa informa acerca del nivel de
calidad alcanzado, pero permite que se acepten o que se rechacen las señales
independientemente de éste. De cara a ofrecer un apoyo en la decisión a tomar, la
aplicación ofrece un pintado de la señal en función del tiempo que incorpora la
posibilidad de realizar zoom sobre la onda representada. Podemos ver una captura de
pantalla de la aplicación en la figura AP1-2.

Fig. AP1-2. Captura de pantalla de la herramienta desarrollada.

199
Apéndices

Por otra parte, el sistema permite enviar las señales grabadas junto con sus
parámetros de grabación en formato textual a un servidor remoto. Es destacable
mencionar que esta operación sólo será realizada con aquellas grabaciones que hayan
sido marcadas como válidas de forma explícita.

Por último, es posible ofrecer la aplicación desarrollada a través de la web,


mediante la tecnología Java Web Start (Oracle Corporation, 2014). Esta tecnología
facilita la descarga del programa y gestiona las actualizaciones del sistema de forma
transparente, permitiendo en todo caso la ejecución de la aplicación sin necesidad de
conexión, una vez instalada.

200
Apéndice 2.1. Análisis descriptivo general de los
parámetros
Apéndices

Tabla AP2.1-1. Descriptivos de la base de datos femenina: media, error típico de la


media, mediana, moda, desviación típica, varianza y asimetría.
Error
Desviación
Media típico de la Mediana Moda Varianza Asimetría
típica
media
PAR.001 202,449 2,818 203,601 144,282 28,184 794,326 0,236
PAR.002 0,018 0,002 0,009 0,002 0,022 0,000 2,687
PAR.003 0,037 0,002 0,034 0,005 0,017 0,000 0,612
PAR.004 0,089 0,004 0,083 0,009 0,040 0,002 0,975
PAR.005 0,038 0,002 0,037 0,005 0,018 0,000 0,879
PAR.006 0,978 0,006 0,987 0,637 0,063 0,004 -3,338
PAR.007 0,991 0,004 1,000 0,719 0,041 0,002 -4,406
PAR.008 0,070 0,004 0,063 0,011 0,038 0,001 2,185
PAR.009 2,041 0,017 2,000 2,000 0,170 0,029 4,764
PAR.010 0,162 0,020 0,102 0,012 0,200 0,040 4,596
PAR.011 -8,176 0,468 -8,976 -16,432 4,676 21,862 0,571
PAR.012 -26,495 0,881 -28,763 -39,833 8,810 77,622 0,959
PAR.013 -33,500 0,961 -35,912 -50,355 9,609 92,328 0,842
PAR.014 -38,114 1,001 -41,875 -53,049 10,007 100,134 0,654
PAR.015 -4,322 0,305 -3,334 -22,121 3,048 9,289 -3,005
PAR.016 -4,358 0,305 -3,377 -22,404 3,046 9,277 -3,089
PAR.017 21,275 0,359 22,192 11,021 3,589 12,883 -0,591
PAR.018 -23,924 0,690 -24,102 -38,018 6,900 47,607 0,182
PAR.019 -18,023 0,719 -18,503 -32,622 7,189 51,677 0,246
PAR.020 -18,023 0,719 -18,503 -32,622 7,189 51,677 0,246
PAR.021 -31,858 0,866 -33,003 -49,566 8,662 75,037 0,346
PAR.022 -25,087 0,816 -25,992 -41,537 8,163 66,628 0,255
PAR.023 -64,315 1,042 -66,874 -82,853 10,419 108,548 1,012
PAR.024 0,494 0,003 0,500 0,500 0,027 0,001 -4,907
PAR.025 0,496 0,002 0,500 0,500 0,024 0,001 -4,530
PAR.026 2,041 0,017 2,000 2,000 0,170 0,029 4,764
PAR.027 2,653 0,066 2,500 2,000 0,662 0,439 0,602
PAR.028 3,284 0,068 3,132 3,000 0,678 0,460 0,551
PAR.029 3,284 0,068 3,132 3,000 0,678 0,460 0,551
PAR.030 4,452 0,083 4,422 3,500 0,828 0,685 0,315
PAR.031 5,132 0,086 5,100 4,446 0,857 0,734 0,342
PAR.032 55,782 0,985 54,500 56,500 9,852 97,068 -0,123
PAR.033 14,392 0,352 14,189 6,104 3,519 12,382 0,644
PAR.034 24,750 0,828 24,092 9,471 8,276 68,499 0,616
PAR.035 0,071 0,057 0,013 0,008 0,567 0,321 9,996
PAR.036 4,493 0,019 4,569 3,798 0,193 0,037 -1,778
PAR.037 1,382E+05 1,144E+05 2,034E+04 1,480E+04 1,144E+06 1,309E+12 9,994E+00
PAR.038 0,049 0,012 0,003 0,000 0,117 0,014 3,327
PAR.039 0,021 0,002 0,013 0,004 0,023 0,001 2,545
PAR.040 0,082 0,015 0,020 0,004 0,150 0,022 2,887

202
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Error
Desviación
Media típico de la Mediana Moda Varianza Asimetría
típica
media
PAR.041 0,016 0,001 0,015 0,008 0,006 0,000 1,792
PAR.042 19,610 0,780 17,104 9,058 7,797 60,797 1,594
PAR.043 3,290E+04 4,760E+03 2,088E+04 9,212E+03 4,760E+04 2,266E+09 5,064E+00
PAR.044 0,078 0,007 0,052 0,016 0,068 0,005 2,064
PAR.045 0,084 0,007 0,060 0,014 0,067 0,005 1,657
PAR.046 0,126 0,015 0,065 0,016 0,146 0,021 3,184
PAR.047 0,500 0,011 0,490 0,202 0,112 0,013 0,217
PAR.048 0,799 0,008 0,809 0,609 0,079 0,006 -0,277
PAR.049 0,180 0,009 0,159 0,022 0,090 0,008 2,862
PAR.050 0,091 0,006 0,080 0,026 0,063 0,004 6,621
PAR.051 0,858 0,007 0,856 0,580 0,069 0,005 -0,614

Tabla AP2.1-2. Descriptivos de la base de datos femenina: error típico de asimetría,


curtosis, error típico de curtosis, amplitud, mínimo, máximo, suma.
Error típico Error
de Curtosis típico de Amplitud Mínimo Máximo Suma
asimetría curtosis

PAR.001 0,241 0,401 0,478 153,059 144,282 297,341 20244,932


PAR.002 0,241 8,322 0,478 0,125 0,002 0,127 1,751
PAR.003 0,241 -0,100 0,478 0,075 0,005 0,080 3,727
PAR.004 0,241 2,980 0,478 0,254 0,009 0,263 8,852
PAR.005 0,241 1,528 0,478 0,104 0,005 0,109 3,819
PAR.006 0,241 13,843 0,478 0,425 0,637 1,062 97,777
PAR.007 0,241 22,155 0,478 0,302 0,719 1,021 99,055
PAR.008 0,241 7,426 0,478 0,238 0,011 0,249 7,024
PAR.009 0,241 22,615 0,478 1,000 2,000 3,000 204,090
PAR.010 0,241 28,754 0,478 1,607 0,012 1,620 16,195
PAR.011 0,241 -0,610 0,478 19,837 -16,432 3,405 -817,577
PAR.012 0,241 0,212 0,478 38,970 -39,833 -0,863 -2649,499
PAR.013 0,241 0,008 0,478 42,795 -50,355 -7,560 -3350,027
PAR.014 0,241 -0,699 0,478 37,849 -53,049 -15,200 -3811,399
PAR.015 0,241 12,234 0,478 21,154 -22,121 -0,967 -432,197
PAR.016 0,241 12,923 0,478 20,963 -22,404 -1,441 -435,757
PAR.017 0,241 0,225 0,478 18,175 11,021 29,196 2127,511
PAR.018 0,241 -0,330 0,478 31,384 -38,018 -6,635 -2392,432
PAR.019 0,241 -0,406 0,478 31,067 -32,622 -1,555 -1802,254
PAR.020 0,241 -0,406 0,478 31,067 -32,622 -1,555 -1802,254
PAR.021 0,241 -0,215 0,478 40,663 -49,566 -8,903 -3185,778
PAR.022 0,241 -0,632 0,478 35,008 -41,537 -6,529 -2508,682
PAR.023 0,241 0,810 0,478 52,538 -82,853 -30,315 -6431,483
PAR.024 0,241 24,658 0,478 0,167 0,333 0,500 49,365

203
Apéndices

Error típico Error


de Curtosis típico de Amplitud Mínimo Máximo Suma
asimetría curtosis
PAR.025 0,241 27,010 0,478 0,223 0,345 0,568 49,575
PAR.026 0,241 22,615 0,478 1,000 2,000 3,000 204,090
PAR.027 0,241 -0,082 0,478 2,947 1,500 4,447 265,275
PAR.028 0,241 -0,165 0,478 3,096 2,000 5,096 328,402
PAR.029 0,241 -0,165 0,478 3,096 2,000 5,096 328,402
PAR.030 0,241 -0,271 0,478 4,122 2,803 6,926 445,172
PAR.031 0,241 -0,222 0,478 4,128 3,500 7,628 513,167
PAR.032 0,241 0,658 0,478 52,500 27,000 79,500 5578,184
PAR.033 0,241 1,445 0,478 20,438 6,104 26,542 1439,228
PAR.034 0,241 0,499 0,478 43,279 9,471 52,749 2475,002
PAR.035 0,241 99,945 0,478 5,674 0,008 5,683 7,108
PAR.036 0,241 3,089 0,478 0,886 3,798 4,684 449,260
PAR.037 2,414E-01 9,992E+01 4,783E-01 1,145E+07 1,480E+04 1,146E+07 1,382E+07
PAR.038 0,241 11,326 0,478 0,623 0,000 0,624 4,911
PAR.039 0,241 8,305 0,478 0,137 0,004 0,141 2,144
PAR.040 0,241 8,244 0,478 0,732 0,004 0,737 8,185
PAR.041 0,241 4,412 0,478 0,036 0,008 0,043 1,595
PAR.042 0,241 2,358 0,478 38,220 9,058 47,278 1961,017
PAR.043 2,414E-01 2,929E+01 4,783E-01 3,517E+05 9,212E+03 3,609E+05 3,290E+06
PAR.044 0,241 4,560 0,478 0,340 0,016 0,357 7,838
PAR.045 0,241 2,350 0,478 0,291 0,014 0,305 8,393
PAR.046 0,241 13,505 0,478 0,985 0,016 1,001 12,621
PAR.047 0,241 0,218 0,478 0,584 0,202 0,786 49,990
PAR.048 0,241 -0,038 0,478 0,383 0,609 0,992 79,912
PAR.049 0,241 15,395 0,478 0,726 0,022 0,749 17,967
PAR.050 0,241 56,039 0,478 0,609 0,026 0,635 9,080
PAR.051 0,241 2,223 0,478 0,417 0,580 0,996 85,772

204
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla AP2.1-3. Descriptivos de la base de datos femenina: percentiles 10, 20,


25, 30 y 40.
Percentil Percentil Percentil Percentil Percentil Percentil
10 20 25 30 40 50

PAR.001 159,837 176,108 182,429 187,658 197,687 203,601


PAR.002 0,004 0,004 0,004 0,005 0,006 0,009
PAR.003 0,017 0,023 0,026 0,027 0,029 0,034
PAR.004 0,048 0,058 0,062 0,068 0,075 0,083
PAR.005 0,018 0,023 0,024 0,026 0,031 0,037
PAR.006 0,937 0,961 0,970 0,974 0,981 0,987
PAR.007 0,986 0,994 0,996 0,997 0,999 1,000
PAR.008 0,034 0,045 0,049 0,050 0,055 0,063
PAR.009 2,000 2,000 2,000 2,000 2,000 2,000
PAR.010 0,038 0,063 0,070 0,075 0,084 0,102
PAR.011 -13,241 -12,452 -12,059 -11,557 -10,584 -8,976
PAR.012 -35,501 -33,342 -32,854 -32,516 -31,481 -28,763
PAR.013 -43,269 -41,854 -41,011 -39,762 -38,523 -35,912
PAR.014 -48,986 -46,652 -46,133 -45,300 -43,970 -41,875
PAR.015 -7,752 -5,234 -4,928 -4,510 -3,857 -3,334
PAR.016 -7,752 -5,234 -4,928 -4,510 -3,928 -3,377
PAR.017 15,818 18,389 18,789 19,804 20,880 22,192
PAR.018 -32,538 -30,872 -29,141 -27,530 -25,504 -24,102
PAR.019 -26,992 -24,817 -23,092 -22,071 -19,912 -18,503
PAR.020 -26,992 -24,817 -23,092 -22,071 -19,912 -18,503
PAR.021 -42,673 -39,504 -38,333 -37,029 -34,963 -33,003
PAR.022 -35,437 -32,881 -31,146 -30,199 -28,213 -25,992
PAR.023 -74,367 -73,256 -72,427 -70,801 -69,549 -66,874
PAR.024 0,494 0,500 0,500 0,500 0,500 0,500
PAR.025 0,500 0,500 0,500 0,500 0,500 0,500
PAR.026 2,000 2,000 2,000 2,000 2,000 2,000
PAR.027 2,000 2,000 2,037 2,124 2,500 2,500
PAR.028 2,500 2,579 2,818 2,989 3,000 3,132
PAR.029 2,500 2,579 2,818 2,989 3,000 3,132
PAR.030 3,415 3,639 3,828 3,968 4,217 4,422
PAR.031 4,078 4,429 4,503 4,581 4,829 5,100
PAR.032 45,050 49,024 50,500 51,650 53,500 54,500
PAR.033 10,029 11,949 12,418 12,682 13,727 14,189
PAR.034 14,506 17,362 18,626 19,851 22,081 24,092
PAR.035 0,010 0,011 0,012 0,012 0,012 0,013
PAR.036 4,212 4,381 4,421 4,467 4,532 4,569
PAR.037 1,583E+04 1,791E+04 1,833E+04 1,897E+04 1,977E+04 2,034E+04
PAR.038 0,000 0,001 0,001 0,001 0,001 0,003
PAR.039 0,006 0,006 0,007 0,007 0,009 0,013
PAR.040 0,007 0,008 0,009 0,009 0,012 0,020

205
Apéndices

Percentil Percentil Percentil Percentil Percentil Percentil


10 20 25 30 40 50
PAR.041 0,010 0,011 0,011 0,012 0,013 0,015
PAR.042 12,632 13,909 14,558 15,277 16,154 17,104
PAR.043 1,160E+04 1,335E+04 1,465E+04 1,584E+04 1,860E+04 2,088E+04
PAR.044 0,025 0,031 0,034 0,038 0,045 0,052
PAR.045 0,027 0,033 0,037 0,043 0,048 0,060
PAR.046 0,034 0,041 0,047 0,051 0,060 0,065
PAR.047 0,346 0,415 0,431 0,446 0,471 0,490
PAR.048 0,686 0,727 0,744 0,769 0,791 0,809
PAR.049 0,089 0,118 0,128 0,133 0,149 0,159
PAR.050 0,052 0,061 0,064 0,067 0,075 0,080
PAR.051 0,785 0,815 0,822 0,828 0,841 0,856

Tabla AP2.1-4. Descriptivos de la base de datos femenina:


percentiles 60, 70, 75, 80 y 90.
Percentil Percentil Percentil Percentil Percentil
60 70 75 80 90

PAR.001 209,189 216,703 220,719 224,463 239,340


PAR.002 0,011 0,018 0,021 0,028 0,041
PAR.003 0,039 0,045 0,049 0,050 0,062
PAR.004 0,095 0,105 0,106 0,112 0,143
PAR.005 0,042 0,045 0,048 0,051 0,061
PAR.006 0,998 1,008 1,010 1,013 1,027
PAR.007 1,001 1,003 1,004 1,005 1,010
PAR.008 0,068 0,079 0,086 0,093 0,107
PAR.009 2,000 2,000 2,000 2,000 2,045
PAR.010 0,126 0,149 0,166 0,214 0,320
PAR.011 -7,794 -5,780 -5,044 -3,353 -1,200
PAR.012 -26,749 -23,344 -21,024 -18,829 -11,795
PAR.013 -33,997 -29,224 -26,702 -24,455 -18,043
PAR.014 -37,443 -32,774 -29,679 -27,804 -21,068
PAR.015 -2,999 -2,665 -2,535 -2,484 -2,299
PAR.016 -3,027 -2,687 -2,542 -2,491 -2,305
PAR.017 22,618 23,165 23,618 24,200 25,358
PAR.018 -22,194 -20,307 -19,316 -18,317 -14,919
PAR.019 -17,215 -14,316 -12,568 -11,196 -8,134
PAR.020 -17,215 -14,316 -12,568 -11,196 -8,134
PAR.021 -29,578 -27,317 -25,375 -24,290 -21,341
PAR.022 -23,517 -19,513 -18,494 -17,439 -13,985
PAR.023 -63,910 -59,801 -58,728 -57,342 -48,346
PAR.024 0,500 0,500 0,500 0,500 0,500
PAR.025 0,500 0,500 0,500 0,500 0,500
PAR.026 2,000 2,000 2,000 2,000 2,045

206
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Percentil Percentil Percentil Percentil Percentil


60 70 75 80 90
PAR.027 2,717 3,006 3,111 3,218 3,589
PAR.028 3,358 3,585 3,805 3,859 4,249
PAR.029 3,358 3,585 3,805 3,859 4,249
PAR.030 4,574 4,907 5,083 5,177 5,593
PAR.031 5,285 5,588 5,783 5,850 6,336
PAR.032 56,500 60,500 61,500 63,411 69,450
PAR.033 14,816 15,382 15,840 16,635 19,163
PAR.034 26,642 28,242 29,257 31,017 36,354
PAR.035 0,013 0,015 0,015 0,016 0,017
PAR.036 4,594 4,616 4,625 4,630 4,651
PAR.037 2,120E+04 2,217E+04 2,302E+04 2,357E+04 2,544E+04
PAR.038 0,007 0,017 0,029 0,057 0,158
PAR.039 0,016 0,023 0,026 0,030 0,049
PAR.040 0,031 0,057 0,063 0,115 0,248
PAR.041 0,016 0,018 0,019 0,020 0,023
PAR.042 18,219 20,687 21,593 24,251 32,692
PAR.043 2,409E+04 2,749E+04 2,978E+04 3,360E+04 4,719E+04
PAR.044 0,067 0,082 0,086 0,113 0,162
PAR.045 0,074 0,094 0,109 0,118 0,184
PAR.046 0,091 0,125 0,132 0,175 0,315
PAR.047 0,511 0,554 0,577 0,586 0,639
PAR.048 0,831 0,846 0,851 0,859 0,878
PAR.049 0,172 0,206 0,220 0,228 0,289
PAR.050 0,086 0,098 0,102 0,106 0,134
PAR.051 0,872 0,879 0,896 0,908 0,960

207
Apéndices

Tabla AP2.1-5. Descriptivos de la base de datos masculina: media, error típico de la


media, mediana, moda, desviación típica, varianza y asimetría.
Error
Desviación
Media típico de Mediana Moda Varianza Asimetría
típica
la media

PAR.001 119,034 1,787 115,442 87,080 17,871 319,368 1,072


PAR.002 0,016 0,002 0,007 0,002 0,020 0,000 2,305
PAR.003 0,050 0,003 0,047 0,008 0,027 0,001 0,961
PAR.004 0,093 0,005 0,085 0,011 0,050 0,003 0,724
PAR.005 0,054 0,003 0,046 0,010 0,034 0,001 1,733
PAR.006 0,977 0,009 0,989 0,522 0,093 0,009 -2,814
PAR.007 1,000 0,002 1,000 0,828 0,024 0,001 -3,592
PAR.008 0,100 0,004 0,101 0,028 0,039 0,002 1,060
PAR.009 2,087 0,026 2,000 2,000 0,261 0,068 3,135
PAR.010 0,111 0,009 0,089 0,026 0,087 0,008 3,815
PAR.011 -9,771 0,479 -10,140 -21,379 4,794 22,981 0,288
PAR.012 -29,835 0,730 -30,671 -45,440 7,302 53,319 1,021
PAR.013 -36,694 0,787 -37,795 -50,221 7,866 61,881 1,065
PAR.014 -39,891 0,847 -41,764 -55,720 8,466 71,676 0,701
PAR.015 -3,948 0,355 -2,686 -21,467 3,548 12,589 -2,870
PAR.016 -3,949 0,355 -2,686 -21,467 3,552 12,620 -2,872
PAR.017 27,208 0,320 27,610 18,244 3,200 10,238 -0,810
PAR.018 -24,501 0,754 -24,520 -43,044 7,544 56,914 0,015
PAR.019 -17,390 0,666 -18,239 -34,856 6,661 44,370 0,434
PAR.020 -17,390 0,666 -18,239 -34,856 6,661 44,370 0,434
PAR.021 -30,660 0,761 -30,810 -46,652 7,608 57,883 0,169
PAR.022 -24,088 0,683 -24,567 -40,934 6,827 46,608 0,187
PAR.023 -74,783 1,015 -76,682 -95,472 10,154 103,101 0,854
PAR.024 0,486 0,004 0,500 0,500 0,042 0,002 -3,051
PAR.025 0,486 0,004 0,500 0,500 0,041 0,002 -3,029
PAR.026 2,087 0,026 2,000 2,000 0,261 0,068 3,135
PAR.027 2,512 0,059 2,500 2,000 0,590 0,348 0,745
PAR.028 3,223 0,066 3,261 3,500 0,659 0,434 0,294
PAR.029 3,223 0,066 3,261 3,500 0,659 0,434 0,294
PAR.030 4,318 0,093 4,257 3,500 0,925 0,856 0,451
PAR.031 4,984 0,097 4,840 4,000 0,973 0,946 0,364
PAR.032 92,065 1,676 95,059 97,000 16,761 280,915 -0,558
PAR.033 15,408 0,418 14,233 8,171 4,185 17,512 0,415
PAR.034 24,562 1,116 22,033 6,848 11,164 124,631 1,091
PAR.035 0,023 0,001 0,022 0,015 0,008 0,000 7,704
PAR.036 4,535 0,014 4,589 4,055 0,137 0,019 -1,548
PAR.037 1,301E+04 9,344E+02 1,141E+04 8,731E+03 9,344E+03 8,730E+07 8,965E+00
PAR.038 0,036 0,010 0,002 0,000 0,097 0,009 4,670
PAR.039 0,021 0,002 0,012 0,003 0,021 0,000 1,814
PAR.040 0,068 0,013 0,016 0,004 0,126 0,016 3,545

208
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Error
Desviación
Media típico de Mediana Moda Varianza Asimetría
típica
la media
PAR.041 0,023 0,001 0,020 0,008 0,010 0,000 2,371
PAR.042 16,184 0,576 14,938 8,445 5,760 33,177 2,057
PAR.043 1,872E+04 5,512E+03 7,877E+03 4,417E+03 5,512E+04 3,038E+09 9,277E+00
PAR.044 0,101 0,010 0,077 0,013 0,096 0,009 3,127
PAR.045 0,088 0,006 0,071 0,011 0,062 0,004 1,757
PAR.046 0,142 0,017 0,090 0,011 0,169 0,029 3,750
PAR.047 0,501 0,010 0,490 0,124 0,099 0,010 0,406
PAR.048 0,787 0,008 0,790 0,579 0,077 0,006 -0,094
PAR.049 0,194 0,008 0,180 0,031 0,081 0,007 1,049
PAR.050 0,075 0,003 0,070 0,002 0,034 0,001 1,132
PAR.051 0,851 0,011 0,868 0,191 0,113 0,013 -2,989

Tabla AP2.1-6. Descriptivos de la base de datos masculina: error típico de asimetría,


curtosis, error típico de curtosis, amplitud, mínimo, máximo, suma.
Error Error
típico de Curtosis típico de Amplitud Mínimo Máximo Suma
asimetría curtosis

PAR.001 0,241 1,614 0,478 96,706 87,080 183,787 11903,411


PAR.002 0,241 5,247 0,478 0,097 0,002 0,099 1,626
PAR.003 0,241 1,346 0,478 0,145 0,008 0,153 5,042
PAR.004 0,241 1,019 0,478 0,270 0,011 0,281 9,294
PAR.005 0,241 4,61 0,478 0,197 0,010 0,206 5,389
PAR.006 0,241 10,472 0,478 0,613 0,522 1,135 97,686
PAR.007 0,241 26,407 0,478 0,214 0,828 1,043 99,959
PAR.008 0,241 4,23 0,478 0,257 0,028 0,285 10,022
PAR.009 0,241 8,892 0,478 1,273 2,000 3,273 208,651
PAR.010 0,241 23,044 0,478 0,688 0,026 0,714 11,141
PAR.011 0,241 0,266 0,478 24,742 -21,379 3,364 -977,114
PAR.012 0,241 2 0,478 40,958 -45,440 -4,482 -2983,525
PAR.013 0,241 1,687 0,478 39,646 -50,221 -10,575 -3669,372
PAR.014 0,241 0,189 0,478 39,296 -55,720 -16,424 -3989,130
PAR.015 0,241 8,908 0,478 20,570 -21,467 -0,898 -394,828
PAR.016 0,241 8,911 0,478 20,570 -21,467 -0,898 -394,949
PAR.017 0,241 0,59 0,478 15,321 18,244 33,565 2720,810
PAR.018 0,241 0,083 0,478 36,384 -43,044 -6,660 -2450,145
PAR.019 0,241 0,267 0,478 35,114 -34,856 0,258 -1738,967
PAR.020 0,241 0,267 0,478 35,114 -34,856 0,258 -1738,967
PAR.021 0,241 -0,327 0,478 33,270 -46,652 -13,382 -3065,971
PAR.022 0,241 0,289 0,478 34,433 -40,934 -6,502 -2408,793
PAR.023 0,241 0,815 0,478 55,602 -95,472 -39,870 -7478,338
PAR.024 0,241 8,071 0,478 0,174 0,326 0,500 48,609

209
Apéndices

Error Error
típico de Curtosis típico de Amplitud Mínimo Máximo Suma
asimetría curtosis
PAR.025 0,241 7,914 0,478 0,167 0,333 0,500 48,632
PAR.026 0,241 8,892 0,478 1,273 2,000 3,273 208,651
PAR.027 0,241 0,745 0,478 3,066 1,379 4,444 251,218
PAR.028 0,241 -0,029 0,478 3,033 2,000 5,033 322,304
PAR.029 0,241 -0,029 0,478 3,033 2,000 5,033 322,304
PAR.030 0,241 0,264 0,478 4,700 2,500 7,200 431,776
PAR.031 0,241 0,123 0,478 5,043 2,857 7,900 498,424
PAR.032 0,241 0,619 0,478 89,500 47,000 136,500 9206,498
PAR.033 0,241 -0,573 0,478 17,963 8,171 26,134 1540,838
PAR.034 0,241 1,435 0,478 54,814 6,848 61,662 2456,219
PAR.035 0,241 69,551 0,478 0,082 0,015 0,097 2,274
PAR.036 0,241 1,803 0,478 0,621 4,055 4,676 453,513
PAR.037 0,241 85,833 4,783E-01 9,341E+04 8,731E+03 1,021E+05 1,301E+06
PAR.038 0,241 26,16 0,478 0,708 0,000 0,708 3,649
PAR.039 0,241 2,799 0,478 0,097 0,003 0,100 2,130
PAR.040 0,241 14,602 0,478 0,791 0,004 0,795 6,774
PAR.041 0,241 9,349 0,478 0,071 0,008 0,079 2,272
PAR.042 0,241 4,926 0,478 30,480 8,445 38,925 1618,445
PAR.043 0,241 90,028 4,783E-01 5,462E+05 4,417E+03 5,506E+05 1,872E+06
PAR.044 0,241 13,247 0,478 0,652 0,013 0,666 10,135
PAR.045 0,241 4,333 0,478 0,330 0,011 0,341 8,774
PAR.046 0,241 17,066 0,478 1,160 0,011 1,171 14,213
PAR.047 0,241 4,272 0,478 0,718 0,124 0,842 50,069
PAR.048 0,241 0,381 0,478 0,398 0,579 0,977 78,659
PAR.049 0,241 1,544 0,478 0,423 0,031 0,454 19,431
PAR.050 0,241 1,972 0,478 0,188 0,002 0,190 7,478
PAR.051 0,241 13,515 0,478 0,806 0,191 0,997 85,092

210
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla AP2.1-7. Descriptivos de la base de datos masculina: percentiles 10, 20,


25, 30 y 40.
Percentil Percentil Percentil Percentil Percentil Percentil
10 20 25 30 40 50
PAR.001 100,357 105,176 107,212 108,547 113,176 115,442
PAR.002 0,003 0,004 0,005 0,005 0,005 0,007
PAR.003 0,017 0,028 0,031 0,032 0,039 0,047
PAR.004 0,023 0,055 0,060 0,069 0,079 0,085
PAR.005 0,015 0,028 0,035 0,037 0,042 0,046
PAR.006 0,908 0,951 0,957 0,966 0,983 0,989
PAR.007 0,982 0,989 0,991 0,993 0,995 1,000
PAR.008 0,046 0,066 0,078 0,081 0,093 0,101
PAR.009 2,000 2,000 2,000 2,000 2,000 2,000
PAR.010 0,042 0,055 0,061 0,064 0,074 0,089
PAR.011 -16,043 -13,500 -12,681 -12,305 -10,962 -10,140
PAR.012 -37,890 -34,765 -33,794 -33,249 -32,274 -30,671
PAR.013 -45,230 -42,654 -41,496 -40,723 -39,038 -37,795
PAR.014 -49,838 -46,931 -45,458 -44,532 -43,513 -41,764
PAR.015 -7,752 -4,698 -4,283 -3,477 -2,968 -2,686
PAR.016 -7,752 -4,698 -4,283 -3,477 -2,968 -2,686
PAR.017 22,567 25,376 25,833 26,533 27,091 27,610
PAR.018 -33,850 -30,725 -29,938 -27,941 -25,768 -24,520
PAR.019 -25,499 -22,580 -21,235 -20,809 -19,351 -18,239
PAR.020 -25,499 -22,580 -21,235 -20,809 -19,351 -18,239
PAR.021 -40,620 -36,919 -35,957 -34,912 -32,519 -30,810
PAR.022 -31,829 -29,471 -28,631 -27,733 -25,736 -24,567
PAR.023 -85,677 -82,581 -81,876 -80,793 -78,630 -76,682
PAR.024 0,447 0,500 0,500 0,500 0,500 0,500
PAR.025 0,447 0,500 0,500 0,500 0,500 0,500
PAR.026 2,000 2,000 2,000 2,000 2,000 2,000
PAR.027 1,950 2,000 2,000 2,031 2,295 2,500
PAR.028 2,405 2,510 2,766 2,890 3,000 3,261
PAR.029 2,405 2,510 2,766 2,890 3,000 3,261
PAR.030 3,102 3,500 3,571 3,924 4,073 4,257
PAR.031 3,692 4,115 4,294 4,533 4,676 4,840
PAR.032 68,600 79,600 84,125 87,150 90,500 95,059
PAR.033 10,388 11,964 12,364 12,647 13,366 14,233
PAR.034 12,813 15,171 16,640 17,597 19,408 22,033
PAR.035 0,018 0,019 0,020 0,020 0,021 0,022
PAR.036 4,325 4,454 4,487 4,517 4,571 4,589
PAR.037 1,001E+04 1,034E+04 1,068E+04 1,075E+04 1,120E+04 1,141E+04
PAR.038 0,001 0,001 0,001 0,001 0,001 0,002
PAR.039 0,005 0,007 0,007 0,008 0,009 0,012
PAR.040 0,007 0,008 0,009 0,010 0,012 0,016

211
Apéndices

Percentil Percentil Percentil Percentil Percentil Percentil


10 20 25 30 40 50
PAR.041 0,014 0,017 0,017 0,018 0,018 0,020
PAR.042 11,284 12,427 12,563 12,851 13,747 14,938
PAR.043 5,245E+03 6,170E+03 6,522E+03 6,843E+03 7,154E+03 7,877E+03
PAR.044 0,024 0,046 0,049 0,053 0,061 0,077
PAR.045 0,025 0,042 0,046 0,052 0,064 0,071
PAR.046 0,039 0,053 0,057 0,062 0,076 0,090
PAR.047 0,425 0,449 0,453 0,457 0,477 0,490
PAR.048 0,692 0,731 0,740 0,749 0,767 0,790
PAR.049 0,105 0,131 0,140 0,149 0,169 0,180
PAR.050 0,036 0,050 0,053 0,055 0,064 0,070
PAR.051 0,739 0,819 0,824 0,839 0,859 0,868

Tabla AP2.1-8. Descriptivos de la base de datos masculina:


percentiles 60, 70, 75, 80 y 90.
Percentil Percentil Percentil Percentil Percentil
60 70 75 80 90

PAR.001 118,723 125,211 127,001 131,227 146,946


PAR.002 0,010 0,014 0,020 0,026 0,039
PAR.003 0,054 0,062 0,069 0,073 0,084
PAR.004 0,098 0,111 0,128 0,139 0,155
PAR.005 0,056 0,061 0,066 0,070 0,089
PAR.006 1,003 1,016 1,026 1,029 1,053
PAR.007 1,003 1,008 1,010 1,014 1,025
PAR.008 0,108 0,115 0,122 0,130 0,145
PAR.009 2,000 2,000 2,000 2,000 2,319
PAR.010 0,108 0,129 0,144 0,153 0,199
PAR.011 -9,288 -7,608 -6,990 -5,305 -3,341
PAR.012 -29,525 -28,419 -27,210 -24,200 -20,624
PAR.013 -36,563 -34,629 -33,561 -32,450 -26,852
PAR.014 -39,693 -36,079 -33,227 -32,431 -28,795
PAR.015 -2,512 -2,206 -2,123 -2,002 -1,824
PAR.016 -2,512 -2,206 -2,123 -2,002 -1,824
PAR.017 28,222 28,687 29,221 29,980 30,972
PAR.018 -22,791 -21,340 -20,072 -18,251 -15,108
PAR.019 -16,632 -15,002 -14,337 -12,197 -6,558
PAR.020 -16,632 -15,002 -14,337 -12,197 -6,558
PAR.021 -29,272 -27,793 -26,160 -23,906 -20,155
PAR.022 -23,250 -21,079 -20,456 -19,020 -13,238
PAR.023 -74,631 -71,469 -69,683 -66,999 -58,457
PAR.024 0,500 0,500 0,500 0,500 0,500
PAR.025 0,500 0,500 0,500 0,500 0,500
PAR.026 2,000 2,000 2,000 2,000 2,319

212
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Percentil Percentil Percentil Percentil Percentil


60 70 75 80 90
PAR.027 2,555 2,858 2,972 3,000 3,249
PAR.028 3,449 3,500 3,553 3,778 4,053
PAR.029 3,449 3,500 3,553 3,778 4,053
PAR.030 4,472 4,713 4,936 5,000 5,562
PAR.031 5,245 5,473 5,658 5,833 6,214
PAR.032 97,500 100,350 102,125 105,500 109,425
PAR.033 16,520 17,488 18,576 19,404 21,575
PAR.034 24,928 29,880 30,993 32,839 38,754
PAR.035 0,022 0,023 0,024 0,024 0,026
PAR.036 4,603 4,616 4,629 4,639 4,652
PAR.037 1,181E+04 1,247E+04 1,291E+04 1,354E+04 1,559E+04
PAR.038 0,004 0,011 0,025 0,035 0,104
PAR.039 0,016 0,022 0,027 0,035 0,048
PAR.040 0,026 0,040 0,074 0,087 0,194
PAR.041 0,022 0,023 0,027 0,029 0,036
PAR.042 15,947 16,856 17,351 18,521 22,548
PAR.043 1,033E+04 1,373E+04 1,529E+04 1,724E+04 3,251E+04
PAR.044 0,089 0,104 0,110 0,128 0,210
PAR.045 0,089 0,099 0,107 0,130 0,173
PAR.046 0,117 0,143 0,154 0,183 0,298
PAR.047 0,505 0,518 0,529 0,537 0,608
PAR.048 0,813 0,827 0,833 0,844 0,868
PAR.049 0,192 0,222 0,239 0,249 0,296
PAR.050 0,078 0,084 0,088 0,092 0,123
PAR.051 0,885 0,904 0,915 0,922 0,951

213
Apéndice 2.2. Análisis descriptivo de los
parámetros: diagramas de caja
Apéndices

BASE DE DATOS FEMENINA

69
1 1
96 88

CTRL_PATOLOGIA
CTRL_PATOLOGIA

63

39
0 0
39
47
11

150,000 200,000 250,000 300,000 0,000 0,020 0,040 0,060 0,080 0,100 0,120 0,140

PAR.001 PAR.002

1 0,072 1 0,146
CTRL_PATOLOGIA

84
CTRL_PATOLOGIA

42 36
0 0,0451
0 0,148
42
2

0,000 0,010 0,020 0,030 0,040 0,050 0,060 0,070 0,080 0,000 0,050 0,100 0,150 0,200 0,250 0,300

PAR.003 PAR.004

1 1
CTRL_PATOLOGIA

CTRL_PATOLOGIA

88 67 57 80 85

42
0 0
49
2

0,000 0,020 0,040 0,060 0,080 0,100 0,120 0,600 0,700 0,800 0,900 1,000 1,100

PAR.005 PAR.006

216
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

52
85 80

1 1

CTRL_PATOLOGIA
CTRL_PATOLOGIA

67 78 57 82 68 96
70

35

0 37 0
49
40

0,700 0,800 0,900 1,000 0,000 0,050 0,100 0,150 0,200 0,250

PAR.007 PAR.008

69 70 91
94
1 1
CTRL_PATOLOGIA

CTRL_PATOLOGIA

57 56 85 98 70
89 79 73
52

0 0
25

2,000 2,200 2,400 2,600 2,800 3,000 0,000 0,500 1,000 1,500 2,000

PAR.009 PAR.010

1 17,527 1
CTRL_PATOLOGIA

CTRL_PATOLOGIA

0 10,915 0
30

-20,000 -15,000 -10,000 -5,000 0,000 5,000 -40,000 -30,000 -20,000 -10,000 0,000

PAR.011 PAR.012

217
Apéndices

1 1
CTRL_PATOLOGIA

CTRL_PATOLOGIA
0 0
30 30

-60,000 -50,000 -40,000 -30,000 -20,000 -10,000 0,000 -50,000 -40,000 -30,000 -20,000

PAR.013 PAR.014

66
1 1 18,175
CTRL_PATOLOGIA

CTRL_PATOLOGIA

98
96

31

0 0 10,096
49
50

-25,000 -20,000 -15,000 -10,000 -5,000 0,000 10,000 15,000 20,000 25,000 30,000

PAR.015 PAR.017

1 28,820 1 24,129
CTRL_PATOLOGIA

CTRL_PATOLOGIA

0 23,809 0 19,219
13

-40,000 -30,000 -20,000 -10,000 -30,000 -20,000 -10,000 0,000

PAR.018 PAR.019

218
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

1 33,599 1 25,972
CTRL_PATOLOGIA

CTRL_PATOLOGIA
0 22,311 0 20,877
40 40

-50,000 -40,000 -30,000 -20,000 -10,000 0,000


-40,000 -30,000 -20,000 -10,000
PAR.021 PAR.022

79 69

1 1
CTRL_PATOLOGIA

CTRL_PATOLOGIA

94 98 73 94 85 56 57

70 89

30

0 0
49
15

-90,000 -80,000 -70,000 -60,000 -50,000 -40,000 -30,000 0,300 0,350 0,400 0,450 0,500

PAR.023 PAR.024

73
69
70
1 1
CTRL_PATOLOGIA

98
CTRL_PATOLOGIA

57 56 85 64
94
89 79

0 0

2,000 2,200 2,400 2,600 2,800 3,000 1,500 2,000 2,500 3,000 3,500 4,000 4,500

PAR.026 PAR.027

219
Apéndices

1 2,002 1 2,984
CTRL_PATOLOGIA

CTRL_PATOLOGIA
64

0 3,096 0 3,275
49

2,000 3,000 4,000 5,000 2,000 3,000 4,000 5,000 6,000 7,000

PAR.028 PAR.030

1 2,898 1 44,938
CTRL_PATOLOGIA
CTRL_PATOLOGIA

90

0 4,128 0 29,500
48 1
47

3,000 4,000 5,000 6,000 7,000 8,000 20,000 30,000 40,000 50,000 60,000 70,000 80,000

PAR.031 PAR.032

1 13,924 1
CTRL_PATOLOGIA

CTRL_PATOLOGIA

72 55 77

0 10,731 0
16 36 23

5,000 10,000 15,000 20,000 25,000 30,000 0,000 10,000 20,000 30,000 40,000 50,000 60,000

PAR.033 PAR.034

220
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

70
85 85
1 73 1
CTRL_PATOLOGIA

70

CTRL_PATOLOGIA
96 73

1
0 0

47 37

0,000 1,000 2,000 3,000 4,000 5,000 6,000 3,800 4,000 4,200 4,400 4,600 4,800

PAR.035 PAR.036

85 85
63
73
1 1
CTRL_PATOLOGIA

96 70
CTRL_PATOLOGIA

96 70
69
88
82
94
47 50
11

39
0 0 37
39

35

14
31

0,000 2000000,00 4000000,00 6000000,00 8000000,00 10000000,0 12000000,0


0,000 0,100 0,200 0,300 0,400 0,500 0,600 0,700
0 0 0 0 00 00

PAR.038
PAR.037

70 96
63 69 63

1 1
CTRL_PATOLOGIA

CTRL_PATOLOGIA

88
96 88

85

39
39
11 37
0 0
47
28 11
47

0,000 0,030 0,060 0,090 0,120 0,150 0,000 0,200 0,400 0,600 0,800

PAR.039 PAR.040

221
Apéndices

1 1
CTRL_PATOLOGIA

CTRL_PATOLOGIA
86 59 75 86

50

0 0

16

0,005 0,010 0,015 0,020 0,025 0,030 0,035 0,040 0,045 10,000 20,000 30,000 40,000 50,000

PAR.041 PAR.042

98

73 69

1 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA

85 94 85 88 94
95 67

50
39 42 2
0 0

31 36

0,000 100000,000 200000,000 300000,000 400000,000 0,000 0,100 0,200 0,300 0,400

PAR.043 PAR.044

69 85

1
1
CTRL_PATOLOGIA

CTRL_PATOLOGIA

94

95

0 43
0
2

0,000 0,100 0,200 0,300 0,000 0,200 0,400 0,600 0,800 1,000 1,200

PAR.045 PAR.046

222
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

1 0,498 1 0,383
CTRL_PATOLOGIA

CTRL_PATOLOGIA
98

0 0,285 0 0,223
9

0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,600 0,700 0,800 0,900 1,000

PAR.047 PAR.048

95
1
CTRL_PATOLOGIA 1
51
CTRL_PATOLOGIA

59 97 51

0 0
13
29

0,000 0,100 0,200 0,300 0,400 0,500 0,600 0,700


0,000 0,200 0,400 0,600 0,800
PAR.050
PAR.049

1
CTRL_PATOLOGIA

98

50

0,500 0,600 0,700 0,800 0,900 1,000

PAR.051

223
Apéndices

BASE DE DATOS MASCULINA

52

1 1
CTRL_PATOLOGIA

CTRL_PATOLOGIA
83
64

41
18

0 0 16
33 23

12

80,000 100,000 120,000 140,000 160,000 180,000 200,000 0,000 0,020 0,040 0,060 0,080 0,100

PAR.001 PAR.002

1
1
CTRL_PATOLOGIA

57
CTRL_PATOLOGIA

56

0
0

0,000 0,020 0,040 0,060 0,080 0,100 0,120 0,140 0,160


0,000 0,050 0,100 0,150 0,200 0,250 0,300
PAR.003
PAR.004

91

1 1
CTRL_PATOLOGIA

55 58 77
CTRL_PATOLOGIA

93 59 51

57

37

0 0
30 50

0,500 0,600 0,700 0,800 0,900 1,000 1,100 1,200


0,000 0,050 0,100 0,150 0,200
PAR.006
PAR.005

224
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

1 1
CTRL_PATOLOGIA

98

CTRL_PATOLOGIA
65

0
0
30
12

0,800 0,850 0,900 0,950 1,000 1,050


0,000 0,050 0,100 0,150 0,200 0,250 0,300
PAR.007
PAR.008

52 74

1 1
CTRL_PATOLOGIA

84 95 68
CTRL_PATOLOGIA

99 75 93 67
55 82
57 87

34

0
0
40

2,000 2,200 2,400 2,600 2,800 3,000 3,200 3,400


0,000 0,200 0,400 0,600 0,800
PAR.009
PAR.010

75
1 1
CTRL_PATOLOGIA

CTRL_PATOLOGIA

56
74

47 47

0
0
49
49 50

-25,000 -20,000 -15,000 -10,000 -5,000 0,000 5,000


-50,000 -40,000 -30,000 -20,000 -10,000 0,000
PAR.011
PAR.012

225
Apéndices

1 1
CTRL_PATOLOGIA

CTRL_PATOLOGIA
75 56

0 0

41

-50,000 -40,000 -30,000 -20,000 -10,000 -60,000 -50,000 -40,000 -30,000 -20,000

PAR.013 PAR.014

68

1 1
CTRL_PATOLOGIA

CTRL_PATOLOGIA

58 64
87

48
0 0
49

50

-25,000 -20,000 -15,000 -10,000 -5,000 0,000 20,000 25,000 30,000

PAR.015 PAR.017

1 1 25,407
CTRL_PATOLOGIA
CTRL_PATOLOGIA

0 0 16,804
38

-40,000 -30,000 -20,000 -10,000 -30,000 -20,000 -10,000 0,000

PAR.018 PAR.019

226
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

1 26,533 1 25,543
CTRL_PATOLOGIA

CTRL_PATOLOGIA
47

0 22,970 0 16,189
37
48

-50,000 -40,000 -30,000 -20,000 -10,000 -40,000 -30,000 -20,000 -10,000

PAR.021 PAR.022

68 74
55

1 1
CTRL_PATOLOGIA

CTRL_PATOLOGIA

56 95 52 84
99
82 87

0 0

-100,000 -80,000 -60,000 -40,000 -20,000 0,300 0,350 0,400 0,450 0,500

PAR.023 PAR.024

52 99 74

1 1 2,090
CTRL_PATOLOGIA
CTRL_PATOLOGIA

84 95 82 68 75

57 55
87

37

0 0 1,567

38

2,000 2,200 2,400 2,600 2,800 3,000 3,200 3,400 1,000 2,000 3,000 4,000

PAR.026 PAR.027

227
Apéndices

1 1 3,917
CTRL_PATOLOGIA

CTRL_PATOLOGIA
0 0 3,079
37 48
38
37

2,000 3,000 4,000 5,000


2,000 3,000 4,000 5,000 6,000 7,000 8,000
PAR.028 PAR.030

1 4,476 1 85,833
CTRL_PATOLOGIA
CTRL_PATOLOGIA

38

0 3,289 0 55,500
37 48 39

44

2,000 3,000 4,000 5,000 6,000 7,000 8,000 40,000 60,000 80,000 100,000 120,000 140,000

PAR.031 PAR.032

1 16,292 1
CTRL_PATOLOGIA

CTRL_PATOLOGIA

54

0 17,096 0
40

10,000 15,000 20,000 25,000 0,000 20,000 40,000 60,000 80,000

PAR.033 PAR.034

228
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

93 52

1 1
CTRL_PATOLOGIA

CTRL_PATOLOGIA
64
58

0 0

0,000 0,020 0,040 0,060 0,080 0,100 4,000 4,100 4,200 4,300 4,400 4,500 4,600 4,700

PAR.035 PAR.036

74 58
74

1 1
CTRL_PATOLOGIA

52 64
CTRL_PATOLOGIA

64
75
75
56

23 30
33 12

0 0
16

18 29

0,000 20000,000 40000,000 60000,000 80000,000 100000,000 120000,000 0,000 0,200 0,400 0,600 0,800

PAR.037 PAR.038

56
75

1 1
CTRL_PATOLOGIA

CTRL_PATOLOGIA

52 58 52 64

74

30 41
16
18 12
0 0 30

12
50 18
16
41

0,000 0,020 0,040 0,060 0,080 0,100 0,120


0,000 0,200 0,400 0,600 0,800
PAR.039
PAR.040

229
Apéndices

68

1 1
CTRL_PATOLOGIA

CTRL_PATOLOGIA
88 56 70

71

12

0 0

28
9

0,000 0,010 0,020 0,030 0,040 0,050 0,060 0,070 0,080 10,000 20,000 30,000 40,000

PAR.041 PAR.042

52

1 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA

56 68 68 59
56

49
48
6

0 12 0
30

50 38
1

0,000 100000,000 200000,000 300000,000 400000,000 500000,000 600000,000 0,000 0,100 0,200 0,300 0,400 0,500 0,600 0,700

PAR.043 PAR.044

64 59

1 1
CTRL_PATOLOGIA

CTRL_PATOLOGIA

52 56 68
58
59

0 0
3 30 30
32

0,000 0,100 0,200 0,300 0,400 0,000 0,200 0,400 0,600 0,800 1,000 1,200

PAR.045 PAR.046

230
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

68 88

1 1 0,346
CTRL_PATOLOGIA

CTRL_PATOLOGIA
87 69 73
58
62

0 0 0,292
49

0,200 0,400 0,600 0,800 0,600 0,700 0,800 0,900 1,000

PAR.047 PAR.048

82 57

1 1
CTRL_PATOLOGIA

CTRL_PATOLOGIA

64

74 52

0 0
49

0,000 0,100 0,200 0,300 0,400 0,500


0,000 0,050 0,100 0,150 0,200
PAR.049 PAR.050

52

1
CTRL_PATOLOGIA

87 68
95

0
30

0,000 0,200 0,400 0,600 0,800 1,000

PAR.051

231
Apéndice 2.3. Análisis descriptivo de los
parámetros: normalidad
Apéndices

Tabla AP2.3-1. Resultados de la prueba de Kolmogorov-


Smirnov de la base de datos femenina, todos los sujetos.
Asymp.
Kolmogorov- Sig. (2-
Most Extreme Differences Smirnov Z tailed)
Absolute Positive Negative
PAR.001 0,06428 0,04009 -0,06428 0,64275 0,80314
PAR.002 0,24561 0,22876 -0,24561 2,45613 0,00001
PAR.003 0,10193 0,10193 -0,05699 1,01929 0,24989
PAR.004 0,09353 0,09353 -0,06545 0,93535 0,34581
PAR.005 0,07006 0,07006 -0,04771 0,70061 0,71021
PAR.006 0,24276 0,15232 -0,24276 2,42757 0,00002
PAR.007 0,36855 0,25272 -0,36855 3,68548 0,00000
PAR.008 0,15086 0,15086 -0,10100 1,50861 0,02110
PAR.009 0,49504 0,49504 -0,40496 4,95036 0,00000
PAR.010 0,25142 0,25142 -0,23467 2,51424 0,00001
PAR.011 0,11745 0,11745 -0,07020 1,17446 0,12672
PAR.012 0,13266 0,13266 -0,08323 1,32661 0,05921
PAR.013 0,13657 0,13657 -0,08273 1,36572 0,04797
PAR.014 0,15231 0,15231 -0,07146 1,52310 0,01932
PAR.015 0,19521 0,18636 -0,19521 1,95207 0,00098
PAR.017 0,11016 0,04261 -0,11016 1,10161 0,17647
PAR.018 0,05613 0,05613 -0,02661 0,56134 0,91098
PAR.019 0,06969 0,06969 -0,04277 0,69694 0,71632
PAR.021 0,06959 0,06959 -0,04307 0,69594 0,71798
PAR.022 0,06558 0,06558 -0,05654 0,65575 0,78305
PAR.023 0,13236 0,13236 -0,08236 1,32360 0,06016
PAR.024 0,49440 0,40560 -0,49440 4,94398 0,00000
PAR.026 0,49504 0,49504 -0,40496 4,95036 0,00000
PAR.027 0,12119 0,12119 -0,08221 1,21188 0,10600
PAR.028 0,12229 0,12229 -0,06387 1,22292 0,10046
PAR.030 0,05125 0,05125 -0,03952 0,51254 0,95535
PAR.031 0,05730 0,05730 -0,04262 0,57302 0,89786
PAR.032 0,09095 0,09095 -0,06594 0,90946 0,37980
PAR.033 0,10792 0,10792 -0,05322 1,07922 0,19453
PAR.034 0,05296 0,05296 -0,04153 0,52957 0,94183
PAR.035 0,50364 0,50364 -0,45604 5,03640 0,00000
PAR.036 0,18953 0,16423 -0,18953 1,89526 0,00152
PAR.037 0,50379 0,50379 -0,45705 5,03789 0,00000
PAR.038 0,33859 0,33289 -0,33859 3,38593 0,00000
PAR.039 0,21860 0,21788 -0,21860 2,18599 0,00014
PAR.040 0,31049 0,31049 -0,30261 3,10492 0,00000
PAR.041 0,11919 0,11919 -0,10976 1,19190 0,11668
PAR.042 0,18042 0,18042 -0,11203 1,80423 0,00298
PAR.043 0,31973 0,31973 -0,30935 3,19728 0,00000

234
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Asymp.
Kolmogorov- Sig. (2-
Most Extreme Differences Smirnov Z tailed)
Absolute Positive Negative
PAR.044 0,21260 0,21260 -0,18048 2,12603 0,00024
PAR.045 0,18290 0,18290 -0,16170 1,82899 0,00249
PAR.046 0,24227 0,24227 -0,23965 2,42268 0,00002
PAR.047 0,06982 0,06982 -0,04376 0,69822 0,71420
PAR.048 0,08363 0,07158 -0,08363 0,83625 0,48644
PAR.049 0,14316 0,14316 -0,12425 1,43162 0,03318
PAR.050 0,22124 0,22124 -0,19288 2,21245 0,00011
PAR.051 0,09051 0,09051 -0,08552 0,90514 0,38567

Tabla AP2.3-2. Resultados de la prueba de Kolmogorov-


Smirnov de la base de datos femenina, sujetos normofónicos.
Asymp.
Kolmogorov- Sig. (2-
Most Extreme Differences Smirnov Z tailed)
Absolute Positive Negative
PAR.001 0,09039 0,09039 -0,08403 0,63916 0,80859
PAR.002 0,17791 0,17791 -0,12116 1,25804 0,08439
PAR.003 0,14086 0,14086 -0,07438 0,99605 0,27426
PAR.004 0,12659 0,12659 -0,06963 0,89514 0,39948
PAR.005 0,11347 0,11347 -0,06031 0,80238 0,54027
PAR.006 0,24537 0,15982 -0,24537 1,73502 0,00486
PAR.007 0,09426 0,09426 -0,08097 0,66654 0,76597
PAR.008 0,16430 0,16430 -0,08434 1,16181 0,13442
PAR.009
PAR.010 0,16182 0,16182 -0,08063 1,14422 0,14577
PAR.011 0,09302 0,09302 -0,05477 0,65772 0,77997
PAR.012 0,10615 0,10615 -0,05988 0,75063 0,62611
PAR.013 0,05310 0,05043 -0,05310 0,37550 0,99894
PAR.014 0,09715 0,09715 -0,06201 0,68697 0,73280
PAR.015 0,19785 0,18118 -0,19785 1,39898 0,03991
PAR.017 0,16302 0,07508 -0,16302 1,15270 0,14021
PAR.018 0,08885 0,08885 -0,08844 0,62828 0,82478
PAR.019 0,07205 0,07205 -0,06314 0,50949 0,95755
PAR.021 0,06104 0,06104 -0,05544 0,43165 0,99227
PAR.022 0,09514 0,09514 -0,04642 0,67272 0,75604
PAR.023 0,10474 0,10474 -0,07925 0,74066 0,64291
PAR.024
PAR.026
PAR.027 0,09550 0,09550 -0,07811 0,67528 0,75189
PAR.028 0,13467 0,13467 -0,06533 0,95225 0,32473
PAR.030 0,08811 0,06294 -0,08811 0,62300 0,83245

235
Apéndices

Asymp.
Kolmogorov- Sig. (2-
Most Extreme Differences Smirnov Z tailed)
Absolute Positive Negative
PAR.031 0,06494 0,06494 -0,05154 0,45918 0,98430
PAR.032 0,09905 0,09905 -0,08316 0,70037 0,71062
PAR.033 0,12073 0,12073 -0,07929 0,85366 0,45977
PAR.034 0,08279 0,08279 -0,05009 0,58540 0,88301
PAR.035 0,10824 0,10824 -0,05307 0,76536 0,60137
PAR.036 0,09847 0,05447 -0,09847 0,69632 0,71735
PAR.037 0,10015 0,10015 -0,08863 0,70820 0,69754
PAR.038 0,31166 0,31166 -0,23892 2,20378 0,00012
PAR.039 0,16812 0,16812 -0,10740 1,18876 0,11844
PAR.040 0,20087 0,20087 -0,13261 1,42033 0,03538
PAR.041 0,11726 0,11726 -0,08655 0,82915 0,49752
PAR.042 0,10597 0,10597 -0,04687 0,74933 0,62830
PAR.043 0,12704 0,12704 -0,10111 0,89831 0,39507
PAR.044 0,14252 0,14252 -0,08566 1,00776 0,26177
PAR.045 0,09597 0,09597 -0,07453 0,67861 0,74649
PAR.046 0,10547 0,10547 -0,08233 0,74578 0,63427
PAR.047 0,11237 0,07711 -0,11237 0,79456 0,55303
PAR.048 0,11174 0,07273 -0,11174 0,79011 0,56032
PAR.049 0,09905 0,09905 -0,08931 0,70035 0,71065
PAR.050 0,10175 0,10175 -0,06723 0,71947 0,67862
PAR.051 0,07740 0,04991 -0,07740 0,54727 0,92554

Tabla AP2.3-3. Resultados de la prueba de Kolmogorov-


Smirnov de la base de datos femenina, sujetos con patología
vocal.
Asymp.
Kolmogorov- Sig. (2-
Most Extreme Differences Smirnov Z tailed)
Absolute Positive Negative
PAR.001 0,07169 0,07169 -0,05788 0,50694 0,95933
PAR.002 0,19458 0,19458 -0,16359 1,37588 0,04537
PAR.003 0,08004 0,08004 -0,05437 0,56596 0,90590
PAR.004 0,15068 0,15068 -0,08767 1,06550 0,20627
PAR.005 0,08180 0,08180 -0,06598 0,57843 0,89149
PAR.006 0,22890 0,15810 -0,22890 1,61857 0,01061
PAR.007 0,35966 0,24155 -0,35966 2,54315 0,00000
PAR.008 0,15272 0,15272 -0,11837 1,07993 0,19393
PAR.009 0,43637 0,43637 -0,36363 3,08558 0,00000
PAR.010 0,20682 0,20409 -0,20682 1,46243 0,02776
PAR.011 0,08063 0,08063 -0,06739 0,57011 0,90122
PAR.012 0,07995 0,07995 -0,05410 0,56531 0,90663

236
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Asymp.
Kolmogorov- Sig. (2-
Most Extreme Differences Smirnov Z tailed)
Absolute Positive Negative
PAR.013 0,06259 0,06259 -0,04386 0,44259 0,98958
PAR.014 0,08133 0,08133 -0,07068 0,57506 0,89548
PAR.015 0,21438 0,14946 -0,21438 1,51588 0,02019
PAR.017 0,08236 0,07601 -0,08236 0,58238 0,88671
PAR.018 0,05457 0,04337 -0,05457 0,38589 0,99836
PAR.019 0,09474 0,09474 -0,06315 0,66994 0,76052
PAR.021 0,07339 0,06963 -0,07339 0,51893 0,95053
PAR.022 0,08940 0,05379 -0,08940 0,63218 0,81903
PAR.023 0,11375 0,11375 -0,07057 0,80430 0,53716
PAR.024 0,43542 0,36458 -0,43542 3,07886 0,00000
PAR.026 0,43637 0,43637 -0,36363 3,08558 0,00000
PAR.027 0,11877 0,11877 -0,08212 0,83980 0,48094
PAR.028 0,09346 0,09346 -0,05773 0,66086 0,77501
PAR.030 0,06991 0,06991 -0,04875 0,49431 0,96747
PAR.031 0,08329 0,08329 -0,05095 0,58892 0,87860
PAR.032 0,07588 0,05618 -0,07588 0,53653 0,93570
PAR.033 0,11064 0,11064 -0,06336 0,78237 0,57308
PAR.034 0,09800 0,09800 -0,06280 0,69295 0,72293
PAR.035 0,50015 0,50015 -0,44045 3,53662 0,00000
PAR.036 0,13829 0,09766 -0,13829 0,97788 0,29447
PAR.037 0,49832 0,49832 -0,44071 3,52367 0,00000
PAR.038 0,28582 0,28582 -0,26316 2,02103 0,00057
PAR.039 0,20635 0,20635 -0,13942 1,45911 0,02830
PAR.040 0,25751 0,25751 -0,22011 1,82086 0,00264
PAR.041 0,13489 0,13489 -0,08712 0,95381 0,32282
PAR.042 0,15234 0,15234 -0,09288 1,07722 0,19620
PAR.043 0,33228 0,33228 -0,27105 2,34957 0,00003
PAR.044 0,18735 0,18735 -0,12292 1,32477 0,05979
PAR.045 0,15946 0,15946 -0,08241 1,12757 0,15721
PAR.046 0,19798 0,19798 -0,17732 1,39994 0,03969
PAR.047 0,06174 0,05171 -0,06174 0,43656 0,99113
PAR.048 0,06030 0,06030 -0,04277 0,42635 0,99337
PAR.049 0,19484 0,19484 -0,15524 1,37775 0,04490
PAR.050 0,24273 0,24273 -0,20704 1,71633 0,00553
PAR.051 0,08217 0,08217 -0,07534 0,58101 0,88838

237
Apéndices

Tabla AP2.3-4. Resultados de la prueba de Kolmogorov-


Smirnov de la base de datos masculina, todos los sujetos.
Asymp.
Kolmogorov- Sig. (2-
Most Extreme Differences Smirnov Z tailed)
Absolute Positive Negative
PAR.001 0,12076 0,12076 -0,06657 1,20756 0,10824
PAR.002 0,26345 0,26345 -0,24098 2,63454 0,00000
PAR.003 0,08501 0,08501 -0,06719 0,85014 0,46510
PAR.004 0,10017 0,10017 -0,05083 1,00173 0,26815
PAR.005 0,12707 0,12707 -0,09800 1,27071 0,07916
PAR.006 0,20492 0,12452 -0,20492 2,04924 0,00045
PAR.007 0,14714 0,08848 -0,14714 1,47144 0,02633
PAR.008 0,07645 0,07645 -0,05036 0,76450 0,60282
PAR.009 0,49980 0,49980 -0,37020 4,99802 0,00000
PAR.010 0,16332 0,14769 -0,16332 1,63320 0,00964
PAR.011 0,07157 0,07157 -0,04330 0,71575 0,68489
PAR.012 0,13256 0,13256 -0,07040 1,32564 0,05951
PAR.013 0,12192 0,12192 -0,08830 1,21922 0,10229
PAR.014 0,10092 0,10092 -0,04763 1,00922 0,26025
PAR.015 0,26911 0,22555 -0,26911 2,69112 0,00000
PAR.017 0,12589 0,05048 -0,12589 1,25894 0,08401
PAR.018 0,05689 0,04756 -0,05689 0,56894 0,90255
PAR.019 0,09390 0,09390 -0,06898 0,93905 0,34112
PAR.021 0,06643 0,06643 -0,03764 0,66435 0,76946
PAR.022 0,07487 0,07487 -0,05249 0,74872 0,62933
PAR.023 0,11348 0,11348 -0,05680 1,13477 0,15218
PAR.024 0,50052 0,36948 -0,50052 5,00518 0,00000
PAR.026 0,49980 0,49980 -0,37020 4,99802 0,00000
PAR.027 0,11214 0,11214 -0,09250 1,12143 0,16161
PAR.028 0,07520 0,07520 -0,05284 0,75204 0,62373
PAR.030 0,06355 0,06355 -0,04564 0,63552 0,81405
PAR.031 0,06874 0,06874 -0,03932 0,68736 0,73216
PAR.032 0,09578 0,06911 -0,09578 0,95780 0,31800
PAR.033 0,12544 0,12544 -0,06595 1,25436 0,08597
PAR.034 0,10694 0,10694 -0,06825 1,06943 0,20286
PAR.035 0,26577 0,26577 -0,21005 2,65771 0,00000
PAR.036 0,21239 0,15198 -0,21239 2,12387 0,00024
PAR.037 0,32362 0,32193 -0,32362 3,23616 0,00000
PAR.038 0,35516 0,33045 -0,35516 3,55156 0,00000
PAR.039 0,20500 0,20500 -0,20316 2,05001 0,00045
PAR.040 0,30626 0,29413 -0,30626 3,06264 0,00000
PAR.041 0,19595 0,19595 -0,11067 1,95948 0,00092
PAR.042 0,18353 0,18353 -0,12559 1,83532 0,00237
PAR.043 0,39765 0,33936 -0,39765 3,97650 0,00000

238
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Asymp.
Kolmogorov- Sig. (2-
Most Extreme Differences Smirnov Z tailed)
Absolute Positive Negative
PAR.044 0,22763 0,22763 -0,17992 2,27633 0,00006
PAR.045 0,13681 0,13681 -0,10545 1,36812 0,04734
PAR.046 0,23094 0,23094 -0,21946 2,30940 0,00005
PAR.047 0,16722 0,16722 -0,13386 1,67220 0,00745
PAR.048 0,06567 0,06371 -0,06567 0,65673 0,78152
PAR.049 0,12129 0,12129 -0,05879 1,21286 0,10550
PAR.050 0,12400 0,12400 -0,06865 1,23996 0,09237
PAR.051 0,19811 0,11032 -0,19811 1,98115 0,00078

Tabla AP2.3-5. Resultados de la prueba de Kolmogorov-


Smirnov de la base de datos masculina, sujetos normofónicos.
Asymp.
Kolmogorov- Sig. (2-
Most Extreme Differences Smirnov Z tailed)
Absolute Positive Negative
PAR.001 0,10450 0,10450 -0,05350 0,73892 0,64584
PAR.002 0,22383 0,22383 -0,13570 1,58269 0,01334
PAR.003 0,08389 0,08389 -0,06779 0,59318 0,87318
PAR.004 0,11592 0,11592 -0,08661 0,81965 0,51253
PAR.005 0,09553 0,09553 -0,09053 0,67552 0,75151
PAR.006 0,12262 0,07973 -0,12262 0,86705 0,43979
PAR.007 0,09034 0,09034 -0,08593 0,63877 0,80918
PAR.008 0,10451 0,10451 -0,05669 0,73897 0,64575
PAR.009
PAR.010 0,16698 0,16698 -0,10731 1,18074 0,12302
PAR.011 0,08384 0,07020 -0,08384 0,59283 0,87363
PAR.012 0,10806 0,04390 -0,10806 0,76411 0,60347
PAR.013 0,12502 0,10158 -0,12502 0,88400 0,41519
PAR.014 0,06546 0,03930 -0,06546 0,46289 0,98290
PAR.015 0,20752 0,16650 -0,20752 1,46739 0,02696
PAR.017 0,06107 0,04266 -0,06107 0,43183 0,99223
PAR.018 0,11345 0,08023 -0,11345 0,80219 0,54058
PAR.019 0,12414 0,06006 -0,12414 0,87780 0,42411
PAR.021 0,08178 0,05743 -0,08178 0,57828 0,89168
PAR.022 0,11416 0,05684 -0,11416 0,80724 0,53241
PAR.023 0,08015 0,04600 -0,08015 0,56676 0,90501
PAR.024
PAR.026
PAR.027 0,12123 0,12123 -0,10863 0,85720 0,45445
PAR.028 0,15205 0,15205 -0,09775 1,07518 0,19793
PAR.030 0,10530 0,10530 -0,06408 0,74461 0,63625

239
Apéndices

Asymp.
Kolmogorov- Sig. (2-
Most Extreme Differences Smirnov Z tailed)
Absolute Positive Negative
PAR.031 0,09158 0,09158 -0,04940 0,64754 0,79582
PAR.032 0,11956 0,07525 -0,11956 0,84544 0,47228
PAR.033 0,17063 0,17063 -0,08201 1,20651 0,10879
PAR.034 0,14860 0,14860 -0,11033 1,05074 0,21953
PAR.035 0,08741 0,08741 -0,04814 0,61806 0,83951
PAR.036 0,09769 0,05434 -0,09769 0,69076 0,72655
PAR.037 0,10995 0,10995 -0,04136 0,77745 0,58123
PAR.038 0,34107 0,33163 -0,34107 2,41174 0,00002
PAR.039 0,22811 0,22811 -0,14225 1,61298 0,01100
PAR.040 0,25262 0,25262 -0,20995 1,78630 0,00338
PAR.041 0,19724 0,19724 -0,09468 1,39470 0,04088
PAR.042 0,15558 0,15558 -0,10457 1,10015 0,17760
PAR.043 0,23834 0,23834 -0,12273 1,68533 0,00682
PAR.044 0,12030 0,12030 -0,08394 0,85067 0,46430
PAR.045 0,10216 0,10216 -0,08849 0,72238 0,67373
PAR.046 0,20174 0,20174 -0,12050 1,42649 0,03416
PAR.047 0,06148 0,06148 -0,05737 0,43472 0,99157
PAR.048 0,15223 0,06140 -0,15223 1,07646 0,19685
PAR.049 0,07200 0,05766 -0,07200 0,50914 0,95780
PAR.050 0,07439 0,07439 -0,04846 0,52603 0,94482
PAR.051 0,10025 0,06830 -0,10025 0,70890 0,69638

Tabla AP2.3-6. Resultados de la prueba de Kolmogorov-


Smirnov de la base de datos masculina, sujetos con
patología vocal.
Asymp.
Kolmogorov- Sig. (2-
Most Extreme Differences Smirnov Z tailed)
Absolute Positive Negative
PAR.001 0,13077 0,13077 -0,08130 0,92465 0,35961
PAR.002 0,17655 0,17655 -0,16148 1,24841 0,08857
PAR.003 0,10047 0,10047 -0,09580 0,71043 0,69382
PAR.004 0,13206 0,13206 -0,07991 0,93384 0,34773
PAR.005 0,18860 0,18860 -0,11531 1,33359 0,05705
PAR.006 0,26559 0,17140 -0,26559 1,87800 0,00173
PAR.007 0,18788 0,09646 -0,18788 1,32853 0,05861
PAR.008 0,08710 0,08710 -0,08679 0,61587 0,84260
PAR.009 0,42949 0,42949 -0,31051 3,03698 0,00000
PAR.010 0,18572 0,18572 -0,16580 1,31320 0,06355
PAR.011 0,09577 0,09577 -0,05498 0,67718 0,74880
PAR.012 0,13668 0,13668 -0,09696 0,96650 0,30765

240
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Asymp.
Kolmogorov- Sig. (2-
Most Extreme Differences Smirnov Z tailed)
Absolute Positive Negative
PAR.013 0,15503 0,15503 -0,08314 1,09623 0,18068
PAR.014 0,10300 0,10300 -0,07028 0,72833 0,66370
PAR.015 0,25701 0,17686 -0,25701 1,81736 0,00271
PAR.017 0,11858 0,06620 -0,11858 0,83852 0,48293
PAR.018 0,07494 0,07494 -0,04227 0,52988 0,94157
PAR.019 0,10949 0,09589 -0,10949 0,77418 0,58666
PAR.021 0,08606 0,08606 -0,06246 0,60852 0,85280
PAR.022 0,11777 0,11777 -0,07805 0,83272 0,49193
PAR.023 0,07657 0,07657 -0,05847 0,54146 0,93113
PAR.024 0,43062 0,30938 -0,43062 3,04492 0,00000
PAR.026 0,42949 0,42949 -0,31051 3,03698 0,00000
PAR.027 0,15609 0,15609 -0,07874 1,10373 0,17483
PAR.028 0,12596 0,12596 -0,08520 0,89071 0,40569
PAR.030 0,08644 0,08644 -0,05382 0,61124 0,84906
PAR.031 0,07346 0,07346 -0,05969 0,51942 0,95015
PAR.032 0,09135 0,07959 -0,09135 0,64593 0,79829
PAR.033 0,11018 0,11018 -0,08305 0,77910 0,57849
PAR.034 0,10041 0,10041 -0,06591 0,71004 0,69447
PAR.035 0,31556 0,31556 -0,24292 2,23136 0,00009
PAR.036 0,12770 0,09300 -0,12770 0,90296 0,38866
PAR.037 0,33780 0,33780 -0,33587 2,38862 0,00002
PAR.038 0,29212 0,27575 -0,29212 2,06560 0,00039
PAR.039 0,15576 0,15576 -0,11809 1,10138 0,17664
PAR.040 0,24503 0,24503 -0,23643 1,73263 0,00494
PAR.041 0,16990 0,16990 -0,08817 1,20137 0,11151
PAR.042 0,15799 0,15799 -0,10864 1,11714 0,16474
PAR.043 0,37200 0,33765 -0,37200 2,63045 0,00000
PAR.044 0,22656 0,22656 -0,17036 1,60202 0,01180
PAR.045 0,15439 0,15439 -0,10466 1,09171 0,18428
PAR.046 0,27145 0,27145 -0,21791 1,91942 0,00126
PAR.047 0,17833 0,14394 -0,17833 1,26096 0,08316
PAR.048 0,09203 0,09203 -0,07327 0,65072 0,79090
PAR.049 0,15946 0,15946 -0,07877 1,12754 0,15723
PAR.050 0,16076 0,16076 -0,07645 1,13672 0,15084
PAR.051 0,22442 0,14431 -0,22442 1,58687 0,01300

241
Apéndices

Tabla AP2.3-7. Resultados de las pruebas de


Kolmogorov-Smirnov-Lilliefors y Saphiro-Wilk de la
base de datos femenina, todos los sujetos.
K-S-Lilliefors Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
PAR.001 ,064 100 ,200(*) ,984 100 ,278
PAR.002 ,246 100 ,000 ,662 100 ,000
PAR.003 ,102 100 ,012 ,961 100 ,005
PAR.004 ,094 100 ,031 ,946 100 ,000
PAR.005 ,070 100 ,200(*) ,956 100 ,002
PAR.006 ,243 100 ,000 ,660 100 ,000
PAR.007 ,369 100 ,000 ,426 100 ,000
PAR.008 ,151 100 ,000 ,827 100 ,000
PAR.009 ,495 100 ,000 ,258 100 ,000
PAR.010 ,251 100 ,000 ,556 100 ,000
PAR.011 ,117 100 ,002 ,948 100 ,001
PAR.012 ,133 100 ,000 ,913 100 ,000
PAR.013 ,137 100 ,000 ,929 100 ,000
PAR.014 ,152 100 ,000 ,921 100 ,000
PAR.015 ,195 100 ,000 ,689 100 ,000
PAR.017 ,110 100 ,004 ,972 100 ,033
PAR.018 ,056 100 ,200(*) ,989 100 ,583
PAR.019 ,070 100 ,200(*) ,985 100 ,316
PAR.021 ,070 100 ,200(*) ,985 100 ,314
PAR.022 ,066 100 ,200(*) ,980 100 ,127
PAR.023 ,132 100 ,000 ,927 100 ,000
PAR.024 ,494 100 ,000 ,258 100 ,000
PAR.026 ,495 100 ,000 ,258 100 ,000
PAR.027 ,121 100 ,001 ,956 100 ,002
PAR.028 ,122 100 ,001 ,964 100 ,008
PAR.030 ,051 100 ,200(*) ,986 100 ,370
PAR.031 ,057 100 ,200(*) ,985 100 ,338
PAR.032 ,091 100 ,040 ,977 100 ,075
PAR.033 ,108 100 ,006 ,966 100 ,011
PAR.034 ,053 100 ,200(*) ,975 100 ,050
PAR.035 ,504 100 ,000 ,080 100 ,000
PAR.036 ,190 100 ,000 ,793 100 ,000
PAR.037 ,504 100 ,000 ,080 100 ,000
PAR.038 ,339 100 ,000 ,472 100 ,000
PAR.039 ,219 100 ,000 ,709 100 ,000
PAR.040 ,310 100 ,000 ,552 100 ,000
PAR.041 ,119 100 ,001 ,854 100 ,000
PAR.042 ,180 100 ,000 ,840 100 ,000
PAR.043 ,320 100 ,000 ,415 100 ,000
PAR.044 ,213 100 ,000 ,759 100 ,000
PAR.045 ,183 100 ,000 ,805 100 ,000
PAR.046 ,242 100 ,000 ,638 100 ,000
PAR.047 ,070 100 ,200(*) ,989 100 ,575
PAR.048 ,084 100 ,081 ,979 100 ,102

242
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

K-S-Lilliefors Shapiro-Wilk
Statistic df Sig. Statistic df
PAR.049 ,143 100 ,000 ,793 100 ,000
PAR.050 ,221 100 ,000 ,484 100 ,000
PAR.051 ,091 100 ,042 ,952 100 ,001

Tabla AP2.3-8. Resultados de las pruebas de Kolmogorov-


Smirnov-Lilliefors y Saphiro-Wilk de la base de datos
femenina, sujetos normofónicos (0) y con patología vocal (1).
K-S-Lilliefors Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
PAR.001 0 ,090 50 ,200(*) ,967 50 ,180
1 ,072 50 ,200(*) ,977 50 ,422
PAR.002 0 ,178 50 ,000 ,838 50 ,000
1 ,195 50 ,000 ,784 50 ,000
PAR.003 0 ,141 50 ,015 ,920 50 ,002
1 ,080 50 ,200(*) ,978 50 ,464
PAR.004 0 ,127 50 ,044 ,972 50 ,283
1 ,151 50 ,006 ,904 50 ,001
PAR.005 0 ,113 50 ,129 ,934 50 ,008
1 ,082 50 ,200(*) ,958 50 ,075
PAR.006 0 ,245 50 ,000 ,576 50 ,000
1 ,229 50 ,000 ,725 50 ,000
PAR.007 0 ,094 50 ,200(*) ,959 50 ,081
1 ,360 50 ,000 ,570 50 ,000
PAR.008 0 ,164 50 ,002 ,912 50 ,001
1 ,153 50 ,005 ,811 50 ,000
PAR.009 1 ,436 50 ,000 ,398 50 ,000
PAR.010 0 ,162 50 ,002 ,923 50 ,003
1 ,207 50 ,000 ,667 50 ,000
PAR.011 0 ,093 50 ,200(*) ,986 50 ,831
1 ,081 50 ,200(*) ,969 50 ,206
PAR.012 0 ,106 50 ,200(*) ,975 50 ,364
1 ,080 50 ,200(*) ,967 50 ,173
PAR.013 0 ,053 50 ,200(*) ,991 50 ,975
1 ,063 50 ,200(*) ,976 50 ,397
PAR.014 0 ,097 50 ,200(*) ,974 50 ,323
1 ,081 50 ,200(*) ,974 50 ,339
PAR.015 0 ,198 50 ,000 ,660 50 ,000
1 ,214 50 ,000 ,783 50 ,000
PAR.016 0 ,198 50 ,000 ,660 50 ,000
1 ,222 50 ,000 ,761 50 ,000
PAR.017 0 ,163 50 ,002 ,961 50 ,097
1 ,082 50 ,200(*) ,978 50 ,456
PAR.018 0 ,089 50 ,200(*) ,980 50 ,542
1 ,055 50 ,200(*) ,992 50 ,984
PAR.019 0 ,072 50 ,200(*) ,967 50 ,181
1 ,095 50 ,200(*) ,981 50 ,586

243
Apéndices

K-S-Lilliefors Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
PAR.020 0 ,072 50 ,200(*) ,967 50 ,181
1 ,095 50 ,200(*) ,981 50 ,586
PAR.021 0 ,061 50 ,200(*) ,991 50 ,966
1 ,073 50 ,200(*) ,982 50 ,624
PAR.022 0 ,095 50 ,200(*) ,984 50 ,720
1 ,089 50 ,200(*) ,977 50 ,417
PAR.023 0 ,105 50 ,200(*) ,964 50 ,134
1 ,114 50 ,120 ,958 50 ,071
PAR.024 1 ,435 50 ,000 ,401 50 ,000
PAR.025 1 ,422 50 ,000 ,452 50 ,000
PAR.026 1 ,436 50 ,000 ,398 50 ,000
PAR.027 0 ,095 50 ,200(*) ,969 50 ,216
1 ,119 50 ,075 ,946 50 ,024
PAR.028 0 ,135 50 ,024 ,975 50 ,349
1 ,093 50 ,200(*) ,960 50 ,088
PAR.029 0 ,135 50 ,024 ,975 50 ,349
1 ,093 50 ,200(*) ,960 50 ,088
PAR.030 0 ,088 50 ,200(*) ,991 50 ,963
1 ,070 50 ,200(*) ,976 50 ,389
PAR.031 0 ,065 50 ,200(*) ,994 50 ,995
1 ,083 50 ,200(*) ,969 50 ,207
PAR.032 0 ,099 50 ,200(*) ,961 50 ,096
1 ,076 50 ,200(*) ,971 50 ,260
PAR.033 0 ,121 50 ,066 ,946 50 ,024
1 ,111 50 ,173 ,962 50 ,111
PAR.034 0 ,083 50 ,200(*) ,964 50 ,127
1 ,098 50 ,200(*) ,944 50 ,020
PAR.035 0 ,108 50 ,199 ,973 50 ,300
1 ,500 50 ,000 ,131 50 ,000
PAR.036 0 ,098 50 ,200(*) ,962 50 ,113
1 ,138 50 ,018 ,895 50 ,000
PAR.037 0 ,100 50 ,200(*) ,958 50 ,077
1 ,498 50 ,000 ,132 50 ,000
PAR.038 0 ,312 50 ,000 ,574 50 ,000
1 ,286 50 ,000 ,658 50 ,000
PAR.039 0 ,168 50 ,001 ,865 50 ,000
1 ,206 50 ,000 ,811 50 ,000
PAR.040 0 ,201 50 ,000 ,817 50 ,000
1 ,258 50 ,000 ,718 50 ,000
PAR.041 0 ,117 50 ,083 ,956 50 ,062
1 ,135 50 ,024 ,897 50 ,000
PAR.042 0 ,106 50 ,200(*) ,963 50 ,123
1 ,152 50 ,005 ,917 50 ,002
PAR.043 0 ,127 50 ,042 ,886 50 ,000
1 ,332 50 ,000 ,525 50 ,000
PAR.044 0 ,143 50 ,013 ,903 50 ,001
1 ,187 50 ,000 ,866 50 ,000

244
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

K-S-Lilliefors Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
PAR.045 0 ,096 50 ,200(*) ,951 50 ,038
1 ,159 50 ,003 ,904 50 ,001
PAR.046 0 ,105 50 ,200(*) ,931 50 ,006
1 ,198 50 ,000 ,754 50 ,000
PAR.047 0 ,112 50 ,155 ,957 50 ,068
1 ,062 50 ,200(*) ,983 50 ,670
PAR.048 0 ,112 50 ,162 ,959 50 ,081
1 ,060 50 ,200(*) ,979 50 ,504
PAR.049 0 ,099 50 ,200(*) ,944 50 ,020
1 ,195 50 ,000 ,761 50 ,000
PAR.050 0 ,102 50 ,200(*) ,956 50 ,061
1 ,243 50 ,000 ,483 50 ,000
PAR.051 0 ,077 50 ,200(*) ,964 50 ,129
1 ,082 50 ,200(*) ,935 50 ,008
PAR.009 is constant when CTRL_PATOLOGIA = 0. It has been
omitted. PAR.024 is constant when CTRL_PATOLOGIA = 0. It has
been omitted. PAR.025 is constant when CTRL_PATOLOGIA = 0. It
has been omitted. PAR.026 is constant when CTRL_PATOLOGIA =
0. It has been omitted.

Tabla AP2.3-9. Resultados de las pruebas de


Kolmogorov-Smirnov-Lilliefors y Saphiro-Wilk de la base
de datos masculina, todos los sujetos.
K-S-Lilliefors Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
PAR.001 ,121 100 ,001 ,936 100 ,000
PAR.002 ,263 100 ,000 ,668 100 ,000
PAR.003 ,085 100 ,072 ,944 100 ,000
PAR.004 ,100 100 ,015 ,957 100 ,003
PAR.005 ,127 100 ,000 ,866 100 ,000
PAR.006 ,205 100 ,000 ,723 100 ,000
PAR.007 ,147 100 ,000 ,729 100 ,000
PAR.008 ,076 100 ,159 ,930 100 ,000
PAR.009 ,500 100 ,000 ,376 100 ,000
PAR.010 ,163 100 ,000 ,694 100 ,000
PAR.011 ,072 100 ,200(*) ,988 100 ,481
PAR.012 ,133 100 ,000 ,935 100 ,000
PAR.013 ,122 100 ,001 ,926 100 ,000
PAR.014 ,101 100 ,014 ,959 100 ,003
PAR.015 ,269 100 ,000 ,624 100 ,000
PAR.017 ,126 100 ,000 ,947 100 ,001
PAR.018 ,057 100 ,200(*) ,991 100 ,772
PAR.019 ,094 100 ,030 ,974 100 ,049
PAR.021 ,066 100 ,200(*) ,987 100 ,426
PAR.022 ,075 100 ,185 ,980 100 ,139
PAR.023 ,113 100 ,003 ,954 100 ,001

245
Apéndices

K-S-Lilliefors Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
PAR.024 ,501 100 ,000 ,372 100 ,000
PAR.026 ,500 100 ,000 ,376 100 ,000
PAR.027 ,112 100 ,003 ,950 100 ,001
PAR.028 ,075 100 ,180 ,980 100 ,136
PAR.030 ,064 100 ,200(*) ,982 100 ,177
PAR.031 ,069 100 ,200(*) ,988 100 ,481
PAR.032 ,096 100 ,024 ,964 100 ,008
PAR.033 ,125 100 ,001 ,965 100 ,009
PAR.034 ,107 100 ,007 ,928 100 ,000
PAR.035 ,266 100 ,000 ,385 100 ,000
PAR.036 ,212 100 ,000 ,811 100 ,000
PAR.037 ,324 100 ,000 ,243 100 ,000
PAR.038 ,355 100 ,000 ,414 100 ,000
PAR.039 ,205 100 ,000 ,751 100 ,000
PAR.040 ,306 100 ,000 ,528 100 ,000
PAR.041 ,196 100 ,000 ,806 100 ,000
PAR.042 ,184 100 ,000 ,798 100 ,000
PAR.043 ,398 100 ,000 ,191 100 ,000
PAR.044 ,228 100 ,000 ,691 100 ,000
PAR.045 ,137 100 ,000 ,857 100 ,000
PAR.046 ,231 100 ,000 ,587 100 ,000
PAR.047 ,167 100 ,000 ,870 100 ,000
PAR.048 ,066 100 ,200(*) ,986 100 ,381
PAR.049 ,121 100 ,001 ,935 100 ,000
PAR.050 ,124 100 ,001 ,924 100 ,000
PAR.051 ,198 100 ,000 ,750 100 ,000

Tabla AP2.3-10. Resultados de las pruebas de Kolmogorov-


Smirnov-Lilliefors y Saphiro-Wilk de la base de datos
masculina, sujetos normofónicos (0) y con patología vocal. (1)
K-S-Lilliefors Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
PAR.001 0 ,104 50 ,200(*) ,953 50 ,045
1 ,131 50 ,032 ,937 50 ,011
PAR.002 0 ,224 50 ,000 ,780 50 ,000
1 ,177 50 ,000 ,829 50 ,000
PAR.003 0 ,084 50 ,200(*) ,956 50 ,063
1 ,100 50 ,200(*) ,929 50 ,005
PAR.004 0 ,116 50 ,091 ,938 50 ,011
1 ,132 50 ,029 ,926 50 ,004
PAR.005 0 ,096 50 ,200(*) ,944 50 ,019
1 ,189 50 ,000 ,837 50 ,000
PAR.006 0 ,123 50 ,058 ,929 50 ,005
1 ,266 50 ,000 ,661 50 ,000

246
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

K-S-Lilliefors Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
PAR.007 0 ,090 50 ,200(*) ,969 50 ,204
1 ,188 50 ,000 ,715 50 ,000
PAR.008 0 ,105 50 ,200(*) ,986 50 ,825
1 ,087 50 ,200(*) ,903 50 ,001
PAR.009 1 ,429 50 ,000 ,558 50 ,000
PAR.010 0 ,167 50 ,001 ,893 50 ,000
1 ,186 50 ,000 ,692 50 ,000
PAR.011 0 ,084 50 ,200(*) ,979 50 ,497
1 ,096 50 ,200(*) ,985 50 ,782
PAR.012 0 ,108 50 ,200(*) ,964 50 ,132
1 ,137 50 ,020 ,926 50 ,004
PAR.013 0 ,125 50 ,049 ,947 50 ,026
1 ,155 50 ,004 ,905 50 ,001
PAR.014 0 ,065 50 ,200(*) ,983 50 ,665
1 ,103 50 ,200(*) ,964 50 ,128
PAR.015 0 ,208 50 ,000 ,728 50 ,000
1 ,257 50 ,000 ,751 50 ,000
PAR.016 0 ,208 50 ,000 ,728 50 ,000
1 ,257 50 ,000 ,750 50 ,000
PAR.017 0 ,061 50 ,200(*) ,972 50 ,268
1 ,119 50 ,076 ,965 50 ,147
PAR.018 0 ,113 50 ,130 ,956 50 ,063
1 ,075 50 ,200(*) ,985 50 ,788
PAR.019 0 ,124 50 ,052 ,962 50 ,106
1 ,109 50 ,186 ,963 50 ,123
PAR.020 0 ,124 50 ,052 ,962 50 ,106
1 ,109 50 ,186 ,963 50 ,123
PAR.021 0 ,082 50 ,200(*) ,972 50 ,270
1 ,086 50 ,200(*) ,972 50 ,283
PAR.022 0 ,114 50 ,107 ,946 50 ,024
1 ,118 50 ,080 ,970 50 ,242
PAR.023 0 ,080 50 ,200(*) ,991 50 ,964
1 ,077 50 ,200(*) ,967 50 ,176
PAR.024 1 ,431 50 ,000 ,549 50 ,000
PAR.025 1 ,431 50 ,000 ,550 50 ,000
PAR.026 1 ,429 50 ,000 ,558 50 ,000
PAR.027 0 ,121 50 ,064 ,907 50 ,001
1 ,156 50 ,004 ,938 50 ,011
PAR.028 0 ,152 50 ,006 ,928 50 ,005
1 ,126 50 ,046 ,955 50 ,055
PAR.029 0 ,152 50 ,006 ,928 50 ,005
1 ,126 50 ,046 ,955 50 ,055
PAR.030 0 ,105 50 ,200(*) ,951 50 ,039
1 ,086 50 ,200(*) ,972 50 ,270
PAR.031 0 ,092 50 ,200(*) ,967 50 ,170
1 ,073 50 ,200(*) ,983 50 ,665

247
Apéndices

K-S-Lilliefors Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
PAR.032 0 ,120 50 ,071 ,926 50 ,004
1 ,091 50 ,200(*) ,976 50 ,398
PAR.033 0 ,171 50 ,001 ,947 50 ,026
1 ,110 50 ,178 ,959 50 ,079
PAR.034 0 ,149 50 ,008 ,882 50 ,000
1 ,100 50 ,200(*) ,952 50 ,041
PAR.035 0 ,087 50 ,200(*) ,986 50 ,796
1 ,316 50 ,000 ,402 50 ,000
PAR.036 0 ,098 50 ,200(*) ,958 50 ,074
1 ,128 50 ,040 ,924 50 ,003
PAR.037 0 ,110 50 ,181 ,952 50 ,043
1 ,338 50 ,000 ,289 50 ,000
PAR.038 0 ,341 50 ,000 ,358 50 ,000
1 ,292 50 ,000 ,580 50 ,000
PAR.039 0 ,228 50 ,000 ,815 50 ,000
1 ,156 50 ,004 ,893 50 ,000
PAR.040 0 ,253 50 ,000 ,628 50 ,000
1 ,245 50 ,000 ,691 50 ,000
PAR.041 0 ,197 50 ,000 ,863 50 ,000
1 ,170 50 ,001 ,865 50 ,000
PAR.042 0 ,156 50 ,004 ,931 50 ,006
1 ,158 50 ,003 ,883 50 ,000
PAR.043 0 ,238 50 ,000 ,786 50 ,000
1 ,372 50 ,000 ,261 50 ,000
PAR.044 0 ,120 50 ,068 ,932 50 ,007
1 ,227 50 ,000 ,743 50 ,000
PAR.045 0 ,102 50 ,200(*) ,895 50 ,000
1 ,154 50 ,004 ,869 50 ,000
PAR.046 0 ,202 50 ,000 ,782 50 ,000
1 ,271 50 ,000 ,649 50 ,000
PAR.047 0 ,061 50 ,200(*) ,976 50 ,413
1 ,178 50 ,000 ,916 50 ,002
PAR.048 0 ,152 50 ,005 ,943 50 ,018
1 ,092 50 ,200(*) ,966 50 ,164
PAR.049 0 ,072 50 ,200(*) ,985 50 ,756
1 ,159 50 ,003 ,926 50 ,004
PAR.050 0 ,074 50 ,200(*) ,966 50 ,165
1 ,161 50 ,002 ,946 50 ,024
PAR.051 0 ,100 50 ,200(*) ,968 50 ,201
1 ,224 50 ,000 ,743 50 ,000
PAR.009 is constant when CTRL_PATOLOGIA = 0. It has been
omitted. PAR.024 is constant when CTRL_PATOLOGIA = 0. It has
been omitted. PAR.025 is constant when CTRL_PATOLOGIA = 0. It
has been omitted. PAR.026 is constant when CTRL_PATOLOGIA = 0.
It has been omitted

248
Apéndice 2.4. Análisis descriptivo de los
parámetros: homogeneidad de varianzas
Apéndices

Tabla AP2.4-1. Resultados del test de Levene de homogeneidad de varianzas


de la base de datos femenina.
Test of Homogeneity of Variance(b,c,d,e)

Levene
Statistic df1 df2 Sig.
PAR.001 Based on Mean 1,561 1 98,000 0,214
Based on Median 1,572 1 98,000 0,213
Based on Median and with adjusted df 1,572 1 96,509 0,213
Based on trimmed mean 1,638 1 98,000 0,204
PAR.002 Based on Mean 42,812 1 98,000 0,000
Based on Median 25,144 1 98,000 0,000
Based on Median and with adjusted df 25,144 1 49,668 0,000
Based on trimmed mean 36,011 1 98,000 0,000
PAR.003 Based on Mean 1,563 1 98,000 0,214
Based on Median 1,744 1 98,000 0,190
Based on Median and with adjusted df 1,744 1 97,054 0,190
Based on trimmed mean 1,736 1 98,000 0,191
PAR.004 Based on Mean 0,006 1 98,000 0,937
Based on Median 0,040 1 98,000 0,843
Based on Median and with adjusted df 0,040 1 96,459 0,843
Based on trimmed mean 0,008 1 98,000 0,930
PAR.005 Based on Mean 0,766 1 98,000 0,384
Based on Median 0,857 1 98,000 0,357
Based on Median and with adjusted df 0,857 1 94,731 0,357
Based on trimmed mean 0,841 1 98,000 0,361
PAR.006 Based on Mean 4,022 1 98,000 0,048
Based on Median 2,651 1 98,000 0,107
Based on Median and with adjusted df 2,651 1 85,221 0,107
Based on trimmed mean 2,804 1 98,000 0,097
PAR.007 Based on Mean 25,332 1 98,000 0,000
Based on Median 9,814 1 98,000 0,002
Based on Median and with adjusted df 9,814 1 49,331 0,003
Based on trimmed mean 14,897 1 98,000 0,000
PAR.008 Based on Mean 4,677 1 98,000 0,033
Based on Median 3,822 1 98,000 0,053
Based on Median and with adjusted df 3,822 1 74,938 0,054
Based on trimmed mean 3,954 1 98,000 0,050
PAR.009 Based on Mean .(a)
PAR.010 Based on Mean 20,675 1 98,000 0,000
Based on Median 12,478 1 98,000 0,001
Based on Median and with adjusted df 12,478 1 50,986 0,001
Based on trimmed mean 16,334 1 98,000 0,000

250
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Levene
Statistic df1 df2 Sig.

PAR.011 Based on Mean 20,419 1 98,000 0,000


Based on Median 19,806 1 98,000 0,000
Based on Median and with adjusted df 19,806 1 76,933 0,000
Based on trimmed mean 20,245 1 98,000 0,000
PAR.012 Based on Mean 33,205 1 98,000 0,000
Based on Median 32,900 1 98,000 0,000
Based on Median and with adjusted df 32,900 1 72,532 0,000
Based on trimmed mean 32,854 1 98,000 0,000
PAR.013 Based on Mean 25,656 1 98,000 0,000
Based on Median 25,658 1 98,000 0,000
Based on Median and with adjusted df 25,658 1 68,783 0,000
Based on trimmed mean 25,767 1 98,000 0,000
PAR.014 Based on Mean 30,080 1 98,000 0,000
Based on Median 27,945 1 98,000 0,000
Based on Median and with adjusted df 27,945 1 72,321 0,000
Based on trimmed mean 29,993 1 98,000 0,000
PAR.015 Based on Mean 16,568 1 98,000 0,000
Based on Median 11,758 1 98,000 0,001
Based on Median and with adjusted df 11,758 1 65,731 0,001
Based on trimmed mean 13,521 1 98,000 0,000
PAR.016 Based on Mean 15,985 1 98,000 0,000
Based on Median 10,655 1 98,000 0,002
Based on Median and with adjusted df 10,655 1 65,341 0,002
Based on trimmed mean 12,583 1 98,000 0,001
PAR.017 Based on Mean 16,317 1 98,000 0,000
Based on Median 15,085 1 98,000 0,000
Based on Median and with adjusted df 15,085 1 78,099 0,000
Based on trimmed mean 16,135 1 98,000 0,000
PAR.018 Based on Mean 0,200 1 98,000 0,656
Based on Median 0,194 1 98,000 0,660
Based on Median and with adjusted df 0,194 1 91,856 0,660
Based on trimmed mean 0,199 1 98,000 0,656
PAR.019 Based on Mean 0,906 1 98,000 0,343
Based on Median 0,889 1 98,000 0,348
Based on Median and with adjusted df 0,889 1 97,864 0,348
Based on trimmed mean 0,888 1 98,000 0,348
PAR.020 Based on Mean 0,906 1 98,000 0,343
Based on Median 0,889 1 98,000 0,348
Based on Median and with adjusted df 0,889 1 97,864 0,348
Based on trimmed mean 0,888 1 98,000 0,348

251
Apéndices

Levene
Statistic df1 df2 Sig.
PAR.021 Based on Mean 1,908 1 98,000 0,170
Based on Median 1,882 1 98,000 0,173
Based on Median and with adjusted df 1,882 1 90,796 0,173
Based on trimmed mean 1,930 1 98,000 0,168
PAR.022 Based on Mean 1,379 1 98,000 0,243
Based on Median 1,236 1 98,000 0,269
Based on Median and with adjusted df 1,236 1 92,275 0,269
Based on trimmed mean 1,354 1 98,000 0,247
PAR.023 Based on Mean 16,796 1 98,000 0,000
Based on Median 14,294 1 98,000 0,000
Based on Median and with adjusted df 14,294 1 73,210 0,000
Based on trimmed mean 15,608 1 98,000 0,000
PAR.024 Based on Mean .(a)
PAR.025 Based on Mean .(a)
PAR.026 Based on Mean .(a)
PAR.027 Based on Mean 4,695 1 98,000 0,033
Based on Median 4,761 1 98,000 0,032
Based on Median and with adjusted df 4,761 1 96,831 0,032
Based on trimmed mean 4,574 1 98,000 0,035
PAR.028 Based on Mean 5,168 1 98,000 0,025
Based on Median 5,416 1 98,000 0,022
Based on Median and with adjusted df 5,416 1 97,334 0,022
Based on trimmed mean 5,313 1 98,000 0,023
PAR.029 Based on Mean 5,168 1 98,000 0,025
Based on Median 5,416 1 98,000 0,022
Based on Median and with adjusted df 5,416 1 97,334 0,022
Based on trimmed mean 5,313 1 98,000 0,023
PAR.030 Based on Mean 0,941 1 98,000 0,334
Based on Median 0,893 1 98,000 0,347
Based on Median and with adjusted df 0,893 1 95,612 0,347
Based on trimmed mean 0,937 1 98,000 0,335
PAR.031 Based on Mean 0,865 1 98,000 0,355
Based on Median 0,857 1 98,000 0,357
Based on Median and with adjusted df 0,857 1 95,788 0,357
Based on trimmed mean 0,898 1 98,000 0,346
PAR.032 Based on Mean 6,810 1 98,000 0,010
Based on Median 6,699 1 98,000 0,011
Based on Median and with adjusted df 6,699 1 92,351 0,011
Based on trimmed mean 6,959 1 98,000 0,010
PAR.033 Based on Mean 1,781 1 98,000 0,185
Based on Median 1,799 1 98,000 0,183
Based on Median and with adjusted df 1,799 1 94,069 0,183
Based on trimmed mean 1,796 1 98,000 0,183

252
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Levene
Statistic df1 df2 Sig.

PAR.034 Based on Mean 0,012 1 98,000 0,914


Based on Median 0,001 1 98,000 0,972
Based on Median and with adjusted df 0,001 1 97,794 0,972
Based on trimmed mean 0,006 1 98,000 0,937
PAR.035 Based on Mean 4,126 1 98,000 0,045
Based on Median 1,059 1 98,000 0,306
Based on Median and with adjusted df 1,059 1 49,000 0,308
Based on trimmed mean 1,060 1 98,000 0,306
PAR.036 Based on Mean 50,979 1 98,000 0,000
Based on Median 34,995 1 98,000 0,000
Based on Median and with adjusted df 34,995 1 52,110 0,000
Based on trimmed mean 44,223 1 98,000 0,000
PAR.037 Based on Mean 4,130 1 98,000 0,045
Based on Median 1,068 1 98,000 0,304
Based on Median and with adjusted df 1,068 1 49,000 0,307
Based on trimmed mean 1,071 1 98,000 0,303
PAR.038 Based on Mean 49,314 1 98,000 0,000
Based on Median 18,553 1 98,000 0,000
Based on Median and with adjusted df 18,553 1 49,007 0,000
Based on trimmed mean 33,251 1 98,000 0,000
PAR.039 Based on Mean 43,684 1 98,000 0,000
Based on Median 24,080 1 98,000 0,000
Based on Median and with adjusted df 24,080 1 50,374 0,000
Based on trimmed mean 35,776 1 98,000 0,000
PAR.040 Based on Mean 54,519 1 98,000 0,000
Based on Median 21,610 1 98,000 0,000
Based on Median and with adjusted df 21,610 1 49,067 0,000
Based on trimmed mean 39,325 1 98,000 0,000
PAR.041 Based on Mean 15,129 1 98,000 0,000
Based on Median 14,016 1 98,000 0,000
Based on Median and with adjusted df 14,016 1 58,421 0,000
Based on trimmed mean 14,138 1 98,000 0,000
PAR.042 Based on Mean 35,971 1 98,000 0,000
Based on Median 23,277 1 98,000 0,000
Based on Median and with adjusted df 23,277 1 61,559 0,000
Based on trimmed mean 32,448 1 98,000 0,000
PAR.043 Based on Mean 17,995 1 98,000 0,000
Based on Median 7,403 1 98,000 0,008
Based on Median and with adjusted df 7,403 1 49,527 0,009
Based on trimmed mean 10,057 1 98,000 0,002

253
Apéndices

Levene
Statistic df1 df2 Sig.
PAR.044 Based on Mean 47,288 1 98,000 0,000
Based on Median 24,687 1 98,000 0,000
Based on Median and with adjusted df 24,687 1 52,395 0,000
Based on trimmed mean 40,537 1 98,000 0,000
PAR.045 Based on Mean 47,907 1 98,000 0,000
Based on Median 32,821 1 98,000 0,000
Based on Median and with adjusted df 32,821 1 53,132 0,000
Based on trimmed mean 43,414 1 98,000 0,000
PAR.046 Based on Mean 40,976 1 98,000 0,000
Based on Median 20,556 1 98,000 0,000
Based on Median and with adjusted df 20,556 1 49,564 0,000
Based on trimmed mean 32,021 1 98,000 0,000
PAR.047 Based on Mean 8,405 1 98,000 0,005
Based on Median 7,855 1 98,000 0,006
Based on Median and with adjusted df 7,855 1 79,928 0,006
Based on trimmed mean 8,234 1 98,000 0,005
PAR.048 Based on Mean 10,552 1 98,000 0,002
Based on Median 10,630 1 98,000 0,002
Based on Median and with adjusted df 10,630 1 88,995 0,002
Based on trimmed mean 10,689 1 98,000 0,001
PAR.049 Based on Mean 4,132 1 98,000 0,045
Based on Median 2,052 1 98,000 0,155
Based on Median and with adjusted df 2,052 1 62,576 0,157
Based on trimmed mean 3,567 1 98,000 0,062
PAR.050 Based on Mean 4,599 1 98,000 0,034
Based on Median 3,464 1 98,000 0,066
Based on Median and with adjusted df 3,464 1 53,005 0,068
Based on trimmed mean 3,448 1 98,000 0,066
PAR.051 Based on Mean 21,550 1 98,000 0,000
Based on Median 21,425 1 98,000 0,000
Based on Median and with adjusted df 21,425 1 64,866 0,000
Based on trimmed mean 21,539 1 98,000 0,000
a There are not enough unique spread/level pairs to compute the Levene statistic.
b PAR.009 is constant when CTRL_PATOLOGIA = 0. It has been omitted.
c PAR.024 is constant when CTRL_PATOLOGIA = 0. It has been omitted.
d PAR.025 is constant when CTRL_PATOLOGIA = 0. It has been omitted.
e PAR.026 is constant when CTRL_PATOLOGIA = 0. It has been omitted.

254
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla AP2.4-2. Resultados del test de Levene de homogeneidad de varianzas de


la base de datos masculina.
Test of Homogeneity of Variance(b,c,d,e)
Levene
Statistic df1 df2 Sig.

PAR.001 Based on Mean 5,924 1 98,000 0,017


Based on Median 4,422 1 98,000 0,038
Based on Median and with adjusted df 4,422 1 87,186 0,038
Based on trimmed mean 5,422 1 98,000 0,022
PAR.002 Based on Mean 55,249 1 98,000 0,000
Based on Median 36,492 1 98,000 0,000
Based on Median and with adjusted df 36,492 1 50,691 0,000
Based on trimmed mean 47,699 1 98,000 0,000
PAR.003 Based on Mean 2,878 1 98,000 0,093
Based on Median 2,518 1 98,000 0,116
Based on Median and with adjusted df 2,518 1 82,821 0,116
Based on trimmed mean 2,666 1 98,000 0,106
PAR.004 Based on Mean 0,005 1 98,000 0,946
Based on Median 0,075 1 98,000 0,785
Based on Median and with adjusted df 0,075 1 96,995 0,785
Based on trimmed mean 0,021 1 98,000 0,885
PAR.005 Based on Mean 3,802 1 98,000 0,054
Based on Median 2,283 1 98 0,134
Based on Median and with adjusted df 2,283 1 70,257 0,135
Based on trimmed mean 2,890 1 98,000 0,092
PAR.006 Based on Mean 2,585 1 98,000 0,111
Based on Median 1,048 1 98,000 0,308
Based on Median and with adjusted df 1,048 1 68,873 0,310
Based on trimmed mean 1,420 1 98,000 0,236
PAR.007 Based on Mean 6,585 1 98,000 0,012
Based on Median 6,258 1 98,000 0,014
Based on Median and with adjusted df 6,258 1 61,484 0,015
Based on trimmed mean 7,378 1 98,000 0,008
PAR.008 Based on Mean 11,508 1 98,000 0,001
Based on Median 11,506 1 98,000 0,001
Based on Median and with adjusted df 11,506 1 71,649 0,001
Based on trimmed mean 11,584 1 98,000 0,001
PAR.009 Based on Mean .(a)
PAR.010 Based on Mean 4,504 1 98,000 0,036
Based on Median 3,813 1 98,000 0,054
Based on Median and with adjusted df 3,813 1 65,216 0,055
Based on trimmed mean 3,917 1 98,000 0,051

255
Apéndices

Levene
Statistic df1 df2 Sig.

PAR.011 Based on Mean 2,277 1 98,000 0,135


Based on Median 2,115 1 98,000 0,149
Based on Median and with adjusted df 2,115 1 93,339 0,149
Based on trimmed mean 2,251 1 98,000 0,137
PAR.012 Based on Mean 11,098 1 98,000 0,001
Based on Median 7,610 1 98,000 0,007
Based on Median and with adjusted df 7,610 1 74,082 0,007
Based on trimmed mean 10,319 1 98,000 0,002
PAR.013 Based on Mean 11,862 1 98,000 0,001
Based on Median 7,671 1 98,000 0,007
Based on Median and with adjusted df 7,671 1 70,333 0,007
Based on trimmed mean 10,326 1 98,000 0,002
PAR.014 Based on Mean 11,568 1 98,000 0,001
Based on Median 10,312 1 98,000 0,002
Based on Median and with adjusted df 10,312 1 76,538 0,002
Based on trimmed mean 11,834 1 98,000 0,001
PAR.015 Based on Mean 35,991 1 98,000 0,000
Based on Median 16,841 1 98,000 0,000
Based on Median and with adjusted df 16,841 1 53,058 0,000
Based on trimmed mean 26,340 1 98,000 0,000
PAR.016 Based on Mean 35,973 1 98,000 0,000
Based on Median 16,823 1 98,000 0,000
Based on Median and with adjusted df 16,823 1 53,044 0,000
Based on trimmed mean 26,317 1 98,000 0,000
PAR.017 Based on Mean 13,095 1 98,000 0,000
Based on Median 9,553 1 98,000 0,003
Based on Median and with adjusted df 9,553 1 74,599 0,003
Based on trimmed mean 12,671 1 98,000 0,001
PAR.018 Based on Mean 1,930 1 98,000 0,168
Based on Median 1,822 1 98,000 0,180
Based on Median and with adjusted df 1,822 1 97,616 0,180
Based on trimmed mean 1,981 1 98,000 0,162
PAR.019 Based on Mean 9,020 1 98,000 0,003
Based on Median 7,742 1 98,000 0,006
Based on Median and with adjusted df 7,742 1 92,060 0,007
Based on trimmed mean 8,952 1 98,000 0,004
PAR.020 Based on Mean 9,020 1 98,000 0,003
Based on Median 7,742 1 98,000 0,006
Based on Median and with adjusted df 7,742 1 92,060 0,007
Based on trimmed mean 8,952 1 98,000 0,004

256
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Levene
Statistic df1 df2 Sig.
PAR.021 Based on Mean 2,050 1 98,000 0,155
Based on Median 1,737 1 98,000 0,191
Based on Median and with adjusted df 1,737 1 95,040 0,191
Based on trimmed mean 2,070 1 98,000 0,153
PAR.022 Based on Mean 4,014 1 98,000 0,048
Based on Median 2,938 1 98,000 0,090
Based on Median and with adjusted df 2,938 1 95,486 0,090
Based on trimmed mean 3,913 1 98,000 0,051
PAR.023 Based on Mean 13,470 1 98,000 0,000
Based on Median 12,103 1 98,000 0,001
Based on Median and with adjusted df 12,103 1 76,300 0,001
Based on trimmed mean 13,039 1 98,000 0,000
PAR.024 Based on Mean .(a)
PAR.025 Based on Mean .(a)
PAR.026 Based on Mean .(a)
PAR.027 Based on Mean 0,157 1 98,000 0,693
Based on Median 0,145 1 98,000 0,704
Based on Median and with adjusted df 0,145 1 97,990 0,704
Based on trimmed mean 0,183 1 98,000 0,670
PAR.028 Based on Mean 7,522 1 98,000 0,007
Based on Median 6,425 1 98,000 0,013
Based on Median and with adjusted df 6,425 1 97,890 0,013
Based on trimmed mean 7,366 1 98,000 0,008
PAR.029 Based on Mean 7,522 1 98,000 0,007
Based on Median 6,425 1 98,000 0,013
Based on Median and with adjusted df 6,425 1 97,890 0,013
Based on trimmed mean 7,366 1 98,000 0,008
PAR.030 Based on Mean 2,069 1 98,000 0,154
Based on Median 1,885 1 98,000 0,173
Based on Median and with adjusted df 1,885 1 97,960 0,173
Based on trimmed mean 2,015 1 98,000 0,159
PAR.031 Based on Mean 1,330 1 98 0,252
Based on Median 1,221 1 98 0,272
Based on Median and with adjusted df 1,221 1 97,5867874 0,272
Based on trimmed mean 1,295 1 98,000 0,258
PAR.032 Based on Mean 1,592 1 98,000 0,210
Based on Median 1,643 1 98,000 0,203
Based on Median and with adjusted df 1,643 1 97,967 0,203
Based on trimmed mean 1,683 1 98,000 0,198
PAR.033 Based on Mean 0,539 1 98,000 0,465
Based on Median 0,568 1 98,000 0,453
Based on Median and with adjusted df 0,568 1 95,580 0,453
Based on trimmed mean 0,550 1 98,000 0,460

257
Apéndices

Levene
Statistic df1 df2 Sig.

PAR.034 Based on Mean 0,145 1 98,000 0,704


Based on Median 0,058 1 98,000 0,810
Based on Median and with adjusted df 0,058 1 94,580 0,810
Based on trimmed mean 0,099 1 98,000 0,753
PAR.035 Based on Mean 3,193 1 98,000 0,077
Based on Median 2,218 1 98,000 0,140
Based on Median and with adjusted df 2,218 1 51,449 0,143
Based on trimmed mean 2,219 1 98,000 0,140
PAR.036 Based on Mean 57,813 1 98,000 0,000
Based on Median 42,757 1 98,000 0,000
Based on Median and with adjusted df 42,757 1 53,137 0,000
Based on trimmed mean 53,302 1 98,000 0,000
PAR.037 Based on Mean 4,607 1 98,000 0,034
Based on Median 2,502 1 98,000 0,117
Based on Median and with adjusted df 2,502 1 49,543 0,120
Based on trimmed mean 2,787 1 98,000 0,098
PAR.038 Based on Mean 29,977 1 98,000 0,000
Based on Median 14,056 1 98,000 0,000
Based on Median and with adjusted df 14,056 1 49,080 0,000
Based on trimmed mean 20,669 1 98,000 0,000
PAR.039 Based on Mean 56,970 1 98,000 0,000
Based on Median 42,215 1 98,000 0,000
Based on Median and with adjusted df 42,215 1 53,891 0,000
Based on trimmed mean 54,342 1 98,000 0,000
PAR.040 Based on Mean 37,824 1 98,000 0,000
Based on Median 20,411 1 98,000 0,000
Based on Median and with adjusted df 20,411 1 49,509 0,000
Based on trimmed mean 26,733 1 98,000 0,000
PAR.041 Based on Mean 17,654 1 98,000 0,000
Based on Median 12,027 1 98,000 0,001
Based on Median and with adjusted df 12,027 1 66,040 0,001
Based on trimmed mean 15,594 1 98,000 0,000
PAR.042 Based on Mean 27,123 1 98,000 0,000
Based on Median 17,068 1 98,000 0,000
Based on Median and with adjusted df 17,068 1 55,320 0,000
Based on trimmed mean 23,829 1 98,000 0,000
PAR.043 Based on Mean 6,033 1 98,000 0,016
Based on Median 3,385 1 98,000 0,069
Based on Median and with adjusted df 3,385 1 49,086 0,072
Based on trimmed mean 3,693 1 98,000 0,058

258
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Levene
Statistic df1 df2 Sig.
PAR.044 Based on Mean 21,725 1 98,000 0,000
Based on Median 10,303 1 98,000 0,002
Based on Median and with adjusted df 10,303 1 53,372 0,002
Based on trimmed mean 15,592 1 98,000 0,000
PAR.045 Based on Mean 12,593 1 98,000 0,001
Based on Median 8,513 1 98,000 0,004
Based on Median and with adjusted df 8,513 1 68,007 0,005
Based on trimmed mean 11,168 1 98,000 0,001
PAR.046 Based on Mean 16,558 1 98,000 0,000
Based on Median 9,293 1 98,000 0,003
Based on Median and with adjusted df 9,293 1 53,117 0,004
Based on trimmed mean 11,764 1 98,000 0,001
PAR.047 Based on Mean 14,624 1 98,000 0,000
Based on Median 13,362 1 98,000 0,000
Based on Median and with adjusted df 13,362 1 56,763 0,001
Based on trimmed mean 14,813 1 98,000 0,000
PAR.048 Based on Mean 0,159 1 98,000 0,691
Based on Median 0,188 1 98,000 0,666
Based on Median and with adjusted df 0,188 1 97,596 0,666
Based on trimmed mean 0,173 1 98,000 0,679
PAR.049 Based on Mean 12,047 1 98,000 0,001
Based on Median 7,085 1 98,000 0,009
Based on Median and with adjusted df 7,085 1 69,736 0,010
Based on trimmed mean 11,018 1 98,000 0,001
PAR.050 Based on Mean 7,669 1 98,000 0,007
Based on Median 6,947 1 98,000 0,010
Based on Median and with adjusted df 6,947 1 74,088 0,010
Based on trimmed mean 7,288 1 98,000 0,008
PAR.051 Based on Mean 9,403 1 98,000 0,003
Based on Median 5,176 1 98,000 0,025
Based on Median and with adjusted df 5,176 1 59,770 0,027
Based on trimmed mean 6,481 1 98,000 0,012
a There are not enough unique spread/level pairs to compute the Levene statistic.
b PAR.009 is constant when CTRL_PATOLOGIA = 0. It has been omitted.
c PAR.024 is constant when CTRL_PATOLOGIA = 0. It has been omitted.
d PAR.025 is constant when CTRL_PATOLOGIA = 0. It has been omitted.
e PAR.026 is constant when CTRL_PATOLOGIA = 0. It has been omitted.

259
Apéndice 3. Pruebas de diferencias de medias
(t-test) de los parámetros
Apéndices

Tabla AP3-1. Resultados de la prueba t de diferencia de medias de la base de datos


femenina.
Levene's Test for
Eq. of Variances t-test for Equality of Means
Std. 95%Confidence
Sig. (2- Mean Error Interval of the
F Sig. t df tailed) Diff. Diff. Difference
Lower Upper
1 E.V.A* 1,56 2,14E-01 2,73 98,00 7,63E-03 14,88 5,46 4,04 25,72
E. V.N.A* 2,73 97,46 7,63E-03 14,88 5,46 4,04 25,72
2 E. V.A. 42,81 2,76E-09 -6,71 98,00 1,27E-09 -0,03 0,00 -0,03 -0,02
E. V.N.A -6,71 49,75 1,75E-08 -0,03 0,00 -0,03 -0,02
3 E. V.A. 1,56 2,14E-01 -3,86 98,00 2,01E-04 -0,01 0,00 -0,02 -0,01
E. V.N.A -3,86 97,05 2,02E-04 -0,01 0,00 -0,02 -0,01
4 E. V.A. 0,01 9,37E-01 -1,55 98,00 1,25E-01 -0,01 0,01 -0,03 0,00
E. V.N.A -1,55 97,11 1,25E-01 -0,01 0,01 -0,03 0,00
5 E. V.A. 0,77 3,84E-01 -4,15 98,00 7,19E-05 -0,01 0,00 -0,02 -0,01
E. V.N.A -4,15 94,69 7,36E-05 -0,01 0,00 -0,02 -0,01
6 E. V.A. 4,02 4,77E-02 0,94 98,00 3,49E-01 0,01 0,01 -0,01 0,04
E. V.N.A 0,94 84,10 3,50E-01 0,01 0,01 -0,01 0,04
7 E. V.A. 25,33 2,19E-06 2,37 98,00 1,98E-02 0,02 0,01 0,00 0,04
E. V.N.A 2,37 49,57 2,18E-02 0,02 0,01 0,00 0,04
8 E. V.A. 4,68 3,30E-02 -0,55 98,00 5,87E-01 0,00 0,01 -0,02 0,01
E. V.N.A -0,55 78,58 5,87E-01 0,00 0,01 -0,02 0,01
9 E. V.A. 24,54 3,05E-06 -2,47 98,00 1,54E-02 -0,08 0,03 -0,15 -0,02
E. V.N.A -2,47 49,00 1,72E-02 -0,08 0,03 -0,15 -0,02
10 E. V.A. 20,68 1,56E-05 -3,50 98,00 6,96E-04 -0,13 0,04 -0,21 -0,06
E. V.N.A -3,50 51,88 9,57E-04 -0,13 0,04 -0,21 -0,06
11 E. V.A. 20,42 1,74E-05 -7,91 98,00 4,02E-12 -5,81 0,73 -7,26 -4,35
E. V.N.A -7,91 73,40 2,05E-11 -5,81 0,73 -7,27 -4,34
12 E. V.A. 33,21 9,60E-08 -8,56 98,00 1,59E-13 -11,47 1,34 -14,13 -8,81
E. V.N.A -8,56 66,66 2,44E-12 -11,47 1,34 -14,14 -8,79
13 E. V.A. 25,66 1,92E-06 -9,50 98,00 1,51E-15 -13,24 1,39 -16,00 -10,47
E. V.N.A -9,50 67,49 4,66E-14 -13,24 1,39 -16,02 -10,45
14 E. V.A. 30,08 3,24E-07 -10,13 98,00 6,19E-17 -14,25 1,41 -17,03 -11,46
E. V.N.A -10,13 67,74 3,30E-15 -14,25 1,41 -17,05 -11,44
15 E. V.A. 16,57 9,51E-05 3,83 98,00 2,29E-04 2,19 0,57 1,05 3,32
E. V.N.A 3,83 63,34 3,00E-04 2,19 0,57 1,05 3,33
17 E. V.A. 16,32 1,07E-04 1,85 98,00 6,67E-02 1,32 0,71 -0,09 2,72
E. V.N.A 1,85 74,43 6,77E-02 1,32 0,71 -0,10 2,73
18 E. V.A. 0,20 6,56E-01 -5,60 98,00 2,01E-07 -6,76 1,21 -9,15 -4,36
E. V.N.A -5,60 96,42 2,07E-07 -6,76 1,21 -9,15 -4,36
19 E. V.A. 0,91 3,43E-01 -7,70 98,00 1,11E-11 -8,78 1,14 -11,05 -6,52
E. V.N.A -7,70 97,48 1,14E-11 -8,78 1,14 -11,05 -6,52
21 E. V.A. 1,91 1,70E-01 -8,25 98,00 7,52E-13 -11,03 1,34 -13,69 -8,38
E. V.N.A -8,25 92,94 1,04E-12 -11,03 1,34 -13,69 -8,38
22 E. V.A. 1,38 2,43E-01 -9,39 98,00 2,51E-15 -11,18 1,19 -13,54 -8,82
E. V.N.A -9,39 94,20 3,52E-15 -11,18 1,19 -13,54 -8,82
23 E. V.A. 16,80 8,59E-05 -8,78 98,00 5,28E-14 -13,76 1,57 -16,87 -10,65
E. V.N.A -8,78 71,71 5,47E-13 -13,76 1,57 -16,88 -10,64
24 E. V.A. 24,04 3,75E-06 2,45 98,00 1,61E-02 0,01 0,01 0,00 0,02
E. V.N.A 2,45 49,00 1,80E-02 0,01 0,01 0,00 0,02
26 E. V.A. 24,54 3,05E-06 -2,47 98,00 1,54E-02 -0,08 0,03 -0,15 -0,02
E. V.N.A -2,47 49,00 1,72E-02 -0,08 0,03 -0,15 -0,02

262
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Levene's Test for


Eq. of Variances t-test for Equality of Means
Std. 95%Confidence
Sig. (2- Mean Error Interval of the
F Sig. t df tailed) Diff. Diff. Difference
Lower Upper
27 E. V.A. 4,70 3,27E-02 3,89 98,00 1,81E-04 0,48 0,12 0,24 0,73
E. V.N.A 3,89 92,40 1,87E-04 0,48 0,12 0,24 0,73
28 E. V.A. 5,17 2,52E-02 3,33 98,00 1,22E-03 0,43 0,13 0,17 0,69
E. V.N.A 3,33 91,95 1,25E-03 0,43 0,13 0,17 0,69
30 E. V.A. 0,94 3,34E-01 3,85 98,00 2,12E-04 0,60 0,16 0,29 0,91
E. V.N.A 3,85 95,88 2,14E-04 0,60 0,16 0,29 0,91
31 E. V.A. 0,87 3,55E-01 3,33 98,00 1,21E-03 0,54 0,16 0,22 0,87
E. V.N.A 3,33 95,93 1,22E-03 0,54 0,16 0,22 0,87
32 E. V.A. 6,81 1,05E-02 -3,48 98,00 7,48E-04 -6,50 1,87 -10,21 -2,80
E. V.N.A -3,48 87,30 7,82E-04 -6,50 1,87 -10,22 -2,79
33 E. V.A. 1,78 1,85E-01 1,48 98,00 1,42E-01 1,03 0,70 -0,35 2,42
E. V.N.A 1,48 92,99 1,43E-01 1,03 0,70 -0,36 2,42
34 E. V.A. 0,01 9,14E-01 2,69 98,00 8,50E-03 4,31 1,61 1,13 7,50
E. V.N.A 2,69 97,99 8,50E-03 4,31 1,61 1,13 7,50
35 E. V.A. 4,13 4,49E-02 -1,05 98,00 2,99E-01 -0,12 0,11 -0,34 0,11
E. V.N.A -1,05 49,00 3,01E-01 -0,12 0,11 -0,35 0,11
36 E. V.A. 50,98 1,65E-10 8,19 98,00 1,01E-12 0,24 0,03 0,19 0,30
E. V.N.A 8,19 52,74 5,82E-11 0,24 0,03 0,18 0,30
37 E. V.A. 4,13 4,48E-02 -1,03 98,00 3,05E-01 -235730 228774 -689726 218264
E. V.N.A -1,03 49,00 3,08E-01 -235730 228774 -695470 224008
38 E. V.A. 49,31 2,89E-10 -4,45 98,00 2,26E-05 -0,10 0,02 -0,14 -0,05
E. V.N.A -4,45 49,01 4,92E-05 -0,10 0,02 -0,14 -0,05
39 E. V.A. 43,68 2,03E-09 -7,28 98,00 8,25E-11 -0,03 0,00 -0,03 -0,02
E. V.N.A -7,28 50,53 2,04E-09 -0,03 0,00 -0,03 -0,02
40 E. V.A. 54,52 5,11E-11 -5,38 98,00 5,05E-07 -0,14 0,03 -0,20 -0,09
E. V.N.A -5,38 49,09 2,06E-06 -0,14 0,03 -0,20 -0,09
41 E. V.A. 15,13 1,83E-04 -6,02 98,00 3,11E-08 -0,01 0,00 -0,01 0,00
E. V.N.A -6,02 64,42 9,38E-08 -0,01 0,00 -0,01 0,00
42 E. V.A. 35,97 3,36E-08 -4,79 98,00 5,98E-06 -6,76 1,41 -9,56 -3,96
E. V.N.A -4,79 62,21 1,08E-05 -6,76 1,41 -9,58 -3,94
43 E. V.A. 18,00 5,03E-05 -3,35 98,00 1,14E-03 -30381 9063 -48367 -12394
E. V.N.A -3,35 49,96 1,54E-03 -30381 9063 -48586 -12176
44 E. V.A. 47,29 5,77E-10 -6,99 98,00 3,37E-10 -0,08 0,01 -0,10 -0,06
E. V.N.A -6,99 53,41 4,51E-09 -0,08 0,01 -0,10 -0,06
45 E. V.A. 47,91 4,67E-10 -7,96 98,00 3,14E-12 -0,08 0,01 -0,10 -0,06
E. V.N.A -7,96 54,10 1,15E-10 -0,08 0,01 -0,11 -0,06
46 E. V.A. 40,98 5,33E-09 -6,10 98,00 2,14E-08 -0,15 0,03 -0,20 -0,10
E. V.N.A -6,10 49,99 1,55E-07 -0,15 0,03 -0,20 -0,10
47 E. V.A. 8,41 4,62E-03 -5,07 98,00 1,86E-06 -0,10 0,02 -0,14 -0,06
E. V.N.A -5,07 79,66 2,50E-06 -0,10 0,02 -0,14 -0,06
48 E. V.A. 10,55 1,59E-03 3,11 98,00 2,49E-03 0,05 0,02 0,02 0,08
E. V.N.A 3,11 82,60 2,60E-03 0,05 0,02 0,02 0,08
49 E. V.A. 4,13 4,48E-02 -2,68 98,00 8,62E-03 -0,05 0,02 -0,08 -0,01
E. V.N.A -2,68 75,29 9,02E-03 -0,05 0,02 -0,08 -0,01
50 E. V.A. 4,60 3,45E-02 -2,90 98,00 4,64E-03 -0,04 0,01 -0,06 -0,01
E. V.N.A -2,90 56,04 5,35E-03 -0,04 0,01 -0,06 -0,01
51 E. V.A. 21,55 1,07E-05 -2,13 98,00 3,57E-02 -0,03 0,01 -0,06 0,00
E. V.N.A -2,13 65,21 3,70E-02 -0,03 0,01 -0,06 0,00
*
E.V.A: Equal Variances Assumed: Varianzas iguales asumidas
*
E.V.N.A: Equal Variances Not Assumed: Varianzas iguales no asumidas

263
Apéndices

Tabla AP3-2. Resultados de la prueba t de diferencia de medias de la base de datos


masculina.
Levene's Test for
Eq. of Variances t-test for Equality of Means
Std. 95% Confidence
Sig. (2- Mean Error Interval of the
F Sig. t df tailed) Diff. Diff. Difference
Lower Upper
1 E. V.A.* 5,92 1,68E-02 -2,43 98,00 1,71E-02 -8,46 3,49 -15,39 -1,54
E. V.N.A* -2,43 88,43 1,73E-02 -8,46 3,49 -15,40 -1,53
2 E. V.A. 55,25 4,03E-11 -6,21 98,00 1,26E-08 -0,02 0,00 -0,03 -0,02
E. V.N.A -6,21 50,47 9,81E-08 -0,02 0,00 -0,03 -0,01
3 E. V.A. 2,88 9,30E-02 -3,27 98,00 1,49E-03 -0,02 0,01 -0,03 -0,01
E. V.N.A -3,27 90,01 1,53E-03 -0,02 0,01 -0,03 -0,01
4 E. V.A. 0,01 9,46E-01 -3,61 98,00 4,88E-04 -0,03 0,01 -0,05 -0,02
E. V.N.A -3,61 97,98 4,88E-04 -0,03 0,01 -0,05 -0,02
5 E. V.A. 3,80 5,41E-02 -3,92 98,00 1,65E-04 -0,03 0,01 -0,04 -0,01
E. V.N.A -3,92 81,49 1,85E-04 -0,03 0,01 -0,04 -0,01
6 E. V.A. 2,59 1,11E-01 1,72 98,00 8,90E-02 0,03 0,02 -0,01 0,07
E. V.N.A 1,72 77,23 8,99E-02 0,03 0,02 -0,01 0,07
7 E. V.A. 6,59 1,18E-02 0,82 98,00 4,17E-01 0,00 0,01 -0,01 0,01
E. V.N.A 0,82 65,25 4,18E-01 0,00 0,01 -0,01 0,01
8 E. V.A. 11,51 1,00E-03 1,24 98,00 2,19E-01 0,01 0,01 -0,01 0,03
E. V.N.A 1,24 73,79 2,20E-01 0,01 0,01 -0,01 0,03
9 E. V.A. 61,87 4,90E-12 -3,50 98,00 7,11E-04 -0,17 0,05 -0,27 -0,08
E. V.N.A -3,50 49,00 1,01E-03 -0,17 0,05 -0,27 -0,07
10 E. V.A. 4,50 3,64E-02 -2,41 98,00 1,78E-02 -0,04 0,02 -0,07 -0,01
E. V.N.A -2,41 69,19 1,86E-02 -0,04 0,02 -0,08 -0,01
11 E. V.A. 2,28 1,35E-01 -7,16 98,00 1,48E-10 -5,59 0,78 -7,14 -4,04
E. V.N.A -7,16 93,28 1,80E-10 -5,59 0,78 -7,14 -4,04
12 E. V.A. 11,10 1,22E-03 -7,17 98,00 1,42E-10 -8,52 1,19 -10,88 -6,17
E. V.N.A -7,17 77,23 3,89E-10 -8,52 1,19 -10,89 -6,16
13 E. V.A. 11,86 8,45E-04 -8,08 98,00 1,74E-12 -9,90 1,23 -12,33 -7,47
E. V.N.A -8,08 76,21 7,70E-12 -9,90 1,23 -12,34 -7,46
14 E. V.A. 11,57 9,72E-04 -8,65 98,00 1,04E-13 -11,08 1,28 -13,63 -8,54
E. V.N.A -8,65 79,03 4,75E-13 -11,08 1,28 -13,63 -8,53
15 E. V.A. 35,99 3,33E-08 4,62 98,00 1,17E-05 2,99 0,65 1,70 4,27
E. V.N.A 4,62 53,37 2,47E-05 2,99 0,65 1,69 4,28
17 E. V.A. 13,10 4,70E-04 3,52 98,00 6,51E-04 2,14 0,61 0,93 3,34
E. V.N.A 3,52 78,58 7,15E-04 2,14 0,61 0,93 3,34
18 E. V.A. 1,93 1,68E-01 -4,12 98,00 7,95E-05 -5,77 1,40 -8,55 -2,99
E. V.N.A -4,12 95,28 8,10E-05 -5,77 1,40 -8,55 -2,99
19 E. V.A. 9,02 3,39E-03 -6,02 98,00 3,11E-08 -6,88 1,14 -9,15 -4,61
E. V.N.A -6,02 87,67 4,06E-08 -6,88 1,14 -9,16 -4,61
21 E. V.A. 2,05 1,55E-01 -5,82 98,00 7,49E-08 -7,67 1,32 -10,29 -5,06
E. V.N.A -5,82 94,72 8,05E-08 -7,67 1,32 -10,29 -5,05
22 E. V.A. 4,01 4,79E-02 -6,51 98,00 3,25E-09 -7,46 1,15 -9,74 -5,19
E. V.N.A -6,51 94,28 3,64E-09 -7,46 1,15 -9,74 -5,19
23 E. V.A. 13,47 3,95E-04 -6,98 98,00 3,62E-10 -11,64 1,67 -14,95 -8,33
E. V.N.A -6,98 77,86 8,84E-10 -11,64 1,67 -14,96 -8,32
24 E. V.A. 64,49 2,18E-12 3,52 98,00 6,60E-04 0,03 0,01 0,01 0,04
E. V.N.A 3,52 49,00 9,47E-04 0,03 0,01 0,01 0,04
26 E. V.A. 61,87 4,90E-12 -3,50 98,00 7,11E-04 -0,17 0,05 -0,27 -0,08
E. V.N.A -3,50 49,00 1,01E-03 -0,17 0,05 -0,27 -0,07
27 E. V.A. 0,16 6,93E-01 3,14 98,00 2,23E-03 0,36 0,11 0,13 0,58
E. V.N.A 3,14 97,96 2,23E-03 0,36 0,11 0,13 0,58

264
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Levene's Test for


Eq. of Variances t-test for Equality of Means
Std. 95% Confidence
Sig. (2- Mean Error Interval of the
t df tailed) Diff. Diff. Difference
Lower Upper
28 E. V.A. 7,52 7,25E-03 2,38 98,00 1,93E-02 0,31 0,13 0,05 0,56
E. V.N.A 2,38 92,40 1,94E-02 0,31 0,13 0,05 0,56
30 E. V.A. 2,07 1,54E-01 1,60 98,00 1,13E-01 0,29 0,18 -0,07 0,66
E. V.N.A 1,60 95,99 1,13E-01 0,29 0,18 -0,07 0,66
31 E. V.A. 1,33 2,52E-01 1,59 98,00 1,16E-01 0,31 0,19 -0,08 0,69
E. V.N.A 1,59 96,02 1,16E-01 0,31 0,19 -0,08 0,69
32 E. V.A. 1,59 2,10E-01 1,93 98,00 5,70E-02 6,37 3,31 -0,19 12,93
E. V.N.A 1,93 96,55 5,70E-02 6,37 3,31 -0,19 12,93
33 E. V.A. 0,54 4,65E-01 1,04 98,00 3,03E-01 0,87 0,84 -0,79 2,53
E. V.N.A 1,04 97,36 3,03E-01 0,87 0,84 -0,79 2,53
34 E. V.A. 0,15 7,04E-01 1,42 98,00 1,58E-01 3,16 2,22 -1,25 7,57
E. V.N.A 1,42 97,51 1,58E-01 3,16 2,22 -1,25 7,57
35 E. V.A. 3,19 7,71E-02 -1,14 98,00 2,56E-01 0,00 0,00 -0,01 0,00
E. V.N.A -1,14 54,11 2,58E-01 0,00 0,00 -0,01 0,00
36 E. V.A. 57,81 1,76E-11 7,80 98,00 6,92E-12 0,17 0,02 0,13 0,21
E. V.N.A 7,80 54,13 2,08E-10 0,17 0,02 0,13 0,21
37 E. V.A. 4,61 3,43E-02 -1,98 98,00 5,07E-02 -3643 1841 -7298 11,84
E. V.N.A -1,98 50,15 5,34E-02 -3643 1841 -7342 55,94
38 E. V.A. 29,98 3,37E-07 -3,80 98,00 2,51E-04 -0,07 0,02 -0,11 -0,03
E. V.N.A -3,80 49,07 4,00E-04 -0,07 0,02 -0,11 -0,03
39 E. V.A. 56,97 2,31E-11 -7,07 98,00 2,31E-10 -0,03 0,00 -0,03 -0,02
E. V.N.A -7,07 52,69 3,59E-09 -0,03 0,00 -0,03 -0,02
40 E. V.A. 37,82 1,68E-08 -4,78 98,00 6,08E-06 -0,11 0,02 -0,16 -0,06
E. V.N.A -4,78 49,46 1,59E-05 -0,11 0,02 -0,16 -0,06
41 E. V.A. 17,65 5,85E-05 -2,59 98,00 1,09E-02 -0,01 0,00 -0,01 0,00
E. V.N.A -2,59 65,52 1,17E-02 -0,01 0,00 -0,01 0,00
42 E. V.A. 27,12 1,06E-06 -4,40 98,00 2,80E-05 -4,65 1,06 -6,75 -2,55
E. V.N.A -4,40 58,34 4,73E-05 -4,65 1,06 -6,77 -2,53
43 E. V.A. 6,03 1,58E-02 -2,05 98,00 4,28E-02 -22270 10848 -43798 -741,47
E. V.N.A -2,05 49,12 4,54E-02 -22270 10848 -44069 -470,48
44 E. V.A. 21,73 9,93E-06 -5,15 98,00 1,33E-06 -0,09 0,02 -0,12 -0,05
E. V.N.A -5,15 56,21 3,42E-06 -0,09 0,02 -0,12 -0,05
45 E. V.A. 12,59 5,96E-04 -6,45 98,00 4,29E-09 -0,07 0,01 -0,09 -0,05
E. V.N.A -6,45 71,28 1,17E-08 -0,07 0,01 -0,09 -0,05
46 E. V.A. 16,56 9,56E-05 -4,57 98,00 1,42E-05 -0,14 0,03 -0,20 -0,08
E. V.N.A -4,57 54,07 2,87E-05 -0,14 0,03 -0,20 -0,08
47 E. V.A. 14,62 2,31E-04 -2,18 98,00 3,15E-02 -0,04 0,02 -0,08 0,00
E. V.N.A -2,18 60,59 3,30E-02 -0,04 0,02 -0,08 0,00
48 E. V.A. 0,16 6,91E-01 -1,34 98,00 1,85E-01 -0,02 0,02 -0,05 0,01
E. V.N.A -1,34 97,63 1,85E-01 -0,02 0,02 -0,05 0,01
49 E. V.A. 12,05 7,73E-04 -2,22 98,00 2,89E-02 -0,04 0,02 -0,07 0,00
E. V.N.A -2,22 77,90 2,95E-02 -0,04 0,02 -0,07 0,00
50 E. V.A. 7,67 6,72E-03 -3,69 98,00 3,69E-04 -0,02 0,01 -0,04 -0,01
E. V.N.A -3,69 77,86 4,15E-04 -0,02 0,01 -0,04 -0,01
51 E. V.A. 9,40 2,80E-03 0,88 98,00 3,84E-01 0,02 0,02 -0,03 0,07
E. V.N.A 0,88 65,67 3,85E-01 0,02 0,02 -0,03 0,07
*
E.V.A: Equal Variances Assumed: Varianzas iguales asumidas
*
E.V.N.A: Equal Variances Not Assumed: Varianzas iguales no asumidas

265
Apéndice 4. Contrastes no paramétricos de los
parámetros
Apéndices

Tabla AP4-1. Resultados de la prueba U de Mann-Whitney de la base de datos


femenina.
Mann- Asymp. Mann- Asymp.
Whitney Wilcoxon Sig. (2- Whitney Wilcoxo Sig. (2-
Par. U W Z tailed) Par. U nW Z tailed)
01 897 2172 -2,434 1,495E-02 28 806,5 2081,5 -3,065 2,175E-03
02 87 1362 -8,018 1,079E-15 30 717 1992 -3,675 2,383E-04
03 687 1962 -3,881 1,039E-04 31 806,5 2081,5 -3,057 2,232E-03
04 1038 2313 -1,461 1,439E-01 32 729,5 2004,5 -3,590 3,312E-04
05 638 1913 -4,219 2,454E-05 33 966 2241 -1,958 5,025E-02
06 1234 2509 -0,110 9,122E-01 34 872 2147 -2,606 9,164E-03
07 1193 2468 -0,393 6,944E-01 35 435 1710 -5,618 1,927E-08
08 1210 2485 -0,276 7,827E-01 36 138 1413 -7,666 1,775E-14
09 1000 2275 -3,311 9,310E-04 37 1125 2400 -0,862 3,888E-01
10 778 2053 -3,254 1,138E-03 38 80 1355 -8,066 7,278E-16
11 377 1652 -6,018 1,763E-09 39 92 1367 -7,983 1,428E-15
12 271 1546 -6,749 1,488E-11 40 74 1349 -8,107 5,183E-16
13 213 1488 -7,149 8,748E-13 41 442 1717 -5,570 2,544E-08
14 211 1486 -7,163 7,912E-13 42 684 1959 -3,902 9,544E-05
15 666 1941 -4,026 5,674E-05 43 481 1756 -5,301 1,150E-07
17 1041 2316 -1,441 1,496E-01 44 233 1508 -7,011 2,366E-12
18 539 1814 -4,902 9,510E-07 45 202 1477 -7,225 5,021E-13
19 339 1614 -6,280 3,380E-10 46 125 1400 -7,756 8,796E-15
21 305 1580 -6,515 7,285E-11 47 559 1834 -4,764 1,901E-06
22 243 1518 -6,942 3,864E-12 48 797 2072 -3,123 1,791E-03
23 219 1494 -7,108 1,181E-12 49 867 2142 -2,640 8,282E-03
24 1000 2275 -3,311 9,311E-04 50 672 1947 -3,985 6,759E-05
26 1000 2275 -3,311 9,310E-04 51 877 2152 -2,571 1,013E-02
27 724,5 1999,5 -3,635 2,780E-04

268
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla AP4-2. Resultados de la prueba de reacciones extremas de Moses de la base de


datos femenina.
Observed
Control Group Trimmed Control Observed Control Trimmed Control
Par Span Group Span * Par Group Span Group Span *
Sig. (1- Sig. (1- Sig. (1- Sig. (1-
tailed) tailed) tailed) tailed)

01 94 5,587E-02 87 1,940E-01 2 28 100 1,000E+00 88 2,768E-01 2


02 63 3,151E-15 55 7,396E-14 2 30 99 7,525E-01 90 5,000E-01 2
03 97 3,087E-01 90 5,000E-01 2 31 100 1,000E+00 91 6,297E-01 2
04 99 7,525E-01 90 5,000E-01 2 32 90 3,890E-03 81 1,142E-02 2
05 98 5,000E-01 89 3,798E-01 2 33 94 5,587E-02 87 1,940E-01 2
06 94 5,587E-02 80 6,413E-03 2 34 95 1,022E-01 83 3,321E-02 2
07 86 1,940E-04 70 4,286E-06 2 35 82 7,051E-06 72 2,330E-05 2
08 95 1,022E-01 87 1,940E-01 2 36 64 1,381E-14 57 1,652E-12 2
09 1 0,000E+00 1 0,000E+00 2 37 89 1,894E-03 76 4,834E-04 2
10 82 7,051E-06 71 1,015E-05 2 38 61 1,366E-16 52 3,454E-16 2
11 72 3,630E-10 62 1,217E-09 2 39 64 1,381E-14 55 7,396E-14 2
12 74 3,226E-09 60 1,030E-10 2 40 61 1,366E-16 53 2,310E-15 2
13 70 3,599E-11 58 6,979E-12 2 41 75 9,209E-09 67 2,654E-07 2
14 67 8,563E-13 60 1,030E-10 2 42 84 3,850E-05 74 1,124E-04 2
15 94 5,587E-02 78 1,861E-03 2 43 83 1,665E-05 75 2,364E-04 2
17 85 8,728E-05 74 1,124E-04 2 44 75 9,209E-09 66 9,792E-08 2
18 94 5,587E-02 72 2,330E-05 2 45 68 3,097E-12 59 2,762E-11 2
19 97 3,087E-01 70 4,286E-06 2 46 66 2,269E-13 58 6,979E-12 2
21 88 9,036E-04 62 1,217E-09 2 47 76 2,558E-08 70 4,286E-06 2
22 88 9,036E-04 61 3,632E-10 2 48 94 5,587E-02 80 6,413E-03 2
23 75 9,209E-09 63 3,888E-09 2 49 94 5,587E-02 84 5,418E-02 2
24 1 0,000E+00 1 0,000E+00 2 50 94 5,587E-02 83 3,321E-02 2
26 1 0,000E+00 1 0,000E+00 2 51 79 4,712E-07 69 1,753E-06 2
27 100 1,000E+00 83 3,321E-02 2
*
Outliers Trimmed from each End

269
Apéndices

Tabla AP4-3. Resultados de la prueba de Kolmogorv-Smirnov para dos muestras de la


base de datos femenina.
Par Most Extreme K-S Asymp. Sig. Most Extreme K-S Asymp. Sig.
. Differences Z (2-tailed) Par Differences Z (2-tailed)
Abs Pos Neg Abs Pos Neg
01 0,28 0 -0,28 1,4 3,968E-02 28 0,3 0,02 -0,3 1,5 2,222E-02
02 0,86 0,86 0 4,3 0,000E+00 30 0,44 0 -0,44 2,2 1,250E-04
03 0,4 0,4 0 2 6,709E-04 31 0,32 0,02 -0,32 1,6 1,195E-02
04 0,26 0,26 0 1,3 6,809E-02 32 0,38 0,38 -0,02 1,9 1,464E-03
05 0,46 0,46 0 2,3 5,084E-05 33 0,28 0,06 -0,28 1,4 3,968E-02
06 0,16 0,12 -0,16 0,8 5,441E-01 34 0,28 0,02 -0,28 1,4 3,968E-02
07 0,32 0,26 -0,32 1,6 1,195E-02 35 0,56 0,56 0 2,8 3,100E-07
08 0,16 0,12 -0,16 0,8 5,441E-01 36 0,76 0 -0,76 3,8 0,000E+00
09 0,2 0,2 0 1 2,700E-01 37 0,22 0,22 -0,14 1,1 1,777E-01
10 0,4 0,4 -0,06 2 6,709E-04 38 0,88 0,88 0 4,4 0,000E+00
11 0,64 0,64 0 3,2 0,000E+00 39 0,82 0,82 0 4,1 0,000E+00
12 0,7 0,7 0 3,5 0,000E+00 40 0,86 0,86 0 4,3 0,000E+00
13 0,74 0,74 0 3,7 0,000E+00 41 0,52 0,52 0 2,6 2,688E-06
14 0,72 0,72 0 3,6 0,000E+00 42 0,42 0,42 -0,02 2,1 2,955E-04
15 0,46 0,02 -0,46 2,3 5,084E-05 43 0,54 0,54 -0,02 2,7 9,311E-07
17 0,24 0,14 -0,24 1,2 1,122E-01 44 0,68 0,68 0 3,4 0,000E+00
18 0,44 0,44 0 2,2 1,250E-04 45 0,76 0,76 0 3,8 0,000E+00
19 0,58 0,58 0 2,9 9,913E-08 46 0,78 0,78 0 3,9 0,000E+00
21 0,64 0,64 0 3,2 0,000E+00 47 0,56 0,56 -0,04 2,8 3,100E-07
22 0,68 0,68 0 3,4 0,000E+00 48 0,4 0,06 -0,4 2 6,709E-04
23 0,66 0,66 0 3,3 0,000E+00 49 0,3 0,3 -0,02 1,5 2,222E-02
24 0,2 0 -0,2 1 2,700E-01 50 0,46 0,46 0 2,3 5,084E-05
26 0,2 0,2 0 1 2,700E-01 51 0,38 0,38 -0,1 1,9 1,464E-03
27 0,38 0 -0,38 1,9 1,464E-03

270
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla AP4-4. Resultados de la prueba de las rachas de Wald-Wolfowitz de la base de


datos femenina.
Asymp. Asymp.
Number Sig. (1- Number Sig. (1-
Par. of Runs Z tailed) Par. of Runs Z tailed)
01 E.N.O.R 54 0,603 7,268E-01 Min.P.c 37 -2,814 2,445E-03
28 c
02 E.N.O.R 10 -8,242 8,487E-17 Max.P 57 1,206 8,861E-01
d
03 E.N.O.R 52 0,201 5,797E-01 Min.P. 42 -1,809 3,521E-02
30 d
04 E.N.O.R 46 -1,005 1,574E-01 Max.P 46 -1,005 1,574E-01
e
05 E.N.O.R 44 -1,407 7,970E-02 Min.P. 49 -0,402 3,438E-01
31 e
06 E.N.O.R 49 -0,402 3,438E-01 Max.P 53 0,402 6,562E-01
f
07 E.N.O.R 39 -2,412 7,928E-03 32 Min.P. 33 -3,618 1,483E-04
f
08 E.N.O.R 51 0,000 5,000E-01 Max.P 53 0,402 6,562E-01
Min.P.a 2 -9,850 3,432E-23 33 E.N.O.R 47 -0,804 2,107E-01
09 a
Max.P 82 6,232 1,000E+00 34 E.N.O.R 44 -1,407 7,970E-02
10 E.N.O.R 49 -0,402 3,438E-01 35 E.N.O.R 34 -3,417 3,162E-04
11 E.N.O.R 30 -4,221 1,214E-05 36 E.N.O.R 22 -5,830 2,779E-09
12 E.N.O.R 22 -5,830 2,779E-09 37 E.N.O.R 41 -2,010 2,221E-02
13 E.N.O.R 28 -4,623 1,887E-06 38 E.N.O.R 12 -7,840 2,258E-15
14 E.N.O.R 24 -5,427 2,858E-08 39 E.N.O.R 20 -6,232 2,309E-10
15 E.N.O.R 45 -1,206 1,139E-01 40 E.N.O.R 14 -7,438 5,124E-14
17 E.N.O.R 47 -0,804 2,107E-01 41 E.N.O.R 30 -4,221 1,214E-05
18 E.N.O.R 40 -2,211 1,351E-02 42 E.N.O.R 43 -1,608 5,390E-02
19 E.N.O.R 34 -3,417 3,162E-04 43 E.N.O.R 39 -2,412 7,928E-03
21 E.N.O.R 30 -4,221 1,214E-05 44 E.N.O.R 30 -4,221 1,214E-05
22 E.N.O.R 26 -5,025 2,511E-07 45 E.N.O.R 24 -5,427 2,858E-08
23 E.N.O.R 30 -4,221 1,214E-05 46 E.N.O.R 22 -5,830 2,779E-09
a
Min.P. 2 -9,850 3,432E-23 47 E.N.O.R 31 -4,020 2,906E-05
24 a
Max.P 82 6,232 1,000E+00 48 E.N.O.R 39 -2,412 7,928E-03
Min.P.a 2 -9,850 3,432E-23 49 E.N.O.R 43 -1,608 5,390E-02
26 a
Max.P 82 6,232 1,000E+00 50 E.N.O.R 44 -1,407 7,970E-02
b
Min.P. 35 -3,216 6,493E-04 51 E.N.O.R 39 -2,412 7,928E-03
27 b
Max.P 64 2,613 9,955E-01
Min.P.: Minimun Possible
Max.P.: Maximun Possible
E.N.O.R: Exact Number of Runs
a There are 1 inter-group ties involving 90 cases.
b There are 3 inter-group ties involving 32 cases.
c There are 2 inter-group ties involving 26 cases.
d There are 4 inter-group ties involving 10 cases.
e There are 3 inter-group ties involving 6 cases.
f There are 13 inter-group ties involving 40 cases.

271
Apéndices

Tabla AP4-5. Resultados de la prueba U de Mann-Whitney de la base de datos


masculina.
Mann- Asymp. Mann- Asymp.
Whitney Wilcoxon Sig. (2- Whitney Wilcoxon Sig. (2-
Par. U W Z tailed) Par. U W Z tailed)
01 973 2248 -1,910 5,619E-02 28 920,5 2195,5 -2,275 2,292E-02
02 258 1533 -6,839 7,993E-12 30 1014 2289 -1,627 1,037E-01
03 843 2118 -2,806 5,019E-03 31 1027,5 2302,5 -1,534 1,250E-01
04 727 2002 -3,605 3,116E-04 32 951,5 2226,5 -2,058 3,958E-02
05 735 2010 -3,550 3,848E-04 33 1080 2355 -1,172 2,412E-01
06 1103 2378 -1,013 3,109E-01 34 1056 2331 -1,337 1,811E-01
07 1074 2349 -1,213 2,250E-01 35 1206 2481 -0,303 7,616E-01
08 1002 2277 -1,710 8,733E-02 36 228 1503 -7,045 1,848E-12
09 925 2200 -3,834 1,261E-04 37 733 2008 -3,564 3,651E-04
10 910 2185 -2,344 1,908E-02 38 260 1535 -6,825 8,800E-12
11 379 1654 -6,005 1,919E-09 39 271 1546 -6,749 1,488E-11
12 324 1599 -6,384 1,729E-10 40 253 1528 -6,873 6,280E-12
13 230 1505 -7,032 2,040E-12 41 929 2204 -2,213 2,690E-02
14 276 1551 -6,715 1,886E-11 42 693 1968 -3,840 1,231E-04
15 469 1744 -5,384 7,282E-08 43 505 1780 -5,136 2,808E-07
17 806 2081 -3,061 2,207E-03 44 393 1668 -5,908 3,463E-09
18 743 2018 -3,495 4,738E-04 45 330 1605 -6,342 2,263E-10
19 539 1814 -4,902 9,510E-07 46 327 1602 -6,363 1,979E-10
21 532 1807 -4,950 7,430E-07 47 879 2154 -2,558 1,054E-02
22 461 1736 -5,439 5,351E-08 48 1138 2413 -0,772 4,401E-01
23 416 1691 -5,749 8,954E-09 49 1056 2331 -1,337 1,811E-01
24 925 2200 -3,834 1,261E-04 50 734 2009 -3,557 3,748E-04
26 925 2200 -3,834 1,261E-04 51 1131 2406 -0,820 4,120E-01
27 783 2058 -3,230 1,237E-03

272
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla AP4-6. Resultados de la prueba de reacciones extremas de Moses de la base


de datos masculina.
Observed Observed
Control Group Trimmed Control Control Group Trimmed Control
Par. Span Group Span * Par. Span Group Span *
Sig. (1- Sig. (1- Sig. (1- Sig. (1-
tailed) tailed) tailed) tailed)
01 97 3,087E-01 84 5,418E-02 2 28 86 1,940E-04 82 1,976E-02 2
02 74 3,226E-09 69 1,753E-06 2 30 95 1,022E-01 85 8,569E-02 2
03 92 1,543E-02 85 8,569E-02 2 31 95 1,022E-01 83 3,321E-02 2
04 99 7,525E-01 92 7,565E-01 2 32 99 7,525E-01 91 6,297E-01 2
05 93 2,972E-02 88 2,768E-01 2 33 96 1,811E-01 86 1,312E-01 2
06 97 3,087E-01 91 6,297E-01 2 34 93 2,972E-02 85 8,569E-02 2
07 97 3,087E-01 83 3,321E-02 2 35 95 1,022E-01 86 1,312E-01 2
08 89 1,894E-03 76 4,834E-04 2 36 68 3,097E-12 63 3,888E-09 2
09 1 0,000E+00 1 0,000E+00 2 37 93 2,972E-02 77 9,616E-04 2
10 96 1,811E-01 84 5,418E-02 2 38 75 9,209E-09 59 2,762E-11 2
11 86 1,940E-04 72 2,330E-05 2 39 73 1,098E-09 64 1,188E-08 2
12 77 6,924E-08 69 1,753E-06 2 40 74 3,226E-09 63 3,888E-09 2
13 71 1,162E-10 67 2,654E-07 2 41 87 4,228E-04 75 2,364E-04 2
14 69 1,076E-11 64 1,188E-08 2 42 75 9,209E-09 70 4,286E-06 2
15 88 9,036E-04 71 1,015E-05 2 43 81 2,924E-06 71 1,015E-05 2
17 89 1,894E-03 78 1,861E-03 2 44 86 1,940E-04 74 1,124E-04 2
18 90 3,890E-03 80 6,413E-03 2 45 92 1,543E-02 74 1,124E-04 2
19 80 1,187E-06 73 5,192E-05 2 46 91 7,830E-03 72 2,330E-05 2
21 82 7,051E-06 76 4,834E-04 2 47 86 1,940E-04 81 1,142E-02 2
22 80 1,187E-06 76 4,834E-04 2 48 94 5,587E-02 90 5,000E-01 2
23 80 1,187E-06 67 2,654E-07 2 49 89 1,894E-03 80 6,413E-03 2
24 1 0,000E+00 1 0,000E+00 2 50 93 2,972E-02 80 6,413E-03 2
26 1 0,000E+00 1 0,000E+00 2 51 93 2,972E-02 83 3,321E-02 2
27 82 7,051E-06 79 3,502E-03 2
*
Outliers Trimmed from each End

273
Apéndices

Tabla AP4-7. Resultados de la prueba de Kolmogorv-Smirnov para dos muestras de la


base de datos masculina.
Asymp.
Most Extreme K-S Sig. (2- Most Extreme Asymp. Sig.
Par. Differences Z tailed) Par. Differences K-S Z (2-tailed)
Abs Pos Neg Abs Pos Neg
01 0,24 0,24 -0,02 1,2 1,122E-01 28 0,38 0,04 -0,38 1,9 1,464E-03
02 0,7 0,7 0 3,5 0,000E+00 30 0,22 0,08 -0,22 1,1 1,777E-01
03 0,28 0,28 0 1,4 3,968E-02 31 0,2 0,04 -0,2 1 2,700E-01
04 0,38 0,38 0 1,9 1,464E-03 32 0,24 0,02 -0,24 1,2 1,122E-01
05 0,34 0,34 0 1,7 6,177E-03 33 0,2 0,06 -0,2 1 2,700E-01
06 0,14 0,04 -0,14 0,7 7,112E-01 34 0,16 0 -0,16 0,8 5,441E-01
07 0,28 0,16 -0,28 1,4 3,968E-02 35 0,14 0,14 -0,12 0,7 7,112E-01
08 0,32 0,06 -0,32 1,6 1,195E-02 36 0,78 0 -0,78 3,9 0,000E+00
09 0,26 0,26 0 1,3 6,809E-02 37 0,34 0,34 0 1,7 6,177E-03
10 0,28 0,28 -0,02 1,4 3,968E-02 38 0,7 0,7 0 3,5 0,000E+00
11 0,58 0,58 0 2,9 9,913E-08 39 0,66 0,66 0 3,3 0,000E+00
12 0,6 0,6 0 3 3,046E-08 40 0,7 0,7 0 3,5 0,000E+00
13 0,68 0,68 0 3,4 0,000E+00 41 0,3 0,3 -0,12 1,5 2,222E-02
14 0,62 0,62 0 3,1 0,000E+00 42 0,46 0,46 -0,04 2,3 5,084E-05
15 0,56 0 -0,56 2,8 3,100E-07 43 0,56 0,56 0 2,8 3,100E-07
17 0,34 0,04 -0,34 1,7 6,177E-03 44 0,56 0,56 0 2,8 3,100E-07
18 0,4 0,4 0 2 6,709E-04 45 0,6 0,6 0 3 3,046E-08
19 0,46 0,46 0 2,3 5,084E-05 46 0,64 0,64 0 3,2 0,000E+00
21 0,48 0,48 0 2,4 1,986E-05 47 0,32 0,32 -0,08 1,6 1,195E-02
22 0,54 0,54 0 2,7 9,311E-07 48 0,18 0,18 -0,1 0,9 3,927E-01
23 0,58 0,58 0 2,9 9,913E-08 49 0,22 0,22 -0,04 1,1 1,777E-01
24 0,26 0 -0,26 1,3 6,809E-02 50 0,36 0,36 -0,04 1,8 3,068E-03
26 0,26 0,26 0 1,3 6,809E-02 51 0,2 0,2 -0,14 1 2,700E-01
27 0,38 0 -0,38 1,9 1,464E-03

274
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla AP4-8. Resultados de la prueba de las rachas de Wald-Wolfowitz de la base de


datos masculina.
Num
Numbe ber
r of Asymp. Sig. of Asymp. Sig.
Par. Runs Z (1-tailed) Par. Runs Z (1-tailed)
01 E.N.O.R 47 -0,804 2,107E-01 Min.P c 30 -4,221 1,214E-05
28
02 E.N.O.R 28 -4,623 1,887E-06 Max.P c
50 -0,201 4,203E-01
03 E.N.O.R 48 -0,603 2,732E-01 Min.P
d
46 -1,005 1,574E-01
30
04 E.N.O.R 42 -1,809 3,521E-02 Max.P
d
52 0,201 5,797E-01
05 E.N.O.R 46 -1,005 1,574E-01 Min.P
e
54 0,603 7,268E-01
31
06 E.N.O.R 52 0,201 5,797E-01 Max.P e
60 1,809 9,648E-01
07 E.N.O.R 47 -0,804 2,107E-01 Min.P f
44 -1,407 7,970E-02
32
08 E.N.O.R 47 -0,804 2,107E-01 Max.P f
64 2,613 9,955E-01
Min.P a
2 -9,850 3,432E-23 33 E.N.O.R 52 0,201 5,797E-01
09
Max.P a
76 5,025 1,000E+00 34 E.N.O.R 56 1,005 8,426E-01
10 E.N.O.R 49 -0,402 3,438E-01 35 E.N.O.R 52 0,201 5,797E-01
11 E.N.O.R 38 -2,613 4,485E-03 36 E.N.O.R 14 -7,438 5,124E-14
12 E.N.O.R 34 -3,417 3,162E-04 37 E.N.O.R 50 -0,201 4,203E-01
13 E.N.O.R 20 -6,232 2,309E-10 38 E.N.O.R 26 -5,025 2,511E-07
14 E.N.O.R 26 -5,025 2,511E-07 39 E.N.O.R 30 -4,221 1,214E-05
15 E.N.O.R 42 -1,809 3,521E-02 40 E.N.O.R 30 -4,221 1,214E-05
17 E.N.O.R 49 -0,402 3,438E-01 41 E.N.O.R 41 -2,010 2,221E-02
18 E.N.O.R 40 -2,211 1,351E-02 42 E.N.O.R 31 -4,020 2,906E-05
19 E.N.O.R 30 -4,221 1,214E-05 43 E.N.O.R 38 -2,613 4,485E-03
21 E.N.O.R 48 -0,603 2,732E-01 44 E.N.O.R 32 -3,819 6,691E-05
22 E.N.O.R 32 -3,819 6,691E-05 45 E.N.O.R 30 -4,221 1,214E-05
23 E.N.O.R 34 -3,417 3,162E-04 46 E.N.O.R 28 -4,623 1,887E-06
Min.P
a
2 -9,850 3,432E-23 47 E.N.O.R 41 -2,010 2,221E-02
24
Max.P a
76 5,025 1,000E+00 48 E.N.O.R 40 -2,211 1,351E-02
Min.P
a
2 -9,850 3,432E-23 49 E.N.O.R 48 -0,603 2,732E-01
26
Max.P a
76 5,025 1,000E+00 50 E.N.O.R 41 -2,010 2,221E-02
Min.P
b
34 -3,417 3,162E-04 51 E.N.O.R 51 0,000 5,000E-01
27 b
Max.P 54 0,603 7,268E-01
Min.P.: Minimun Possible
Max.P.: Maximun Possible
E.N.O.R: Exact Number of Runs
a There are 1 inter-group ties involving 87 cases.
b There are 4 inter-group ties involving 38 cases.
c There are 8 inter-group ties involving 39 cases.
d There are 4 inter-group ties involving 14 cases.
e There are 6 inter-group ties involving 15 cases
f There are 14 inter-group ties involving 36 cases.

275
Apéndice 5. Pruebas de correlación (τ-Kendall)
de los parámetros
Apéndices

Tabla AP5-1-1. Índices de correlación Tau-Kendall entre los parámetros de la base de


datos femenina, todos los casos (primera parte).
1 2 3 4 5 6 7 8 9 10 11 12 13
1 1,00
2 -0,15 1,00
3 -0,21 0,28 1,00
4 -0,06 0,10 0,52 1,00
5 -0,23 0,30 0,74 0,58 1,00
6 0,02 -0,02 0,12 0,16 0,08 1,00
7 -0,11 -0,02 0,05 0,15 0,08 0,24 1,00
8 -0,16 0,03 0,06 0,10 0,13 0,02 0,09 1,00
9 0,08 0,30 0,16 0,14 0,20 0,04 -0,05 -0,06 1,00
10 -0,12 0,28 0,19 0,10 0,21 -0,08 0,01 0,42 0,09 1,00
11 -0,04 0,50 0,27 0,17 0,28 -0,04 0,03 0,23 0,28 0,47 1,00
12 -0,13 0,49 0,33 0,17 0,31 -0,06 0,02 0,12 0,27 0,40 0,71 1,00
13 -0,13 0,48 0,34 0,20 0,34 -0,06 -0,01 0,10 0,29 0,41 0,66 0,83 1,00
14 -0,15 0,49 0,35 0,21 0,35 -0,03 0,01 0,13 0,28 0,37 0,65 0,78 0,86
15 0,09 -0,40 -0,01 0,10 -0,05 0,13 0,15 -0,14 -0,17 -0,13 -0,23 -0,19 -0,17
17 -0,32 -0,09 0,09 0,12 0,15 0,01 0,09 0,66 -0,19 0,27 0,05 0,02 0,01
18 0,02 0,30 0,17 0,05 0,16 0,07 -0,12 -0,13 0,29 0,13 0,28 0,27 0,28
19 -0,02 0,40 0,21 0,08 0,20 0,07 -0,08 -0,15 0,28 0,11 0,36 0,38 0,38
21 -0,11 0,49 0,29 0,13 0,28 0,00 -0,03 -0,09 0,32 0,13 0,47 0,48 0,46
22 -0,11 0,52 0,31 0,15 0,29 0,01 -0,05 -0,08 0,30 0,15 0,50 0,50 0,49
23 -0,01 0,46 0,26 0,13 0,24 -0,06 -0,05 -0,12 0,30 0,16 0,50 0,63 0,66
24 -0,08 -0,30 -0,16 -0,14 -0,20 -0,04 0,05 0,06 -1,00 -0,09 -0,28 -0,26 -0,29
26 0,08 0,30 0,16 0,14 0,20 0,04 -0,05 -0,06 1,00 0,09 0,28 0,27 0,29
27 0,13 -0,29 -0,23 -0,13 -0,22 -0,10 0,01 0,02 -0,22 -0,15 -0,29 -0,30 -0,28
28 0,11 -0,23 -0,18 -0,10 -0,17 -0,10 0,02 0,06 -0,20 -0,11 -0,22 -0,24 -0,23
30 0,17 -0,29 -0,25 -0,16 -0,22 -0,04 -0,06 0,02 -0,25 -0,10 -0,29 -0,30 -0,28
31 0,17 -0,25 -0,23 -0,15 -0,20 -0,01 -0,05 0,02 -0,24 -0,08 -0,26 -0,26 -0,24
32 -0,77 0,23 0,32 0,14 0,35 0,00 0,06 0,23 -0,10 0,21 0,11 0,22 0,25
33 -0,12 -0,07 -0,04 0,02 -0,07 0,04 0,12 0,07 -0,20 -0,06 -0,12 -0,09 -0,11
34 0,05 -0,23 -0,12 -0,01 -0,14 -0,03 0,02 0,00 -0,19 -0,15 -0,26 -0,25 -0,23
35 -0,66 0,43 0,35 0,15 0,40 -0,06 0,00 0,18 0,25 0,26 0,29 0,37 0,39
36 0,07 -0,71 -0,24 -0,08 -0,27 0,06 0,07 -0,02 -0,33 -0,26 -0,45 -0,49 -0,48
37 0,71 0,12 -0,04 0,03 -0,05 0,01 -0,10 -0,08 0,21 0,07 0,19 0,10 0,11
38 -0,12 0,81 0,28 0,11 0,31 -0,01 -0,03 0,04 0,33 0,28 0,51 0,51 0,50
39 -0,18 0,93 0,27 0,09 0,29 0,00 0,00 0,03 0,26 0,27 0,48 0,47 0,47
40 -0,13 0,93 0,29 0,11 0,31 -0,02 -0,05 0,03 0,33 0,28 0,51 0,51 0,50
41 -0,20 0,28 0,16 0,00 0,15 -0,04 -0,07 -0,34 0,11 -0,12 0,08 0,19 0,21
42 0,11 0,23 0,08 -0,01 0,02 0,00 -0,08 -0,67 0,24 -0,22 0,02 0,12 0,15
43 0,23 0,40 0,05 -0,03 0,04 -0,05 -0,15 -0,29 0,39 -0,03 0,25 0,27 0,27
44 -0,17 0,50 0,54 0,41 0,60 0,06 0,00 0,01 0,38 0,19 0,38 0,42 0,46
45 -0,11 0,53 0,52 0,37 0,56 0,04 -0,05 -0,06 0,30 0,17 0,38 0,46 0,48
46 -0,12 0,60 0,43 0,27 0,45 0,04 0,01 -0,08 0,38 0,18 0,43 0,48 0,50
47 -0,19 0,28 0,17 0,05 0,18 -0,16 -0,15 0,06 -0,02 0,17 0,19 0,25 0,30
48 0,17 -0,11 -0,01 0,07 0,00 0,07 0,09 0,23 0,14 0,11 0,12 -0,03 -0,07
49 0,05 0,11 0,10 0,00 0,11 0,06 -0,08 0,13 0,06 0,20 0,13 0,06 0,11
50 0,11 0,28 0,07 0,02 0,08 -0,03 -0,10 -0,08 0,12 0,06 0,14 0,10 0,14
51 -0,19 0,15 0,08 0,00 0,10 -0,06 -0,04 0,24 -0,20 0,24 0,12 0,09 0,11

278
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla AP5-1-2. Índices de correlación Tau-Kendall entre los parámetros de la


base de datos femenina, todos los casos (segunda parte).
14 15 17 18 19 21 22 23 24 26
14 1,00
15 -0,19 1,00
17 0,04 -0,07 1,00
18 0,26 -0,14 -0,21 1,00
19 0,36 -0,19 -0,24 0,70 1,00
21 0,47 -0,25 -0,18 0,48 0,62 1,00
22 0,49 -0,23 -0,18 0,45 0,60 0,84 1,00
23 0,67 -0,17 -0,22 0,28 0,41 0,50 0,53 1,00
24 -0,28 0,17 0,19 -0,29 -0,28 -0,31 -0,30 -0,30 1,00
26 0,28 -0,17 -0,19 0,29 0,28 0,32 0,30 0,30 -1,00 1,00
27 -0,30 0,14 0,04 -0,47 -0,56 -0,46 -0,44 -0,28 0,22 -0,22
28 -0,23 0,07 0,06 -0,47 -0,52 -0,40 -0,36 -0,23 0,20 -0,20
30 -0,30 0,11 0,04 -0,30 -0,36 -0,48 -0,49 -0,32 0,25 -0,25
31 -0,27 0,09 0,02 -0,29 -0,35 -0,47 -0,47 -0,28 0,24 -0,24
32 0,25 -0,12 0,38 0,05 0,11 0,17 0,18 0,07 0,10 -0,10
33 -0,08 0,05 0,13 -0,47 -0,21 -0,14 -0,12 -0,06 0,20 -0,20
34 -0,25 0,16 0,04 -0,33 -0,36 -0,43 -0,30 -0,22 0,19 -0,19
35 0,41 -0,26 0,23 0,16 0,24 0,35 0,35 0,27 -0,25 0,25
36 -0,50 0,39 0,11 -0,32 -0,43 -0,50 -0,50 -0,49 0,33 -0,33
37 0,09 -0,06 -0,30 0,14 0,14 0,10 0,11 0,18 -0,21 0,21
38 0,52 -0,38 -0,08 0,34 0,45 0,52 0,55 0,47 -0,33 0,33
39 0,47 -0,39 -0,08 0,28 0,40 0,47 0,50 0,44 -0,26 0,26
40 0,51 -0,40 -0,10 0,30 0,42 0,50 0,52 0,48 -0,33 0,33
41 0,20 -0,13 -0,31 0,20 0,33 0,37 0,39 0,31 -0,11 0,11
42 0,12 0,00 -0,71 0,29 0,38 0,33 0,34 0,33 -0,24 0,24
43 0,26 -0,37 -0,46 0,30 0,37 0,40 0,39 0,41 -0,39 0,39
44 0,47 -0,15 -0,03 0,27 0,37 0,47 0,49 0,41 -0,38 0,38
45 0,49 -0,20 -0,10 0,32 0,44 0,52 0,56 0,47 -0,30 0,30
46 0,49 -0,20 -0,16 0,37 0,49 0,54 0,56 0,49 -0,38 0,38
47 0,29 -0,19 0,02 0,15 0,21 0,24 0,27 0,26 0,02 -0,02
48 -0,05 -0,01 0,14 0,01 -0,08 -0,07 -0,09 -0,15 -0,14 0,14
49 0,12 -0,02 0,05 0,22 0,19 0,08 0,08 0,09 -0,06 0,06
50 0,15 -0,21 -0,18 0,23 0,29 0,20 0,22 0,21 -0,12 0,12
51 0,12 -0,11 0,20 0,00 0,03 0,08 0,09 0,04 0,20 -0,20

279
Apéndices

Tabla AP5-1-3. Índices de correlación Tau-Kendall entre los parámetros de la


base de datos femenina, todos los casos (tercera parte).
27 28 30 31 32 33 34 35 36 37 38 39
27 1,00
28 0,87 1,00
30 0,60 0,61 1,00
31 0,59 0,60 0,89 1,00
32 -0,16 -0,11 -0,14 -0,13 1,00
33 -0,03 -0,02 -0,06 -0,05 0,07 1,00
34 0,44 0,45 0,25 0,26 -0,10 0,10 1,00
35 -0,29 -0,23 -0,31 -0,28 0,70 0,02 -0,21 1,00
36 0,30 0,23 0,27 0,23 -0,18 0,11 0,28 -0,40 1,00
37 0,00 0,02 0,03 0,06 -0,51 -0,14 -0,05 -0,37 -0,21 1,00
38 -0,31 -0,25 -0,30 -0,26 0,22 -0,10 -0,26 0,44 -0,76 0,17 1,00
39 -0,27 -0,21 -0,28 -0,23 0,25 -0,07 -0,20 0,40 -0,66 0,09 0,77 1,00
40 -0,29 -0,23 -0,29 -0,25 0,22 -0,08 -0,23 0,44 -0,76 0,15 0,86 0,89
41 -0,22 -0,19 -0,26 -0,24 0,19 0,00 -0,11 0,27 -0,27 -0,06 0,29 0,28
42 -0,15 -0,14 -0,14 -0,12 -0,11 -0,13 -0,09 0,00 -0,25 0,17 0,23 0,22
43 -0,14 -0,10 -0,14 -0,11 -0,17 -0,19 -0,17 0,04 -0,45 0,39 0,40 0,36
44 -0,29 -0,24 -0,31 -0,28 0,28 -0,09 -0,21 0,41 -0,45 0,05 0,49 0,48
45 -0,32 -0,26 -0,32 -0,29 0,25 -0,10 -0,20 0,37 -0,48 0,12 0,52 0,52
46 -0,31 -0,27 -0,29 -0,26 0,20 -0,16 -0,24 0,37 -0,53 0,09 0,58 0,59
47 -0,13 -0,09 -0,15 -0,15 0,28 -0,05 -0,05 0,29 -0,24 -0,04 0,25 0,29
48 0,01 0,01 0,02 0,03 -0,18 -0,07 -0,01 -0,13 0,09 0,15 -0,08 -0,13
49 -0,12 -0,12 -0,02 -0,03 0,06 -0,19 -0,08 0,09 -0,16 0,14 0,12 0,10
50 -0,03 0,01 0,00 0,02 -0,01 -0,19 -0,01 0,07 -0,30 0,27 0,26 0,27
51 -0,08 -0,06 -0,08 -0,09 0,26 0,06 -0,06 0,20 -0,10 -0,11 0,11 0,15

Tabla AP5-1-4. Índices de correlación Tau-Kendall entre los parámetros de la


base de datos femenina, todos los casos (cuarta parte).
40 41 42 43 44 45 46 47 48 49 50 51
40 1,00
41 0,28 1,00
42 0,24 0,50 1,00
43 0,42 0,34 0,50 1,00
44 0,50 0,31 0,22 0,28 1,00
45 0,54 0,38 0,29 0,35 0,78 1,00
46 0,60 0,30 0,34 0,40 0,71 0,73 1,00
47 0,29 0,25 0,10 0,13 0,28 0,32 0,28 1,00
48 -0,11 -0,32 -0,25 -0,10 -0,13 -0,15 -0,14 -0,32 1,00
49 0,12 -0,09 -0,05 -0,00 0,13 0,09 0,12 0,14 0,03 1,00
50 0,28 0,12 0,20 0,32 0,20 0,22 0,24 0,25 -0,06 0,36 1,00
51 0,13 0,07 -0,15 -0,09 0,12 0,11 0,05 0,34 -0,16 0,26 0,12 1,00

280
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla AP5-2-1. Índices de correlación Tau-Kendall entre los parámetros de la base de datos
femenina, casos patológicos (primera parte).
1 2 3 4 5 6 7 8 9 10 11 12 13
1 1,00 0,03 -0,15 -0,02 -0,12 0,01 -0,18 -0,30 0,22 -0,17 0,08 0,03 0,04
2 0,03 1,00 0,25 0,21 0,27 -0,01 0,03 0,14 0,22 0,23 0,38 0,37 0,38
3 -0,15 0,25 1,00 0,41 0,57 0,15 0,13 0,10 0,07 0,24 0,29 0,35 0,33
4 -0,02 0,21 0,41 1,00 0,55 0,14 0,29 0,12 0,15 0,18 0,23 0,26 0,27
5 -0,12 0,27 0,57 0,55 1,00 0,05 0,18 0,19 0,14 0,25 0,23 0,27 0,28
6 0,01 -0,01 0,15 0,14 0,05 1,00 0,34 0,00 0,05 -0,06 -0,07 -0,02 -0,05
7 -0,18 0,03 0,13 0,29 0,18 0,34 1,00 0,12 -0,06 0,00 -0,02 0,01 0,01
8 -0,30 0,14 0,10 0,12 0,19 0,00 0,12 1,00 -0,06 0,56 0,32 0,28 0,31
9 0,22 0,22 0,07 0,15 0,14 0,05 -0,06 -0,06 1,00 -0,03 0,20 0,16 0,17
10 -0,17 0,23 0,24 0,18 0,25 -0,06 0,00 0,56 -0,03 1,00 0,52 0,54 0,56
11 0,08 0,38 0,29 0,23 0,23 -0,07 -0,02 0,32 0,20 0,52 1,00 0,81 0,81
12 0,03 0,37 0,35 0,26 0,27 -0,02 0,01 0,28 0,16 0,54 0,81 1,00 0,90
13 0,04 0,38 0,33 0,27 0,28 -0,05 0,01 0,31 0,17 0,56 0,81 0,90 1,00
14 0,07 0,38 0,32 0,24 0,28 -0,06 0,03 0,31 0,18 0,46 0,73 0,78 0,83
15 0,10 -0,29 -0,01 0,07 -0,09 0,11 0,18 -0,26 -0,12 -0,14 -0,10 -0,02 -0,05
17 -0,48 0,06 0,14 0,11 0,20 0,01 0,14 0,72 -0,18 0,41 0,16 0,16 0,17
18 0,15 0,18 0,11 0,03 0,08 -0,03 -0,26 -0,21 0,28 0,02 0,19 0,13 0,14
19 0,22 0,28 0,15 0,06 0,10 0,00 -0,21 -0,27 0,24 0,00 0,26 0,21 0,22
21 0,16 0,40 0,21 0,07 0,16 -0,07 -0,10 -0,10 0,28 0,09 0,37 0,35 0,36
22 0,21 0,47 0,23 0,06 0,13 -0,05 -0,11 -0,11 0,25 0,13 0,39 0,36 0,38
23 0,34 0,32 0,20 0,15 0,11 -0,02 -0,05 -0,04 0,23 0,09 0,48 0,46 0,48
24 -0,22 -0,22 -0,07 -0,14 -0,14 -0,06 0,06 0,06 -1,00 0,03 -0,19 -0,16 -0,17
26 0,22 0,22 0,07 0,15 0,14 0,05 -0,06 -0,06 1,00 -0,03 0,20 0,16 0,17
27 -0,01 -0,26 -0,23 -0,09 -0,22 -0,09 0,09 0,01 -0,21 -0,11 -0,27 -0,25 -0,27
28 0,00 -0,17 -0,19 -0,09 -0,18 -0,07 0,09 0,03 -0,20 -0,07 -0,23 -0,23 -0,22
30 -0,06 -0,27 -0,21 -0,12 -0,18 0,00 -0,02 -0,02 -0,27 -0,11 -0,27 -0,29 -0,28
31 -0,06 -0,26 -0,16 -0,09 -0,15 0,03 0,01 -0,03 -0,28 -0,08 -0,25 -0,25 -0,24
32 -0,78 0,10 0,23 0,08 0,22 0,00 0,17 0,40 -0,28 0,28 -0,01 0,04 0,05
33 -0,11 -0,02 0,02 0,03 0,01 0,04 0,18 0,12 -0,21 0,00 -0,06 0,00 -0,02
34 0,00 -0,18 -0,10 -0,07 -0,18 0,01 0,06 -0,07 -0,18 -0,14 -0,28 -0,26 -0,29
35 -0,43 0,32 0,31 0,20 0,39 -0,08 0,03 0,43 0,17 0,36 0,25 0,25 0,27
36 -0,16 -0,63 -0,27 -0,21 -0,33 0,03 0,12 -0,21 -0,31 -0,28 -0,42 -0,41 -0,43
37 0,64 0,33 0,06 0,11 0,10 0,01 -0,12 -0,10 0,26 0,05 0,27 0,22 0,24
38 0,10 0,76 0,29 0,22 0,35 -0,04 -0,05 0,18 0,30 0,26 0,42 0,41 0,42
39 -0,06 0,82 0,19 0,15 0,20 0,03 0,10 0,11 0,09 0,19 0,27 0,28 0,28
40 0,10 0,85 0,28 0,23 0,33 -0,04 -0,04 0,17 0,29 0,26 0,42 0,40 0,42
41 -0,04 -0,02 -0,05 -0,09 -0,01 0,00 -0,09 -0,36 -0,07 -0,27 -0,27 -0,26 -0,23
42 0,36 0,02 -0,06 -0,06 -0,13 0,03 -0,12 -0,72 0,21 -0,40 -0,16 -0,14 -0,15
43 0,47 0,23 -0,04 0,01 0,00 -0,01 -0,20 -0,26 0,49 -0,16 0,13 0,09 0,11
44 0,12 0,46 0,23 0,30 0,33 0,06 0,10 -0,04 0,44 0,11 0,25 0,26 0,28
45 0,25 0,50 0,27 0,30 0,34 0,05 0,02 -0,15 0,24 0,06 0,24 0,24 0,25
46 0,23 0,42 0,22 0,23 0,22 0,10 0,06 -0,20 0,44 -0,03 0,23 0,24 0,25
47 -0,05 0,01 -0,04 -0,12 0,00 -0,22 -0,17 0,14 -0,23 0,03 -0,07 -0,08 -0,06
48 0,04 0,18 0,32 0,27 0,29 0,01 0,03 0,12 0,30 0,28 0,49 0,44 0,43
49 0,02 0,06 0,03 -0,10 0,06 -0,01 -0,13 0,20 -0,03 0,17 0,17 0,08 0,09
50 0,10 0,26 0,05 -0,03 0,03 -0,17 -0,16 -0,07 -0,02 -0,03 0,14 0,06 0,07
51 -0,23 -0,06 -0,08 -0,11 -0,03 -0,17 -0,12 0,35 -0,36 0,20 -0,02 -0,04 -0,03

281
Apéndices

Tabla AP5-2-2. Índices de correlación Tau-Kendall entre los


parámetros de la base de datos femenina, casos patológicos (segunda
parte).
14 15 17 18 19 21 22 23 24 26
14 1,00 -0,08 0,16 0,08 0,18 0,39 0,40 0,57 -0,17 0,18
15 -0,08 1,00 -0,25 -0,01 -0,02 -0,15 -0,15 -0,05 0,12 -0,12
17 0,16 -0,25 1,00 -0,28 -0,40 -0,22 -0,26 -0,19 0,18 -0,18
18 0,08 -0,01 -0,28 1,00 0,65 0,42 0,39 0,16 -0,28 0,28
19 0,18 -0,02 -0,40 0,65 1,00 0,54 0,57 0,31 -0,23 0,24
21 0,39 -0,15 -0,22 0,42 0,54 1,00 0,75 0,50 -0,28 0,28
22 0,40 -0,15 -0,26 0,39 0,57 0,75 1,00 0,53 -0,25 0,25
23 0,57 -0,05 -0,19 0,16 0,31 0,50 0,53 1,00 -0,22 0,23
24 -0,17 0,12 0,18 -0,28 -0,23 -0,28 -0,25 -0,22 1,00 -1,00
26 0,18 -0,12 -0,18 0,28 0,24 0,28 0,25 0,23 -1,00 1,00
27 -0,25 0,07 0,04 -0,36 -0,42 -0,35 -0,37 -0,22 0,21 -0,21
28 -0,22 -0,04 0,04 -0,33 -0,37 -0,31 -0,29 -0,18 0,20 -0,20
30 -0,32 0,02 0,01 -0,12 -0,20 -0,39 -0,39 -0,33 0,27 -0,27
31 -0,27 0,04 0,00 -0,13 -0,19 -0,40 -0,38 -0,30 0,28 -0,28
32 0,03 -0,12 0,56 -0,16 -0,20 -0,15 -0,17 -0,30 0,29 -0,28
33 0,03 0,00 0,16 -0,58 -0,27 -0,21 -0,12 0,00 0,21 -0,21
34 -0,31 0,03 -0,01 -0,32 -0,25 -0,43 -0,24 -0,21 0,18 -0,18
35 0,27 -0,28 0,45 0,00 -0,03 0,08 0,06 -0,01 -0,17 0,17
36 -0,47 0,25 -0,07 -0,16 -0,25 -0,40 -0,43 -0,37 0,31 -0,31
37 0,27 -0,06 -0,28 0,16 0,25 0,27 0,34 0,40 -0,26 0,26
38 0,46 -0,26 0,08 0,17 0,29 0,40 0,46 0,36 -0,30 0,30
39 0,28 -0,25 0,04 0,12 0,26 0,34 0,42 0,24 -0,09 0,09
40 0,44 -0,28 0,06 0,16 0,27 0,40 0,46 0,36 -0,29 0,29
41 -0,21 -0,07 -0,33 0,06 0,17 0,12 0,12 -0,01 0,07 -0,07
42 -0,14 0,21 -0,83 0,33 0,45 0,27 0,30 0,17 -0,21 0,21
43 0,13 -0,16 -0,43 0,32 0,39 0,43 0,40 0,40 -0,48 0,49
44 0,30 -0,11 -0,13 0,16 0,26 0,39 0,35 0,25 -0,45 0,44
45 0,25 -0,12 -0,25 0,20 0,37 0,41 0,46 0,33 -0,24 0,24
46 0,25 0,04 -0,31 0,35 0,49 0,47 0,47 0,33 -0,44 0,44
47 -0,03 -0,29 0,07 0,02 0,02 0,10 0,11 -0,02 0,23 -0,23
48 0,41 -0,09 0,07 0,19 0,20 0,25 0,27 0,26 -0,29 0,30
49 0,10 -0,09 0,12 0,12 0,08 0,10 0,09 0,04 0,03 -0,03
50 0,09 -0,26 -0,15 0,19 0,27 0,34 0,34 0,25 0,03 -0,02
51 -0,02 -0,23 0,31 -0,14 -0,20 -0,08 -0,12 -0,16 0,35 -0,36

282
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla AP5-2-3. Índices de correlación Tau-Kendall entre los parámetros de la base


de datos femenina, casos patológicos (tercera parte).
27 28 30 31 32 33 34 35 36 37 38 39
27 1,00 0,83 0,58 0,57 -0,01 -0,02 0,39 -0,16 0,23 -0,09 -0,24 -0,20
28 0,83 1,00 0,59 0,58 -0,01 -0,04 0,43 -0,13 0,16 -0,02 -0,17 -0,14
30 0,58 0,59 1,00 0,88 0,07 -0,13 0,27 -0,12 0,25 -0,11 -0,27 -0,22
31 0,57 0,58 0,88 1,00 0,07 -0,09 0,27 -0,11 0,26 -0,10 -0,27 -0,20
32 -0,01 -0,01 0,07 0,07 1,00 0,10 -0,05 0,53 -0,01 -0,45 0,06 0,15
33 -0,02 -0,04 -0,13 -0,09 0,10 1,00 0,20 0,03 0,05 -0,10 -0,04 0,01
34 0,39 0,43 0,27 0,27 -0,05 0,20 1,00 -0,18 0,23 -0,07 -0,22 -0,10
35 -0,16 -0,13 -0,12 -0,11 0,53 0,03 -0,18 1,00 -0,41 -0,07 0,42 0,21
36 0,23 0,16 0,25 0,26 -0,01 0,05 0,23 -0,41 1,00 -0,51 -0,84 -0,47
37 -0,09 -0,02 -0,11 -0,10 -0,45 -0,10 -0,07 -0,07 -0,51 1,00 0,44 0,21
38 -0,24 -0,17 -0,27 -0,27 0,06 -0,04 -0,22 0,42 -0,84 0,44 1,00 0,60
39 -0,20 -0,14 -0,22 -0,20 0,15 0,01 -0,10 0,21 -0,47 0,21 0,60 1,00
40 -0,25 -0,17 -0,27 -0,26 0,04 -0,03 -0,19 0,39 -0,76 0,43 0,90 0,71
41 -0,12 -0,09 -0,08 -0,08 -0,03 0,09 0,03 -0,09 0,07 -0,02 -0,06 0,02
42 -0,10 -0,09 -0,04 -0,03 -0,41 -0,19 0,01 -0,34 0,01 0,24 0,01 0,02
43 -0,16 -0,10 -0,16 -0,16 -0,47 -0,21 -0,13 -0,13 -0,29 0,46 0,26 0,12
44 -0,26 -0,22 -0,24 -0,23 -0,09 -0,05 -0,26 0,21 -0,45 0,28 0,47 0,36
45 -0,32 -0,25 -0,25 -0,23 -0,16 -0,02 -0,18 0,08 -0,43 0,43 0,48 0,42
46 -0,26 -0,27 -0,23 -0,21 -0,18 -0,19 -0,24 0,08 -0,39 0,33 0,44 0,37
47 0,00 0,04 0,00 -0,04 0,14 0,00 0,01 0,05 -0,07 0,00 0,03 0,02
48 -0,22 -0,18 -0,22 -0,19 -0,02 -0,09 -0,16 0,21 -0,23 0,15 0,22 0,12
49 0,00 0,03 0,12 0,08 0,08 -0,22 -0,14 0,16 -0,23 0,11 0,17 0,03
50 0,08 0,15 0,12 0,10 -0,06 -0,19 0,00 0,06 -0,26 0,24 0,26 0,24
51 0,11 0,11 0,10 0,07 0,30 0,07 -0,04 0,13 -0,01 -0,18 -0,05 -0,04

Tabla AP5-2-4. Índices de correlación Tau-Kendall entre los parámetros de la base


de datos femenina, casos patológicos (cuarta parte).
40 41 42 43 44 45 46 47 48 49 50 51
40 1,00 -0,04 0,01 0,27 0,47 0,50 0,43 0,01 0,21 0,10 0,26 -0,07
41 -0,04 1,00 0,41 0,20 0,10 0,20 0,04 0,22 -0,18 -0,28 0,11 -0,01
42 0,01 0,41 1,00 0,44 0,19 0,29 0,38 -0,04 -0,06 -0,13 0,15 -0,34
43 0,27 0,20 0,44 1,00 0,35 0,36 0,42 0,03 0,11 -0,06 0,28 -0,26
44 0,47 0,10 0,19 0,35 1,00 0,61 0,60 -0,08 0,19 -0,01 0,12 -0,16
45 0,50 0,20 0,29 0,36 0,61 1,00 0,54 -0,01 0,16 -0,05 0,20 -0,15
46 0,43 0,04 0,38 0,42 0,60 0,54 1,00 -0,16 0,23 0,04 0,17 -0,35
47 0,01 0,22 -0,04 0,03 -0,08 -0,01 -0,16 1,00 -0,08 0,09 0,24 0,46
48 0,21 -0,18 -0,06 0,11 0,19 0,16 0,23 -0,08 1,00 0,11 0,07 -0,12
49 0,10 -0,28 -0,13 -0,06 -0,01 -0,05 0,04 0,09 0,11 1,00 0,31 0,22
50 0,26 0,11 0,15 0,28 0,12 0,20 0,17 0,24 0,07 0,31 1,00 0,10
51 -0,07 -0,01 -0,34 -0,26 -0,16 -0,15 -0,35 0,46 -0,12 0,22 0,10 1,00

283
Apéndices

Tabla AP5-3-1. Índices de correlación Tau-Kendall entre los parámetros de la base de


datos femenina, casos normofónicos (primera parte).
1 2 3 4 5 6 7 8 9 10 11 12 13
1 1,00 -0,06 -0,19 -0,07 -0,23 0,02 -0,07 0,04 . 0,07 0,15 -0,03 -0,08
2 -0,06 1,00 -0,07 -0,16 -0,08 -0,03 -0,04 -0,03 . 0,05 0,17 0,08 -0,04
3 -0,19 -0,07 1,00 0,59 0,80 0,12 -0,03 -0,01 . -0,03 -0,01 0,07 0,14
4 -0,07 -0,16 0,59 1,00 0,66 0,19 -0,04 0,09 . -0,03 0,05 0,04 0,13
5 -0,23 -0,08 0,80 0,66 1,00 0,14 0,01 0,09 . -0,03 0,03 0,08 0,14
6 0,02 -0,03 0,12 0,19 0,14 1,00 0,15 0,10 . -0,16 0,00 -0,12 -0,12
7 -0,07 -0,04 -0,03 -0,04 0,01 0,15 1,00 0,06 . -0,04 0,04 0,06 -0,02
8 0,04 -0,03 -0,01 0,09 0,09 0,10 0,06 1,00 . 0,37 0,26 -0,03 -0,07
9 . . . . . . . . . . . . .
10 0,07 0,05 -0,03 -0,03 -0,03 -0,16 -0,04 0,37 . 1,00 0,22 0,04 0,10
11 0,15 0,17 -0,01 0,05 0,03 0,00 0,04 0,26 . 0,22 1,00 0,42 0,24
12 -0,03 0,08 0,07 0,04 0,08 -0,12 0,06 -0,03 . 0,04 0,42 1,00 0,62
13 -0,08 -0,04 0,14 0,13 0,14 -0,12 -0,02 -0,07 . 0,10 0,24 0,62 1,00
14 -0,12 -0,01 0,13 0,19 0,17 -0,03 0,00 0,00 . 0,05 0,29 0,57 0,76
15 -0,11 -0,29 0,29 0,23 0,26 0,09 0,02 0,00 . 0,01 -0,11 0,00 0,11
17 -0,24 -0,13 0,12 0,21 0,25 0,09 0,01 0,62 . 0,22 0,05 -0,04 0,00
18 0,09 -0,12 -0,02 -0,01 -0,08 0,17 0,07 -0,08 . -0,08 0,03 -0,02 -0,06
19 0,01 -0,09 0,00 0,00 -0,06 0,15 0,07 -0,13 . -0,16 0,03 0,06 0,01
21 -0,16 0,04 0,09 0,05 0,05 0,09 0,06 -0,19 . -0,20 0,21 0,20 0,05
22 -0,17 0,02 0,14 0,15 0,11 0,11 0,02 -0,18 . -0,24 0,23 0,19 0,05
23 -0,03 -0,03 0,04 0,03 0,03 -0,13 -0,09 -0,31 . -0,12 0,14 0,52 0,55
24 . . . . . . . . . . . . .
26 . . . . . . . . . . . . .
27 0,14 0,01 -0,02 -0,04 0,04 -0,12 -0,14 0,06 . 0,03 -0,04 -0,07 -0,02
28 0,10 0,04 0,01 -0,04 0,06 -0,13 -0,14 0,08 . 0,02 0,01 -0,02 0,01
30 0,26 0,01 -0,11 -0,11 -0,04 -0,08 -0,17 0,13 . 0,14 0,00 -0,03 0,04
31 0,27 0,01 -0,12 -0,13 -0,06 -0,08 -0,16 0,11 . 0,13 -0,03 -0,04 0,01
32 -0,85 -0,04 0,30 0,19 0,35 0,06 0,02 0,01 . -0,07 -0,20 0,05 0,15
33 -0,19 0,15 0,01 0,03 0,00 0,05 0,01 0,00 . 0,01 -0,07 0,03 0,02
34 0,02 -0,06 0,06 0,14 0,08 -0,06 -0,06 0,11 . -0,03 -0,10 -0,10 0,02
35 -0,97 0,08 0,19 0,07 0,24 -0,02 0,07 -0,04 . -0,08 -0,15 0,04 0,08
36 -0,09 -0,38 0,22 0,25 0,25 0,17 0,06 0,14 . 0,02 -0,01 -0,06 0,06
37 0,96 -0,04 -0,20 -0,08 -0,24 0,02 -0,06 0,04 . 0,08 0,16 -0,03 -0,08
38 0,01 0,58 -0,15 -0,18 -0,17 -0,01 0,02 -0,05 . 0,01 0,17 0,09 -0,04
39 -0,07 0,92 -0,05 -0,16 -0,06 -0,02 -0,04 0,00 . 0,07 0,20 0,10 0,01
40 -0,03 0,92 -0,08 -0,17 -0,10 -0,04 -0,06 -0,06 . 0,04 0,16 0,10 -0,02
41 -0,22 -0,05 0,07 -0,08 -0,02 -0,09 -0,02 -0,52 . -0,37 -0,16 0,09 0,07
42 -0,02 0,07 0,05 -0,06 -0,06 -0,10 -0,05 -0,83 . -0,33 -0,20 0,05 0,08
43 0,34 0,18 -0,18 -0,23 -0,25 -0,17 -0,11 -0,41 . -0,17 0,00 0,06 -0,02
44 -0,21 -0,07 0,79 0,67 0,81 0,18 -0,05 0,07 . -0,05 0,00 0,06 0,10
45 -0,19 -0,02 0,72 0,61 0,76 0,09 -0,03 0,00 . -0,05 0,07 0,20 0,21
46 -0,19 0,22 0,49 0,38 0,48 0,02 0,04 -0,05 . 0,03 0,18 0,21 0,19
47 -0,25 0,05 0,21 0,19 0,20 -0,06 -0,04 -0,03 . 0,13 0,01 0,14 0,24
48 0,29 0,01 -0,23 -0,10 -0,16 0,13 0,12 0,51 . 0,20 0,27 -0,10 -0,19
49 0,16 -0,20 0,01 0,05 0,00 0,14 0,02 0,08 . 0,13 -0,15 -0,29 -0,20
50 0,22 -0,02 -0,07 0,01 -0,04 0,15 0,03 -0,04 . 0,01 -0,21 -0,30 -0,26
51 -0,07 0,05 0,12 0,03 0,07 0,07 0,08 0,08 . 0,23 0,01 -0,11 -0,05

284
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla AP5-3-2. Índices de correlación Tau-Kendall entre los


parámetros de la base de datos femenina, casos normofónicos
(segunda parte).
14 15 17 18 19 21 22 23 24 26
14 1,00 0,05 0,06 -0,06 0,00 0,07 0,08 0,53 . .
15 0,05 1,00 0,07 0,02 0,00 -0,05 0,06 0,07 . .
17 0,06 0,07 1,00 -0,10 -0,09 -0,15 -0,12 -0,27 . .
18 -0,06 0,02 -0,10 1,00 0,67 0,34 0,29 -0,01 . .
19 0,00 0,00 -0,09 0,67 1,00 0,46 0,39 0,08 . .
21 0,07 -0,05 -0,15 0,34 0,46 1,00 0,79 0,14 . .
22 0,08 0,06 -0,12 0,29 0,39 0,79 1,00 0,14 . .
23 0,53 0,07 -0,27 -0,01 0,08 0,14 0,14 1,00 . .
24 . . . . . . . . . .
26 . . . . . . . . . .
27 -0,05 0,02 0,01 -0,48 -0,64 -0,45 -0,37 -0,10 . .
28 0,00 0,01 0,05 -0,53 -0,63 -0,40 -0,33 -0,06 . .
30 0,00 -0,02 0,07 -0,34 -0,40 -0,47 -0,48 -0,08 . .
31 -0,03 -0,03 0,03 -0,36 -0,41 -0,52 -0,52 -0,08 . .
32 0,15 0,17 0,37 -0,08 0,03 0,12 0,13 -0,01 . .
33 0,06 0,01 0,05 -0,36 -0,05 0,03 0,05 0,07 . .
34 0,00 0,17 0,07 -0,26 -0,36 -0,41 -0,25 -0,08 . .
35 0,12 0,10 0,23 -0,10 0,00 0,16 0,17 0,03 . .
36 0,04 0,31 0,25 -0,03 -0,07 -0,09 0,00 -0,07 . .
37 -0,12 -0,12 -0,24 0,08 0,01 -0,15 -0,16 -0,03 . .
38 0,01 -0,30 -0,15 0,04 0,07 0,16 0,13 -0,03 . .
39 0,03 -0,30 -0,10 -0,11 -0,09 0,04 0,02 -0,02 . .
40 0,00 -0,30 -0,17 -0,09 -0,04 0,06 0,03 0,00 . .
41 0,00 0,16 -0,33 0,03 0,14 0,29 0,32 0,19 . .
42 0,03 -0,01 -0,66 0,09 0,15 0,25 0,24 0,30 . .
43 -0,06 -0,46 -0,52 0,02 0,01 0,07 0,01 0,12 . .
44 0,13 0,28 0,21 -0,06 -0,02 0,08 0,16 0,03 . .
45 0,23 0,18 0,15 -0,02 0,06 0,16 0,21 0,13 . .
46 0,17 0,01 0,00 0,01 0,08 0,19 0,22 0,13 . .
47 0,24 0,19 0,12 -0,07 -0,04 -0,07 -0,04 0,13 . .
48 -0,12 -0,17 0,26 0,08 -0,04 -0,09 -0,11 -0,28 . .
49 -0,22 0,25 0,04 0,17 0,08 -0,22 -0,20 -0,13 . .
50 -0,20 0,05 -0,09 0,10 0,02 -0,26 -0,24 -0,17 . .
51 -0,05 0,23 0,08 -0,07 -0,08 -0,06 -0,03 -0,08 . .

285
Apéndices

Tabla AP5-3-3. Índices de correlación Tau-Kendall entre los parámetros de la base


de datos femenina, casos normofónicos (tercera parte).
27 28 30 31 32 33 34 35 36 37 38 39
27 1,00 0,91 0,56 0,57 -0,11 -0,15 0,46 -0,14 0,07 0,13 -0,08 0,02
28 0,91 1,00 0,58 0,58 -0,06 -0,10 0,43 -0,10 0,05 0,09 -0,07 0,05
30 0,56 0,58 1,00 0,92 -0,15 -0,10 0,17 -0,24 0,00 0,25 -0,07 0,02
31 0,57 0,58 0,92 1,00 -0,19 -0,09 0,18 -0,26 -0,04 0,27 -0,05 0,02
32 -0,11 -0,06 -0,15 -0,19 1,00 0,17 -0,02 0,86 0,15 -0,82 -0,08 -0,01
33 -0,15 -0,10 -0,10 -0,09 0,17 1,00 -0,07 0,20 -0,04 -0,19 0,12 0,14
34 0,46 0,43 0,17 0,18 -0,02 -0,07 1,00 -0,04 0,18 0,01 -0,15 -0,06
35 -0,14 -0,10 -0,24 -0,26 0,86 0,20 -0,04 1,00 0,08 -0,93 0,02 0,10
36 0,07 0,05 0,00 -0,04 0,15 -0,04 0,18 0,08 1,00 -0,10 -0,34 -0,36
37 0,13 0,09 0,25 0,27 -0,82 -0,19 0,01 -0,93 -0,10 1,00 0,04 -0,04
38 -0,08 -0,07 -0,07 -0,05 -0,08 0,12 -0,15 0,02 -0,34 0,04 1,00 0,57
39 0,02 0,05 0,02 0,02 -0,01 0,14 -0,06 0,10 -0,36 -0,04 0,57 1,00
40 -0,01 0,02 0,00 0,01 -0,06 0,13 -0,09 0,05 -0,46 0,00 0,61 0,89
41 -0,10 -0,07 -0,22 -0,21 0,17 0,09 -0,09 0,23 0,00 -0,21 0,03 -0,08
42 -0,07 -0,08 -0,15 -0,14 -0,03 0,03 -0,11 0,02 -0,19 -0,01 0,11 0,04
43 0,09 0,07 0,08 0,09 -0,35 -0,10 -0,11 -0,33 -0,34 0,34 0,17 0,17
44 -0,01 0,02 -0,11 -0,12 0,34 0,08 0,09 0,21 0,22 -0,22 -0,15 -0,05
45 -0,06 -0,03 -0,14 -0,15 0,32 0,04 0,01 0,20 0,14 -0,20 -0,09 0,01
46 -0,13 -0,10 -0,12 -0,14 0,14 0,04 -0,09 0,20 -0,01 -0,20 0,07 0,24
47 -0,01 -0,02 -0,03 -0,04 0,25 0,07 0,09 0,26 0,14 -0,25 -0,12 0,09
48 0,05 0,06 0,10 0,08 -0,27 -0,14 0,03 -0,29 -0,04 0,29 0,08 0,01
49 -0,08 -0,13 -0,01 -0,01 -0,12 -0,12 0,09 -0,18 0,18 0,16 -0,28 -0,20
50 0,11 0,07 0,15 0,16 -0,17 -0,16 0,15 -0,22 -0,04 0,22 -0,09 -0,03
51 -0,11 -0,10 -0,12 -0,13 0,08 0,11 0,03 0,06 0,18 -0,05 -0,09 0,04

Tabla AP5-3-4. Índices de correlación Tau-Kendall entre los parámetros de la base de


datos femenina, casos normofónicos (cuarta parte).
40 41 42 43 44 45 46 47 48 49 50 51
40 1,00 -0,04 0,10 0,22 -0,09 -0,02 0,19 0,04 0,00 -0,21 0,00 0,01
41 -0,04 1,00 0,52 0,14 0,02 0,06 0,01 -0,10 -0,34 -0,19 -0,22 -0,02
42 0,10 0,52 1,00 0,42 -0,03 0,05 0,10 -0,03 -0,48 -0,16 -0,02 -0,09
43 0,22 0,14 0,42 1,00 -0,24 -0,14 0,01 -0,19 -0,13 -0,22 -0,01 -0,22
44 -0,09 0,02 -0,03 -0,24 1,00 0,77 0,49 0,19 -0,16 0,00 -0,08 0,10
45 -0,02 0,06 0,05 -0,14 0,77 1,00 0,63 0,21 -0,21 -0,09 -0,13 0,03
46 0,19 0,01 0,10 0,01 0,49 0,63 1,00 0,25 -0,21 -0,15 -0,09 0,02
47 0,04 -0,10 -0,03 -0,19 0,19 0,21 0,25 1,00 -0,36 0,06 0,07 0,11
48 0,00 -0,34 -0,48 -0,13 -0,16 -0,21 -0,21 -0,36 1,00 0,10 0,05 0,00
49 -0,21 -0,19 -0,16 -0,22 0,00 -0,09 -0,15 0,06 0,10 1,00 0,46 0,23
50 0,00 -0,22 -0,02 -0,01 -0,08 -0,13 -0,09 0,07 0,05 0,46 1,00 0,05
51 0,01 -0,02 -0,09 -0,22 0,10 0,03 0,02 0,11 0,00 0,23 0,05 1,00

286
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla AP5-4-1. Índices de correlación Tau-Kendall entre los parámetros de la base de


datos masculina, todos los casos (primera parte).
1 2 3 4 5 6 7 8 9 10 11 12 13
1 1,00
2 0,18 1,00
3 0,03 0,07 1,00
4 0,12 0,12 0,57 1,00
5 -0,03 0,12 0,71 0,66 1,00
6 0,03 -0,03 -0,04 -0,03 -0,06 1,00
7 -0,13 -0,03 -0,01 0,02 0,05 0,01 1,00
8 -0,26 -0,21 0,10 0,10 0,17 -0,19 0,08 1,00
9 0,02 0,37 -0,03 -0,01 0,04 0,01 0,04 -0,20 1,00
10 -0,04 0,07 0,16 0,16 0,13 -0,12 0,00 0,27 0,00 1,00
11 0,09 0,42 0,25 0,32 0,29 -0,16 -0,09 0,11 0,30 0,33 1,00
12 0,12 0,39 0,29 0,34 0,35 -0,10 -0,10 0,01 0,28 0,23 0,68 1,00
13 0,15 0,42 0,31 0,36 0,37 -0,07 -0,16 -0,06 0,28 0,21 0,61 0,81 1,00
14 0,13 0,39 0,31 0,33 0,35 -0,05 -0,12 -0,09 0,22 0,18 0,55 0,72 0,82
15 -0,19 -0,48 0,12 0,02 0,06 -0,03 0,10 0,26 -0,42 0,07 -0,22 -0,18 -0,23
17 -0,41 -0,33 0,05 -0,02 0,04 -0,02 0,16 0,54 -0,25 0,19 -0,14 -0,17 -0,23
18 0,23 0,28 0,15 0,18 0,12 0,01 -0,13 -0,11 0,30 0,03 0,37 0,30 0,30
19 0,29 0,37 0,21 0,22 0,20 0,01 -0,13 -0,19 0,32 0,06 0,41 0,37 0,40
21 0,13 0,32 0,20 0,17 0,18 0,05 -0,13 -0,12 0,30 0,05 0,37 0,33 0,34
22 0,16 0,38 0,20 0,22 0,20 0,00 -0,15 -0,11 0,32 0,13 0,46 0,40 0,42
23 0,26 0,33 0,25 0,27 0,26 0,00 -0,14 -0,22 0,21 0,07 0,45 0,59 0,67
24 -0,02 -0,37 0,03 0,01 -0,04 -0,01 -0,04 0,21 -1,00 0,00 -0,30 -0,28 -0,28
26 0,02 0,37 -0,03 -0,01 0,04 0,01 0,04 -0,20 1,00 0,00 0,30 0,28 0,28
27 -0,28 -0,14 -0,06 -0,08 -0,05 -0,03 0,12 0,18 -0,28 -0,02 -0,17 -0,20 -0,21
28 -0,29 -0,12 -0,06 -0,10 -0,04 -0,01 0,14 0,13 -0,29 -0,01 -0,15 -0,15 -0,16
30 -0,21 -0,10 -0,05 -0,07 -0,04 -0,02 0,11 0,09 -0,27 -0,02 -0,15 -0,14 -0,15
31 -0,20 -0,10 -0,05 -0,06 -0,03 -0,03 0,11 0,09 -0,29 -0,02 -0,14 -0,12 -0,13
32 -0,73 -0,22 0,09 0,01 0,13 0,03 0,11 0,31 -0,30 0,01 -0,16 -0,15 -0,18
33 -0,03 -0,14 -0,08 -0,09 -0,06 0,06 0,10 -0,03 -0,07 0,01 -0,22 -0,15 -0,12
34 0,03 -0,01 -0,03 -0,02 -0,06 -0,07 0,09 0,00 0,01 0,03 -0,05 -0,04 -0,02
35 -0,78 0,03 -0,02 -0,08 0,06 -0,05 0,07 0,18 0,19 0,07 0,08 0,04 0,02
36 -0,22 -0,68 -0,09 -0,17 -0,13 0,03 0,00 0,21 -0,36 -0,07 -0,41 -0,38 -0,41
37 0,83 0,33 0,03 0,11 -0,01 0,01 -0,13 -0,30 0,18 0,02 0,21 0,23 0,26
38 0,25 0,73 0,10 0,20 0,14 -0,08 0,02 -0,18 0,39 0,11 0,43 0,42 0,44
39 0,18 0,92 0,08 0,13 0,13 -0,05 0,00 -0,20 0,38 0,07 0,42 0,38 0,42
40 0,19 0,88 0,09 0,14 0,13 -0,07 0,02 -0,20 0,39 0,09 0,43 0,40 0,42
41 -0,10 0,02 0,00 0,02 0,05 0,02 0,00 -0,21 0,03 -0,17 -0,09 0,00 0,05
42 0,18 0,38 0,04 0,06 0,03 0,07 -0,13 -0,60 0,29 -0,24 0,10 0,17 0,24
43 0,36 0,45 0,00 0,08 0,02 0,05 -0,11 -0,46 0,42 -0,14 0,17 0,21 0,27
44 0,10 0,34 0,42 0,47 0,53 -0,05 -0,02 -0,05 0,36 0,07 0,39 0,47 0,50
45 0,17 0,40 0,44 0,50 0,55 -0,07 -0,05 -0,07 0,28 0,07 0,45 0,51 0,55
46 0,14 0,44 0,37 0,45 0,44 -0,09 -0,03 -0,08 0,35 0,11 0,46 0,50 0,54
47 0,08 0,11 0,06 -0,01 0,07 0,04 -0,19 -0,04 -0,18 -0,01 0,05 0,10 0,12
48 0,03 0,10 0,02 -0,01 -0,03 -0,02 0,04 0,14 0,19 0,15 0,21 0,08 0,04
49 -0,01 0,04 0,00 0,05 0,01 0,02 0,00 -0,02 0,06 0,11 0,03 0,06 0,05
50 0,16 0,32 -0,11 -0,10 -0,08 0,02 -0,09 -0,38 0,19 -0,06 0,03 0,07 0,17
51 0,01 -0,07 0,07 0,05 0,08 -0,03 -0,09 0,03 -0,33 0,07 -0,05 0,02 0,05

287
Apéndices

Tabla AP5-4-2. Índices de correlación Tau-Kendall entre los parámetros de la


base de datos masculina, todos los casos (segunda parte).
14 15 17 18 19 21 22 23 24 26
14 1,00
15 -0,17 1,00
17 -0,23 0,28 1,00
18 0,28 -0,16 -0,30 1,00
19 0,38 -0,20 -0,39 0,63 1,00
21 0,33 -0,12 -0,29 0,47 0,53 1,00
22 0,39 -0,20 -0,29 0,44 0,58 0,69 1,00
23 0,75 -0,16 -0,38 0,31 0,40 0,34 0,39 1,00
24 -0,22 0,42 0,25 -0,30 -0,32 -0,30 -0,32 -0,21 1,00
26 0,22 -0,42 -0,25 0,30 0,32 0,30 0,32 0,21 -1,00 1,00
27 -0,22 0,11 0,25 -0,35 -0,46 -0,38 -0,40 -0,28 0,28 -0,28
28 -0,16 0,09 0,25 -0,43 -0,44 -0,38 -0,38 -0,23 0,29 -0,29
30 -0,14 0,04 0,21 -0,28 -0,30 -0,38 -0,45 -0,21 0,27 -0,27
31 -0,13 0,05 0,21 -0,29 -0,31 -0,39 -0,44 -0,20 0,29 -0,29
32 -0,17 0,27 0,52 -0,27 -0,30 -0,17 -0,18 -0,30 0,30 -0,30
33 -0,11 0,06 0,10 -0,56 -0,24 -0,19 -0,13 -0,11 0,07 -0,07
34 -0,04 -0,06 0,03 -0,14 -0,08 -0,40 -0,14 -0,04 -0,01 0,01
35 0,02 0,03 0,27 -0,09 -0,13 0,03 0,02 -0,12 -0,19 0,19
36 -0,37 0,46 0,30 -0,26 -0,34 -0,28 -0,34 -0,33 0,36 -0,36
37 0,22 -0,30 -0,48 0,33 0,41 0,23 0,28 0,33 -0,18 0,18
38 0,39 -0,46 -0,33 0,32 0,38 0,28 0,37 0,35 -0,39 0,39
39 0,38 -0,47 -0,32 0,29 0,39 0,34 0,40 0,32 -0,38 0,38
40 0,39 -0,47 -0,32 0,30 0,39 0,33 0,38 0,33 -0,39 0,39
41 0,06 -0,01 -0,20 0,02 0,10 0,16 0,12 0,09 -0,03 0,03
42 0,24 -0,28 -0,67 0,29 0,37 0,31 0,31 0,32 -0,29 0,29
43 0,24 -0,57 -0,59 0,25 0,34 0,21 0,31 0,32 -0,42 0,42
44 0,43 -0,21 -0,24 0,32 0,41 0,36 0,38 0,36 -0,36 0,36
45 0,51 -0,23 -0,28 0,36 0,46 0,40 0,42 0,46 -0,28 0,28
46 0,48 -0,26 -0,28 0,37 0,43 0,38 0,43 0,42 -0,34 0,35
47 0,13 -0,22 -0,04 0,02 0,12 0,12 0,12 0,10 0,18 -0,18
48 0,02 -0,12 0,14 0,05 0,00 0,04 0,04 -0,05 -0,19 0,19
49 0,07 -0,09 0,11 0,06 0,03 -0,09 -0,07 -0,01 -0,06 0,06
50 0,18 -0,37 -0,32 0,15 0,20 0,16 0,17 0,21 -0,19 0,19
51 0,08 0,08 0,02 -0,10 -0,06 0,02 -0,03 0,07 0,32 -0,33

288
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla AP5-4-3. Índices de correlación Tau-Kendall entre los parámetros de la


base de datos masculina, todos los casos (tercera parte).
27 28 30 31 32 33 34 35 36 37 38 39
27 1,00
28 0,74 1,00
30 0,55 0,66 1,00
31 0,53 0,64 0,91 1,00
32 0,32 0,36 0,27 0,28 1,00
33 -0,05 0,05 -0,03 -0,02 0,04 1,00
34 0,18 0,21 0,08 0,08 -0,05 0,06 1,00
35 0,16 0,18 0,12 0,11 0,62 -0,05 -0,06 1,00
36 0,14 0,11 0,06 0,06 0,23 0,12 0,01 0,00 1,00
37 -0,34 -0,34 -0,25 -0,24 -0,71 -0,09 0,00 -0,61 -0,38 1,00
38 -0,17 -0,16 -0,12 -0,11 -0,29 -0,17 0,03 -0,04 -0,74 0,41 1,00
39 -0,15 -0,14 -0,11 -0,11 -0,23 -0,15 -0,02 0,02 -0,66 0,34 0,75 1,00
40 -0,15 -0,14 -0,11 -0,11 -0,25 -0,16 -0,01 0,02 -0,72 0,35 0,82 0,91
41 -0,14 -0,09 -0,09 -0,07 0,09 0,06 -0,14 0,08 -0,03 -0,08 -0,04 0,02
42 -0,15 -0,13 -0,11 -0,12 -0,21 -0,13 -0,05 -0,05 -0,33 0,26 0,32 0,37
43 -0,21 -0,21 -0,18 -0,18 -0,42 -0,04 0,07 -0,20 -0,44 0,45 0,45 0,45
44 -0,24 -0,22 -0,17 -0,15 -0,12 -0,13 -0,08 0,03 -0,34 0,21 0,38 0,36
45 -0,23 -0,19 -0,15 -0,13 -0,14 -0,17 -0,09 -0,02 -0,39 0,28 0,43 0,41
46 -0,20 -0,18 -0,14 -0,13 -0,14 -0,20 -0,06 0,02 -0,42 0,25 0,47 0,46
47 -0,06 -0,03 0,00 0,01 0,04 0,03 -0,11 -0,07 -0,07 0,06 0,01 0,10
48 -0,06 -0,08 -0,08 -0,08 -0,09 -0,03 -0,01 0,06 -0,08 0,08 0,13 0,09
49 0,02 0,02 0,12 0,15 0,03 -0,07 0,07 0,08 -0,09 -0,02 0,10 0,03
50 -0,07 -0,05 0,02 0,02 -0,19 -0,06 -0,01 -0,02 -0,30 0,21 0,28 0,32
51 0,06 0,06 0,10 0,11 0,08 0,08 -0,16 -0,04 0,09 -0,04 -0,11 -0,07

Tabla AP5-4-4. Índices de correlación Tau-Kendall entre los parámetros de la


base de datos masculina, todos los casos (cuarta parte).
40 41 42 43 44 45 46 47 48 49 50 51
40 1,00
41 0,01 1,00
42 0,36 0,32 1,00
43 0,46 0,19 0,55 1,00
44 0,36 0,19 0,29 0,35 1,00
45 0,42 0,16 0,33 0,34 0,73 1,00
46 0,48 0,15 0,35 0,39 0,70 0,73 1,00
47 0,08 0,18 0,09 0,19 0,09 0,12 0,08 1,00
48 0,10 -0,41 -0,24 -0,09 -0,03 0,00 -0,03 -0,18 1,00
49 0,05 -0,09 -0,06 -0,01 0,02 -0,02 0,00 0,05 0,07 1,00
50 0,32 0,15 0,36 0,41 0,11 0,11 0,14 0,27 -0,21 0,25 1,00
51 -0,08 0,28 -0,02 -0,04 -0,01 0,04 -0,01 0,34 -0,23 0,07 0,11 1,00

289
Apéndices

Tabla AP5-5-1. Índices de correlación Tau-Kendall entre los parámetros de la base de datos
masculina, casos patológicos (primera parte).
1 2 3 4 5 6 7 8 9 10 11 12 13
1 1,00 0,16 -0,09 0,09 -0,19 0,08 -0,13 -0,30 -0,03 -0,15 0,02 0,03 0,07
2 0,16 1,00 -0,14 -0,09 -0,08 0,03 0,03 -0,18 0,33 -0,03 0,40 0,36 0,33
3 -0,09 -0,14 1,00 0,43 0,65 -0,07 -0,04 0,14 -0,17 0,14 0,11 0,12 0,12
4 0,09 -0,09 0,43 1,00 0,52 -0,04 -0,04 0,12 -0,19 0,12 0,14 0,15 0,14
5 -0,19 -0,08 0,65 0,52 1,00 -0,09 0,02 0,23 -0,10 0,12 0,12 0,18 0,16
6 0,08 0,03 -0,07 -0,04 -0,09 1,00 -0,15 -0,30 0,08 -0,15 -0,11 -0,03 0,05
7 -0,13 0,03 -0,04 -0,04 0,02 -0,15 1,00 0,00 0,08 0,03 -0,14 -0,08 -0,15
8 -0,30 -0,18 0,14 0,12 0,23 -0,30 0,00 1,00 -0,23 0,31 0,02 -0,04 -0,06
9 -0,03 0,33 -0,17 -0,19 -0,10 0,08 0,08 -0,23 1,00 -0,09 0,23 0,13 0,12
10 -0,15 -0,03 0,14 0,12 0,12 -0,15 0,03 0,31 -0,09 1,00 0,22 0,21 0,20
11 0,02 0,40 0,11 0,14 0,12 -0,11 -0,14 0,02 0,23 0,22 1,00 0,72 0,67
12 0,03 0,36 0,12 0,15 0,18 -0,03 -0,08 -0,04 0,13 0,21 0,72 1,00 0,83
13 0,07 0,33 0,12 0,14 0,16 0,05 -0,15 -0,06 0,12 0,20 0,67 0,83 1,00
14 0,10 0,22 0,11 0,09 0,10 0,14 -0,14 -0,16 0,05 0,14 0,52 0,65 0,73
15 -0,19 -0,45 0,32 0,20 0,20 -0,09 0,02 0,20 -0,47 0,19 -0,19 -0,11 -0,16
17 -0,41 -0,33 0,17 0,09 0,21 -0,20 0,15 0,61 -0,23 0,33 -0,12 -0,15 -0,18
18 0,21 0,28 -0,09 -0,08 -0,15 0,07 -0,21 -0,27 0,31 -0,14 0,39 0,30 0,29
19 0,29 0,33 -0,07 -0,09 -0,14 0,10 -0,19 -0,36 0,30 -0,16 0,37 0,33 0,34
21 0,19 0,24 -0,08 -0,18 -0,13 0,14 -0,18 -0,30 0,25 -0,16 0,20 0,16 0,20
22 0,15 0,33 -0,09 -0,12 -0,12 0,14 -0,17 -0,33 0,29 -0,11 0,28 0,25 0,29
23 0,27 0,23 0,08 0,06 0,02 0,24 -0,12 -0,35 0,08 -0,04 0,38 0,52 0,59
24 0,03 -0,33 0,17 0,20 0,10 -0,08 -0,08 0,23 -1,00 0,09 -0,22 -0,14 -0,12
26 -0,03 0,33 -0,17 -0,19 -0,10 0,08 0,08 -0,23 1,00 -0,09 0,23 0,13 0,12
27 -0,22 -0,09 0,13 0,08 0,19 -0,11 0,19 0,34 -0,31 0,19 -0,08 -0,11 -0,11
28 -0,20 -0,08 0,12 0,06 0,18 -0,12 0,18 0,26 -0,35 0,14 -0,10 -0,08 -0,08
30 -0,12 -0,09 0,15 0,07 0,15 -0,14 0,15 0,22 -0,34 0,16 -0,02 0,00 -0,04
31 -0,11 -0,09 0,16 0,10 0,16 -0,13 0,13 0,22 -0,37 0,16 -0,01 0,03 -0,02
32 -0,66 -0,23 0,23 0,08 0,29 -0,09 0,10 0,35 -0,39 0,15 -0,13 -0,09 -0,12
33 -0,05 -0,21 -0,01 0,03 0,04 0,06 0,16 0,01 -0,05 0,06 -0,31 -0,17 -0,17
34 -0,07 0,07 0,06 0,10 0,06 -0,05 0,12 0,04 0,08 0,07 0,06 0,06 0,08
35 -0,68 0,14 0,05 -0,10 0,18 -0,09 0,06 0,20 0,23 0,16 0,21 0,16 0,13
36 -0,17 -0,75 0,15 0,08 0,12 0,00 -0,08 0,18 -0,30 0,02 -0,41 -0,37 -0,32
37 0,75 0,38 -0,17 -0,01 -0,22 0,05 -0,12 -0,33 0,14 -0,10 0,20 0,18 0,20
38 0,16 0,75 -0,13 -0,08 -0,11 -0,08 0,15 -0,15 0,37 0,05 0,42 0,39 0,33
39 0,17 0,91 -0,16 -0,10 -0,08 -0,03 0,07 -0,17 0,35 0,00 0,39 0,35 0,32
40 0,17 0,83 -0,13 -0,08 -0,08 -0,08 0,13 -0,16 0,38 0,04 0,42 0,37 0,34
41 -0,05 -0,13 -0,06 -0,03 -0,01 0,07 0,04 -0,26 -0,06 -0,26 -0,24 -0,11 -0,06
42 0,22 0,32 -0,08 -0,10 -0,11 0,23 -0,10 -0,66 0,26 -0,34 0,10 0,14 0,17
43 0,31 0,37 -0,19 -0,07 -0,15 0,17 0,02 -0,47 0,47 -0,25 0,10 0,12 0,14
44 -0,05 0,20 0,13 0,06 0,23 -0,02 0,01 -0,08 0,34 -0,03 0,22 0,24 0,21
45 0,19 0,29 0,18 0,13 0,24 -0,02 -0,09 -0,20 0,16 -0,12 0,29 0,35 0,34
46 0,06 0,32 0,08 0,08 0,14 -0,11 0,01 -0,12 0,30 -0,03 0,30 0,32 0,30
47 0,12 -0,10 0,01 -0,05 0,03 0,03 -0,20 0,02 -0,36 -0,10 -0,10 0,00 0,04
48 0,00 0,23 0,02 0,00 -0,07 -0,12 0,03 0,10 0,24 0,10 0,26 0,13 0,10
49 -0,01 -0,01 0,00 0,02 0,02 0,00 -0,02 0,06 0,03 0,08 0,04 0,03 0,01
50 0,21 0,25 -0,17 -0,21 -0,13 0,21 0,01 -0,32 0,16 -0,09 0,08 0,11 0,20
51 0,06 -0,18 0,06 0,07 0,12 -0,12 -0,10 0,18 -0,47 0,10 -0,05 0,05 0,08

290
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla AP5-5-2. Índices de correlación Tau-Kendall entre los


parámetros de la base de datos masculina, casos patológicos (segunda
parte).
14 15 17 18 19 21 22 23 24 26
14 1,00 -0,09 -0,18 0,27 0,31 0,21 0,28 0,69 -0,05 0,05
15 -0,09 1,00 0,34 -0,25 -0,30 -0,22 -0,26 -0,13 0,47 -0,47
17 -0,18 0,34 1,00 -0,37 -0,48 -0,40 -0,38 -0,39 0,23 -0,23
18 0,27 -0,25 -0,37 1,00 0,65 0,44 0,39 0,35 -0,30 0,31
19 0,31 -0,30 -0,48 0,65 1,00 0,50 0,54 0,40 -0,30 0,30
21 0,21 -0,22 -0,40 0,44 0,50 1,00 0,73 0,29 -0,25 0,25
22 0,28 -0,26 -0,38 0,39 0,54 0,73 1,00 0,31 -0,28 0,29
23 0,69 -0,13 -0,39 0,35 0,40 0,29 0,31 1,00 -0,08 0,08
24 -0,05 0,47 0,23 -0,30 -0,30 -0,25 -0,28 -0,08 1,00 -1,00
26 0,05 -0,47 -0,23 0,31 0,30 0,25 0,29 0,08 -1,00 1,00
27 -0,18 0,21 0,34 -0,39 -0,49 -0,44 -0,49 -0,26 0,30 -0,31
28 -0,12 0,20 0,29 -0,43 -0,43 -0,41 -0,43 -0,19 0,34 -0,35
30 -0,09 0,21 0,24 -0,26 -0,28 -0,41 -0,47 -0,16 0,34 -0,34
31 -0,07 0,22 0,25 -0,26 -0,29 -0,40 -0,44 -0,15 0,37 -0,37
32 -0,11 0,41 0,47 -0,35 -0,38 -0,23 -0,23 -0,25 0,39 -0,39
33 -0,15 0,06 0,11 -0,53 -0,28 -0,13 -0,06 -0,20 0,04 -0,05
34 0,04 -0,06 0,09 -0,14 -0,07 -0,43 -0,20 0,00 -0,09 0,08
35 0,06 0,03 0,25 -0,05 -0,07 0,01 0,08 -0,13 -0,22 0,23
36 -0,22 0,35 0,27 -0,23 -0,31 -0,15 -0,28 -0,26 0,30 -0,30
37 0,16 -0,34 -0,50 0,34 0,44 0,29 0,29 0,32 -0,14 0,14
38 0,23 -0,40 -0,22 0,27 0,32 0,16 0,27 0,24 -0,36 0,37
39 0,22 -0,45 -0,29 0,28 0,34 0,24 0,33 0,22 -0,35 0,35
40 0,24 -0,41 -0,25 0,29 0,34 0,20 0,29 0,24 -0,38 0,38
41 -0,05 -0,04 -0,21 -0,01 0,02 0,07 0,08 0,06 0,05 -0,06
42 0,19 -0,27 -0,75 0,35 0,46 0,40 0,43 0,40 -0,26 0,26
43 0,12 -0,54 -0,56 0,28 0,33 0,26 0,32 0,26 -0,47 0,47
44 0,12 -0,22 -0,18 0,21 0,23 0,15 0,13 0,12 -0,34 0,34
45 0,26 -0,24 -0,39 0,30 0,35 0,23 0,22 0,37 -0,17 0,16
46 0,18 -0,19 -0,27 0,33 0,28 0,18 0,22 0,23 -0,30 0,30
47 0,06 -0,07 -0,05 0,02 0,05 0,11 0,06 0,08 0,36 -0,36
48 0,07 -0,15 0,04 0,11 0,11 0,11 0,11 -0,04 -0,24 0,24
49 0,05 -0,04 0,16 0,10 0,07 -0,11 -0,10 -0,06 -0,03 0,03
50 0,21 -0,33 -0,26 0,21 0,29 0,24 0,25 0,28 -0,16 0,16
51 0,12 0,09 0,10 -0,15 -0,14 -0,08 -0,12 0,04 0,47 -0,47

291
Apéndices

Tabla AP5-5-3. Índices de correlación Tau-Kendall entre los parámetros de la base


de datos masculina, casos patológicos (tercera parte).
27 28 30 31 32 33 34 35 36 37 38 39
27 1,00 0,77 0,63 0,61 0,38 -0,04 0,13 0,09 0,08 -0,29 -0,13 -0,11
28 0,77 1,00 0,70 0,68 0,40 0,01 0,19 0,09 0,04 -0,24 -0,11 -0,10
30 0,63 0,70 1,00 0,91 0,28 -0,09 0,09 0,02 0,05 -0,17 -0,08 -0,09
31 0,61 0,68 0,91 1,00 0,29 -0,09 0,08 0,01 0,04 -0,17 -0,08 -0,09
32 0,38 0,40 0,28 0,29 1,00 0,09 0,00 0,47 0,24 -0,65 -0,29 -0,26
33 -0,04 0,01 -0,09 -0,09 0,09 1,00 0,05 -0,05 0,18 -0,14 -0,19 -0,21
34 0,13 0,19 0,09 0,08 0,00 0,05 1,00 0,03 -0,11 -0,04 0,07 0,06
35 0,09 0,09 0,02 0,01 0,47 -0,05 0,03 1,00 -0,14 -0,43 0,15 0,14
36 0,08 0,04 0,05 0,04 0,24 0,18 -0,11 -0,14 1,00 -0,42 -0,81 -0,73
37 -0,29 -0,24 -0,17 -0,17 -0,65 -0,14 -0,04 -0,43 -0,42 1,00 0,40 0,38
38 -0,13 -0,11 -0,08 -0,08 -0,29 -0,19 0,07 0,15 -0,81 0,40 1,00 0,77
39 -0,11 -0,10 -0,09 -0,09 -0,26 -0,21 0,06 0,14 -0,73 0,38 0,77 1,00
40 -0,12 -0,12 -0,09 -0,09 -0,30 -0,21 0,06 0,14 -0,77 0,40 0,91 0,86
41 -0,11 -0,10 -0,15 -0,12 0,05 0,10 -0,07 -0,07 0,19 -0,09 -0,16 -0,14
42 -0,30 -0,24 -0,23 -0,23 -0,26 -0,09 -0,10 -0,09 -0,26 0,30 0,21 0,28
43 -0,26 -0,27 -0,28 -0,26 -0,47 -0,01 0,03 -0,12 -0,30 0,41 0,33 0,37
44 -0,12 -0,12 -0,04 -0,02 -0,11 -0,12 -0,02 0,17 -0,12 0,07 0,21 0,23
45 -0,17 -0,12 -0,04 -0,02 -0,22 -0,18 -0,03 -0,02 -0,24 0,30 0,28 0,29
46 -0,12 -0,09 -0,05 -0,03 -0,19 -0,24 0,04 0,11 -0,27 0,18 0,34 0,35
47 -0,03 0,00 0,01 0,05 0,10 0,01 -0,20 -0,15 0,13 0,02 -0,17 -0,10
48 -0,05 -0,12 -0,08 -0,09 -0,11 -0,11 -0,01 0,17 -0,21 0,08 0,27 0,25
49 0,00 -0,05 0,08 0,08 0,01 -0,09 0,03 0,08 0,00 -0,04 0,05 0,01
50 -0,12 -0,10 -0,09 -0,09 -0,20 -0,08 -0,06 -0,04 -0,21 0,28 0,22 0,25
51 0,15 0,12 0,14 0,13 0,13 0,10 -0,14 -0,14 0,24 -0,05 -0,17 -0,16

Tabla AP5-5-4. Índices de correlación Tau-Kendall entre los parámetros de la base


de datos masculina, casos patológicos (cuarta parte).
40 41 42 43 44 45 46 47 48 49 50 51
40 1,00 -0,14 0,24 0,36 0,24 0,31 0,39 -0,14 0,27 0,05 0,24 -0,16
41 -0,14 1,00 0,31 0,28 0,21 0,20 0,17 0,26 -0,36 -0,19 0,12 0,18
42 0,24 0,31 1,00 0,51 0,22 0,40 0,30 0,08 -0,10 -0,16 0,27 -0,13
43 0,36 0,28 0,51 1,00 0,36 0,36 0,37 0,05 0,01 -0,04 0,36 -0,13
44 0,24 0,21 0,22 0,36 1,00 0,53 0,57 -0,01 0,04 0,02 0,13 -0,06
45 0,31 0,20 0,40 0,36 0,53 1,00 0,54 0,09 0,05 -0,09 0,09 0,05
46 0,39 0,17 0,30 0,37 0,57 0,54 1,00 -0,06 0,04 -0,02 0,11 -0,12
47 -0,14 0,26 0,08 0,05 -0,01 0,09 -0,06 1,00 -0,27 0,09 0,29 0,52
48 0,27 -0,36 -0,10 0,01 0,04 0,05 0,04 -0,27 1,00 0,09 -0,15 -0,16
49 0,05 -0,19 -0,16 -0,04 0,02 -0,09 -0,02 0,09 0,09 1,00 0,27 0,05
50 0,24 0,12 0,27 0,36 0,13 0,09 0,11 0,29 -0,15 0,27 1,00 0,04
51 -0,16 0,18 -0,13 -0,13 -0,06 0,05 -0,12 0,52 -0,16 0,05 0,04 1,00

292
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla AP5-6-1. Índices de correlación Tau-Kendall entre los parámetros de la base de


datos masculina, casos normofónicos (primera parte).
1 2 3 4 5 6 7 8 9 10 11 12 13
1 1,00 0,02 0,08 0,10 -0,01 0,03 -0,12 -0,22 . 0,06 -0,01 0,05 0,09
2 0,02 1,00 -0,02 -0,10 -0,06 0,05 0,02 -0,14 . -0,05 0,07 -0,03 -0,02
3 0,08 -0,02 1,00 0,64 0,73 0,04 0,14 0,17 . 0,17 0,27 0,36 0,42
4 0,10 -0,10 0,64 1,00 0,72 0,06 0,16 0,21 . 0,17 0,32 0,38 0,46
5 -0,01 -0,06 0,73 0,72 1,00 0,02 0,18 0,26 . 0,11 0,30 0,39 0,47
6 0,03 0,05 0,04 0,06 0,02 1,00 0,19 -0,08 . -0,06 -0,17 -0,14 -0,10
7 -0,12 0,02 0,14 0,16 0,18 0,19 1,00 0,19 . 0,06 0,09 -0,01 -0,09
8 -0,22 -0,14 0,17 0,21 0,26 -0,08 0,19 1,00 . 0,35 0,43 0,26 0,10
9 . . . . . . . . . . . . .
10 0,06 -0,05 0,17 0,17 0,11 -0,06 0,06 0,35 . 1,00 0,40 0,17 0,11
11 -0,01 0,07 0,27 0,32 0,30 -0,17 0,09 0,43 . 0,40 1,00 0,48 0,30
12 0,05 -0,03 0,36 0,38 0,39 -0,14 -0,01 0,26 . 0,17 0,48 1,00 0,69
13 0,09 -0,02 0,42 0,46 0,47 -0,10 -0,09 0,10 . 0,11 0,30 0,69 1,00
14 -0,01 0,01 0,41 0,40 0,46 -0,10 0,01 0,12 . 0,08 0,31 0,60 0,79
15 -0,10 -0,20 0,28 0,25 0,34 -0,05 0,14 0,26 . 0,14 0,18 0,28 0,26
17 -0,41 -0,14 0,01 0,01 0,04 0,11 0,12 0,44 . 0,18 0,07 0,01 -0,08
18 0,14 -0,01 0,30 0,31 0,25 0,00 -0,02 0,14 . 0,11 0,19 0,09 0,07
19 0,23 0,04 0,39 0,35 0,36 0,04 0,06 0,12 . 0,19 0,24 0,14 0,16
21 -0,03 0,08 0,37 0,29 0,29 0,05 0,09 0,21 . 0,15 0,32 0,20 0,12
22 0,07 0,05 0,35 0,34 0,27 -0,04 0,01 0,25 . 0,26 0,41 0,25 0,17
23 0,18 -0,04 0,28 0,30 0,30 -0,10 -0,09 -0,02 . 0,00 0,23 0,46 0,60
24 . . . . . . . . . . . . .
26 . . . . . . . . . . . . .
27 -0,26 0,20 -0,17 -0,13 -0,16 0,01 -0,07 -0,18 . -0,13 -0,06 -0,04 -0,02
28 -0,32 0,14 -0,22 -0,19 -0,19 0,05 0,01 -0,19 . -0,12 -0,08 -0,07 -0,06
30 -0,29 0,08 -0,25 -0,18 -0,17 0,08 -0,02 -0,14 . -0,17 -0,22 -0,23 -0,14
31 -0,27 0,04 -0,25 -0,17 -0,16 0,06 -0,01 -0,13 . -0,18 -0,24 -0,23 -0,12
32 -0,83 -0,06 0,04 0,03 0,13 0,10 0,13 0,26 . -0,07 -0,05 -0,05 -0,11
33 0,05 -0,02 -0,13 -0,15 -0,10 0,05 0,06 -0,09 . 0,01 -0,11 -0,04 0,01
34 0,17 0,01 -0,09 -0,06 -0,13 -0,09 -0,03 -0,15 . 0,02 -0,09 -0,04 0,03
35 -0,97 0,00 -0,08 -0,11 0,00 -0,01 0,11 0,20 . -0,07 0,01 -0,06 -0,09
36 -0,15 -0,34 -0,06 -0,07 -0,03 -0,06 0,00 0,19 . 0,04 -0,02 0,09 0,02
37 0,95 0,04 0,11 0,13 0,02 0,03 -0,12 -0,22 . 0,07 0,01 0,06 0,10
38 0,30 0,49 0,09 0,15 0,06 0,02 0,02 -0,17 . 0,01 0,10 0,08 0,11
39 0,03 0,86 0,03 -0,07 -0,02 0,05 0,05 -0,12 . -0,06 0,07 -0,04 -0,02
40 0,06 0,82 0,03 -0,06 -0,04 0,03 0,03 -0,15 . -0,05 0,07 -0,04 -0,02
41 -0,25 -0,17 -0,03 -0,03 0,02 -0,02 -0,02 -0,11 . -0,18 -0,24 -0,15 -0,11
42 0,09 0,20 -0,03 -0,02 -0,05 -0,02 -0,08 -0,56 . -0,36 -0,28 -0,12 0,00
43 0,40 0,13 -0,06 -0,04 -0,12 0,00 -0,19 -0,44 . -0,22 -0,18 -0,14 -0,07
44 0,11 0,00 0,64 0,72 0,72 -0,04 0,13 0,18 . 0,04 0,27 0,42 0,46
45 0,08 0,02 0,69 0,70 0,76 -0,02 0,15 0,21 . 0,10 0,30 0,41 0,47
46 0,06 0,08 0,58 0,63 0,61 -0,02 0,08 0,17 . 0,10 0,30 0,38 0,43
47 -0,02 0,08 -0,02 -0,15 -0,04 0,12 -0,13 -0,07 . -0,08 -0,09 -0,04 -0,07
48 0,03 0,02 -0,01 -0,05 -0,04 0,06 0,10 0,29 . 0,21 0,24 0,04 -0,04
49 -0,10 -0,12 -0,07 0,01 -0,05 0,04 0,06 -0,06 . 0,12 -0,11 -0,06 -0,04
50 0,00 0,15 -0,28 -0,31 -0,29 -0,09 -0,13 -0,43 . -0,17 -0,37 -0,35 -0,21
51 -0,08 -0,18 0,04 -0,04 0,00 0,09 -0,07 -0,14 . -0,05 -0,18 -0,09 -0,04

293
Apéndices

Tabla AP5-6-2. Índices de correlación Tau-Kendall entre los


parámetros de la base de datos masculina, casos normofónicos
(segunda parte).
14 15 17 18 19 21 22 23 24 26
14 1,00 0,31 -0,09 0,04 0,15 0,11 0,11 0,67 . .
15 0,31 1,00 0,03 0,18 0,22 0,38 0,26 0,28 . .
17 -0,09 0,03 1,00 -0,10 -0,20 0,00 -0,04 -0,33 . .
18 0,04 0,18 -0,10 1,00 0,56 0,38 0,39 0,09 . .
19 0,15 0,22 -0,20 0,56 1,00 0,35 0,41 0,20 . .
21 0,11 0,38 0,00 0,38 0,35 1,00 0,59 0,12 . .
22 0,11 0,26 -0,04 0,39 0,41 0,59 1,00 0,15 . .
23 0,67 0,28 -0,33 0,09 0,20 0,12 0,15 1,00 . .
24 . . . . . . . . . .
26 . . . . . . . . . .
27 -0,03 -0,21 -0,01 -0,21 -0,29 -0,16 -0,16 -0,12 . .
28 -0,04 -0,16 0,07 -0,39 -0,38 -0,24 -0,28 -0,15 . .
30 -0,09 -0,25 0,08 -0,26 -0,22 -0,35 -0,45 -0,18 . .
31 -0,09 -0,23 0,09 -0,30 -0,27 -0,39 -0,47 -0,19 . .
32 -0,08 0,07 0,56 -0,08 -0,15 0,03 -0,05 -0,30 . .
33 0,02 -0,06 0,05 -0,64 -0,25 -0,20 -0,20 0,02 . .
34 0,01 -0,19 -0,13 -0,09 0,04 -0,41 -0,08 0,01 . .
35 0,01 0,08 0,40 -0,14 -0,23 0,04 -0,07 -0,18 . .
36 0,00 0,14 0,20 -0,03 -0,07 -0,05 -0,01 0,02 . .
37 0,01 -0,09 -0,41 0,16 0,25 -0,01 0,08 0,19 . .
38 0,07 -0,13 -0,34 0,16 0,17 0,02 0,10 0,09 . .
39 0,01 -0,15 -0,17 0,06 0,13 0,14 0,12 -0,04 . .
40 0,00 -0,18 -0,22 0,08 0,12 0,11 0,10 -0,04 . .
41 -0,04 0,22 -0,04 -0,04 -0,02 0,08 -0,07 -0,03 . .
42 0,00 -0,09 -0,52 0,06 0,11 -0,02 -0,03 0,08 . .
43 -0,11 -0,37 -0,54 0,04 0,11 -0,17 0,01 0,06 . .
44 0,43 0,27 -0,08 0,29 0,37 0,27 0,26 0,32 . .
45 0,45 0,30 -0,02 0,24 0,37 0,27 0,30 0,31 . .
46 0,38 0,14 -0,05 0,24 0,33 0,26 0,30 0,26 . .
47 -0,06 -0,23 0,10 -0,11 0,00 -0,04 -0,06 -0,12 . .
48 -0,05 -0,09 0,32 -0,07 -0,16 -0,03 -0,02 -0,14 . .
49 -0,04 0,03 0,16 -0,04 -0,12 -0,20 -0,15 -0,12 . .
50 -0,18 -0,21 -0,25 -0,09 -0,09 -0,16 -0,18 -0,10 . .
51 0,01 0,15 -0,04 -0,10 -0,10 0,04 -0,07 0,05 . .

294
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla AP5-6-3. Índices de correlación Tau-Kendall entre los parámetros de la base


de datos masculina, casos normofónicos (tercera parte).
27 28 30 31 32 33 34 35 36 37 38 39
27 1,00 0,73 0,45 0,42 0,18 -0,07 0,21 0,28 -0,16 -0,25 0,10 0,17
28 0,73 1,00 0,59 0,56 0,26 0,09 0,16 0,34 -0,13 -0,32 -0,02 0,09
30 0,45 0,59 1,00 0,90 0,27 0,04 0,05 0,31 -0,14 -0,27 -0,03 0,05
31 0,42 0,56 0,90 1,00 0,26 0,07 0,05 0,29 -0,11 -0,26 -0,03 0,00
32 0,18 0,26 0,27 0,26 1,00 -0,07 -0,16 0,83 0,11 -0,78 -0,29 -0,06
33 -0,07 0,09 0,04 0,07 -0,07 1,00 0,06 -0,06 -0,01 0,04 -0,14 -0,05
34 0,21 0,16 0,05 0,05 -0,16 0,06 1,00 -0,18 -0,01 0,15 0,12 0,00
35 0,28 0,34 0,31 0,29 0,83 -0,06 -0,18 1,00 0,12 -0,92 -0,29 -0,01
36 -0,16 -0,13 -0,14 -0,11 0,11 -0,01 -0,01 0,12 1,00 -0,18 -0,42 -0,31
37 -0,25 -0,32 -0,27 -0,26 -0,78 0,04 0,15 -0,92 -0,18 1,00 0,33 0,06
38 0,10 -0,02 -0,03 -0,03 -0,29 -0,14 0,12 -0,29 -0,42 0,33 1,00 0,49
39 0,17 0,09 0,05 0,00 -0,06 -0,05 0,00 -0,01 -0,31 0,06 0,49 1,00
40 0,19 0,11 0,05 0,01 -0,11 -0,08 0,03 -0,05 -0,43 0,09 0,58 0,86
41 -0,05 0,02 0,09 0,11 0,23 0,05 -0,22 0,25 0,02 -0,25 -0,26 -0,13
42 0,27 0,18 0,16 0,13 -0,09 -0,13 0,13 -0,08 -0,23 0,09 0,24 0,24
43 0,09 0,00 0,01 0,00 -0,35 0,01 0,28 -0,39 -0,21 0,40 0,26 0,14
44 -0,15 -0,23 -0,21 -0,19 0,01 -0,13 -0,05 -0,12 -0,12 0,14 0,16 0,03
45 -0,10 -0,14 -0,17 -0,15 0,06 -0,11 -0,03 -0,07 -0,12 0,11 0,17 0,05
46 -0,01 -0,09 -0,12 -0,12 0,07 -0,16 0,01 -0,05 -0,15 0,09 0,21 0,11
47 -0,02 -0,02 -0,02 -0,04 0,05 0,13 0,03 0,02 0,05 -0,03 -0,18 0,05
48 -0,04 0,01 -0,09 -0,09 -0,03 0,05 0,00 -0,04 0,08 0,04 -0,01 -0,05
49 0,14 0,21 0,25 0,29 0,13 -0,04 0,13 0,11 0,03 -0,09 -0,02 -0,17
50 0,20 0,17 0,22 0,21 -0,08 -0,01 0,12 0,01 -0,12 0,00 0,08 0,14
51 0,01 0,00 0,02 0,04 0,06 0,06 -0,20 0,09 0,08 -0,07 -0,21 -0,18

Tabla AP5-6-4. Índices de correlación Tau-Kendall entre los parámetros de la base


de datos masculina, casos normofónicos (cuarta parte).
40 41 42 43 44 45 46 47 48 49 50 51
40 1,00 -0,15 0,26 0,19 0,03 0,05 0,12 0,00 -0,04 -0,15 0,15 -0,20
41 -0,15 1,00 0,21 -0,10 0,03 -0,04 -0,06 0,00 -0,49 0,03 0,09 0,42
42 0,26 0,21 1,00 0,43 0,07 0,00 0,11 -0,04 -0,52 -0,03 0,36 0,07
43 0,19 -0,10 0,43 1,00 0,02 -0,05 0,06 0,17 -0,26 -0,15 0,27 -0,03
44 0,03 0,03 0,07 0,02 1,00 0,75 0,68 -0,03 -0,14 -0,06 -0,22 -0,03
45 0,05 -0,04 0,00 -0,05 0,75 1,00 0,73 -0,06 -0,06 -0,06 -0,22 -0,04
46 0,12 -0,06 0,11 0,06 0,68 0,73 1,00 0,01 -0,14 -0,10 -0,17 -0,06
47 0,00 0,00 -0,04 0,17 -0,03 -0,06 0,01 1,00 -0,06 -0,09 0,07 0,14
48 -0,04 -0,49 -0,52 -0,26 -0,14 -0,06 -0,14 -0,06 1,00 0,01 -0,34 -0,29
49 -0,15 0,03 -0,03 -0,15 -0,06 -0,06 -0,10 -0,09 0,01 1,00 0,11 0,09
50 0,15 0,09 0,36 0,27 -0,22 -0,22 -0,17 0,07 -0,34 0,11 1,00 0,11
51 -0,20 0,42 0,07 -0,03 -0,03 -0,04 -0,06 0,14 -0,29 0,09 0,11 1,00

295
Apéndice 6. Análisis factorial de los parámetros
Apéndices

Tabla AP6-1. Estructura factorial de la base de datos femenina, todos los casos, sin
rotación, a partir de la matriz de componentes.
1 2 3 4 5 6 7 8 9 10 11
PAR.022 0,88 -0,14 -0,24 0,00 -0,04 -0,13 -0,01 0,01 0,00 0,02 0,04
PAR.021 0,88 -0,18 -0,21 -0,04 -0,12 -0,09 0,03 -0,02 0,00 -0,03 0,06
PAR.045 0,85 -0,04 -0,04 0,18 0,30 0,07 0,02 -0,01 -0,05 -0,10 -0,13
PAR.014 0,85 0,26 -0,01 0,05 -0,06 -0,11 -0,26 0,17 -0,08 0,18 0,14
PAR.044 0,85 -0,08 0,15 0,08 0,28 0,18 -0,04 -0,03 0,03 -0,09 -0,09
PAR.013 0,84 0,27 0,03 0,11 -0,05 -0,12 -0,23 0,17 -0,08 0,18 0,17
PAR.036 -0,83 -0,18 -0,16 -0,19 0,01 0,05 0,01 0,06 -0,11 -0,03 0,13
PAR.023 0,82 -0,17 -0,01 0,15 -0,01 -0,16 -0,22 0,21 -0,09 0,22 0,07
PAR.012 0,82 0,26 0,04 0,09 -0,06 -0,15 -0,23 0,17 -0,18 0,16 0,19
PAR.046 0,81 -0,29 0,18 0,11 0,13 0,13 0,06 0,06 -0,15 0,01 0,04
PAR.011 0,81 0,25 0,11 0,07 -0,20 -0,08 -0,23 0,11 -0,23 0,15 0,11
PAR.019 0,79 -0,29 -0,25 -0,02 -0,18 -0,02 0,25 -0,02 -0,05 -0,03 0,13
PAR.040 0,77 0,29 0,23 0,23 0,22 0,05 0,13 -0,29 -0,06 -0,10 -0,11
PAR.002 0,77 0,21 0,00 0,21 0,31 0,13 -0,01 -0,36 -0,19 -0,10 -0,05
PAR.039 0,73 0,16 -0,11 0,18 0,33 0,15 -0,09 -0,36 -0,21 -0,10 -0,01
PAR.038 0,73 0,31 0,31 0,23 0,17 0,01 0,18 -0,26 -0,02 -0,09 -0,13
PAR.018 0,68 -0,29 -0,16 -0,01 -0,36 0,15 0,37 0,03 -0,09 -0,08 0,19
PAR.027 -0,65 0,08 0,29 0,52 0,24 0,16 -0,18 0,11 0,08 0,07 0,08
PAR.043 0,64 -0,50 0,36 0,05 -0,05 0,07 -0,06 0,06 0,01 0,01 -0,04
PAR.030 -0,63 0,10 0,23 0,57 0,04 0,23 -0,01 0,06 0,02 -0,03 0,24
PAR.028 -0,58 0,13 0,28 0,57 0,25 0,15 -0,23 0,11 0,09 0,07 0,08
PAR.005 0,57 0,41 -0,08 -0,17 0,37 0,30 0,14 0,28 0,08 -0,15 -0,09
PAR.034 -0,51 0,05 0,09 0,17 0,31 0,04 -0,10 0,13 0,08 0,15 -0,19
PAR.003 0,51 0,32 -0,17 -0,23 0,28 0,21 0,07 0,48 0,04 -0,08 0,00
PAR.017 -0,23 0,81 0,03 -0,33 -0,19 0,20 -0,21 -0,02 0,00 -0,13 0,04
PAR.008 0,08 0,78 0,29 -0,05 -0,29 -0,04 -0,14 -0,04 -0,06 0,01 -0,03
PAR.010 0,41 0,71 0,26 0,11 -0,18 -0,27 0,13 0,06 0,10 0,07 0,06
PAR.042 0,47 -0,68 -0,19 0,30 0,22 -0,13 0,20 0,06 0,16 0,02 0,10
PAR.032 0,21 0,60 -0,51 -0,12 0,05 0,17 -0,04 0,03 0,20 -0,22 0,27
PAR.035 0,21 0,49 0,46 0,09 -0,01 -0,37 0,46 0,04 0,34 0,05 0,01
PAR.037 0,21 0,49 0,47 0,09 -0,01 -0,37 0,46 0,04 0,33 0,05 0,01
PAR.047 0,33 0,17 -0,61 0,27 -0,07 0,10 -0,14 -0,06 0,17 0,28 -0,16
PAR.048 0,05 0,18 0,56 -0,16 -0,33 0,14 0,07 0,00 -0,29 -0,17 -0,05
PAR.009 0,49 -0,40 0,54 -0,31 -0,08 0,24 -0,21 -0,01 0,28 0,10 -0,02
PAR.026 0,49 -0,40 0,54 -0,31 -0,08 0,24 -0,21 -0,01 0,28 0,10 -0,02
PAR.024 -0,47 0,38 -0,54 0,32 0,09 -0,24 0,22 0,02 -0,32 -0,08 0,02
PAR.001 -0,10 -0,43 0,48 0,31 -0,05 -0,13 0,20 0,07 -0,36 0,17 -0,27
PAR.051 0,05 0,44 -0,47 0,18 -0,19 0,09 -0,10 -0,05 0,05 0,33 -0,38
PAR.041 0,36 -0,28 -0,46 0,14 0,30 -0,20 -0,01 -0,11 0,41 0,06 0,15
PAR.031 -0,59 0,11 0,24 0,60 0,08 0,22 -0,02 0,05 -0,01 0,00 0,26
PAR.049 0,18 0,17 -0,23 0,22 -0,55 0,48 0,19 -0,02 0,06 0,14 -0,19
PAR.050 0,24 -0,03 -0,26 0,39 -0,39 0,44 0,21 -0,03 0,24 0,07 -0,12
PAR.033 -0,18 0,19 -0,08 -0,33 0,37 -0,39 -0,31 -0,17 0,06 0,08 -0,27
PAR.004 0,30 0,24 0,08 -0,27 0,40 0,32 0,15 0,51 -0,03 -0,04 -0,15
PAR.015 -0,38 -0,13 -0,18 -0,03 0,15 -0,07 0,34 0,45 -0,23 0,17 -0,15
PAR.006 -0,11 0,12 0,03 -0,45 0,31 0,22 0,36 -0,18 -0,14 0,53 0,23
PAR.007 -0,33 0,22 0,10 -0,37 0,29 0,30 0,23 -0,36 -0,10 0,38 0,23

298
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla AP6-2. Estructura factorial de la base de datos femenina, todos los casos,
rotación varimax, a partir de la matriz de componentes rotada.
1 2 3 4 5 6 7 8 9 10 11
PAR.002 0,92 0,16 0,27 0,02 0,05 0,03 0,08 0,08 0,03 0,06 0,05
PAR.039 0,88 0,17 0,28 -0,01 0,10 -0,11 0,13 0,07 0,01 0,06 0,06
PAR.040 0,87 0,13 0,23 0,11 -0,03 0,31 -0,01 0,10 0,06 0,06 0,00
PAR.038 0,81 0,11 0,20 0,13 -0,07 0,42 -0,04 0,10 0,07 0,05 -0,02
PAR.045 0,72 0,24 0,32 0,14 0,27 0,03 -0,06 0,30 0,08 0,05 -0,14
PAR.044 0,69 0,20 0,29 0,38 0,19 0,03 -0,03 0,30 0,09 -0,01 -0,10
PAR.036 -0,58 -0,23 -0,41 -0,25 -0,06 -0,33 0,01 -0,10 -0,07 -0,19 0,17
PAR.046 0,54 0,24 0,39 0,35 0,21 -0,04 -0,24 0,20 0,28 -0,11 -0,05
PAR.015 -0,41 -0,05 -0,14 -0,37 0,12 -0,06 -0,40 0,35 0,00 -0,02 0,11
PAR.028 -0,09 -0,94 -0,09 -0,08 -0,02 0,00 -0,05 -0,06 -0,08 -0,01 -0,05
PAR.027 -0,14 -0,92 -0,16 -0,08 -0,02 -0,02 -0,09 -0,07 -0,07 -0,04 -0,02
PAR.031 -0,10 -0,86 -0,13 -0,19 -0,07 0,02 -0,04 -0,16 0,21 -0,08 0,02
PAR.030 -0,15 -0,85 -0,18 -0,18 -0,09 0,01 -0,02 -0,16 0,23 -0,06 0,00
PAR.019 0,31 0,61 0,31 0,10 0,32 0,00 -0,03 0,03 0,43 0,02 -0,06
PAR.021 0,38 0,59 0,44 0,18 0,28 0,01 0,05 0,05 0,23 0,06 -0,15
PAR.022 0,39 0,54 0,49 0,14 0,32 0,02 0,04 0,09 0,15 0,09 -0,15
PAR.034 -0,19 -0,52 -0,21 -0,09 0,04 -0,03 -0,15 0,11 -0,31 0,08 0,05
PAR.012 0,37 0,23 0,84 0,08 -0,03 0,14 0,08 0,12 0,05 0,03 -0,08
PAR.013 0,37 0,20 0,82 0,13 0,01 0,18 0,12 0,15 0,06 0,09 -0,08
PAR.014 0,35 0,25 0,82 0,15 0,01 0,14 0,13 0,16 0,02 0,12 -0,09
PAR.011 0,37 0,26 0,79 0,15 -0,18 0,12 0,02 0,06 0,11 0,09 -0,09
PAR.023 0,30 0,26 0,74 0,24 0,28 -0,01 -0,15 0,10 0,07 0,05 -0,16
PAR.024 -0,10 -0,17 -0,11 -0,95 0,01 -0,01 0,05 -0,04 -0,04 0,10 0,00
PAR.009 0,12 0,17 0,13 0,95 0,00 0,00 -0,09 0,05 0,05 -0,10 0,02
PAR.026 0,12 0,17 0,13 0,95 0,00 0,00 -0,09 0,05 0,05 -0,10 0,02
PAR.043 0,30 0,21 0,27 0,60 0,18 -0,04 -0,33 0,03 0,22 -0,13 -0,17
PAR.042 0,22 0,18 0,11 0,15 0,81 -0,07 -0,26 0,01 0,26 -0,10 -0,15
PAR.041 0,17 0,18 0,10 0,02 0,80 0,00 0,23 -0,04 -0,07 0,08 -0,06
PAR.017 -0,11 -0,08 -0,01 -0,14 -0,71 0,12 0,57 0,13 -0,17 0,13 0,11
PAR.008 0,10 -0,07 0,26 -0,06 -0,68 0,41 0,25 -0,03 -0,12 0,16 0,00
PAR.048 0,07 0,04 0,01 0,20 -0,68 0,14 -0,18 -0,01 0,19 -0,19 -0,02
PAR.037 0,12 -0,02 0,06 0,02 -0,09 0,97 -0,02 0,07 0,00 -0,06 0,03
PAR.035 0,12 -0,02 0,06 0,01 -0,09 0,97 -0,02 0,07 0,00 -0,06 0,03
PAR.010 0,22 0,05 0,42 -0,09 -0,31 0,72 0,17 0,06 0,00 0,11 -0,04
PAR.001 0,02 -0,16 -0,03 0,09 -0,04 0,03 -0,85 -0,14 0,10 -0,13 -0,06
PAR.032 0,12 0,12 0,12 -0,30 -0,02 0,06 0,79 0,28 0,07 0,17 0,03
PAR.004 0,14 0,05 0,08 0,11 -0,09 0,05 0,01 0,86 -0,03 -0,04 0,11
PAR.003 0,17 0,20 0,28 0,00 0,03 0,07 0,26 0,76 0,04 0,03 0,01
PAR.005 0,42 0,16 0,14 0,04 -0,02 0,15 0,27 0,74 0,03 0,08 0,05
PAR.033 -0,02 0,09 -0,08 -0,09 0,00 0,01 0,10 -0,02 -0,80 -0,02 0,06
PAR.018 0,21 0,56 0,23 0,13 0,17 0,00 -0,06 0,04 0,67 0,02 -0,04
PAR.051 0,03 0,03 0,13 -0,30 -0,08 0,01 0,12 0,02 -0,14 0,79 0,00
PAR.049 0,04 0,08 0,00 0,00 -0,20 0,00 0,05 0,00 0,53 0,68 -0,03
PAR.047 0,16 0,10 0,27 -0,18 0,30 -0,10 0,23 0,02 0,01 0,67 -0,05
PAR.050 0,12 0,00 -0,05 0,07 0,12 0,01 0,06 -0,01 0,57 0,60 -0,13
PAR.006 -0,05 0,08 -0,07 -0,01 -0,01 0,03 -0,02 0,15 -0,05 -0,04 0,92
PAR.007 -0,01 -0,12 -0,24 -0,02 -0,16 -0,01 0,12 -0,01 -0,11 -0,05 0,86

299
Apéndices

Tabla AP6-3. Estructura factorial de la base de datos femenina, casos patológicos,


sin rotación, a partir de la matriz de componentes.
1 2 3 4 5 6 7 8 9 10 11
PAR.021 0,83 -0,25 0,34 -0,06 -0,09 -0,01 -0,02 -0,09 0,02 0,06 0,04
PAR.022 0,81 -0,22 0,36 -0,02 -0,04 -0,15 -0,05 -0,07 0,01 0,18 0,00
PAR.046 0,78 -0,36 -0,06 0,19 0,07 0,10 0,07 0,19 0,15 -0,11 -0,04
PAR.044 0,78 -0,13 -0,10 0,22 0,30 0,11 -0,14 0,04 -0,12 -0,19 -0,01
PAR.013 0,76 0,41 0,05 -0,01 -0,23 -0,28 0,02 0,22 0,06 0,07 0,00
PAR.011 0,76 0,38 0,06 -0,07 -0,32 -0,18 -0,08 0,25 0,10 0,11 -0,03
PAR.014 0,75 0,40 0,06 -0,10 -0,22 -0,30 -0,04 0,23 0,01 0,04 0,06
PAR.023 0,74 -0,23 0,04 0,04 -0,22 -0,38 -0,04 0,26 -0,03 0,09 0,14
PAR.045 0,74 -0,11 0,14 0,29 0,39 -0,05 -0,02 -0,02 -0,09 -0,04 0,06
PAR.012 0,73 0,40 0,06 -0,04 -0,20 -0,30 0,05 0,29 0,07 0,11 -0,02
PAR.036 -0,72 -0,25 0,03 -0,24 0,05 0,01 0,11 0,22 0,09 0,16 -0,19
PAR.040 0,70 0,34 -0,02 0,44 0,29 0,10 -0,18 -0,11 0,03 -0,04 -0,09
PAR.043 0,69 -0,50 -0,21 0,04 -0,14 0,07 -0,07 0,01 0,06 -0,19 0,01
PAR.038 0,68 0,36 -0,08 0,46 0,19 0,11 -0,14 -0,18 0,02 -0,03 -0,06
PAR.019 0,66 -0,43 0,32 0,04 -0,05 0,12 0,22 -0,03 0,14 0,18 -0,17
PAR.027 -0,66 0,01 -0,19 0,54 -0,08 -0,06 -0,16 0,23 -0,16 0,06 0,10
PAR.030 -0,63 0,03 0,00 0,58 -0,19 0,23 0,05 0,20 -0,04 0,05 -0,10
PAR.002 0,63 0,26 0,15 0,33 0,52 0,09 -0,27 0,09 0,05 -0,02 -0,15
PAR.048 0,59 0,29 -0,17 -0,05 -0,28 0,20 0,07 0,12 -0,10 0,46 0,07
PAR.018 0,58 -0,37 0,31 0,04 -0,22 0,40 0,29 -0,01 0,17 -0,06 -0,14
PAR.034 -0,56 -0,04 -0,23 0,23 0,09 -0,23 -0,13 0,09 -0,09 0,20 -0,05
PAR.005 0,47 0,46 0,02 0,03 0,42 0,25 0,27 0,01 -0,27 -0,06 0,16
PAR.017 -0,16 0,87 -0,01 -0,34 -0,07 0,16 -0,12 0,05 -0,06 -0,13 -0,06
PAR.008 0,13 0,85 -0,11 -0,05 -0,26 -0,02 -0,10 -0,10 0,14 -0,16 -0,01
PAR.042 0,23 -0,82 0,13 0,29 0,14 -0,08 0,23 -0,14 0,03 0,09 -0,01
PAR.010 0,28 0,76 -0,14 0,20 -0,28 -0,11 0,15 -0,24 0,09 -0,01 -0,05
PAR.032 -0,17 0,65 0,45 -0,22 0,20 0,21 0,18 -0,01 -0,12 -0,09 -0,19
PAR.001 0,33 -0,51 -0,24 0,45 -0,19 -0,27 -0,03 0,01 0,22 -0,05 0,29
PAR.035 0,19 0,50 -0,39 0,39 -0,19 -0,05 0,28 -0,48 0,05 0,06 -0,01
PAR.037 0,20 0,50 -0,39 0,40 -0,20 -0,05 0,28 -0,48 0,05 0,06 -0,01
PAR.047 -0,12 0,07 0,72 0,01 0,01 -0,02 -0,29 -0,22 0,10 0,03 0,36
PAR.024 -0,51 0,33 0,56 0,29 0,15 -0,28 0,23 0,08 0,17 0,03 -0,06
PAR.009 0,54 -0,34 -0,56 -0,26 -0,15 0,28 -0,22 -0,05 -0,12 -0,06 0,07
PAR.026 0,54 -0,34 -0,56 -0,26 -0,15 0,28 -0,22 -0,05 -0,12 -0,06 0,07
PAR.051 -0,25 0,40 0,51 0,01 -0,09 -0,02 -0,27 -0,08 0,11 -0,27 0,42
PAR.050 0,02 -0,08 0,50 0,21 -0,33 0,49 -0,09 -0,07 -0,19 0,32 0,20
PAR.031 -0,59 0,05 -0,02 0,62 -0,14 0,18 0,05 0,24 -0,02 0,08 -0,10
PAR.028 -0,59 0,06 -0,14 0,60 -0,12 -0,07 -0,23 0,21 -0,18 0,08 0,08
PAR.039 0,53 0,19 0,21 0,23 0,59 0,07 -0,28 0,19 0,04 -0,03 -0,20
PAR.049 -0,05 0,16 0,43 0,07 -0,46 0,55 -0,16 0,04 0,02 0,00 0,09
PAR.033 -0,16 0,25 -0,20 -0,29 0,40 -0,53 -0,20 -0,11 -0,07 0,22 0,07
PAR.015 -0,25 -0,19 0,09 0,15 0,01 -0,18 0,50 0,22 0,17 -0,46 0,22
PAR.003 0,41 0,37 0,10 -0,19 0,18 0,06 0,48 0,21 -0,27 0,18 0,13
PAR.041 -0,12 -0,40 0,25 -0,01 0,41 -0,18 0,10 -0,42 -0,14 0,28 0,19
PAR.006 -0,15 0,19 -0,39 -0,10 0,38 0,29 0,07 0,14 0,58 0,23 0,21
PAR.007 -0,25 0,27 -0,33 -0,11 0,43 0,38 -0,02 0,14 0,45 0,24 0,22
PAR.004 0,29 0,22 -0,29 0,06 0,28 0,15 0,35 0,28 -0,35 -0,11 0,38

300
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla AP6-4. Estructura factorial de la base de datos femenina, casos patológicos,


rotación varimax, a partir de la matriz de componentes rotada.
1 2 3 4 5 6 7 8 9 10 11
PAR.002 0,95 0,20 -0,02 0,10 -0,05 0,01 -0,01 0,07 0,08 0,00 0,09
PAR.039 0,91 0,16 -0,04 0,12 -0,11 -0,18 -0,05 0,05 0,09 -0,03 0,07
PAR.040 0,86 0,23 0,00 0,07 0,09 0,36 0,06 0,08 0,02 0,02 0,08
PAR.038 0,78 0,23 0,01 0,05 0,12 0,47 0,08 0,08 0,01 0,02 0,07
PAR.044 0,73 0,16 0,22 0,20 0,39 0,01 0,05 0,18 -0,10 -0,07 -0,07
PAR.045 0,72 0,19 0,38 0,24 0,08 0,03 0,00 0,22 -0,12 0,04 -0,01
PAR.036 -0,50 -0,33 -0,04 -0,19 -0,28 -0,42 -0,06 -0,15 0,18 -0,24 0,03
PAR.046 0,49 0,32 0,45 0,26 0,34 -0,05 0,26 0,05 0,02 -0,21 -0,21
PAR.011 0,24 0,88 -0,13 0,24 0,11 0,15 0,10 0,02 -0,06 -0,01 0,06
PAR.012 0,25 0,87 -0,07 0,23 -0,01 0,16 -0,01 0,13 -0,06 -0,06 0,00
PAR.013 0,28 0,86 -0,08 0,24 0,04 0,22 0,00 0,11 -0,09 -0,02 -0,01
PAR.014 0,25 0,85 -0,12 0,27 0,09 0,15 -0,05 0,13 -0,12 0,05 0,00
PAR.023 0,17 0,72 0,43 0,18 0,25 -0,08 -0,02 0,05 -0,22 0,02 -0,04
PAR.048 0,07 0,57 -0,04 0,11 0,27 0,26 0,23 0,29 0,14 -0,12 0,41
PAR.017 -0,04 0,12 -0,93 0,04 -0,12 0,16 -0,06 0,12 0,11 0,11 0,07
PAR.042 0,11 -0,19 0,88 0,13 0,03 -0,13 0,14 -0,04 -0,16 -0,14 -0,06
PAR.001 0,08 0,23 0,72 -0,18 0,34 0,15 0,00 -0,17 -0,01 0,10 -0,29
PAR.008 0,07 0,35 -0,67 0,03 -0,04 0,51 -0,03 -0,05 0,08 0,16 -0,07
PAR.032 0,10 -0,11 -0,65 0,20 -0,55 0,01 0,12 0,25 -0,03 0,04 0,09
PAR.041 -0,02 -0,41 0,53 0,21 -0,23 -0,08 -0,27 0,12 -0,07 0,20 0,28
PAR.019 0,25 0,24 0,53 0,47 0,01 -0,08 0,43 -0,03 -0,09 -0,18 0,12
PAR.028 -0,07 -0,13 0,00 -0,92 -0,12 0,03 -0,06 -0,08 -0,05 0,10 0,01
PAR.027 -0,15 -0,20 0,02 -0,90 -0,11 -0,01 -0,08 -0,04 0,01 0,05 -0,05
PAR.031 -0,09 -0,20 0,00 -0,79 -0,29 0,06 0,27 -0,06 0,07 -0,11 -0,05
PAR.030 -0,14 -0,26 -0,03 -0,78 -0,26 0,05 0,32 -0,08 0,03 -0,08 -0,05
PAR.034 -0,18 -0,19 0,05 -0,56 -0,14 -0,05 -0,34 -0,11 0,05 -0,09 0,10
PAR.021 0,33 0,40 0,37 0,54 0,16 -0,05 0,27 0,02 -0,22 0,12 0,12
PAR.022 0,36 0,47 0,42 0,49 0,06 -0,05 0,15 -0,02 -0,23 0,09 0,20
PAR.009 0,07 0,08 0,10 0,24 0,92 0,00 0,05 0,04 0,02 -0,15 0,08
PAR.026 0,07 0,08 0,10 0,24 0,92 0,00 0,05 0,04 0,02 -0,15 0,08
PAR.024 -0,04 -0,06 -0,08 -0,23 -0,92 0,00 -0,03 -0,05 -0,01 0,16 -0,14
PAR.043 0,26 0,22 0,42 0,27 0,60 -0,02 0,20 -0,09 -0,13 -0,12 -0,17
PAR.037 0,08 0,08 -0,05 -0,07 0,02 0,96 -0,03 0,08 0,03 -0,08 0,03
PAR.035 0,08 0,08 -0,05 -0,07 0,01 0,96 -0,03 0,08 0,03 -0,08 0,03
PAR.010 0,12 0,39 -0,36 0,02 -0,13 0,77 0,01 0,05 -0,01 0,02 0,00
PAR.033 -0,03 0,02 -0,13 0,05 -0,12 -0,02 -0,81 0,01 0,10 0,06 0,21
PAR.049 -0,07 0,05 -0,28 -0,09 -0,03 -0,04 0,72 -0,07 -0,03 0,34 0,16
PAR.018 0,17 0,13 0,34 0,44 0,11 -0,03 0,71 0,01 -0,08 -0,15 -0,07
PAR.050 -0,03 -0,02 0,11 -0,12 -0,07 -0,05 0,67 0,10 -0,12 0,37 0,44
PAR.004 0,19 0,10 -0,05 -0,06 0,20 0,08 -0,07 0,80 0,11 -0,06 -0,19
PAR.003 0,10 0,32 -0,11 0,29 -0,17 0,06 0,04 0,71 0,04 -0,14 0,10
PAR.005 0,48 0,07 -0,21 0,23 -0,04 0,20 0,03 0,68 0,07 0,01 0,02
PAR.006 0,01 -0,09 -0,07 -0,01 0,02 0,05 -0,11 0,05 0,93 -0,08 -0,04
PAR.007 0,04 -0,19 -0,21 -0,09 0,00 -0,01 -0,09 0,11 0,90 0,00 0,05
PAR.051 -0,01 0,01 -0,34 -0,05 -0,30 -0,01 0,07 -0,07 -0,03 0,77 -0,15
PAR.047 0,05 -0,05 0,02 0,12 -0,37 -0,14 0,13 -0,14 -0,07 0,76 0,14
PAR.015 -0,22 -0,09 0,22 -0,08 -0,26 -0,06 0,06 0,17 -0,01 0,01 -0,73

301
Apéndices

Tabla AP6-5. Estructura factorial de la base de datos femenina, casos


normofónicos, sin rotación, a partir de la matriz de componentes.
1 2 3 4 5 7 8 9 10
PAR.045 0,73 0,23 0,30 0,14 0,37 -0,24 -0,25 -0,09 0,01 -0,03
PAR.003 0,70 0,35 0,20 0,14 0,36 -0,31 -0,13 -0,03 -0,10 0,00
PAR.044 0,69 0,37 0,25 0,18 0,31 -0,31 -0,23 -0,03 -0,09 -0,04
PAR.031 -0,69 0,38 0,29 -0,23 0,20 -0,03 0,01 -0,23 0,12 -0,06
PAR.005 0,67 0,42 0,22 0,22 0,35 -0,28 -0,18 -0,03 0,01 -0,04
PAR.030 -0,67 0,39 0,28 -0,23 0,20 -0,03 -0,01 -0,24 0,12 -0,05
PAR.046 0,64 0,03 0,45 0,18 0,31 -0,25 -0,03 -0,14 0,02 0,09
PAR.022 0,63 -0,56 0,02 0,13 -0,03 0,03 -0,27 0,26 -0,01 0,18
PAR.004 0,63 0,44 0,08 0,24 0,43 -0,12 -0,15 0,05 0,07 -0,12
PAR.015 0,60 0,21 -0,25 -0,11 0,20 0,03 0,50 0,20 0,17 0,06
PAR.027 -0,59 0,46 0,36 -0,36 0,17 -0,17 -0,08 0,19 0,16 0,15
PAR.032 0,55 0,36 0,03 -0,10 -0,37 -0,11 -0,16 -0,24 0,22 -0,13
PAR.028 -0,53 0,45 0,46 -0,34 0,14 -0,16 -0,09 0,20 0,17 0,12
PAR.006 0,50 -0,06 -0,23 0,13 0,21 -0,07 0,45 0,27 0,39 -0,15
PAR.047 0,44 0,32 0,11 -0,20 0,01 0,13 0,40 -0,28 -0,01 0,13
PAR.017 0,10 0,68 0,14 0,42 -0,40 0,13 -0,18 -0,12 0,18 -0,11
PAR.043 -0,40 -0,65 0,09 -0,19 0,28 -0,12 -0,31 -0,12 -0,05 -0,05
PAR.021 0,57 -0,63 -0,05 0,17 -0,11 0,06 -0,31 0,11 0,01 0,09
PAR.036 0,19 0,60 -0,40 -0,07 0,05 0,16 -0,10 0,36 -0,11 0,19
PAR.038 -0,08 -0,57 0,57 0,28 0,02 -0,19 0,10 -0,09 0,10 0,02
PAR.019 0,41 -0,53 -0,49 0,27 0,07 0,11 -0,06 -0,30 0,09 -0,05
PAR.034 -0,14 0,47 0,07 -0,19 0,15 -0,20 0,15 0,37 0,20 0,18
PAR.010 -0,21 0,42 0,12 0,38 -0,06 0,24 0,22 -0,33 -0,34 0,21
PAR.040 -0,12 -0,57 0,64 0,29 -0,07 -0,23 0,30 -0,03 0,09 0,03
PAR.039 -0,09 -0,48 0,64 0,30 -0,12 -0,23 0,35 0,04 0,08 0,07
PAR.002 -0,11 -0,53 0,62 0,28 -0,15 -0,24 0,34 0,04 0,06 0,07
PAR.049 -0,04 0,29 -0,59 0,23 0,23 0,00 0,36 -0,22 -0,05 0,18
PAR.018 0,24 -0,44 -0,58 0,33 0,11 0,20 -0,13 -0,26 0,28 0,23
PAR.050 -0,21 0,05 -0,44 0,16 0,35 -0,33 0,42 -0,19 0,21 -0,15
PAR.048 -0,46 0,05 0,01 0,65 -0,15 0,24 -0,19 0,22 0,19 -0,10
PAR.042 0,21 -0,60 -0,14 -0,61 0,23 -0,25 0,02 -0,10 -0,07 0,04
PAR.041 0,33 -0,43 -0,04 -0,59 -0,11 -0,18 -0,21 0,21 -0,13 0,16
PAR.008 -0,32 0,50 0,17 0,58 -0,25 0,28 -0,22 0,01 -0,05 0,01
PAR.035 0,59 0,13 0,16 -0,18 -0,69 -0,16 0,09 -0,08 0,11 0,12
PAR.037 -0,58 -0,25 -0,08 0,24 0,67 0,09 -0,06 0,06 -0,13 -0,07
PAR.001 -0,59 -0,23 -0,10 0,24 0,67 0,11 -0,08 0,07 -0,13 -0,07
PAR.012 0,28 -0,16 0,50 -0,15 0,17 0,69 -0,03 0,05 0,06 -0,07
PAR.013 0,38 0,14 0,31 -0,39 0,13 0,68 0,11 -0,09 0,07 -0,03
PAR.014 0,49 0,09 0,35 -0,22 0,13 0,67 0,15 -0,04 0,07 -0,09
PAR.011 0,07 -0,18 0,51 0,44 0,21 0,55 -0,03 0,14 -0,04 0,22
PAR.023 0,38 -0,26 0,15 -0,44 0,30 0,53 0,20 -0,05 -0,06 -0,08
PAR.007 0,12 -0,08 -0,25 0,30 -0,05 0,11 0,21 0,45 0,12 -0,34
PAR.033 0,25 0,02 0,23 -0,08 -0,24 -0,15 0,22 0,07 -0,57 -0,55
PAR.051 0,20 0,29 -0,05 0,31 0,02 -0,09 0,41 0,18 -0,53 0,29

302
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla AP6-6. Estructura factorial de la base de datos femenina, casos


normofónicos, rotación varimax, a partir de la matriz de componentes
rotada.
1 2 3 4 5 6 7 8 9 10
PAR.044 0,96 0,03 -0,08 0,02 -0,15 0,01 -0,07 0,00 0,07 -0,09
PAR.005 0,96 0,00 -0,08 0,07 -0,14 0,03 0,01 0,07 0,05 -0,01
PAR.045 0,96 0,10 0,02 -0,05 -0,12 0,13 -0,06 -0,01 -0,04 0,00
PAR.003 0,94 0,03 -0,08 -0,06 -0,13 0,04 0,00 0,04 0,14 -0,06
PAR.004 0,88 0,04 -0,21 0,13 -0,02 0,11 0,05 0,22 0,01 0,00
PAR.046 0,81 0,10 0,32 -0,10 -0,13 0,17 -0,01 -0,03 0,08 0,05
PAR.028 -0,01 -0,95 0,03 0,05 0,08 -0,02 -0,10 -0,12 -0,10 0,11
PAR.027 -0,06 -0,94 -0,04 0,02 0,13 -0,07 -0,06 -0,12 -0,07 0,15
PAR.019 0,04 0,88 -0,02 -0,15 0,08 -0,01 0,17 0,06 -0,14 0,17
PAR.018 -0,05 0,78 -0,10 -0,03 0,13 -0,05 0,15 0,05 -0,10 0,53
PAR.031 -0,15 -0,74 0,01 0,15 0,22 0,01 0,32 -0,30 -0,19 0,03
PAR.030 -0,14 -0,72 -0,01 0,15 0,21 0,01 0,31 -0,32 -0,20 0,04
PAR.021 0,17 0,72 0,19 -0,21 -0,08 0,06 -0,47 0,06 -0,11 0,11
PAR.034 0,11 -0,63 -0,15 -0,02 -0,06 -0,10 -0,02 0,29 0,15 0,18
PAR.022 0,26 0,61 0,18 -0,26 -0,07 0,10 -0,55 0,15 0,00 0,15
PAR.040 -0,03 0,01 0,99 -0,03 0,06 0,00 -0,05 0,01 0,00 -0,04
PAR.002 -0,07 -0,01 0,97 -0,01 -0,01 -0,03 -0,09 0,05 0,08 -0,04
PAR.039 -0,04 -0,03 0,96 0,02 -0,01 -0,01 -0,06 0,06 0,09 -0,03
PAR.038 0,04 0,09 0,86 -0,03 0,14 0,00 -0,08 -0,09 -0,11 0,03
PAR.036 0,14 -0,13 -0,72 0,14 -0,09 0,00 -0,15 0,22 0,33 0,10
PAR.042 -0,03 0,19 0,07 -0,92 0,06 0,04 -0,01 -0,08 -0,14 0,00
PAR.008 -0,03 -0,15 -0,07 0,92 0,03 -0,06 -0,10 -0,16 0,09 0,00
PAR.017 0,22 -0,10 -0,17 0,80 -0,44 -0,03 0,04 -0,04 -0,07 -0,02
PAR.048 -0,24 0,03 0,11 0,77 0,29 -0,19 -0,16 0,14 -0,13 0,12
PAR.041 -0,03 0,13 -0,05 -0,73 -0,21 0,01 -0,46 -0,05 -0,06 -0,03
PAR.010 -0,03 -0,08 0,00 0,53 0,03 0,10 0,30 -0,34 0,49 -0,05
PAR.001 -0,11 -0,07 0,04 0,05 0,96 -0,07 0,11 -0,04 -0,03 0,07
PAR.037 -0,10 -0,06 0,08 0,04 0,95 -0,06 0,11 -0,04 -0,03 0,07
PAR.035 0,11 0,11 0,09 -0,07 -0,94 0,03 -0,14 0,01 0,07 -0,06
PAR.032 0,36 0,08 -0,19 0,09 -0,70 0,04 0,05 -0,04 -0,23 -0,05
PAR.043 -0,20 0,05 0,28 -0,39 0,52 -0,11 -0,14 -0,33 -0,37 0,04
PAR.047 0,24 -0,05 -0,07 -0,10 -0,42 0,41 0,35 -0,01 0,29 0,01
PAR.014 0,17 0,05 -0,04 0,03 -0,17 0,92 -0,02 0,09 0,00 -0,04
PAR.013 0,09 -0,07 -0,15 -0,06 -0,17 0,92 -0,01 -0,01 -0,02 0,00
PAR.012 0,08 0,04 0,16 0,04 0,06 0,89 -0,24 -0,01 -0,11 0,00
PAR.023 0,02 0,14 -0,03 -0,41 0,06 0,81 0,01 0,06 0,00 -0,07
PAR.011 0,12 0,13 0,39 0,40 0,32 0,54 -0,30 -0,03 0,20 0,19
PAR.050 -0,01 0,00 -0,02 -0,10 0,25 -0,36 0,69 0,30 0,00 0,09
PAR.049 -0,01 0,16 -0,35 0,09 0,13 -0,18 0,58 0,12 0,40 0,20
PAR.006 0,25 0,23 0,04 -0,15 -0,10 0,09 0,23 0,77 0,03 0,11
PAR.007 -0,09 0,24 -0,03 0,19 0,09 -0,04 -0,07 0,65 -0,02 -0,17
PAR.015 0,29 0,09 -0,21 -0,25 -0,25 0,25 0,25 0,59 0,31 0,11
PAR.051 0,19 0,04 -0,03 0,12 -0,02 -0,09 0,05 0,10 0,83 -0,17
PAR.033 0,11 0,04 0,11 -0,08 -0,19 0,04 -0,05 0,03 0,13 -0,89

303
Apéndices

Tabla AP6-7. Estructura factorial de la base de datos masculina, todos los casos, sin
rotación, a partir de la matriz de componentes.
1 2 3 4 5 6 7 8 9 10 11
PAR.039 0,85 0,19 -0,30 0,13 0,00 0,00 -0,06 0,00 -0,15 -0,20 -0,08
PAR.002 0,84 0,23 -0,34 0,16 -0,07 0,00 -0,04 -0,01 -0,08 -0,21 -0,03
PAR.036 -0,84 -0,24 0,26 -0,19 0,03 0,07 0,04 0,02 0,08 0,18 0,10
PAR.019 0,83 -0,13 0,25 0,01 -0,04 0,04 -0,17 0,16 0,09 0,04 -0,05
PAR.022 0,81 -0,13 0,28 -0,14 -0,15 0,07 0,03 0,03 -0,08 -0,17 0,01
PAR.040 0,78 0,29 -0,42 0,12 -0,24 0,04 -0,02 -0,05 -0,04 -0,11 -0,05
PAR.011 0,77 0,32 0,09 -0,24 0,03 -0,25 -0,11 0,08 -0,20 0,02 0,07
PAR.013 0,76 0,40 0,22 0,00 0,16 -0,32 0,13 0,01 -0,15 -0,02 0,07
PAR.023 0,76 0,12 0,33 0,19 0,20 -0,31 0,05 0,01 -0,05 -0,06 -0,04
PAR.012 0,75 0,41 0,17 -0,08 0,12 -0,32 0,02 0,01 -0,17 -0,01 0,05
PAR.021 0,74 -0,13 0,34 -0,10 -0,21 0,20 -0,11 0,14 -0,12 -0,26 0,08
PAR.014 0,74 0,33 0,30 0,03 0,14 -0,30 0,14 0,12 -0,13 -0,02 0,01
PAR.045 0,73 0,36 0,14 0,08 0,07 0,31 -0,03 -0,22 0,14 0,14 -0,03
PAR.018 0,71 -0,16 0,24 -0,08 -0,08 0,09 -0,47 0,29 0,15 0,10 -0,09
PAR.046 0,71 0,05 -0,09 -0,10 0,33 0,40 -0,16 -0,20 -0,07 0,16 0,11
PAR.038 0,71 0,32 -0,45 0,13 -0,33 0,07 0,01 -0,07 0,03 -0,07 -0,02
PAR.015 -0,67 0,25 0,43 -0,10 0,12 -0,15 0,01 0,13 0,12 0,00 -0,08
PAR.042 0,65 -0,27 0,13 0,45 0,38 0,13 -0,05 -0,06 0,08 -0,08 0,03
PAR.044 0,64 0,20 -0,03 -0,14 0,33 0,47 0,01 -0,08 -0,01 0,17 -0,04
PAR.017 -0,63 0,38 -0,13 -0,50 -0,20 0,07 0,15 0,23 -0,03 -0,02 0,06
PAR.026 0,63 -0,46 -0,31 -0,20 0,22 -0,04 0,31 0,23 0,03 0,11 0,05
PAR.009 0,63 -0,46 -0,31 -0,20 0,22 -0,04 0,31 0,23 0,03 0,11 0,05
PAR.024 -0,62 0,45 0,30 0,20 -0,20 0,06 -0,33 -0,25 -0,04 -0,10 -0,01
PAR.027 -0,52 0,40 -0,34 0,18 0,39 -0,08 -0,13 0,00 0,00 -0,06 -0,01
PAR.028 -0,52 0,49 -0,34 0,25 0,44 -0,05 -0,03 -0,05 -0,04 -0,10 0,04
PAR.032 -0,49 0,45 0,09 -0,15 0,09 0,40 0,14 0,26 0,06 -0,28 0,11
PAR.043 0,47 -0,36 -0,14 -0,07 0,35 0,20 0,00 -0,14 -0,04 0,19 0,37
PAR.005 0,34 0,60 0,27 -0,33 0,26 0,22 0,22 -0,12 0,25 -0,03 -0,08
PAR.031 -0,44 0,52 -0,28 0,36 0,42 -0,02 -0,17 0,11 -0,05 0,10 0,13
PAR.010 0,11 0,50 -0,07 -0,29 0,02 -0,33 0,19 0,02 -0,25 0,07 0,13
PAR.051 -0,42 0,49 0,38 0,33 -0,28 0,08 0,08 0,06 -0,21 0,16 -0,05
PAR.030 -0,45 0,49 -0,30 0,36 0,42 -0,02 -0,19 0,12 -0,02 0,07 0,11
PAR.003 0,30 0,48 0,45 -0,35 0,21 0,07 0,15 -0,09 0,32 -0,05 -0,03
PAR.004 0,37 0,43 0,39 -0,32 0,16 -0,06 0,03 -0,18 0,26 0,06 -0,04
PAR.035 0,29 0,45 -0,48 0,05 -0,42 0,32 0,17 -0,01 0,23 -0,03 0,11
PAR.008 -0,32 0,46 -0,06 -0,56 -0,23 0,06 -0,11 0,02 -0,21 0,13 0,08
PAR.050 0,43 0,10 -0,06 0,56 -0,03 -0,04 0,27 0,44 0,07 0,02 -0,20
PAR.047 -0,05 0,32 0,42 0,46 -0,37 0,18 0,26 0,08 -0,12 0,17 0,10
PAR.048 0,31 0,08 -0,41 -0,42 -0,15 -0,21 -0,21 -0,08 0,00 0,07 0,28
PAR.037 0,45 0,33 -0,34 0,21 -0,53 0,05 0,08 -0,21 0,33 0,11 0,08
PAR.041 0,11 -0,15 0,35 0,40 0,14 0,49 0,28 -0,12 -0,29 0,17 0,03
PAR.001 0,43 -0,13 0,18 0,29 -0,21 -0,47 -0,17 -0,37 0,13 0,18 -0,06
PAR.034 -0,16 0,01 -0,26 -0,03 0,24 -0,34 0,20 -0,30 0,26 0,18 -0,29
PAR.033 -0,30 -0,11 -0,07 0,03 -0,10 -0,12 0,74 -0,37 -0,17 -0,09 0,08
PAR.006 -0,12 -0,07 0,19 0,28 0,07 -0,20 0,16 0,18 0,49 -0,41 0,42
PAR.049 0,16 0,31 -0,11 0,10 -0,17 -0,10 0,09 0,48 0,19 0,56 -0,04
PAR.007 -0,08 0,07 -0,30 -0,25 0,15 0,18 0,10 0,08 -0,06 -0,21 -0,59

304
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla AP6-8. Estructura factorial de la base de datos masculina, todos los casos,
rotación varimax, a partir de la matriz de componentes rotada.
1 2 3 4 5 6 7 8 9 10 11
PAR.013 0,87 0,22 -0,09 0,10 0,07 0,32 0,01 -0,06 0,08 0,01 0,09
PAR.012 0,85 0,24 -0,10 0,10 -0,02 0,28 0,10 -0,07 0,04 0,06 0,08
PAR.014 0,85 0,14 -0,16 0,08 0,14 0,28 0,06 -0,02 0,15 -0,03 0,04
PAR.011 0,77 0,27 -0,20 0,18 -0,17 0,22 0,23 0,00 0,02 0,14 0,07
PAR.023 0,77 0,11 -0,20 0,10 0,35 0,21 0,12 -0,16 0,04 -0,08 0,06
PAR.010 0,49 0,06 0,17 -0,01 -0,46 0,14 -0,24 0,03 0,10 0,09 0,02
PAR.038 0,29 0,91 -0,10 0,11 -0,02 0,03 0,07 -0,04 0,08 0,07 -0,04
PAR.040 0,39 0,86 -0,10 0,17 0,04 0,03 0,12 -0,03 0,02 0,09 -0,07
PAR.037 -0,02 0,86 -0,12 -0,10 -0,06 0,13 -0,05 -0,22 0,23 -0,07 0,18
PAR.035 -0,13 0,85 0,04 -0,02 -0,17 0,18 -0,09 0,17 0,21 -0,05 0,00
PAR.002 0,51 0,76 -0,07 0,24 0,15 0,02 0,16 0,01 -0,06 0,04 -0,09
PAR.039 0,55 0,68 -0,08 0,27 0,18 0,02 0,17 0,01 -0,09 0,10 -0,12
PAR.036 -0,57 -0,68 0,07 -0,20 -0,19 -0,05 -0,16 0,07 0,03 -0,04 0,12
PAR.015 -0,12 -0,60 0,24 -0,46 -0,19 0,18 -0,05 0,03 0,11 -0,20 -0,09
PAR.031 -0,01 -0,03 0,92 -0,19 0,00 -0,03 0,05 0,10 0,10 0,01 0,06
PAR.030 -0,04 -0,03 0,92 -0,17 0,01 -0,05 0,07 0,08 0,09 -0,02 0,04
PAR.028 -0,06 -0,03 0,91 -0,17 -0,05 0,01 -0,14 0,05 -0,08 -0,05 -0,11
PAR.027 -0,11 -0,07 0,83 -0,14 -0,11 -0,04 -0,03 0,00 -0,07 -0,04 -0,13
PAR.021 0,40 0,25 -0,64 0,09 0,20 0,11 0,31 0,30 -0,14 -0,01 0,06
PAR.022 0,46 0,25 -0,63 0,20 0,18 0,18 0,17 0,12 -0,10 0,02 0,03
PAR.019 0,41 0,23 -0,48 0,24 0,28 0,17 0,44 -0,03 0,10 0,02 0,07
PAR.026 0,19 0,13 -0,29 0,88 0,12 -0,04 -0,03 0,00 0,16 0,02 -0,07
PAR.009 0,19 0,13 -0,29 0,88 0,12 -0,04 -0,03 0,00 0,16 0,02 -0,07
PAR.024 -0,20 -0,13 0,30 -0,86 -0,11 0,05 0,04 0,01 -0,19 0,00 0,10
PAR.051 0,02 -0,11 0,16 -0,78 0,04 0,01 -0,18 0,19 0,30 0,12 0,10
PAR.043 0,04 0,09 -0,08 0,67 0,24 0,10 0,06 0,05 -0,16 0,19 0,38
PAR.047 0,09 0,10 -0,10 -0,59 0,28 0,04 -0,23 0,24 0,40 0,02 0,26
PAR.046 0,21 0,35 -0,05 0,44 0,25 0,39 0,26 0,11 -0,18 0,41 0,18
PAR.042 0,28 0,16 -0,08 0,34 0,76 0,09 0,22 -0,06 -0,12 -0,05 0,13
PAR.008 -0,05 -0,04 0,09 -0,26 -0,74 0,15 -0,02 0,22 0,01 0,27 0,00
PAR.017 -0,28 -0,17 0,20 -0,23 -0,72 0,08 -0,20 0,34 0,15 -0,03 -0,18
PAR.041 -0,03 -0,08 -0,12 -0,08 0,67 0,08 -0,24 0,31 0,06 0,34 0,21
PAR.048 0,15 0,34 -0,05 0,34 -0,55 -0,03 0,14 -0,13 -0,12 0,06 0,19
PAR.005 0,27 0,13 0,03 -0,03 -0,05 0,88 -0,03 0,12 0,03 0,03 -0,12
PAR.003 0,29 -0,04 -0,10 -0,08 -0,08 0,84 0,04 0,04 0,01 -0,11 -0,04
PAR.004 0,34 0,01 -0,12 -0,06 -0,10 0,73 0,09 -0,14 -0,01 -0,01 0,04
PAR.045 0,30 0,49 -0,12 0,03 0,30 0,58 0,19 -0,02 0,04 0,23 0,14
PAR.044 0,20 0,31 -0,03 0,36 0,23 0,54 0,19 0,19 0,00 0,40 0,01
PAR.033 -0,10 -0,06 -0,04 -0,01 0,01 -0,08 -0,90 -0,04 -0,08 -0,05 0,00
PAR.018 0,27 0,15 -0,47 0,19 0,15 0,12 0,74 -0,02 0,11 0,05 0,06
PAR.001 0,30 0,17 -0,29 -0,11 0,21 -0,07 0,10 -0,67 -0,01 -0,03 0,28
PAR.032 -0,23 -0,12 0,33 -0,29 -0,20 0,29 -0,09 0,61 0,01 -0,18 -0,18
PAR.034 -0,10 -0,07 0,27 0,16 -0,06 0,12 -0,27 -0,58 0,05 0,00 -0,21
PAR.049 0,10 0,18 0,09 0,02 -0,14 0,06 0,16 -0,05 0,81 0,04 0,07
PAR.050 0,32 0,33 0,01 0,05 0,48 -0,13 0,03 0,05 0,54 -0,19 -0,19
PAR.006 -0,03 -0,09 0,08 -0,01 0,17 0,03 -0,05 0,08 -0,01 -0,85 0,21
PAR.007 -0,11 0,06 0,10 0,11 -0,08 0,08 -0,03 0,06 -0,06 0,18 -0,73

305
Apéndices

Tabla AP6-9. Estructura factorial de la base de datos masculina, casos patológicos,


sin rotación, a partir de la matriz de componentes.
1 2 3 4 5 6 7 8 9 10 11
PAR.019 0,82 -0,13 0,25 -0,01 0,03 0,05 -0,17 0,11 0,12 -0,05 -0,12
PAR.039 0,78 0,38 -0,21 -0,08 0,06 -0,19 0,01 0,08 -0,26 0,00 -0,03
PAR.002 0,78 0,44 -0,20 -0,15 0,05 -0,17 0,05 0,07 -0,23 -0,05 0,00
PAR.022 0,77 -0,20 0,18 -0,07 -0,02 0,27 0,05 0,00 -0,31 -0,04 0,05
PAR.036 -0,75 -0,44 0,14 0,12 -0,01 0,27 -0,06 -0,04 0,19 0,05 0,15
PAR.018 0,75 -0,14 0,22 -0,03 0,04 0,11 -0,46 0,19 0,19 -0,12 -0,14
PAR.040 0,73 0,48 -0,29 -0,31 0,01 -0,08 0,06 0,00 -0,12 0,00 -0,02
PAR.021 0,70 -0,23 0,24 -0,21 0,04 0,30 -0,14 0,05 -0,32 -0,14 0,18
PAR.017 -0,70 0,30 -0,39 -0,03 -0,31 0,32 -0,07 0,16 -0,02 0,05 0,07
PAR.015 -0,69 0,18 0,43 0,22 -0,13 0,14 0,00 0,12 0,08 -0,02 -0,08
PAR.038 0,66 0,50 -0,31 -0,40 0,01 -0,03 0,11 -0,03 -0,05 -0,01 -0,01
PAR.032 -0,65 0,36 0,05 0,08 0,14 0,37 0,11 0,23 -0,28 -0,12 0,02
PAR.009 0,64 -0,36 -0,36 0,34 -0,17 0,02 0,21 0,18 0,20 0,08 0,14
PAR.026 0,64 -0,36 -0,36 0,34 -0,17 0,02 0,21 0,18 0,20 0,08 0,14
PAR.011 0,64 0,50 0,09 0,19 -0,28 0,07 -0,26 0,02 -0,05 0,16 0,05
PAR.042 0,64 -0,23 0,38 0,20 0,42 -0,25 0,15 0,00 0,00 -0,08 -0,03
PAR.024 -0,63 0,36 0,36 -0,33 0,20 -0,01 -0,23 -0,20 -0,20 -0,06 -0,12
PAR.023 0,62 0,21 0,60 0,25 -0,15 -0,09 0,06 0,01 -0,05 0,02 -0,08
PAR.046 0,60 0,12 -0,18 0,28 0,55 0,18 -0,19 -0,11 0,02 0,17 0,03
PAR.027 -0,57 0,52 -0,15 0,20 0,15 -0,35 -0,05 0,13 -0,06 -0,08 0,15
PAR.051 -0,54 0,37 0,43 -0,39 0,02 0,13 -0,02 0,05 0,01 0,33 -0,07
PAR.014 0,51 0,42 0,50 0,22 -0,36 0,10 0,03 0,07 -0,08 0,15 -0,01
PAR.043 0,50 -0,26 -0,15 0,36 0,29 0,02 -0,02 -0,15 0,11 0,17 0,26
PAR.008 -0,48 0,40 -0,37 -0,08 -0,17 0,25 -0,30 -0,06 0,01 0,17 0,12
PAR.005 -0,09 0,61 0,00 0,37 0,23 0,48 0,24 -0,04 0,04 -0,17 -0,05
PAR.012 0,55 0,59 0,29 0,25 -0,28 -0,04 -0,06 -0,08 -0,05 0,20 0,02
PAR.031 -0,49 0,59 0,06 0,15 0,28 -0,39 -0,14 0,13 0,12 0,03 0,15
PAR.013 0,53 0,58 0,35 0,28 -0,30 0,00 0,05 -0,06 -0,08 0,21 0,09
PAR.028 -0,56 0,56 -0,08 0,22 0,25 -0,39 0,07 0,11 -0,09 -0,06 0,12
PAR.030 -0,50 0,56 0,02 0,14 0,26 -0,44 -0,13 0,13 0,15 -0,02 0,14
PAR.010 -0,18 0,54 -0,17 0,21 -0,34 -0,01 0,08 -0,12 -0,08 0,24 0,18
PAR.035 0,29 0,50 -0,38 -0,49 0,09 0,24 0,29 -0,02 0,10 -0,15 0,02
PAR.048 0,41 0,21 -0,51 -0,03 -0,15 0,03 -0,26 -0,23 0,11 -0,07 0,20
PAR.037 0,39 0,44 -0,20 -0,58 0,02 0,01 0,26 -0,21 0,26 -0,15 0,03
PAR.047 -0,29 0,15 0,49 -0,56 0,12 0,18 0,21 0,11 0,11 0,25 0,16
PAR.044 0,42 0,24 -0,21 0,28 0,61 0,31 -0,05 0,14 0,10 0,14 0,05
PAR.041 -0,06 -0,32 0,30 -0,08 0,55 0,04 0,31 -0,06 0,01 0,45 0,05
PAR.045 0,50 0,42 0,12 -0,10 0,54 0,15 0,08 -0,18 0,22 -0,01 -0,07
PAR.001 0,38 0,02 0,34 -0,23 -0,14 -0,51 -0,05 -0,40 0,24 0,01 0,00
PAR.003 -0,11 0,48 0,19 0,41 0,05 0,50 0,12 -0,11 0,09 -0,29 -0,07
PAR.033 -0,32 -0,22 -0,15 -0,04 -0,17 0,03 0,68 -0,33 -0,16 0,18 0,10
PAR.050 0,41 0,19 0,29 -0,24 -0,10 -0,06 0,36 0,61 0,12 0,05 0,05
PAR.004 -0,02 0,44 0,18 0,30 -0,10 0,18 0,07 -0,46 0,20 -0,14 -0,14
PAR.049 0,07 0,26 0,00 -0,29 -0,23 0,13 -0,09 0,30 0,67 0,04 -0,05
PAR.006 0,03 0,00 0,47 0,12 -0,09 -0,14 0,36 0,12 0,03 -0,52 0,37
PAR.034 -0,13 0,15 -0,22 0,37 -0,11 -0,24 0,40 -0,10 0,18 0,06 -0,46
PAR.007 -0,06 0,09 -0,41 0,14 0,07 -0,06 0,14 0,35 -0,20 0,08 -0,44

306
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla AP6-10. Estructura factorial de la base de datos masculina, casos


patológicos, rotación varimax, a partir de la matriz de componentes rotada.
1 2 3 4 5 6 7 8 9 10 11
PAR.038 0,93 -0,09 0,22 0,07 -0,04 -0,02 0,08 0,04 -0,04 0,10 -0,01
PAR.040 0,91 -0,08 0,29 0,12 0,00 -0,06 0,10 0,09 -0,01 0,02 -0,02
PAR.002 0,84 -0,03 0,38 0,18 0,15 -0,09 0,09 0,15 0,06 -0,10 -0,01
PAR.037 0,82 -0,07 -0,05 -0,09 -0,02 0,16 -0,02 -0,11 -0,28 0,32 0,06
PAR.035 0,82 -0,05 -0,13 -0,06 -0,17 0,25 0,04 -0,12 0,08 0,28 0,04
PAR.036 -0,79 0,01 -0,41 -0,14 -0,21 0,09 -0,02 -0,18 0,01 0,10 0,15
PAR.039 0,77 -0,03 0,40 0,22 0,15 -0,14 0,12 0,18 0,08 -0,15 -0,05
PAR.015 -0,59 0,29 0,09 -0,41 -0,08 0,30 -0,21 -0,06 0,14 0,16 -0,04
PAR.048 0,48 -0,04 0,06 0,40 -0,41 0,05 0,05 0,18 -0,24 -0,10 0,13
PAR.030 -0,04 0,92 0,00 -0,23 -0,05 0,05 0,03 0,09 -0,03 0,07 -0,02
PAR.028 -0,01 0,91 -0,02 -0,20 -0,05 0,12 -0,04 -0,12 0,16 -0,11 -0,08
PAR.031 -0,05 0,90 0,05 -0,27 -0,07 0,06 0,07 0,08 0,00 0,06 0,00
PAR.027 -0,03 0,86 -0,04 -0,15 -0,17 0,09 -0,10 -0,03 0,15 -0,10 -0,03
PAR.022 0,30 -0,65 0,31 0,18 0,31 -0,05 0,13 0,08 0,12 -0,15 0,24
PAR.021 0,28 -0,62 0,21 0,07 0,28 -0,10 0,10 0,24 0,13 -0,14 0,46
PAR.019 0,23 -0,46 0,34 0,23 0,38 -0,06 0,17 0,44 -0,12 0,11 0,06
PAR.013 0,24 0,02 0,93 0,05 0,06 0,18 0,05 -0,01 -0,08 0,03 0,04
PAR.014 0,09 -0,15 0,90 -0,02 0,15 0,16 -0,04 0,07 0,01 0,12 0,04
PAR.012 0,28 0,03 0,89 0,05 0,01 0,15 0,07 0,10 -0,14 0,01 -0,01
PAR.011 0,35 -0,08 0,78 0,17 -0,15 0,08 0,09 0,29 -0,05 0,01 0,05
PAR.023 0,07 -0,17 0,76 0,04 0,48 0,12 0,02 0,14 -0,12 0,02 0,01
PAR.009 0,10 -0,30 0,12 0,89 0,11 -0,11 0,12 -0,03 0,05 0,12 -0,06
PAR.026 0,10 -0,30 0,12 0,89 0,11 -0,11 0,12 -0,03 0,05 0,12 -0,06
PAR.024 -0,10 0,31 -0,12 -0,88 -0,11 0,11 -0,08 0,04 -0,06 -0,14 0,08
PAR.051 -0,16 0,18 0,11 -0,82 -0,18 -0,02 0,04 -0,16 0,05 0,32 0,03
PAR.047 -0,04 -0,02 0,00 -0,66 0,09 -0,07 0,09 -0,29 0,04 0,50 0,28
PAR.043 0,01 -0,13 0,07 0,55 0,14 -0,03 0,52 0,01 -0,15 -0,15 0,14
PAR.042 0,09 -0,15 0,18 0,22 0,80 -0,05 0,33 0,13 -0,13 -0,12 0,04
PAR.008 0,00 0,27 -0,06 -0,20 -0,79 0,10 -0,02 -0,01 0,09 0,02 0,04
PAR.017 -0,15 0,27 -0,17 -0,15 -0,75 0,16 -0,26 -0,14 0,34 0,14 -0,04
PAR.006 -0,09 0,16 0,12 0,09 0,56 0,27 -0,40 -0,14 0,02 0,11 0,43
PAR.010 0,08 0,35 0,41 0,03 -0,47 0,14 -0,09 -0,30 0,02 -0,03 -0,05
PAR.003 -0,08 0,10 0,21 -0,09 -0,05 0,84 0,05 0,03 0,17 0,01 0,01
PAR.005 0,12 0,22 0,16 -0,07 -0,09 0,80 0,22 -0,07 0,30 0,04 -0,05
PAR.004 0,00 0,08 0,29 -0,10 -0,09 0,65 -0,01 -0,05 -0,31 -0,06 -0,12
PAR.046 0,30 -0,08 0,14 0,29 0,07 0,14 0,75 0,27 0,00 -0,19 0,02
PAR.044 0,27 0,06 0,06 0,25 0,04 0,26 0,74 0,22 0,26 0,03 0,02
PAR.041 -0,23 -0,11 -0,15 -0,22 0,38 -0,18 0,59 -0,38 0,01 0,09 0,03
PAR.045 0,51 -0,01 0,12 -0,12 0,27 0,35 0,55 0,14 -0,17 0,14 0,03
PAR.033 -0,09 -0,10 -0,18 0,02 -0,05 0,03 -0,13 -0,86 -0,01 -0,09 -0,10
PAR.018 0,16 -0,44 0,25 0,19 0,24 -0,08 0,16 0,71 -0,12 0,13 0,10
PAR.001 0,20 -0,03 0,26 -0,06 0,32 -0,20 -0,11 0,04 -0,74 0,04 0,04
PAR.032 -0,18 0,31 -0,11 -0,43 -0,21 0,37 -0,07 -0,14 0,58 -0,03 0,07
PAR.049 0,14 0,01 0,05 0,00 -0,21 0,07 -0,08 0,26 -0,14 0,78 -0,04
PAR.050 0,30 -0,05 0,34 0,03 0,42 -0,16 -0,10 -0,02 0,30 0,60 0,06
PAR.034 -0,03 0,23 0,04 0,21 0,04 0,22 -0,10 -0,25 -0,08 0,01 -0,70
PAR.007 0,15 0,12 -0,09 0,11 -0,07 -0,09 0,00 0,04 0,45 -0,07 -0,56

307
Apéndices

Tabla AP6-11. Estructura factorial de la base de datos masculina, casos


normofónicos, sin rotación, a partir de la matriz de componentes.
1 2 3 4 5 6 7 8 9 10
PAR.044 0,81 0,19 0,33 0,04 0,23 -0,23 0,16 -0,04 0,05 -0,02
PAR.004 0,81 0,00 0,30 0,07 0,19 -0,25 0,15 0,15 0,07 -0,01
PAR.045 0,80 0,11 0,42 0,05 0,14 -0,27 0,13 -0,04 0,03 -0,03
PAR.005 0,80 -0,04 0,29 0,06 0,28 -0,25 0,20 0,07 0,01 -0,06
PAR.003 0,78 -0,03 0,12 0,02 0,32 -0,14 0,17 0,20 0,04 -0,11
PAR.022 0,75 0,01 -0,17 -0,28 -0,07 0,22 -0,07 0,00 0,31 -0,03
PAR.012 0,72 -0,24 0,06 0,45 0,00 0,28 0,03 0,02 0,10 -0,02
PAR.046 0,71 0,28 0,52 0,03 0,03 -0,19 0,05 -0,13 0,11 -0,03
PAR.021 0,70 -0,05 0,03 -0,45 0,08 0,36 -0,16 0,01 -0,05 -0,05
PAR.019 0,68 0,19 -0,09 -0,40 0,04 -0,09 -0,13 0,27 0,06 0,07
PAR.011 0,68 -0,26 -0,02 0,19 -0,36 0,32 -0,01 0,13 0,17 -0,01
PAR.031 -0,65 0,00 0,52 0,24 -0,05 -0,12 0,06 0,29 -0,08 0,09
PAR.013 0,65 -0,02 0,10 0,59 0,23 0,19 0,15 0,09 0,01 0,00
PAR.030 -0,64 0,03 0,55 0,21 -0,06 -0,07 0,03 0,30 -0,11 0,02
PAR.018 0,61 0,14 -0,03 -0,43 -0,11 -0,11 -0,45 0,32 0,05 -0,16
PAR.028 -0,60 -0,05 0,54 0,41 -0,11 0,04 -0,03 0,06 0,14 -0,06
PAR.015 0,56 -0,50 0,06 0,08 0,11 0,07 -0,33 0,10 -0,25 0,18
PAR.038 0,47 0,44 0,42 -0,10 -0,28 -0,09 -0,05 -0,39 -0,02 0,17
PAR.043 -0,35 0,83 -0,12 -0,02 0,08 -0,03 0,19 -0,02 0,14 -0,12
PAR.042 -0,12 0,75 0,39 0,01 0,25 -0,06 -0,24 0,07 0,00 -0,02
PAR.017 0,00 -0,74 0,15 -0,34 -0,12 -0,18 0,40 0,04 0,14 -0,02
PAR.008 0,50 -0,63 0,10 -0,18 -0,26 0,07 0,07 -0,12 0,10 0,07
PAR.039 0,18 0,60 0,36 -0,20 -0,46 0,30 0,22 0,05 -0,09 0,11
PAR.040 0,37 0,56 0,46 -0,17 -0,41 0,09 0,06 -0,23 -0,06 0,15
PAR.050 -0,53 0,55 0,11 0,02 0,15 -0,11 -0,19 0,06 0,17 0,13
PAR.002 0,03 0,52 0,28 -0,16 -0,44 0,36 0,31 0,28 -0,12 0,09
PAR.036 -0,02 -0,46 -0,13 0,08 0,15 -0,24 -0,21 -0,43 0,11 -0,14
PAR.001 0,36 0,48 -0,70 0,12 -0,03 -0,24 0,09 0,10 -0,04 0,10
PAR.037 0,35 0,50 -0,68 0,12 -0,04 -0,23 0,10 0,13 -0,05 0,11
PAR.035 -0,37 -0,48 0,68 -0,15 0,02 0,25 -0,12 -0,09 0,04 -0,07
PAR.032 -0,15 -0,42 0,53 -0,44 0,09 -0,22 0,27 0,08 0,16 -0,04
PAR.027 -0,48 0,09 0,51 0,38 -0,17 0,05 -0,11 0,10 0,24 -0,23
PAR.023 0,50 0,18 -0,09 0,63 0,29 0,30 -0,12 -0,04 -0,17 -0,08
PAR.014 0,60 -0,05 0,20 0,62 0,22 0,25 0,05 0,06 -0,07 0,00
PAR.051 -0,33 -0,13 -0,08 -0,17 0,72 0,17 0,00 0,18 -0,01 0,10
PAR.041 -0,16 0,11 0,24 -0,35 0,69 0,29 -0,10 -0,11 0,07 0,17
PAR.048 0,13 -0,47 -0,26 0,24 -0,64 -0,08 0,10 0,12 -0,21 -0,23
PAR.033 -0,29 -0,10 -0,25 0,27 0,23 0,11 0,58 -0,36 -0,10 0,32
PAR.047 -0,19 0,16 -0,12 -0,23 0,32 0,27 0,47 -0,12 0,38 -0,17
PAR.006 -0,24 -0,07 -0,22 -0,24 0,15 0,03 0,40 0,53 -0,25 -0,20
PAR.034 -0,12 0,20 -0,20 0,37 -0,29 -0,27 0,02 -0,09 0,53 -0,11
PAR.007 0,21 -0,22 0,32 -0,09 -0,09 -0,34 0,08 -0,20 -0,49 0,17
PAR.049 -0,25 -0,29 0,13 0,28 0,09 -0,27 -0,12 0,38 0,24 0,47
PAR.010 0,25 -0,34 -0,23 -0,01 -0,29 0,14 0,00 0,20 0,43 0,47

308
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz

Tabla AP6-12. Estructura factorial de la base de datos masculina, casos


normofónicos, rotación varimax, a partir de la matriz de componentes
rotada.
1 2 3 4 5 6 7 8 9 10
PAR.045 0,91 -0,07 0,08 0,12 0,09 -0,02 0,12 0,20 -0,11 -0,05
PAR.044 0,91 -0,17 0,03 0,15 0,09 0,06 0,09 0,16 -0,05 -0,07
PAR.005 0,91 -0,11 0,16 0,16 -0,04 0,03 0,09 -0,02 -0,10 -0,02
PAR.004 0,89 -0,12 0,15 0,16 0,04 -0,01 0,16 0,01 -0,07 0,08
PAR.046 0,83 0,01 -0,03 0,10 0,22 -0,02 0,16 0,37 -0,04 -0,09
PAR.003 0,80 -0,21 0,19 0,21 -0,04 0,08 0,18 -0,16 0,01 -0,02
PAR.001 0,08 -0,89 -0,22 0,14 0,06 -0,25 -0,01 -0,06 0,08 0,08
PAR.037 0,08 -0,88 -0,23 0,14 0,10 -0,25 0,00 -0,07 0,08 0,09
PAR.035 -0,12 0,87 0,23 -0,16 -0,05 0,26 0,03 0,06 -0,10 -0,06
PAR.028 -0,18 0,79 -0,29 0,06 0,03 -0,16 -0,19 0,05 0,09 0,20
PAR.027 -0,12 0,73 -0,35 0,10 0,07 -0,24 0,00 0,08 0,23 0,11
PAR.030 -0,16 0,71 -0,40 -0,09 0,18 -0,09 -0,12 -0,20 -0,14 0,24
PAR.031 -0,15 0,68 -0,39 -0,11 0,14 -0,10 -0,18 -0,20 -0,14 0,31
PAR.008 0,25 0,05 0,83 -0,07 -0,08 -0,07 0,10 0,14 -0,10 -0,01
PAR.042 0,17 0,12 -0,78 0,06 0,28 0,24 0,21 0,18 0,03 -0,02
PAR.043 -0,11 -0,21 -0,73 -0,13 0,32 0,02 -0,15 0,00 0,40 -0,14
PAR.050 -0,24 0,10 -0,71 -0,15 0,10 0,16 0,00 0,12 0,17 0,21
PAR.017 0,18 0,28 0,65 -0,52 -0,17 -0,06 -0,15 -0,24 -0,01 0,06
PAR.011 0,23 -0,09 0,64 0,43 0,18 -0,25 0,24 0,12 0,12 0,07
PAR.010 -0,08 -0,20 0,59 0,01 0,07 -0,05 0,07 0,12 0,19 0,56
PAR.015 0,24 -0,03 0,48 0,36 -0,23 0,13 0,28 0,02 -0,46 0,14
PAR.022 0,33 -0,42 0,47 0,12 0,12 0,11 0,40 0,20 0,27 -0,09
PAR.023 0,26 -0,18 -0,08 0,89 -0,06 0,02 -0,03 0,06 -0,03 -0,11
PAR.014 0,49 0,05 0,15 0,79 0,01 -0,02 -0,08 0,02 -0,04 0,04
PAR.013 0,55 -0,07 0,16 0,74 0,01 -0,05 -0,11 -0,02 0,05 0,08
PAR.012 0,43 -0,04 0,47 0,66 -0,02 -0,12 0,04 0,10 0,06 0,04
PAR.032 0,30 0,52 0,24 -0,59 -0,05 0,18 -0,02 -0,17 -0,01 0,05
PAR.002 -0,01 0,06 -0,07 -0,01 0,93 -0,07 0,04 -0,06 0,06 -0,06
PAR.039 0,11 0,01 -0,09 -0,03 0,92 -0,05 0,07 0,21 0,02 -0,15
PAR.040 0,31 -0,01 -0,09 -0,06 0,71 -0,06 0,09 0,54 -0,11 -0,18
PAR.036 -0,03 0,06 0,18 -0,07 -0,68 -0,04 -0,07 0,22 -0,04 -0,11
PAR.041 0,03 0,15 -0,18 -0,05 -0,05 0,88 -0,01 0,02 0,07 -0,06
PAR.048 -0,16 -0,02 0,49 0,08 -0,05 -0,75 0,02 -0,19 -0,18 -0,05
PAR.051 -0,13 0,07 -0,14 -0,01 -0,27 0,67 -0,10 -0,40 0,06 0,11
PAR.034 -0,05 -0,08 -0,21 -0,02 -0,13 -0,51 -0,09 0,26 0,50 0,20
PAR.033 -0,15 -0,12 0,05 0,05 -0,07 0,14 -0,89 -0,06 0,04 0,02
PAR.018 0,29 -0,32 0,11 -0,06 0,10 0,01 0,85 0,04 -0,06 -0,03
PAR.019 0,43 -0,48 0,15 -0,06 0,19 0,15 0,52 0,00 -0,02 0,05
PAR.021 0,29 -0,25 0,46 0,13 0,19 0,37 0,48 0,08 -0,05 -0,27
PAR.006 -0,10 -0,07 -0,01 -0,19 0,13 0,05 -0,05 -0,82 0,01 -0,06
PAR.038 0,42 -0,07 -0,07 -0,04 0,42 -0,05 0,08 0,66 -0,17 -0,17
PAR.007 0,30 0,08 0,14 -0,19 0,00 -0,09 -0,14 0,11 -0,67 -0,09
PAR.047 0,01 -0,05 -0,02 -0,17 0,07 0,35 -0,31 -0,17 0,62 -0,23
PAR.049 -0,01 0,24 -0,04 -0,02 -0,20 -0,01 -0,06 -0,08 -0,07 0,80

309

También podría gustarte