Carlos Alfredo Lazaro Carrascosa PDF
Carlos Alfredo Lazaro Carrascosa PDF
Carlos Alfredo Lazaro Carrascosa PDF
Tesis doctoral
2015
DEPARTAMENTO DE ARQUITECTURA, TECNOLOGÍA Y
SISTEMAS INFORMÁTICOS
Tesis doctoral
2015
Tribunal nombrado por el Magnífico y Excelentísimo Sr.
Rector de la Universidad Politécnica de Madrid el día __
de __________ de 2015.
Presidente:_______________________________________________
Vocal:____________________________________________________
Vocal:____________________________________________________
Vocal:____________________________________________________
Secretario:_______________________________________________
Suplente:_________________________________________________
Suplente:_________________________________________________
Calificación:___________________
EL SECRETARIO
Agradecimientos
Por todo ello resultan de especial interés las técnicas de ayuda al diagnóstico que
son capaces de extraer conclusiones clínicas a partir de una muestra de la voz grabada
con un micrófono, frente a otras invasivas que implican la exploración utilizando
laringoscopios, fibroscopios o videoendoscopios, técnicas en cualquier caso mucho
más molestas para los pacientes al exigir la introducción parcial del instrumental citado
por la garganta, en actuaciones consideradas de tipo quirúrgico.
xi
Esta tesis doctoral se ocupa de varias cuestiones: en primer lugar, es necesario
analizar cuidadosamente estos nuevos parámetros, por lo que ofreceremos una
completa descripción estadística de los mismos. También estudiaremos cuestiones
como la distribución de los parámetros atendiendo a criterios como el de normalidad
estadística de los mismos, ocupándonos especialmente de la diferencia entre las
distribuciones que presentan sujetos sanos y sujetos con patología vocal. Para todo
ello emplearemos diferentes técnicas estadísticas: generación de elementos y
diagramas descriptivos, pruebas de normalidad y diversos contrastes de hipótesis,
tanto paramétricos como no paramétricos, que considerarán la diferencia entre los
grupos de personas sanas y los grupos de personas con alguna patología relacionada
con la voz.
Todos los análisis presentes en el trabajo serán realizados para cada uno de los dos
géneros, de acuerdo con diversos estudios previos que demuestran que los géneros
masculino y femenino deben tratarse de forma independiente debido a las diferencias
orgánicas observadas entre ambos. Sin embargo, en lo referente a la detección de
patología vocal contemplaremos también la posibilidad de trabajar con la base de
datos unificada, comprobando que las tasas de acierto son también elevadas.
xii
Abstract
Voice pathologies have become recently in a social problem that has reached a
certain concern. Pollution in cities, smoking habits, air conditioning, etc. contributes to
it. This problem is more relevant for professionals who use their voice frequently:
speakers, singers, teachers, actors, telemarketers, etc.
Therefore techniques that are capable of drawing conclusions from a sample of the
recorded voice are of particular interest for the diagnosis as opposed to other invasive
ones, involving exploration by laryngoscopes, fiber scopes or video endoscopes, which
are techniques much less comfortable for patients.
Voice quality analysis has come a long way in a relatively short period of time. In
regard to the diagnosis of diseases, we have gone in the last fifteen years from working
primarily with parameters extracted from the voice signal (both in time and frequency
domains) and with scales drawn from subjective assessments by experts to produce
more accurate evaluations with estimates derived from the glottal source. The
importance of using the glottal source resides broadly in that this signal is linked to the
state of the speaker's laryngeal structure. Unlike the voice signal (phonated speech)
the glottal source, if conveniently reconstructed using adaptive lattices, may be less
influenced by the vocal tract. As it is well known the vocal tract is related to the
articulation of the spoken message and its influence complicates the process of voice
pathology detection, unlike when using the reconstructed glottal source, where vocal
tract influence has been almost completely removed.
The estimates of the glottal source have been obtained through inverse filtering
techniques developed by our research group. We have also deepened into the nature
of the glottal signal, dissecting it and relating it to the biomechanical parameters of the
vocal folds, obtaining several estimates of items such as mass, loss or elasticity of cover
and body of the vocal fold, among others. From the components of the glottal source
also arise the so-called biometric parameters, related to the shape of the signal, which
are themselves a biometric signature of the individual. We will also work with
temporal parameters related to the different stages that are observed in the glottal
signal during a cycle of phonation. Finally, we will take into consideration classical
perturbation and energy parameters.
This thesis addresses several issues: first, a careful analysis of these new parameters
is required, so we will offer a complete statistical description of them. We will also
discuss issues such as distribution of the parameters, considering criteria such as their
statistical normality. We will take special care in the analysis of the difference between
distributions from healthy subjects and the distributions from pathological subjects. To
reach these goals we will use different statistical techniques such as: generation of
descriptive items and diagramas, tests for normality and hypothesis testing, both
xiii
parametric and nonparametric. These latter techniques consider the difference
between the groups of healthy subjects and groups of people with an illness related to
voice.
All the analyses presented in this work have been performed for each of the two
genders in agreement with previous studies showing that male and female genders
should be treated independently, due to the observed functional differences between
them. However, with regard to the detection of vocal pathology we will consider the
possibility of working with the unified database, ensuring that the success rates
obtained are also high.
xiv
Índice general
1. Introducción........................................................................................... 1
1.1. Organización del presente documento..................................... 2
1.2. Motivaciones y características generales del presente
estudio....................................................................................... 3
1.3. Hipótesis de partida................................................................... 7
1.4. Objetivos.................................................................................... 8
1.5. Revisión de los análisis directo y perceptual para la detección
de patología vocal..................................................................... 9
1.5.1. Instrumental utilizado en la inspección directa del
aparato fonador........................................................... 9
1.5.2. Análisis perceptual o subjetivo de lavoz...................... 11
2. Producción y fisiología de la voz............................................................ 15
2.1. Teorías de la fonación ............................................................... 16
2.1.1. Antecedentes históricos............................................... 16
2.1.2. Teoría de Van den Berg................................................ 18
2.2. Modelos de representación de los pliegues vocales................. 20
2.3. Modelado acústico.................................................................... 23
2.4. Revisión del uso de parámetros acústicos procedentes de la
señal de voz en la detección de patología vocal....................... 27
3. Parámetros glóticos presentes en el estudio......................................... 37
3.1. Estimación de la señal glótica –mediante filtrado inverso– y
parametrización........................................................................ 38
3.2. Parámetros glóticos clásicos de perturbación y energía........... 43
3.3. Parámetros glóticos biométricos.............................................. 46
3.4. Parámetros glóticos biomecánicos........................................... 51
3.5. Parámetros glóticos temporales............................................... 53
3.6. Revisión del uso de parámetros glóticos en la detección de
patología vocal.......................................................................... 54
4. Patologías vocales, bases de datos y herramientas para la ayuda al
diagnóstico............................................................................................. 59
4.1. Patologías vocales: clasificación y características generales.... 60
4.2. Bases de datos frecuentemente utilizadas y herramientas
para la ayuda al diagnóstico...................................................... 65
4.3. Base de datos y herramienta empleada para el estudio.......... 71
5. Métodos analíticos utilizados en el estudio........................................... 75
5.1. Naturaleza de los datos: descriptivos, normalidad y
homocedasticidad.................................................................... 76
5.2. Pruebas de comparación de distribuciones.............................. 80
5.2.1. Prueba t de Student..................................................... 81
5.2.2. Prueba U de Mann-Whitney......................................... 81
5.2.3. Prueba de Kolmogorov-Smirnov para dos muestras.... 82
xv
5.2.4. Prueba de las rachas de Wald-Wolfowitz..................... 82
5.2.5. Prueba de reacciones extremas de Moses................... 83
5.2.6. Tamaño del efecto........................................................ 83
5.3. Estudios de correlación lineal bivariada................................... 85
5.4. Análisis Factorial basado en componentes principales............. 87
5.5. Análisis Discriminante............................................................... 90
6. Experimentación y resultados............................................................... 95
6.1. Descripción de los parámetros y características generales de
la distribución de los mismos.................................................... 96
6.1.1. Resultados de las pruebas de normalidad................... 97
6.1.2. Resultados de los diagramas de caja............................ 103
6.1.3. Resultados de las pruebas de diferencia en las
distribuciones............................................................... 108
6.2. Relación entre los parámetros e importancia relativa de los
mismos...................................................................................... 120
6.2.1. Resultados de las pruebas de correlación bivariada..... 120
6.2.2. Resultados de las pruebas de análisis factorial............ 140
6.3. Detección de los sujetos en base a la presencia de patología
vocal.......................................................................................... 150
7. Contribuciones, conclusiones y líneas futuras....................................... 171
7.1. Contribuciones y conclusiones.................................................. 172
7.2. Líneas futuras............................................................................ 176
xvi
Índice de tablas
xvii
Tabla 5-3. Interpretación cualitativa de los valores del
tamaño del efecto, según Cohen (Cohen, J., 1988). 84
Tabla 5-4. Interpretación cualitativa de los valores del
tamaño del efecto y relación con el coeficiente de
correlación, según Hopkins (Hopkins, W.G., 2000).. 84
Tabla 5-5. Escala de interpretación de los valores de
correlación de Bisquerra (Bisquerra,R., 1987)......... 86
Tabla 6-1. Normalidad de los parámetros en la base de datos
femenina y masculina según la prueba de
Kolmogorov-Smirnov............................................... 97
Tabla 6-2. Normalidad de los parámetros en la base de datos
femenina y masculina según la prueba de
Kolmogorov-Smirnov, modificación de Lilliefors..... 98
Tabla 6-3. Normalidad de los parámetros en la base de datos
femenina y masculina según la prueba de Saphiro-
Wilk.......................................................................... 99
Tabla 6-4. Normalidad de los parámetros en la base de datos
femenina y masculina según las pruebas de
Kolmogorov-Smirnov, Kolmogorov-Smirnov,
modificación de Lilliefors y Saphiro-Wilk................. 101
Tabla 6-5. Proporción de los parámetros que se ajustan a la
distribución normal en la base de datos femenina:
todos los casos, casos normofónicos y casos
patológicos. En la última fila y en la última
columna, suma de los valores.................................. 102
Tabla 6-6. Proporción de los parámetros que se ajustan a la
distribución normal en la base de datos masculina:
todos los casos, casos normofónicos y casos
patológicos. En la última fila y en la última
columna, suma de los valores.................................. 102
Tabla 6-7. Listado de valores representativos de los
diagramas de caja de los parámetros de la base de
datos femenina........................................................ 103
Tabla 6-8. Listado de parámetros de la base de datos
femenina que cumplen el primero de los tres
criterios establecidos............................................... 104
Tabla 6-9. Listado de parámetros de la base de datos
femenina que cumplen el segundo de los tres
criterios establecidos............................................... 105
Tabla 6-10. Listado de parámetros de la base de datos
femenina que cumplen el tercero de los tres
criterios establecidos............................................... 105
Tabla 6-11. Listado de valores representativos de los
diagramas de caja de los parámetros de la base de
datos masculina....................................................... 106
xviii
Tabla 6-12. Listado de parámetros de la base de datos
masculina que cumplen el primero de los tres
criterios establecidos............................................... 106
Tabla 6-13. Listado de parámetros de la base de datos
masculina que cumplen el segundo de los tres
criterios establecidos............................................... 107
Tabla 6-14. Listado de parámetros de la base de datos
masculina que cumplen el tercero de los tres
criterios establecidos............................................... 107
Tabla 6-15. Listado de códigos de los parámetros de ambas
bases de datos que cumplen cada uno de los tres
criterios establecidos, y alguno de ellos.................. 108
Tabla 6-16. Rechazo de la hipótesis de igualdad de medias
según las pruebas t de Student y Mann-Whitney
en las bases de datos femenina y masculina para
todos los parámetros............................................... 110
Tabla 6-17. Rechazo de la hipótesis de igualdad de
distribuciones según las pruebas de Kolmogorov-
Smirnov (K-S) para dos muestras independientes y
de las rachas de Wald-Wolfowitz (W-W) en las
bases de datos femenina y masculina para todos
los parámetros......................................................... 112
Tabla 6-18. Rechazo de la hipótesis de igualdad de varianzas
según las pruebas de Levene de la varianza y de
las reacciones extremas de Moses en las bases de
datos femenina y masculina para todos los
parámetros.............................................................. 114
Tabla 6-19. Listado de parámetros de la base de datos
femenina que rechazan todas las hipótesis de
igualdad en las distribuciones, según las seis
pruebas realizadas................................................... 115
Tabla 6-20. Listado de parámetros de la base de datos
masculina que rechazan todas las hipótesis de
igualdad en las distribuciones, según las seis
pruebas realizadas................................................... 115
Tabla 6-21. Tamaño del efecto de los parámetros para las
bases de datos femenina y masculina..................... 116
Tabla 6-22. Parámetros de la base de datos femenina
ordenados según el tamaño del efecto................... 118
Tabla 6-23. Parámetros de la base de datos masculina
ordenados según el tamaño del efecto................... 119
Tabla 6-24. Correlaciones consideradas altas y muy altas
presentes en la base de datos femenina, según la
prueba de τ-Kendall................................................. 120
xix
Tabla 6-25. Observamos una fuerte relación entre el Jitter
(002), Desbalance de la masa del cuerpo (038),
Desbalance de la pérdida del cuerpo (039) y
Desbalance de la elasticidad del cuerpo (040), en
la base de datos femenina, todos los casos............. 122
Tabla 6-26. Observamos una fuerte relación entre el Jitter
(002), Desbalance de la masa del cuerpo (038),
Desbalance de la pérdida del cuerpo (039),
Desbalance de la elasticidad del cuerpo (040) y
Pérdida del cuerpo (036) en la base de datos
femenina, casos patológicos.................................... 122
Tabla 6-27. Observamos una fuerte relación entre el Jitter
(002), Desbalance de la pérdida del cuerpo (039) y
Desbalance de la elasticidad del cuerpo (040) en la
base de datos femenina, casos
normofónicos........................................................... 123
Tabla 6-28. Observamos una fuerte relación entre los
parámetros 2º Arm./Frecuencia Fundamental
MWC (009), Frecuencia del origen de la señal (024)
y Frecuencia del primer máximo (026), en la base
de datos femenina, todos los casos......................... 123
Tabla 6-29. Observamos una fuerte relación entre los
parámetros 2º Arm./Frecuencia Fundamental
MWC (009), Frecuencia del origen de la señal (024)
y Frecuencia del primer máximo (026), en la base
de datos femenina, casos patológicos..................... 123
Tabla 6-30. Observamos una fuerte relación entre los
parámetros Frecuencia del primer mínimo (027) y
Frecuencia del segundo máximo (028), en la base
de datos femenina, todos los casos......................... 124
Tabla 6-31. Observamos una fuerte relación entre los
parámetros Frecuencia del primer mínimo (027) y
Frecuencia del segundo máximo (028), en la base
de datos femenina, casos patológicos..................... 124
Tabla 6-32. Observamos una fuerte relación entre los
parámetros Frecuencia del primer mínimo (027) y
Frecuencia del segundo máximo (028), en la base
de datos femenina, casos normofónicos................. 124
Tabla 6-33. Observamos una fuerte relación entre los
parámetros Segunda banda de energía de la MWC
(012), Tercera banda de energía de la MWC (013)
y Cuarta banda de energía de la MWC (014), en la
base de datos femenina, todos los casos................. 125
xx
Tabla 6-34. Observamos una fuerte relación entre los
parámetros Segunda banda de energía de la MWC
(012), Tercera banda de energía de la MWC (013),
Cuarta banda de energía de la MWC (014) y
Primera banda de energía de la MWC (011), en la
base de datos femenina, casos patológicos............. 125
Tabla 6-35. Observamos una fuerte relación entre los
parámetros Amplitud del segundo mínimo (021) y
Amplitud del cuarto máximo (022), en la base de
datos femenina, todos los casos.............................. 126
Tabla 6-36. Observamos una fuerte relación entre los
parámetros Frecuencia del segundo mínimo (030)
y Frecuencia del cuarto máximo (031), en la base
de datos femenina, todos los casos......................... 126
Tabla 6-37. Observamos una fuerte relación entre los
parámetros Frecuencia del segundo mínimo (030)
y Frecuencia del cuarto máximo (031), en la base
de datos femenina, casos patológicos..................... 126
Tabla 6-38. Observamos una fuerte relación entre los
parámetros Frecuencia del segundo mínimo (030)
y Frecuencia del cuarto máximo (031), en la base
de datos femenina, casos normofónicos................. 126
Tabla 6-39. Observamos una fuerte relación entre los
parámetros Amplitud del primer máximo (017) y
Pérdida de la cubierta (042), en la base de datos
femenina, casos patológicos.................................... 127
Tabla 6-40. Observamos una fuerte relación entre los
parámetros Pitch (001), Frecuencia final (032),
Masa del cuerpo (035) y Elasticidad del cuerpo
(037), base de datos femenina, casos
normofónicos........................................................... 127
Tabla 6-41. Observamos una fuerte relación entre los
parámetros Shimmer en amplitud (003), Shimmer
en área (005) y Desbalance en masa de la cubierta
(044), en la base de datos femenina, casos
normofónicos........................................................... 128
Tabla 6-42. Observamos una fuerte relación entre los
parámetros Energía MWC/AAW (008) y Pérdida de
la cubierta (042), en la base de datos femenina,
casos normofónicos................................................. 128
Tabla 6-43. Correlaciones consideradas altas y muy altas
presentes en la base de datos masculina, según la
prueba de τ-Kendall................................................. 129
xxi
Tabla 6-44. Observamos una fuerte relación entre los
parámetros Jitter (002), Desbalance de la masa del
cuerpo (038), Desbalance de la pérdida del cuerpo
(039) y Desbalance de la elasticidad del cuerpo
(040), en la base de datos masculina, todos los
casos........................................................................ 130
Tabla 6-45. Observamos una fuerte relación entre los
parámetros Jitter (002), Desbalance de la masa del
cuerpo (038), Desbalance de la pérdida del cuerpo
(039), Desbalance de la elasticidad del cuerpo
(040) y Pérdida del cuerpo (036), en la base de
datos masculina, casos patológicos......................... 130
Tabla 6-46. Observamos una fuerte relación entre los
parámetros Jitter (002), Desbalance de la pérdida
del cuerpo (039) y Desbalance de la elasticidad del
cuerpo (040), en la base de datos masculina, casos
normofónicos........................................................... 131
Tabla 6-47. Observamos una fuerte relación entre los
parámetros 2º Arm./Frecuencia Fundamental
MWC (009), Frecuencia del origen de la señal (024)
y Frecuencia del primer máximo (026), en la base
de datos masculina, todos los casos........................ 131
Tabla 6-48. Observamos una fuerte relación entre los
parámetros 2º Arm./Frecuencia Fundamental
MWC (009), Frecuencia del origen de la señal (024)
y Frecuencia del primer máximo (026), en la base
de datos masculina, casos patológicos.................... 131
Tabla 6-49. Observamos una fuerte relación entre los
parámetros Segunda banda de energía de la MWC
(012), Tercera banda de energía de la MWC (013)
y Cuarta banda de energía de la MWC (014), en la
base de datos masculina, todos los casos................ 132
Tabla 6-50. Observamos una fuerte relación entre los
parámetros Segunda banda de energía de la MWC
(012) y Tercera banda de energía de la MWC
(013), en la base de datos masculina, casos
patológicos...............................................................
. 132
Tabla 6-51. Observamos una fuerte relación entre los
parámetros Pitch (001) y Elasticidad del cuerpo
(037), en la base de datos masculina, todos los
casos........................................................................ 133
Tabla 6-52. Observamos una fuerte relación entre los
parámetros Pitch (001), Frecuencia final (032),
Masa del cuerpo (035) y Elasticidad del cuerpo
(037), en la base de datos masculina, casos
normofónicos........................................................... 133
xxii
Tabla 6-53. Observamos una fuerte relación entre los
parámetros Frecuencia del segundo mínimo (030)
y Frecuencia del cuarto máximo (031), en la base
de datos masculina, todos los casos....................... 134
Tabla 6-54. Observamos una fuerte relación entre los
parámetros Frecuencia del segundo mínimo (030)
y Frecuencia del cuarto máximo (031), en la base
de datos masculina, casos patológicos................... 134
Tabla 6-55. Observamos una fuerte relación entre los
parámetros Frecuencia del segundo mínimo (030)
y Frecuencia del cuarto máximo (031), en la base
de datos masculina, casos normofónicos............... 134
Tabla 6-56. Bloques de parámetros que presentan una
correlación considerada muy alta en las bases de
datos femenina y masculina, todos los casos.......... 135
Tabla 6-57. Bloques de parámetros que presentan una
correlación considerada muy alta en las bases de
datos femenina y masculina, casos patológicos...... 136
Tabla 6-58. Bloques de parámetros que presentan una
correlación considerada muy alta en las bases de
datos femenina y masculina, casos
normofónicos........................................................... 136
Tabla 6-59. Listado de parámetros utilizados en el estudio,
junto con el índice de correlación que éstos
presentan con la variable que discrimina los
sujetos patológicos de los normofónicos, para la
base de datos femenina. Los parámetros aparecen
ordenados en base al índice de correlación............ 137
Tabla 6-60. Listado de parámetros utilizados en el estudio,
junto con el índice de correlación que éstos
presentan con la variable que discrimina los
sujetos patológicos de los normofónicos, para la
base de datos masculina. Los parámetros
aparecen ordenados en base al índice de
correlación............................................................... 139
Tabla 6-61. Listado de los parámetros agrupados por factores
para todos los casos, sin rotación y para las bases
de datos femenina y masculina............................... 141
Tabla 6-62. Listado de los parámetros agrupados por factores,
casos normofónicos, sin rotación y para las bases
de datos femenina y masculina............................... 142
Tabla 6-63. Listado de los parámetros agrupados por factores,
casos patológicos, sin rotación y para las bases de
datos femenina y masculina.................................... 143
xxiii
Tabla 6-64. Listado de los parámetros agrupados por factores
para todos los casos, rotación varimax y para las
bases de datos femenina y masculina..................... 145
Tabla 6-65. Listado de los parámetros agrupados por factores,
casos normofónicos, rotación varimax y para las
bases de datos femenina y masculina..................... 147
Tabla 6-66. Listado de los parámetros agrupados por factores,
casos patológicos, rotación varimax y para las
bases de datos femenina y masculina..................... 148
Tabla 6-67. Resultado de la primera tanda de pruebas de
análisis discriminante, base de datos femenina...... 152
Tabla 6-68. Resultado de la segunda tanda de pruebas de
análisis discriminante, base de datos femenina...... 153
Tabla 6-69. Resultado de la tercera tanda de pruebas de
análisis discriminante, base de datos femenina...... 154
Tabla 6-70. Resultado de la cuarta tanda de pruebas de
análisis discriminante, base de datos femenina...... 154
Tabla 6-71. Resultado de la quinta tanda de pruebas de
análisis discriminante, base de datos femenina...... 155
Tabla 6-72. Resultado de la sexta tanda de pruebas de análisis
discriminante, base de datos femenina................... 156
Tabla 6-73. Resultado de la séptima tanda de pruebas de
análisis discriminante, base de datos femenina...... 157
Tabla 6-74. Resultado de la primera tanda de pruebas de
análisis discriminante, base de datos masculina..... 159
Tabla 6-75. Resultado de la segunda tanda de pruebas de
análisis discriminante, base de datos masculina..... 160
Tabla 6-76. Resultado de la tercera tanda de pruebas de
análisis discriminante, base de datos masculina..... 160
Tabla 6-77. Resultado de la cuarta tanda de pruebas de
análisis discriminante, base de datos masculina..... 160
Tabla 6-78. Resultado de la quinta tanda de pruebas de
análisis discriminante, base de datos masculina..... 161
Tabla 6-79. Resultado de la sexta tanda de pruebas de análisis
discriminante, base de datos masculina.................. 162
Tabla 6-80. Resultado de la séptima tanda de pruebas de
análisis discriminante, base de datos masculina..... 163
Tabla 6-81. Resultado detallado del estudio correspondiente
al uso de los factores extraídos a todos los
parámetros excepto el número 24 (Frecuencia
Origen Señal), base de datos femenina................... 165
Tabla 6-82. Resultado detallado del estudio correspondiente
al uso de todos los parámetros excepto los
temporales, base de datos masculina...................... 167
xxiv
Tabla 6-83. Resultados de la tasa general para la base de
datos global, y comparativa con la suma de las
tasas de las bases de datos femenina y masculina.. 168
Tabla AP2.1-1. Descriptivos de la base de datos femenina: media,
error típico de la media, mediana, moda,
desviación típica, varianza y asimetría..................... 202
Tabla AP2.1-2. Descriptivos de la base de datos femenina: error
típico de asimetría, curtosis, error típico de
curtosis, amplitud, mínimo, máximo, suma............. 203
Tabla AP2.1-3. Descriptivos de la base de datos femenina:
percentiles 10, 20, 25, 30 y 40................................. 205
Tabla AP2.1-4. Descriptivos de la base de datos femenina:
percentiles 60, 70, 75, 80 y 90................................. 206
Tabla AP2.1-5. Descriptivos de la base de datos masculina: media,
error típico de la media, mediana, moda,
desviación típica, varianza y asimetría..................... 208
Tabla AP2.1-6. Descriptivos de la base de datos masculina: error
típico de asimetría, curtosis, error típico de
curtosis, amplitud, mínimo, máximo, suma............. 209
Tabla AP2.1-7. Descriptivos de la base de datos masculina:
percentiles 10, 20, 25, 30 y 40................................. 211
Tabla AP2.1-8. Descriptivos de la base de datos masculina:
percentiles 60, 70, 75, 80 y 90................................. 212
Tabla AP2.3-1. Resultados de la prueba de Kolmogorov-Smirnov
de la base de datos femenina, todos los sujetos..... 234
Tabla AP2.3-2. Resultados de la prueba de Kolmogorov-Smirnov
de la base de datos femenina, sujetos
normofónicos........................................................... 235
Tabla AP2.3-3. Resultados de la prueba de Kolmogorov-Smirnov
de la base de datos femenina, sujetos con
patología vocal......................................................... 236
Tabla AP2.3-4. Resultados de la prueba de Kolmogorov-Smirnov
de la base de datos masculina, todos los sujetos.... 238
Tabla AP2.3-5. Resultados de la prueba de Kolmogorov-Smirnov
de la base de datos masculina, sujetos
normofónicos........................................................... 239
Tabla AP2.3-6. Resultados de la prueba de Kolmogorov-Smirnov
de la base de datos masculina, sujetos con
patología vocal......................................................... 240
Tabla AP2.3-7. Resultados de las pruebas de Kolmogorov-
Smirnov-Lilliefors y Saphiro-Wilk de la base de
datos femenina, todos los sujetos........................... 242
Tabla AP2.3-8. Resultados de las pruebas de Kolmogorov-
Smirnov-Lilliefors y Saphiro-Wilk de la base de
datos femenina, sujetos normofónicos y con
patología vocal......................................................... 243
xxv
Tabla AP2.3-9. Resultados de las pruebas de Kolmogorov-
Smirnov-Lilliefors y Saphiro-Wilk de la base de
datos masculina, todos los sujetos.......................... 245
Tabla AP2.3-10. Resultados de las pruebas de Kolmogorov-
Smirnov-Lilliefors y Saphiro-Wilk de la base de
datos masculina, sujetos normofónicos y con
patología vocal......................................................... 246
Tabla AP2.4-1. Resultados del test de Levene de homogeneidad
de varianzas de la base de datos femenina............. 250
Tabla AP2.4-2. Resultados del test de Levene de homogeneidad
de varianzas de la base de datos masculina............ 255
Tabla AP3-1. Resultados de la prueba t de diferencia de medias
de la base de datos femenina.................................. 262
Tabla AP3-2. Resultados de la prueba t de diferencia de medias
de la base de datos masculina................................. 264
Tabla AP4-1. Resultados de la prueba U de Mann-Whitney de la
base de datos femenina........................................... 268
Tabla AP4-2. Resultados de la prueba de reacciones extremas
de Moses de la base de datos femenina.................. 269
Tabla AP4-3. Resultados de la prueba de Kolmogorov-Smirnov
para dos muestras de la base de datos femenina... 270
Tabla AP4-4. Resultados de la prueba de las rachas de Wald-
Wolfowitz de la base de datos femenina................. 271
Tabla AP4-5. Resultados de la prueba U de Mann-Whitney de la
base de datos masculina.......................................... 272
Tabla AP4-6. Resultados de la prueba de reacciones extremas
de Moses de la base de datos masculina................. 273
Tabla AP4-7. Resultados de la prueba de Kolmogorov-Smirnov
para dos muestras de la base de datos masculina... 274
Tabla AP4-8. Resultados de la prueba de las rachas de Wald-
Wolfowitz de la base de datos masculina................ 275
Tabla AP5-1-1. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, todos
los casos (primera parte)......................................... 278
Tabla AP5-1-2. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, todos
los casos (segunda parte)........................................ 279
Tabla AP5-1-3. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, todos
los casos (tercera parte).......................................... 280
Tabla AP5-1-4. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, todos
los casos (cuarta parte)............................................ 280
Tabla AP5-2-1. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, casos
patológicos (primera parte)..................................... 281
xxvi
Tabla AP5-2-2. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, casos
patológicos (segunda parte).................................... 282
Tabla AP5-2-3. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, casos
patológicos (tercera parte)...................................... 283
Tabla AP5-2-4. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, casos
patológicos (cuarta parte)........................................ 283
Tabla AP5-3-1. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, casos
normofónicos (primera parte)................................. 284
Tabla AP5-3-2. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, casos
normofónicos (segunda parte)................................ 285
Tabla AP5-3-3. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, casos
normofónicos (tercera parte).................................. 286
Tabla AP5-3-4. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos femenina, casos
normofónicos (cuarta parte).................................... 286
Tabla AP5-4-1. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, todos
los casos (primera parte)......................................... 287
Tabla AP5-4-2. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, todos
los casos (segunda parte)........................................ 288
Tabla AP5-4-3. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, todos
los casos (tercera parte).......................................... 289
Tabla AP5-4-4. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, todos
los casos (cuarta parte)............................................ 289
Tabla AP5-5-1. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, casos
patológicos (primera parte)..................................... 290
Tabla AP5-5-2. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, casos
patológicos (segunda parte).................................... 291
Tabla AP5-5-3. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, casos
patológicos (tercera parte)...................................... 292
Tabla AP5-5-4. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, casos
patológicos (cuarta parte)........................................ 292
xxvii
Tabla AP5-6-1. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, casos
normofónicos (primera parte)................................. 293
Tabla AP5-6-2. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, casos
normofónicos (segunda parte)................................ 294
Tabla AP5-6-3. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, casos
normofónicos (tercera parte).................................. 295
Tabla AP5-6-4. Índices de correlación Tau-Kendall entre los
parámetros de la base de datos masculina, casos
normofónicos (cuarta parte).................................... 295
Tabla AP6-1. Estructura factorial de la base de datos femenina,
todos los casos, sin rotación, a partir de la matriz
de componentes...................................................... 298
Tabla AP6-2. Estructura factorial de la base de datos femenina,
todos los casos, rotación varimax, a partir de la
matriz de componentes rotada............................... 299
Tabla AP6-3. Estructura factorial de la base de datos femenina,
casos patológicos, sin rotación, a partir de la
matriz de componentes........................................... 300
Tabla AP6-4. Estructura factorial de la base de datos femenina,
casos patológicos, rotación varimax, a partir de la
matriz de componentes rotada............................... 301
Tabla AP6-5. Estructura factorial de la base de datos femenina,
casos normofónicos, sin rotación, a partir de la
matriz de componentes........................................... 302
Tabla AP6-6. Estructura factorial de la base de datos masculina,
casos normofónicos, rotación varimax, a partir de
la matriz de componentes rotada............................ 303
Tabla AP6-7. Estructura factorial de la base de datos masculina,
todos los casos, sin rotación, a partir de la matriz
de componentes...................................................... 304
Tabla AP6-8. Estructura factorial de la base de datos masculina,
todos los casos, rotación varimax, a partir de la
matriz de componentes rotada............................... 305
Tabla AP6-9. Estructura factorial de la base de datos masculina,
casos patológicos, sin rotación, a partir de la
matriz de componentes........................................... 306
Tabla AP6-10. Estructura factorial de la base de datos masculina,
casos patológicos, rotación varimax, a partir de la
matriz de componentes rotada............................... 307
Tabla AP6-11. Estructura factorial de la base de datos masculina,
casos normofónicos, sin rotación, a partir de la
matriz de componentes........................................... 308
xxviii
Tabla AP6-12. Estructura factorial de la base de datos masculina,
casos normofónicos, rotación varimax, a partir de
la matriz de componentes rotada............................ 309
xxix
Índice de figuras
xxx
Fig. 3-3. Estimación de la fuente glótica (arriba), de la onda acústica
promedio (centro) y de la onda mucosa (abajo)................... 40
Fig. 3-4. Densidad espectral de potencia de la fuente glótica
(arriba), de la onda acústica media (centro) y de la onda
mucosa (abajo)...................................................................... 41
Fig. 3-5. a) Transadmitancia del modelo biomecánico de tres masas
de los pliegues vocales. b) Densidad espectral de potencia
de la onda mucosa para una voz normofónica típica........... 42
Fig. 3-6. La densidad espectral de potencia de la onda mucosa se
puede dividir en cuatro bandas de energía. Los valores de
energía de cada banda corresponden a los parámetros
p11, p12, p13 y p14 (línea de rayas y puntos alternos)........ 45
Fig. 3-7. Densidad espectral de potencia de la fuente glótica y su
envolvente............................................................................ 46
Fig. 3-8. Envolvente de la densidad espectral de potencia de la
fuente glótica, y valores de amplitud y frecuencia que
conforman el primer surco................................................... 47
Fig. 3-9. Representación de algunos parámetros glóticos
biométricos........................................................................... 48
Fig. 3-10. Representación esquemática de los dos primeros surcos
de la envolvente de la densidad espectral de potencia de
la fuente glótica; (a) se corresponde con la forma esperada
de los surcos; (b) representa la forma real, donde se
aprecia que dos de los puntos esperados coinciden............ 50
Fig. 3-11. Representación esquemática de la envolvente de la
densidad espectral de potencia de la fuente glótica; (a) se
corresponde con la forma esperada del inicio de la señal,
donde se diferencian el punto de origen (or) y el primer
mínimo (m1); (b) representa la forma obtenida, donde se
aprecia que los dos puntos en cuestión coinciden............... 50
Fig. 3-12. Puntos singulares en un ciclo de fonación de acuerdo al
modelo L-F............................................................................ 53
Fig. 4-1. Pantalla de la aplicación MDVP, donde se aprecia la
representación vectorial conjunta de los parámetros
analizados............................................................................. 67
Fig. 4-2. Pantalla del módulo de evaluación de la calidad vocal de la
aplicación Dr. Speech 4 (tomado de Zaoming, D. & Huang,
H., 1998)................................................................................ 68
Fig. 4-3. Pantalla del módulo de edición de la aplicación MediVoz
Captura................................................................................. 69
Fig. 4-4. Pantalla de la aplicación WPCVox......................................... 69
Fig. 4-5. Pantalla principal de la aplicación BioMet®Phon.................. 72
Fig. 4-6. Pantalla de introducción de datos y configuración de la
aplicación BioMet®Phon....................................................... 73
Fig. 5-1. Diagrama de caja (boxplot) y sus elementos (tomado de
Pardo, A. & Ruiz, M.Á., 2002)................................................ 78
xxxi
Fig. 5-2. Representación de la función discriminante, de las
distribuciones de dos grupos de variables, de sus
centroides y de la distancia entre los centroides (tomado
de Pardo, A. & Ruiz, M.Á., 2002)........................................... 91
Fig. 6-1. Representación gráfica de los datos correspondientes a los
factores presentes en la tabla 6-73....................................... 158
Fig. 6-2. Representación gráfica de los datos correspondientes a los
parámetros presentes en la tabla 6-73................................. 158
Fig. 6-3. Representación gráfica de los datos correspondientes a los
factores presentes en la tabla 6-80....................................... 164
Fig. 6-4. Representación gráfica de los datos correspondientes a los
parámetros presentes en la tabla 6-80................................. 164
Fig. AP1-1. Captura de pantalla de la herramienta Adobe Audition....... 198
Fig. AP1-2. Captura de pantalla de la herramienta desarrollada............ 199
xxxii
1. Introducción
Capítulo 1: Introducción
Podemos observar que el estado del arte del trabajo completo se encuentra
repartido entre los cuatro primeros capítulos: el primero de ellos repasa algunos
elementos relacionados de forma general con el trabajo realizado, mientras que los
tres siguientes se centran en aspectos más específicos que forman el núcleo de la tesis.
El quinto capítulo contiene una breve explicación sobre las características más
importantes de las técnicas estadísticas empleadas en el desarrollo de este trabajo:
métodos descriptivos, test de normalidad, pruebas de diferencia de distribuciones
estadísticas, estudios de correlación, análisis factorial basado en componentes
principales y análisis discriminante, realizadas con el objetivo de presentar una
completa descripción de los parámetros, precisar la importancia relativa de los
2
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Por otra parte, hábitos poco saludables como el consumo de tabaco o el abuso del
alcohol, la exposición frecuente a ambientes polucionados o la contaminación acústica
que se produce en las ciudades, el uso excesivo o el mal uso de aparatos de aire
acondicionado, factores como la alergia o el envejecimiento, etc., contribuyen de
manera importante al hecho de agravar los trastornos vocales (Gómez, P. et al, 2007),
(Gómez, P. et al, 2011).
1
HyperText Markup Language, lenguaje de marcado estándar utilizado para la elaboración de páginas
web.
3
Capítulo 1: Introducción
El presente estudio tiene por lo tanto su raíz en el análisis de la voz, con la intención
de contribuir en la resolución de los problemas arriba mencionados: es conveniente
tratar de realizar un pre-diagnóstico de las patologías vocales de manera rápida,
económica y no invasiva, cosa que además facilitará los diagnósticos tempranos.
4
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
5
Capítulo 1: Introducción
Este estudio está centrado en las patologías de la voz. Sin embargo, este concepto
es amplio, pues incluye alteraciones procedentes de disfunciones orgánicas de la
laringe, así como problemas funcionales, respiratorios, neurológicos, de resonancia,
congénitos o psiquiátricos. La presente tesis se centrará sobre todo en la disfonía
resultado de patologías de la voz basadas en alteraciones orgánicas de la laringe,
incluso más específicamente, de los pliegues vocales2. Los pliegues vocales son
estructuras frágiles que juegan un papel crucial en el proceso de producción de voz, y
un gran porcentaje de las enfermedades vocales se debe a algún tipo de alteración o
mal funcionamiento de ellos (Gómez, P. et al, 2011). Sin embargo, el estudio también
puede incluir otro tipo de patologías vocales, siempre y cuando manifiesten una
perturbación en los parámetros utilizados.
De acuerdo con lo anterior, y de forma general, cabe mencionar que las posibles
patologías principales que podemos encontrar en los sujetos que forman la base de
datos utilizada son de alguna de las categorías que aparecen en la tabla 1-1 (Dworkin,
J.P. & Meleca, R.J., 1997).
2
Aún así, en lo que resta de documento hablaremos genéricamente de “patologías vocales” o de
“patologías de la voz”, refiriéndonos exclusivamente a las que aquí tratamos.
6
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Los parámetros glóticos extraídos suponen una aportación en sí mismos por parte
de nuestro grupo de investigación, por lo que demandan un completo estudio
estadístico de cara a establecer relaciones entre ellos, a reducir la dimensionalidad del
problema y a determinar su importancia relativa para las tareas de detección. Este
estudio será realizado bajo un enfoque descriptivo-exploratorio, sin utilizar hipótesis
previas.
7
Capítulo 1: Introducción
1.4. Objetivos
Los objetivos marcados para la consecución del trabajo son los siguientes:
Tratar de, a partir de los dos objetivos anteriores, alcanzar conclusiones acerca
de las posibles relaciones establecidas entre los parámetros glóticos empleados
en el estudio y acerca de la importancia relativa de los mismos.
8
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
9
Capítulo 1: Introducción
Por otra parte, el análisis perceptual también puede ser realizado por personal no
entrenado, como los propios pacientes. En ocasiones los pacientes se autoevalúan
tomando como referencia su propia capacidad para cubrir sus expectativas sociales y
profesionales, lo que puede resultar de interés. Por otro lado, diferentes estudios
demuestran que un nivel de entrenamiento demasiado elevado por parte del
11
Capítulo 1: Introducción
Una de las cuestiones abiertas en la escala GRBAS consiste en el hecho de que las
diferentes características se miden de forma independiente, aunque generalmente se
suelen sumar las puntuaciones obteniendo una valoración global. Sin embargo, el
parámetro G, grado general, también recoge la percepción global de disfonía. Esta
cuestión es analizada desde un punto de vista estadístico en (Dejonckere, P. H. &
Lebacq, J., 1996), aunque el problema aún sigue abierto. Por otro lado, no está del
todo definido cómo contribuye cada uno de los parámetros para un nivel dado de
patología. Por ejemplo, no sabemos si una voz etiquetada con el valor uno (1) tanto en
el parámetro B como en el parámetro R (y con el valor cero (0) en los demás
parámetros) es más o menos disfónica que otra voz etiquetada con el valor dos (2) en
el parámetro R (y con el valor cero (0) en los demás parámetros) (Pedro Gómez Vilda
et al 2011).
3
Cuando hablamos de desviación nos referimos en los tres casos a desviación respecto a la normalidad.
12
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
13
Capítulo 1: Introducción
Fig. 1-4. Versión del cuestionario VHI atendiendo a los aspectos social, físico y
psicológico, respectivamente (tomado de Kandogan, T. & Sanal, A., 2005).
14
2. Producción y fisiología de la voz
Capítulo 2: Producción y fisiología de la voz
Otra importante aportación del siglo XVII fue realizada por Bernard Lamy, que
intuyó el funcionamiento de los pliegues vocales en su obra “La réthorique ou l´art de
parler”, publicada en 1675 (Lamy, B., 1741).
Claude Perrault publicó en 1680 “Du bruit (et) De la musique des anciens”, donde
recoge ideas bastante ajustadas a la realidad que hoy conocemos. Perrault dividió los
sistemas sonoros en dos categorías: instrumentos de percusión e instrumentos por
verberación, situando al órgano productor de voz entre estos últimos. Para él la voz es
un ruido producido por la salida violenta del aire que en su paso hacia el exterior frota
las dos membranas que configuran la glotis. Además, explica la generación de las
distintas tonalidades de la voz por las variaciones de longitud y de tensión de los
pliegues vocales.
16
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Los pliegues vocales aducidos en contacto uno con otro vibran al paso del aire
produciendo el sonido denominado voz.
La ausencia en la preparación anatómica de epiglotis y bandas ventriculares
reduce el volumen del sonido emitido.
El tono asciende cuando aumenta la tensión de los pliegues vocales.
Cuando la tensión de los pliegues vocales se mantiene, un aumento de la presión
del aire significa un ascenso del tono equivalente a una quinta.
17
Capítulo 2: Producción y fisiología de la voz
Como conclusión del apartado cabe mencionar que todos los procedimientos de
experimentación realizados durante los siglos comprendidos entre el XVI y el XIX
fueron realizados sobre laringes de cadáveres y sobre laringes artificiales. Sin embargo,
el procedimiento que más información real proporciona es la visión de cualquier
fenómeno desde su inicio hasta su culminación en su situación fisiológica normal,
hecho que sólo fue posible a partir de 1854 gracias a la invención del espejo laríngeo
(ver figura 2-1) por parte del pedagogo vocal Manuel Patricio Rodríguez García,
acontecimiento que se considera como el punto de partida de la laringología como
especialidad clínica (Wikipedia, 2014g), (American Otological Society, 1905).
En 1958 Janwillem Van den Berg expuso la teoría más aceptada hasta la fecha sobre
la producción de la voz: su teoría mioelástica y aerodinámica (Van den Berg, J., 1958).
La teoría de Van den Berg tiene su antecedente en la teoría mioelástica enunciada por
Ewald en 1898, también denominada actualmente “teoría mioelástica primitiva” (Le
18
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Huche, F. & Allali, A., 2004), (García-Ruiz, J., 2010a), y se desarrolla en parte como
respuesta a la teoría neurocronáxica de Husson publicada en 1950 (Le Huche, F. &
Allali, A., 2004). En realidad, la teoría de Van den Berg evolucionará incluyendo las
aportaciones de diferentes investigadores a lo largo de distintos años comprendidos
entre 1958 y 1976: el propio Van den Berg, Smith, Cornut y Lafon, Perelló, Vallancien,
Liberman, Hirano y Wyke realizaron aportaciones significativas, sustituyendo en
ocasiones el nombre original por el de teoría mucoondulatoria, teoría mioelástica
perfeccionada o teoría impulsional (Le Huche, F. & Allali, A., 2004), (García-Ruiz, J.,
2010a).
De acuerdo con la teoría general de Van den Berg, durante la fonación los pliegues
vocales se aproximan lo suficiente como para provocar que la presión pulmonar
aumente lo bastante como para forzar la separación de los pliegues (es decir, la
apertura glótica). Ello hace que se emita un breve pulso de flujo de aire glótico, que
reduce la presión pulmonar, y que junto a las fuerzas elásticas de recuperación induce
un nuevo cierre glótico. La sucesión de estos fenómenos establece el régimen de
vibración de los pliegues vocales durante la fonación (Gómez, P., 2002), (Story, B. H.,
2002).
Liberman, en 1968, ofrece una explicación más detallada del ciclo vibratorio de los
pliegues vocales, afirmando que dos tipos de fuerzas actúan sobre ellas:
Fuerzas aerodinámicas y aeroestáticas desplazan los pliegues vocales de su
posición de aducción en su preparación para la fonación.
Fuerzas del tejido que actúan restituyendo los pliegues a su posición de
aducción.
19
Capítulo 2: Producción y fisiología de la voz
Fig. 2-3. Ciclo idealizado de vibración de los pliegues vocales. Advertir que la parte
inferior de los pliegues vocales guía el movimiento de la parte superior, creando un
movimiento ondulatorio en la cubierta de los pliegues conocido como onda mucosa
(tomado de Story, B.H., 2002).
20
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
la aportación de Hirano referente a la onda mucosa. Cabe añadir que la presencia del
tracto vocal también contribuye a que se produzca la oscilación (Story, B.H., 2002).
A partir de las teorías expuestas se han desarrollado diferentes modelos que
representan el comportamiento de los pliegues vocales. Estos modelos permiten
realizar síntesis de voz, profundizando en el conocimiento de la fonación. Además, dan
lugar al análisis de parámetros biomecánicos como la masa o la elasticidad de los
pliegues vocales, de gran interés en el objetivo de la detección de patologías vocales.
21
Capítulo 2: Producción y fisiología de la voz
desplazamiento lateral a cada masa, que está conectada con una pared rígida a través
de sendos sistemas resorte-amortiguador. Además, las dos masas están unidas entre sí
a través de otro sistema similar. Los dos grados de libertad presentes permiten
representar tanto la onda mucosa como el movimiento lateral global (ver figura 2-5).
22
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
23
Capítulo 2: Producción y fisiología de la voz
2. Transmisión, que está condicionada por las resonancias del tracto vocal, formado
por las cavidades supraglóticas: faringe, cavidad oral y cavidad nasal.
3. Radiación, debida a la apertura de la boca y a la posición de los labios.
24
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Fig. 2-7. Triángulo vocálico del castellano, que muestra sus cinco vocales cardinales.
25
Capítulo 2: Producción y fisiología de la voz
La frecuencia o altura está regulada por la acción de los músculos tensores de los
pliegues vocales (cricotiroideo y tiroaritenoideo). En el caso de la voz hablada
con naturalidad los pliegues vocales adoptan una posición de equilibrio fruto del
mínimo esfuerzo producido por estos músculos. El alargamiento o elongación del
pliegue produce un incremento de la frecuencia fundamental de la señal,
acompañado de un aumento de la tensión y una disminución de la elasticidad
del pliegue, por lo que la ondulación disminuye. El mecanismo opuesto es el
acortamiento del pliegue vocal, que provoca una reducción de la frecuencia
fundamental, que implica a su vez una disminución de la tensión. Por su parte, el
tracto vocal actúa como amplificador selectivo de determinadas frecuencias y
como atenuador de otras.
26
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
2.4. Revisión del uso de parámetros acústicos procedentes de la señal de voz para
la detección de patología vocal
4
En realidad, los parámetros de tiempo largo también se calculan generalmente en tramos cortos de la
señal, pero como sólo tienen sentido en tramos largos, se suele calcular la media de los resultados.
27
Capítulo 2: Producción y fisiología de la voz
de ellos, los coeficientes LPC (Godino Llorente, J.I., 2002), (Deller, J. R., Proakis, J. G., &
Hansen, J. H., 1993), (Faúndez Zanuy, M., 2000) están relacionados con la técnica de
predicción lineal, útil para codificar la señal y para sintetizar la voz. Es una técnica que
trabaja en el dominio del tiempo y que se basa en predecir el valor de una muestra
como combinación lineal de p muestras anteriores, de acuerdo a la siguiente ecuación:
Fig. 2-10. Ejemplo de espectro LPC en voz cantada, realizado con el programa Dr.
Speech (tomado de Huang, D.Z. & Watson, C., 1998).
Sin embargo, precisamente por su vinculación al tracto vocal y por tanto a las
características del locutor y del mensaje, y no tanto a los pliegues vocales y a su
vibración –origen más frecuente de los desórdenes vocales–, los coeficientes LPC no
han sido demasiado utilizados en el campo de la detección de patología vocal, aunque
autores como Childers han detectado variabilidad entre los espectros LPC de voces
normales y patológicas (Childers, D.G. & Bae, K.S., 1992). También podemos encontrar
en (Castrillón, O., Castellanos, G. & Daza, G., 2006) un estudio multiparamétrico
destinado a detectar hipernasalidad en niños en el que se utilizan los coeficientes LPC:
después de sucesivas etapas enfocadas a reducir la dimensionalidad del problema los
primeros coeficientes LPC resultaron ser suficientemente discriminantes. Otro ejemplo
28
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Los dos diagramas más empleados a partir del cálculo de la FFT son el
espectrograma, que representa la evolución temporal de los distintos valores
frecuenciales, cuyo valor en intensidad se expresa mediante niveles de colores o grises
(ver figura 2-11) y el propio espectro FFT, que representa el valor en amplitud o
intensidad de los armónicos para una frecuencia dada (ver figura 2-12). También es
habitualmente utilizada la señal conocida como densidad espectral de potencia
(conocida también por su nombre en inglés, power spectral density), que ofrece los
valores de potencia de la señal (eje de ordenadas) para las diferentes frecuencias (eje
de abscisas).
29
Capítulo 2: Producción y fisiología de la voz
Fig. 2-12. Espectro FFT de la palabra patata, realizado con el programa lingWAVES
(tomado de Villayandre, M., 2011).
En cuanto a los parámetros extraídos a partir de esta técnica, en (Kuo, J., Holmberg, E.
B., & Hillman, R.E., 1999) podemos encontrar el uso de distintas relaciones entre
armónicos y armónicos próximos a los formantes. En particular, el estudio incluye los
parámetros H1-A1, H1-A3, A1-A3 y H1-H2, que se corresponden con las diferencias en
amplitud entre distintas combinaciones de los armónicos y de los armónicos más
cercanos al formante , respectivamente. Estos parámetros, combinados con otros
que el autor denomina aerodinámicos y que están asociados a la señal glótica son
utilizados en la técnica estadística de análisis discriminante, obteniendo una buena
separación entre casos que presentan patología vocal (en concreto, nódulos bilaterales
en los pliegues vocales) y casos etiquetados como normales. En (Holmberg, E.B.,
Hillman, R. E., & Perkell, J. S., 1988) se utiliza la diferencia de energía entre los dos
primeros armónicos, el cociente entre los armónicos más próximos al primer y al
tercer formante y los parámetros H1-A1 y H1-A3, encontrando correlación estadística
entre estos parámetros y la presencia o ausencia de determinadas patologías vocales.
Otros autores han analizado la diferencia de energía entre distintas bandas
frecuenciales, encontrando también diferencias entre voces normales y voces con
patología vocal (Hammarberg, B., Fritzell, B., & Schiratzki, H., 1984), (Hammarberg, B.
et al, 1980), (Kitzing, P., 1986).
30
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
31
Capítulo 2: Producción y fisiología de la voz
En (Wallen, E.J. & Hansen, J.H., 1996) también se utiliza otro parámetro cepstral: la
amplitud media del pico cepstral principal, para, en combinación con otros
parámetros, y a través de un sistema basado en redes de neuronas artificiales,
identificar pacientes con cáncer de laringe. En esta ocasión la tasa de acierto global fue
del 85,5%. En (Bovbel E.I. & Toumilovich, M.A., 1999) se emplean 24 coeficientes MFCC
en un estudio basado en modelos ocultos de Markov, con, según los autores, buenos
resultados.
32
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Destacaremos en este apartado los buenos resultados obtenidos con los coeficientes
MFCC, así como la incorporación de la primera y segunda derivada a los estudios. Más
adelante, en (Fraile Muñoz et al, 2008) se utilizan nuevos parámetros cepstrales
propuestos por los autores que obtienen unos resultados similares a los obtenidos con
parámetros MFCC, pero aportan una interpretación física más sencilla. En (Godino-
Llorente, J.I. & Gómez-Vilda, P., 2004) se utilizan de nuevo los parámetros MFCC en
clasificadores basados en redes de neuronas, alcanzando una tasa de acierto global del
96%. En (Godino-Llorente, J.I., Gomez-Vilda, P., & Blanco-Velasco, M., 2006) se vuelven
a utilizar los parámetros MFCC con su primera derivada, demostrando que el uso de la
segunda derivada es prescindible. El estudio emplea para la clasificación el coeficiente
de discriminación de Fisher y el coeficiente F. En (Benba, A., Jilbab, A. & Hammouch,
A., 2014) se utilizan los parámetros MFCC comprimidos mediante cuantización
vectorial para detectar la enfermedad de Parkinson, obteniendo una tasa de éxito del
82%.
Los parámetros de tiempo largo han sido más utilizados en el campo de la detección
de patología vocal. En particular, se ha trabajado ampliamente con tres tipos o familias
de parámetros: los relacionados con la variación de la frecuencia de la señal, los
relacionados con la variación de la amplitud de la señal y los relacionados con la
presencia de ruido en la señal. Los dos primeros grupos se producen porque la
vibración de los pliegues vocales presenta irregularidades, que son mayores en
presencia de patología vocal. Por otro lado, todas estas medidas se suelen realizar con
pronunciación de vocales sostenidas, ya que aunque es posible tomarlas para habla
continua, en este caso se mezclan sonidos sordos con sonoros, por lo que tanto la
variación de las medidas como la presencia de ruido (inherente a los sonidos
consonánticos) será mayor y menos controlable.
siendo N el número de ciclos analizado, y el valor del período del i-ésimo ciclo.
En cuanto a los trabajos que han utilizado estos parámetros, cabe destacar en
primer lugar el descrito en (Boyanov, B. & Hadjitodorov, S., 1997), en el que se utilizan
parámetros extraidos a partir de los tres dominios mencionados (temporal, frecuencial
y cepstral) y de distinta naturaleza: perturbación de la frecuencia, perturbación de la
amplitud, medidas de ruido y medidas de energía, entre otros. El trabajo destaca
porque propone una técnica de clasificación basada en redes de neuronas y en análisis
discriminante que ofrece muy buenos resultados, y también porque el artículo incluye
una amplia revisión del estado del arte asociado a los parámetros acústicos utilizados y
al análisis acústico en general.
34
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
En (Yumoto, E., Gould, W.J., & Baer, T., 1982) encontramos un estudio que trata de
medir la eficacia del parámetro HNR, midiéndolo en 20 personas con patología vocal y
en 42 personas sin ella, haciéndolo en el primer caso tanto antes como después de un
proceso quirúrgico. Los resultados fueron satisfactorios desde el punto de vista
estadístico, obteniendo los siguientes valores medios: grupo normal, 11,9 dB; grupo
postoperatorio, 11,3 dB y grupo preoperatorio, 1,2 dB. Además, los autores
concluyeron que existía correlación entre la medida HNR y una evaluación subjetiva
realizada por expertos basada en el análisis visual del espectrograma. También se
advierte que el método empleado no es válido para pacientes con patologías vocales
graves.
El parámetro HNR también fue analizado por (Wolfe, V., Cornell, R., & Palmer, C.,
1991), extrayendo en esta ocasión su valor en cuatro regiones espectrales diferentes.
También se emplearon otros parámetros, como la frecuencia fundamental o el jitter,
aplicados sobre 49 personas afectadas de diferentes patologías vocales (pólipos,
nódulos, edema, etcétera). Las voces se dividieron en aéreas, roncas y tensas,
obteniendo unas tasas globales de acierto para cada categoría de un 76%, 86% y 80%,
respectivamente. El método clasificador empleado fue el análisis discriminante.
El índice NNE fue probado por (Kasuya, H. et al, 1986a) con una importante muestra
de 250 personas, 64 en el grupo de control (sin patología vocal) y 186 afectadas de
diferentes trastornos vocales. Se destaca la capacidad de discriminación de la medida
para determinadas enfermedades como cáncer glotal, presencia de nódulos en los
pliegues vocales y parálisis recurrente del nervio. En concreto, el índice NNE resultó de
altísima fiabilidad para estadios intermedios y avanzados de cáncer glotal (“los
diferencia perfectamente de los sujetos sanos”), aunque empeoró su rendimiento en
estadios tempranos (22,6% de falsos negativos y 9,4% de falsos positivos). Más tarde,
en (Kasuya, H. et al, 1986b) el parámetro NNE se combina con el cálculo del número de
tramas no sonoras y con los parámetros PPQ y APQ sobre una base de datos de 991
personas afectadas de cáncer. Lo más destacado de los resultados fue el hecho de que
una medida combinada de los parámetros utilizados consiguió detectar el cáncer en
varios casos en los que un análisis perceptual había dado un resultado negativo.
En (Plante, F. et al, 1993) y (Wallen, E.J. & Hansen, J.H., 1996), ya mencionados más
arriba, junto a los parámetros de tiempo corto entonces comentados se emplearon
también perturbaciones de frecuencia y amplitud, además de estimadores de ruido
(NHR, NNE) en el primero de los dos trabajos.
35
Capítulo 2: Producción y fisiología de la voz
36
3. Parámetros glóticos presentes en el estudio
Capítulo 3: Parámetros glóticos presentes en el estudio
5
En general, éstos serán los trastornos tratados en esta tesis, aunque como veremos en el capítulo
cuatro existen ciertas patologías no relacionadas con los pliegues vocales que también pueden ser
detectadas gracias a los parámetros glóticos.
38
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Una de las señales resultado del proceso es, como hemos visto, la derivada de la
fuente glótica . La integración de esta señal da como resultado la fuente glótica
, objetivo del estudio. Podemos encontrar el proceso completo descrito con más
detalle en (Gómez P. et al, 2004a), además de en las referencias ya citadas.
Fig. 3-2. Señal de voz de entrada (arriba) y estimación de la fuente glótica (abajo).
39
Capítulo 3: Parámetros glóticos presentes en el estudio
40
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
41
Capítulo 3: Parámetros glóticos presentes en el estudio
Fig. 3-5. a) Transadmitancia del modelo biomecánico de tres masas de los pliegues
vocales. b) Densidad espectral de potencia de la onda mucosa para una voz
normofónica típica.
La técnica general aplicada para obtener los valores de los parámetros (Gómez, P. et
al, 2009b) consiste en obtener segmentos de la señal coincidentes con un ciclo de
fonación, comprendidos desde un pico de cierre hasta el siguiente. En el estudio actual
se han utilizado para la voz masculina tramos de voz de 200 milisegundos que
contienen aproximadamente veinte ciclos de fonación, con una frecuencia
fundamental de 100 Hz y para la voz femenina se han utilizado tramos de la misma
duración que contienen aproximadamente cuarenta ciclos de fonación con una
frecuencia fundamental de 200 Hz.
42
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
En el presente estudio trabajaremos con el valor medio, de modo que para cada
parámetro contaremos con un vector de observaciones
43
Capítulo 3: Parámetros glóticos presentes en el estudio
Cociente de la diferencia entre la amplitud del pico de cierre de los ciclos vecinos
respecto a su valor medio en el segmento de voz considerado (p6).
Cociente de la diferencia entre la esbeltez del pico de cierre de los ciclos vecinos
respecto a su valor medio en el segmento de voz considerado (p7).
44
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
45
Capítulo 3: Parámetros glóticos presentes en el estudio
En la figura 3-8 podemos observar etiquetados los puntos que forman parte del
primer surco en “V”: tenemos un máximo de amplitud y frecuencia , seguido
de un mínimo de amplitud y frecuencia y de un nuevo máximo de amplitud
y frecuencia . Este primer surco tiene una importancia especial: si la señal
utilizada es la fuente glótica ofrece una estimación del acoplamiento existente entre el
6
También es posible utilizar la onda mucosa para obtener estos parámetros.
46
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
cuerpo y la cubierta del pliegue vocal, si por el contrario la señal utilizada es la onda
mucosa podemos obtener una medida del acoplamiento entre los labios subglóticos y
supraglóticos del pliegue vocal (Gómez, P. et al, 2009b), (Svec, J.G. et al, 2000).
Estos surcos aparecen varias veces más a lo largo de la caída de la curva, en todos
los locutores: en los que no presentan patología la forma de los surcos es bastante
afilada, característica que disminuye en ciertos casos patológicos. Sin embargo, en
patologías específicas como el edema de Reinke el carácter afilado de los surcos
incluso podría aumentar. En todo caso, la desviación del perfil en un caso concreto
respecto a una población normativa se puede relacionar con presencia de patología
(Gómez, P. et al, 2009b).
Los valores obtenidos para los puntos del primer surco obedecen a las siguientes
expresiones (Gómez, P. et al, 2009b):
47
Capítulo 3: Parámetros glóticos presentes en el estudio
Por otra parte, el factor slenderness (esbeltez) del surco se define como:
48
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
La parte (a) de la figura recoge la situación esperada, razón por la cual contábamos
con tener cuatro parámetros en cada dimensión preparados para recoger el valor de
los cuatro máximos. La parte (b) recoge la situación real, en la que se aprecia que los
valores de dos de los máximos (el segundo y el tercero) coinciden.
49
Capítulo 3: Parámetros glóticos presentes en el estudio
cada caso una de las dos variables que contienen los valores duplicados. En concreto,
no consideraremos en el estudio a los parámetros 20 y 29, correspondientes al tercer
máximo, pero sí a los parámetros 19 y 28, correspondientes al segundo máximo;
tampoco consideraremos a los parámetros 16 y 25, correspondientes al mínimo inicial,
pero sí a los parámetros 15 y 24, correspondientes al punto origen de la señal. A pesar
de excluir del estudio a los parámetros mencionados mantendremos la numeración
propuesta inicialmente, de cara a mantener la coherencia con los estudios publicados.
Por último, el parámetro de pérdida puede ser estimado (con un factor de escala
) como:
51
Capítulo 3: Parámetros glóticos presentes en el estudio
52
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
En la figura podemos observar los puntos singulares que dan lugar a los parámetros
temporales presentes en el estudio. Tres de estos puntos singulares dividen el ciclo de
fonación, de período T, en cuatro fases o intervalos principales:
53
Capítulo 3: Parámetros glóticos presentes en el estudio
Por otra parte, estos estudios trabajan generalmente con la fuente glótica o con su
derivada, frecuentemente denominada residuo, siendo la obtención y el análisis de
parámetros relacionados con la onda mucosa y la onda acústica promedio una
novedad en el campo, aportada por nuestro grupo de investigación y recogida
principalmente en (Gómez, P. et al, 2004d), (Gómez, P. et al, 2005b).
En (Orr, R., Cranen, B. & Jong, F.I.D., 2003) encontramos un estudio en el que
también se utilizan parámetros glóticos, aunque en esta ocasión con un propósito
diferente: el autor pretende comparar las medidas obtenidas a partir de la señal de voz
con las obtenidas a partir del uso de una máscara de Rothenberg, bajo la hipótesis de
que debería existir una fuerte correlación entre ambas.
Los parámetros escogidos para hacer la experimentación fueron la diferencia entre
los dos primeros armónicos (H1-H2), una medida de la caída de la envolvente espectral
(spectral slope), el cociente de velocidad (SP, Speed Quotient) y el cociente de apertura
(OQ, Open Quotient).
Los resultados no confirmaron la hipótesis, no se encontraron correlaciones entre
los parámetros obtenidos por las dos vías mencionadas. Es conocido que la señal de
voz se puede estimar a partir de una derivada de primer orden de la señal de flujo
aéreo en la boca (Flanagan, J.L., 1972), por lo que ambas señales recogen
esencialmente la misma información, con la excepción de una componente de señal
55
Capítulo 3: Parámetros glóticos presentes en el estudio
continua presente en la fuente glótica. Por estas razones se esperaba, según los
autores, que los parámetros medidos hubieran sido comparables, pero los estudios
estadísticos realizados afirmaron lo contrario.
La explicación ofrecida involucra múltiples causas, una de ellas es la variabilidad
interlocutor, que podría ser reducida formando grupos experimentales del mismo
género, parecida edad, etcétera; otra posible causa para explicar los resultados es la
variabilidad intralocutor, debida posiblemente a la incomodidad que provoca la
máscara y a las propias limitaciones inherentes al uso de la misma: disminución de los
primeros formantes y pérdida de información en altas frecuencias (Rothenberg, M.,
1973), (Rothenberg, M., 1977), (Hertegård, S. & Gauffin, J., 1992), (Badin, P.,
Hertegård, S. & Karlsson, I., 1990).
En (Kuo, J., Holmberg, E.B., & Hillman, R.E., 1999) se trabaja de manera combinada
con parámetros acústicos clásicos procedentes de la señal de voz (en el dominio de la
frecuencia, en este caso) y con parámetros glóticos extraidos a partir del uso de una
máscara de Rothenberg. El trabajo se ocupa de estudiar, mediante análisis
discriminante, los parámetros o conjuntos de los mismos que son capaces de distinguir
mejor entre voces sanas y voces con presencia de nódulos en los pliegues vocales.
Los parámetros glóticos empleados fueron la presión subglótica, el flujo medio, el
flujo mínimo, el pico máximo de amplitud de la señal glótica sin contabilizar la
componente continua (AC flow), el cociente de apertura y el MFDR (Maximum Flow
Declination Rate).
Los resultados obtenidos indicaron que el uso combinado de todos los parámetros
llevó a una tasa de acierto del 96%. Por separado, los parámetros glóticos alcanzaron
el 95%, mientras que los parámetros acústicos clásicos sólo llegaron al 76%. Estudios
más concretos concluyeron que la presión subglótica combinada con el cociente de
apertura alcanza un 94% de tasa de acierto, constituyéndose ambos en los dos
parámetros más importantes de los analizados.
Destacaremos también el trabajo de (de Oliveira Rosa, M., Pereira, J.C. & Grellet,
M., 2000), en el que los autores extrajeron siete parámetros de la derivada de la
fuente glótica, con el objetivo de estudiar cuáles de ellos discriminan mejor la
presencia de patología vocal.
La base de datos utilizada constaba de 73 locutores, 48 de los cuales presentaron
algún tipo de patología vocal. El número de patologías vocales contempladas fue
56
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Por último, mencionar que en (Lázaro-Carrascosa, C. & Gómez-Vilda, P., 2014) está
publicado un breve resumen del trabajo realizado en esta tesis, esencialmente
centrado en los resultados más importantes del análisis estadístico llevado a cabo.
Además, en (Lázaro-Carrascosa, C. & Gomez-Vilda, P., 2015a) y en (Lázaro-Carrascosa,
C. & Gomez-Vilda, P., 2015b) encontramos trabajos en los que se ha aplicado parte del
protocolo de experimentación utilizado en esta tesis a un nuevo conjunto de
parámetros, obteniendo resultados satisfactorios.
57
4. Patologías vocales, bases de datos y
herramientas para la ayuda al
diagnóstico
Capítulo 4: Patologías vocales, bases de datos y herramientas de ayuda al diagnóstico
60
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Por su parte, Gallardo y Gallego (Gallardo Ruiz, J.R. & Gallego Ortega, J.L., 1993),
(Madrid Fernández, C.F., 2008) utilizan tres criterios diferentes para clasificar las
patologías vocales. El primero de ellos, denominado cuantitativo atiende al grado de
pérdida en la voz, distinguiendo entre la afonía o pérdida total de la voz y la disfonía o
pérdida parcial de la voz, en cualquiera de sus propiedades (tono, timbre, intensidad,
duración). El segundo criterio, denominado topográfico, atiende a la localización de la
lesión, distinguiendo dos grandes grupos: el primero de ellos se denomina
laringofonía, con lesión localizada en la laringe, y se divide en los subgrupos mala
impostación (utilización de un tono inadecuado), ronquera vocal (voz grave y sin
timbre, suele ser consecuencia de gritos excesivos), laringitis funcional (inflamación de
61
Capítulo 4: Patologías vocales, bases de datos y herramientas de ayuda al diagnóstico
Cobeta, por su parte (Cobeta, I. & Tapia, R.G., 1996), (Godino Llorente, J.I., 2002)
distingue cinco grandes grupos de patología vocal, atendiendo a la causa que las
provoca: orgánicas, funcionales, por trastornos neurológicos (el aparato fonador
presenta un perfecto estado, pero no se puede controlar la fonación correctamente
debido a trastornos en la coordinación motora causados por daño en las regiones del
sistema nervioso responsables de la producción de voz, conociéndose estas
alteraciones generalmente como disartrias), por trastornos en la resonancia y por
trastornos psiquiátricos o del sector cognitivo de la personalidad (entre otras, dislalias,
disfemia o tartamudez, alteraciones provocadas por trastornos cerebrales o por
miedos irracionales u obsesiones).
Prater y Swift (Prater, R.J. & Swift, R.W., 1986), (Bolettieri, S., 2007) proponen una
clasificación basada en dos conceptos importantes a la hora de hablar de las disfonías:
el abuso vocal y el mal uso vocal. El abuso vocal se refiere a una higiene vocal pobre,
incluyendo conductas que puedan ejercer efectos traumatizantes en los pliegues
vocales: chillar, aclamar, imitar sonidos emitidos por máquinas, aclarar excesivamente
la garganta, inhalar humo, polvo o gases nocivos, etc. El mal uso vocal está relacionado
con un uso incorrecto del tono y de la intensidad en la producción de voz, situaciones
que se suelen dar en ambientes de alto ruido ambiental (Godino Llorente, J.I., 2002).
Prater y Swift dividen las patologías vocales de acuerdo a estas definiciones,
distinguiendo tres grupos: originadas por abuso vocal, debido al mal uso vocal y por
abuso y mal uso.
62
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Tabla 4-1. Patologías vocales frecuentes, junto con una breve descripción (Gómez, P., 2002),
(Godino Llorente, J.I., 2002).
Patología Descripción
Nódulos de pliegue vocal Patología orgánica, defecto de cierre con contacto. Se
incrementa la masa y la rigidez de la cubierta del pliegue. El
aumento de masa produce un incremento en la aperiodicidad
de la vibración, lo que provoca un aumento del jitter y
shimmer y de la ronquera. Disminuye el rango vocal y el
margen dinámico. La frecuencia fundamental permanece en
márgenes normales. En función del tamaño del nódulo se
aprecia un cierre más o menos defectuoso, con un aumento
de la cantidad de aire que escapa, y un aumento en el nivel
de las componentes ruidosas en las regiones de alta
frecuencia.
Pólipos Patología orgánica, defecto de cierre con contacto.
Características similares a las presentes en los nódulos de
pliegue vocal, con posible ausencia de onda mucosa en
función de las características del pólipo y posible presencia de
asimetría en la fonación.
Parálisis laríngea unilateral Patología funcional, defecto de cierre sin contacto.
Importante componente aéreo en la voz, disminución de los
tiempos fonatorios, imposibilidad para alcanzar los tonos
agudos. La onda mucosa en el lado paralizado está retrasada
en su inicio respecto al lado sano, y es irregular.
Debilitamiento de componentes armónicos y aumento de
presencia de ruido.
Prebisfonía Patología orgánica, defecto de cierre sin contacto. Es el modo
fonatorio de las personas de edad avanzada, pero a menudo
sus características obedecen más a malas condiciones de vida
que al proceso de envejecimiento normal del organismo, por
lo que los síntomas se presentan antes. Aparece fatiga vocal,
aire en la voz y disminución de los rangos vocales y
dinámicos. Se aprecia una cierta irregularidad en la onda
mucosa, además de la presencia de un defecto de cierre
central y posterior. La frecuencia fundamental de los hombres
aumenta, y la de las mujeres disminuye, por disminución
hormonal. Aparece aumento de ruido en el espectrograma,
temblor en la voz y disminución de energía de los armónicos.
63
Capítulo 4: Patologías vocales, bases de datos y herramientas de ayuda al diagnóstico
Patología Descripción
Quistes intracordales Patología orgánica, desequilibrio mecánico de los pliegues
vocales. Signos acústicos similares a los presentados en los
nódulos de pliegue vocal.
Edema de Reinke Patología orgánica, desequilibrio mecánico de los pliegues
vocales. Incremento de la masa del pliegue, aumento de la
aperiodicidad de la vibración, con aumento del jitter y de la
ronquera. Disminución de la rigidez de la cubierta del pliegue.
También desciende la frecuencia fundamental, y aparece una
onda mucosa aumentada. Dependiendo del tamaño y
localización puede interferir más o menos con el cierre,
observándose (si el cierre es afectado) un aumento del
escape de aire y de ruido en el espectrograma. Dependiendo
de que el edema sea bilateral o unilateral el desequilibrio de
masas puede ser más o menos evidente con mayor o menor
presencia de perturbaciones en la voz y disminución del rango
vocal y dinámico.
Laringitis Patología orgánica, bloqueo de la vibración. Inflamación
duradera de la mucosa laríngea, hinchazón o edema de
alguna parte de la laringe. Incremento de la rigidez del
pliegue. La masa sólo se altera significativamente si hay
lesiones asociadas. Aumento del jitter y del shimmer,
disminución del rango vocal y dinámico. Ruido en el
espectrograma. Irregularidad y disminución de la onda
mucosa.
Sulcus vocalis Patología orgánica, bloqueo de la vibración. Aumento de la
rigidez, ausencia de onda mucosa. Reducción del rango
dinámico, frecuencia fundamental más baja de lo normal.
Fatiga vocal.
Carcinoma microinvasor Patología orgánica, bloqueo de la vibración. Grado severo de
disfonía, desaparición de la onda mucosa.
Cicatrizaciones anómalas Patología orgánica, frecuentemente traumática, bloqueo de
la vibración. Ausencia de onda mucosa, limitación del rango
dinámico y vocal. Aumento de las perturbaciones
dependiendo del grado de la lesión y aumento de la
componente de ruido en el espectrograma si coexiste defecto
de cierre.
64
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
65
Capítulo 4: Patologías vocales, bases de datos y herramientas de ayuda al diagnóstico
Cabe mencionar que los trabajos de investigación mencionados en los capítulos dos
y tres han utilizado bases de datos propias grabadas para su experimentación que
generalmente cuentan con unas pocas decenas de pacientes. A las mencionadas allí
añadiremos ahora las siguientes referencias, en las que aparecen bases de datos de
similares características: (Cheol-Woo, J. et al, 2001), (Hadjitodorov, S., Boyanov, B., &
Teston, B., 2000), (Martín Álvarez, J.J., 2000), (Nieto, A. et al, 1995) y (Qi, Y. & Hillman,
R.E., 1997).
66
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Otra de las herramientas que podemos considerar clásica es el Dr. Speech, de Tiger
DRS Inc. (http://www.drspeech.com/). Desde su versión 4, Dr. Speech es una familia de
aplicaciones relacionadas con la evaluación de la calidad vocal, que se caracteriza
porque trabaja con hardware estándar de bajo coste, aunque por otra parte sus
programas sólo funcionan en plataformas Windows®. La suite que compone el
producto está formada por aplicaciones útiles para la propia evaluación de la calidad
vocal, que trabajan con parámetros como la intensidad, la frecuencia fundamental, el
jitter, el shimmer, medidas de ruido, etcétera, y que permiten la valoración de tres
aspectos de la voz: ronquera, dureza en la voz y voz aérea, mediante comparación con
valores de normalidad establecidos a partir de una base de datos (ver figura 4-2).
También encontramos herramientas para la gestión de los pacientes, así como
aplicaciones educativas, orientadas a la rehabilitación logopédica y al análisis de
imágenes endoscópicas (Tiger DRS Inc., 1999).
67
Capítulo 4: Patologías vocales, bases de datos y herramientas de ayuda al diagnóstico
68
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Fig. 4-3. Pantalla del módulo de edición de la aplicación MediVoz Captura (tomado de
Medivoz, 2014).
69
Capítulo 4: Patologías vocales, bases de datos y herramientas de ayuda al diagnóstico
70
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
La base de datos empleada para el estudio forma un corpus de cien sujetos de cada
género en los que se reparte de forma equitativa la presencia y ausencia de patología
vocal. Así, la base de datos contiene cincuenta sujetos que denominaremos femeninos
normofónicos, cincuenta sujetos femeninos patológicos, cincuenta sujetos masculinos
normofónicos y cincuenta sujetos masculinos patológicos.
Las edades de los sujetos están comprendidas entre los diecinueve y los cincuenta y
seis años, con una media de 30,02 años y una desviación típica de 9,94 años. La
condición de normalidad ha sido determinada por electroglotografía, video-
endoscopia y evaluación GRBAS (Hirano, M. et al, 1988). Además, previamente se
establecieron algunos criterios que los locutores debían cumplir para cumplir tal
condición:
71
Capítulo 4: Patologías vocales, bases de datos y herramientas de ayuda al diagnóstico
72
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
73
5. Métodos analíticos utilizados en el
estudio
Capítulo 5: Métodos analíticos utilizados en el estudio
Cabe destacar que vamos a distinguir dos escenarios diferentes: por una parte
examinaremos las características de los parámetros de todos los sujetos de forma
global, sin distinguir ningún rasgo en ellos 7; por otra –más interesante–, veremos la
mayor parte de estas características de forma comparada, diferenciando a los sujetos
que presentan patología vocal de aquellos que no lo hacen.
Los datos descriptivos analizados en primer lugar serán los mismos en ambos
escenarios (con alguna pequeña salvedad que explicaremos al final del apartado), y
serán los que aparecen en la tabla 5-1 (Pardo, A. & Ruiz, M.Á., 2002).
Tabla 5-1. Valores descriptivos calculados para todos los sujetos, para el
subconjunto de sujetos con patología vocal y para el subconjunto de sujetos
normofónicos.
Descriptivo Breve explicación
Media Suma de todos los valores, dividido entre el número de valores.
Error típico de Desviación típica dividida entre la raíz cuadrada del número de
la media valores (Morales Vallejo, P., 2011a).
Intervalo de Límites inferior y superior del intervalo, al 95%.
confianza para
la media
Media Media obtenida eliminando el 5% de los casos más grandes y el
truncada 5% de los casos más pequeños.
7
Como ya hemos comentado, teniendo siempre en cuenta que los estudios se realizan siempre por
duplicado, actuando tanto sobre la base de datos de sujetos femeninos como sobre la base de datos de
sujetos masculinos, salvo que se indique expresamente lo contrario.
76
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Los histogramas son gráficos en los que los valores de las variables se dividen en
intervalos iguales, y a cada intervalo se le asigna una barra con una altura proporcional
a la frecuencia absoluta o porcentual.
Los diagramas de caja representan una herramienta gráfica especialmente útil para
observar la distribución de los datos de una forma rápida, y lo que es más interesante
en el caso que nos ocupa, para comparar de una forma visual efectiva las
distribuciones de los sujetos que presentan patología vocal y las de los sujetos
77
Capítulo 5: Métodos analíticos utilizados en el estudio
En la figura 5-1 podemos observar los datos que destacan los diagramas de caja
empleados. Existen representaciones alternativas en las que los extremos de la caja
representan valores diferentes: el mínimo y el máximo de los valores de la distribución,
una desviación estándar por encima y por debajo de la media, los percentiles 2 y 98 y
los percentiles 9 y 91, respectivamente (Wikipedia, 2014a) (McGill, R., Tukey, J.W. &
Larsen, W.A., 1978).
78
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Uno de los contrastes utilizado para contrastar la hipótesis de que las muestras
obtenidas se ajustan a la distribución normal es el de Kolmogorov-Smirnov
(Kolmogorov, A., 1933), (Smirnov, N.V., 1948) (Wikipedia, 2014e), quizá la prueba más
general y utilizada para estos casos. El test se basa en evaluar un estadístico que
involucra a la distribución empírica y a la distribución teórica, obtenidas a partir de los
datos muestrales y teniendo en cuenta que la distribución a comparar es la normal –el
test puede ser utilizado para contrastar la hipótesis de que la distribución obtenida se
ajusta a cualquier distribución teórica de probabilidad–.
El estadístico de Kolmogorov-Smirnov se distribuye según el modelo de
probabilidad , y se calcula a partir de la diferencia más grande entre la
distribución empírica y la distribución teórica, atendiendo, para una muestra de
tamaño a la siguiente expresión (Pardo, A. & Ruiz, M.Á., 2002):
También, por otra parte, se ofrece la prueba de Saphiro-Wilk (Shapiro, S.S. & Wilk,
M.B., 1965), prueba de gran potencia, sobre todo cuando el tamaño muestral es
reducido (Pardo, A. & Ruiz, M.Á., 2002) (Wikipedia, 2014j) (Lohninger, H., 2012).
Los diagramas Q-Q normal representan generalmente los valores de los cuantiles de
la distribución normal esperada, que forman una recta. Los cuantiles correspondientes
a las muestras recogidas también son representados; si se ajustan a la recta
mencionada la distribución en estudio es considerada normal. En nuestro caso, en
lugar de los cuantiles utilizaremos las puntuaciones típicas, obteniendo en la práctica
el mismo resultado. Los diagramas Q-Q normal sin tendencia muestran las diferencias
existentes entre las puntuaciones típicas esperadas y las observadas, es decir, muestra
las distancias existentes entre los puntos observados y la recta modelo del gráfico
anterior. En el eje de abscisas aparecen los valores observados, y en el de ordenadas
las diferencias mencionadas. Estas diferencias deben oscilar de forma aleatoria en
79
Capítulo 5: Métodos analíticos utilizados en el estudio
torno al valor cero en el caso de que la distribución sea normal, apareciendo pautas de
variación no aleatorias en caso contrario (Pardo, A. & Ruiz, M.Á., 2002).
80
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
La prueba t es una tipificación de la diferencia entre las dos medias muestrales que
se obtiene restando a esa diferencia su valor esperado en la población y dividiendo el
resultado por el error típico de la diferencia:
La prueba U de Mann-Whitney (Mann, H.B. & Whitney, D.R., 1947) (Pardo, A. &
Ruiz, M.Á., 2002) (Wikipedia, 2014h) es un contraste no paramétrico que tiene el
mismo objetivo que la prueba t de Student. Esta última prueba está indicada para
distribuciones que se ajustan a la normal, aunque también se comporta de un modo
satisfactorio si la muestra es grande. No todos los parámetros en estudio tienen una
distribución normal, y aunque el tamaño de la muestra es relativamente grande,
hemos preferido completar el estudio con un contraste que no dependa de la
distribución de los parámetros.
81
Capítulo 5: Métodos analíticos utilizados en el estudio
La prueba de las rachas de Wald-Wolfowitz (Wald, A. & Wolfowitz, J., 1940) (Pardo,
A. & Ruiz, M.Á., 2002) es un contraste no paramétrico que tiene objetivos y
características similares a la prueba de Kolmogorov-Smirnov para dos muestras: se
utiliza para comprobar si dos muestras pertenecen a la misma población, y para ello
considera los valores promedio, pero también tiene en cuenta otras características de
las distribuciones, como la asimetría o la varianza.
siendo
82
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
La prueba de reacciones extremas de Moses (Moses, L.E., 1952) (Pardo, A. & Ruiz,
M.Á., 2002) es, en realidad, un contraste de varianza no paramétrico. Podemos, por
tanto, considerarlo un complemento a la prueba de Levene, en la que ya analizábamos
esta cuestión. Consiste en ordenar las dos muestras mezcladas, asignarles rangos y
analizar la amplitud recortada de los rangos de uno de los grupos, con el fin de
contrastar la hipótesis de que la variabilidad de las dos muestras es la misma, en
cuanto a que no hay diferencias entre los valores extremos de las dos distribuciones.
Existen al menos dos enfoques para realizar el cálculo del tamaño del efecto. El
primero de ellos propone utilizar directamente el coeficiente de correlación de la
variable con la pertenencia a cada grupo. El segundo, más adoptado por la comunidad
científica y que será el que emplearemos en nuestro estudio consiste en calcular una
diferencia tipificada (índice de Cohen) que atiende a la siguiente fórmula:
8
En realidad concluimos que la probabilidad de que la diferencia sea distinta de cero es muy alta (mayor
de un 95% con el frecuentemente utilizado índice de significación α=0,05)
83
Capítulo 5: Métodos analíticos utilizados en el estudio
Hopkins (Hopkins, W.G., 2000), (Morales Vallejo, P., 2011c) propone otra escala más
exigente, que podemos ver en la tabla 5.4. Esta escala considera tanto el coeficiente
como el coeficiente de correlación entre la variable en estudio y la pertenencia a uno
u otro grupo (ambos coeficientes están relacionados, es posible transformar uno de
ellos en el otro con facilidad).
Tabla 5.4. Interpretación cualitativa de los valores del tamaño del efecto y
relación con el coeficiente de correlación, según Hopkins (Hopkins, W.G., 2000)
Tamaño del efecto Correlación Interpretación cualitativa
Diferencia pequeña
Diferencia moderada
Diferencia grande
84
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
9
Tipo de diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de dos
variables para un conjunto de datos (Entrada de Wikipedia "diagrama de dispersión").
85
Capítulo 5: Métodos analíticos utilizados en el estudio
86
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
El análisis factorial (Thurstone, L.L., 1947) (Hair, J. et al, 1999) es una técnica
estadística multidimensional que permite alcanzar dos objetivos: por una parte,
podemos encontrar la estructura en nuestra matriz de datos (si es que existe), o lo
que es lo mismo, podemos agrupar las variables que forman parte de nuestro sistema
en base a las relaciones existentes entre ellas. Por otra parte, permite reducir la
dimensionalidad del problema, ya que estas agrupaciones de las variables originales,
denominadas factores, recogen un porcentaje muy significativo de la información del
sistema empleando en general un número de ellos mucho más reducido que el de las
variables originales. Por otro lado, como veremos en el capítulo de resultados, los
factores han resultado tener más capacidad discriminante que los parámetros
originales en varios de los casos analizados, siempre de cara a la detección de
patología vocal.
El modelo matemático del análisis factorial viene dado por las siguientes ecuaciones
(Salvador, M. & Gargallo, P., 2013):
...
87
Capítulo 5: Métodos analíticos utilizados en el estudio
88
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Los porcentajes de varianza explicada, que nos ayudarán a decidir con cuántos
factores debemos construir el modelo factorial. Estos valores nos indican, factor
a factor, qué porcentaje de la varianza total explica cada uno de ellos, así como el
porcentaje acumulado. Los porcentajes se extraen directamente de los
autovalores de la matriz de varianzas-covarianzas correspondientes a cada
factor. En general, se suelen incluir en los modelos aquellos factores cuyo
autovalor sea mayor que la unidad. Una herramienta gráfica útil que representa
la importancia de cada factor es el gráfico de sedimentación. Este tipo de
gráficos, en los que en el eje de abscisas aparece el número de factor y en el eje
de ordenadas aparece el autovalor correspondiente representa la varianza
explicada por cada factor de forma acumulada a través de una recta. El estudio
sobre el cambio de la pendiente de la recta determinará a partir de qué factor la
información restante no es relevante.
Por último, el análisis factorial nos permite realizar rotaciones de los factores de
cara a tratar de mejorar la interpretación del modelo. Estas rotaciones tratan de
cumplir el Principio de Estructura Simple (Thurstone, L.L., 1947) (Salvador, M. &
Gargallo, P., 2006), que dice que el modelo factorial debe cumplir las siguientes
características:
1. Cada factor debe tener unos pocos pesos altos y los otros próximos a cero.
2. Cada variable no debe estar saturada más que en un factor.
3. No deben existir factores con la misma distribución, es decir, dos factores
distintos deben presentar distribuciones diferentes de cargas altas y bajas.
89
Capítulo 5: Métodos analíticos utilizados en el estudio
El análisis discriminante (Pardo, A. & Ruiz, M.Á., 2002) es una técnica perteneciente
a la estadística multivariante que permite clasificar a los sujetos de un estudio en
diferentes grupos, utilizando para ello una función matemática denominada función
discriminante, calculada como combinación lineal de un conjunto de variables
independientes que caracterizan a los sujetos de tal modo que permite diferenciar lo
más posible a los distintos grupos. Además, el análisis discriminante permitirá
seleccionar las variables de predicción que contribuyen en mayor medida a explicar las
diferencias entre los grupos (Torrado-Fonseca, M. & Berlanga, V., 2013). En el caso que
nos ocupa, naturalmente, las variables independientes con las que contamos son los
parámetros del estudio, y los grupos de clasificación son dos: personas con patología
vocal y personas normofónicas.
siendo las las variables independientes y los los coeficientes que logran que los
sujetos de uno de los grupos consigan puntuaciones máximas en , justo al contrario
que los sujetos del otro grupo. En efecto, la función discriminante busca maximizar la
varianza entre los grupos y minimizar la varianza dentro de los grupos (De la Fuente
Fernández, S., 2011).
En la figura 5-2 (Pardo, A. & Ruiz, M.Á., 2002) podemos observar una
representación de la función discriminante sobre la que aparecen las distribuciones de
90
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
los dos grupos, y también las respectivas medias multivariantes de cada uno,
denominados centroides. La función discriminante debe ser tal que la distancia entre
ambos centroides sea máxima.
91
Capítulo 5: Métodos analíticos utilizados en el estudio
Por otra parte, es de gran interés confirmar que los grupos formados estén lo
suficientemente alejados como para que la función discriminante tenga éxito. Existen
varios indicadores para llevar a cabo este propósito, como el índice de correlación
canónica (correlación entre las puntuaciones discriminantes y la pertenencia a los
grupos) o los autovalores (cociente entre la variación intergrupos y la variación
intragrupos) (Pardo, A. & Ruiz, M.Á., 2002). Sin embargo, es más habitual y completo
utilizar para ello el estadístico conocido como lambda de Wilks. La lambda de Wilks se
define como:
11
Lo veremos en el capítulo siguiente para las diferentes combinaciones de parámetros y factores
sometidas a estudio. Lógicamente, en el caso de los factores, al ser ortogonales, el problema de la
colinealidad no se presenta. En todo caso, como hemos visto, el algoritmo utilizado elimina del modelo
los parámetros cuyo índice de tolerancia sea muy pequeño o cuya inclusión haga muy pequeña la
tolerancia de algún parámetro ya incluido.
92
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
todos los casos como si pertenecieran a un único grupo. La lambda de Wilks permite
contrastar la hipótesis nula de que los centroides de los grupos son iguales, además de
ofrecer un valor comprendido entre cero y uno, donde valores próximos a cero
indicarán una gran diferencia entre los grupos (Pardo, A. & Ruiz, M.Á., 2002).
Para verificar la importancia que tienen los parámetros a la hora de diferenciar a los
grupos utilizaremos la matriz de coeficientes estandarizados, que contiene las
contribuciones netas de cada variable a la función discriminante (es decir,
considerando la relación que existe entre las variables discriminantes). Por su parte, la
matriz de estructura, en la que encontraremos las correlaciones entre las variables y la
función discriminante estandarizada, proporciona la contribución bruta de cada
variable a la función discriminante (es decir, sin considerar la relación que existe entre
las variables discriminantes) (Pardo, A. & Ruiz, M.Á., 2002).
Por último, cabe destacar que hemos realizado una experimentación completa que
incluye numerosos casos en los que intervienen todos los parámetros glóticos,
subconjuntos presumiblemente relevantes de ellos, y también factores extraídos con
la técnica de análisis factorial descrita en el apartado anterior.
Además, en cada experimento hemos realizado un doble proceso de validación
cruzada: en primer lugar, hemos dividido cada muestra original en submuestras,
para estimar en cada ocasión la función discriminante eliminando una de las
submuestras (fase de entrenamiento) y clasificar después los elementos eliminados,
que no han intervenido en la construcción de la función (fase de clasificación). Estos
elementos reciben el nombre de no seleccionados en las tablas de resultados que
veremos en el capítulo seis. En general, la submuestra ha representado el 10% de los
casos, repitiendo el proceso diez veces y excluyendo cada vez una de las
submuestras13. Hemos utilizado, por tanto, un esquema clásico de entrenamiento-
clasificación, en el que además también ofrecemos los resultados de clasificar los
elementos que sí forman parte del proceso de construcción de la función
discriminante, elementos que reciben el nombre de seleccionados en las tablas de
resultados. En segundo lugar, por otro lado, en cada uno de los estudios realizados
generaremos tantas funciones discriminantes como casos de entrenamiento válidos
tenemos, excluyendo un sólo caso en cada ocasión (en inglés, leave-one-out). A
continuación, clasificaremos el caso excluido utilizando precisamente la función
discriminante que no lo ha tenido en cuenta. La tasa resultado de este proceso recibirá
el nombre de validación cruzada en las tablas de resultados del siguiente capítulo.
12
Naturalmente, los resultados completos estarán disponibles en el disco adjunto a esta tesis.
13
Como veremos en el capítulo seis, también hemos realizado ensayos con diferentes porcentajes y
repeticiones.
93
6. Experimentación y resultados
Capítulo 6: Experimentación y resultados
Los datos calculados para describir los parámetros analizados son muy abundantes,
por lo que es necesario realizar una adecuada organización de los mismos, priorizando
los más importantes. Para ello, en este apartado, así como en el resto del capítulo,
presentaremos y comentaremos aquellos datos más relevantes, los que mejor
resumen cada estudio. En un segundo nivel quedarán los detalles de las pruebas
estadísticas, o la parte más esencial de las mismas si éstas son demasiado extensas,
que aparecerán en los apéndices de este documento. Por último, en un tercer nivel
presentaremos todas las pruebas estadísticas completas realizadas en este trabajo,
incluidas en un disco adjunto. En general, en cada apartado quedará explicado qué
parte de la información es presentada en cada uno de los niveles establecidos.
Por otro lado, este apartado también incluye el resumen comentado de los
resultados de los contrastes de medias paramétricos y no paramétricos realizados
sobre el conjunto de los datos. Los resultados completos correspondientes a la prueba
t de Student realizada, perteneciente a la primera categoría, aparecen detallados en el
apéndice tres. Los resultados completos de las pruebas de Mann-Whitney,
96
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Las tablas 6-1, 6-2 y 6-3 recogen un resumen de los resultados de las pruebas de
normalidad realizadas utilizando, respectivamente, la prueba de Kolmogorov-Smirnov,
la modificación de Lilliefors y la prueba de Saphiro-Wilk (recordemos que los
resultados completos de las pruebas aparecen en el apéndice 2.3). En cada tabla
podemos observar si cada uno de los parámetros supera el test de normalidad en las
seis bases de datos utilizadas: casos no patológicos (N), casos patológicos (P) y
combinación de todos los casos (G), para cada uno de los dos géneros. En el caso de
que el test de normalidad sea superado se marcará la casilla correspondiente con una
'X', quedándose ésta en blanco en caso contrario.
97
Capítulo 6: Experimentación y resultados
BD BD
Femenina Masculina
Nº Parámetro biométrico G N P G N P
28 Frecuencia del segundo máx. (valor relativo) X X X X X X
30 Frecuencia del segundo mín. (valor relativo) X X X X X X
Nº Parámetro biomecánico
31 Frecuencia del cuarto máximo (valor relativo) X X X X X X
32 Frecuencia del final de la señal (valor relativo) X X X X X X
33 Esbeltez correspondiente al primer surco X X X X X X
34 Esbeltez correspondiente al segundo surco X X X X X X
35 Masa del cuerpo X X
36 Pérdida del cuerpo X X X X
37 Elasticidad del cuerpo X X
38 Desbalance de la masa del cuerpo
39 Desbalance de la pérdida del cuerpo X X
40 Desbalance de la elasticidad del cuerpo
41 Masa de la cubierta X X X X
42 Pérdida de la cubierta X X X X
43 Elasticidad de la cubierta X
44 Desbalance de la masa de la cubierta X X X
45 Desbalance de la pérdida de la cubierta X X X X
46 Desbalance de la elasticidad de la cubierta X
Nº Parámetro temporal
47 Punto de Apertura X X X X
48 Punto de Cierre X X X X X X
49 Punto de Recuperación X X X X
50 Posición 1er Máximo Onda Mucosa X X X X
51 Posición 2o Máximo Onda Mucosa X X X X
98
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
BD BD
Femenina Masculina
Nº Parámetro biométrico G N P G N P
21 Amplitud del segundo mínimo (valor relativo) X X X X X
22 Amplitud del cuarto máximo (valor relativo) X X X X X X
23 Amplitud del final de la señal (valor relativo) X X X X
24 Frecuencia del origen de la señal (valor rel.)
26 Frecuencia del primer máximo (valor absoluto)
27 Frecuencia del primer mínimo (valor relativo) X X X
28 Frecuencia del segundo máx. (valor relativo) X X
30 Frecuencia del segundo mín. (valor relativo) X X X X X X
31 Frecuencia del cuarto máximo (valor relativo) X X X X X X
32 Frecuencia del final de la señal (valor relativo) X X X X
33 Esbeltez correspondiente al primer surco X X X
34 Esbeltez correspondiente al segundo surco X X X X
Nº Parámetro biomecánico
35 Masa del cuerpo X X
36 Pérdida del cuerpo X X
37 Elasticidad del cuerpo X X
38 Desbalance de la masa del cuerpo
39 Desbalance de la pérdida del cuerpo
40 Desbalance de la elasticidad del cuerpo
41 Masa de la cubierta X
42 Pérdida de la cubierta X
43 Elasticidad de la cubierta
44 Desbalance de la masa de la cubierta X
45 Desbalance de la pérdida de la cubierta X X
46 Desbalance de la elasticidad de la cubierta X
Nº Parámetro temporal
47 Punto de Apertura X X X X
48 Punto de Cierre X X X X X
49 Punto de Recuperación X X
er
50 Posición 1 Máximo Onda Mucosa X X
51 Posición 2o Máximo Onda Mucosa X X X
99
Capítulo 6: Experimentación y resultados
BD BD
Femenina Masculina
Nº Parámetro biométrico G N P G N P
15 Amplitud del origen de la señal (valor relativo)
17 Amplitud del primer máximo (valor absoluto) X X X X
18 Amplitud del primer mínimo (valor relativo) X X X X X X
19 Amplitud del segundo máximo (valor relativo) X X X X X
21 Amplitud del segundo mínimo (valor relativo) X X X X X X
22 Amplitud del cuarto máximo (valor relativo) X X X X X
23 Amplitud del final de la señal (valor relativo) X X X X
24 Frecuencia del origen de la señal (valor rel.)
26 Frecuencia del primer máx. (valor absoluto)
27 Frecuencia del primer mín. (valor relativo) X
28 Frecuencia del segundo máx. (valor relativo) X X X X
30 Frecuencia del segundo mín. (valor relativo) X X X X X
31 Frecuencia del cuarto máximo (valor relativo) X X X X X X
32 Frecuencia del final de la señal (valor relativo) X X X X
33 Esbeltez correspondiente al primer surco X X
34 Esbeltez correspondiente al segundo surco X X
Nº Parámetro biomecánico
35 Masa del cuerpo X X
36 Pérdida del cuerpo X X
37 Elasticidad del cuerpo X
38 Desbalance de la masa del cuerpo
39 Desbalance de la pérdida del cuerpo
40 Desbalance de la elasticidad del cuerpo
41 Masa de la cubierta X
42 Pérdida de la cubierta X
43 Elasticidad de la cubierta
44 Desbalance de la masa de la cubierta
45 Desbalance de la pérdida de la cubierta
46 Desbalance de la elasticidad de la cubierta
Nº Parámetro temporal
47 Punto de Apertura X X X X
48 Punto de Cierre X X X X X
49 Punto de Recuperación X
50 Posición 1er Máximo Onda Mucosa X X
o
51 Posición 2 Máximo Onda Mucosa X X
La tabla 6-4 combina la información contenida en las tablas 6-1, 6-2 y 6-3. En ella
podemos comprobar si cada uno de los parámetros sigue la distribución normal
superando todas las pruebas consideradas, para cada una de las seis bases de datos
utilizadas. Escogiendo un criterio conservador, comentaremos los resultados sobre la
tabla 6-4, aprovechando de este modo los tres estudios realizados.
100
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
101
Capítulo 6: Experimentación y resultados
BD BD
Femenina Masculina
Nº Parámetro temporal G N P G N P
50 Posición 1er Máximo Onda Mucosa X X
o
51 Posición 2 Máximo Onda Mucosa X X
Las tablas 6-5 y 6-6 recogen un interesante resumen de los datos del estudio; en
ellas podemos observar la proporción de parámetros que siguen la distribución normal
según las tres pruebas realizadas, distinguiendo a los parámetros por su naturaleza.
Los parámetros biométricos son los que alcanzan un porcentaje más alto de casos
positivos en las pruebas, con un 54,1% en las mujeres y un 45,8% en los hombres. Los
temporales, que son menos numerosos, ocupan el segundo lugar, con un 53,3% en la
base de datos femenina y un 40% en la masculina. Los parámetros de perturbación y
energía arrojan resultados inferiores: 33,3% y 21,4% en mujeres y hombres,
respectivamente. Y los biomecánicos, muy inferiores: la base de datos femenina tiene
un 13,9% de parámetros normales, y la base de datos masculina, sólo un 5,6%.
102
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Otra conclusión que se aprecia a simple vista en las tablas 6-5 y 6-6 es que de las
dos bases de datos es la femenina la que cuenta con más parámetros que se ajustan a
la normal. La suma de todos los valores alcanza un 37,6% en la base de datos femenina
y un 27,6% en la base de datos masculina. A pesar de esa diferencia, las bases de datos
masculina y femenina tienen un alto número de coincidencias en cuanto a la
normalidad de sus parámetros: hablamos de un 79,4% de los casos.
Para poder extraer conclusiones acerca de los diagramas de caja generados (que,
recordemos, aparecen en el apéndice 2-2 de este documento) utilizaremos tres
criterios diferentes. En el primero de ellos destacaremos aquellos parámetros en los
que no existe solapamiento entre los rangos intercuartílicos de las distribuciones de
casos normofónicos y patológicos. En el segundo criterio destacaremos aquellos
parámetros en los que aunque exista este solapamiento, la alta presencia de valores
atípicos presente en los datos patológicos puede ofrecer algún indicio relevante. En el
tercer criterio destacaremos aquellos parámetros que sin cumplir los requisitos
necesarios para encajar en alguno de los dos criterios anteriores también parecen
relevantes de acuerdo a una inspección visual.
En la tabla 6-7 podemos observar los siguientes valores extraídos del análisis de los
diagramas de caja para la base de datos femenina, que representan un resumen de los
mismos: valor no atípico más pequeño, percentil 25, mediana, percentil 75, valor no
atípico más grande, valor atípico extremo más pequeño, valor atípico leve más
pequeño, valor atípico leve más grande y valor atípico extremo más grande. Todos
estos valores han sido recogidos de los diagramas de caja correspondientes a los casos
normofónicos (N en la tabla) y patológicos (P en la tabla), para cada uno de los
parámetros representativos según los critrerios seleccionados. Las casillas en blanco se
corresponden con situaciones en las que no existe ningún valor atípico de la categoría
en cuestión en el correspondiente diagrama. Es importante destacar que los valores
recogidos corresponden a un análisis visual, por lo que son aproximados. Métodos
posteriores tratarán los datos de forma más rigurosa, pero los diagramas de caja son
especialmente indicados para etapas preliminares: arrojan indicios que podrán ser
confirmados en estudios posteriores.
103
Capítulo 6: Experimentación y resultados
La tabla 6-8, de acuerdo con el primero de los criterios arriba explicados, recoge los
parámetros en los que no existe solapamiento entre los rangos intercuartílicos
correspondientes a las distribuciones de casos normales y patológicos. En ella se listan
sus nombres, destacando en negrita aquellos en los que la diferencia entre las
distribuciones de los grupos resulta más evidente.
Tabla 6-8. Listado de parámetros de la base de datos
femenina que cumplen el primero de los tres criterios
establecidos.
Cód. Nombre del parámetro
2 Jitter
11 Primera banda de energía de la Onda Mucosa
12 Segunda banda de energía de la Onda Mucosa
13 Tercera banda de energía de la Onda Mucosa
14 Cuarta banda de energía de la Onda Mucosa
19 Amplitud del segundo máximo (valor relativo)
21 Amplitud del segundo mínimo (valor relativo)
22 Amplitud del cuarto máximo (valor relativo)
23 Amplitud del final de la señal (valor relativo)
36 Pérdida del cuerpo
38 Desbalance de la masa del cuerpo
39 Desbalance de la pérdida del cuerpo
104
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
105
Capítulo 6: Experimentación y resultados
106
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Los siguientes parámetros cumplen las condiciones del segundo criterio en la base
de datos masculina, y sus nombres aparecen listados en la tabla 6-13:
A modo de resumen, la tabla 6-15 presenta los códigos de los parámetros que
cumplen cada uno de los criterios establecidos para ambas bases de datos. En ella
podemos observar que existe una alta coincidencia entre los parámetros de las dos
bases de datos. Así, todos los parámetros que cumplen el primer criterio en la base de
datos masculina también lo hacen en la base de datos femenina. No sucede lo mismo
de forma recíproca, pero los tres únicos parámetros que lo impiden (destacados en la
tabla) sí cumplen el tercer criterio en la base de datos masculina, criterio que podemos
107
Capítulo 6: Experimentación y resultados
considerar como una versión relajada del primero de ellos. Por esta razón, las
discrepancias observadas en el tercer criterio, que son mayores, quedan algo
amortiguadas. Por otro lado, el segundo criterio es satisfecho en ambas bases de datos
por los mismos parámetros. Por fin, en la última fila de la tabla reuniremos a todos los
parámetros que cumplen alguno de los criterios, para las dos bases de datos. Podemos
comprobar que ambas bases de datos comparten veinte parámetros en esta última
fila, a los cuales la base de datos femenina añade cinco más (destacados en la tabla),
todos ellos pertenecientes al tercer criterio, que es, como hemos visto, el más
subjetivo de los tres. Estos últimos parámetros (todos los de la última fila de la tabla 6-
15) serán considerados como los mejores de este estudio de cara a su utilización en el
análisis discriminante, cuyos resultados podemos ver en el apartado 6.3.
Tabla 6-15. Listado de códigos de los parámetros de ambas bases de datos que
cumplen cada uno de los tres criterios establecidos, y alguno de ellos.
Código de los Código de los
parámetros, parámetros,
base de datos femenina base de datos masculina
Cumplen el primer criterio 2, 11, 12, 13, 14, 19, 21, 2, 11, 12, 13, 14, 22, 36,
establecido (rangos 22, 23, 36, 38, 39, 40, 38, 39, 40, 44, 45, 46
intercuartílicos no solapados) 44, 45, 46
Cumplen el segundo criterio 9, 24, 26 9, 24, 26
establecido (distribuciones
uniformes, casos atípicos)
Cumplen el tercer criterio 7, 10, 15, 41, 42, 43 15, 19, 21, 23
establecido (distribuciones
visualmente diferentes, rangos
intercuartílicos con ligero
solapamiento)
Cumplen alguno de los tres 2, 7, 9, 10, 11, 12, 13, 2, 9, 11, 12, 13, 14, 15,
criterios anteriores 14, 15, 19, 21, 22, 23, 19, 21, 22, 23, 24, 26, 36,
24, 26, 36, 38, 39, 40, 38, 39, 40, 44, 45, 46
41, 42, 43, 44, 45, 46
108
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
109
Capítulo 6: Experimentación y resultados
Tabla 6-16. Rechazo de la hipótesis de igualdad de medias según las pruebas t de Student
y Mann-Whitney en las bases de datos femenina y masculina para todos los parámetros.
Nº Parámetro t-Student Mann- T-Student Mann-
Femenino Whitney Masculino Whitney
Femenino Masculino
1 Pitch X X X
2 Jitter X X X X
3 Shimmer asociado a la amplitud X X X X
4 Shimmer asociado a la esbeltez X X
5 Shimmer asociado al área X X X X
6 Amplitud Pico de Cierre Glótico / Vecinos
7 Esbeltez Pico de Cierre Glótico / Vecinos X
8 Energía MWC/AAW
9 2º Arm. / Frecuencia Fundamental MWC X X X X
10 2º Arm. / 1er Arm. Onda Mucosa X X X X
11 Primera banda de energía de la MWC X X X X
12 Segunda banda de energía de la MWC X X X X
13 Tercera banda de energía de la MWC X X X X
14 Cuarta banda de energía de la MWC X X X X
15 Amp. del origen de la señal (valor relativo) X X X X
17 Amp. del primer máximo (valor absoluto) X X
18 Amp. del primer mínimo (valor relativo) X X X X
19 Amp. del segundo máximo (valor relativo) X X X X
21 Amp. del segundo mínimo (valor relativo) X X X X
22 Amp. del cuarto máximo (valor relativo) X X X X
23 Amp. del final de la señal (valor relativo) X X X X
24 Frec. del origen de la señal (valor relativo) X X X X
26 Frec. del primer máximo (valor absoluto) X X X X
27 Frec. del primer mínimo (valor relativo) X X X X
28 Frec. del segundo máximo (valor relativo) X X X X
30 Frec. del segundo mínimo (valor relativo) X X
31 Frec. del cuarto máximo (valor relativo) X X
32 Frec. del final de la señal (valor relativo) X X X
33 Esbeltez correspondiente al primer surco
34 Esbeltez correspondiente al segundo surco X X
35 Masa del cuerpo X
36 Pérdida del cuerpo X X X X
37 Elasticidad del cuerpo X
38 Desbalance de la masa del cuerpo X X X X
39 Desbalance de la pérdida del cuerpo X X X X
40 Desbalance de la elasticidad del cuerpo X X X X
41 Masa de la cubierta X X X X
42 Pérdida de la cubierta X X X X
43 Elasticidad de la cubierta X X X X
44 Desbalance de la masa de la cubierta X X X X
45 Desbalance de la pérdida de la cubierta X X X X
46 Desbalance de la elasticidad de la cubierta X X X X
110
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
111
Capítulo 6: Experimentación y resultados
- Las bases de datos masculina y femenina coinciden en el resultado del 70,2% de los
parámetros en la prueba de Kolmogorov-Smirnov y en el del 76,6% en la prueba de
Wald-Wolfowitz.
112
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
113
Capítulo 6: Experimentación y resultados
1 Pitch X
2 Jitter X X X X
3 Shimmer asociado a la amplitud
4 Shimmer asociado a la esbeltez
5 Shimmer asociado al área
6 Razón Amplitud Pico de Cierre Glótico / Vecinos X
7 Razón Esbeltez Pico de Cierre Glótico / Vecinos X X X X
8 Razón Energía MWC/AAW X X
9 2º Arm. / Frecuencia Fundamental Onda Mucosa X X X X
10 2º Arm. / 1er Arm. Onda Mucosa X X
11 Primera banda de energía de la Onda Mucosa X X X
12 Segunda banda de energía de la Onda Mucosa X X X X
13 Tercera banda de energía de la Onda Mucosa X X X X
14 Cuarta banda de energía de la Onda Mucosa X X X X
15 Amplitud del origen de la señal (valor relativo) X X X X
17 Amplitud del primer máximo (valor absoluto) X X X X
18 Amplitud del primer mínimo (valor relativo) X X
19 Amplitud del segundo máximo (valor relativo) X X X
21 Amplitud del segundo mínimo (valor relativo) X X
22 Amplitud del cuarto máximo (valor relativo) X X
23 Amplitud del final de la señal (valor relativo) X X X X
24 Frecuencia del origen de la señal (valor relativo) X X X X
26 Frecuencia del primer máximo (valor absoluto) X X X X
27 Frecuencia del primer mínimo (valor relativo) X X
28 Frecuencia del segundo máximo (valor relativo) X X
30 Frecuencia del segundo mínimo (valor relativo)
31 Frecuencia del cuarto máximo (valor relativo)
32 Frecuencia del final de la señal (valor relativo) X
33 Esbeltez correspondiente al primer surco
34 Esbeltez correspondiente al segundo surco X
35 Masa del cuerpo X
36 Pérdida del cuerpo X X X X
37 Elasticidad del cuerpo X X
38 Desbalance de la masa del cuerpo X X X X
39 Desbalance de la pérdida del cuerpo X X X X
40 Desbalance de la elasticidad del cuerpo X X X X
41 Masa de la cubierta X X X X
42 Pérdida de la cubierta X X X X
43 Elasticidad de la cubierta X X X
44 Desbalance de la masa de la cubierta X X X X
45 Desbalance de la pérdida de la cubierta X X X X
46 Desbalance de la elasticidad de la cubierta X X X X
47 Punto de Apertura X X X X
48 Punto de Cierre X X
49 Punto de Recuperación X X
er
50 Posición 1 Máximo Onda Mucosa X X X
o
51 Posición 2 Máximo Onda Mucosa X X X X
114
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Hemos realizado seis pruebas estadísticas que tienen como objetivo analizar los
parámetros glóticos en estudio, buscando aquellos cuya distribución sea diferente en
el caso de que la muestra obtenida corresponda a sujetos con patología vocal y en el
caso de que corresponda a sujetos normofónicos. Las pruebas miden diferentes
aspectos de la distribución: media, varianza, simetría, etcétera, y aunque son
independientes unas de otras también tienen un carácter complementario, por lo que
resulta de interés destacar aquellos parámetros que indican diferencia en todas las
pruebas realizadas: podemos observar los correspondientes a la base de datos
femenina en la tabla 6-19, y los correspondientes a la base de datos masculina en la
tabla 6-20. Estos parámetros serán considerados como los mejores de este estudio de
cara a su uso en el análisis discriminante, cuyos resultados podemos ver en el apartado
6-3. Por su parte, los parámetros con códigos 4 y 8 (Shimmer asociado a la esbeltez y
Razón Energía Onda Mucosa (MWC) / Onda Acústica Promedio (AAW),
respectivamente) no indican diferencia en ninguna de las pruebas realizadas para la
base de datos femenina, razón por la cual serán considerados como los peores de este
estudio, también de cara a su uso en el análisis discriminante. Lo mismo sucede para la
base de datos masculina con los parámetros de códigos 6, 30, 31, 33, 34 y 35 (Razón
Amplitud Pico de Cierre Glótico / Vecinos, Frecuencia del segundo mínimo, Frecuencia
del cuarto máximo, Esbeltez correspondiente al primer surco, Esbeltez correspondiente
al segundo surco y Masa del cuerpo, respectivamente).
Tabla 6-19. Listado de parámetros de la base de datos femenina que rechazan la hipótesis
de igualdad en las distribuciones según las seis pruebas realizadas.
Nº Parámetro Nº Parámetro Nº Parámetro
2 Jitter 36 Pérdida cuerpo 45 Desbalance pérdida cubierta
11 1ª banda energía MWC 38 Desbalance masa cuerpo 46 Desb. elasticidad cubierta
12 2ª banda energía MWC 39 Desbalance pérdida cuerpo 47 Punto de Apertura
13 3ª banda energía MWC 40 Desb. elasticidad cuerpo 48 Punto de Cierre
14 4ª banda energía MWC 41 Masa de la cubierta 51 Posición 2o Máx. MWC
22 Amplitud 4º máximo 43 Elasticidad de la cubierta
32 Frecuencia final de la 44 Desbalance masa cubierta
señal
Tabla 6-20. Listado de parámetros de la base de datos masculina que rechazan la hipótesis
de igualdad en las distribuciones según las seis pruebas realizadas.
Nº Parámetro Nº Parámetro Nº Parámetro
2 Jitter 28 Frecuencia 2º máximo 44 Desbalance masa cubierta
12 2ª banda energía MWC 36 Pérdida cuerpo 45 Desbalance pérdida cubierta
13 3ª banda energía MWC 38 Desbalance masa cuerpo 46 Desb. elasticidad cubierta
14 4ª banda energía MWC 39 Desbalance pérdida cuerpo 47 Punto de Apertura
15 Amplitud origen señal 40 Desb. elasticidad cuerpo 50 Posición 1er Máximo MWC
19 Amplitud 2º máximo 41 Masa de la cubierta
23 Amplitud final de la 42 Pérdida de la cubierta
señal
115
Capítulo 6: Experimentación y resultados
Tabla 6-21. Tamaño del efecto de los parámetros para las bases de datos femenina
y masculina.
Nº Parámetro TAMAÑO DEL TAMAÑO DEL
EFECTO B.D. EFECTO B.D.
FEMENINA MASCULINA
1 Pitch 0,54 -1,86
2 Jitter -1,33 -1,74
3 Shimmer asociado a la amplitud -0,77 0,49
4 Shimmer asociado a la esbeltez -0,31 -0,49
5 Shimmer asociado al área -0,82 0,77
6 Razón Amplitud Pico de Cierre Glótico / Vecinos 0,19 0,66
7 Razón Esbeltez Pico de Cierre Glótico / Vecinos 0,47 0,76
8 Razón Energía MWC/AAW -0,11 0,66
9 2º Arm. / Frecuencia Fundamental Onda Mucosa -0,49 -0,69
er
10 2º Arm. / 1 Arm. Onda Mucosa -0,69 0,29
11 Primera banda de energía de la Onda Mucosa -1,57 0,53
12 Segunda banda de energía de la Onda Mucosa -1,70 -0,21
13 Tercera banda de energía de la Onda Mucosa -1,88 1,62
14 Cuarta banda de energía de la Onda Mucosa -2,01 -0,20
15 Amplitud del origen de la señal (valor relativo) 0,76 -0,88
17 Amplitud del primer máximo (valor absoluto) 0,37 -1,45
18 Amplitud del primer mínimo (valor relativo) -1,11 -1,07
19 Amplitud del segundo máximo (valor relativo) -1,53 -1,19
21 Amplitud del segundo mínimo (valor relativo) -1,64 -0,95
22 Amplitud del cuarto máximo (valor relativo) -1,86 -0,66
23 Amplitud del final de la señal (valor relativo) -1,74 -1,39
116
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Las tablas 6-22 y 6-23, que mantienen el código de color empleado en la tabla 6-21
ofrecen nuevamente los listados de parámetros de las bases de datos femenina y
masculina, junto con los valores del tamaño del efecto. Pero en esta ocasión los
parámetros aparecen ordenados, lo que resulta de especial interés: podemos
comprobar cuáles ofrecen una mayor diferencia entre los grupos patológico y
normofónico, estableciendo una comparación entre ellos. En los próximos párrafos
comentaremos algunos aspectos sobre los parámetros que presentan las mayores
diferencias.
117
Capítulo 6: Experimentación y resultados
118
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
119
Capítulo 6: Experimentación y resultados
Al igual que en la mayoría de los análisis realizados en este trabajo hemos llevado a
cabo las pruebas de correlación considerando de forma separada a los sujetos
femeninos y a los sujetos masculinos de la base de datos. Además, para cada uno de
estos dos casos contemplaremos tanto el conjunto total de las muestras como los
subconjuntos de personas con patología vocal y de personas normofónicas.
Los resultados presentados consisten en mostrar una tabla general (6-24 en la base
de datos femenina, 6-42 en la base de datos masculina) en la que podemos apreciar,
para cada parámetro, con cuál de los restantes parámetros se establece una
correlación considerada "alta" (con un índice mayor o igual que 0,6) ó "muy alta" (con
un índice mayor o igual que 0,8), según la escala de Bisquerra (Bisquerra, R., 1987). La
prueba realizada fue la de τ-Kendall, tal y como explicamos en el capítulo cinco.
120
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
121
Capítulo 6: Experimentación y resultados
PRIMER GRUPO.
En la tabla 6-25, referida a todos los casos, observamos que la relación establecida
entre los parámetros 038-040 no depende de terceras variables. Las relaciones
establecidas entre los parámetros 002-040, 038-039 y 002-039 sí presentan un cierto
grado de dependencia de terceras variables (menor en el último caso). Por último, las
relaciones establecidas entre los parámetros 002-038 y 039-040 presentan un grado de
dependencia de terceras variables bastante elevado.
Tabla 6-26. Observamos una fuerte relación entre el Jitter (002), Desbalance de la
masa del cuerpo (038), Desbalance de la pérdida del cuerpo (039), Desbalance de la
elasticidad del cuerpo (040) y Pérdida del cuerpo (036) en la base de datos femenina,
casos patológicos.
PAR.002 PAR.038 PAR.039 PAR.040 PAR.036
PAR.002 1
PAR.038 0,755/0,715 1
PAR.039 0,823/0,689 0,601/0,006 1
PAR.040 0,846/0,797 0,895/0,991 0,706/0,116 1
PAR.036 0,627/. 0,843/. 0,474/0,072 0,758/0,686 1
122
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
En la tabla 6-26, referida a los casos patológicos, observamos en primer lugar que el
parámetro 036 se ha incorporado a la agrupación. Además, podemos comprobar que
las relaciones 002-038, 002-039, 002-040 y 036-040 no dependen en gran medida de
terceras variables, y que en las relaciones establecidas entre los parámetros 038-039,
039-040 y 036-039 se detecta una fuerte dependencia de terceras variables, muy
especialmente en el primer caso (relación prácticamente espuria). Por último,
comprobamos que la relación establecida entre los parámetros 038-040 no depende
en absoluto de terceras variables.
La tabla 6-27, referida a los casos normofónicos, sólo incluye a los parámetros 002,
039 y 040 y en ella observamos que todas las relaciones (002-039, 002-040 y 039-040)
se ven bastante influidas por la presencia de terceras variables, aunque esta influencia
es menor en el caso de la relación establecida entre los parámetros 002 y 039.
SEGUNDO GRUPO.
123
Capítulo 6: Experimentación y resultados
En las tablas 6-28 y 6-29 (referidas a todos los casos y a los casos patológicos,
respectivamente) observamos un comportamiento idéntico: la relación que se
establece ente los parámetros 009 y 026 no se ve en absoluto afectada por terceras
variables, mientras que las relaciones que se establecen entre los parámetros 009-024
y 024-026 aparecen como totalmente espurias.
TERCER GRUPO.
Las tablas 6-30, 6-31 y 6-32 ofrecen una estructura similar. En los tres estudios
(todos los sujetos, sujetos patológicos y sujetos normofónicos, respectivamente) la
correlación que presentan los parámetros se ve afectada cuando consideramos la
influencia del resto de las variables, aunque no de un modo especialmente grande. En
particular, en el tercero de los casos (sujetos normofónicos) la influencia es
relativamente pequeña.
124
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
CUARTO GRUPO.
La tabla 6-33, referida a todos los casos, indica que las relaciones existentes entre
los parámetros 012-013 y 013-014 se ven moderadamente afectadas por la presencia
de terceras variables. La relación entre los parámetros 012-014, en cambio, se ve
bastante más influida por esta presencia.
La tabla 6-34, referida a los casos patológicos, incorpora al grupo el parámetro 011,
e indica que las relaciones existentes entre los parámetros 012-013, 012-014 y 013-014
no se ven afectadas por la presencia de terceras variables. La relación entre los
parámetros 012-011 lo hace de forma moderada. Por último, las relaciones entre los
parámetros 011-013 y 011-014 están bastante influidas por la presencia de terceras
variables.
14
Recordemos aquí que la razón de no considerar las correlaciones menores reside en que favorecemos
el análisis de un número de casos más reducido, además de más relevantes.
125
Capítulo 6: Experimentación y resultados
QUINTO GRUPO.
La tabla 6-35, referida al conjunto de todos los casos, indica que la relación
existente entre los parámetros 021-022 apenas depende de la influencia de terceras
variables.
SEXTO GRUPO.
126
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
La tabla 6-36, referida al conjunto de todos los casos, indica que la relación
existente entre los parámetros 030-031 apenas se ve influida por la presencia de
terceras variables. En cambio, con los mismos parámetros, la tabla 6-37 indica que,
para los casos patológicos la influencia de terceras variables es muy fuerte. Por último,
la tabla 6-38 indica que los casos normofónicos la influencia de terceras variables
existe, pero no es demasiado grande.
SÉPTIMO GRUPO.
La tabla 6-39, referida a los casos patológicos, indica que la relación existente entre
los parámetros 017-042 no se ve influida por la presencia de terceras variables.
En los casos normofónicos y en el conjunto de todos los casos la correlación que se
establece entre estos parámetros no alcanza el valor estipulado, por lo que no se
profundizará en el estudio en ninguno de los dos casos.
OCTAVO GRUPO.
La tabla 6-40, referida a los casos normofónicos, indica que la relación existente
entre los parámetros 001-037 no se ve afectada por la presencia de terceras variables.
Las relaciones establecidas entre los parámetros 001-035, 001-032 y 032-037 sí se ven
bastante afectadas, y aún alcanzamos un grado mayor de influencia por parte de
terceras variables en las relaciones establecidas entre los parámetros 035-037 y 032-
035.
En el conjunto de todos los casos la correlación que se establece entre estos
parámetros no alcanza el valor estipulado. Lo mismo sucede en los casos patológicos,
por lo que no se profundizará en el estudio en ninguno de los dos casos.
127
Capítulo 6: Experimentación y resultados
NOVENO GRUPO.
La tabla 6-41, referida a los casos normofónicos, indica que la relación existente
entre los parámetros 003-044 se ve muy afectada por la presencia de terceras
variables. En cambio, la relación existente entre los parámetros 005 y 044 no se ve
apenas afectada por la presencia de terceras variables. Por último, la relación existente
entre los parámetros 003 y 005 se ve moderadamente afectada por la presencia de
terceras variables.
DÉCIMO GRUPO.
Tanto en el conjunto de todos los casos como en los casos patológicos la correlación
establecida entre estos parámetros no alcanza el valor estipulado, por lo que no se
profundizará en el estudio en ninguno de los dos casos.
128
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
129
Capítulo 6: Experimentación y resultados
Del mismo modo que en la base de datos femenina, en la base de datos masculina
también hemos identificado bloques de parámetros relacionados atendiendo a la
correlación considerada como muy alta según Bisquerra (Bisquerra, R., 1987).
Podemos observarlos en las tablas comprendidas entre la 6-44 y la 6-55. En estas
tablas aparecen los índices de correlación calculados entre los diferentes parámetros,
junto con los índices de correlación parcial correspondientes, que, como en la base de
datos anterior, darán lugar a un breve comentario cualitativo sobre la influencia que
terceras variables pudieran tener en las relaciones consideradas.
PRIMER GRUPO.
La tabla 6-44, referida a todos los casos, indica que las relaciones establecidas entre
los parámetros 038-039 y 038-040 no se ven influidas por la presencia de terceras
variables. Sí aparece esta influencia, pero de forma ligera, en las relaciones
establecidas entre los parámetros 002-039 y 039-040. Por último, las relaciones
establecidas entre los parámetros 002-038 y 002-040 aparecen muy influidas por la
presencia de terceras variables.
Tabla 6-45. Observamos una fuerte relación entre los parámetros Jitter (002),
Desbalance de la masa del cuerpo (038), Desbalance de la pérdida del cuerpo (039),
Desbalance de la elasticidad del cuerpo (040) y Pérdida del cuerpo (036), en la base
de datos masculina, casos patológicos.
PAR.002 PAR.038 PAR.039 PAR.040 PAR.036
PAR.002 1
PAR.038 0,748/0,635 1
PAR.039 0,910/0,803 0,773/0,968 1
PAR.040 0,828/0,581 0,906/0,997 0,859/0,950 1
PAR.036 0,745/0,600 0,813/0,870 0,727/0,868 0,773/0,862 1
La tabla 6-45, referida a los casos patológicos, añade al grupo el parámetro 036, e
indica que las relaciones establecidas entre los parámetros 038-039, 038-040, 038-036,
039-040, 039-036 y 040-036 no se ven influidas por la presencia de terceras variables.
130
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
En las relaciones establecidas entre los parámetros 002-038, 002-039, 002-040 y 002-
036 sí se aprecia esta influencia, pero de forma leve.
La tabla 6-46, referida a los casos normofónicos, sólo incluye a los parámetros 002,
039 y 040, e indica que las relaciones establecidas entre los parámetros 002-039, y
039-040 no se ven influidas por la presencia de terceras variables. En la relación
establecida entre los parámetros 002-040 y 002-036 sí se aprecia esta influencia, de
forma moderada.
SEGUNDO GRUPO.
En las tablas 6-47 y 6-48 (referidas a todos los casos y a los casos patológicos,
respectivamente) observamos un comportamiento prácticamente idéntico, e idéntico
también al observado en la base de datos femenina para los mismos parámetros: la
relación que se establece ente los parámetros 009 y 026 no se ve en absoluto afectada
131
Capítulo 6: Experimentación y resultados
por terceras variables, mientras que las relaciones que se establecen entre los
parámetros 009-024 y 024-026 aparecen como totalmente espurias.
En los casos normofónicos los tres parámetros tienen también un valor constante
para todos los sujetos.
TERCER GRUPO.
La tabla 6-49, referida a todos los casos, indica que las relaciones establecidas entre
los parámetros 012-013 y 013-014 se ven influidas por la presencia de terceras
variables de forma moderada. La relación establecida entre los parámetros 012-014 se
considera prácticamente espuria.
La tabla 6-50, referida a los casos patológicos, sólo incluye a los parámetros 012 y
013, e indica que la relación establecida entre ambos se ve influida por la presencia de
terceras variables, pero de forma leve.
132
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
CUARTO GRUPO.
La tabla 6-51, referida a todos los casos, indica que la relación establecida entre los
parámetros 001-037 no se ve influida por la presencia de terceras variables.
Tabla 6-52. Observamos una fuerte relación entre los
parámetros Pitch (001), Frecuencia final (032), Masa del cuerpo
(035) y Elasticidad del cuerpo (037), en la base de datos
masculina, casos normofónicos.
PAR.001 PAR.032 PAR.035 PAR.037
PAR.001 1
PAR.032 0,827/0,058 1
PAR.035 0,965/0,692 0,831/0,382 1
PAR.037 0,954/0,982 0,784/0 0,920/0,557 1
La tabla 6-52, referida a los casos normofónicos, añade al bloque los parámetros
032 y 035, e indica que la relación establecida entre los parámetros 001-037 no se ve
influida por la presencia de terceras variables. Las relaciones establecidas entre los
parámetros 001-037 y 035-037 sí lo hacen, de forma moderada. Por su parte, la
relación establecida entre los parámetros 032-035 se ve bastante influida por la
presencia de terceras variables. Por último, las relaciones establecidas entre los
parámetros 001-032 y 032-037 se ven muy influidas por la presencia de terceras
variables, en especial la última de ellas, que se puede considerar espuria
En los casos patológicos la correlación que se establece entre estos parámetros no
alcanza el valor estipulado, por lo que no se profundizará en el estudio.
133
Capítulo 6: Experimentación y resultados
QUINTO GRUPO.
Las tablas 6-53, 6-54 y 6-55 (referidas a todos los casos, a los casos patológicos y a
los casos normofónicos, respectivamente) tienen una estructura similar. En ellas se
observa que la relación establecida entre los parámetros 030-031 apenas se ve influida
por el efecto de terceras variables cuando consideramos todos los casos y cuando
consideramos los casos patológicos. En los casos normofónicos esta influencia es algo
mayor, sin llegar a ser grande.
Como resumen del estudio, en las tablas comprendidas entre la 6-56 y la 6-58
podemos observar de forma clara los bloques de parámetros correlacionados en las
bases de datos femenina y masculina, cuando tenemos en cuenta todos los casos,
cuando consideramos únicamente los casos patológicos y cuando trabajamos
únicamente con los casos normofónicos, respectivamente.
134
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
restantes del bloque. En este caso, los parámetros afectados no estarán destacados en
la tabla.
Observando la tabla 6-56, referida a todos los casos, podemos comprobar el hecho
de que los bloques son iguales en las dos bases de datos, con el matiz de que en tres
de los casos los bloques presentan una correlación "muy alta" sólo en una de las dos
bases de datos (relación 001-037 en la base de datos masculina y relaciones 021-022 y
027-028 en la base de datos femenina), siendo las correlaciones que se establecen en
cada caso en la otra base de datos únicamente "altas".
En todo caso, podemos apreciar que los bloques están formados frecuentemente
por parámetros de la misma familia: observamos agrupaciones de desbalances de los
parámetros biomecánicos (junto con el jitter), de diferentes parámetros biométricos y
también de parámetros relacionados con la energía. También encontramos un bloque
en el que aparece un parámetro de perturbación/energía (2º Arm./Frecuencia
fundamental Onda Mucosa) relacionado con dos parámetros biométricos (Frecuencia
del origen de la señal y Frecuencia del primer máximo), y un bloque más formado por
el Pitch y la Elasticidad del cuerpo del pliegue vocal, parámetro biomecánico.
También cabe destacar que en el caso de eliminar las relaciones claramente
espurias podríamos suprimir de la tabla el parámetro biométrico 024 (Frecuencia del
origen de la señal) en ambas bases de datos, así como la relación 012-014, únicamente
en la base de datos masculina.
135
Capítulo 6: Experimentación y resultados
136
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
137
Capítulo 6: Experimentación y resultados
138
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
En la tabla 6-60 observamos que los índices alcanzan valores más bajos en la base
de datos masculina que en la femenina: en esta ocasión no tenemos correlaciones
"muy altas", y tampoco tenemos correlaciones "altas", siempre según el criterio
utilizado. Sí se mantiene, en cambio, el comportamiento que tienen las familias de los
parámetros en la base de datos femenina: los parámetros biomecánicos, y en
particular sus desbalances son los que ocupan las primeras posiciones; los parámetros
de energía junto con el jitter ocupan lugares avanzados en la tabla; los parámetros
biométricos no destacan especialmente; los parámetros temporales ocupan siempre
lugares retrasados.
139
Capítulo 6: Experimentación y resultados
Las pruebas de análisis factorial, como las de correlación, han sido realizadas sobre
los sujetos masculinos y femeninos de la base de datos de forma separada. También en
esta ocasión y para ambos casos trabajaremos tanto sobre el total de las muestras
como sobre los sujetos con patología vocal y sobre los sujetos normofónicos.
Los detalles de todas las pruebas realizadas figuran en el disco anexo, mientras que
en el apéndice seis aparecen las tablas de comunalidades (normales y rotadas) de los
diferentes casos sometidos a estudio.
El primer resultado alcanzado está relacionado con la adecuación de la técnica
sobre los datos empleados. En este sentido, podemos afirmar que en todos los casos
realizados se han obtenido resultados bastante satisfactorios. Los determinantes de las
matrices de correlación son siempre nulos o extremadamente pequeños. Las medidas
KMO, en cambio, no obtienen valores demasiado grandes, tal y como sería deseable.
Sin embargo, las pruebas de esfericidad de Bartlett sí alcanzan los valores requeridos, y
las matrices residuales no contienen valores altos, indicador de que el modelo factorial
es adecuado para explicar los datos. Por otra parte, es destacable el hecho de que las
tablas de comunalidades de todos los casos contienen valores altos en prácticamente
todos los parámetros. En cuanto a la varianza explicada por los factores calculados, no
queda por debajo del 84% en ningún caso. Llegando por fin al núcleo del estudio,
presentamos en las tablas comprendidas entre la 6-61 y la 6-66 las estructuras
factoriales obtenidas en cada caso, lo que permite observar qué parámetros concretos
contribuyen a la constitución de cada factor, destacando por su importancia aquellos
que lo hagan a las de los primeros factores.
140
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Tabla 6-61. Listado de los parámetros agrupados por factores para todos los casos, sin
rotación y para las bases de datos femenina y masculina.
BASES DE DATOS COMPLETAS, SIN ROTACIÓN
Base de datos femenina Base de datos masculina
F1 Amplitud del cuarto máximo (valor relativo) Desbalance de la pérdida del cuerpo
Amplitud del segundo mínimo (valor relativo) Jitter
Desbalance de la pérdida de la cubierta Pérdida del cuerpo
Cuarta banda de energía de la Onda Mucosa Amplitud del segundo máximo (valor relativo)
Desbalance de la masa de la cubierta Amplitud del cuarto máximo (valor relativo)
Tercera banda de energía de la Onda Mucosa Desbalance de la elasticidad del cuerpo
Pérdida del cuerpo Primera banda de energía de la Onda Mucosa
Amplitud del segundo máximo (valor relativo) Tercera banda de energía de la Onda Mucosa
Segunda banda de energía de la Onda Mucosa Amplitud del segundo máximo (valor relativo)
Desbalance de la elasticidad de la cubierta Segunda banda de energía de la Onda Mucosa
Primera banda de energía de la Onda Mucosa Amplitud del segundo mínimo (valor relativo)
Amplitud del segundo máximo (valor relativo) Cuarta banda de energía de la Onda Mucosa
Desbalance de la elasticidad del cuerpo Desbalance de la pérdida de la cubierta
Jitter Amplitud del primer mínimo (valor relativo)
Desbalance de la pérdida del cuerpo Desbalance de la elasticidad de la cubierta
Desbalance de la masa del cuerpo Desbalance de la masa del cuerpo
Amplitud del primer mínimo (valor relativo) Amplitud del origen de la señal (valor relativo)
Frecuencia del primer mínimo (valor relativo) Pérdida de la cubierta
Elasticidad de la cubierta Desbalance de la masa de la cubierta
Frecuencia del segundo mínimo (valor rel.) Amplitud del primer máximo (valor absoluto)
Frecuencia del segundo máximo (valor rel.) Frecuencia del primer máximo (valor abs.)
Shimmer asociado al área 2º Arm. / Frecuencia Fundamental MWC
Esbeltez correspondiente al segundo surco Frecuencia del origen de la señal (valor rel.)
Shimmer asociado a la amplitud Frecuencia del primer mínimo (valor relativo)
Frecuencia del segundo máximo (valor rel.)
Frecuencia del final de la señal (valor relativo)
Elasticidad de la cubierta
F2 Amplitud del primer máximo (valor absoluto) Shimmer asociado al área
Relación Energía MWC/AAW Frecuencia del cuarto máximo (valor relativo)
er er
2º Arm. / 1 Arm. Onda Mucosa 2º Arm. / 1 Arm. Onda Mucosa
Pérdida de la cubierta Posición 2º Máximo Onda Mucosa
Frecuencia del final de la señal (valor relativo) Frecuencia del 2º mínimo (valor relativo)
Masa del cuerpo
Elasticidad del cuerpo
F3 Punto de Apertura Shimmer asociado a la amplitud
Punto de Cierre Shimmer asociado a la esbeltez
2º Arm. / Frecuencia Fundamental MWC Masa del cuerpo
Frecuencia del primer máximo (valor absoluto)
Frecuencia del origen de la señal (valor rel.)
Pitch
Posición 2º Máximo Onda Mucosa
Masa de la cubierta
F4 Frecuencia del cuarto máximo (valor relativo) Relación Energía MWC/AAW
er
Posición 1 Máximo Onda Mucosa
Punto de Apertura
Punto de Cierre
F5 Punto de Recuperación Elasticidad del cuerpo
F6 Posición 1er Máximo Onda Mucosa Masa de la cubierta
Pitch
Esbeltez correspondiente al segundo surco
F7 Esbeltez correspondiente al primer surco Esbeltez correspondiente al primer surco
141
Capítulo 6: Experimentación y resultados
Tabla 6-62. Listado de los parámetros agrupados por factores, casos normofónicos, sin
rotación y para las bases de datos femenina y masculina.
BASES DE DATOS NORMOFÓNICAS, SIN ROTACIÓN
Base de datos femenina Base de datos masculina
F1 Desbalance de la pérdida de la cubierta Desbalance de la masa de la cubierta
Shimmer asociado a la amplitud Shimmer asociado a la esbeltez
Desbalance de la masa de la cubierta Desbalance de la pérdida de la cubierta
Frecuencia del cuarto máximo (valor rel.) Shimmer asociado al área
Shimmer asociado al área Shimmer asociado a la amplitud
Frecuencia del segundo mínimo (valor rel.) Amplitud del cuarto máximo (valor relativo)
Desbalance de la elasticidad de la cubierta Segunda banda de energía de la MWC
Amplitud del cuarto máximo (valor relativo) Desbalance de la elasticidad de la cubierta
Shimmer asociado a la esbeltez Amplitud del segundo mínimo (valor relativo)
Amplitud del origen de la señal (valor rel.) Amplitud del segundo máximo (valor relativo)
Frecuencia del primer mínimo (valor rel.) Primera banda de energía de la Onda Mucosa
Frecuencia del final de la señal (valor rel.) Frecuencia del cuarto máximo (valor relativo)
Frecuencia del segundo máximo (valor rel.) Tercera banda de energía de la MWC
Razón Amp. Pico de Cierre Glótico / Vecinos Frecuencia del segundo mínimo (valor rel.)
Punto de Apertura Amplitud del primer mínimo (valor relativo)
Frecuencia del segundo máximo (valor rel)
Amplitud del origen de la señal (valor rel.)
Desbalance de la masa del cuerpo
F2 Amplitud del primer máximo (valor abs.) Elasticidad de la cubierta
Elasticidad de la cubierta Pérdida de la cubierta
Amplitud del segundo mínimo (valor rel.) Amplitud del primer máximo (valor absoluto)
Pérdida del cuerpo Razón Energía MWC/AAW
Desbalance de la masa del cuerpo Desbalance de la pérdida del cuerpo
Amplitud del segundo máximo (valor rel.) Desbalance de la elasticidad del cuerpo
Esbeltez correspondiente al segundo surco Posición 1er Máximo Onda Mucosa
er
2º Arm. / 1 Arm. Onda Mucosa Jitter
Pérdida del cuerpo
F3 Desbalance de la elasticidad del cuerpo Pitch
Desbalance de la pérdida del cuerpo Elasticidad del cuerpo
Jitter Masa del cuerpo
Punto de Recuperación Frecuencia del final de la señal (valor relativo)
Amplitud del primer mínimo (valor relativo) Frecuencia del primer mínimo (valor relativo)
Posición 1er Máximo Onda Mucosa
F4 Punto de Cierre Amplitud del segundo máximo (valor relativo)
Pérdida de la cubierta Cuarta banda de energía de la Onda Mucosa
Masa de la cubierta
Relación Energía MWC/AAW
o
F5 Masa del cuerpo Posición 2 Máximo Onda Mucosa
Elasticidad del cuerpo Masa de la cubierta
Pitch Punto de Cierre
142
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Tabla 6-63. Listado de los parámetros agrupados por factores, casos patológicos, sin
rotación y para las bases de datos femenina y masculina.
BASES DE DATOS PATOLÓGICAS, SIN ROTACIÓN
Base de datos femenina Base de datos masculina
F1 Amplitud del segundo mínimo (valor relativo) Amplitud del segundo máximo (valor relativo)
Amplitud del cuarto máximo (valor relativo) Desbalance de la pérdida del cuerpo
Desbalance de la elasticidad de la cubierta Jitter
Desbalance de la masa de la cubierta Amplitud del cuarto máximo (valor relativo)
Tercera banda de energía de la Onda Mucosa Pérdida del cuerpo
Primera banda de energía de la Onda Mucosa Amplitud del primer mínimo (valor relativo)
Cuarta banda de energía de la Onda Mucosa Desbalance de la elasticidad del cuerpo
Amplitud del segundo máximo (valor relativo) Amplitud del segundo mínimo (valor relativo)
Desbalance de la pérdida de la cubierta Amplitud del primer máximo (valor absoluto)
Segunda banda de energía de la Onda Mucosa Amplitud del origen de la señal (valor rel.)
Pérdida del cuerpo Desbalance de la masa del cuerpo
Desbalance de la elasticidad del cuerpo Frecuencia del final de la señal (valor rel.)
Elasticidad de la cubierta 2º Arm. / Frecuencia Fundamental MWC
Desbalance de la masa del cuerpo Frecuencia del primer máximo (valor abs.)
Amplitud del segundo máximo (valor relativo) Primera banda de energía de la Onda Mucosa
Frecuencia del primer mínimo (valor relativo) Pérdida de la cubierta
Frecuencia del segundo mínimo (valor rel.) Frecuencia del origen de la señal (valor rel.)
Jitter Amplitud del segundo máximo (valor relativo)
Punto de Cierre Desbalance de la elasticidad de la cubierta
Amplitud del primer mínimo (valor relativo) Frecuencia del primer mínimo (valor relativo)
Esbeltez correspondiente al segundo surco Posición 2o Máximo Onda Mucosa
Shimmer asociado al área Cuarta banda de energía de la Onda Mucosa
Elasticidad de la cubierta
Razón Energía MWC/AAW
F2 Amplitud del primer máximo (valor absoluto) Shimmer asociado al área
Razón Energía MWC/AAW Segunda banda de energía de la MWC
Pérdida de la cubierta Frecuencia del cuarto máximo (valor relativo)
2º Arm. / 1er Arm. Onda Mucosa Tercera banda de energía de la MWC
Frecuencia del final de la señal (valor relativo) Frecuencia del segundo máximo (valor rel.)
Pitch Frecuencia del segundo mínimo (valor rel.)
er
Masa del cuerpo 2º Arm. / 1 Arm. Onda Mucosa
Elasticidad del cuerpo Masa del cuerpo
143
Capítulo 6: Experimentación y resultados
Las tablas 6-61, 6-62 y 6-63 presentan la estructura factorial de las bases de datos
femenina y masculina para todos los casos, para los casos patológicos y para los casos
normofónicos. En los tres casos alcanzamos las mismas conclusiones: las estructuras
factoriales obtenidas presentan una gran acumulación de parámetros en el primer
factor; en los siguientes factores va disminuyendo el número de parámetros de forma
más o menos progresiva hasta llegar a los últimos factores, donde la estructura
factorial se difumina, dándose en varios casos la circunstancia de contar con factores
explicados con un sólo parámetro.
Estas configuraciones no permiten alcanzar conclusiones relevantes, debido al
aspecto caótico que ofrecen, aunque los factores obtenidos sí jugarán un papel
importante en la tarea de detección de patología mediante la técnica de análisis
discriminante, como veremos en el siguiente apartado.
Para obtener una interpretación más clara podemos observar las tablas
comprendidas entre la 6-64 y la 6-66, donde se ha aplicado a las soluciones factoriales
sendas rotaciones con el método varimax. Las soluciones rotadas presentan a los
diferentes parámetros organizados de un modo claro en torno a los factores, como
podemos comprobar en las tablas.
144
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Tabla 6-64. Listado de los parámetros agrupados por factores para todos los casos, rotación
varimax y para las bases de datos femenina y masculina.
BASES DE DATOS COMPLETAS, ROTACIÓN VARIMAX
Base de datos femenina Base de datos masculina
F1 Jitter Tercera banda de energía de la Onda Mucosa
Desbalance de la pérdida del cuerpo Segunda banda de energía de la Onda Mucosa
Desbalance de la elasticidad del cuerpo Cuarta banda de energía de la Onda Mucosa
Desbalance de la masa del cuerpo Primera banda de energía de la Onda Mucosa
Desbalance de la pérdida de la cubierta Amplitud del segundo máximo (valor relativo)
Desbalance de la masa de la cubierta 2º Arm. / 1er Arm. Onda Mucosa
Pérdida del cuerpo
Desbalance de la elasticidad de la cubierta
Amplitud del origen de la señal (valor
relativo)
F2 Frecuencia del segundo máximo (valor rel.) Desbalance de la masa del cuerpo
Frecuencia del primer mínimo (valor relativo) Desbalance de la elasticidad del cuerpo
Frecuencia del cuarto máximo (valor relativo) Elasticidad del cuerpo
Frecuencia del segundo mínimo (valor rel.) Masa del cuerpo
Amplitud del segundo máximo (valor relativo) Jitter
Amplitud del segundo mínimo (valor relativo) Desbalance de la pérdida del cuerpo
Amplitud del cuarto máximo (valor relativo) Pérdida del cuerpo
Esbeltez correspondiente al segundo surco Amplitud del origen de la señal (valor relativo)
F3 Segunda banda de energía de la MWC Frecuencia del cuarto máximo (valor rel.)
Tercera banda de energía de la MWC Frecuencia del segundo mínimo (valor rel.)
Cuarta banda de energía de la MWC Frecuencia del segundo máximo (valor rel.)
Primera banda de energía de la MWC Frecuencia del primer mínimo (valor rel.)
Amplitud del segundo máximo (valor relativo) Amplitud del segundo mínimo (valor rel.)
Amplitud del cuarto máximo (valor rel.)
Amplitud del segundo máximo (valor rel.)
F4 Frecuencia del origen de la señal (valor Frecuencia del primer máximo (valor absoluto)
relativo) 2º Arm. / Frecuencia Fundamental MWC
2º Arm. / Frecuencia Fundamental MWC Frecuencia del origen de la señal (valor
Frecuencia del primer máximo (valor relativo)
o
absoluto) Posición 2 Máximo Onda Mucosa
Elasticidad de la cubierta Elasticidad de la cubierta
Punto de Apertura
Desbalance de la elasticidad de la cubierta
F5 Pérdida de la cubierta Pérdida de la cubierta
Masa de la cubierta Razón Energía MWC/AAW
Amplitud del primer máximo (valor absoluto) Amplitud del primer máximo (valor absoluto)
Razón Energía MWC/AAW Masa de la cubierta
Punto de Cierre Punto de Cierre
145
Capítulo 6: Experimentación y resultados
La tabla 6-64, referida a todos los casos para las bases de datos femenina y
masculina, presenta el listado de los parámetros correspondientes a cada factor
resultado del análisis, con la solución factorial rotada con el método varimax.
Comentaremos a continuación las características más destacadas de los bloques
formados.
En la base de datos femenina, el primer factor agrupa todos los desbalances de los
parámetros biomecánicos. El segundo factor está compuesto exclusivamente por
parámetros biométricos. En el tercer factor encontramos todos los parámetros de
energía. Los parámetros temporales, en su mayoría, se agrupan en torno a uno de los
factores menos importantes, el décimo. Los parámetros de perturbación también
aparecen, en general, concentrados en torno a los últimos factores (con la excepción
del jitter, que aparece en el primer factor).
146
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Tabla 6-65. Listado de los parámetros agrupados por factores, casos normofónicos,
rotación varimax y para las bases de datos femenina y masculina.
BASES DE DATOS NORMOFÓNICAS, ROTACIÓN VARIMAX
Base de datos femenina Base de datos masculina
F1 Desbalance de la masa de la cubierta Desbalance de la pérdida de la cubierta
Shimmer asociado al área Desbalance de la masa de la cubierta
Desbalance de la pérdida de la cubierta Shimmer asociado al área
Shimmer asociado a la amplitud Shimmer asociado a la esbeltez
Shimmer asociado a la esbeltez Desbalance de la elasticidad de la cubierta
Desbalance de la elasticidad de la cubierta Shimmer asociado a la amplitud
F2 Frecuencia del segundo máximo (valor rel.) Pitch
Frecuencia del primer mínimo (valor relativo) Elasticidad del cuerpo
Amplitud del segundo máximo (valor relativo) Masa del cuerpo
Amplitud del primer mínimo (valor relativo) Frecuencia del segundo máximo (valor rel.)
Frecuencia del cuarto máximo (valor relativo) Frecuencia del primer mínimo (valor rel.)
Frecuencia del segundo mínimo (valor rel.) Frecuencia del segundo mínimo (valor rel.)
Amplitud del segundo mínimo (valor relativo) Frecuencia del cuarto máximo (valor rel.)
Esbeltez correspondiente al segundo surco
Amplitud del cuarto máximo (valor relativo)
F3 Desbalance de la elasticidad del cuerpo Relación Energía MWC/AAW
Jitter Pérdida de la cubierta
Desbalance de la pérdida del cuerpo Elasticidad de la cubierta
Desbalance de la masa del cuerpo Posición 1er Máximo Onda Mucosa
Pérdida del cuerpo Amplitud del primer máximo (valor abs.)
Primera banda de energía de la MWC
2º Arm / 1er Arm. Onda Mucosa
Amplitud del origen de la señal (valor rel.)
Amplitud del cuarto máximo (valor relativo)
F4 Pérdida de la cubierta Amplitud del segundo máximo (valor rel.)
Razón Energía MWC/AAW Cuarta banda de energía de la MWC
Amplitud del primer máximo (valor absoluto) Tercera banda de energía de la MWC
Punto de Cierre Segunda banda de energía de la MWC
Masa de la cubierta Frecuencia del final de la señal (valor rel.)
2º ARM / 1er Arm. Onda Mucosa
F5 Pitch Jitter
Elasticidad del cuerpo Desbalance de la pérdida del cuerpo
Masa del cuerpo Desbalance de la elasticidad del cuerpo
Frecuencia del final de la señal (valor relativo) Pérdida del cuerpo
Elasticidad de la cubierta
Punto de Apertura
F6 Cuarta banda de energía de la Onda Mucosa Masa de la cubierta
Tercera banda de energía de la Onda Mucosa Punto de Cierre
o
Segunda banda de energía de la Onda Mucosa Posición 2 Máximo Onda Mucosa
Amplitud del segundo máximo (valor relativo) Esbeltez correspondiente al segundo surco
Primera banda de energía de la Onda Mucosa
F7 Posición 1er Máximo Onda Mucosa Esbeltez correspondiente al primer surco
Punto de Recuperación Amplitud del primer mínimo (valor relativo)
Amplitud del segundo máximo (valor rel.)
Amplitud del segundo mínimo (valor rel.)
F8 Razón Amp. Pico de Cierre Glótico / Vecinos Razón Amp. Pico de Cierre Glótico / Vecinos
Razón Esb. Pico de Cierre Glótico / Vecinos Desbalance de la masa del cuerpo
Amplitud del origen de la señal (valor relativo)
F9 Posición 2o Máximo Onda Mucosa Razón Esb. Pico de Cierre Glótico / Vecinos
Punto de Apertura
F10 Esbeltez correspondiente al primer surco Punto de Recuperación
147
Capítulo 6: Experimentación y resultados
En la base de datos masculina, el primer factor tiene las mismas características que
en la base de datos femenina: aparecen algunos desbalances de los parámetros
biomecánicos junto con algunos parámetros de perturbación. El segundo factor cuenta
también con varios parámetros biométricos y con algún parámetro biomecánico. El
tercer factor aglutina varios parámetros de todas las categorías. Las bandas de energía
aparecen mayoritariamente en el cuarto factor, el resto de los desbalances aparecen
en el séptimo factor, y los parámetros temporales se encuentran nuevamente
presentes en los últimos factores.
Tabla 6-66. Listado de los parámetros agrupados por factores, casos patológicos, rotación
varimax y para las bases de datos femenina y masculina.
BASES DE DATOS PATOLÓGICAS, ROTACIÓN VARIMAX
Base de datos femenina Base de datos masculina
F1 Jitter Desbalance de la masa del cuerpo
Desbalance de la pérdida del cuerpo Desbalance de la elasticidad del cuerpo
Desbalance de la elasticidad del cuerpo Jitter
Desbalance de la masa del cuerpo Elasticidad del cuerpo
Desbalance de la masa de la cubierta Masa del cuerpo
Desbalance de la pérdida de la cubierta Pérdida del cuerpo
Pérdida del cuerpo Desbalance de la pérdida del cuerpo
Desbalance de la elasticidad de la cubierta Amplitud del origen de la señal (valor rel.)
Punto de Cierre
F2 Primera banda de energía de la Onda Mucosa Frecuencia del segundo mínimo (valor rel.)
Segunda banda de energía de la Onda Mucosa Frecuencia del segundo máximo (valor rel.)
Tercera banda de energía de la Onda Mucosa Frecuencia del cuarto máximo (valor relativo)
Cuarta banda de energía de la Onda Mucosa Frecuencia del primer mínimo (valor relativo)
Amplitud del segundo máximo (valor relativo) Amplitud del cuarto máximo (valor relativo)
Punto de Cierre Amplitud del segundo mínimo (valor relativo)
Amplitud del segundo máximo (valor relativo)
148
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
En la base de datos femenina, el primer factor acumula todos los desbalances de los
parámetros biomecánicos. En el segundo factor aparecen las cuatro bandas de energía
de la onda mucosa. El tercer factor está compuesto de parámetros biométricos y
biomecánicos, y de la relación de energía entre la onda mucosa y la onda acústica
promedio. El resto de los parámetros biométricos aparecen mayoritariamente en los
siguientes factores (cuarto y quinto). Los parámetros temporales aparecen en los
últimos factores, con la excepción de uno de ellos –punto de cierre– que encontramos
en el segundo factor. Los parámetros de perturbación también aparecen generalmente
en los últimos factores.
149
Capítulo 6: Experimentación y resultados
En la base de datos masculina, el primer factor cuenta sobre todo con parámetros
biomecánicos, aunque también aparecen parámetros de las demás categorías
(perturbación, biométricos e incluso temporales). El segundo factor está formado
exclusivamente por parámetros biométricos. En el tercer factor aparecen las cuatro
bandas de energía. Los desbalances que no aparecen en el primer factor están en esta
ocasión agrupados en un factor retrasado, el séptimo. Los parámetros temporales se
distribuyen en esta ocasión también en factores adelantados: en el primero (ya
mencionado) y en el cuarto, aunque también con presencia en el décimo factor. Los
parámetros de perturbación aparecen de forma mayoritaria en los factores centrales
(cuarto, quinto y sexto).
15
Recordemos que hablamos del cálculo de la medida de validación cruzada llamada "no seleccionada".
Además, también se calculan las medidas llamadas "seleccionadas", "validación cruzada" (leave-one-out)
y "medida general".
150
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
16
En esta categoría se calcularon por separado los factores correspondientes a cada familia, y se
incluyeron en cada uno de los estudios, dejando fuera los de una familia cada vez. En la categoría
anterior se calcularon todos los factores para cada estudio, dejando fuera en cada ocasión los
parámetros correspondientes a cada familia.
151
Capítulo 6: Experimentación y resultados
Todos los parámetros excepto los peores según el estudio realizado a partir de la
diferencia de distribuciones de los parámetros (ver tablas 6-19 y 6-20).
Todos los parámetros excepto los peores según el estudio realizado a partir del
tamaño del efecto de los parámetros (ver tablas 6-22 y 6-23)17.
Todos los parámetros excepto los peores según el estudio realizado a partir de la
correlación de los parámetros con la variable dicotómica que indica si cada uno
de los sujetos tiene o no patología vocal (ver tablas 6-59 y 6-60).
Los siguientes estudios realizados están relacionados con el análisis factorial cuyos
resultados podemos ver en el apartado 6.2.2, y consisten en utilizar de forma
incremental los diferentes factores que resultan de aplicar la técnica a las bases de
datos de todos los sujetos utilizando la rotación varimax. Así, en un primer estudio se
empleó únicamente el primer factor; en el segundo, los dos primeros; en el tercero, los
tres primeros, y así sucesivamente hasta llegar a los once factores. Las pruebas se
repitieron utilizando, en lugar de los factores, los parámetros vinculados a los mismos.
17
En este caso se han realizado algunas pruebas adicionales excluyendo, respectivamente, uno, seis,
ocho, nueve y doce parámetros (aquellos que, en cada caso, ofrecen un valor más bajo del tamaño del
efecto). Recordemos que el estudio original excluyó cuatro parámetros.
152
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
La tabla 6-67 recoge los resultados de las pruebas que implican a todos los
parámetros y a todos los factores extraídos de ellos, variando la proporción de casos
utilizados en la fase de entrenamiento y en la fase de clasificación. Podemos concluir
que el porcentaje en los valores seleccionados es siempre muy alto (por encima del
96%), rozando o alcanzando el 100% en el caso de las pruebas que involucran a los
parámetros. La validación cruzada ofrece mejores resultados en las pruebas que
utilizan factores, circunstancia que se repite en el caso de los valores no seleccionados
y también en el de la medida general, aunque no en el caso de los valores
seleccionados. En cuanto a la proporción entrenamiento/clasificación los resultados
son algo mejores para los casos 90-10, proporción que generalmente se considera más
adecuada. Son muy destacables los valores alcanzados en el caso del uso de factores
con la proporción entrenamiento/clasificación 90-10.
La tabla 6-68 recoge los resultados de las pruebas en las que se han utilizado
únicamente factores y parámetros pertenecientes a cada una de las familias
empleadas en la tesis. Es destacable el hecho de que los valores obtenidos con los
parámetros son más altos que los obtenidos con los factores prácticamente en todos
los casos.
Por otra parte, podemos observar que los parámetros que por sí solos tienen más
éxito son los biomecánicos y los biométricos, con valores que rondan el 90%. Los de
perturbación y energía alcanzan valores algo menores, moviéndose en torno al 86%.
Los parámetros temporales alcanzan cotas más pequeñas, alrededor del 77%. En todo
caso, todos los resultados obtenidos son apreciables, teniendo en cuenta que
proceden de estudios en los que se han utilizado un número relativamente reducido
de datos.
153
Capítulo 6: Experimentación y resultados
La tabla 6-69 recoge los resultados de las pruebas en las que se han utilizado todos
los parámetros excepto los de una de las familias en cada ocasión, junto con las
pruebas en las que, con el mismo esquema, se han utilizado los factores
correspondientes en lugar de los parámetros.
Los resultados son siempre algo mejores cuando empleamos factores que cuando
utilizamos parámetros. En el caso del uso de factores, la ausencia de cualquier familia
de parámetros en el modelo empeora los resultados obtenidos 18, aun manteniendo
unas tasas altas (algo menores en el caso de los factores obtenidos al prescindir de los
parámetros de perturbación/energía). En el caso del uso de parámetros, en cambio, los
resultados mejoran cuando prescindimos de los biomecánicos y mejoran aún algo más
cuando lo hacemos de los biométricos. En cambio, si prescindimos tanto de los
parámetros temporales como de los de perturbación/energía, las tasas empeoran
ligeramente.
18
respecto al hecho de utilizarlos todos, tabla 6-67. En el resto del párrafo, las alusiones a los términos
"mejora" o "empeora" se refieren a la misma circunstancia.
154
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
La tabla 6-70 recoge los resultados de la pruebas en la que se han utilizado todos los
parámetros excepto el número 024 (Frecuencia Origen Señal), junto con la prueba en
la que, con el mismo esquema, se han utilizado los factores correspondientes en lugar
de los parámetros. Ambas pruebas mejoran ligeramente los resultados obtenidos en
las pruebas equivalentes en las que no se ha realizado la exclusión del parámetro en
cuestión, alcanzado siempre tasas más altas con los factores.
En esta tabla encontramos el mejor resultado de clasificación obtenido para la base
de datos femenina de todos los estudios realizados, obtenido con la utilización de los
factores extraídos a partir de todos los parámetros excepto el número 024, (Frecuencia
Origen Señal), en una proporción entrenamiento/clasificación de 90-10.
Tabla 6-71. Resultado de la quinta tanda de pruebas de análisis discriminante, base de
datos femenina.
PRUEBA SELECCIO- VALIDACIÓN NO MEDIDA
NADOS CRUZADA SELECCIO- GENERAL
NADOS
Mejores parámetros
98,00% 87,00% 94,00% 93,00%
DIAGRAMAS DE CAJA 50-50
Mejores parámetros
97,12% 91,65% 90,00% 92,92%
DIAGRAMAS DE CAJA 90-10
Mejores factores
92,00% 91,00% 92,00% 91,67%
DIAGRAMAS DE CAJA 50-50
Mejores factores
92,53% 91,65% 92,00% 92,06%
DIAGRAMAS DE CAJA 90-10
Mejores parámetros
98,00% 82,00% 91,00% 90,33%
DIFERENCIA DISTRIBUCIONES 50-50
Mejores parámetros
95,23% 88,57% 91,00% 91,60%
DIFERENCIA DISTRIBUCIONES 90-10
Mejores factores
93,00% 93,00% 92,00% 92,67%
DIFERENCIA DISTRIBUCIONES 50-50
Mejores factores
92,98% 92,87% 93,00% 92,95%
DIFERENCIA DISTRIBUCIONES 90-10
Mejores parámetros
97,00% 90,00% 92,00% 93,00%
TAMAÑO DEL EFECTO 50-50
Mejores parámetros
95,91% 91,43% 90,00% 92,45%
TAMAÑO DEL EFECTO 90-10
Mejores factores
93,00% 88,00% 91,00% 90,67%
TAMAÑO DEL EFECTO 50-50
Mejores factores
91,76% 90,55% 91,00% 91,10%
TAMAÑO DEL EFECTO 90-10
Mejores parámetros
90,00% 84,00% 87,00% 87,00%
CORRELACION CRITERIO SALUD 50-50
Mejores parámetros
90,66% 87,14% 87,00% 88,27%
CORRELACION CRITERIO SALUD 90-10
Mejores factores
88,00% 88,00% 89,00% 88,33%
CORRELACION CRITERIO SALUD 50-50
Mejores factores
87,69% 87,47% 88,00% 87,72%
CORRELACION CRITERIO SALUD 90-10
La tabla 6-71 recoge los resultados de las pruebas en las que se han utilizado los
mejores parámetros según cada uno de los estudios estadísticos realizados en esta
tesis que permiten catalogarlos como tales. Como es habitual, también aparecen los
resultados que ofrecen los factores obtenidos de los mismos parámetros. Además,
155
Capítulo 6: Experimentación y resultados
todas las pruebas se han llevado a cabo utilizando dos proporciones diferentes de
casos de entrenamiento y clasificación: 90-10 y 50-50, respectivamente.
El uso de parámetros o factores arroja resultados similares. En el caso de los
estudios relacionados con los diagramas de caja y con el tamaño del efecto los
parámetros alcanzan valores ligeramente mayores, mientras que en los estudios
relacionados con la diferencia de distribuciones y con la correlación con la variable
dicotómica "patológico-sano" sucede lo contrario. Los resultados son también muy
parecidos en las dos proporciones de casos de entrenamiento y clasificación utilizadas,
obteniendo la opción 90-10 resultados ligeramente mejores en la mayoría de los casos.
En cuanto a los tipos de estudios realizados, en los tres primeros casos (diagramas
de caja, diferencia de distribuciones y tamaño del efecto) obtenemos cotas superiores
que alcanzan o se acercan al 93% en la medida general, mientras que en el último
estudio (correlación con la variable "patológico-sano") superamos el 88%. Cabe
destacar, como en estudios anteriores, la elevada capacidad discriminante de un
conjunto relativamente pequeño de parámetros.
Tabla 6-72. Resultado de la sexta tanda de pruebas de análisis discriminante, base de datos
femenina.
PRUEBA SELECCIO- VALIDACIÓN NO SELECCIO- MEDIDA
NADOS CRUZADA NADOS GENERAL
Sin peores parámetros
100,00% 73,00% 78,00% 83,67%
DIFERENCIA DISTRIBUCIONES 50-50
Sin peores parámetros
99,34% 87,10% 87,00% 91,15%
DIFERENCIA DISTRIBUCIONES 90-10
Sin peores factores
96,00% 90,00% 96,00% 94,00%
DIFERENCIA DISTRIBUCIONES 50-50
Sin peores factores
96,04% 94,54% 96,00% 95,53%
DIFERENCIA DISTRIBUCIONES 90-10
Sin peores parámetros
100,00% 73,00% 84,00% 85,67%
TAMAÑO DEL EFECTO 50-50
Sin peores parámetros
99,23% 87,47% 90,00% 92,23%
TAMAÑO DEL EFECTO 90-10
Sin peores factores
95,00% 90,00% 96,00% 93,67%
TAMAÑO DEL EFECTO 50-50
Sin peores factores
95,47% 93,99% 95,00% 94,82%
TAMAÑO DEL EFECTO 90-10
Sin peores parámetros
99,00% 79,00% 84,00% 87,33%
CORRELACION CRITERIO SALUD 50-50
Sin peores parámetros
98,46% 88,12% 88,00% 91,53%
CORRELACION CRITERIO SALUD 90-10
Sin peores factores
95,00% 90,00% 92,00% 92,33%
CORRELACION CRITERIO SALUD 50-50
Sin peores factores
95,93% 93,21% 94,00% 94,38%
CORRELACION CRITERIO SALUD 90-10
Sin peores factores
96,04% 95,11% 96,00% 95,72%
TAMAÑO DEL EFECTO 50-50 1
Sin peores factores
95,81% 93,44% 94,00% 94,42%
TAMAÑO DEL EFECTO 50-50 6
Sin peores factores
96,04% 94,89% 95,00% 95,31%
TAMAÑO DEL EFECTO 50-50 8
Sin peores factores
96,04% 94,88% 95,00% 95,31%
TAMAÑO DEL EFECTO 50-50 9
Sin peores factores
95,69% 93,65% 95,00% 94,78%
TAMAÑO DEL EFECTO 50-50 12
156
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
La tabla 6-72 recoge los resultados de las pruebas en las que se han suprimido los
peores parámetros, siempre según cada uno de los estudios estadísticos realizado en
esta tesis que permiten catalogarlos como tales. También aparecen en la tabla los
resultados que ofrecen los factores obtenidos de los mismos parámetros. Además,
como en la tabla anterior, todas las pruebas se han realizado utilizando dos
proporciones diferentes de casos de entrenamiento y clasificación: 90-10 y 50-50,
respectivamente. Por último, el estudio relacionado con el tamaño del efecto incluye
algunas pruebas adicionales en las que se han eliminado un número diferente de
parámetros para generar los factores empleados: uno, seis, ocho, nueve y doce
parámetros, respectivamente.
Los factores obtienen mejores resultados que los parámetros en todos los casos, al
igual que sucede con la proporción 90-10 respecto a la 50-50. En cuanto a los estudios
realizados, al prescindir de los peores parámetros en cada uno de ellos se obtienen
resultados muy altos. Destacamos en este sentido el estudio relacionado con la
diferencia de distribuciones utilizando factores y usando la proporción
entrenamiento/clasificación 90-10. En cualquier caso, los resultados son siempre
ligeramente peores que en los estudios en los que se utilizan todos los parámetros o
factores. En la misma línea, las pruebas adicionales relacionadas con el tamaño del
efecto también obtienen tasas cercanas a los mejores resultados obtenidos.
157
Capítulo 6: Experimentación y resultados
La tabla 6-73 recoge los resultados de las pruebas en las que se han utilizado, de
forma incremental, los diferentes factores obtenidos utilizando todos los parámetros
con la rotación varimax (en la primera prueba se ha empleado únicamente el primer
factor, en la segunda prueba se han empleado los dos primeros factores, y así
sucesivamente). En la tabla aparecen también los resultados de las pruebas realizadas
utilizando los parámetros correspondientes a cada uno de los factores empleados en
las pruebas anteriores.
Fig. 6-1. Representación gráfica de los datos correspondientes a los factores presentes
en la tabla 6-73.
158
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
159
Capítulo 6: Experimentación y resultados
La tabla 6-75 recoge los resultados de las pruebas en las que se han utilizado
únicamente factores y parámetros pertenecientes a cada una de las familias
empleadas en la tesis. Podemos observar que los parámetros se comportan mejor que
los factores, excepto en el caso de los de perturbación/energía. En particular, los
parámetros biométricos y los biomecánicos alcanzan tasas muy elevadas (alrededor
del 85% en la medida general). Por el contrario, tanto los parámetros como los
factores temporales arrojan resultados de clasificación más modestos (alrededor del
65% los primeros, sin alcanzar el 70% los segundos, ambos en la medida general).
Tabla 6-76. Resultado de la tercera tanda de pruebas de análisis discriminante, base de
datos masculina.
PRUEBA SELECCIO- VALIDACIÓN NO MEDIDA
NADOS CRUZADA SELECCIO- GENERAL
NADOS
Parámetros SIN
94,78% 82,44% 84,00% 87,07%
PERTURBACIÓN/ENERGÍA
Parámetros
93,42% 84,33% 84,00% 87,25%
SIN BIOMÉTRICOS
Parámetros
92,97% 75,44% 81,00% 83,14%
SIN BIOMECÁNICOS
Parámetros
95,32% 85,79% 89,00% 90,04%
SIN TEMPORALES
Factores SIN
84,49% 80,66% 79,00% 81,38%
PERTURBACIÓN/ENERGÍA
Factores
89,45% 86,56% 84,00% 86,67%
SIN BIOMÉTRICOS
Factores
89,56% 85,43% 85,00% 86,66%
SIN BIOMECÁNICOS
Factores
89,34% 83,53% 83,00% 85,29%
SIN TEMPORALES
La tabla 6-76 recoge los resultados de las pruebas en las que se han utilizado todos
los parámetros excepto los de una de las familias en cada ocasión, junto con las
pruebas en las que, con el mismo esquema, se han utilizado los factores
correspondientes en lugar de los parámetros. Podemos observar que los parámetros
alcanzan tasas más elevadas que los factores, excepto en el caso de los biomecánicos.
En todo caso, ya sea utilizando parámetros o factores, el hecho de prescindir de
cualquiera de las familias utilizadas mantiene valores muy altos, pero sin llegar a los
alcanzados cuando incluimos estas familias. Esto sucede en todos los casos excepto
cuando prescindimos de los parámetros temporales. En este último caso mejoramos
los resultados obtenidos con todos los parámetros, alcanzando con este estudio los
mejores resultados de toda la base de datos masculina.
Tabla 6-77. Resultado de la cuarta tanda de pruebas de análisis
discriminante, base de datos masculina.
PRUEBA SELECCIO- VALIDACIÓN NO SELECCIO- MEDIDA
NADOS CRUZADA NADOS GENERAL
Parámetros
95,53% 82,77% 86,00% 88,10%
SIN EL 24
Factores
88,90% 86,02% 87,00% 87,31%
SIN EL 24
160
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
La tabla 6-77 recoge los resultados de la pruebas en la que se han utilizado todos los
parámetros excepto el número 024 (Frecuencia Origen Señal), junto con la prueba en
la que, con el mismo esquema, se han utilizado los factores correspondientes en lugar
de los parámetros. Podemos observar que las dos pruebas obtienen resultados muy
similares aunque ligeramente inferiores a los obtenidos en las pruebas equivalentes en
las que se han utilizados todos los parámetros y factores, respectivamente.
La tabla 6-78 recoge los resultados de las pruebas en las que se han utilizado los
mejores parámetros según cada uno de los estudios realizado en esta tesis que
permiten catalogarlos como tales. Además, también aparecen los resultados que
ofrecen los factores obtenidos de los mismos parámetros. Por otra parte, todas las
pruebas se han realizado utilizando dos proporciones diferentes de casos de
entrenamiento y clasificación: 90-10 y 50-50, respectivamente.
El uso de parámetros o factores arroja resultados muy similares. Lo mismo sucede
con las dos proporciones empleadas de casos de entrenamiento y clasificación. En
cuanto a los tipos de estudios realizados, los relacionados con diagramas de caja y con
161
Capítulo 6: Experimentación y resultados
diferencia de distribuciones alcanzan unas cotas muy elevadas, próximas a las de los
mejores estudios de la base de datos. El estudio relacionado con la correlación de la
variable binaria "patológico-sano" baja ligeramente sus prestaciones, y algo más lo
hace el estudio relacionado con el tamaño del efecto, aun manteniendo valores
apreciables.
Tabla 6-79. Resultado de la sexta tanda de pruebas de análisis discriminante, base de
datos masculina
PRUEBA SELECCIO- VALIDACIÓN NO MEDIDA
NADOS CRUZADA SELECCIO- GENERAL
NADOS
Sin peores parámetros
98,05% 69,35% 73,70% 80,37%
DIFERENCIA DISTRIBUCIONES 50-50
Sin peores parámetros
95,22% 83,11% 81,00% 86,44%
DIFERENCIA DISTRIBUCIONES 90-10
Sin peores factores
89,00% 85,00% 78,00% 84,00%
DIFERENCIA DISTRIBUCIONES 50-50
Sin peores factores
90,21% 87,69% 86,00% 87,97%
DIFERENCIA DISTRIBUCIONES 90-10
Sin peores parámetros
100,00% 67,00% 74,00% 80,33%
TAMAÑO DEL EFECTO 50-50
Sin peores parámetros
96,12% 83,43% 87,00% 88,85%
TAMAÑO DEL EFECTO 90-10
Sin peores factores
91,00% 86,00% 81,00% 86,00%
TAMAÑO DEL EFECTO 50-50
Sin peores factores
88,79% 87,52% 84,00% 86,77%
TAMAÑO DEL EFECTO 90-10
Sin peores parámetros
97,00% 73,00% 80,00% 83,33%
CORRELACION CRITERIO SALUD 50-50
Sin peores parámetros
93,20% 81,98% 84,00% 86,39%
CORRELACION CRITERIO SALUD 90-10
Sin peores factores
91,00% 86,00% 85,00% 87,33%
CORRELACION CRITERIO SALUD 50-50
Sin peores factores
89,67% 86,91% 85,00% 87,19%
CORRELACION CRITERIO SALUD 90-10
La tabla 6-79 recoge los resultados de las pruebas en las que se han suprimido los
peores parámetros, siempre según cada uno de los estudios realizado en esta tesis que
permiten catalogarlos como tales. Aparecen también en la tabla los resultados que
ofrecen los factores obtenidos de los mismos parámetros. Además, como en la tabla
anterior, todas las pruebas se han realizado utilizando dos proporciones diferentes de
casos de entrenamiento y clasificación: 90-10 y 50-50, respectivamente.
Los factores obtienen mejores resultados que los parámetros en todos los casos
excepto en el estudio relacionado con el tamaño del efecto con proporción
entrenamiento/clasificación de 90-10.
En cuanto a las dos proporciones utilizadas, la 90-10 obtiene mejores resultados en
todos los casos excepto en el estudio relacionado con la correlación con la variable
dicotómica "sano-patológico" que utiliza factores.
En cuanto a los estudios estadísticos, todos ellos alcanzan cotas muy elevadas,
cercanas a las de los mejores resultados obtenidos en la base de datos. Destacamos
especialmente el estudio relacionado con el tamaño del efecto empleando parámetros
162
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
La tabla 6-80 recoge los resultados de las pruebas en las que se han utilizado, de
forma incremental, los diferentes factores obtenidos utilizando todos los parámetros
con la rotación varimax (en la primera prueba se ha empleado únicamente el primer
factor, en la segunda prueba se han empleado los dos primeros factores, y así
sucesivamente). En la tabla aparecen también los resultados de las pruebas realizadas
utilizando los parámetros correspondientes a cada uno de los factores empleados en
las pruebas anteriores.
163
Capítulo 6: Experimentación y resultados
164
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Tabla 6-81. Resultado detallado del estudio correspondiente al uso de los factores
extraídos de todos los parámetros excepto el número 024 (Frecuencia Origen Señal),
base de datos femenina.
Seleccio- Normo- Patoló- Validación Normo- Patoló- No Normo- Patoló-
nados fónicos gicos Cruzada fónicos gicos seleccio- fónicos gicos
nados
Serie 1 95,6 97,8 93,3 95,6 97,8 93,3 100 100 100
Serie 2 96,7 97,8 95,6 96,7 97,8 95,6 90 100 80
Serie 3 95,6 97,8 93,3 95,6 97,8 93,3 100 100 100
Serie 4 95,6 97,8 93,3 95,6 97,8 93,3 100 100 100
Serie 5 95,6 97,8 93,3 94,4 97,8 91,1 100 100 100
Serie 6 95,6 97,8 93,3 95,6 97,8 93,3 100 100 100
Serie 7 97,8 100 95,6 96,7 97,8 95,6 90 100 80
Serie 8 97,8 100 95,6 97,8 100 95,6 80 80 80
Serie 9 95,6 97,8 93,3 94,4 97,8 91,1 100 100 100
Serie 10 95,6 97,8 93,3 93,3 97,8 98,9 100 100 100
Total 96,15 98,24 93,99 95,57 98,02 94,11 96 98 94
En la tabla 6-81 podemos observar el resultado del estudio que mejores resultados
ha obtenido en la base de datos femenina, correspondiente al uso de los factores
extraídos de todos los parámetros utilizados en este trabajo excepto del referido a la
frecuencia del origen de la fuente glótica, parámetro biométrico numerado con el 024.
La medida general alcanza un 95,91% de éxito, la clasificación de valores seleccionados
obtiene el 96,15%, la tasa de validación cruzada llega al 95,57% y la clasificación de
valores no seleccionados alcanza el 96%.
Comprobamos en la tabla que las diez series obtienen valores similares, y, sobre
todo, que la clasificación correcta de casos normofónicos es elevadísima, alcanzando o
superando el 98% en todos los casos. La tasa de acierto de casos patológicos, aún
siendo alta, cae cuatro puntos con respecto a la anterior. Como podemos comprobar
en el anexo incluido en el disco adjunto, esta tendencia se repite en todos los estudios
realizados.
En cuanto a las pruebas relacionadas con la idoneidad de la prueba, podemos
comentar que este estudio supera las pruebas de colinealidad, debido al uso de
factores ortogonales entre sí. En cuanto a la prueba M de Box, es posible rechazar la
hipótesis de igualdad de matrices de varianzas-covarianzas entre los grupos, y por
165
Capítulo 6: Experimentación y resultados
tanto concluir que uno de los grupos es más variable que el otro. Por otro lado, el
estadístico lambda de Wilks19 permite confirmar en todos los casos de forma
significativa que la diferencia entre los grupos es suficientemente grande, ofreciendo
siempre valores inferiores a 0,3. Este resultado lo confirman los autovalores 20, siempre
por encima de 2,5 y también el índice de correlación canónica 21, siempre por encima
de 0,8.
Por otra parte, los parámetros que más importancia tienen a la hora de predecir el
grupo de pertenencia de los sujetos son los siguientes:
Jitter.
Desbalance de la pérdida del cuerpo de los pliegues vocales.
Tercera banda de energía de la onda mucosa.
Cuarta banda de energía de la onda mucosa.
Amplitud 1er mínimo de la densidad espectral de potencia de la fuente glótica.
Amplitud 2º máximo de la densidad espectral de potencia fuente glótica.
Desbalance de la masa del cuerpo de los pliegues vocales.
Desbalance de la pérdida de energía del cuerpo de los pliegues vocales.
Por último, mencionaremos que los modelos ofrecen unas muy altas probabilidades
de pertenencia al grupo al que clasificaron en prácticamente todos los casos.
En la tabla 6-82 podemos observar el resultado del estudio que mejores resultados
ha obtenido en la base de datos masculina, correspondiente al uso de todos los
parámetros empleados en esta tesis excepto los pertenecientes a la familia de los
parámetros temporales. La medida general alcanza el 90,04% de éxito, la clasificación
de valores seleccionados obtiene el 95,32%, la tasa de validación cruzada llega al
85,79% y la clasificación de valores no seleccionados alcanza el 89%.
19
El estadístico toma valores entre 0 y 1. Valores próximos a 0 indican gran diferencia entre los grupos.
20
Los autovalores tienen valor mínimo 0 y no tienen valor máximo. Valores próximos a 0 indican poca
diferencia entre los grupos.
21
Índice de correlación (valor entre 0 y 1). Correlaciones altas son indicadores de buena discriminación.
166
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Tabla 6-82. Resultado detallado del estudio correspondiente al uso de todos los
parámetros excepto los temporales, base de datos masculina.
Seleccio- Normo- Patoló- Validación Normo- Patoló- No Normo- Patoló-
nados fónicos gicos Cruzada fónicos gicos seleccio- fónicos gicos
nados
167
Capítulo 6: Experimentación y resultados
En esta ocasión los parámetros más importantes de cara a la predicción del grupo
de pertenencia de los locutores son los siguientes:
Los tres primeros parámetros, –el primero de ellos de perturbación y los dos
siguientes biométricos– destacan sobre el resto en cuanto a su influencia de
predicción. En el listado aparecen, además, una banda de energía de la onda mucosa,
hasta cinco parámetros biométricos adicionales y tres parámetros biomecánicos, entre
los que están incluidos dos desbalances de elementos mecánicos de los pliegues
vocales.
Es destacable, además, que como en el caso del mejor estudio de la base de datos
femenina, los modelos ofrecen unas muy altas probabilidades de pertenencia al grupo
al que clasificaron en prácticamente todos los casos.
Por último y para concluir el estudio, aportaremos datos relacionados con algunos
estudios realizados sobre la base de datos global, es decir, con la utilización de los
sujetos de ambos géneros de forma indistinta. De este modo podremos comprobar
que las tasas de clasificación también alcanzan valores elevados, de cara a la
posibilidad de utilizar bases de datos en las que el género no esté etiquetado.
168
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
169
7. Contribuciones, conclusiones y líneas
futuras
Capítulo 7: Contribuciones, conclusiones y lineas futuras
Se han realizado pruebas específicas relacionadas con el tamaño del efecto sobre
la diferencia entre las distribuciones de casos patológicos y de casos
normofónicos. Los resultados obtenidos permiten obtener un listado ordenado
de parámetros glóticos relevantes.
172
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
173
Capítulo 7: Contribuciones, conclusiones y líneas futuras
23
Recordemos que la motivación para eliminar este parámetro nace en los estudios de correlación
parcial.
24
Las tasas obtenidas por los parámetros o factores temporales son sensiblemente inferiores a las del
resto de familias, si bien es cierto que los parámetros temporales son mucho menos numerosos.
174
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
25
De esta conclusión queda excluido el estudio en el que se suprimen los parámetros temporales en la
base de datos masculina, estudio en el que sí se alcanzan los mejores resultados.
26
Recordemos que en la primera prueba se empleó solo el primer factor; en la segunda, los dos
primeros factores, y así sucesivamente.
175
Capítulo 7: Contribuciones, conclusiones y líneas futuras
En segundo lugar, pero también relacionado con el análisis discriminante, hay que
comentar que, como expusimos en el capítulo cinco y recordamos aquí de forma muy
breve, la técnica se basa en establecer dos grupos diferenciados y en clasificar nuevos
casos en un grupo o en otro en función de la distancia existente a los centroides de los
grupos. Este enfoque puede ser ampliado aumentando el número de categorías, para
tratar de precisar mejor la patología o el tipo de patología sufrida por el paciente.
Además, existen trabajos relacionados que utilizan un enfoque diferente, basado en
definir de forma lo más precisa posible el concepto de salud vocal, y en catalogar los
nuevos casos como más o menos patológicos en función de lo alejados que se
encuentren de lo considerado como sano. Este tipo de estudios permiten, además,
estimar la gradación de la patología. Encontramos más detalles en (Gómez, P. et al,
2009a) y en (Gómez, P. et al, 2011), y proponemos su continuidad utilizando las
diferentes combinaciones de parámetros que en esta tesis se han revelado como más
discriminantes para realizar los cálculos relacionados con la referencia de salud.
En tercer lugar, cabe utilizar las conclusiones obtenidas en cuanto a la calidad de los
parámetros glóticos para desarrollar una aplicación informática de ayuda al
diagnóstico similar a las expuestas en el capítulo cuatro, aplicación que podría ser
fusionada con la herramienta de captura desarrollada y mencionada en el primer
apéndice. También se plantea la posibilidad de incorporar estas conclusiones a la
herramienta BioMet®Pho, desarrollada por nuestro grupo de investigación.
176
Referencias documentales
Referencias documentales
Abad, A. (2013). The L2F broadcast news transcription system. En Application of Speech
Technologies. Benítez Ortúzar & Pérez Córdoba (eds). Universidad de Granada.
Akande, O. O., & Murphy, P. J. (2005). Estimation of the vocal tract transfer function
with application to glottal wave analysis. Speech Communication,46(1), 15-36.
Alipour, F., Berry, D. A., & Titze, I. R. (2000). A finite-element model of vocal-fold
vibration. The Journal of the Acoustical Society of America, 108(6), 3003-3012.
Alonso, J. B., De Leon, J., Alonso, I., & Ferrer, M. A. (2001). Automatic detection of
pathologies in the voice by HOS based parameters. EURASIP Journal on Applied Signal
Processing (Vol. 4, pp. 275-284).
Badin, P., Hertegård, S., & Karlsson, I. (1990). Notes on the Rothenberg mask. STL-
QPSR, 31, 1-7.
Baken, R. J., & Orlikoff, R. F. (2000). Clinical measurement of speech and voice. Cengage
Learning.
Banci, G., Monini, S., Falaschi, A., & De Sario, N. (1986). Vocal fold disorder evaluation
by digital speech analysis. Journal of Phonetics, 14(3-4), 495-499.
Benba, A., Jilbab, A., & Hammouch, A. (2014). Voice analysis for detecting persons with
Parkinson’s disease using MFCC and VQ. In The 2014 International Conference on
Circuits, Systems and Signal Processing.
178
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Beceiro, D. I. E., Macías, F. S., Ortiz, D. S. D. C., & Reyes, D. E. J. M. (2009). Adaptación
del diagrama de bloques de un algoritmo para la extracción de la frecuencia
fundamental en el llanto infantil. Ciencia en su PC, (2).
Bovbel, E. I., & Toumilovich, M. A. (1999). Stochastic approach to vocal fold pathology
diagnostics. In MAVEBA (pp. 112-117).
Boyanov, B., & Chollet, G. (1992). Pathological voice analysis using cepstra, bispectra
and group delay functions. In Second International Conference on Spoken Language
Processing (pp. 1039-1042).
Boyanov, B., & Hadjitodorov, S. (1997). Acoustic analysis of pathological voices. A voice
analysis system for the screening of laryngeal diseases.Engineering in Medicine and
Biology Magazine, IEEE, 16(4), 74-82.
Cabrera, J., Alonso, J. B., De León, J., Ferrer, M. A., Henríquez, P., & Travieso, C. M.
(2014). Web server for evaluation of voice quality: e-VOICE. In Proceedings of VII
Jornadas en Tecnologías del Habla and IV Iberian LTech Workshop (IBERSPEECH 2014),
367-376.
Childers, D. G., & Bae, K. S. (1992). Detection of laryngeal function using speech and
electroglottographic data. IEEE Transactions on Biomedical Engineering, 39(1), 19-25.
179
Referencias documentales
Chu, E. A., & Kim, Y. J. (2008). Laryngeal cancer: diagnosis and preoperative work-
up. Otolaryngologic clinics of North America, 41(4), 673-695.
Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences. Lawrence
Erlbaum Associates.
Cordeiro, H. T., Fonseca, J. M., & Ribeiro, C. M. (2013). LPC Spectrum First Peak
Analysis for Voice Pathology Detection. Procedia Technology, 9, 1104-1111.
De Bodt, M., Wuyts, F., Heylen, L. & Mertens, F. (1998). Voice database of the Belgian
study group on voice disorders. Proceedings of Voicedata '98 (pp. 104-109).
de Oliveira Rosa, M., Pereira, J. C., & Grellet, M. (2000). Adaptive estimation of residue
signal for voice pathology diagnosis. IEEE Transactions on Biomedical
Engineering, 47(1), 96-104.
Deller, J. R., Proakis, J. G., & Hansen, J. H. Discrete-time processing of speech signals,
1993. Maxwell Mcmillian, New York.
Dworkin, J. P., & Meleca, R. J. (1997). Vocal pathologies: Diagnosis, treatment, and
case studies. Singular Publishing Group. San Diego, CA.
Fant, G. (1960). Acoustic theory of speech production. Mouton & Co., N.V. Publishers.
180
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Feijoo, S., ernández, C. (1990). Short-term stability measures for the evaluation of
vocal quality. Journal of Speech, Language, and Hearing Research, 33(2), 324-334.
Fernández-Baillo, R., Gómez-Vilda, P., Ramírez-Calvo, C., & Scola, B. (2007, December).
Pre-post surgery evaluation based on the profile of glottal source. En MAVEBA (pp.65-
68).
Fernández-Baillo, R., Gómez, P. & Godino, J.I. (2009). The effects of age on voice based
on the analysis of the glottal source profile. En Proc. de AVFA09, 3rd Advanced Voice
Function Assessment International Workshop (pp. 141-145).
Fernández-Planas, A. M., Vilaseca, I., Huerta, P., & Jiménez, C. (2006). Contribución del
análisis fonético acústico en el ámbito clínico: evaluación de la voz en pacientes
tratados de carcinoma laríngeo con láser carbónico. Actas del Primer Congreso
Nacional de Lingüística Clínica. Vol 2: Lingüística y evaluación del lenguaje (pp. 80-96).
Fontes, A. I., Souza, P. T., Neto, A. D., Martins, A. D. M., & Silveira, L. F. (2014).
Classification System of Pathological Voices Using Correntropy.Mathematical Problems
in Engineering, 2014.
Fourcin, A. (1998). Databases and criteria for normal and pathological speech: a
contribution to discussion. In proceedings of Voicedata ’98 (pp. 40-42).
181
Referencias documentales
Fraile Muñoz, R., Godino Llorente, J. I., Sáenz Lechón, N., & Osma Ruiz, V. (2008). Use
of Cepstrum-based parameters for automatic pathology detection on speech. Analysis
of performance and theoretical justification. In International Conference on Bio-
inspired Systems and Signal Processing.
Gil, J., Rodríguez, G. & García, E. (1995). Estadística básica aplicada a las Ciencias de la
Educación. Kronos.
182
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Godino-Llorente, J. I., Sáenz-Lechón, N., Osma-Ruiz, V., Aguilera-Navarro, S., & Gómez-
Vilda, P. (2006). An integrated tool for the diagnosis of voice disorders. Medical
engineering & physics, 28(3), 276-289.
Gómez, P., Díaz, F., Martínez, R., Godino, J. I., Alvarez, A., Rodríguez, F., & Rodellar, V.
(2004). Precise reconstruction of the mucosal wave for voice pathology detection and
classification. In proceedings of EUSIPCO'04 (pp. 297-300).
Gómez, P., Godino, J. I., Díaz, F., Martínez, R., Nieto, V., & Rodellar, V. (2004). A new
mucosal wave correlate detection method as a clue to voice pathology. In International
Conference on Voice Physiology and Biomechanics ICVPB’04 (pp. 59-62).
Gómez P., Godino J. I., Díaz F., Álvarez A., Martínez R. & Rodellar V. (2004).
Biomechanical Parameter Fingerprint in the Mucosal Wave Power Spectral Density.
In Eighth International Conference on Spoken Language Processing (pp. 842-845).
Gómez, P., Godino, J. I., Rodríguez, F., Díaz, F., Nieto, V., Álvarez, A., & Rodellar, V.
(2004, May). Evidence of vocal cord pathology from the mucosal wave cepstral
contents. In Proceedings of IEEE International Conference on Acoustics, Speech, and
Signal Processing (Vol 5, pp. 437).
Gómez, P., Díaz, F., Álvarez, A., Martínez, R., Rodellar, V., Fernández, R., ... &
Fernández, F. J. (2005). PCA of perturbation parameters in voice pathology detection.
En Proc. de EUROSPEECH (Vol. 5, pp. 645-648).
Gómez, P., Godino, J. I., Álvarez, A., Martínez, R., Nieto, V., & Rodellar, V. (2005,
March). Evidence of glottal source spectral features found in vocal fold dynamics.
In Proceedings of IEEE International Conference on Acoustics, Speech, and Signal
Processing (Vol. 5, p. 441).
Gómez, P., Martínez, R., Díaz, F., Lázaro, C., Álvarez, A., Rodellar, V., & Nieto, V. (2005).
Voice pathology detection by vocal cord biomechanical parameter estimation. En
Nonlinear Analyses and Algorithms for Speech Processing, 242-256). Springer Berlin
Heidelberg.
183
Referencias documentales
Gómez, P., Fernández-Baillo, R., Nieto, A., Díaz, F., Fernández, F. J., Rodellar, V., ... &
Martínez, R. (2007). Evaluation of voice pathology based on the estimation of vocal
fold biomechanical parameters. Journal of Voice, 21(4), 450-476.
Gómez, P., Fernández-Baíllo, R., Rodellar, V., & Godino-Llorente, J. I. (2009). Voice
pathology grading by Gaussian mixture models: study cases. In MAVEBA (pp. 45-48).
Gómez, P., Fernández-Baillo, R., Rodellar, V., Nieto, V., Álvarez, A., Mazaira, L. M., ... &
Godino, J. I. (2009). Glottal source biometrical signature for voice pathology detection.
Speech Communication, 51(9), 759-781.
Gómez, P., Fernández-Baillo, R., Rodellar, V., Álvarez, A., Mazaira, L.M., Martínez, R.,
Muñoz, C., Nieto, V., & Godino, J.I. (2011). Evaluation of Voice Pathology Grade from
Glottal Source Parameterization. Informe técnico, Facultad de Informática, U.P.M.
Gómez, P., Rodellar, V., Nieto, V., Martínez, R., Alvarez, A., Scola, B., ... & Fernández,
M. (2013, February). BioMet® Phon: A System to Monitor Phonation Quality in the
Clinics. In eTELEMED 2013, The Fifth International Conference on eHealth,
Telemedicine, and Social Medicine (pp. 253-258).
Grissom, R. J., & Kim, J. J. (2005). Effect sizes for research: A broad practical approach.
Lawrence Erlbaum Associates Publishers.
Hadjitodorov, S., Boyanov, B., & Teston, B. (2000). Laryngeal pathology detection by
means of class-specific neural maps. IEEE Transactions on Information Technology in
Biomedicine, 4(1), 68-73.
Hair, J., Anderson, R., Tatham, R. & Black, W. (1999). Análisis Multivariante. Prentice
Hall.
Hammarberg, B., Fritzell, B., Gaufin, J., Sundberg, J., & Wedin, L. (1980). Perceptual and
acoustic correlates of abnormal voice qualities. Acta oto-laryngologica, 90(1-6), 441-
451.
Hammarberg, B., Fritzell, B., & Schiratzki, H. (1984). Teflon Injection in 16 Patients with
Paralytic DysphoniaPerceptual and Acoustic Evaluations. Journal of Speech and Hearing
Disorders, 49(1), 72-82.
184
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Hariharan, M., Paulraj, M. P., & Sazali, Y. (2010). Time-domain features and
probabilistic neural network for the detection of vocal fold pathology. Malaysian
Journal of Computer Science, 23(1), 60-67.
erbst, C. T., erzel, ., Švec, J. G., Wyman, M. T., Fitch, W. T. (2013). Visualization
of system dynamics using phasegrams. Journal of The Royal Society Interface, 10(85),
20130288.
Hertegård, S., & Gauffin, J. (1992). Acoustic properties of the Rothenberg mask. STL-
QPSR, 33(2-3), 009-018.
Herzel, H., Berry, D., Titze, I. R., & Saleh, M. (1994). Analysis of vocal disorders with
methods from nonlinear dynamics. Journal of Speech, Language, and Hearing
Research, 37(5), 1008-1019.
Hirano, M. (1974). Morphological structure of the vocal cord as a vibrator and its
variations. Folia Phoniatrica et Logopaedica, 26(2), 89-94.
Hirano, M., Hibi, S., Yoshida, T., Hirade, Y., Kasuya, H., & Kikuchi, Y. (1988). Acoustic
analysis of pathological voice: some results of clinical application. Acta
otolaryngologica, 105(5-6), 432-438.
Holmberg, E. B., Hillman, R. E., & Perkell, J. S. (1988). Glottal airflow and transglottal air
pressure measurements for male and female speakers in soft, normal, and loud
voice. The Journal of the Acoustical Society of America,84(2), 511-529.
Huang, D. Z., & Watson, C. (1998). Use and Understanding Voice Lab for Singers. En
página web http://www.drspeech.com/Paper.html. Última consulta: 14-Nov-2014.
Ishizaka, K., & Flanagan, J. L. (1972). Synthesis of Voiced Sounds From a Two‐Mass
Model of the Vocal Cords. Bell system technical journal, 51(6), 1233-1268.
Jacobson, B. H., Johnson, A., Grywalski, C., Silbergleit, A., Jacobson, G., Benninger, M.
S., & Newman, C. W. (1997). The voice handicap index (VHI) development and
validation. American Journal of Speech-Language Pathology,6(3), 66-70.
Jarque, C. M., & Bera, A. K. (1980). Efficient tests for normality, homoscedasticity and
serial independence of regression residuals. Economics Letters, 6(3), 255-259.
185
Referencias documentales
Kandogan, T., & Sanal, A. (2005). Voice Handicap Index (VHI) in partial laryngectomy
patients. In KBB Forum (Vol. 4, No. 1, pp. 15-17).
Kasuya, H., Ogawa, S., Mashima, K., & Ebihara, S. (1986). Normalized noise energy as
an acoustic measure to evaluate pathologic voice. The Journal of the Acoustical Society
of America, 80(5), 1329-1334.
Kasuya, H., Masubuchi, K., Ebihara, S., & Yoshida, H. (1986). Preliminary experiments
on voice screening. Journal of Phonetics, 14(3-4), 463-468.
Kitzing, P. (1986). LTAS criteria pertinent to the measurement of voice quality. Journal
of phonetics, 14, 477-482.
Koutsogiannaki, M., Simantiraki, O., Degottex, G., & Stylianou, Y. (2014, September).
The importance of phase on voice quality assessment. In Proc. Interspeech.
Kuo, J., Holmberg, E. B., & Hillman, R. E. (1999, March). Discriminating speakers with
vocal nodules using aerodynamic and acoustic features. In Proceedings of IEEE
International Conference on Acoustics, Speech, and Signal Processing (Vol. 1, pp. 77-
80).
Laver, J., Wirz, S., Mackenzie, J., & Hiller, S. (1981). A perceptual protocol for the
analysis of vocal profiles. Edinburgh University Department of Linguistics Work in
Progress, 14, 139-155.
Lázaro Carrascosa, C. (2000). Desarrollo de una aplicación para el vínculo de una base
de datos de pacientes de otorrinolaringología con un editor de señales. Facultad de
Informática, Universidad Politécnica de Madrid.
186
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Le Huche, F., & Allali, A. (2004). La voz: Anatomía y fisiología de los órganos de la voz y
del habla (IX, 196 p.). Masson.
Lilliefors, H. W. (1967). On the Kolmogorov-Smirnov test for normality with mean and
variance unknown. Journal of the American Statistical Association,62(318), 399-402.
López, J., Pérez, A., Zamora, J., Murciano, A., Alonso J., Reviriego, M. & Lahoz, R.
(2014). Coeficiente de correlación múltiple. En Aula virtual de bioestadística.
Universidad Complutense de Madrid. Disponible en http://e-
stadistica.bio.ucm.es/glosario/coef_corre.html. Última consulta: 14-Nov-2014
Ma, E. P. M., Yiu, E. M. L., & Abbott, K. V. (2007, November). Application of the ICF in
voice disorders. In Seminars in speech and language (Vol. 28, No. 04, pp. 343-350). ©
Thieme Medical Publishers.
Mann, H. B., & Whitney, D. R. (1947). On a test of whether one of two random
variables is stochastically larger than the other. The annals of mathematical statistics,
18, 50-60.
187
Referencias documentales
Marinaki, M., Kotropoulos, C., Pitas, I., & Maglaveras, N. (2004). Automatic Detection
Of Vocal Fold Paralysis and Edema. In Eighth International Conference on Spoken
Language Processing.
McGill, R., Tukey, J. W., & Larsen, W. A. (1978). Variations of box plots. The American
Statistician, 32(1), 12-16.
McGuirt, W. F., Blalock, D., Koufman, J. A., & Feehs, R. S. (1992). Voice analysis of
patients with endoscopically treated early laryngeal carcinoma. The Annals of otology,
rhinology, and laryngology, 101(2 Pt 1), 142-146.
188
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Morales Vallejo, P. (2011c). El tamaño del efecto (effect size): análisis complementarios
al contraste de medias. En Estadística aplicada a las Ciencias Sociales. Universidad
Pontificia Comillas, Madrid.
Muhammad, G., Alsulaiman, M., Mahmood, A., Almojali, M., & Abdelkader, B. M.
(2014). Voice Pathology Detection using Multiresolution Technique. Pathology, 70,
103.
Nieto, A., Vegas, A., Gamboa, J., Montojo, J., Cobeta, I. & Kitzing, P. (1995). Jitter and
shimmer in vocal fold nodules, polyps and edemas before and after phonosurgery.
Proceedings of XIIIth International Congress of Phonetic Sciences (Vol. 4, pp. 606-609).
Norusis, M. J. (1993). SPSS for Windows: Base System User's Guide Release 6.0. SPSS
Inc. Links, Chicago, IL.
Nunnally, J. C., Bernstein, I. H., & Berge, J. M. T. (1967). Psychometric theory(Vol. 226).
New York: McGraw-Hill.
Núñez Batalla, F., Corte Santos, P., Sequeiros Santiago, G., Señaris González, B., &
Suárez Nieto, C. (2004). Evaluación perceptual de la disfonía: correlación con los
parámetros acústicos y fiabilidad. Acta Otorrinolaringológica Española, 55(6), 282-287.
Oracle Corporation. (2014). Guía oficial de la tecnología Java Web Start. Disponible en
http://docs.oracle.com/javase/8/docs/technotes/guides/javaws/developersguide/cont
ents.html. Última consulta: 14-Nov-2013.
Orr, R., Cranen, B., & Jong, F. I. D. (2003). An investigation of the parameters derived
from the inverse filtering of flow and microphone signals. In ISCA Tutorial and Research
Workshop on Voice Quality: Functions, Analysis and Synthesis (pp. 35-40).
Ortega, A., & Miguel, A. (2013). Adaptation and normalization techniques (especially)
for automatic speech recognition. En Application of Speech Technologies. Benítez
Ortúzar & Pérez Córdoba (eds). Universidad de Granada.
189
Referencias documentales
Pardo, A., & Ruiz, M. Á. (2002). SPSS 11: Guía para el análisis de datos. Madrid:
McGraw-Hill.
Parsa, V., & Jamieson, D. G. (2000). Identification of pathological voices using glottal
noise measures. Journal of speech, language, and hearing research,43(2), 469-485.
Perelló, J. & Miquel, J. A. S. (1973). Alteraciones de la voz: por Jorge Perelló con la
colaboración de José Antonio Salvà Miquel. Editorial Científico-Médica.
Pinho, S. R., & Pontes, P. (2002). Escala de evaluación perceptiva de la fuente glótica:
RASAT. Disponible en http://www.invoz.com.br/paginas/rasat.pdf. Última consulta: 4-
Nov-2014.
Plante, F., Borel, J., Berger-Vachon, C., & Kauffmann, I. (1993). Acoustic detection of
laryngeal diseases in children. In Eurospeech.
Prater, R. J., & Swift, R. W. (1986). Manual de terapéutica de la voz. Salvat Editores.
Price, P. J. (1989). Male and female voice source characteristics: Inverse filtering
results. Speech Communication, 8(3), 261-277.
Qi, Y., & Hillman, R. E. (1997). Temporal and spectral estimations of harmonics-to-
noise ratio in human voice signals. The Journal of the Acoustical Society of
America, 102(1), 537-543.
Ritchings, R. T., Conroy, G. V., McGillion, M. A., Moore, C. J., Slevin, N., Winstanley, S.,
& Woods, H. (1999). A neural network based approach to objective voice quality
assessment. In Research and Development in Expert Systems XV (pp. 198-209).
Springer London.
Ritchings, R. T., McGillion, M. A., & Moore, C. J. (2001). Pathological voice quality
assesment using artificial neural networks. In MAVEBA (pp. 230-234).
190
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Rosier, J. F., Grégoire, V., Counoy, H., Octave-Prignot, M., Rombaut, P., Scalliet, P., ... &
Hamoir, M. (1998). Comparison of external radiotherapy, laser microsurgery and
partial laryngectomy for the treatment of T1N0M0 glottic carcinomas: a retrospective
evaluation. Radiotherapy and oncology, 48(2), 175-183.
Rothenberg, M. (1973). A new inverse‐filtering technique for deriving the glottal air
flow waveform during voicing. The Journal of the Acoustical Society of America, 53(6),
1632-1645.
Ruiz, M. T., & Verbrugge, L. M. (1997). A two way view of gender bias in
medicine. Journal of epidemiology and community health, 51(2), 106.
Salvador, M., & Gargallo, P. (2006). Análisis factorial. [en línea]. En 5campus.com,
Estadística. Disponible en http://www.5campus.com/leccion/factorial. Última
consulta: 12-Nov-2014.
Shapiro, S. S., & Wilk, M. B. (1965). An analysis of variance test for normality (complete
samples). Biometrika, 52 (3-4), 591-611.
191
Referencias documentales
Story, B. H. (2002). An overview of the physiology, physics and modeling of the sound
source for vowels. Acoustical Science and Technology, 23(4), 195-206.
Story, B. H., & Titze, I. R. (1995). Voice simulation with a body‐cover model of the vocal
folds. The Journal of the Acoustical Society of America, 97(2), 1249-1260.
Suárez, C., Gil Carcedo, L.M., Marco, J., Medina, J.E., Ortega, P. & Trinidad, J. (2006).
Tratado de Otorrinolaringología y Cirugía de Cabeza y Cuello. Editorial Médica
Panamericana.
Švec, J. G., oráček, J., Šram, F., Veselý, J. (2000). Resonance properties of the vocal
folds: in vivo laryngoscopic investigation of the externally excited laryngeal
vibrations. The Journal of the Acoustical Society of America, 108(4), 1397-1407.
Tiger DRS Inc. (1999). Suite de productos relacionados con la calidad vocal Dr. Speech
V.4. Disponible en http://www.drspeech.com/. Última consulta: 9-Nov-2013.
Titze, I. R. (1994). Principles of Voice Production. Prentice Hall. Englewood Cliffs, NJ.
Titze, I. R., & Talkin, D. T. (1979). A theoretical study of the effects of various laryngeal
configurations on the acoustics of phonation. The Journal of the Acoustical Society of
America, 66(1), 60-74.
192
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Tucker, H. M. (Ed.). The Larynx, 2ª Ed. Thieme Medical Publishers. New York (1993)
Varho, S., & Alku, P. (1999, July). A new predictive method for all-pole modelling of
speech spectra with a compressed set of parameters. In Proceedings of the 1999 IEEE
International Symposium on Circuits and Systems (Vol. 3, pp. 126-129).
Varri, A., Kemp, B., Penzel, T., & Schlogl, A. (2001). Standards for biomedical signal
databases. Engineering in Medicine and Biology Magazine, IEEE, 20(3), 33-37.
Wald, A., & Wolfowitz, J. (1940). On a test whether two samples are from the same
population. The Annals of Mathematical Statistics, 11(2), 147-162.
Wallen, E. J., & Hansen, J. H. (1996, October). A screening test for speech pathology
assessment using objective quality measures. In Proceedings of IEEE Fourth
International Conference on Spoken Language (Vol. 2, pp. 776-779).
Webb, A. L., Carding, P. N., Deary, I. J., MacKenzie, K., Steen, I. N., & Wilson, J. A.
(2007). Optimising outcome assessment of voice interventions, I: reliability and validity
of three self-reported scales. The Journal of Laryngology & Otology, 121(08), 763-767.
193
Referencias documentales
Wilson, D. K. (1987). Voice problems of children (3rd ed., pp. 116-124). Baltimore:
Williams & Wilkins.
Wolfe, V., Cornell, R., & Palmer, C. (1991). Acoustic correlates of pathologic voice
types. Journal of Speech, Language, and Hearing Research, 34(3), 509-516.
World Health Organization. (2010). International classification of voice disorders.
Disponible en http://apps.who.int/classifications/apps/icd/icd10online/. Última
consulta: 9-Nov-2014.
194
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Xu, M., Duan, L. Y., Cai, J., Chia, L. T., Xu, C., & Tian, Q. (2005). HMM-based audio
keyword generation. In Advances in Multimedia Information Processing-PCM 2004 (pp.
566-574). Springer Berlin Heidelberg.
Yamauchi, E. J., Imaizumi, S., Maruyama, H., & Haji, T. (2009). Intercultural differences
in evaluation of pathological voice quality: perceptual and acoustical comparisons
between RASATI and GRBASI scales. In INTERSPEECH (pp. 2927-2930).
Yanagihara, N. (1967). Significance of harmonic changes and noise components in
hoarseness. Journal of Speech and Hearing Research, 10(3), 531-541.
Yumoto, E., Gould, W. J., & Baer, T. (1982). Harmonics‐to‐noise ratio as an index of the
degree of hoarseness. The journal of the Acoustical Society of America, 71(6), 1544-
1550.
Zaoming, D. & Huang, H. (1998). Voice Lab in Clinical Practice. En página web
http://www.drspeech.com/Paper.html. Última consulta: 14-Nov-2014.
195
Apéndice 1. Desarrollo de una herramienta para
la captura, almacenamiento y análisis visual de
la señal de voz
Apéndices
Más allá del uso de voces generadas de manera sintética, utilizadas en los
antecedentes de este trabajo y no incluidas en él, o de la utilización de bases de datos
estandarizadas como las presentadas en el capítulo cuatro, la captura de diferentes y
numerosas muestras de voz resulta de gran importancia para la realización de la
experimentación, como también apuntábamos en el capítulo cuatro. Con este objetivo
se desarrolló una aplicación informática ad hoc con el fin de obtener las muestras de
voz (Santos, R., 2005), en el marco de la presente tesis doctoral y de los proyectos de
investigación con los que ha estado relacionada.
Por otra parte, estas herramientas profesionales suelen capturar los ficheros para
después almacenarlos en algún tipo de memoria secundaria, pero el protocolo de
grabación establecido en (Gómez, P., 2006) relacionado con el proceso global de
captura y prediagnóstico establece que los ficheros deben poder ser enviados a un
servidor remoto de forma semiautomática para su posterior análisis.
198
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
199
Apéndices
Por otra parte, el sistema permite enviar las señales grabadas junto con sus
parámetros de grabación en formato textual a un servidor remoto. Es destacable
mencionar que esta operación sólo será realizada con aquellas grabaciones que hayan
sido marcadas como válidas de forma explícita.
200
Apéndice 2.1. Análisis descriptivo general de los
parámetros
Apéndices
202
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Error
Desviación
Media típico de la Mediana Moda Varianza Asimetría
típica
media
PAR.041 0,016 0,001 0,015 0,008 0,006 0,000 1,792
PAR.042 19,610 0,780 17,104 9,058 7,797 60,797 1,594
PAR.043 3,290E+04 4,760E+03 2,088E+04 9,212E+03 4,760E+04 2,266E+09 5,064E+00
PAR.044 0,078 0,007 0,052 0,016 0,068 0,005 2,064
PAR.045 0,084 0,007 0,060 0,014 0,067 0,005 1,657
PAR.046 0,126 0,015 0,065 0,016 0,146 0,021 3,184
PAR.047 0,500 0,011 0,490 0,202 0,112 0,013 0,217
PAR.048 0,799 0,008 0,809 0,609 0,079 0,006 -0,277
PAR.049 0,180 0,009 0,159 0,022 0,090 0,008 2,862
PAR.050 0,091 0,006 0,080 0,026 0,063 0,004 6,621
PAR.051 0,858 0,007 0,856 0,580 0,069 0,005 -0,614
203
Apéndices
204
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
205
Apéndices
206
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
207
Apéndices
208
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Error
Desviación
Media típico de Mediana Moda Varianza Asimetría
típica
la media
PAR.041 0,023 0,001 0,020 0,008 0,010 0,000 2,371
PAR.042 16,184 0,576 14,938 8,445 5,760 33,177 2,057
PAR.043 1,872E+04 5,512E+03 7,877E+03 4,417E+03 5,512E+04 3,038E+09 9,277E+00
PAR.044 0,101 0,010 0,077 0,013 0,096 0,009 3,127
PAR.045 0,088 0,006 0,071 0,011 0,062 0,004 1,757
PAR.046 0,142 0,017 0,090 0,011 0,169 0,029 3,750
PAR.047 0,501 0,010 0,490 0,124 0,099 0,010 0,406
PAR.048 0,787 0,008 0,790 0,579 0,077 0,006 -0,094
PAR.049 0,194 0,008 0,180 0,031 0,081 0,007 1,049
PAR.050 0,075 0,003 0,070 0,002 0,034 0,001 1,132
PAR.051 0,851 0,011 0,868 0,191 0,113 0,013 -2,989
209
Apéndices
Error Error
típico de Curtosis típico de Amplitud Mínimo Máximo Suma
asimetría curtosis
PAR.025 0,241 7,914 0,478 0,167 0,333 0,500 48,632
PAR.026 0,241 8,892 0,478 1,273 2,000 3,273 208,651
PAR.027 0,241 0,745 0,478 3,066 1,379 4,444 251,218
PAR.028 0,241 -0,029 0,478 3,033 2,000 5,033 322,304
PAR.029 0,241 -0,029 0,478 3,033 2,000 5,033 322,304
PAR.030 0,241 0,264 0,478 4,700 2,500 7,200 431,776
PAR.031 0,241 0,123 0,478 5,043 2,857 7,900 498,424
PAR.032 0,241 0,619 0,478 89,500 47,000 136,500 9206,498
PAR.033 0,241 -0,573 0,478 17,963 8,171 26,134 1540,838
PAR.034 0,241 1,435 0,478 54,814 6,848 61,662 2456,219
PAR.035 0,241 69,551 0,478 0,082 0,015 0,097 2,274
PAR.036 0,241 1,803 0,478 0,621 4,055 4,676 453,513
PAR.037 0,241 85,833 4,783E-01 9,341E+04 8,731E+03 1,021E+05 1,301E+06
PAR.038 0,241 26,16 0,478 0,708 0,000 0,708 3,649
PAR.039 0,241 2,799 0,478 0,097 0,003 0,100 2,130
PAR.040 0,241 14,602 0,478 0,791 0,004 0,795 6,774
PAR.041 0,241 9,349 0,478 0,071 0,008 0,079 2,272
PAR.042 0,241 4,926 0,478 30,480 8,445 38,925 1618,445
PAR.043 0,241 90,028 4,783E-01 5,462E+05 4,417E+03 5,506E+05 1,872E+06
PAR.044 0,241 13,247 0,478 0,652 0,013 0,666 10,135
PAR.045 0,241 4,333 0,478 0,330 0,011 0,341 8,774
PAR.046 0,241 17,066 0,478 1,160 0,011 1,171 14,213
PAR.047 0,241 4,272 0,478 0,718 0,124 0,842 50,069
PAR.048 0,241 0,381 0,478 0,398 0,579 0,977 78,659
PAR.049 0,241 1,544 0,478 0,423 0,031 0,454 19,431
PAR.050 0,241 1,972 0,478 0,188 0,002 0,190 7,478
PAR.051 0,241 13,515 0,478 0,806 0,191 0,997 85,092
210
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
211
Apéndices
212
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
213
Apéndice 2.2. Análisis descriptivo de los
parámetros: diagramas de caja
Apéndices
69
1 1
96 88
CTRL_PATOLOGIA
CTRL_PATOLOGIA
63
39
0 0
39
47
11
150,000 200,000 250,000 300,000 0,000 0,020 0,040 0,060 0,080 0,100 0,120 0,140
PAR.001 PAR.002
1 0,072 1 0,146
CTRL_PATOLOGIA
84
CTRL_PATOLOGIA
42 36
0 0,0451
0 0,148
42
2
0,000 0,010 0,020 0,030 0,040 0,050 0,060 0,070 0,080 0,000 0,050 0,100 0,150 0,200 0,250 0,300
PAR.003 PAR.004
1 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
88 67 57 80 85
42
0 0
49
2
0,000 0,020 0,040 0,060 0,080 0,100 0,120 0,600 0,700 0,800 0,900 1,000 1,100
PAR.005 PAR.006
216
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
52
85 80
1 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
67 78 57 82 68 96
70
35
0 37 0
49
40
0,700 0,800 0,900 1,000 0,000 0,050 0,100 0,150 0,200 0,250
PAR.007 PAR.008
69 70 91
94
1 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
57 56 85 98 70
89 79 73
52
0 0
25
2,000 2,200 2,400 2,600 2,800 3,000 0,000 0,500 1,000 1,500 2,000
PAR.009 PAR.010
1 17,527 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
0 10,915 0
30
-20,000 -15,000 -10,000 -5,000 0,000 5,000 -40,000 -30,000 -20,000 -10,000 0,000
PAR.011 PAR.012
217
Apéndices
1 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
0 0
30 30
-60,000 -50,000 -40,000 -30,000 -20,000 -10,000 0,000 -50,000 -40,000 -30,000 -20,000
PAR.013 PAR.014
66
1 1 18,175
CTRL_PATOLOGIA
CTRL_PATOLOGIA
98
96
31
0 0 10,096
49
50
-25,000 -20,000 -15,000 -10,000 -5,000 0,000 10,000 15,000 20,000 25,000 30,000
PAR.015 PAR.017
1 28,820 1 24,129
CTRL_PATOLOGIA
CTRL_PATOLOGIA
0 23,809 0 19,219
13
PAR.018 PAR.019
218
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
1 33,599 1 25,972
CTRL_PATOLOGIA
CTRL_PATOLOGIA
0 22,311 0 20,877
40 40
79 69
1 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
94 98 73 94 85 56 57
70 89
30
0 0
49
15
-90,000 -80,000 -70,000 -60,000 -50,000 -40,000 -30,000 0,300 0,350 0,400 0,450 0,500
PAR.023 PAR.024
73
69
70
1 1
CTRL_PATOLOGIA
98
CTRL_PATOLOGIA
57 56 85 64
94
89 79
0 0
2,000 2,200 2,400 2,600 2,800 3,000 1,500 2,000 2,500 3,000 3,500 4,000 4,500
PAR.026 PAR.027
219
Apéndices
1 2,002 1 2,984
CTRL_PATOLOGIA
CTRL_PATOLOGIA
64
0 3,096 0 3,275
49
2,000 3,000 4,000 5,000 2,000 3,000 4,000 5,000 6,000 7,000
PAR.028 PAR.030
1 2,898 1 44,938
CTRL_PATOLOGIA
CTRL_PATOLOGIA
90
0 4,128 0 29,500
48 1
47
3,000 4,000 5,000 6,000 7,000 8,000 20,000 30,000 40,000 50,000 60,000 70,000 80,000
PAR.031 PAR.032
1 13,924 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
72 55 77
0 10,731 0
16 36 23
5,000 10,000 15,000 20,000 25,000 30,000 0,000 10,000 20,000 30,000 40,000 50,000 60,000
PAR.033 PAR.034
220
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
70
85 85
1 73 1
CTRL_PATOLOGIA
70
CTRL_PATOLOGIA
96 73
1
0 0
47 37
0,000 1,000 2,000 3,000 4,000 5,000 6,000 3,800 4,000 4,200 4,400 4,600 4,800
PAR.035 PAR.036
85 85
63
73
1 1
CTRL_PATOLOGIA
96 70
CTRL_PATOLOGIA
96 70
69
88
82
94
47 50
11
39
0 0 37
39
35
14
31
PAR.038
PAR.037
70 96
63 69 63
1 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
88
96 88
85
39
39
11 37
0 0
47
28 11
47
0,000 0,030 0,060 0,090 0,120 0,150 0,000 0,200 0,400 0,600 0,800
PAR.039 PAR.040
221
Apéndices
1 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
86 59 75 86
50
0 0
16
0,005 0,010 0,015 0,020 0,025 0,030 0,035 0,040 0,045 10,000 20,000 30,000 40,000 50,000
PAR.041 PAR.042
98
73 69
1 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
85 94 85 88 94
95 67
50
39 42 2
0 0
31 36
0,000 100000,000 200000,000 300000,000 400000,000 0,000 0,100 0,200 0,300 0,400
PAR.043 PAR.044
69 85
1
1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
94
95
0 43
0
2
0,000 0,100 0,200 0,300 0,000 0,200 0,400 0,600 0,800 1,000 1,200
PAR.045 PAR.046
222
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
1 0,498 1 0,383
CTRL_PATOLOGIA
CTRL_PATOLOGIA
98
0 0,285 0 0,223
9
0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,600 0,700 0,800 0,900 1,000
PAR.047 PAR.048
95
1
CTRL_PATOLOGIA 1
51
CTRL_PATOLOGIA
59 97 51
0 0
13
29
1
CTRL_PATOLOGIA
98
50
PAR.051
223
Apéndices
52
1 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
83
64
41
18
0 0 16
33 23
12
80,000 100,000 120,000 140,000 160,000 180,000 200,000 0,000 0,020 0,040 0,060 0,080 0,100
PAR.001 PAR.002
1
1
CTRL_PATOLOGIA
57
CTRL_PATOLOGIA
56
0
0
91
1 1
CTRL_PATOLOGIA
55 58 77
CTRL_PATOLOGIA
93 59 51
57
37
0 0
30 50
224
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
1 1
CTRL_PATOLOGIA
98
CTRL_PATOLOGIA
65
0
0
30
12
52 74
1 1
CTRL_PATOLOGIA
84 95 68
CTRL_PATOLOGIA
99 75 93 67
55 82
57 87
34
0
0
40
75
1 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
56
74
47 47
0
0
49
49 50
225
Apéndices
1 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
75 56
0 0
41
-50,000 -40,000 -30,000 -20,000 -10,000 -60,000 -50,000 -40,000 -30,000 -20,000
PAR.013 PAR.014
68
1 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
58 64
87
48
0 0
49
50
PAR.015 PAR.017
1 1 25,407
CTRL_PATOLOGIA
CTRL_PATOLOGIA
0 0 16,804
38
PAR.018 PAR.019
226
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
1 26,533 1 25,543
CTRL_PATOLOGIA
CTRL_PATOLOGIA
47
0 22,970 0 16,189
37
48
PAR.021 PAR.022
68 74
55
1 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
56 95 52 84
99
82 87
0 0
-100,000 -80,000 -60,000 -40,000 -20,000 0,300 0,350 0,400 0,450 0,500
PAR.023 PAR.024
52 99 74
1 1 2,090
CTRL_PATOLOGIA
CTRL_PATOLOGIA
84 95 82 68 75
57 55
87
37
0 0 1,567
38
2,000 2,200 2,400 2,600 2,800 3,000 3,200 3,400 1,000 2,000 3,000 4,000
PAR.026 PAR.027
227
Apéndices
1 1 3,917
CTRL_PATOLOGIA
CTRL_PATOLOGIA
0 0 3,079
37 48
38
37
1 4,476 1 85,833
CTRL_PATOLOGIA
CTRL_PATOLOGIA
38
0 3,289 0 55,500
37 48 39
44
2,000 3,000 4,000 5,000 6,000 7,000 8,000 40,000 60,000 80,000 100,000 120,000 140,000
PAR.031 PAR.032
1 16,292 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
54
0 17,096 0
40
PAR.033 PAR.034
228
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
93 52
1 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
64
58
0 0
0,000 0,020 0,040 0,060 0,080 0,100 4,000 4,100 4,200 4,300 4,400 4,500 4,600 4,700
PAR.035 PAR.036
74 58
74
1 1
CTRL_PATOLOGIA
52 64
CTRL_PATOLOGIA
64
75
75
56
23 30
33 12
0 0
16
18 29
0,000 20000,000 40000,000 60000,000 80000,000 100000,000 120000,000 0,000 0,200 0,400 0,600 0,800
PAR.037 PAR.038
56
75
1 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
52 58 52 64
74
30 41
16
18 12
0 0 30
12
50 18
16
41
229
Apéndices
68
1 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
88 56 70
71
12
0 0
28
9
0,000 0,010 0,020 0,030 0,040 0,050 0,060 0,070 0,080 10,000 20,000 30,000 40,000
PAR.041 PAR.042
52
1 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
56 68 68 59
56
49
48
6
0 12 0
30
50 38
1
0,000 100000,000 200000,000 300000,000 400000,000 500000,000 600000,000 0,000 0,100 0,200 0,300 0,400 0,500 0,600 0,700
PAR.043 PAR.044
64 59
1 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
52 56 68
58
59
0 0
3 30 30
32
0,000 0,100 0,200 0,300 0,400 0,000 0,200 0,400 0,600 0,800 1,000 1,200
PAR.045 PAR.046
230
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
68 88
1 1 0,346
CTRL_PATOLOGIA
CTRL_PATOLOGIA
87 69 73
58
62
0 0 0,292
49
PAR.047 PAR.048
82 57
1 1
CTRL_PATOLOGIA
CTRL_PATOLOGIA
64
74 52
0 0
49
52
1
CTRL_PATOLOGIA
87 68
95
0
30
PAR.051
231
Apéndice 2.3. Análisis descriptivo de los
parámetros: normalidad
Apéndices
234
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Asymp.
Kolmogorov- Sig. (2-
Most Extreme Differences Smirnov Z tailed)
Absolute Positive Negative
PAR.044 0,21260 0,21260 -0,18048 2,12603 0,00024
PAR.045 0,18290 0,18290 -0,16170 1,82899 0,00249
PAR.046 0,24227 0,24227 -0,23965 2,42268 0,00002
PAR.047 0,06982 0,06982 -0,04376 0,69822 0,71420
PAR.048 0,08363 0,07158 -0,08363 0,83625 0,48644
PAR.049 0,14316 0,14316 -0,12425 1,43162 0,03318
PAR.050 0,22124 0,22124 -0,19288 2,21245 0,00011
PAR.051 0,09051 0,09051 -0,08552 0,90514 0,38567
235
Apéndices
Asymp.
Kolmogorov- Sig. (2-
Most Extreme Differences Smirnov Z tailed)
Absolute Positive Negative
PAR.031 0,06494 0,06494 -0,05154 0,45918 0,98430
PAR.032 0,09905 0,09905 -0,08316 0,70037 0,71062
PAR.033 0,12073 0,12073 -0,07929 0,85366 0,45977
PAR.034 0,08279 0,08279 -0,05009 0,58540 0,88301
PAR.035 0,10824 0,10824 -0,05307 0,76536 0,60137
PAR.036 0,09847 0,05447 -0,09847 0,69632 0,71735
PAR.037 0,10015 0,10015 -0,08863 0,70820 0,69754
PAR.038 0,31166 0,31166 -0,23892 2,20378 0,00012
PAR.039 0,16812 0,16812 -0,10740 1,18876 0,11844
PAR.040 0,20087 0,20087 -0,13261 1,42033 0,03538
PAR.041 0,11726 0,11726 -0,08655 0,82915 0,49752
PAR.042 0,10597 0,10597 -0,04687 0,74933 0,62830
PAR.043 0,12704 0,12704 -0,10111 0,89831 0,39507
PAR.044 0,14252 0,14252 -0,08566 1,00776 0,26177
PAR.045 0,09597 0,09597 -0,07453 0,67861 0,74649
PAR.046 0,10547 0,10547 -0,08233 0,74578 0,63427
PAR.047 0,11237 0,07711 -0,11237 0,79456 0,55303
PAR.048 0,11174 0,07273 -0,11174 0,79011 0,56032
PAR.049 0,09905 0,09905 -0,08931 0,70035 0,71065
PAR.050 0,10175 0,10175 -0,06723 0,71947 0,67862
PAR.051 0,07740 0,04991 -0,07740 0,54727 0,92554
236
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Asymp.
Kolmogorov- Sig. (2-
Most Extreme Differences Smirnov Z tailed)
Absolute Positive Negative
PAR.013 0,06259 0,06259 -0,04386 0,44259 0,98958
PAR.014 0,08133 0,08133 -0,07068 0,57506 0,89548
PAR.015 0,21438 0,14946 -0,21438 1,51588 0,02019
PAR.017 0,08236 0,07601 -0,08236 0,58238 0,88671
PAR.018 0,05457 0,04337 -0,05457 0,38589 0,99836
PAR.019 0,09474 0,09474 -0,06315 0,66994 0,76052
PAR.021 0,07339 0,06963 -0,07339 0,51893 0,95053
PAR.022 0,08940 0,05379 -0,08940 0,63218 0,81903
PAR.023 0,11375 0,11375 -0,07057 0,80430 0,53716
PAR.024 0,43542 0,36458 -0,43542 3,07886 0,00000
PAR.026 0,43637 0,43637 -0,36363 3,08558 0,00000
PAR.027 0,11877 0,11877 -0,08212 0,83980 0,48094
PAR.028 0,09346 0,09346 -0,05773 0,66086 0,77501
PAR.030 0,06991 0,06991 -0,04875 0,49431 0,96747
PAR.031 0,08329 0,08329 -0,05095 0,58892 0,87860
PAR.032 0,07588 0,05618 -0,07588 0,53653 0,93570
PAR.033 0,11064 0,11064 -0,06336 0,78237 0,57308
PAR.034 0,09800 0,09800 -0,06280 0,69295 0,72293
PAR.035 0,50015 0,50015 -0,44045 3,53662 0,00000
PAR.036 0,13829 0,09766 -0,13829 0,97788 0,29447
PAR.037 0,49832 0,49832 -0,44071 3,52367 0,00000
PAR.038 0,28582 0,28582 -0,26316 2,02103 0,00057
PAR.039 0,20635 0,20635 -0,13942 1,45911 0,02830
PAR.040 0,25751 0,25751 -0,22011 1,82086 0,00264
PAR.041 0,13489 0,13489 -0,08712 0,95381 0,32282
PAR.042 0,15234 0,15234 -0,09288 1,07722 0,19620
PAR.043 0,33228 0,33228 -0,27105 2,34957 0,00003
PAR.044 0,18735 0,18735 -0,12292 1,32477 0,05979
PAR.045 0,15946 0,15946 -0,08241 1,12757 0,15721
PAR.046 0,19798 0,19798 -0,17732 1,39994 0,03969
PAR.047 0,06174 0,05171 -0,06174 0,43656 0,99113
PAR.048 0,06030 0,06030 -0,04277 0,42635 0,99337
PAR.049 0,19484 0,19484 -0,15524 1,37775 0,04490
PAR.050 0,24273 0,24273 -0,20704 1,71633 0,00553
PAR.051 0,08217 0,08217 -0,07534 0,58101 0,88838
237
Apéndices
238
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Asymp.
Kolmogorov- Sig. (2-
Most Extreme Differences Smirnov Z tailed)
Absolute Positive Negative
PAR.044 0,22763 0,22763 -0,17992 2,27633 0,00006
PAR.045 0,13681 0,13681 -0,10545 1,36812 0,04734
PAR.046 0,23094 0,23094 -0,21946 2,30940 0,00005
PAR.047 0,16722 0,16722 -0,13386 1,67220 0,00745
PAR.048 0,06567 0,06371 -0,06567 0,65673 0,78152
PAR.049 0,12129 0,12129 -0,05879 1,21286 0,10550
PAR.050 0,12400 0,12400 -0,06865 1,23996 0,09237
PAR.051 0,19811 0,11032 -0,19811 1,98115 0,00078
239
Apéndices
Asymp.
Kolmogorov- Sig. (2-
Most Extreme Differences Smirnov Z tailed)
Absolute Positive Negative
PAR.031 0,09158 0,09158 -0,04940 0,64754 0,79582
PAR.032 0,11956 0,07525 -0,11956 0,84544 0,47228
PAR.033 0,17063 0,17063 -0,08201 1,20651 0,10879
PAR.034 0,14860 0,14860 -0,11033 1,05074 0,21953
PAR.035 0,08741 0,08741 -0,04814 0,61806 0,83951
PAR.036 0,09769 0,05434 -0,09769 0,69076 0,72655
PAR.037 0,10995 0,10995 -0,04136 0,77745 0,58123
PAR.038 0,34107 0,33163 -0,34107 2,41174 0,00002
PAR.039 0,22811 0,22811 -0,14225 1,61298 0,01100
PAR.040 0,25262 0,25262 -0,20995 1,78630 0,00338
PAR.041 0,19724 0,19724 -0,09468 1,39470 0,04088
PAR.042 0,15558 0,15558 -0,10457 1,10015 0,17760
PAR.043 0,23834 0,23834 -0,12273 1,68533 0,00682
PAR.044 0,12030 0,12030 -0,08394 0,85067 0,46430
PAR.045 0,10216 0,10216 -0,08849 0,72238 0,67373
PAR.046 0,20174 0,20174 -0,12050 1,42649 0,03416
PAR.047 0,06148 0,06148 -0,05737 0,43472 0,99157
PAR.048 0,15223 0,06140 -0,15223 1,07646 0,19685
PAR.049 0,07200 0,05766 -0,07200 0,50914 0,95780
PAR.050 0,07439 0,07439 -0,04846 0,52603 0,94482
PAR.051 0,10025 0,06830 -0,10025 0,70890 0,69638
240
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Asymp.
Kolmogorov- Sig. (2-
Most Extreme Differences Smirnov Z tailed)
Absolute Positive Negative
PAR.013 0,15503 0,15503 -0,08314 1,09623 0,18068
PAR.014 0,10300 0,10300 -0,07028 0,72833 0,66370
PAR.015 0,25701 0,17686 -0,25701 1,81736 0,00271
PAR.017 0,11858 0,06620 -0,11858 0,83852 0,48293
PAR.018 0,07494 0,07494 -0,04227 0,52988 0,94157
PAR.019 0,10949 0,09589 -0,10949 0,77418 0,58666
PAR.021 0,08606 0,08606 -0,06246 0,60852 0,85280
PAR.022 0,11777 0,11777 -0,07805 0,83272 0,49193
PAR.023 0,07657 0,07657 -0,05847 0,54146 0,93113
PAR.024 0,43062 0,30938 -0,43062 3,04492 0,00000
PAR.026 0,42949 0,42949 -0,31051 3,03698 0,00000
PAR.027 0,15609 0,15609 -0,07874 1,10373 0,17483
PAR.028 0,12596 0,12596 -0,08520 0,89071 0,40569
PAR.030 0,08644 0,08644 -0,05382 0,61124 0,84906
PAR.031 0,07346 0,07346 -0,05969 0,51942 0,95015
PAR.032 0,09135 0,07959 -0,09135 0,64593 0,79829
PAR.033 0,11018 0,11018 -0,08305 0,77910 0,57849
PAR.034 0,10041 0,10041 -0,06591 0,71004 0,69447
PAR.035 0,31556 0,31556 -0,24292 2,23136 0,00009
PAR.036 0,12770 0,09300 -0,12770 0,90296 0,38866
PAR.037 0,33780 0,33780 -0,33587 2,38862 0,00002
PAR.038 0,29212 0,27575 -0,29212 2,06560 0,00039
PAR.039 0,15576 0,15576 -0,11809 1,10138 0,17664
PAR.040 0,24503 0,24503 -0,23643 1,73263 0,00494
PAR.041 0,16990 0,16990 -0,08817 1,20137 0,11151
PAR.042 0,15799 0,15799 -0,10864 1,11714 0,16474
PAR.043 0,37200 0,33765 -0,37200 2,63045 0,00000
PAR.044 0,22656 0,22656 -0,17036 1,60202 0,01180
PAR.045 0,15439 0,15439 -0,10466 1,09171 0,18428
PAR.046 0,27145 0,27145 -0,21791 1,91942 0,00126
PAR.047 0,17833 0,14394 -0,17833 1,26096 0,08316
PAR.048 0,09203 0,09203 -0,07327 0,65072 0,79090
PAR.049 0,15946 0,15946 -0,07877 1,12754 0,15723
PAR.050 0,16076 0,16076 -0,07645 1,13672 0,15084
PAR.051 0,22442 0,14431 -0,22442 1,58687 0,01300
241
Apéndices
242
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
K-S-Lilliefors Shapiro-Wilk
Statistic df Sig. Statistic df
PAR.049 ,143 100 ,000 ,793 100 ,000
PAR.050 ,221 100 ,000 ,484 100 ,000
PAR.051 ,091 100 ,042 ,952 100 ,001
243
Apéndices
K-S-Lilliefors Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
PAR.020 0 ,072 50 ,200(*) ,967 50 ,181
1 ,095 50 ,200(*) ,981 50 ,586
PAR.021 0 ,061 50 ,200(*) ,991 50 ,966
1 ,073 50 ,200(*) ,982 50 ,624
PAR.022 0 ,095 50 ,200(*) ,984 50 ,720
1 ,089 50 ,200(*) ,977 50 ,417
PAR.023 0 ,105 50 ,200(*) ,964 50 ,134
1 ,114 50 ,120 ,958 50 ,071
PAR.024 1 ,435 50 ,000 ,401 50 ,000
PAR.025 1 ,422 50 ,000 ,452 50 ,000
PAR.026 1 ,436 50 ,000 ,398 50 ,000
PAR.027 0 ,095 50 ,200(*) ,969 50 ,216
1 ,119 50 ,075 ,946 50 ,024
PAR.028 0 ,135 50 ,024 ,975 50 ,349
1 ,093 50 ,200(*) ,960 50 ,088
PAR.029 0 ,135 50 ,024 ,975 50 ,349
1 ,093 50 ,200(*) ,960 50 ,088
PAR.030 0 ,088 50 ,200(*) ,991 50 ,963
1 ,070 50 ,200(*) ,976 50 ,389
PAR.031 0 ,065 50 ,200(*) ,994 50 ,995
1 ,083 50 ,200(*) ,969 50 ,207
PAR.032 0 ,099 50 ,200(*) ,961 50 ,096
1 ,076 50 ,200(*) ,971 50 ,260
PAR.033 0 ,121 50 ,066 ,946 50 ,024
1 ,111 50 ,173 ,962 50 ,111
PAR.034 0 ,083 50 ,200(*) ,964 50 ,127
1 ,098 50 ,200(*) ,944 50 ,020
PAR.035 0 ,108 50 ,199 ,973 50 ,300
1 ,500 50 ,000 ,131 50 ,000
PAR.036 0 ,098 50 ,200(*) ,962 50 ,113
1 ,138 50 ,018 ,895 50 ,000
PAR.037 0 ,100 50 ,200(*) ,958 50 ,077
1 ,498 50 ,000 ,132 50 ,000
PAR.038 0 ,312 50 ,000 ,574 50 ,000
1 ,286 50 ,000 ,658 50 ,000
PAR.039 0 ,168 50 ,001 ,865 50 ,000
1 ,206 50 ,000 ,811 50 ,000
PAR.040 0 ,201 50 ,000 ,817 50 ,000
1 ,258 50 ,000 ,718 50 ,000
PAR.041 0 ,117 50 ,083 ,956 50 ,062
1 ,135 50 ,024 ,897 50 ,000
PAR.042 0 ,106 50 ,200(*) ,963 50 ,123
1 ,152 50 ,005 ,917 50 ,002
PAR.043 0 ,127 50 ,042 ,886 50 ,000
1 ,332 50 ,000 ,525 50 ,000
PAR.044 0 ,143 50 ,013 ,903 50 ,001
1 ,187 50 ,000 ,866 50 ,000
244
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
K-S-Lilliefors Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
PAR.045 0 ,096 50 ,200(*) ,951 50 ,038
1 ,159 50 ,003 ,904 50 ,001
PAR.046 0 ,105 50 ,200(*) ,931 50 ,006
1 ,198 50 ,000 ,754 50 ,000
PAR.047 0 ,112 50 ,155 ,957 50 ,068
1 ,062 50 ,200(*) ,983 50 ,670
PAR.048 0 ,112 50 ,162 ,959 50 ,081
1 ,060 50 ,200(*) ,979 50 ,504
PAR.049 0 ,099 50 ,200(*) ,944 50 ,020
1 ,195 50 ,000 ,761 50 ,000
PAR.050 0 ,102 50 ,200(*) ,956 50 ,061
1 ,243 50 ,000 ,483 50 ,000
PAR.051 0 ,077 50 ,200(*) ,964 50 ,129
1 ,082 50 ,200(*) ,935 50 ,008
PAR.009 is constant when CTRL_PATOLOGIA = 0. It has been
omitted. PAR.024 is constant when CTRL_PATOLOGIA = 0. It has
been omitted. PAR.025 is constant when CTRL_PATOLOGIA = 0. It
has been omitted. PAR.026 is constant when CTRL_PATOLOGIA =
0. It has been omitted.
245
Apéndices
K-S-Lilliefors Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
PAR.024 ,501 100 ,000 ,372 100 ,000
PAR.026 ,500 100 ,000 ,376 100 ,000
PAR.027 ,112 100 ,003 ,950 100 ,001
PAR.028 ,075 100 ,180 ,980 100 ,136
PAR.030 ,064 100 ,200(*) ,982 100 ,177
PAR.031 ,069 100 ,200(*) ,988 100 ,481
PAR.032 ,096 100 ,024 ,964 100 ,008
PAR.033 ,125 100 ,001 ,965 100 ,009
PAR.034 ,107 100 ,007 ,928 100 ,000
PAR.035 ,266 100 ,000 ,385 100 ,000
PAR.036 ,212 100 ,000 ,811 100 ,000
PAR.037 ,324 100 ,000 ,243 100 ,000
PAR.038 ,355 100 ,000 ,414 100 ,000
PAR.039 ,205 100 ,000 ,751 100 ,000
PAR.040 ,306 100 ,000 ,528 100 ,000
PAR.041 ,196 100 ,000 ,806 100 ,000
PAR.042 ,184 100 ,000 ,798 100 ,000
PAR.043 ,398 100 ,000 ,191 100 ,000
PAR.044 ,228 100 ,000 ,691 100 ,000
PAR.045 ,137 100 ,000 ,857 100 ,000
PAR.046 ,231 100 ,000 ,587 100 ,000
PAR.047 ,167 100 ,000 ,870 100 ,000
PAR.048 ,066 100 ,200(*) ,986 100 ,381
PAR.049 ,121 100 ,001 ,935 100 ,000
PAR.050 ,124 100 ,001 ,924 100 ,000
PAR.051 ,198 100 ,000 ,750 100 ,000
246
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
K-S-Lilliefors Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
PAR.007 0 ,090 50 ,200(*) ,969 50 ,204
1 ,188 50 ,000 ,715 50 ,000
PAR.008 0 ,105 50 ,200(*) ,986 50 ,825
1 ,087 50 ,200(*) ,903 50 ,001
PAR.009 1 ,429 50 ,000 ,558 50 ,000
PAR.010 0 ,167 50 ,001 ,893 50 ,000
1 ,186 50 ,000 ,692 50 ,000
PAR.011 0 ,084 50 ,200(*) ,979 50 ,497
1 ,096 50 ,200(*) ,985 50 ,782
PAR.012 0 ,108 50 ,200(*) ,964 50 ,132
1 ,137 50 ,020 ,926 50 ,004
PAR.013 0 ,125 50 ,049 ,947 50 ,026
1 ,155 50 ,004 ,905 50 ,001
PAR.014 0 ,065 50 ,200(*) ,983 50 ,665
1 ,103 50 ,200(*) ,964 50 ,128
PAR.015 0 ,208 50 ,000 ,728 50 ,000
1 ,257 50 ,000 ,751 50 ,000
PAR.016 0 ,208 50 ,000 ,728 50 ,000
1 ,257 50 ,000 ,750 50 ,000
PAR.017 0 ,061 50 ,200(*) ,972 50 ,268
1 ,119 50 ,076 ,965 50 ,147
PAR.018 0 ,113 50 ,130 ,956 50 ,063
1 ,075 50 ,200(*) ,985 50 ,788
PAR.019 0 ,124 50 ,052 ,962 50 ,106
1 ,109 50 ,186 ,963 50 ,123
PAR.020 0 ,124 50 ,052 ,962 50 ,106
1 ,109 50 ,186 ,963 50 ,123
PAR.021 0 ,082 50 ,200(*) ,972 50 ,270
1 ,086 50 ,200(*) ,972 50 ,283
PAR.022 0 ,114 50 ,107 ,946 50 ,024
1 ,118 50 ,080 ,970 50 ,242
PAR.023 0 ,080 50 ,200(*) ,991 50 ,964
1 ,077 50 ,200(*) ,967 50 ,176
PAR.024 1 ,431 50 ,000 ,549 50 ,000
PAR.025 1 ,431 50 ,000 ,550 50 ,000
PAR.026 1 ,429 50 ,000 ,558 50 ,000
PAR.027 0 ,121 50 ,064 ,907 50 ,001
1 ,156 50 ,004 ,938 50 ,011
PAR.028 0 ,152 50 ,006 ,928 50 ,005
1 ,126 50 ,046 ,955 50 ,055
PAR.029 0 ,152 50 ,006 ,928 50 ,005
1 ,126 50 ,046 ,955 50 ,055
PAR.030 0 ,105 50 ,200(*) ,951 50 ,039
1 ,086 50 ,200(*) ,972 50 ,270
PAR.031 0 ,092 50 ,200(*) ,967 50 ,170
1 ,073 50 ,200(*) ,983 50 ,665
247
Apéndices
K-S-Lilliefors Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
PAR.032 0 ,120 50 ,071 ,926 50 ,004
1 ,091 50 ,200(*) ,976 50 ,398
PAR.033 0 ,171 50 ,001 ,947 50 ,026
1 ,110 50 ,178 ,959 50 ,079
PAR.034 0 ,149 50 ,008 ,882 50 ,000
1 ,100 50 ,200(*) ,952 50 ,041
PAR.035 0 ,087 50 ,200(*) ,986 50 ,796
1 ,316 50 ,000 ,402 50 ,000
PAR.036 0 ,098 50 ,200(*) ,958 50 ,074
1 ,128 50 ,040 ,924 50 ,003
PAR.037 0 ,110 50 ,181 ,952 50 ,043
1 ,338 50 ,000 ,289 50 ,000
PAR.038 0 ,341 50 ,000 ,358 50 ,000
1 ,292 50 ,000 ,580 50 ,000
PAR.039 0 ,228 50 ,000 ,815 50 ,000
1 ,156 50 ,004 ,893 50 ,000
PAR.040 0 ,253 50 ,000 ,628 50 ,000
1 ,245 50 ,000 ,691 50 ,000
PAR.041 0 ,197 50 ,000 ,863 50 ,000
1 ,170 50 ,001 ,865 50 ,000
PAR.042 0 ,156 50 ,004 ,931 50 ,006
1 ,158 50 ,003 ,883 50 ,000
PAR.043 0 ,238 50 ,000 ,786 50 ,000
1 ,372 50 ,000 ,261 50 ,000
PAR.044 0 ,120 50 ,068 ,932 50 ,007
1 ,227 50 ,000 ,743 50 ,000
PAR.045 0 ,102 50 ,200(*) ,895 50 ,000
1 ,154 50 ,004 ,869 50 ,000
PAR.046 0 ,202 50 ,000 ,782 50 ,000
1 ,271 50 ,000 ,649 50 ,000
PAR.047 0 ,061 50 ,200(*) ,976 50 ,413
1 ,178 50 ,000 ,916 50 ,002
PAR.048 0 ,152 50 ,005 ,943 50 ,018
1 ,092 50 ,200(*) ,966 50 ,164
PAR.049 0 ,072 50 ,200(*) ,985 50 ,756
1 ,159 50 ,003 ,926 50 ,004
PAR.050 0 ,074 50 ,200(*) ,966 50 ,165
1 ,161 50 ,002 ,946 50 ,024
PAR.051 0 ,100 50 ,200(*) ,968 50 ,201
1 ,224 50 ,000 ,743 50 ,000
PAR.009 is constant when CTRL_PATOLOGIA = 0. It has been
omitted. PAR.024 is constant when CTRL_PATOLOGIA = 0. It has
been omitted. PAR.025 is constant when CTRL_PATOLOGIA = 0. It
has been omitted. PAR.026 is constant when CTRL_PATOLOGIA = 0.
It has been omitted
248
Apéndice 2.4. Análisis descriptivo de los
parámetros: homogeneidad de varianzas
Apéndices
Levene
Statistic df1 df2 Sig.
PAR.001 Based on Mean 1,561 1 98,000 0,214
Based on Median 1,572 1 98,000 0,213
Based on Median and with adjusted df 1,572 1 96,509 0,213
Based on trimmed mean 1,638 1 98,000 0,204
PAR.002 Based on Mean 42,812 1 98,000 0,000
Based on Median 25,144 1 98,000 0,000
Based on Median and with adjusted df 25,144 1 49,668 0,000
Based on trimmed mean 36,011 1 98,000 0,000
PAR.003 Based on Mean 1,563 1 98,000 0,214
Based on Median 1,744 1 98,000 0,190
Based on Median and with adjusted df 1,744 1 97,054 0,190
Based on trimmed mean 1,736 1 98,000 0,191
PAR.004 Based on Mean 0,006 1 98,000 0,937
Based on Median 0,040 1 98,000 0,843
Based on Median and with adjusted df 0,040 1 96,459 0,843
Based on trimmed mean 0,008 1 98,000 0,930
PAR.005 Based on Mean 0,766 1 98,000 0,384
Based on Median 0,857 1 98,000 0,357
Based on Median and with adjusted df 0,857 1 94,731 0,357
Based on trimmed mean 0,841 1 98,000 0,361
PAR.006 Based on Mean 4,022 1 98,000 0,048
Based on Median 2,651 1 98,000 0,107
Based on Median and with adjusted df 2,651 1 85,221 0,107
Based on trimmed mean 2,804 1 98,000 0,097
PAR.007 Based on Mean 25,332 1 98,000 0,000
Based on Median 9,814 1 98,000 0,002
Based on Median and with adjusted df 9,814 1 49,331 0,003
Based on trimmed mean 14,897 1 98,000 0,000
PAR.008 Based on Mean 4,677 1 98,000 0,033
Based on Median 3,822 1 98,000 0,053
Based on Median and with adjusted df 3,822 1 74,938 0,054
Based on trimmed mean 3,954 1 98,000 0,050
PAR.009 Based on Mean .(a)
PAR.010 Based on Mean 20,675 1 98,000 0,000
Based on Median 12,478 1 98,000 0,001
Based on Median and with adjusted df 12,478 1 50,986 0,001
Based on trimmed mean 16,334 1 98,000 0,000
250
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Levene
Statistic df1 df2 Sig.
251
Apéndices
Levene
Statistic df1 df2 Sig.
PAR.021 Based on Mean 1,908 1 98,000 0,170
Based on Median 1,882 1 98,000 0,173
Based on Median and with adjusted df 1,882 1 90,796 0,173
Based on trimmed mean 1,930 1 98,000 0,168
PAR.022 Based on Mean 1,379 1 98,000 0,243
Based on Median 1,236 1 98,000 0,269
Based on Median and with adjusted df 1,236 1 92,275 0,269
Based on trimmed mean 1,354 1 98,000 0,247
PAR.023 Based on Mean 16,796 1 98,000 0,000
Based on Median 14,294 1 98,000 0,000
Based on Median and with adjusted df 14,294 1 73,210 0,000
Based on trimmed mean 15,608 1 98,000 0,000
PAR.024 Based on Mean .(a)
PAR.025 Based on Mean .(a)
PAR.026 Based on Mean .(a)
PAR.027 Based on Mean 4,695 1 98,000 0,033
Based on Median 4,761 1 98,000 0,032
Based on Median and with adjusted df 4,761 1 96,831 0,032
Based on trimmed mean 4,574 1 98,000 0,035
PAR.028 Based on Mean 5,168 1 98,000 0,025
Based on Median 5,416 1 98,000 0,022
Based on Median and with adjusted df 5,416 1 97,334 0,022
Based on trimmed mean 5,313 1 98,000 0,023
PAR.029 Based on Mean 5,168 1 98,000 0,025
Based on Median 5,416 1 98,000 0,022
Based on Median and with adjusted df 5,416 1 97,334 0,022
Based on trimmed mean 5,313 1 98,000 0,023
PAR.030 Based on Mean 0,941 1 98,000 0,334
Based on Median 0,893 1 98,000 0,347
Based on Median and with adjusted df 0,893 1 95,612 0,347
Based on trimmed mean 0,937 1 98,000 0,335
PAR.031 Based on Mean 0,865 1 98,000 0,355
Based on Median 0,857 1 98,000 0,357
Based on Median and with adjusted df 0,857 1 95,788 0,357
Based on trimmed mean 0,898 1 98,000 0,346
PAR.032 Based on Mean 6,810 1 98,000 0,010
Based on Median 6,699 1 98,000 0,011
Based on Median and with adjusted df 6,699 1 92,351 0,011
Based on trimmed mean 6,959 1 98,000 0,010
PAR.033 Based on Mean 1,781 1 98,000 0,185
Based on Median 1,799 1 98,000 0,183
Based on Median and with adjusted df 1,799 1 94,069 0,183
Based on trimmed mean 1,796 1 98,000 0,183
252
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Levene
Statistic df1 df2 Sig.
253
Apéndices
Levene
Statistic df1 df2 Sig.
PAR.044 Based on Mean 47,288 1 98,000 0,000
Based on Median 24,687 1 98,000 0,000
Based on Median and with adjusted df 24,687 1 52,395 0,000
Based on trimmed mean 40,537 1 98,000 0,000
PAR.045 Based on Mean 47,907 1 98,000 0,000
Based on Median 32,821 1 98,000 0,000
Based on Median and with adjusted df 32,821 1 53,132 0,000
Based on trimmed mean 43,414 1 98,000 0,000
PAR.046 Based on Mean 40,976 1 98,000 0,000
Based on Median 20,556 1 98,000 0,000
Based on Median and with adjusted df 20,556 1 49,564 0,000
Based on trimmed mean 32,021 1 98,000 0,000
PAR.047 Based on Mean 8,405 1 98,000 0,005
Based on Median 7,855 1 98,000 0,006
Based on Median and with adjusted df 7,855 1 79,928 0,006
Based on trimmed mean 8,234 1 98,000 0,005
PAR.048 Based on Mean 10,552 1 98,000 0,002
Based on Median 10,630 1 98,000 0,002
Based on Median and with adjusted df 10,630 1 88,995 0,002
Based on trimmed mean 10,689 1 98,000 0,001
PAR.049 Based on Mean 4,132 1 98,000 0,045
Based on Median 2,052 1 98,000 0,155
Based on Median and with adjusted df 2,052 1 62,576 0,157
Based on trimmed mean 3,567 1 98,000 0,062
PAR.050 Based on Mean 4,599 1 98,000 0,034
Based on Median 3,464 1 98,000 0,066
Based on Median and with adjusted df 3,464 1 53,005 0,068
Based on trimmed mean 3,448 1 98,000 0,066
PAR.051 Based on Mean 21,550 1 98,000 0,000
Based on Median 21,425 1 98,000 0,000
Based on Median and with adjusted df 21,425 1 64,866 0,000
Based on trimmed mean 21,539 1 98,000 0,000
a There are not enough unique spread/level pairs to compute the Levene statistic.
b PAR.009 is constant when CTRL_PATOLOGIA = 0. It has been omitted.
c PAR.024 is constant when CTRL_PATOLOGIA = 0. It has been omitted.
d PAR.025 is constant when CTRL_PATOLOGIA = 0. It has been omitted.
e PAR.026 is constant when CTRL_PATOLOGIA = 0. It has been omitted.
254
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
255
Apéndices
Levene
Statistic df1 df2 Sig.
256
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Levene
Statistic df1 df2 Sig.
PAR.021 Based on Mean 2,050 1 98,000 0,155
Based on Median 1,737 1 98,000 0,191
Based on Median and with adjusted df 1,737 1 95,040 0,191
Based on trimmed mean 2,070 1 98,000 0,153
PAR.022 Based on Mean 4,014 1 98,000 0,048
Based on Median 2,938 1 98,000 0,090
Based on Median and with adjusted df 2,938 1 95,486 0,090
Based on trimmed mean 3,913 1 98,000 0,051
PAR.023 Based on Mean 13,470 1 98,000 0,000
Based on Median 12,103 1 98,000 0,001
Based on Median and with adjusted df 12,103 1 76,300 0,001
Based on trimmed mean 13,039 1 98,000 0,000
PAR.024 Based on Mean .(a)
PAR.025 Based on Mean .(a)
PAR.026 Based on Mean .(a)
PAR.027 Based on Mean 0,157 1 98,000 0,693
Based on Median 0,145 1 98,000 0,704
Based on Median and with adjusted df 0,145 1 97,990 0,704
Based on trimmed mean 0,183 1 98,000 0,670
PAR.028 Based on Mean 7,522 1 98,000 0,007
Based on Median 6,425 1 98,000 0,013
Based on Median and with adjusted df 6,425 1 97,890 0,013
Based on trimmed mean 7,366 1 98,000 0,008
PAR.029 Based on Mean 7,522 1 98,000 0,007
Based on Median 6,425 1 98,000 0,013
Based on Median and with adjusted df 6,425 1 97,890 0,013
Based on trimmed mean 7,366 1 98,000 0,008
PAR.030 Based on Mean 2,069 1 98,000 0,154
Based on Median 1,885 1 98,000 0,173
Based on Median and with adjusted df 1,885 1 97,960 0,173
Based on trimmed mean 2,015 1 98,000 0,159
PAR.031 Based on Mean 1,330 1 98 0,252
Based on Median 1,221 1 98 0,272
Based on Median and with adjusted df 1,221 1 97,5867874 0,272
Based on trimmed mean 1,295 1 98,000 0,258
PAR.032 Based on Mean 1,592 1 98,000 0,210
Based on Median 1,643 1 98,000 0,203
Based on Median and with adjusted df 1,643 1 97,967 0,203
Based on trimmed mean 1,683 1 98,000 0,198
PAR.033 Based on Mean 0,539 1 98,000 0,465
Based on Median 0,568 1 98,000 0,453
Based on Median and with adjusted df 0,568 1 95,580 0,453
Based on trimmed mean 0,550 1 98,000 0,460
257
Apéndices
Levene
Statistic df1 df2 Sig.
258
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Levene
Statistic df1 df2 Sig.
PAR.044 Based on Mean 21,725 1 98,000 0,000
Based on Median 10,303 1 98,000 0,002
Based on Median and with adjusted df 10,303 1 53,372 0,002
Based on trimmed mean 15,592 1 98,000 0,000
PAR.045 Based on Mean 12,593 1 98,000 0,001
Based on Median 8,513 1 98,000 0,004
Based on Median and with adjusted df 8,513 1 68,007 0,005
Based on trimmed mean 11,168 1 98,000 0,001
PAR.046 Based on Mean 16,558 1 98,000 0,000
Based on Median 9,293 1 98,000 0,003
Based on Median and with adjusted df 9,293 1 53,117 0,004
Based on trimmed mean 11,764 1 98,000 0,001
PAR.047 Based on Mean 14,624 1 98,000 0,000
Based on Median 13,362 1 98,000 0,000
Based on Median and with adjusted df 13,362 1 56,763 0,001
Based on trimmed mean 14,813 1 98,000 0,000
PAR.048 Based on Mean 0,159 1 98,000 0,691
Based on Median 0,188 1 98,000 0,666
Based on Median and with adjusted df 0,188 1 97,596 0,666
Based on trimmed mean 0,173 1 98,000 0,679
PAR.049 Based on Mean 12,047 1 98,000 0,001
Based on Median 7,085 1 98,000 0,009
Based on Median and with adjusted df 7,085 1 69,736 0,010
Based on trimmed mean 11,018 1 98,000 0,001
PAR.050 Based on Mean 7,669 1 98,000 0,007
Based on Median 6,947 1 98,000 0,010
Based on Median and with adjusted df 6,947 1 74,088 0,010
Based on trimmed mean 7,288 1 98,000 0,008
PAR.051 Based on Mean 9,403 1 98,000 0,003
Based on Median 5,176 1 98,000 0,025
Based on Median and with adjusted df 5,176 1 59,770 0,027
Based on trimmed mean 6,481 1 98,000 0,012
a There are not enough unique spread/level pairs to compute the Levene statistic.
b PAR.009 is constant when CTRL_PATOLOGIA = 0. It has been omitted.
c PAR.024 is constant when CTRL_PATOLOGIA = 0. It has been omitted.
d PAR.025 is constant when CTRL_PATOLOGIA = 0. It has been omitted.
e PAR.026 is constant when CTRL_PATOLOGIA = 0. It has been omitted.
259
Apéndice 3. Pruebas de diferencias de medias
(t-test) de los parámetros
Apéndices
262
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
263
Apéndices
264
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
265
Apéndice 4. Contrastes no paramétricos de los
parámetros
Apéndices
268
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
269
Apéndices
270
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
271
Apéndices
272
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
273
Apéndices
274
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
275
Apéndice 5. Pruebas de correlación (τ-Kendall)
de los parámetros
Apéndices
278
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
279
Apéndices
280
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Tabla AP5-2-1. Índices de correlación Tau-Kendall entre los parámetros de la base de datos
femenina, casos patológicos (primera parte).
1 2 3 4 5 6 7 8 9 10 11 12 13
1 1,00 0,03 -0,15 -0,02 -0,12 0,01 -0,18 -0,30 0,22 -0,17 0,08 0,03 0,04
2 0,03 1,00 0,25 0,21 0,27 -0,01 0,03 0,14 0,22 0,23 0,38 0,37 0,38
3 -0,15 0,25 1,00 0,41 0,57 0,15 0,13 0,10 0,07 0,24 0,29 0,35 0,33
4 -0,02 0,21 0,41 1,00 0,55 0,14 0,29 0,12 0,15 0,18 0,23 0,26 0,27
5 -0,12 0,27 0,57 0,55 1,00 0,05 0,18 0,19 0,14 0,25 0,23 0,27 0,28
6 0,01 -0,01 0,15 0,14 0,05 1,00 0,34 0,00 0,05 -0,06 -0,07 -0,02 -0,05
7 -0,18 0,03 0,13 0,29 0,18 0,34 1,00 0,12 -0,06 0,00 -0,02 0,01 0,01
8 -0,30 0,14 0,10 0,12 0,19 0,00 0,12 1,00 -0,06 0,56 0,32 0,28 0,31
9 0,22 0,22 0,07 0,15 0,14 0,05 -0,06 -0,06 1,00 -0,03 0,20 0,16 0,17
10 -0,17 0,23 0,24 0,18 0,25 -0,06 0,00 0,56 -0,03 1,00 0,52 0,54 0,56
11 0,08 0,38 0,29 0,23 0,23 -0,07 -0,02 0,32 0,20 0,52 1,00 0,81 0,81
12 0,03 0,37 0,35 0,26 0,27 -0,02 0,01 0,28 0,16 0,54 0,81 1,00 0,90
13 0,04 0,38 0,33 0,27 0,28 -0,05 0,01 0,31 0,17 0,56 0,81 0,90 1,00
14 0,07 0,38 0,32 0,24 0,28 -0,06 0,03 0,31 0,18 0,46 0,73 0,78 0,83
15 0,10 -0,29 -0,01 0,07 -0,09 0,11 0,18 -0,26 -0,12 -0,14 -0,10 -0,02 -0,05
17 -0,48 0,06 0,14 0,11 0,20 0,01 0,14 0,72 -0,18 0,41 0,16 0,16 0,17
18 0,15 0,18 0,11 0,03 0,08 -0,03 -0,26 -0,21 0,28 0,02 0,19 0,13 0,14
19 0,22 0,28 0,15 0,06 0,10 0,00 -0,21 -0,27 0,24 0,00 0,26 0,21 0,22
21 0,16 0,40 0,21 0,07 0,16 -0,07 -0,10 -0,10 0,28 0,09 0,37 0,35 0,36
22 0,21 0,47 0,23 0,06 0,13 -0,05 -0,11 -0,11 0,25 0,13 0,39 0,36 0,38
23 0,34 0,32 0,20 0,15 0,11 -0,02 -0,05 -0,04 0,23 0,09 0,48 0,46 0,48
24 -0,22 -0,22 -0,07 -0,14 -0,14 -0,06 0,06 0,06 -1,00 0,03 -0,19 -0,16 -0,17
26 0,22 0,22 0,07 0,15 0,14 0,05 -0,06 -0,06 1,00 -0,03 0,20 0,16 0,17
27 -0,01 -0,26 -0,23 -0,09 -0,22 -0,09 0,09 0,01 -0,21 -0,11 -0,27 -0,25 -0,27
28 0,00 -0,17 -0,19 -0,09 -0,18 -0,07 0,09 0,03 -0,20 -0,07 -0,23 -0,23 -0,22
30 -0,06 -0,27 -0,21 -0,12 -0,18 0,00 -0,02 -0,02 -0,27 -0,11 -0,27 -0,29 -0,28
31 -0,06 -0,26 -0,16 -0,09 -0,15 0,03 0,01 -0,03 -0,28 -0,08 -0,25 -0,25 -0,24
32 -0,78 0,10 0,23 0,08 0,22 0,00 0,17 0,40 -0,28 0,28 -0,01 0,04 0,05
33 -0,11 -0,02 0,02 0,03 0,01 0,04 0,18 0,12 -0,21 0,00 -0,06 0,00 -0,02
34 0,00 -0,18 -0,10 -0,07 -0,18 0,01 0,06 -0,07 -0,18 -0,14 -0,28 -0,26 -0,29
35 -0,43 0,32 0,31 0,20 0,39 -0,08 0,03 0,43 0,17 0,36 0,25 0,25 0,27
36 -0,16 -0,63 -0,27 -0,21 -0,33 0,03 0,12 -0,21 -0,31 -0,28 -0,42 -0,41 -0,43
37 0,64 0,33 0,06 0,11 0,10 0,01 -0,12 -0,10 0,26 0,05 0,27 0,22 0,24
38 0,10 0,76 0,29 0,22 0,35 -0,04 -0,05 0,18 0,30 0,26 0,42 0,41 0,42
39 -0,06 0,82 0,19 0,15 0,20 0,03 0,10 0,11 0,09 0,19 0,27 0,28 0,28
40 0,10 0,85 0,28 0,23 0,33 -0,04 -0,04 0,17 0,29 0,26 0,42 0,40 0,42
41 -0,04 -0,02 -0,05 -0,09 -0,01 0,00 -0,09 -0,36 -0,07 -0,27 -0,27 -0,26 -0,23
42 0,36 0,02 -0,06 -0,06 -0,13 0,03 -0,12 -0,72 0,21 -0,40 -0,16 -0,14 -0,15
43 0,47 0,23 -0,04 0,01 0,00 -0,01 -0,20 -0,26 0,49 -0,16 0,13 0,09 0,11
44 0,12 0,46 0,23 0,30 0,33 0,06 0,10 -0,04 0,44 0,11 0,25 0,26 0,28
45 0,25 0,50 0,27 0,30 0,34 0,05 0,02 -0,15 0,24 0,06 0,24 0,24 0,25
46 0,23 0,42 0,22 0,23 0,22 0,10 0,06 -0,20 0,44 -0,03 0,23 0,24 0,25
47 -0,05 0,01 -0,04 -0,12 0,00 -0,22 -0,17 0,14 -0,23 0,03 -0,07 -0,08 -0,06
48 0,04 0,18 0,32 0,27 0,29 0,01 0,03 0,12 0,30 0,28 0,49 0,44 0,43
49 0,02 0,06 0,03 -0,10 0,06 -0,01 -0,13 0,20 -0,03 0,17 0,17 0,08 0,09
50 0,10 0,26 0,05 -0,03 0,03 -0,17 -0,16 -0,07 -0,02 -0,03 0,14 0,06 0,07
51 -0,23 -0,06 -0,08 -0,11 -0,03 -0,17 -0,12 0,35 -0,36 0,20 -0,02 -0,04 -0,03
281
Apéndices
282
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
283
Apéndices
284
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
285
Apéndices
286
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
287
Apéndices
288
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
289
Apéndices
Tabla AP5-5-1. Índices de correlación Tau-Kendall entre los parámetros de la base de datos
masculina, casos patológicos (primera parte).
1 2 3 4 5 6 7 8 9 10 11 12 13
1 1,00 0,16 -0,09 0,09 -0,19 0,08 -0,13 -0,30 -0,03 -0,15 0,02 0,03 0,07
2 0,16 1,00 -0,14 -0,09 -0,08 0,03 0,03 -0,18 0,33 -0,03 0,40 0,36 0,33
3 -0,09 -0,14 1,00 0,43 0,65 -0,07 -0,04 0,14 -0,17 0,14 0,11 0,12 0,12
4 0,09 -0,09 0,43 1,00 0,52 -0,04 -0,04 0,12 -0,19 0,12 0,14 0,15 0,14
5 -0,19 -0,08 0,65 0,52 1,00 -0,09 0,02 0,23 -0,10 0,12 0,12 0,18 0,16
6 0,08 0,03 -0,07 -0,04 -0,09 1,00 -0,15 -0,30 0,08 -0,15 -0,11 -0,03 0,05
7 -0,13 0,03 -0,04 -0,04 0,02 -0,15 1,00 0,00 0,08 0,03 -0,14 -0,08 -0,15
8 -0,30 -0,18 0,14 0,12 0,23 -0,30 0,00 1,00 -0,23 0,31 0,02 -0,04 -0,06
9 -0,03 0,33 -0,17 -0,19 -0,10 0,08 0,08 -0,23 1,00 -0,09 0,23 0,13 0,12
10 -0,15 -0,03 0,14 0,12 0,12 -0,15 0,03 0,31 -0,09 1,00 0,22 0,21 0,20
11 0,02 0,40 0,11 0,14 0,12 -0,11 -0,14 0,02 0,23 0,22 1,00 0,72 0,67
12 0,03 0,36 0,12 0,15 0,18 -0,03 -0,08 -0,04 0,13 0,21 0,72 1,00 0,83
13 0,07 0,33 0,12 0,14 0,16 0,05 -0,15 -0,06 0,12 0,20 0,67 0,83 1,00
14 0,10 0,22 0,11 0,09 0,10 0,14 -0,14 -0,16 0,05 0,14 0,52 0,65 0,73
15 -0,19 -0,45 0,32 0,20 0,20 -0,09 0,02 0,20 -0,47 0,19 -0,19 -0,11 -0,16
17 -0,41 -0,33 0,17 0,09 0,21 -0,20 0,15 0,61 -0,23 0,33 -0,12 -0,15 -0,18
18 0,21 0,28 -0,09 -0,08 -0,15 0,07 -0,21 -0,27 0,31 -0,14 0,39 0,30 0,29
19 0,29 0,33 -0,07 -0,09 -0,14 0,10 -0,19 -0,36 0,30 -0,16 0,37 0,33 0,34
21 0,19 0,24 -0,08 -0,18 -0,13 0,14 -0,18 -0,30 0,25 -0,16 0,20 0,16 0,20
22 0,15 0,33 -0,09 -0,12 -0,12 0,14 -0,17 -0,33 0,29 -0,11 0,28 0,25 0,29
23 0,27 0,23 0,08 0,06 0,02 0,24 -0,12 -0,35 0,08 -0,04 0,38 0,52 0,59
24 0,03 -0,33 0,17 0,20 0,10 -0,08 -0,08 0,23 -1,00 0,09 -0,22 -0,14 -0,12
26 -0,03 0,33 -0,17 -0,19 -0,10 0,08 0,08 -0,23 1,00 -0,09 0,23 0,13 0,12
27 -0,22 -0,09 0,13 0,08 0,19 -0,11 0,19 0,34 -0,31 0,19 -0,08 -0,11 -0,11
28 -0,20 -0,08 0,12 0,06 0,18 -0,12 0,18 0,26 -0,35 0,14 -0,10 -0,08 -0,08
30 -0,12 -0,09 0,15 0,07 0,15 -0,14 0,15 0,22 -0,34 0,16 -0,02 0,00 -0,04
31 -0,11 -0,09 0,16 0,10 0,16 -0,13 0,13 0,22 -0,37 0,16 -0,01 0,03 -0,02
32 -0,66 -0,23 0,23 0,08 0,29 -0,09 0,10 0,35 -0,39 0,15 -0,13 -0,09 -0,12
33 -0,05 -0,21 -0,01 0,03 0,04 0,06 0,16 0,01 -0,05 0,06 -0,31 -0,17 -0,17
34 -0,07 0,07 0,06 0,10 0,06 -0,05 0,12 0,04 0,08 0,07 0,06 0,06 0,08
35 -0,68 0,14 0,05 -0,10 0,18 -0,09 0,06 0,20 0,23 0,16 0,21 0,16 0,13
36 -0,17 -0,75 0,15 0,08 0,12 0,00 -0,08 0,18 -0,30 0,02 -0,41 -0,37 -0,32
37 0,75 0,38 -0,17 -0,01 -0,22 0,05 -0,12 -0,33 0,14 -0,10 0,20 0,18 0,20
38 0,16 0,75 -0,13 -0,08 -0,11 -0,08 0,15 -0,15 0,37 0,05 0,42 0,39 0,33
39 0,17 0,91 -0,16 -0,10 -0,08 -0,03 0,07 -0,17 0,35 0,00 0,39 0,35 0,32
40 0,17 0,83 -0,13 -0,08 -0,08 -0,08 0,13 -0,16 0,38 0,04 0,42 0,37 0,34
41 -0,05 -0,13 -0,06 -0,03 -0,01 0,07 0,04 -0,26 -0,06 -0,26 -0,24 -0,11 -0,06
42 0,22 0,32 -0,08 -0,10 -0,11 0,23 -0,10 -0,66 0,26 -0,34 0,10 0,14 0,17
43 0,31 0,37 -0,19 -0,07 -0,15 0,17 0,02 -0,47 0,47 -0,25 0,10 0,12 0,14
44 -0,05 0,20 0,13 0,06 0,23 -0,02 0,01 -0,08 0,34 -0,03 0,22 0,24 0,21
45 0,19 0,29 0,18 0,13 0,24 -0,02 -0,09 -0,20 0,16 -0,12 0,29 0,35 0,34
46 0,06 0,32 0,08 0,08 0,14 -0,11 0,01 -0,12 0,30 -0,03 0,30 0,32 0,30
47 0,12 -0,10 0,01 -0,05 0,03 0,03 -0,20 0,02 -0,36 -0,10 -0,10 0,00 0,04
48 0,00 0,23 0,02 0,00 -0,07 -0,12 0,03 0,10 0,24 0,10 0,26 0,13 0,10
49 -0,01 -0,01 0,00 0,02 0,02 0,00 -0,02 0,06 0,03 0,08 0,04 0,03 0,01
50 0,21 0,25 -0,17 -0,21 -0,13 0,21 0,01 -0,32 0,16 -0,09 0,08 0,11 0,20
51 0,06 -0,18 0,06 0,07 0,12 -0,12 -0,10 0,18 -0,47 0,10 -0,05 0,05 0,08
290
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
291
Apéndices
292
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
293
Apéndices
294
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
295
Apéndice 6. Análisis factorial de los parámetros
Apéndices
Tabla AP6-1. Estructura factorial de la base de datos femenina, todos los casos, sin
rotación, a partir de la matriz de componentes.
1 2 3 4 5 6 7 8 9 10 11
PAR.022 0,88 -0,14 -0,24 0,00 -0,04 -0,13 -0,01 0,01 0,00 0,02 0,04
PAR.021 0,88 -0,18 -0,21 -0,04 -0,12 -0,09 0,03 -0,02 0,00 -0,03 0,06
PAR.045 0,85 -0,04 -0,04 0,18 0,30 0,07 0,02 -0,01 -0,05 -0,10 -0,13
PAR.014 0,85 0,26 -0,01 0,05 -0,06 -0,11 -0,26 0,17 -0,08 0,18 0,14
PAR.044 0,85 -0,08 0,15 0,08 0,28 0,18 -0,04 -0,03 0,03 -0,09 -0,09
PAR.013 0,84 0,27 0,03 0,11 -0,05 -0,12 -0,23 0,17 -0,08 0,18 0,17
PAR.036 -0,83 -0,18 -0,16 -0,19 0,01 0,05 0,01 0,06 -0,11 -0,03 0,13
PAR.023 0,82 -0,17 -0,01 0,15 -0,01 -0,16 -0,22 0,21 -0,09 0,22 0,07
PAR.012 0,82 0,26 0,04 0,09 -0,06 -0,15 -0,23 0,17 -0,18 0,16 0,19
PAR.046 0,81 -0,29 0,18 0,11 0,13 0,13 0,06 0,06 -0,15 0,01 0,04
PAR.011 0,81 0,25 0,11 0,07 -0,20 -0,08 -0,23 0,11 -0,23 0,15 0,11
PAR.019 0,79 -0,29 -0,25 -0,02 -0,18 -0,02 0,25 -0,02 -0,05 -0,03 0,13
PAR.040 0,77 0,29 0,23 0,23 0,22 0,05 0,13 -0,29 -0,06 -0,10 -0,11
PAR.002 0,77 0,21 0,00 0,21 0,31 0,13 -0,01 -0,36 -0,19 -0,10 -0,05
PAR.039 0,73 0,16 -0,11 0,18 0,33 0,15 -0,09 -0,36 -0,21 -0,10 -0,01
PAR.038 0,73 0,31 0,31 0,23 0,17 0,01 0,18 -0,26 -0,02 -0,09 -0,13
PAR.018 0,68 -0,29 -0,16 -0,01 -0,36 0,15 0,37 0,03 -0,09 -0,08 0,19
PAR.027 -0,65 0,08 0,29 0,52 0,24 0,16 -0,18 0,11 0,08 0,07 0,08
PAR.043 0,64 -0,50 0,36 0,05 -0,05 0,07 -0,06 0,06 0,01 0,01 -0,04
PAR.030 -0,63 0,10 0,23 0,57 0,04 0,23 -0,01 0,06 0,02 -0,03 0,24
PAR.028 -0,58 0,13 0,28 0,57 0,25 0,15 -0,23 0,11 0,09 0,07 0,08
PAR.005 0,57 0,41 -0,08 -0,17 0,37 0,30 0,14 0,28 0,08 -0,15 -0,09
PAR.034 -0,51 0,05 0,09 0,17 0,31 0,04 -0,10 0,13 0,08 0,15 -0,19
PAR.003 0,51 0,32 -0,17 -0,23 0,28 0,21 0,07 0,48 0,04 -0,08 0,00
PAR.017 -0,23 0,81 0,03 -0,33 -0,19 0,20 -0,21 -0,02 0,00 -0,13 0,04
PAR.008 0,08 0,78 0,29 -0,05 -0,29 -0,04 -0,14 -0,04 -0,06 0,01 -0,03
PAR.010 0,41 0,71 0,26 0,11 -0,18 -0,27 0,13 0,06 0,10 0,07 0,06
PAR.042 0,47 -0,68 -0,19 0,30 0,22 -0,13 0,20 0,06 0,16 0,02 0,10
PAR.032 0,21 0,60 -0,51 -0,12 0,05 0,17 -0,04 0,03 0,20 -0,22 0,27
PAR.035 0,21 0,49 0,46 0,09 -0,01 -0,37 0,46 0,04 0,34 0,05 0,01
PAR.037 0,21 0,49 0,47 0,09 -0,01 -0,37 0,46 0,04 0,33 0,05 0,01
PAR.047 0,33 0,17 -0,61 0,27 -0,07 0,10 -0,14 -0,06 0,17 0,28 -0,16
PAR.048 0,05 0,18 0,56 -0,16 -0,33 0,14 0,07 0,00 -0,29 -0,17 -0,05
PAR.009 0,49 -0,40 0,54 -0,31 -0,08 0,24 -0,21 -0,01 0,28 0,10 -0,02
PAR.026 0,49 -0,40 0,54 -0,31 -0,08 0,24 -0,21 -0,01 0,28 0,10 -0,02
PAR.024 -0,47 0,38 -0,54 0,32 0,09 -0,24 0,22 0,02 -0,32 -0,08 0,02
PAR.001 -0,10 -0,43 0,48 0,31 -0,05 -0,13 0,20 0,07 -0,36 0,17 -0,27
PAR.051 0,05 0,44 -0,47 0,18 -0,19 0,09 -0,10 -0,05 0,05 0,33 -0,38
PAR.041 0,36 -0,28 -0,46 0,14 0,30 -0,20 -0,01 -0,11 0,41 0,06 0,15
PAR.031 -0,59 0,11 0,24 0,60 0,08 0,22 -0,02 0,05 -0,01 0,00 0,26
PAR.049 0,18 0,17 -0,23 0,22 -0,55 0,48 0,19 -0,02 0,06 0,14 -0,19
PAR.050 0,24 -0,03 -0,26 0,39 -0,39 0,44 0,21 -0,03 0,24 0,07 -0,12
PAR.033 -0,18 0,19 -0,08 -0,33 0,37 -0,39 -0,31 -0,17 0,06 0,08 -0,27
PAR.004 0,30 0,24 0,08 -0,27 0,40 0,32 0,15 0,51 -0,03 -0,04 -0,15
PAR.015 -0,38 -0,13 -0,18 -0,03 0,15 -0,07 0,34 0,45 -0,23 0,17 -0,15
PAR.006 -0,11 0,12 0,03 -0,45 0,31 0,22 0,36 -0,18 -0,14 0,53 0,23
PAR.007 -0,33 0,22 0,10 -0,37 0,29 0,30 0,23 -0,36 -0,10 0,38 0,23
298
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Tabla AP6-2. Estructura factorial de la base de datos femenina, todos los casos,
rotación varimax, a partir de la matriz de componentes rotada.
1 2 3 4 5 6 7 8 9 10 11
PAR.002 0,92 0,16 0,27 0,02 0,05 0,03 0,08 0,08 0,03 0,06 0,05
PAR.039 0,88 0,17 0,28 -0,01 0,10 -0,11 0,13 0,07 0,01 0,06 0,06
PAR.040 0,87 0,13 0,23 0,11 -0,03 0,31 -0,01 0,10 0,06 0,06 0,00
PAR.038 0,81 0,11 0,20 0,13 -0,07 0,42 -0,04 0,10 0,07 0,05 -0,02
PAR.045 0,72 0,24 0,32 0,14 0,27 0,03 -0,06 0,30 0,08 0,05 -0,14
PAR.044 0,69 0,20 0,29 0,38 0,19 0,03 -0,03 0,30 0,09 -0,01 -0,10
PAR.036 -0,58 -0,23 -0,41 -0,25 -0,06 -0,33 0,01 -0,10 -0,07 -0,19 0,17
PAR.046 0,54 0,24 0,39 0,35 0,21 -0,04 -0,24 0,20 0,28 -0,11 -0,05
PAR.015 -0,41 -0,05 -0,14 -0,37 0,12 -0,06 -0,40 0,35 0,00 -0,02 0,11
PAR.028 -0,09 -0,94 -0,09 -0,08 -0,02 0,00 -0,05 -0,06 -0,08 -0,01 -0,05
PAR.027 -0,14 -0,92 -0,16 -0,08 -0,02 -0,02 -0,09 -0,07 -0,07 -0,04 -0,02
PAR.031 -0,10 -0,86 -0,13 -0,19 -0,07 0,02 -0,04 -0,16 0,21 -0,08 0,02
PAR.030 -0,15 -0,85 -0,18 -0,18 -0,09 0,01 -0,02 -0,16 0,23 -0,06 0,00
PAR.019 0,31 0,61 0,31 0,10 0,32 0,00 -0,03 0,03 0,43 0,02 -0,06
PAR.021 0,38 0,59 0,44 0,18 0,28 0,01 0,05 0,05 0,23 0,06 -0,15
PAR.022 0,39 0,54 0,49 0,14 0,32 0,02 0,04 0,09 0,15 0,09 -0,15
PAR.034 -0,19 -0,52 -0,21 -0,09 0,04 -0,03 -0,15 0,11 -0,31 0,08 0,05
PAR.012 0,37 0,23 0,84 0,08 -0,03 0,14 0,08 0,12 0,05 0,03 -0,08
PAR.013 0,37 0,20 0,82 0,13 0,01 0,18 0,12 0,15 0,06 0,09 -0,08
PAR.014 0,35 0,25 0,82 0,15 0,01 0,14 0,13 0,16 0,02 0,12 -0,09
PAR.011 0,37 0,26 0,79 0,15 -0,18 0,12 0,02 0,06 0,11 0,09 -0,09
PAR.023 0,30 0,26 0,74 0,24 0,28 -0,01 -0,15 0,10 0,07 0,05 -0,16
PAR.024 -0,10 -0,17 -0,11 -0,95 0,01 -0,01 0,05 -0,04 -0,04 0,10 0,00
PAR.009 0,12 0,17 0,13 0,95 0,00 0,00 -0,09 0,05 0,05 -0,10 0,02
PAR.026 0,12 0,17 0,13 0,95 0,00 0,00 -0,09 0,05 0,05 -0,10 0,02
PAR.043 0,30 0,21 0,27 0,60 0,18 -0,04 -0,33 0,03 0,22 -0,13 -0,17
PAR.042 0,22 0,18 0,11 0,15 0,81 -0,07 -0,26 0,01 0,26 -0,10 -0,15
PAR.041 0,17 0,18 0,10 0,02 0,80 0,00 0,23 -0,04 -0,07 0,08 -0,06
PAR.017 -0,11 -0,08 -0,01 -0,14 -0,71 0,12 0,57 0,13 -0,17 0,13 0,11
PAR.008 0,10 -0,07 0,26 -0,06 -0,68 0,41 0,25 -0,03 -0,12 0,16 0,00
PAR.048 0,07 0,04 0,01 0,20 -0,68 0,14 -0,18 -0,01 0,19 -0,19 -0,02
PAR.037 0,12 -0,02 0,06 0,02 -0,09 0,97 -0,02 0,07 0,00 -0,06 0,03
PAR.035 0,12 -0,02 0,06 0,01 -0,09 0,97 -0,02 0,07 0,00 -0,06 0,03
PAR.010 0,22 0,05 0,42 -0,09 -0,31 0,72 0,17 0,06 0,00 0,11 -0,04
PAR.001 0,02 -0,16 -0,03 0,09 -0,04 0,03 -0,85 -0,14 0,10 -0,13 -0,06
PAR.032 0,12 0,12 0,12 -0,30 -0,02 0,06 0,79 0,28 0,07 0,17 0,03
PAR.004 0,14 0,05 0,08 0,11 -0,09 0,05 0,01 0,86 -0,03 -0,04 0,11
PAR.003 0,17 0,20 0,28 0,00 0,03 0,07 0,26 0,76 0,04 0,03 0,01
PAR.005 0,42 0,16 0,14 0,04 -0,02 0,15 0,27 0,74 0,03 0,08 0,05
PAR.033 -0,02 0,09 -0,08 -0,09 0,00 0,01 0,10 -0,02 -0,80 -0,02 0,06
PAR.018 0,21 0,56 0,23 0,13 0,17 0,00 -0,06 0,04 0,67 0,02 -0,04
PAR.051 0,03 0,03 0,13 -0,30 -0,08 0,01 0,12 0,02 -0,14 0,79 0,00
PAR.049 0,04 0,08 0,00 0,00 -0,20 0,00 0,05 0,00 0,53 0,68 -0,03
PAR.047 0,16 0,10 0,27 -0,18 0,30 -0,10 0,23 0,02 0,01 0,67 -0,05
PAR.050 0,12 0,00 -0,05 0,07 0,12 0,01 0,06 -0,01 0,57 0,60 -0,13
PAR.006 -0,05 0,08 -0,07 -0,01 -0,01 0,03 -0,02 0,15 -0,05 -0,04 0,92
PAR.007 -0,01 -0,12 -0,24 -0,02 -0,16 -0,01 0,12 -0,01 -0,11 -0,05 0,86
299
Apéndices
300
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
301
Apéndices
302
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
303
Apéndices
Tabla AP6-7. Estructura factorial de la base de datos masculina, todos los casos, sin
rotación, a partir de la matriz de componentes.
1 2 3 4 5 6 7 8 9 10 11
PAR.039 0,85 0,19 -0,30 0,13 0,00 0,00 -0,06 0,00 -0,15 -0,20 -0,08
PAR.002 0,84 0,23 -0,34 0,16 -0,07 0,00 -0,04 -0,01 -0,08 -0,21 -0,03
PAR.036 -0,84 -0,24 0,26 -0,19 0,03 0,07 0,04 0,02 0,08 0,18 0,10
PAR.019 0,83 -0,13 0,25 0,01 -0,04 0,04 -0,17 0,16 0,09 0,04 -0,05
PAR.022 0,81 -0,13 0,28 -0,14 -0,15 0,07 0,03 0,03 -0,08 -0,17 0,01
PAR.040 0,78 0,29 -0,42 0,12 -0,24 0,04 -0,02 -0,05 -0,04 -0,11 -0,05
PAR.011 0,77 0,32 0,09 -0,24 0,03 -0,25 -0,11 0,08 -0,20 0,02 0,07
PAR.013 0,76 0,40 0,22 0,00 0,16 -0,32 0,13 0,01 -0,15 -0,02 0,07
PAR.023 0,76 0,12 0,33 0,19 0,20 -0,31 0,05 0,01 -0,05 -0,06 -0,04
PAR.012 0,75 0,41 0,17 -0,08 0,12 -0,32 0,02 0,01 -0,17 -0,01 0,05
PAR.021 0,74 -0,13 0,34 -0,10 -0,21 0,20 -0,11 0,14 -0,12 -0,26 0,08
PAR.014 0,74 0,33 0,30 0,03 0,14 -0,30 0,14 0,12 -0,13 -0,02 0,01
PAR.045 0,73 0,36 0,14 0,08 0,07 0,31 -0,03 -0,22 0,14 0,14 -0,03
PAR.018 0,71 -0,16 0,24 -0,08 -0,08 0,09 -0,47 0,29 0,15 0,10 -0,09
PAR.046 0,71 0,05 -0,09 -0,10 0,33 0,40 -0,16 -0,20 -0,07 0,16 0,11
PAR.038 0,71 0,32 -0,45 0,13 -0,33 0,07 0,01 -0,07 0,03 -0,07 -0,02
PAR.015 -0,67 0,25 0,43 -0,10 0,12 -0,15 0,01 0,13 0,12 0,00 -0,08
PAR.042 0,65 -0,27 0,13 0,45 0,38 0,13 -0,05 -0,06 0,08 -0,08 0,03
PAR.044 0,64 0,20 -0,03 -0,14 0,33 0,47 0,01 -0,08 -0,01 0,17 -0,04
PAR.017 -0,63 0,38 -0,13 -0,50 -0,20 0,07 0,15 0,23 -0,03 -0,02 0,06
PAR.026 0,63 -0,46 -0,31 -0,20 0,22 -0,04 0,31 0,23 0,03 0,11 0,05
PAR.009 0,63 -0,46 -0,31 -0,20 0,22 -0,04 0,31 0,23 0,03 0,11 0,05
PAR.024 -0,62 0,45 0,30 0,20 -0,20 0,06 -0,33 -0,25 -0,04 -0,10 -0,01
PAR.027 -0,52 0,40 -0,34 0,18 0,39 -0,08 -0,13 0,00 0,00 -0,06 -0,01
PAR.028 -0,52 0,49 -0,34 0,25 0,44 -0,05 -0,03 -0,05 -0,04 -0,10 0,04
PAR.032 -0,49 0,45 0,09 -0,15 0,09 0,40 0,14 0,26 0,06 -0,28 0,11
PAR.043 0,47 -0,36 -0,14 -0,07 0,35 0,20 0,00 -0,14 -0,04 0,19 0,37
PAR.005 0,34 0,60 0,27 -0,33 0,26 0,22 0,22 -0,12 0,25 -0,03 -0,08
PAR.031 -0,44 0,52 -0,28 0,36 0,42 -0,02 -0,17 0,11 -0,05 0,10 0,13
PAR.010 0,11 0,50 -0,07 -0,29 0,02 -0,33 0,19 0,02 -0,25 0,07 0,13
PAR.051 -0,42 0,49 0,38 0,33 -0,28 0,08 0,08 0,06 -0,21 0,16 -0,05
PAR.030 -0,45 0,49 -0,30 0,36 0,42 -0,02 -0,19 0,12 -0,02 0,07 0,11
PAR.003 0,30 0,48 0,45 -0,35 0,21 0,07 0,15 -0,09 0,32 -0,05 -0,03
PAR.004 0,37 0,43 0,39 -0,32 0,16 -0,06 0,03 -0,18 0,26 0,06 -0,04
PAR.035 0,29 0,45 -0,48 0,05 -0,42 0,32 0,17 -0,01 0,23 -0,03 0,11
PAR.008 -0,32 0,46 -0,06 -0,56 -0,23 0,06 -0,11 0,02 -0,21 0,13 0,08
PAR.050 0,43 0,10 -0,06 0,56 -0,03 -0,04 0,27 0,44 0,07 0,02 -0,20
PAR.047 -0,05 0,32 0,42 0,46 -0,37 0,18 0,26 0,08 -0,12 0,17 0,10
PAR.048 0,31 0,08 -0,41 -0,42 -0,15 -0,21 -0,21 -0,08 0,00 0,07 0,28
PAR.037 0,45 0,33 -0,34 0,21 -0,53 0,05 0,08 -0,21 0,33 0,11 0,08
PAR.041 0,11 -0,15 0,35 0,40 0,14 0,49 0,28 -0,12 -0,29 0,17 0,03
PAR.001 0,43 -0,13 0,18 0,29 -0,21 -0,47 -0,17 -0,37 0,13 0,18 -0,06
PAR.034 -0,16 0,01 -0,26 -0,03 0,24 -0,34 0,20 -0,30 0,26 0,18 -0,29
PAR.033 -0,30 -0,11 -0,07 0,03 -0,10 -0,12 0,74 -0,37 -0,17 -0,09 0,08
PAR.006 -0,12 -0,07 0,19 0,28 0,07 -0,20 0,16 0,18 0,49 -0,41 0,42
PAR.049 0,16 0,31 -0,11 0,10 -0,17 -0,10 0,09 0,48 0,19 0,56 -0,04
PAR.007 -0,08 0,07 -0,30 -0,25 0,15 0,18 0,10 0,08 -0,06 -0,21 -0,59
304
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
Tabla AP6-8. Estructura factorial de la base de datos masculina, todos los casos,
rotación varimax, a partir de la matriz de componentes rotada.
1 2 3 4 5 6 7 8 9 10 11
PAR.013 0,87 0,22 -0,09 0,10 0,07 0,32 0,01 -0,06 0,08 0,01 0,09
PAR.012 0,85 0,24 -0,10 0,10 -0,02 0,28 0,10 -0,07 0,04 0,06 0,08
PAR.014 0,85 0,14 -0,16 0,08 0,14 0,28 0,06 -0,02 0,15 -0,03 0,04
PAR.011 0,77 0,27 -0,20 0,18 -0,17 0,22 0,23 0,00 0,02 0,14 0,07
PAR.023 0,77 0,11 -0,20 0,10 0,35 0,21 0,12 -0,16 0,04 -0,08 0,06
PAR.010 0,49 0,06 0,17 -0,01 -0,46 0,14 -0,24 0,03 0,10 0,09 0,02
PAR.038 0,29 0,91 -0,10 0,11 -0,02 0,03 0,07 -0,04 0,08 0,07 -0,04
PAR.040 0,39 0,86 -0,10 0,17 0,04 0,03 0,12 -0,03 0,02 0,09 -0,07
PAR.037 -0,02 0,86 -0,12 -0,10 -0,06 0,13 -0,05 -0,22 0,23 -0,07 0,18
PAR.035 -0,13 0,85 0,04 -0,02 -0,17 0,18 -0,09 0,17 0,21 -0,05 0,00
PAR.002 0,51 0,76 -0,07 0,24 0,15 0,02 0,16 0,01 -0,06 0,04 -0,09
PAR.039 0,55 0,68 -0,08 0,27 0,18 0,02 0,17 0,01 -0,09 0,10 -0,12
PAR.036 -0,57 -0,68 0,07 -0,20 -0,19 -0,05 -0,16 0,07 0,03 -0,04 0,12
PAR.015 -0,12 -0,60 0,24 -0,46 -0,19 0,18 -0,05 0,03 0,11 -0,20 -0,09
PAR.031 -0,01 -0,03 0,92 -0,19 0,00 -0,03 0,05 0,10 0,10 0,01 0,06
PAR.030 -0,04 -0,03 0,92 -0,17 0,01 -0,05 0,07 0,08 0,09 -0,02 0,04
PAR.028 -0,06 -0,03 0,91 -0,17 -0,05 0,01 -0,14 0,05 -0,08 -0,05 -0,11
PAR.027 -0,11 -0,07 0,83 -0,14 -0,11 -0,04 -0,03 0,00 -0,07 -0,04 -0,13
PAR.021 0,40 0,25 -0,64 0,09 0,20 0,11 0,31 0,30 -0,14 -0,01 0,06
PAR.022 0,46 0,25 -0,63 0,20 0,18 0,18 0,17 0,12 -0,10 0,02 0,03
PAR.019 0,41 0,23 -0,48 0,24 0,28 0,17 0,44 -0,03 0,10 0,02 0,07
PAR.026 0,19 0,13 -0,29 0,88 0,12 -0,04 -0,03 0,00 0,16 0,02 -0,07
PAR.009 0,19 0,13 -0,29 0,88 0,12 -0,04 -0,03 0,00 0,16 0,02 -0,07
PAR.024 -0,20 -0,13 0,30 -0,86 -0,11 0,05 0,04 0,01 -0,19 0,00 0,10
PAR.051 0,02 -0,11 0,16 -0,78 0,04 0,01 -0,18 0,19 0,30 0,12 0,10
PAR.043 0,04 0,09 -0,08 0,67 0,24 0,10 0,06 0,05 -0,16 0,19 0,38
PAR.047 0,09 0,10 -0,10 -0,59 0,28 0,04 -0,23 0,24 0,40 0,02 0,26
PAR.046 0,21 0,35 -0,05 0,44 0,25 0,39 0,26 0,11 -0,18 0,41 0,18
PAR.042 0,28 0,16 -0,08 0,34 0,76 0,09 0,22 -0,06 -0,12 -0,05 0,13
PAR.008 -0,05 -0,04 0,09 -0,26 -0,74 0,15 -0,02 0,22 0,01 0,27 0,00
PAR.017 -0,28 -0,17 0,20 -0,23 -0,72 0,08 -0,20 0,34 0,15 -0,03 -0,18
PAR.041 -0,03 -0,08 -0,12 -0,08 0,67 0,08 -0,24 0,31 0,06 0,34 0,21
PAR.048 0,15 0,34 -0,05 0,34 -0,55 -0,03 0,14 -0,13 -0,12 0,06 0,19
PAR.005 0,27 0,13 0,03 -0,03 -0,05 0,88 -0,03 0,12 0,03 0,03 -0,12
PAR.003 0,29 -0,04 -0,10 -0,08 -0,08 0,84 0,04 0,04 0,01 -0,11 -0,04
PAR.004 0,34 0,01 -0,12 -0,06 -0,10 0,73 0,09 -0,14 -0,01 -0,01 0,04
PAR.045 0,30 0,49 -0,12 0,03 0,30 0,58 0,19 -0,02 0,04 0,23 0,14
PAR.044 0,20 0,31 -0,03 0,36 0,23 0,54 0,19 0,19 0,00 0,40 0,01
PAR.033 -0,10 -0,06 -0,04 -0,01 0,01 -0,08 -0,90 -0,04 -0,08 -0,05 0,00
PAR.018 0,27 0,15 -0,47 0,19 0,15 0,12 0,74 -0,02 0,11 0,05 0,06
PAR.001 0,30 0,17 -0,29 -0,11 0,21 -0,07 0,10 -0,67 -0,01 -0,03 0,28
PAR.032 -0,23 -0,12 0,33 -0,29 -0,20 0,29 -0,09 0,61 0,01 -0,18 -0,18
PAR.034 -0,10 -0,07 0,27 0,16 -0,06 0,12 -0,27 -0,58 0,05 0,00 -0,21
PAR.049 0,10 0,18 0,09 0,02 -0,14 0,06 0,16 -0,05 0,81 0,04 0,07
PAR.050 0,32 0,33 0,01 0,05 0,48 -0,13 0,03 0,05 0,54 -0,19 -0,19
PAR.006 -0,03 -0,09 0,08 -0,01 0,17 0,03 -0,05 0,08 -0,01 -0,85 0,21
PAR.007 -0,11 0,06 0,10 0,11 -0,08 0,08 -0,03 0,06 -0,06 0,18 -0,73
305
Apéndices
306
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
307
Apéndices
308
Descripción de parámetros glóticos basados en el modelado de los pliegues vocales para la detección de patología de la voz
309