Precisindiagnsticadel CPPS
Precisindiagnsticadel CPPS
Precisindiagnsticadel CPPS
net/publication/331072441
CITATIONS READS
0 182
3 authors, including:
Some of the authors of this publication are also working on these related projects:
Validation of the Acoustic Voice Quality Index version 03.01 and the Acoustic Breathiness Index in the Spanish language View project
All content following this page was uploaded by Jonathan Delgado Hernández on 04 March 2019.
Citation / Cómo citar este artículo: Jonathan Delgado-Hernández, Nieves León-Gómez y Alejandra Jiménez-Álvarez.
(2019). Precisión diagnóstica del pico cepstral de mayor prominencia en el cepstrum suavizado (CPPS) en la detección de la
disfonía en español. Loquens, 6(1), e058. https://doi.org/10.3989/loquens.2019.058
RESUMEN: Los parámetros derivados de la métrica cepstral son cada vez más utilizados en la evaluación acústica
de la voz, ya sea como medidas únicas o como parte de índices multivariados. El pico cepstral de mayor prominencia
en el cepstrum suavizado (CPPS) ha demostrado en multitud de estudios ser la única medida acústica con la suficiente
validez concurrente en la evaluación de la severidad de las alteraciones de la voz tanto en muestras de vocal sostenida
como en muestras de habla continua.
El objetivo de este trabajo es conocer la precisión diagnóstica del CPPS en la detección de la disfonía en español.
Se utilizó la configuración que viene por defecto en Praat y la usada en el cálculo del Acoustic Voice Quality Index.
Los resultados confirman que el CPPS es una medida acústica válida para detectar la disfonía en español tanto con
vocal sostenida como con frases.
Palabras clave: análisis acústico de la voz; CPPS; disfonía; Praat.
ABSTRACT: Diagnostic accuracy of the Smoothed Cepstral Peak Prominence (CPPS) in the detection of dysphonia
in the Spanish language.–The smoothed cepstral peak prominence (CPPS) is an acoustic measure that can be calcu-
lated in both sustained vowels and continuous speech. The goal of this work is to find out the diagnostic accuracy of
CPPS in the detection of dysphonia in Spanish.
In this study 136 subjects with dysphonia and 47 healthy subjects participated. For each subject a sustained vowel
and the reading of three phonetically balanced sentences were recorded. The CPPS was calculated with Praat using
its default configuration (configuration 1), and also with the one used in the calculation of the Acoustic Voice Quality
Index (configuration 2). Five experts perceptively assessed the voice of the subjects in the sample by means of the
GRABS scale.
The CPPS has a great power of discrimination between the normal and the pathological voice, whether it is calcu-
lated from the sustained vowel /a/ (AROC[config. 1] = 0.863 and AROC[config. 2] = 0.841) or whether it is calculated from the
sentences (AROC[config. 1] = 0.884 and AROC[config. 2] = 0.866).
The results confirm that CPPS is a valid acoustic measurement to detect dysphonia in the Spanish language.
Keywords: acoustic voice analysis; CPPS; dysphonia; Praat.
Copyright: © 2019 CSIC. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia de uso y distribución Creative
Commons Reconocimiento 4.0 Internacional (CC BY 4.0).
2 • Jonathan Delgado-Hernández, Nieves León-Gómez y Alejandra Jiménez-Álvarez
Tabla 1: Datos descriptivos del grupo disfónico. calibrado PCE-322A. Cada evaluador pudo escuchar cada
grabación las veces que fueran necesarias hasta tener una
Patología del grupo disfónico Número de pacientes decisión final. Para evaluar la fiabilidad intra-evaluador
Disfonía funcional 37 se utilizó la metodología usada en el trabajo de Hernández
et al. (2018), donde se estudia la precisión diagnóstica y
Nódulo 33
la validez concurrente del Acoustic Voice Quality Index
Edema 18 v. 03.01 y el Acoustic Breathiness Index en español. Se
Quiste 9 seleccionaron al azar 19 grabaciones, aproximadamente
Parálisis 8 el 10 % de las 183 muestras. Estas grabaciones se vol-
Presbifonía 5 vieron a presentar al finalizar la evaluación perceptiva
sin informar al evaluador que eran muestras repetidas.
Sulcus vocalis 5
Para controlar factores como la fatiga, la atención y la
Pólipo 4 concentración se realizaron pausas cada 25 muestras de
Disfonía espasmódica 4 voz siguiendo la recomendación de Kreiman, Gerratt,
Laringitis crónica 3 Kempster, Erman y Berke (1993).
Post-cirugía 3
2.4. Análisis acústico
Tumor 2
Trauma 1 Se obtuvieron con el programa Praat (Boersma y
Laringitis aguda 1 Weenink, 2016, v. 5.4.04) los valores del CPPS (en dB)
Leucoplasia 1 de todos los sujetos de la muestra tanto en las grabaciones
Otros trastornos benignos de la voz 2 de la vocal sostenida como en las de las frases. Para el
cálculo del CPPS se utilizaron dos configuraciones dife-
rentes. La primera (CPPSconf.1) es la que viene por defecto
en Praat. La segunda (CPPSconf.2) es la utilizada en el
de 44.1 Khz y 16 bits de resolución. En todos los audios cálculo del Acoustic Voice Quality Index, versión 03.01
fue calculada post hoc la ratio señal-ruido (signal-to- (Barsties y Maryn, 2016).
noise ratio [SNR]) propuesta por Deliyski, Shaw y Evans
(2005) y Deliyski, Shaw, Evans y Vesselinov (2006). Se 2.5. Análisis estadístico
incluyeron en el estudio las grabaciones con los valores
de SNR recomendados para el análisis acústico, es decir, El análisis estadístico se realizó con el programa
los superiores a 30 dB (Deliyski, Shaw y Evans, 2005). SPSS (v. 21.0), excepto la fiabilidad intra-evaluador e
inter-evaluadores, que fue analizada mediante el programa
2.3. Evaluación acústico-perceptual R Studio (v. 3.0.1).
La fiabilidad intra-evaluador se calculó a través del
Para la evaluación acústico-perceptiva se utilizó la coeficiente kappa de Cohen (Ck). Este estadístico aporta
combinación de la grabación de las frases y de la vocal un índice de acuerdo entre dos jueces o dos calificacio-
sostenida de cada sujeto con un segundo de silencio entre nes; en este caso, el grado de acuerdo entre la puntuación
ellas, con el objetivo de obtener el mayor grado de repre- del parámetro G de la escala acústico-perceptiva en las 19
sentación de la voz diaria de los sujetos del estudio. Cinco muestras repetidas de cada evaluador. Los valores varían
logopedas expertos en rehabilitación de la voz (con una de 0 a 1, donde Ck = 1 correspondería a un acuerdo per-
experiencia media de 10.6 años) evaluaron perceptual- fecto y Ck = 0, a un acuerdo explicable por la casualidad
mente la calidad de la voz de los sujetos de la muestra a (Everitt, 2002). El Ck se considera razonablemente fiable
través de la escala GRABS (Hirano, 1981). En esta escala con valores superiores a 0.41 porque este valor presenta
perceptiva se puntúa de 0 a 3 la severidad de 5 parámetros: una fuerza de acuerdo moderada (Landis y Koch, 1977)
G (grade) indica el grado de afectación general y global Para evaluar la fiabilidad inter-evaluadores se calculó
de la voz; R (roughness) muestra el grado de ronquera el coeficiente kappa de Fleiss (Fk) (Fleiss, 1971), que es
de la voz; A (asthenics) indica el grado de astenia, fatiga una extensión del Ck para más de dos jueces/evaluadores.
o cansancio detectado en la voz; B (breathiness) revela Al igual que el Ck, el Fk se consideró razonablemente
la pérdida de aire a través de las cuerdas, la voz aérea o fiable a partir del valor 0.41 (Landis y Koch, 1977).
soplada, y S (strain) indica el grado de tensión o dureza La precisión diagnóstica del CPPS se evaluó por su
de la voz. Cada evaluador puntuó el grado de calidad glo- sensibilidad (la probabilidad de obtener un resultado
bal de la voz de cada sujeto (G) siguiendo la recomenda- positivo cuando el individuo es disfónico) y especificidad
ción de Wuyts et al. (2000) (G0 = normal o ausencia de (la probabilidad de obtener un resultado negativo cuando
alteración; G1 = alteración ligera; G2 = alteración mode- el individuo no es disfónico). Esta relación entre sensi-
rada; G3 = alteración severa). Las grabaciones se pre- bilidad y especificidad puede representarse gráficamente
sentaron individualmente con auriculares Beyerdynamic generando la curva característica operativa del recep-
DT 770 PRO 80Ω en una habitación con un nivel de ruido tor (receiver operating characteristic, ROC). La tasa
ambiental por debajo de 40 dBA, medido por un sonómetro de verdaderos positivos (sensibilidad) se muestra en la
Vocal Frases
Figura 3: Curvas ROC del CPPS en la vocal (izquierda) y en las frases (derecha).
American Journal of Otolaryngology, 36(5), 647–656. Hillenbrand, J., Cleveland, R. A., y Erickson, R. L. (1994).
https://doi.org/10.1016/j.amjoto.2015.04.012 Acoustic correlates of breathy vocal quality. Journal of
Barsties, B., y Maryn, Y. (2016). External validation of the Acoustic Speech, Language, and Hearing Research, 37, 769–778.
Voice Quality Index version 03.01 with extended representa- https://doi.org/10.1044/jshr.3704.769
tivity. Annals of Otology, Rhinology & Laryngology, 125(7), Hillenbrand, J., y Houde, R. A. (1996). Acoustic correlates of
571–583. https://doi.org/10.1177/0003489416636131 breathy vocal quality: Dysphonic voices and continuous
Boersma, P., y Weenink, D. (2016). Praat: Doing phonetics by speech. Journal of Speech, Language, and Hearing Research,
computer [programa informático, versión 6.0.22]. http:// 39, 311–321. https://doi.org/10.1044/jshr.3902.311
www.praat.org/. Hirano, M. (1981). Psycho-acoustic evaluation of voice. En G.
Brinca, L. F., Batista, A. P. F., Tavares, A. I., Gonçalves, I. C., E. Arnold, F. Winckel y B. D. Wyke (Eds.), Disorders of
y Moreno, M. L. (2014). Use of cepstral analyses for dif- Human Communication 5. Clinical Examination of Voice
ferentiating normal from dysphonic voices: A compara- (pp. 81–84). Vienna: Springer.
tive study of connected speech versus sustained vowel in Hochmuth, S., Brand, T., Zokoll, M. A., Zenker Castro, F.,
European Portuguese female speakers. Journal of Voice, 28, Wardenga, N., y Kollmeier, B. (2012). A Spanish matrix
282–286. https://doi.org/10.1016/j.jvoice.2013.10.001 sentence test for assessing speech reception thresholds in
Cecconello, L., Farías, P., y Gurlekian, J. A. (2008). Aplicación del noise. International Journal of Audiology, 51, 536–544.
cepstrum en la clínica vocal. Revista de la Federación Argentina https://doi.org/10.3109/14992027.2012.670731
de Sociedades de Otorrinolaringología. Edición especial, 30.º Kreiman, J., Gerratt, B. R., Kempster, G. B., Erman, A., y
Congreso Argentino de Otorrinolaringología, 15(1), 12–14. Berke, G. S. (1993). Perceptual evaluation of voice qual-
Dejonckere, P. H. (1998). Cepstral voice analysis: Link with per- ity: Review, tutorial, and a framework for future research.
ception and stroboscopy. Revue de Laryngologie, Otologie, Journal of Speech, Language, and Hearing Research, 36,
Rhinologie (Bord), 119, 245–246. 21–40. https://doi.org/10.1044/jshr.3601.21
Dejonckere, P. H., y Wieneke, G. (1996). Cepstra of normal and Krom, G. de (1993). A cepstrum-based technique for determin-
pathological voices in correlation with acoustic, aerody- ing a harmonics-to- noise ratio in speech signals. Journal
namic and perceptual data. En M. J. Ball y M. Duckworth of Speech, Langauge, and Hearing Research, 36, 254–266.
(Eds.), Advances in Clinical Phonetics Vol. 6. (pp. 217–226). https://doi.org/10.1044/jshr.3602.254
Amsterdam: John Benjamins. https://doi.org/10.1075/sspcl. Landis, J. R., y Koch, G. G. (1977). The measurement of
6.13dej observer agreement for categorical data. Biometrics, 33,
Delgado, J., León, N. M., Jiménez, A., e Izquierdo, L. M. (2017). 159–174. https://doi.org/10.2307/2529310
Análisis acústico de la voz: medidas temporales, espec- Latoszek, B. B., Maryn, Y., Gerrit, E., y De Bodt, M. (2017). The
trales y cepstrales en la voz normal con el Praat en una Acoustic Breathiness Index (ABI): A multivariate acoustic
muestra de hablantes de español. Revista de Investigación model for breathiness. Journal of Voice, 31, 511e11- 511e27.
en Logopedia, 7(2), 108–127. https://doi.org/10.1016/j.jvoice.2016.11.017
Delgado-Hernández, J., León-Gómez, N. M., Izquierdo- Maryn, Y., Corthals, P., Van Cauwenberge, P., Roy, N., y De
Arteaga, L. M., y Llanos-Fumero, Y. (2018). Análisis Bodt, M. (2010). Toward improved ecological validity in the
cepstral de la voz normal y patológica en adultos espa- acoustic measurement of overall voice quality: Combining
ñoles. Medida de la prominencia del pico cepstral sua- continuous speech and sustained vowels. Journal of Voice,
vizado en vocales sostenidas versus habla conectada. Acta 24, 540–555. https://doi.org/10.1016/j.jvoice.2008.12.014
Otorrinolaringológica Española, 69, 134–140. https://doi. Maryn, Y., De Bodt, M., Barsties, B., y Roy, N. (2014). The
org/10.1016/j.otorri.2017.05.006 value of the Acoustic Voice Quality Index as a measure
Deliyski, D. D., Shaw, H. S., y Evans, M. K. (2005). Adverse of dysphonia severity in subjects speaking different lan-
effects of environmental noise on acoustic voice quality guages. European Archives of Oto-Rhino-Laryngology, 271,
measurements. Journal of Voice, 19(1), 15–28. https://doi. 1609–1619.
org/10.1016/j.jvoice.2004.07.003 Maryn, Y., De Bodt, M., y Roy, N. (2010). The Acoustic Voice
Deliyski, D. D., Shaw, H. S., Evans, M. K., y Vesselinov, R. (2006). Quality Index: Toward improved treatment outcomes assess-
Regression tree approach to studying factors influencing ment in voice disorders. Journal of Communication Disorders,
acoustic voice analysis. Folia Phoniatrica et Logopaedica, 43, 161–174. https://doi.org/10.1016/j.jcomdis.2009.12.004
58, 274–288. https://doi.org/10.1159/000093184 Maryn, Y., Roy, N., De Bodt, M., Van Cauwenberge, P., y
Eadie, T. L., y Baylor, C. R. (2006). The effect of perceptual Corthals, P. (2009). Acoustic measurement of overall voice
training on inexperienced listeners’ judgments of dys- quality: A meta-analysis. Journal of the Acoustic Society of
phonic voice. Journal of Voice, 20, 527–544. https://doi. America, 126, 2619–2634. https://doi.org/10.1121/1.3224706
org/10.1016/j.jvoice.2005.08.007 Portney, L. G., y Watkins, M. P. (2000). Foundations of clinical
Everitt, B. S. (2002). The Cambridge Dictionary of Statistics. 2nd research: Applications to practice, 2nd ed. Upper Saddle
ed. New York: Cambridge University Press. River, NJ: Prentice Hall.
Fleiss, J. L. (1971). Measuring nominal scale agreement among Sauder, C., Bretl, M., y Eadie, T. (2017). Predicting voice disor-
many raters. Psychological Bulletin, 76, 378–382. https:// der status from smoothed measures of cepstral peak prom-
doi.org/10.1037/h0031619 inence using Praat and Analysis of Dysphonia in Speech
Heman-Ackah, Y. D., Michael, D. D., Baroody, M. M., Ostrowski, and Voice (ADSV). Journal of Voice, 31, 557–566. https://
R., Hillenbrand, J., Heuer, R. J., … y Staloff, R. T. (2003). doi.org/10.1016/j.jvoice.2017.01.006
Cepstral peak prominence: A more reliable measure of dys- Wolfe, V., y Martin, D. (1997). Acoustic correlates of dysphonia:
phonia. Annals of Otology, Rhinology & Laryngology, 112, Type and severity. Journal of Communication Disorders, 30,
324–333. https://doi.org/10.1177/000348940311200406 403–415. https://doi.org/10.1016/S0021-9924(96)00112-8
Heman-Ackah, Y. D., Michael, D. D., y Goding, G. S. Jr. (2002). Wolfe, V. I., Martin, D. P., y Palmer, C. I. (2000). Perception
The relationship between cepstral peak prominence and of dysphonic voice quality by naive listeners. Journal of
selected parameters of dysphonia. Journal of Voice, 16, Speech, Language, and Hearing Research, 43, 697–705.
20–27. https://doi.org/10.1016/S0892-1997(02)00067-X https://doi.org/10.1044/jslhr.4303.697
Heman-Ackah, Y. D., Sataloff, R. T., Laureyns, G., Lurie, D., Wuyts, F. L., De Bodt, M. S., Molenberghs, G., Remacle, M.,
Michael, D. D., Heuer, R., … y Hillenbrand, J. (2014). Heylen, L., Millet, B., ... y Van de Heyning, P. H. (2000).
Quantifying the cepstral peak prominence, a measure of The Dysphonia Severity Index: An objective measure of
dysphonia. Journal of Voice, 28, 783–788. https://doi. vocal quality based on a multiparameter approach. Journal
org/10.1016/j.jvoice.2014.05.005 of Speech, Language, and Hearing Research, 43, 796–809.
Hernández, J. D., León-Gómez, M. L., Jiménez, A., Izquierdo, https://doi.org/10.1044/jslhr.4303.796
L. M., y Latoszek, B. B. v. (2018). Validation of the Yiu, E., Worrall, L., Longland, J., y Mitchell, C. (2000).
Acoustic Voice Quality Index Version 03.01 and the Analysing vocal quality of connected speech using Kay’s
Acoustic Breathiness Index in the Spanish language. Annals Computerized Speech Lab: a preliminary finding. Clinical
of Otology, Rhinology & Laryngology, 127, 317–326. https:// Linguistics & Phonetics, 14(4), 295–305. https://doi.
doi.org/10.1177/0003489418761096 org/10.1080/02699200050023994