Precisindiagnsticadel CPPS

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 7

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/331072441

Precisión diagnóstica del pico cepstral de mayor prominencia en el cepstrum


suavizado (CPPS) en la detección de la disfonía en español

Article · January 2019


DOI: 10.3989/loquens.2019.058

CITATIONS READS

0 182

3 authors, including:

Jonathan Delgado Hernández Nieves Gómez León


CREN Salud Universtity OF uam. Madrid Spain
28 PUBLICATIONS 77 CITATIONS 71 PUBLICATIONS 819 CITATIONS

SEE PROFILE SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Síndrome de Wolf-Hirschhorn: Intervención en el habla y el lenguaje View project

Validation of the Acoustic Voice Quality Index version 03.01 and the Acoustic Breathiness Index in the Spanish language View project

All content following this page was uploaded by Jonathan Delgado Hernández on 04 March 2019.

The user has requested enhancement of the downloaded file.


Loquens 6(1)
January 2019, e058
eISSN 2386-2637
https://doi.org/10.3989/loquens.2019.058

Precisión diagnóstica del pico cepstral de mayor


prominencia en el cepstrum suavizado (CPPS)
en la detección de la disfonía en español

Jonathan Delgado-Hernández1, Nieves León-Gómez2 y Alejandra Jiménez-Álvarez2


1
CREN Salud (España)
2
Hospital Universitario de Canarias (España)
[email protected] ORCID: https://orcid.org/0000-0002-4552-8920
[email protected] ORCID: https://orcid.org/0000-0001-6785-9774
[email protected] ORCID: https://orcid.org/0000-0002-8837-3113

Enviado: 06/08//2018. Aceptado: 16/11/2018; Publicado online: 27/02/2019

Citation / Cómo citar este artículo: Jonathan Delgado-Hernández, Nieves León-Gómez y Alejandra Jiménez-Álvarez.
(2019). Precisión diagnóstica del pico cepstral de mayor prominencia en el cepstrum suavizado (CPPS) en la detección de la
disfonía en español. Loquens, 6(1), e058. https://doi.org/10.3989/loquens.2019.058

RESUMEN: Los parámetros derivados de la métrica cepstral son cada vez más utilizados en la evaluación acústica
de la voz, ya sea como medidas únicas o como parte de índices multivariados. El pico cepstral de mayor prominencia
en el cepstrum suavizado (CPPS) ha demostrado en multitud de estudios ser la única medida acústica con la suficiente
validez concurrente en la evaluación de la severidad de las alteraciones de la voz tanto en muestras de vocal sostenida
como en muestras de habla continua.
El objetivo de este trabajo es conocer la precisión diagnóstica del CPPS en la detección de la disfonía en español.
Se utilizó la configuración que viene por defecto en Praat y la usada en el cálculo del Acoustic Voice Quality Index.
Los resultados confirman que el CPPS es una medida acústica válida para detectar la disfonía en español tanto con
vocal sostenida como con frases.
Palabras clave: análisis acústico de la voz; CPPS; disfonía; Praat.

ABSTRACT: Diagnostic accuracy of the Smoothed Cepstral Peak Prominence (CPPS) in the detection of dysphonia
in the Spanish language.–The smoothed cepstral peak prominence (CPPS) is an acoustic measure that can be calcu-
lated in both sustained vowels and continuous speech. The goal of this work is to find out the diagnostic accuracy of
CPPS in the detection of dysphonia in Spanish.
In this study 136 subjects with dysphonia and 47 healthy subjects participated. For each subject a sustained vowel
and the reading of three phonetically balanced sentences were recorded. The CPPS was calculated with Praat using
its default configuration (configuration 1), and also with the one used in the calculation of the Acoustic Voice Quality
Index (configuration 2). Five experts perceptively assessed the voice of the subjects in the sample by means of the
GRABS scale.
The CPPS has a great power of discrimination between the normal and the pathological voice, whether it is calcu-
lated from the sustained vowel /a/ (AROC[config. 1] = 0.863 and AROC[config. 2] = 0.841) or whether it is calculated from the
sentences (AROC[config. 1] = 0.884 and AROC[config. 2] = 0.866).
The results confirm that CPPS is a valid acoustic measurement to detect dysphonia in the Spanish language.
Keywords: acoustic voice analysis; CPPS; dysphonia; Praat.

Copyright: © 2019 CSIC. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia de uso y distribución Creative
Commons Reconocimiento 4.0 Internacional (CC BY 4.0).
2 • Jonathan Delgado-Hernández, Nieves León-Gómez y Alejandra Jiménez-Álvarez

1. INTRODUCCIÓN Figura 1: Representación gráfica del cepstrum y


del cálculo del CPPS.
El análisis acústico nos aporta información objetiva
sobre la voz del paciente de manera no invasiva. Los pará-
metros derivados de la métrica cepstral son cada vez más
utilizados en la evaluación acústica de la voz, ya sea como
medidas únicas (Awan y Roy, 2006; Balasubramanium,
Bhat, Fahim y Raju, 2011; Dejonckere, 1998; Dejonckere
y Wieneke, 1996; Delgado, León, Jiménez y Izquierdo,
2017; Delgado-Hernández, León-Gómez, Izquierdo-
Arteaga y Llanos-Fumero, 2018; Eadie y Baylor, 2006;
Heman-Ackah et al., 2003; Heman-Ackah, Michael y
Goding, 2002; Heman-Ackah et al., 2014; Hillenbrand,
Cleveland y Erickson, 1994; Hillenbrand y Houde, 1996;
de Krom, 1993; Maryn, Roy, de Bodt, Van Cauwenberge
y Corthals, 2009; Sauder, Bretl y Eadie, 2017; Wolfe y
Martin, 1997; Wolfe, Martin y Palmer, 2000) o como
parte de índices multivariados (Barsties y Maryn, 2015;
Barsties y Maryn, 2016; Hernández, Gómez, Jiménez,
Izquierdo y Latoszek, 2018; Latoszek, Maryn, Gerrits
y de Bolt, 2017; Maryn, De Bolt, Barsties y Roy, 2014; Heman-Ackah et al., 2003; Heman-Ackah, Michael y
Maryn, De Bolt y Roy, 2010). El cepstrum es la trans- Goding, 2002; Hillenbrand, Cleveland y Erickson, 1994;
formada inversa de Fourier del logaritmo de la potencia Hillenbrand y Houde, 1996; de Krom, 1993; Maryn
espectral de la señal (Awan, 2008). El análisis cepstral et al., 2009; Wolfe y Martin, 1997; Wolfe, Martin y
permite determinar la frecuencia fundamental (f0) a par- Palmer, 2000).
tir de la periodicidad del componente armónico de un El objetivo de este trabajo es conocer la precisión diag-
sonido, representado por el pico cepstral de la región alta nóstica del CPPS en la detección de la disfonía en español.
del cepstrum. La amplitud del pico de cepstrum da infor- Para ello se estudiarán los valores del CPPS obtenidos a
mación del grado de periodicidad de la señal de más baja través de vocales sostenidas y frases, así como diferentes
frecuencia en relación con otros componentes periódicos configuraciones para el cálculo de esta medida en Praat.
o ruidosos presentes (Cecconello, Farías y Gurlekian,
2008). Por tanto, no necesita de la detección exacta de 2. MATERIAL Y MÉTODO
los ciclos de la f0, una ventaja importante sobre todo en el
análisis de las voces más disfónicas o aperiódicas, donde 2.1. Sujetos
los programas de detección automática no pueden extraer
de forma fiable la f0. Con relación al tipo de muestra de En este estudio participaron voluntariamente 183 suje-
voz, el análisis cepstral se puede utilizar tanto con vocales tos hablantes de español: 136 sujetos disfónicos con
sostenidas como con habla continua, aportando validez distintos grados de severidad y diferentes etiologías
ecológica a la evaluación acústica (Delgado-Hernández valorados otorrinolaringológicamente y 47 sujetos nor-
et al., 2018). Maryn et al. (2009) realizaron un metaa- mofónicos sin antecedentes de patología vocal. En total
nálisis donde estudiaron 69 medidas acústicas en vocal participaron 56 hombres con una media de edad de
sostenida y 26 en habla continua. Encontraron que el pico 47.83 años (DT 16.04) y 127 mujeres con una media de
cepstral de mayor prominencia en el cepstrum suavizado edad de 44.81 años (DT 14.26). En la Tabla 1 se resume
(smoothed cepstral peak prominence o CPPS) fue la única los detalles del grupo disfónico.
medida acústica estudiada con la suficiente validez con-
currente en la evaluación de la severidad de la disfonía en 2.2. Grabación de las voces
ambas muestras de voz.
El CPPS es una medida acústica cepstral que repre- Se obtuvieron dos muestras de voz diferentes para
senta la diferencia entre el pico cepstral más prominente, cada sujeto de estudio, un total de 366 muestras: una vocal
o primer rahmonic, y el punto con la misma quefrency sostenida /a/ durante 3 segundos aproximadamente y la
sobre la línea de regresión a través del cepstrum suavi- lectura en voz alta de tres frases fonéticamente balancea-
zado (Figura 1). Se expresa en decibelios (dB). das del Spanish matrix sentences test (Hochmuth, Brand,
Los estudios realizados hasta el momento muestran Zokoll, Zenker Castro, Wardenga y Kollmeier, 2012).
su utilidad tanto en el diagnóstico de las alteraciones Se escogieron las tres frases utilizadas en el ­estudio de
de la voz (Heman-Ackah et al., 2014; Sauder, Bretl y Hernández et al. (2018), con un total de 33 sílabas. Las
Eadie, 2017) como en la evaluación de la severidad de voces fueron grabadas con un micrófono de condensa-
la disfonía (Awan y Roy, 2006; Balasubramanium et al., dor de diadema AKG C544L y un interfaz de audio ale-
2011; Dejonckere, 1998; Dejonckere y Wieneke, 1996; sis i/o2 express. Se utilizó el programa Praat (Boersma y
Delgado-Hernández et al., 2018; Eadie y Baylor, 2006; Weenink, 2016, v. 5.4.04) con una frecuencia de muestreo

Loquens, 6(1), January 2019, e058, eISSN 2386-2637 https://doi.org/10.3989/loquens.2019.058


Precisión diagnóstica del pico cepstral de mayor prominencia • 3

Tabla 1: Datos descriptivos del grupo disfónico. calibrado PCE-322A. Cada evaluador pudo escuchar cada
grabación las veces que fueran necesarias hasta tener una
Patología del grupo disfónico Número de pacientes decisión final. Para evaluar la fiabilidad intra-evaluador
Disfonía funcional 37 se utilizó la metodología usada en el trabajo de Hernández
et al. (2018), donde se estudia la precisión diagnóstica y
Nódulo 33
la validez concurrente del Acoustic Voice Quality Index
Edema 18 v. 03.01 y el Acoustic Breathiness Index en español. Se
Quiste 9 seleccionaron al azar 19 grabaciones, aproximadamente
Parálisis 8 el 10 % de las 183 muestras. Estas grabaciones se vol-
Presbifonía 5 vieron a presentar al finalizar la evaluación perceptiva
sin informar al evaluador que eran muestras repetidas.
Sulcus vocalis 5
Para controlar factores como la fatiga, la atención y la
Pólipo 4 concentración se realizaron pausas cada 25 muestras de
Disfonía espasmódica 4 voz siguiendo la recomendación de Kreiman, Gerratt,
Laringitis crónica 3 Kempster, Erman y Berke (1993).
Post-cirugía 3
2.4. Análisis acústico
Tumor 2
Trauma 1 Se obtuvieron con el programa Praat (Boersma y
Laringitis aguda 1 Weenink, 2016, v. 5.4.04) los valores del CPPS (en dB)
Leucoplasia 1 de todos los sujetos de la muestra tanto en las grabaciones
Otros trastornos benignos de la voz 2 de la vocal sostenida como en las de las frases. Para el
cálculo del CPPS se utilizaron dos configuraciones dife-
rentes. La primera (CPPSconf.1) es la que viene por defecto
en Praat. La segunda (CPPSconf.2) es la utilizada en el
de 44.1 Khz y 16 bits de resolución. En todos los audios cálculo del Acoustic Voice Quality Index, versión 03.01
fue calculada post hoc la ratio señal-ruido (signal-to- (Barsties y Maryn, 2016).
noise ratio [SNR]) propuesta por Deliyski, Shaw y Evans
(2005) y Deliyski, Shaw, Evans y Vesselinov (2006). Se 2.5. Análisis estadístico
incluyeron en el estudio las grabaciones con los valores
de SNR recomendados para el análisis acústico, es decir, El análisis estadístico se realizó con el programa
los superiores a 30 dB (Deliyski, Shaw y Evans, 2005). SPSS (v. 21.0), excepto la fiabilidad intra-evaluador e
inter-­evaluadores, que fue analizada mediante el programa
2.3. Evaluación acústico-perceptual R Studio (v. 3.0.1).
La fiabilidad intra-evaluador se calculó a través del
Para la evaluación acústico-perceptiva se utilizó la coeficiente kappa de Cohen (Ck). Este estadístico aporta
combinación de la grabación de las frases y de la vocal un índice de acuerdo entre dos jueces o dos calificacio-
sostenida de cada sujeto con un segundo de silencio entre nes; en este caso, el grado de acuerdo entre la puntuación
ellas, con el objetivo de obtener el mayor grado de repre- del parámetro G de la escala acústico-perceptiva en las 19
sentación de la voz diaria de los sujetos del estudio. Cinco muestras repetidas de cada evaluador. Los valores varían
logopedas expertos en rehabilitación de la voz (con una de 0 a 1, donde Ck = 1 correspondería a un acuerdo per-
experiencia media de 10.6 años) evaluaron perceptual- fecto y Ck = 0, a un acuerdo explicable por la casualidad
mente la calidad de la voz de los sujetos de la muestra a (Everitt, 2002). El Ck se considera razonablemente fiable
través de la escala GRABS (Hirano, 1981). En esta escala con valores superiores a 0.41 porque este valor presenta
perceptiva se puntúa de 0 a 3 la severidad de 5 parámetros: una fuerza de acuerdo moderada (Landis y Koch, 1977)
G (grade) indica el grado de afectación general y global Para evaluar la fiabilidad inter-evaluadores se calculó
de la voz; R (roughness) muestra el grado de ronquera el coeficiente kappa de Fleiss (Fk) (Fleiss, 1971), que es
de la voz; A (asthenics) indica el grado de astenia, fatiga una extensión del Ck para más de dos jueces/evaluadores.
o cansancio detectado en la voz; B (breathiness) revela Al igual que el Ck, el Fk se consideró razonablemente
la pérdida de aire a través de las cuerdas, la voz aérea o fiable a partir del valor 0.41 (Landis y Koch, 1977).
soplada, y S (strain) indica el grado de tensión o dureza La precisión diagnóstica del CPPS se evaluó por su
de la voz. Cada evaluador puntuó el grado de calidad glo- sensibilidad (la probabilidad de obtener un resultado
bal de la voz de cada sujeto (G) siguiendo la recomenda- ­positivo cuando el individuo es disfónico) y especificidad
ción de Wuyts et al. (2000) (G0 = normal o ausencia de (la probabilidad de obtener un resultado negativo cuando
alteración; G1 = alteración ligera; G2 = alteración mode- el individuo no es disfónico). Esta relación entre sensi-
rada; G3 = alteración severa). Las grabaciones se pre- bilidad y especificidad puede representarse gráficamente
sentaron individualmente con auriculares Beyerdynamic generando la curva característica operativa del recep-
DT 770 PRO 80Ω en una habitación con un nivel de ruido tor (receiver operating characteristic, ROC). La tasa
ambiental por debajo de 40 dBA, medido por un sonómetro de verdaderos positivos (sensibilidad) se muestra en la

Loquens, 6(1), January 2019, e058, eISSN 2386-2637 https://doi.org/10.3989/loquens.2019.058


4 • Jonathan Delgado-Hernández, Nieves León-Gómez y Alejandra Jiménez-Álvarez

ordenada y, la tasa de falsos positivos (1– especificidad), 3.2. Estadística descriptiva


en la abscisa. Siguiendo la recomendación de Barsties y
Maryn (2016) se consideraron voces normales todas las En la Tabla 2 se muestra la estadística descriptiva
que presentaron una media en la calificación de la escala de los valores del CPPS con las dos configuraciones
­perceptiva menor a 0.5 (Gmedia < 0.5) y voces disfónicas estudiadas. Se puede observar valores sistemáticamente
todas aquellas que presentaban una media mayor o igual a más altos en la CPPSconf.1 tanto con la vocal sostenida
0.50 en la evaluación perceptiva (Gmedia ≥ 0.50 a ≤ 3). como con las frases. La diferencia entre los valores
Para estimar el poder de discriminación del CPPS medios del CPPS de las dos configuraciones del total
entre voz normal y patológica se usó el área bajo de la de la muestra fue de 9.76 dB en la vocal y de 9.63 dB
curva ROC (AROC). Un valor de AROC = 1 correspondería a en las frases.
una prueba perfecta, es decir, que clasificaría al 100 % de
los disfónicos como disfónicos y al 100 % de los normo- 3.3. Precisión diagnóstica
fónicos como sujetos exentos de alteración en la voz. Con
un valor de AROC = 0.5 existiría la misma probabilidad de Se utilizaron curvas ROC para evaluar la preci-
clasificar a un sujeto con alteraciones en la voz como sano sión diagnostica del CPPS, es decir, la capacidad de
que como disfónico (Portney y Watkins, 2000). esta medida de distinguir entre voces patológicas y
Dependiendo del umbral de CPPS escogido para con- normales.
siderar una voz como disfónica pueden variar tanto la sen- Los resultados muestran que el CPPS es una medida
sibilidad como la especificidad de esta medida acústica. acústica con una buena capacidad para distinguir entre
Por ello, el umbral óptimo de CPPS fue calculado a través voces normales y patológicas (Tabla 3).
del índice Youden (la coordenada con el máximo de sen- En vocales sostenidas se obtuvo una AROC de 0.863
sibilidad + especificidad – 1). con la CPPSconf.1 y de 0.841 con la CPPSconf.2 (Figura 3). El
umbral óptimo para el CPPS, calculado a través del índice
3. RESULTADOS Youden, fue de 23.62 dB para el CPPSconf.1 y de 13.96 dB
para el CPPSconf.2.
3.1. Fiabilidad intra e inter-evaluador En habla continua se obtuvo una AROC de 0.884 con
el CPPSconf.1 y de 0.866 con el CPPSconf.2 (Figura 3). Los
La fiabilidad de los cinco evaluadores se evaluó a partir umbrales con mejor balance entre sensibilidad y especifi-
de las puntuaciones del parámetro G de la escala acústico-­ cidad fueron de 18.40 dB para el CPPSconf.1 y de 8.37 dB
perceptiva. Los valores del Ck se encuentran entre 0.55 y para el CPPSconf.2.
0.71 (media = 0.618), lo que demuestra una fiabilidad
intra-evaluador aceptable en todos los evaluadores (Landis
y Koch, 1977). Por otro lado, se obtuvo un valor de Fk de Tabla 2: Medias (M) y desviaciones típicas (DT) del CPPS
0.434, lo que indica que la evaluación acústico-­perceptiva (en dB).
presenta una suficiente fiabilidad inter-evaluador (Landis
y Koch, 1977). La Figura 2 muestra la frecuencia del pará- Vocal Frases
metro Gmedia valorado por los cinco evaluadores. Grupo Conf.1 Conf.2 Conf.1 Conf.2
Normofónicos (M) 26.09 15.22 19.16 9.42
Figura 2: Distribución de la frecuencia de la puntuación
de la escala acústico-perceptiva (media de la puntuaciones Normofónicos (DT) 2.94 2.39 0.95 0.99
del parámetro G de los cinco evaluadores) Disfónicos (M) 21.75 12.37 17.28 7.69
de las 183 muestras de voz.
Disfónicos (DT) 3.91 3.13 1.51 1.63
Total (M) 22.86 13.10 17.77 8.14
Total (DT) 4.14 3.20 1.61 1.67

Tabla 3: Valores del área bajo la curva ROC del CPPS


y umbrales patológicos con el balance de sensibilidad y
especificidad.

Vocal Frases

Conf.1 Conf.2 Conf.1 Conf.2


AROC 0.863 0.841 0.884 0.866
Umbral (dB) 23.62 13.96 18.40 8.37
Sensibilidad 87.5% 76.8% 82.1% 89.3%
Especificidad 75.6% 77.2% 86.6% 70.9%

Loquens, 6(1), January 2019, e058, eISSN 2386-2637 https://doi.org/10.3989/loquens.2019.058


Precisión diagnóstica del pico cepstral de mayor prominencia • 5

Figura 3: Curvas ROC del CPPS en la vocal (izquierda) y en las frases (derecha).

4. DISCUSIÓN Por último, un aspecto importante a tener en cuenta en


la interpretación de esta medida acústica es la configura-
El objetivo de este trabajo fue conocer la precisión ción elegida en Praat (Delgado et al., 2017). Los resulta-
diagnóstica del CPPS en la detección de la disfonía en dos de este trabajo muestran que el umbral por debajo del
español. cual se puede determinar la voz patológica es aproxima-
Se ha demostrado en multitud de estudios la alta damente 10 dB menos en el CPPSconf.2, tanto en vocales
correlación del CPPS con el grado de severidad de la (CPPSconf.1 = 23.62 dB, CPPSconf.2 = 13.96 dB) como en
disfonía (Awan y Roy, 2006; Balasubramanium et al., habla continua (CPPSconf.1 = 18.40 dB, CPPSconf.2 = 8.37 dB).
2011; Dejonckere, 1998; Dejonckere y Wieneke, 1996;
Delgado-Hernández et al., 2018; Eadie y Baylor, 2006; 5. CONCLUSIONES
Heman-Ackah et al., 2003; Heman-Ackah, Michael y
Goding, 2002; Hillenbrand, Cleveland y Erickson, 1994; Los resultados del presente estudio confirman que el
Hillenbrand y Houde, 1996; de Krom, 1993; Maryn et al., CPPS es una medida acústica válida para detectar las alte-
2009; Wolfe y Martin, 1997; Wolfe, Martin y Palmer, raciones en la voz en español, tanto con vocal sostenida
2000). A medida que se incrementa la severidad de las como con frases.
alteraciones en la voz, disminuye el valor del CPPS y
viceversa. Las voces más periódicas muestran una con- NOTA ACLARATORIA
figuración armónica bien definida dentro del espectro y,
por tanto, un pico cepstral más prominente. Por el con- Este trabajo es la continuación del artículo «Análisis
trario, las voces de menor calidad vocal presentan una cepstral de la voz normal y patológica en adultos espa-
disminución de este pico cepstral (Delgado-Hernández ñoles. Medida de la prominencia del pico cepstral sua-
et al., 2018). vizado en vocales sostenidas versus habla conectada»,
Respecto a la capacidad del CPPS para detectar la voz publicado en la Revista Otorrinolaringológica Española
patológica, los resultados de este trabajo muestran una gran (número 69, pp. 134-140), donde se examinaba la validez
precisión diagnóstica de esta medida acústica en vocales concurrente de esta medida acústica en la evaluación de la
sostenidas (AROC[config.1] = 0.863 y AROC[config.2] = 0.841) y en severidad de la disfonía.
habla continua (AROC[config.1] = 0.884 y AROC[config.2] = 0.866).
El CPPS obtenido a partir de las frases tiene un mayor REFERENCIAS
poder discriminatorio entre voz la normal y patológica
que el obtenido a partir de vocales. El CPPS en habla con- Awan, S. N. (2008). Instrumental analysis of phonation. En M.
tinua está condicionado por el tipo de muestra de habla J. Ball, M. R. Perkins, N. Müller y S. Howard (Eds.), The
handbook of clinical linguistics (p. 347). Oxford: Blackwell.
utilizada, por las variedades dialectales y por la fluidez https://doi.org/10.1002/9781444301007.ch21
lectora de la muestra de estudio (Brinca, Batista, Tavares, Awan, S. N., y Roy, N. (2006). Toward the development of an
Gonçalves y Moreno, 2014), por lo que es recomenda- objective index of dysphonia severity: A four-factor acous-
tic model. Clinical Linguistics & Phonetics, 20, 35–49.
ble la validación de esta medida acústica en los diferentes https://doi.org/10.1080/02699200400008353
idiomas. El umbral obtenido en español en este trabajo a Balasubramanium, R. K., Bhat, J. S., Fahim III, S., y Raju III,
partir de la configuración 1 es muy similar al encontrado R. (2011). Cepstral analysis of voice in unilateral adductor
por Sauder, Breatl y Eadie (2017) en lengua inglesa con la vocal fold palsy. Journal of Voice, 25(3), 326–329. https://
doi.org/10.1016/j.jvoice.2009.12.010
misma configuración (umbral español = 18.40 dB; umbral Barsties, B., y Maryn, Y. (2015). The improvement of inter-
inglés = 19.10 dB). nal consistency of the Acoustic Voice Quality Index.

Loquens, 6(1), January 2019, e058, eISSN 2386-2637 https://doi.org/10.3989/loquens.2019.058


6 • Jonathan Delgado-Hernández, Nieves León-Gómez y Alejandra Jiménez-Álvarez

American Journal of Otolaryngology, 36(5), 647–656. Hillenbrand, J., Cleveland, R. A., y Erickson, R. L. (1994).
https://doi.org/10.1016/j.amjoto.2015.04.012 Acoustic correlates of breathy vocal quality. Journal of
Barsties, B., y Maryn, Y. (2016). External validation of the Acoustic Speech, Language, and Hearing Research, 37, 769–778.
Voice Quality Index version 03.01 with extended representa- https://doi.org/10.1044/jshr.3704.769
tivity. Annals of Otology, Rhinology & Laryngology, 125(7), Hillenbrand, J., y Houde, R. A. (1996). Acoustic correlates of
571–583. https://doi.org/10.1177/​0003489416636131 breathy vocal quality: Dysphonic voices and continuous
Boersma, P., y Weenink, D. (2016). Praat: Doing phonetics by speech. Journal of Speech, Language, and Hearing Research,
computer [programa informático, versión 6.0.22]. http:// 39, 311–321. https://doi.org/10.1044/jshr.3902.311
www.praat.org/. Hirano, M. (1981). Psycho-acoustic evaluation of voice. En G.
Brinca, L. F., Batista, A. P. F., Tavares, A. I., Gonçalves, I. C., E. Arnold, F. Winckel y B. D. Wyke (Eds.), Disorders of
y Moreno, M. L. (2014). Use of cepstral analyses for dif- Human Communication 5. Clinical Examination of Voice
ferentiating normal from dysphonic voices: A compara- (pp. 81–84). Vienna: Springer.
tive study of connected speech versus sustained vowel in Hochmuth, S., Brand, T., Zokoll, M. A., Zenker Castro, F.,
European Portuguese female speakers. Journal of Voice, 28, Wardenga, N., y Kollmeier, B. (2012). A Spanish matrix
282–286. https://doi.org/10.1016/j.jvoice.2013.10.001 sentence test for assessing speech reception thresholds in
Cecconello, L., Farías, P., y Gurlekian, J. A. (2008). Aplicación del noise. International Journal of Audiology, 51, 536–544.
cepstrum en la clínica vocal. Revista de la Federación Argentina https://doi.org/10.3109/14992027.2012.670731
de Sociedades de Otorrinolaringología. Edición especial, 30.º Kreiman, J., Gerratt, B. R., Kempster, G. B., Erman, A., y
Congreso Argentino de Otorrinolaringología, 15(1), 12–14. Berke, G. S. (1993). Perceptual evaluation of voice qual-
Dejonckere, P. H. (1998). Cepstral voice analysis: Link with per- ity: Review, tutorial, and a framework for future research.
ception and stroboscopy. Revue de Laryngologie, Otologie, Journal of Speech, Language, and Hearing Research, 36,
Rhinologie (Bord), 119, 245–246. 21–40. https://doi.org/10.1044/jshr.3601.21
Dejonckere, P. H., y Wieneke, G. (1996). Cepstra of normal and Krom, G. de (1993). A cepstrum-based technique for determin-
pathological voices in correlation with acoustic, aerody- ing a harmonics-to- noise ratio in speech signals. Journal
namic and perceptual data. En M. J. Ball y M. Duckworth of Speech, Langauge, and Hearing Research, 36, 254–266.
(Eds.), Advances in Clinical Phonetics Vol. 6. (pp. 217–226). https://doi.org/10.1044/jshr.3602.254
Amsterdam: John Benjamins. https://doi.org/10.1075/sspcl.​ Landis, J. R., y Koch, G. G. (1977). The measurement of
6.13dej observer agreement for categorical data. Biometrics, 33,
Delgado, J., León, N. M., Jiménez, A., e Izquierdo, L. M. (2017). 159–174. https://doi.org/10.2307/2529310
Análisis acústico de la voz: medidas temporales, espec- Latoszek, B. B., Maryn, Y., Gerrit, E., y De Bodt, M. (2017). The
trales y cepstrales en la voz normal con el Praat en una Acoustic Breathiness Index (ABI): A multivariate acoustic
muestra de hablantes de español. Revista de Investigación model for breathiness. Journal of Voice, 31, 511e11- 511e27.
en Logopedia, 7(2), 108–127. https://doi.org/10.1016/j.jvoice.2016.11.017
Delgado-Hernández, J., León-Gómez, N. M., Izquierdo- Maryn, Y., Corthals, P., Van Cauwenberge, P., Roy, N., y De
Arteaga, L. M., y Llanos-Fumero, Y. (2018). Análisis Bodt, M. (2010). Toward improved ecological validity in the
cepstral de la voz normal y patológica en adultos espa- acoustic measurement of overall voice quality: Combining
ñoles. Medida de la prominencia del pico cepstral sua- continuous speech and sustained vowels. Journal of Voice,
vizado en vocales sostenidas versus habla conectada. Acta 24, 540–555. https://doi.org/10.1016/j.jvoice.2008.12.014
Otorrinolaringológica Española, 69, 134–140. https://doi. Maryn, Y., De Bodt, M., Barsties, B., y Roy, N. (2014). The
org/10.1016/j.otorri.2017.05.006 value of the Acoustic Voice Quality Index as a measure
Deliyski, D. D., Shaw, H. S., y Evans, M. K. (2005). Adverse of dysphonia severity in subjects speaking different lan-
effects of environmental noise on acoustic voice quality guages. European Archives of Oto-Rhino-Laryngology, 271,
measurements. Journal of Voice, 19(1), 15–28. https://doi. 1609–1619.
org/10.1016/j.jvoice.2004.07.003 Maryn, Y., De Bodt, M., y Roy, N. (2010). The Acoustic Voice
Deliyski, D. D., Shaw, H. S., Evans, M. K., y Vesselinov, R. (2006). Quality Index: Toward improved treatment outcomes assess-
Regression tree approach to studying factors influencing ment in voice disorders. Journal of Communication Disorders,
acoustic voice analysis. Folia Phoniatrica et Logopaedica, 43, 161–174. https://doi.org/10.1016/j.jcomdis.2009.12.004
58, 274–288. https://doi.org/10.1159/000093184 Maryn, Y., Roy, N., De Bodt, M., Van Cauwenberge, P., y
Eadie, T. L., y Baylor, C. R. (2006). The effect of perceptual Corthals, P. (2009). Acoustic measurement of overall voice
training on inexperienced listeners’ judgments of dys- quality: A meta-analysis. Journal of the Acoustic Society of
phonic voice. Journal of Voice, 20, 527–544. https://doi. America, 126, 2619–2634. https://doi.org/10.1121/1.3224706
org/10.1016/j.jvoice.2005.08.007 Portney, L. G., y Watkins, M. P. (2000). Foundations of clinical
Everitt, B. S. (2002). The Cambridge Dictionary of Statistics. 2nd research: Applications to practice, 2nd ed. Upper Saddle
ed. New York: Cambridge University Press. River, NJ: Prentice Hall.
Fleiss, J. L. (1971). Measuring nominal scale agreement among Sauder, C., Bretl, M., y Eadie, T. (2017). Predicting voice disor-
many raters. Psychological Bulletin, 76, 378–382. https:// der status from smoothed measures of cepstral peak prom-
doi.org/10.1037/h0031619 inence using Praat and Analysis of Dysphonia in Speech
Heman-Ackah, Y. D., Michael, D. D., Baroody, M. M., Ostrowski, and Voice (ADSV). Journal of Voice, 31, 557–566. https://
R., Hillenbrand, J., Heuer, R. J., … y Staloff, R. T. (2003). doi.org/10.1016/j.jvoice.2017.01.006
Cepstral peak prominence: A more reliable measure of dys- Wolfe, V., y Martin, D. (1997). Acoustic correlates of dysphonia:
phonia. Annals of Otology, Rhinology & Laryngology, 112, Type and severity. Journal of Communication Disorders, 30,
324–333. https://doi.org/10.1177/000348940311200406 403–415. https://doi.org/10.1016/S0021-9924(96)00112-8
Heman-Ackah, Y. D., Michael, D. D., y Goding, G. S. Jr. (2002). Wolfe, V. I., Martin, D. P., y Palmer, C. I. (2000). Perception
The relationship between cepstral peak prominence and of dysphonic voice quality by naive listeners. Journal of
selected parameters of dysphonia. Journal of Voice, 16, Speech, Language, and Hearing Research, 43, 697–705.
20–27. https://doi.org/10.1016/S0892-1997(02)00067-X https://doi.org/10.1044/jslhr.4303.697
Heman-Ackah, Y. D., Sataloff, R. T., Laureyns, G., Lurie, D., Wuyts, F. L., De Bodt, M. S., Molenberghs, G., Remacle, M.,
Michael, D. D., Heuer, R., … y Hillenbrand, J. (2014). Heylen, L., Millet, B., ... y Van de Heyning, P. H. (2000).
Quantifying the cepstral peak prominence, a measure of The Dysphonia Severity Index: An objective measure of
dysphonia. Journal of Voice, 28, 783–788. https://doi. vocal quality based on a multiparameter approach. Journal
org/10.1016/j.jvoice.2014.05.005 of Speech, Language, and Hearing Research, 43, 796–809.
Hernández, J. D., León-Gómez, M. L., Jiménez, A., Izquierdo, https://doi.org/10.1044/jslhr.4303.796
L. M., y Latoszek, B. B. v. (2018). Validation of the Yiu, E., Worrall, L., Longland, J., y Mitchell, C. (2000).
Acoustic Voice Quality Index Version 03.01 and the Analysing vocal quality of connected speech using Kay’s
Acoustic Breathiness Index in the Spanish language. Annals Computerized Speech Lab: a preliminary finding. Clinical
of Otology, Rhinology & Laryngology, 127, 317–326. https:// Linguistics & Phonetics, 14(4), 295–305. https://doi.
doi.org/10.1177/0003489418761096 org/10.1080/02699200050023994

Loquens, 6(1), January 2019, e058, eISSN 2386-2637 https://doi.org/10.3989/loquens.2019.058

View publication stats

También podría gustarte