El Numero Efectivo de Grados de Libertad-Naty

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 8

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/268286470

EL NÚMERO EFECTIVO DE GRADOS DE LIBERTAD

Article

CITATIONS READS

0 1,672

1 author:

Enrique Raúl Villa Diharce


Centro de Investigación en Matemáticas (CIMAT)
50 PUBLICATIONS   412 CITATIONS   

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Supervised Classification with Gaussian Copula View project

All content following this page was uploaded by Enrique Raúl Villa Diharce on 23 January 2015.

The user has requested enhancement of the downloaded file.


Simposio de Metrología 2004 25 al 27 de Octubre

EL NÚMERO EFECTIVO DE GRADOS DE LIBERTAD

Enrique Villa Diharce


Centro de Investigación en Matemáticas, A. C.
Jalisco s/n, Mineral de Valenciana, Guanajuato, Gto. CP. 36240
Tel.: (473) 732 71 55 ext. 49562, Fax: (473) 732 57 49, Email: [email protected]

Resumen: En el análisis de datos de medición, presentamos el resultado de un proceso de medición,


mostrando el resultado de la medición y su incertidumbre. En la mayoría de los casos el mensurando no es
directamente medible, sino que depende de otras cantidades medibles, a través de una función que
generalmente es no lineal. En este caso, la determinación de la incertidumbre expandida de la estimación del
mensurando, se obtiene haciendo uso de una estadística, cuya distribución se desconoce, pero se aproxima
por una distribución t de Student, en la que el número de grados de libertad se obtiene, de acuerdo con la
recomendación de la GUM, utilizando la aproximación de Welch-Satterthwaite. A este número de grados de
libertad se le conoce como el número efectivo de grados de libertad. En este artículo comentamos el
concepto de grados de libertad y presentamos una derivación de la expresión conocida para obtener el
número efectivo de grados de libertad.

1. INTRODUCCIÓN Un procedimiento recomendado por la GUM [1],


para estimar la incertidumbre expandida, consiste
En el análisis de datos de medición, presentamos el en aproximar la distribución de la estadística T con
resultado de un proceso de medición, mostrando el una distribución t de Student con un número de
resultado de la medición y su incertidumbre. Esta grados de libertad dado por la aproximación de
última puede darse en forma estándar o expandida. Welch – Satterthwaite. A este número de grados de
La conveniencia de dar la versión expandida de la libertad se le denomina el número efectivo de
incertidumbre, es que le asociamos una cobertura grados de libertad.
explicita, lo cual facilita su interpretación, ya sea en
el terreno del enfoque frecuentista, o en el subjetivo En la sección 2, se muestra el origen de los grados
(grado de creencia). La incertidumbre expandida de libertad asociados a una incertidumbre
corresponde al rango de un intervalo de confianza expandida. En la sección 3, presentamos el
del mensurando. Para construir tal intervalo de desarrollo de la formula de Welch - Satterthwaite,
confianza, utilizamos una estadística T, dada por el para calcular el número efectivo de grados de
cociente de una estadística normal estándar entre libertad.
una estadística que incluye a la incertidumbre En la sección 4 se comentan las restricciones que
combinada de las variables de influencia del modelo tiene la aproximación de Welch-Sattertwaite y se
de medición. Cuando la estadística del denominador comenta un procedimiento alternativo para la
tiene asociada una distribución ji-cuadrada, determinación de la incertidumbre expandida. En la
entonces el cociente tiene una distribución t de sección 5, se dan las conclusiones del trabajo.
Student, con un número de grados de libertad igual
a los grados de libertad de la estadística ji-cuadrada
del denominador. 2. LOS GRADOS DE LIBERTAD

Frecuentemente, la estadística que involucra a la En la mayoría de los casos el mensurando no es


incertidumbre combinada no tiene una distribución directamente medible, sino que depende de otras
ji-cuadrada exacta, por lo tanto la estadística T no cantidades medibles X 1 , X 2 ,..., X k , a través de
tiene una distribución t de Student exacta. Esta
complicación nos impide tener un intervalo de una función f ( X 1 , X 2 ,..., X k ) . Así la incertidumbre
confianza para el mensurando, con la cobertura de la medición Y del mensurando, es el resultado
nominal deseada exacta. de combinar las incertidumbres de medición de las
diferentes cantidades medidas X 1 , X 2 ,..., X k , con

1
Simposio de Metrología 2004 25 al 27 de Octubre

diferentes pesos, que dependerán de la importancia libremente, ya que el término restante tiene un valor
que cada componente tiene en el modelo de determinado por estos n − 1 términos elegidos y el
medición Y = f ( X 1 , X 2 ,..., X k ) . promedio x . A este número de términos
independientes se le conoce como el número de
Una magnitud X que varia aleatoriamente tiene grados de libertad. De aquí que podemos interpretar
asociados dos parámetros muy importantes: su el número de grados de libertad como la cantidad
de información útil en la determinación de la
esperanza µ X = E ( X ) que nos indica el valor estimación. En cambio si las observaciones no son
alrededor de cual se tienen las observaciones de independientes, tenemos información redundante
X , y su varianza σ X2 que expresa la magnitud de en las observaciones, por lo que la información útil o
efectiva será menor
la variabilidad de las observaciones alrededor de su
valor esperado µ X . Otra interpretación del número de grados de
libertad, es el parámetro de la distribución ji-
Cuando se tienen n observaciones independientes cuadrada asociada al estimador de la varianza,
x1 , x2 ,..., xn de X , estimamos su esperanza como calculada a partir de n observaciones
independientes. En este caso sabemos que la
el promedio x de las n observaciones, estadística

1 n (n − 1) S X2
x= ∑ xi ,
n i =1 W= (1)
σ2
mientras que la varianza se estima por
tiene una distribución ji-cuadrada con n − 1 grados
de libertad. Con este enfoque entonces, el número
1

n
s X2 = ( xi − x ) 2 . efectivo de grados de libertad viene a ser el
n −1 i =1
parámetro asociado a la distribución ji-cuadrada
asociada al estimador de la incertidumbre de la
Cuando tenemos un mensurando, del que tomamos medición considerada.
mediciones con un instrumento, ocurre que
observamos diversos valores que varian La estadística anterior interviene en la estadística T
aleatoriamente, de acuerdo a alguna distribución. utilizada para determinar la incertidumbre
Generalmente asociamos el valor del mensurando expandida en forma de intervalo de confianza,
con el valor esperado de la distribución, de aquí que
estimar el valor del mensurando equivale a estimar X − µX
el valor esperado µ X , La incertidumbre de la
Z σX X − µX
estimación x proviene de la variabilidad de x T= = = . (2)
W S 2 SX
alrededor de µ X , que cuantificamos por su X
(n − 1) σ 2
varianza σ x2 = σ X2 / n , y que estimamos como X

sx2 = s X2 / n . Tambien podemos tomar como Así, además de expresar en forma numérica la
incertidumbre de medición la desviación estándar incertidumbre, ya sea como sx2 , o sx , podemos
de la media, σ x = σ x2 . expresarla en forma expandida, como un intervalo
de confianza del mensurando,
Cuando la información que tenemos del
mensurando es un conjunto de n observaciones ( x − t( n −1,1−α / 2 ) sx , x + t( n −1,1−α / 2) sx ) , (3)
independientes x1 , x2 ,..., xn , entonces tenemos que
para un valor dado de la estimación donde x es la estimación del mensurando, sx es la
x = ( x1 + x2 + ... + xn ) / n , tenemos solo n − 1 incertidumbre de la medición, y t( n −1,1−α / 2) el
observaciones xi que pueden tomar valores coeficiente de confianza para la distribución t de

2
Simposio de Metrología 2004 25 al 27 de Octubre

Student con ν = n − 1 grados de libertad. Este coeficiente de confianza y ν ef . el número de grados


intervalo tiene una cobertura nominal de
de libertad efectivos, dado por
(1 − α )100% .
s y4
Cuando el mensurando de interés Y es resultado ν ef . = , (5)
k
si4
de varias magnitudes de influencia X 1 , X 2 ,..., X k , ∑ν
de acuerdo a un modelo de medición dado por la i =1 i

función Y = f ( X 1 , X 2 , ..., X k ) , entonces hay que


convertir la información que tenemos sobre los siendo s1 , s2 ,..., sk las incertidumbres estándar de
resultados de medición e incertidumbres de las variables de influencia y ν 1 ,ν 2 ,...,ν k sus grados
X 1 , X 2 ,..., X k , en el resultado de medición y la de libertad correspondientes.
incertidumbre de Y . Hacer esto en forma exacta
puede ser un problema complicado, cuando la Para entender el origen del número efectivo de
función f es nolineal, y mas difícil todavía, si grados de libertad, hay que considerar la
estadística T, utilizada para obtener el intervalo de
además, las variables de influencia son
confianza (4)
correlacionadas.

La manera de atacar este problema consiste en y − µY


tomar una aproximación de Taylor, para Y , y − µY σY Z
T= = = . (6)
alrededor de su valor esperado µY . De esta forma, Sy 2
W
S Y
cuando las variables de influencia son no
correlacionadas, obtenemos las aproximaciones σ Y
2
ν ef
para µY y σ Y2 :
Aquí, la estadística Z tiene una distribución Normal
estándar y la estadística W = ν ef S y / σ y
2 2
tiene
µY = f ( µ X , µ X ,..., µ X ) ,
1 2
2
k
aproximadamente una distribución ji-cuadrada con
 ∂f  ν ef grados de libertad.
σ Y2 = ∑ i =1   σ X2 i .
k

 ∂xi  En este caso, el número efectivo de grados de


libertad ν ef viene a ser el parámetro de la
Estos valores son estimados por: distribución ji-cuadrada asociada a la incertidumbre
expandida sY2 , que se obtiene como una
y = f ( x1 , x2 ,..., xk ) ,
combinación lineal de las incertidumbres
2 2 2
2 s , s ,..., s , de las mediciones de las variables de
1 2 k
 ∂f 
sY2 = ∑ i =1 
k
s X2 i . influencia.

∂x
 i ( x1 , x2 ,..., xk )
La expresión del número efectivo de grados de
libertad, se conoce como la aproximación de Welch-
La incertidumbre numérica está dada por sY2 , Satterthwaite, que describimos en la siguiente
mientras que la incertidumbre expandida está dada sección.
por el intervalo de confianza
3. APROXIMACIÓN DE WELCH-
( y − t(ν ef . ,1−α / 2 ) s y , y + t(ν ef . ,1−α / 2) s y ) , (4) SATTERTHWAITE

donde y es el resultado de medición, s y su Sean W1 ,W2 ,...,Wk , k variables aleatorias


incertidumbre combinada, t(ν ef . ,1−α / 2) es el independientes e idénticamente distribuidas como ji-
cuadrada con r1 , r2 , ..., rk grados de libertad

3
Simposio de Metrología 2004 25 al 27 de Octubre

respectivamente. Es un hecho conocido [2] que la Según el metodo de momentos, para estimar el
suma W1 + W2 + ... + Wk se distribuye también como parámetro ν , igualamos los dos primeros
momentos de las variables que tenemos en ambos
ji-cuadrada con r = r1 + r2 + ... + rk grados de lados de la relación de equivalencia anterior. De
libertad. Esta propiedad de herencia de distribución esta forma obtenemos las ecuaciones
no se tiene cuando, en lugar de una suma,
consideramos una combinación lineal U
E (∑ i =1 aiWi ) = E ( ) ,
k
(7)
a1W1 + a2W2 + ... + akWk de las variables aleatorias. ν
U
E (∑ i =1 aiWi ) 2 = E ( ) 2 .
k
La complicación en la determinación del número (8)
efectivo de grados de libertad, se debe a que la ν
2
incertidumbre combinada s y es una combinación
Como la esperanza de una variable aleatoria
lineal de las incertidumbres de las variables de distribuida como ji-cuadrada es igual a sus grados
influencia. Si en lugar de una combinación lineal, de libertad, y su varianza es dos veces sus grados
fuese una suma de términos no correlacionados, de libertad, entonces
entonces el número de grados de libertad asociado
a la incertidumbre combinada seria la suma de los E (U ) = ν
grados de libertad de las variables de influencia.
V (U ) = E (U ) 2 − [ E (U ) ] = 2ν .
2

Cuando la incertidumbre combinada es una


combinación lineal de incertidumbres, entonces la De lo anterior obtenemos que
información de cada una de ellas dentro del total,
tiene un efecto modulado por la constante que
U
multiplica al término correspondiente. Esta E ( ) = 1,
combinación no aditiva de la información ν
proporcionada por cada componente es lo que
tenemos en la aproximación de Welch- U 2
Satterthwaite. E ( ) 2 = − 1.
ν ν
La lógica en el desarrollo de la aproximación,
consiste en suponer que la combinación lineal Sustituyendo estas esperanzas en (7) y (8),
obtenemos,
a1W1 + a2W2 + ... + akW , tiene aproximadamente
una distribución ji-cuadrada con un número de
E (∑ i =1 aiWi ) = 1 , y
k
grados de libertad que debemos determinar. Para (9)
esto, procedemos ajustando una distribución ji- 2
E (∑ i =1 aiWi ) 2 =
k
cuadrada a la combinación lineal, y estimamos su − 1. (10)
parámetro (grados de libertad) por el método de ν
momentos.
De la ecuación (9) no podemos deducir el valor de
Suponemos entonces, que la combinación lineal es ν , solo obtenemos una restricción para los
equivalente al cociente dado por una variable coeficientes de la combinación lineal. Despejamos
aleatoria U distribuida ji-cuadrada, dividida entre ν de la ecuación (10) y obtenemos
2

k
sus grados de libertad ν , esto es, que aiWi y ν= . (11)
E (∑ i =1 aiWi ) 2 − 1
i =1 k

U tienen la misma distribución. Esto se expresa


ν
como la relación de equivalencia, De esta ecuación obtenemos un estimador para el
número de grados de libertad, sustituyendo en el
U denominador la esperanza del cuadrado de la

k
aiWi ∼ . combinación lineal, por la combinación lineal
i =1
ν cuadrática únicamente. Así tenemos,

4
Simposio de Metrología 2004 25 al 27 de Octubre

2 Sustituyendo ahora, la expresión (13) de la varianza


νˆ = . de la combinación lineal, en la expresión (12) de ν
(∑ i =1 aiWi ) 2 − 1
k
tenemos
2
 E (∑ k aiWi ) 
ν=  .
i =1
Este estimador tiene el inconveniente de que nos 2
k a
puede dar valores negativos, lo cual es inadmisible. ∑ i=1 i E (Wi )
νi
Esta expresión para νˆ no considera la restricción
de los coeficientes de la combinación lineal.
Enseguida consideramos una versión modificada de De esta expresión para los grados de libertad como
este estimador, incluyendo la restricción. función de esperanzas de las variables aleatorias,
obtenemos su estimador νˆ , sustituyendo las
2
esperanzas por sus observaciones, esto es,
E (∑ i =1 aiWi ) 2 = V (∑ i =1 aiWi ) +  E (∑ i =1 aiWi ) 
k k k

 
(∑ i =1 aiWi ) 2
k
 
V (∑ i =1 aiWi ) νˆ =
k
2
  . (14)
= E (∑ i =1 aiWi )  
k
+ 1 , ai2

k 2
   2 Wi
 E (∑ aiWi ) 
k
 i =1
νi
 i =1  
Esta aproximación obtenida en la década de los 40,
E (∑ i =1 aiWi ) = 1 ,
k
y considerando de (9) que sigue aún hoy siendo de gran utilidad, su uso se
sustituye algunas veces por procedimientos de
entonces
simulación para la determinación de incertidumbres
expandidas. Cabe hacer notar que el procedimiento
V (∑ i =1 aiWi )
k
de simulación de observaciones de las variables de
E (∑ i =1 aiWi ) =
k 2
2
+ 1. influencia, cuando éstas están correlacionadas no
 E (∑ k aiWi )  es sencillo.
 i =1 
La expresión (14) obtenida para estimar los grados
Sustituyendo esto en la expresión (11) para ν, de libertad coincide con la expresión conocida para
resulta el número efectivo de grados de libertad, después
de hacer las siguientes sustituciones:
2
2  E (∑ i =1 aiWi ) 
k ai = (∂f / ∂xi ) , y Wi = si2 .
ν=   . (12)
V (∑ i =1 aiWi )
k
Los trabajos originales sobre esta aproximación
fueron desarrollados en forma independiente por
Welch [3,4,7] y Satterthwaite [5,6]. Este problema
Finalmente, considerando que W1 , W2 ,..., Wk son es similar al problema de inferencia para una
variables aleatorias independientes distribuidas diferencia de medias, cuando las varianzas son
como ji-cuadradas, tenemos que desconocidas y diferentes. Este último problema
conocido en la literatura estadística como el
problema de Behrens-Fisher [8], ha generado una
V (∑ i =1 aiWi ) = ∑ i =1 ai2V (Wi ) =
k k
polémica interesante, y ha atraído la atención de un
gran número de estadísticos, y por lo tanto se han
ai2 [ E (Wi ) ] (13)
2

2∑ i =1 propuesto varias soluciones desde diferentes


k

νi enfoques.
La última igualdad se debe a que
4. RESTRICCIONES O LIMITACIONES
V (Wi ) = 2 [ E (Wi ) ] / ν i .
2

El desarrollo de la aproximación de Welch-


Satterthwaite supone que las variables de influencia

5
Simposio de Metrología 2004 25 al 27 de Octubre

tienen distribución normal y además son Se ha mostrado el desarrollo de la aproximación de


nocorrelacionadas. Estos supuestos con Welch-Satterthwite para obtener el número efectivo
frecuencia no se cumplen, ya que además de la de grados de libertad.
distribución normal, las distribuciones uniforme y La estadística de la incertidumbre combinada no
triangular intervienen como modelos de medición de tiene una distribución ji-cuadrada exacta, debido a
las variables de influencia. Y además, la correlación que en el numerador no tiene una suma de
entre dichas variables en algunos casos es cuadrados sino una combinación lineal de
significativa. cuadrados.
Se han discutido limitaciones de esta aproximación,
Frecuentemente, el supuesto de no-correlación no como son los supuestos de distribución normal de
se cumple en la practica metrológica, ya que las las variables de influencia, así como la no
mediciones que se hacen de las diferentes variables correlación entre ellas.
de influencia que intervienen en un proceso de Además se ha comentado que una alternativa que
medición, están sujetas a un ambiente común, lo se puede seguir al evaluar la incertidumbre de un
cual genera una cierta estructura de dependencia proceso de medición, cuando las variables de
entre dichas variables. influencia son no-correlacionadas, es la técnica de
Monte Carlo. Cuando se usa algún software para
M Ballico [9] compara la formula de Welch- simular observaciones de variables correlacionadas,
Satterthwaite con otros procedimientos basados en se recomienda conocer el procedimiento que dicho
series de potencias utilizados para determinar la software sigue para introducir la correlación entre
incertidumbre expandida, y encuentra que la las variables, para estar seguros de que la
formula sobreestima el número efectivo de grados correlación que el software considera es la que
de libertad cuando una de las principales nosotros hemos determinado.
componentes tiene pocos grados de libertad. Esto
genera una subestimación del correspondiente
intervalo de confianza, lo cual es aun mas notorio REFERENCIAS
para altos niveles de confianza.
[1] Guide to the Expression of Uncertainty in
Una alternativa que se ha elegido algunas veces Measurement, Geneva, International
para la determinación de la incertidumbre expandida Organization for standardization, 1993, ISBN
o intervalo de confianza, ha sido la técnica de 92-67-10188-9.
simulación [10], también conocida como Monte [2] Casella, G. and Berger, R. L., Statistical
Carlo. Cuando las variables de influencia que se Inference, Wadsworth & Brooks/Cole, Pacific
simulan son nocorrelacionadas, este procedimiento Grove, CA. 1990.
es sencillo, aun cuando se tengan distribuciones [3] Welch, B. L., The Specification of Rules for
diferentes a la normal. En cambio, si las variables Rejection too Variable a Product, with
son correlacionadas, el problema de simulación en Particular Reference to an Electric Lamp
forma exacta es muy complicado, ya que se Problem, Supplement to the Journal of the
requiere conocer la distribución conjunta de las Royal Statistical Society, 3(2), 1936, 29-48.
variables, lo cual no es fácil. Existe software como [4] Welch, B. L., The Significance of the Difference
por ejemplo, Cristal Ball [11] y Risk [12], que Between two Means when the Population
simulan observaciones de variables aleatorias Variances are Unequal, 29, 1938, 350-362.
correlacionadas, con cualquier conjunto de Satterthwaite,F. E., Psychometrika, 1941, 6(5),
distribuciones marginales, y con una relación de 309-316.
correlación definida por el coeficiente de correlación [5] Satterthwaite,F. E., Psychometrika, 1941, 6(5),
por rangos, siguiendo el procedimiento de Iman y 309-316.
Conover [13]. [6] Satterthwaite,F. E., An approximate distributión
of estimates of variance components,
Biometrics, Bull., 2(6), 1946, 110-114.
5. CONCLUSIONES [7] Welch, B. L., The generalization of ´Student´s´
problem when several different population
En este artículo hemos comentado el concepto de variances are involved, Biometrika 34, (1947),
grados de libertad asociado a la determinación de la 28-35.
incertidumbre de medición. [8] Kendall, M. and Stuart, A., The Advanced
Theory of Statistics, , Vol. II: Inference and

6
Simposio de Metrología 2004 25 al 27 de Octubre

Relationship, 4th. Ed., Macmillan, New York,


NY., 1979.
[9] Ballico, M., Limitations of the Welch-
Satterthwaite aproximation for measurement
uncertainty calculations, Metrologia, 37, 2000,
61-64.
[10] Cox, M. G., Dainton, A. B., Forbes, A. B.,
Harris, P. M., Schwenke, P. M., Siebert, B. R.
L., and Woger, W., Use of Monte Carlo
Simulation for uncertainty evaluation in
metrology, in Ciarlini, P., Cox, M. G., Filipe, E,
Pavese, F, and Richter, D., editors, Advanced
Mathematical Tools in Metrology V. Series on
Advances in Mathematics for Applied Sciences,
Vol. 57, World Scientific, 2001, 93-104.
[11] Decisionengineering, Inc., Crystal Ball Version
4.0 User Manual.
[12] Winston, W. L., Simulation usiong @RISK,
Duxbury, Pacific Grove CA. 2001.
[13] Iman R. L. and Conover W. J., A Distribution-
Free Aproach to Inducing Rank Correlation
Among Input Variables, Communications in
Statistics - Simulation and Computation, 11(3),
1982, 331-334.

View publication stats

También podría gustarte