Wuolah Free Super Excel Disenos

ESTIMACIÓN DE PARÁMETROS Y CO
HIPÓTESIS. SÓLO CONCEP
Pasos del proceso inferencial:

Extracción de la muestra
Medición de las características objeto de nuestro interés
Cálculo del estadístico apropiado para inferir el parámetro de la población
Evaluación probabilística del error, que podemos cometer al realizar dicha inferencia

La inferencia estadística es una forma de razonamiento que va de lo concreto a lo general.

Para cada característica evaluada se obtiene uno o más valores numéricos que se conocen com

El estadístico en cada una de las distintas muestras se comporta como una variable aleatoria, y
nombre de distribución muestral.

La desviación típica, al estar referida a la distribución muestral de un estadístico, recibe el nom

La distribución poblacional se refiere a la distribución de los datos individuales en la población
que constituyen la muestra.

µ es la media poblacional, σ2 es la varianza poblacional.

Ȳ es la media de la muestra, SY es la desviación típica de la muestra.

Distribución muestra de la media, es una distribución donde se recogen las medias de varias m

Podemos decir que la distribución muestral de la media es normal, o se aproxima, cuando se c

La variable en la población se distribuye normalmente.
El tamaño de la muestra es ≥ 30 observaciones, Teorema Central del Límite.

Teorema Central de Límite. Establece que, sin importar la forma de la distribución poblacional
aumenta el tamaño de la muestra.

Además de las dos condiciones anteriores se procede de forma diferente:

Si conocemos la σ (desviación típica poblacional), y podemos asumir que la variable de la pobl
distribución muestral del estadístico media es también normal.
Si, como suele ser normal, se desconoce la varianza de la variable en la población, pero podem

Si, como suele ser normal, se desconoce la varianza de la variable en la población, pero podem

La distribución t es simétrica con Ȳ = 0, pero varianza n/n-2. A medida que aumenta la n, la var
aproximando a la normal de puntuaciones Z.

Cuando los grados de libertad son superiores a 100, podemos utilizar los valores de la curva no

π proporción de la población. p proporción de la muestra.

La proporción de los datos que cumplen una determinada condición se le llama genéricamen
son éxito.

La variable aleatoria p, sigue el modelo de probabilidad binomial.
La varianza es una medida de dispersión que permite determinar la variabilidad que presentan

He aquí las fórmulas de la varianza y de la cuasi-varianza., que, si eliminamos el cuadrado, se c

Recordamos también la fórmula de la covarianza, necesaria para el cálculo de la correlación.

La variable aleatoria que permite realizar afirmaciones sobre la varianza poblacional, se puede
que se distribuye según chi cuadrado con n – 1 grados de libertad.

Dos procedimientos de la estadística inferencial:

Estimación de parámetros.
Contraste de hipótesis.

Para el contraste de hipótesis, la muestra se ha seleccionado mediante muestreo aleatorio y s
Dos procedimientos de la estadística inferencial:

Estimación de parámetros.

Para el contraste de hipótesis, la muestra se ha seleccionado mediante muestreo aleatorio y s

La muestra tiene que seleccionarse por algún procedimiento aleatorio
Todos los elementos de la población tienen la misma probabilidad de formar parte de la muest

Un estimador es un estadístico calculado en una muestra que se utiliza para estimar un parám

Un estadístico es un buen estimador de un parámetro cuando tenga las siguientes propiedade

INSESGADO. La media de su distribución muestral debe coincidir con el parámetro que estima
varianza muestral es un estimador sesgado de la varianza poblacional. La cuasivarianza muestr
EFICIENCIA O PRECISIÓN. Entre dos estimadores de un mismo parámetro, es más preciso el qu
CONSISTENTE. Un estimador consistente es aquel que se concentra en un rango cada vez más
muestra. Tanto su sesgo como su varianza tiende a 0 a medida que aumenta n.
SUFICIENCIA. Un estimador es suficiente si al estimar el parámetro utiliza toda la información
estimadores suficientes de sus respectivos parámetros.

Los estadísticos de la muestra se representan con alfabeto latino, los de la población con alfa

La estimación de parámetros se realiza siguiendo dos procedimientos:

Estimación puntual. Consiste en utilizar el valor estadístico calculado en la muestra como valo
Intervalos de confianza. Es poco probable que el valor estadístico calculado en la muestra con
construye alrededor del estadístico de la muestra un intervalo definido por los límites inferior
asegure que el verdadero valor del parámetro se encuentra en esa franja de valores.

Intervalo de confianza para la media.
Varianza poblacional conocida σ2:
Ȳ ± Emax

Varianza poblacional desconocida:
Ȳ ± Emax

Varianza poblacional desconocida:
Ȳ ± Emax

Intervalo de confianza para la proporción.

p ± Emax

Intervalo de confianza para la varianza (n ≤ 100).

Intervalo de confianza para la varianza (n > 100).

Amplitud del intervalo de confianza, depende de dos factores, el nivel de confianza (NC) y el e

Una hipótesis estadística es una conjetura que se formula sobre una población y que puede so
proporcionada por una muestra representativa de esa población. Puede ser nula y alternativa.

La H0 afirma que no existe diferencia entre el valor del estadístico obtenido en la muestra y el q
explicarse como resultado del azar.

La H1 es la negación de la H0. Las dos son exhaustivas y mutuamente excluyentes.

Contrastes:

Bilateral: H0 : µ0 - µ1 = 0 µ0 - µ1 ≠ 0
Unilateral derecha: H0 : µ0 - µ1 ≤ 0 µ 0 - µ1 > 0

Unilateral izquierda: H0 : µ0 - µ1 ≥ 0 µ 0 - µ1 < 0

Medida de discrepancia.
Unilateral derecha: H0 : µ0 - µ1 ≤ 0 µ 0 - µ1 > 0

Unilateral izquierda: H0 : µ0 - µ1 ≥ 0 µ 0 - µ1 < 0

Medida de discrepancia.

Métodos paramétricos. Cuya denominación procede de la búsqueda de los parámetros subyac
distribución poblacional concreta.

Etapas de un contraste de hipótesis:

Condiciones de la investigación y supuestos que cumplen los datos observados.

Formulación de hipótesis. La H0 es la que se somete a contrastación empírica. La H1 es lo que d

Estadístico de contraste.

Regla de decisión. Se establece el nivel de significación α, siendo α el máximo riesgo que el inv
una H0 verdadera. Se calcula el nivel crítico p, que es la probabilidad de obtener unos resultado
H0 y en caso contrario, mantenemos la H0. El nivel de significación más habitual es 0,005 y 0,00
entre el valor teórico planteado en H0 y el valor obtenido en la muestra. Zona de rechazo, depe
valor de la discrepancia tan alejado de H0, que la probabilidad de que se produzca es muy baja
anterior, es 1 – x y es el área de la distribución muestral que corresponde a valores pequeños d
probabilidad de que se produzca es alta si H0 es verdadera.

CONTRASTE BILATERAL
CONTRASTE UNILATERAL IZQUIERDO

CONTRASTE UNILATERAL DERECHO
Conclusión

Interpretación

Errores al tomar una decisión en un contraste clásico de hipótesis.

Tamaño del efecto. Expresa la magnitud de la diferencia observada entre la H0 (valor teórico) y
ARÁMETROS Y CONTRASTES DE
S. SÓLO CONCEPTOS
n
a inferencia
creto a lo general.
s que se conocen como Estadísticos.
a variable aleatoria, y sus diferentes valores forman una distribución de probabilidad que recibe el
dístico, recibe el nombre de error típico del estadístico.

duales en la población, y la distribución en la muestra que es la distribución de los datos individuales
las medias de varias muestras de una misma población.
proxima, cuando se cumple al menos uno de los siguientes requisitos:
te.
tribución poblacional, la distribución muestral de la media, se aproximará a la normal, a medida que
la variable de la población se distribuye normalmente o n ≥ 30, entonces consideramos que la
oblación, pero podemos asumir que n ≥ 30, la distribución muestral de la media, es la T de Student.
oblación, pero podemos asumir que n ≥ 30, la distribución muestral de la media, es la T de Student.
e aumenta la n, la varianza de t, se va aproximando a 1 y por tanto, la distribución t se irá
valores de la curva normal como aproximación a los valores t.
le llama genéricamente éxito. Siendo p = x / n, donde x es el número de datos de la muestra que
bilidad que presentan los datos para la variable de estudio.

mos el cuadrado, se convertirían en desviación típica y cuasi-desviación típica.
o de la correlación.
poblacional, se puede generar a partir de la cuasivarianza poblacional o la varianza de la muestra,
muestreo aleatorio y se tiene que cumplir:

muestreo aleatorio y se tiene que cumplir:
mar parte de la muestra
ara estimar un parámetro poblacional. Para cada parámetro, pueden existir diferentes estimadores.
guientes propiedades:
arámetro que estima. La media muestral es un estimador insesgado de la media poblacional. La
cuasivarianza muestral es un estimador insesgado de la varianza poblacional.
, es más preciso el que tenga la varianza más pequeña.
n rango cada vez más estrecho alrededor de su parámetro a medida que aumenta el tamaño de la
nta n.
toda la información relacionada con el parámetro. La media, la varianza y la proporción son
la población con alfabeto griego.
a muestra como valor del parámetro que se desea estimar.

do en la muestra concreta coincida exactamente con el verdadero valor del parámetro y por ello se
or los límites inferior y superior, que tenga en cuenta el error típico del estimador, de forma que nos
de valores.
Ȳ ± Emax
Ȳ ± Emax
Ȳ ± Emax
p ± Emax
e confianza (NC) y el error típico. Cuanto mayor sea n, menor es el error típico de la muestra.
lación y que puede someterse a prueba, o contrastación empírica, a partir de la información
er nula y alternativa.
do en la muestra y el que formulamos como parámetro poblacional. La diferencia observada puede
uyentes.
os parámetros subyacentes a unos datos asumiendo que éstos se distribuyen según una función de
rvados.
írica. La H1 es lo que dice el investigador.
ximo riesgo que el investigador está dispuesto a cometer al tomar la decisión errónea de rechazar
btener unos resultados como los observados en la muestra o más extremos. Si p < NS, se rechaza la
bitual es 0,005 y 0,001. Valor crítico es la máxima diferencia que podemos admitir, por simple azar,
ona de rechazo, depende del NS α y es el área de la distribución muestral que corresponde a un
produzca es muy baja, si efectivamente la H0 es verdadera. Zona de no rechazo. Complementaria a la
a valores pequeños de la discrepancia tan poco alejados del valor formulado en H 0 que la
la H0 (valor teórico) y la H1 (valor crítico), expresado en una métrica común.
ecibe el
dividuales
edida que
e la
Student.
Student.
ra que
uestra,
madores.
al. La
o de la
on
or ello se
a que nos
a.
ón
a puede
nción de
echazar
echaza la
ple azar,
e a un
ntaria a la
CONTRASTE DE HIPÓTESIS EN LOS DIS
CONCEPTOS
Contrastes paramétricos. La hipótesis a contrastar especifica una característica de la poblaci

Si un determinado parámetro poblacional puede tomar un valor concreto.

Si entre las variables medidas en la muestra existe correlación en la población.

Contrastes no paramétricos. La hipótesis a contrastar especifica una característica de la pob

La forma de la distribución de la variable Y en la población.

Si los datos observados en la muestra son independientes entre sí.

Intervalo de confianza. Es un rango de valores definido a partir del estadístico obtenido en l
cubrirá el valor del parámetro poblacional con una probabilidad de 1 – x, denominada nivel
encontrará la media poblacional, con una probabilidad o N.C., previamente fijado.

El estadístico Z, cuantifica la distancia de la media en la muestra Ȳ, a la media poblacional µ0,

Si se desconoce la varianza poblacional, y la forma de la distribución de la variable X en la po
distribución t de Student, siempre que podamos asumir que la distribución en la población e

El contraste paramétrico de hipótesis para una proporción poblacional sigue la misma lógica
proporción o frecuencia relativa de aparición de una observación, es el cociente entre el núm
observaciones. La distribución binomial se aproxima a la normal, cuando el tamaño de la mu

La proporción observada en la muestra, p, es el estimador insesgado de la proporción poblac

I.C. en la proporción. Se obtiene ± a la proporción observada en la muestra, el error máximo

La proporción observada en la muestra, p, es el estimador insesgado de la proporción poblac

I.C. en la proporción. Se obtiene ± a la proporción observada en la muestra, el error máximo

En el caso de la proporción, si la muestra es grande (n > 25 ó np > 5), se calcula con Z.

Si la H0 es falsa, esta discrepancia debe superar al valor crítico de la distribución muestral. El
α, para poder rechazar la H0.

Contraste sobre la varianza poblacional. Para n ≤ 100. Se distribuye según chi cuadrado con n
Para el I.C.
Estos límites delimitan los valores entre los que se encontrará la varianza poblacional, con un

Tres tipos de contraste.
La potencia de un contraste estadístico es el complementario al Error Tipo II. Primero calcula

valor crítico, que sería β y restamos 1 – β, que sería la potencia de contraste o probabilidad d
cuando es falsa. En los casos en que el valor crítico haya que buscarlo en la binomial, es deci
poblacional, la potencia de contraste varía en función de dos factores: la distancia entre el v
mismo valor de error tipo I se puede confeccionar lo que se denominan CURVAS DE POTENC
según sea el valor que puede tomar la H1.

Nivel crítico p. Es el nivel de significación más pequeño al que una H0 puede ser rechazada c
La potencia de un contraste estadístico es el complementario al Error Tipo II. Primero calcula
valor crítico, que sería β y restamos 1 – β, que sería la potencia de contraste o probabilidad d
cuando es falsa. En los casos en que el valor crítico haya que buscarlo en la binomial, es deci
poblacional, la potencia de contraste varía en función de dos factores: la distancia entre el v
mismo valor de error tipo I se puede confeccionar lo que se denominan CURVAS DE POTENC
según sea el valor que puede tomar la H1.

Nivel crítico p. Es el nivel de significación más pequeño al que una H0 puede ser rechazada c
obtiene multiplicando por dos la probabilidad asociada a los valores mayores o menores (se
como medida de discrepancia). Si p es pequeño, se rechaza la H0 y si es grande, se acepta la
es superior, se acepta H0 y si está en torno a ese valor, se vuelve a tomar nueva evidencia mu

CONTRASTE SOBRE LA MEDIA POBLACIONAL.

UNA MUESTRA. CONOCIDA LA VARIANZA USAR SÓLO LAS CELDAS
POBLACIONAL CON ESTE COLOR
Ȳ Es la media obtenida en la muestra
µ0 Es el valor de la media poblacional formulado en la

hipótesis nula
σȲ Es el error típico de la media o desviación típica de la

distribución muestral de la media
σ Es la desviación típica poblacional que suponemos

conocida
n Es el tamaño de la muestra que estamos utilizando

para contrastar la hipótesis
INTRODUCIR Ȳ 220 Z 2.5

LOS VALORES
INTRODUCIR Ȳ 220 Z 2.5
LOS VALORES
µ0 215
σȲ 2 σȲ 2
INTRODUCIR
LOS VALORES
σ 36 BUSCAR EN LA TABLA DE DISTRIBUCIÓN NORMAL, EL VALOR
NEGATIVO. SI ES UN CONTRASTE BILATERAL HAY QUE
n 324
MUTIPLICAR POR 2 EL VALOR DE LA TABLA. EL RESULTADO, E
EL VALOR CRÍTICO p
Z1-α/2 0.975
Emax
INTERVALO DE CONFIANZA
Ȳ+Emax
Ȳ-Emax
TAMAÑO DE LA MUESTRA
n
CONTRASTE SOBRE LA MEDIA POBLACIONAL.

UNA MUESTRA. DESCONOCIDA LA VARIANZA USAR SÓLO LAS CELDAS
µ0 Es el valor de la media poblacional formulado en la hipótesis

nula
σȲ Es el error típico de la media o desviación típica de la

distribución muestral de la media
Es el estimador de la desviación típica poblacional, que se
σ puede realizar a partir de la varianza o de la cuasivarianza de
la muestra
n Es el tamaño de la muestra que estamos utilizando para

contrastar la hipótesis
INTRODUCIR Ȳ 7 T -2.66
LOS VALORES
INTRODUCIR
LOS VALORES
µ0 8
σȲ 0.3753 σȲ 0.3753
INTRODUCIR σ 1.3
BUSCAR EN LA TABLA T DE STUDENT CON n-1 G.L., ENTRE Q
LOS VALORES
n 12
VALORES SE ENCUENTRA.
S2n-1 1.69
INTRODUCIR Emax
LOS VALORES tn-1;1-α/2 2.201
Ȳ+Emax
Ȳ-Emax
TAMAÑO DE LA MUESTRA n
CONTRASTE SOBRE LA PROPORCIÓN

USAR SÓLO LAS CELDAS
µp Es la media de la distribución muestral de las proporciones

poblacionales
p Proporción
σp Es la desviación típica poblacional
π0 Es la proporción poblacional o hipótesis nula

p 0.26 Z 1.84
INTRODUCIR
LOS VALORES π0 0.2
INTRODUCIR
LOS VALORES π0 0.2
n 150 σp 0.03
S2n-1 0.04 BUSCAR EN LA TABLA DE DISTRIBUCIÓN
NORMAL, EL VALOR CRÍTICO, EN BASE AL
INTRODUCIR
LOS VALORES Z1-α/2 0.005 NIVEL DE CONFIANZA (PARA UN 99%, SERÍA
0,99=2,33). PARA EL CÁLCULO DEL NIVEL
CRÍTICO DE p, EN EL CASO DE UN CONTRASTE
UNILATERAL, BUSCAMOS EL VALOR DE Z EN LA
TABLA DE DISTRIBUCIÓN NORMAL Y SE LO
RESTAMOS A 1
Emax 0.0002
INTERVALO DE CONFIANZA p+Emax 0.2602
p-Emax 0.2598
n 150
TAMAÑO DE LA MUESTRA
CONTRASTE SOBRE LA VARIANZA

σ 2 Es la varianza poblacional
S2n Es la varianza muestral

S2n-1 Es la cuasivarianza muestral
σ 2 18.1 Χ2 33.16
σ 2 18.1 Χ2 33.16
INTRODUCIR
LOS VALORES n 25
S2n 4.9 S2n-1 25.01
BUSCAR EN LA TABLA DE DISTRIBUCIÓN CHI-CUADRADO, EL VALOR CRÍTICO, EN BASE AL NIVEL DE CONFIANZA (PARA
UN 99%, SERÍA 0,99) Y CON n-1 GRADOS DE LIBERTAD . PARA EL CÁLCULO DEL NIVEL CRÍTICO DE p, BUSCAMOS EN LA
TABLA DE DISTRIBUCIÓN DE CHI CUADRADO, CON n-1 GRADOS DE LIBERTAD, EL VALOR DEL ESTADÍSTICO DE
CONTRASTE, POR APROXIMACIÓN
Χ2n-1;1-α/2 9.8862 Χ2n-1;α/2 42.9800
li 60.7159
ls 13.9658
CÁLCULO DE LA POTENCIA DEL

CONTRASTE CON ESTE COLOR
σ Es la desviación típica poblacional

µ0 Es la media de la distribución muestral
σ 220 Z -1.09
INTRODUCIR
LOS VALORES n 100
µ0 1000 Error Tipo I 1.64

µ0 1000 Error Tipo I 1.64
µ1 1060 Error Tipo II

(beta) 0.1379
Ȳ 1036.08 POTENCIA DE
CONTRASTE 0,8621
INTRODUCIR VALOR CRÍTICO
LOS VALORES
DE Z (N.S. 5%) 1.64
Error Tipo I. Se basa en el dato de la hipó

con el valor crítico de 1,64. Desconocemo
Error Tipo II (Beta). Se basa en el dato de
fórmula para el cálculo de Z, buscamos en
cálculo de la potencia de contraste, o pro
la hipótesis nula, cuando es realmente fa
NIVEL CRÍTICO p Y ERRORES EN

CONTRASTES
El nivel crítico p, que se define como el nivel de significación más peque

medida de discrepancia obtenida. Es decir, el nivel crítico p es la probab
obtenido a partir de la información obtenida en nuestra muestra y cuan
obtenidos en la investigación o más extremos bajo el supuesto de que la
El valor del nivel crítico p se obtiene multiplicando por dos la probabilidad asocia
cola caiga el valor del estadístico de contraste como medida de discrepancia).
Al utilizar como criterio para la decisión el nivel crítico p no hay que establecer previamente
es pequeño se rechazará H0, y si es grande se aceptará H0. Obviamente, persiste el problema
decisión hay que recurrir al criterio del grado de cercanía o alejamiento de p a, por ejemplo,
superior se acepta H0, y si está en torno a ese valor, se vuelve a tomar nueva evidencia mues
SIS EN LOS DISEÑOS DE UNA MUESTRA.
CONCEPTOS
rística de la población como:
o.
ación.
cterística de la población como:
stico obtenido en la muestra y delimitado por sus límites inferior y superior. Este intervalo
denominada nivel de confianza. El I.C. de la media nos delimita entre qué dos valores se
te fijado.
edia poblacional µ0, en unidades de error típico de la distribución muestral σȲ.
a variable X en la población, entonces la distribución muestral de la media es la

ón en la población es normal o que ≥ 30. Se distribuye con n – 1 grados de libertad.
gue la misma lógica y procedimiento que el seguido para el contraste de la media. La

ociente entre el número de veces que aparece la observación y el número total de
el tamaño de la muestra es grande (n > 25 ó np > 5).
a proporción poblacional π.
ra, el error máximo de estimación.

a proporción poblacional π.
ra, el error máximo de estimación.
alcula con Z.
bución muestral. El nivel crítico p asociado a esta discrepancia debe ser menor que el N.S.
n chi cuadrado con n – 1 grados de libertad.
poblacional, con una probabilidad de 1 – α.
o II. Primero calculamos el estadístico de contraste, después buscamos en las tablas el

ste o probabilidad de que los resultados de la investigación permitan rechazar la H 0
la binomial, es decir, que la H1 es compuesta y plantea más de un valor como media
distancia entre el valor de la Ho y la H1 y el tamaño muestral. De este modo, para un
URVAS DE POTENCIA, las cuales permiten fácilmente localizar la potencia de un contraste
ede ser rechazada con la medida de discrepancia obtenida. En los contrastes bilaterales, se
o II. Primero calculamos el estadístico de contraste, después buscamos en las tablas el
ste o probabilidad de que los resultados de la investigación permitan rechazar la H 0
la binomial, es decir, que la H1 es compuesta y plantea más de un valor como media
distancia entre el valor de la Ho y la H1 y el tamaño muestral. De este modo, para un
URVAS DE POTENCIA, las cuales permiten fácilmente localizar la potencia de un contraste
ede ser rechazada con la medida de discrepancia obtenida. En los contrastes bilaterales, se
ores o menores (según en qué parte de la cola caiga el valor del estadístico de contraste
rande, se acepta la H0. Por ejemplo, si p es claramente inferior a 0,005, se rechaza la H0, si
nueva evidencia muestral y se repite el contraste.
mulado en la
ión típica de la
suponemos
os utilizando
IÓN NORMAL, EL VALOR
LATERAL HAY QUE
TABLA. EL RESULTADO, ES
1.95
222
218
324
mulado en la hipótesis
ión típica de la
poblacional, que se
de la cuasivarianza de
os utilizando para
T CON n-1 G.L., ENTRE QUÉ
0.83
7.83
6.17
12
de las proporciones
s nula
os utilizando para
TRIBUCIÓN
, EN BASE AL
UN 99%, SERÍA
O DEL NIVEL
E UN CONTRASTE
VALOR DE Z EN LA
RMAL Y SE LO
Siendo la proporción obtenida en la muestra p=XXX

un valor de la distribución muestral de la proporción,
el estadístico Z= YYY, indica que la distancia de p a π0,
es de YYY desviaciones típicas de la distribución
muestral
os utilizando para
L DE CONFIANZA (PARA
DE p, BUSCAMOS EN LA
STADÍSTICO DE
Supongamos que la duración media de una lámpara de bajo consumo de una

determinada marca es de 1000 horas con un desviación típica de 220 horas. La empresa
que las fabrica introduce un nuevo proceso de fabricación y afirma que la vida media de
las nuevas es superior a las antiguas. Vamos a suponer que como hipótesis alternativa
única se plantea un promedio de duración de 1060 horas.
Tomando un nivel de significación del 5%, determinar el error tipo II y la potencia de la
prueba, si el estudio se realizara con un muestra de 100 lámparas.
os utilizando para
n el dato de la hipótesis nula, con un nivel de significación de 5%, y que se corresponde
1,64. Desconocemos la media, por tanto, despejamos el valor de Y, de la fórmula de Z.
basa en el dato de la hipótesis alternativa, una vez conocida la media, aplicamos la
o de Z, buscamos en la tabla de la curva normal y su valor, hay que restarlo a 1, para el
de contraste, o probabilidad de que los resultados de la investigación, permitan rechazar
do es realmente falsa.
ERRORES EN LOS
ASTES
ión más pequeño al que una hipótesis nula puede ser rechazada con la
p es la probabilidad asociada a la medida de discrepancia que hemos
muestra y cuantifica la probabilidad de obtener unos datos como los
uesto de que la hipótesis nula es verdadera.
obabilidad asociada a los valores mayores o menores (según en qué parte de la

discrepancia).
lecer previamente un nivel de significación, y ésta se toma en función del valor de p. Si p

ersiste el problema de determinar qué es grande y qué pequeño. Entonces para tomar una
e p a, por ejemplo, el valor 0,05. Si es claramente inferior, se rechaza H0, si es claramente
eva evidencia muestral y se repite el contraste.
MUESTRAS INDEPEND
RELACIONADAS. CO
Cuando trabajamos con dos muestras (o más de dos), las muestras pueden ser independie
Son independientes cuando no existe relación entre los sujetos de una y otra, lo que podrem
muestras.
Tenemos muestras relacionadas cuando cada observación en una muestra tiene su pareja e
El caso más evidente es cuando son los mismos sujetos los que pasan por diferentes condic
ansiedad, podemos seleccionar a un grupo de sujetos en los que medimos su nivel de ansie
de la terapia para comparar las medias en ansiedad antes y después. En otras ocasiones no
sujeto a sujeto en ambas. Por ejemplo, si disponemos de 10 parejas de hermanos gemelos,
asignados, aleatoriamente, a grupos distintos. También podemos contar con padres e hijos,
que están equiparados en variables que pueden influir en el diseño de la investigación.
Varianza: S2n Cuasi varianza Ŝ2n. La diferencia, el acento circunflejo ^.
Distribución muestral de la diferencia de medias, para dos muestras independientes, σ2 con

Atención a los subíndices. En el caso de Y12, significa la puntuación Y, del sujeto número 2, d

Calculamos las medias de la Población 1.

La distribución muestral de la media para la Población 1, ordenada, sería: 2; 3,5; 3,5; 5; 5; 5

La media y la varianza, serían:

Se calcula igualmente las medias de la Población 2. Y la distribución muestral de la media pa
La media y la varianza, serían:

Se calcula igualmente las medias de la Población 2. Y la distribución muestral de la media pa

La media y la varianza serían: µ2 = 5 σ2Ȳ2 = 0,75.

La distribución muestral de las diferencias Ȳ1 - Ȳ2, la compondremos al emparejar todas las m

Distribución muestral de dos muestras independientes, con varianzas poblacionales desco

+ n2) – 2 grados de libertad.

Distribución muestral de dos muestras independientes con varianzas poblacionales desco

para los grados de libertad:

En el cálculo de los grados de libertad, se prescinde de los decimales.

Primero se calculan las medias y a continuación, las varianzas de ambos grupos:

En el cálculo de los grados de libertad, se prescinde de los decimales.

Primero se calculan las medias y a continuación, las varianzas de ambos grupos:

Después las cuasivarianzas o varianzas insesgadas:

Y obtenidos estos datos, aplicaríamos las fórmulas de t y g.l.

HOMOCEDASTICIDAD. Varianzas poblacionales iguales.

Distribución muestral de dos muestras independientes. Dos varianzas. Se distribuye según
libertad en el denominador.

Distribución muestral de dos muestras independientes. Dos proporciones. Una V.D. es dico
menor que 0.

En la fórmula de la derecha, viene dado lo que significa P. Siendo p1 = Y1 : n1 y en el caso de

Distribución muestral de dos muestras independientes. Dos proporciones. Una V.D. es dico
que un determinado valor, distinto de 0, denotado por D.

Tamaño del efecto. Es una familia de índices que se aplica cuando hay implicados al menos
gradación de Cohen: d = 0,2 (pequeño); d = 0,5 (mediano); d = 0,8 (o superior, grande).

Siendo :

DISTRIBUCIÓN MUESTRAL DE LA
CONTRASTES DE HIPÓTESIS SOBRE DOS
MEDIAS EN MUESTRAS INDEPENDIENTES DIFERENCIA DE MEDIAS PARA DOS
MUESTRAS INDEPENDIENTES
POBLACIÓN 1 POBLACIÓN 2
n SUJETO PUNTUACION
n SUJETO PUNTUACION
Y11 2 Y21 3.5
3 Y12 5
3 Y22 5
Y13 8 Y23 6.5
∑ 15 ∑ 15
µ 1 5.00 µ 2 5.00
σ 2
1 6.00 σ 2
2 1.50
DISTRIBUCIÓN MUESTRA DE LA POBLACIÓN 1

2.00 3.50 3.50 5.00 5.00 5.00 6.50 6.50 8.00
DISTRIBUCIÓN MUESTRAL DE LA POBLACIÓN 2
3.50 -1,5 0 0 1,5 1,5 1,5 3 3 4,5
4.25 -2,25 -0,75 -0,75 0,75 0,75 0,75 2,25 2,25 3,75
4.25 -2,25 -0,75 -0,75 0,75 0,75 0,75 2,25 2,25 3,75
5.00 -3 -1,5 -1,5 0 0 0 1,5 1,5 3
5.00 -3 -1,5 -1,5 0 0 0 1,5 1,5 3
5.00 -3 -1,5 -1,5 0 0 0 1,5 1,5 3
5.75 -3,75 -2,25 -2,25 -0,75 -0,75 -0,75 0,75 0,75 2,25
5.75 -3,75 -2,25 -2,25 -0,75 -0,75 -0,75 0,75 0,75 2,25
6.50 -4,5 -3 -3 -1,5 -1,5 -1,5 0 0 1,5
DISTRIBUCIÓN MUESTRAL DE LAS DIFERENCIAS Ȳ1 - Ȳ2
Un psicólogo escolar utiliza un te

VARIANZAS de medida de intervalo. Se sabe,
CONTRASTES DE HIPÓTESIS SOBRE DOS POBLACIONALES respectivamente.
MEDIAS EN MUESTRAS INDEPENDIENTES Las investigaciones anteriores tam
CONOCIDAS
comprobado con muestras españ
que en realidad no se deben a la
200 niñas obteniendo una media
afirmar que la puntuación media
Un psicólogo escolar utiliza un te
VARIANZAS de medida de intervalo. Se sabe,
CONTRASTES DE HIPÓTESIS SOBRE DOS respectivamente.
MEDIAS EN MUESTRAS INDEPENDIENTES POBLACIONALES
CONOCIDAS Las investigaciones anteriores tam
comprobado con muestras españ
que en realidad no se deben a la
200 niñas obteniendo una media
ESTADÍSTICO DE CONTRASTE afirmar que la puntuación media
σ 2
1
Es la varianza poblacional
Z Es el estadístico de
contraste
INTERVALO DE CONFIANZA p Es el nivel crítico
σ 2
1
36
σ 2
2
49
Ȳ 1
20
Ȳ 17.5
E
2
INTRODUCIR
max 1.524522 LOS VALORES
µ1-µ 2 0
4.0245222 Z 1-α/2 1.96

INTERVALO DE
CONFIANZA n 1
100
0.9754778 n2 200
En un estudio sobr
VARIANZAS POBLACIONALES personas ingresada
MEDIAS EN MUESTRAS INDEPENDIENTES DESCONOCIDAS, PERO personas cuyos fam
SUPUESTAMENTE IGUALES Para comprobar es
puntuación media
que si reciben visit
en la población son
ESTADÍSTICO DE CONTRASTE avalan la hipótesis
INTERVALO DE CONFIANZA TAMAÑO DEL EFECTO
Un laboratorio des
CONTRASTES DE HIPÓTESIS SOBRE DOS VARIANZAS POBLACIONALES muestras aleatoria
DESCONOCIDAS, Y normalmente con
MEDIAS EN MUESTRAS INDEPENDIENTES SUPUESTAMENTE DISTINTAS sustancia placebo.
elevada es la puntu
ESTADÍSTICO DE CONTRASTE GRADOS DE LIBERTAD

Con un nivel de co
VARIANZAS CUASIVARIANZAS O VARIANZAS INSESGADAS
∑
Ȳ
Ȳ2
∑ Y2
S2

VARIANZAS EN MUESTRAS
INDEPENDIENTES
ESTADÍSTICO DE CONTRASTE GRADOS DE LIBERTAD
PROPIEDAD RECÍPROCA DE LA
DISTRIBUCIÓN F
FORMULACIÓN DE HIPÓTESIS
CONTRASTES DE HIPÓTESIS SOBRE DOS BAJO EL SUPUESTO DE QUE LA
PROPORCIONES EN MUESTRAS H0 ES VERDADERA Y LAS DOS
INDEPENDIENTES PROPORCIONES IGUALES
ESTADÍSTICO DE CONTRASTE FORMULACIÓN DE HIPÓTESIS
Según los datos q

CONTRASTES DE HIPÓTESIS SOBRE DOS BAJO EL SUPUESTO DE QUE oposiciones, la pr
PROPORCIONES EN MUESTRAS LAS DOS PROPORCIONES NO aprobados de los
INDEPENDIENTES SON IGUALES proporción será s
de la UNED y otra
temario de las op
confianza del 95%
La magnitud o tamaño del efecto es el nombre que se da a una fa
cuando hay implicados al menos dos grupos, uno de tratamiento
TAMAÑO DEL EFECTO tipo de índices son de uso frecuente en el ámbito del meta-anális
Para interpretar el resultado de este índice, y teniendo en cuenta
“pequeño: d = 0,2”, “mediano: d= 0,5” y “grande: d = 0,8 o superi
INDICE d DE COHEN SIENDO σ LA DESVIACIÓN TÍPICA CONJUNTA D

GRUPOS CUANDO SUS VARIANZAS SON HOMO
n 1 30 Ȳ1 205 Ŝ21 35 σ
n 2 30 Ȳ2 237 Ŝ22 38 d
ESTRAS INDEPENDIENTES O
LACIONADAS. CONCEPTOS
pueden ser independientes o relacionadas.

na y otra, lo que podremos garantizar si los sujetos son asignados aleatoriamente a cada una de las
uestra tiene su pareja en la otra.

n por diferentes condiciones experimentales. Si queremos probar la eficacia de una terapia contra la
dimos su nivel de ansiedad antes del experimento; aplicamos la terapia, y volvemos a medirlo después
En otras ocasiones no son los mismos sujetos los que se repiten en las muestras, pero hay una relación
de hermanos gemelos, podemos formar dos grupos de 5 personas donde cada dos hermanos son
tar con padres e hijos, maridos y mujeres, etc. Por último, también podemos utilizar pares de sujetos
de la investigación.
^.
ndependientes, σ2 conocidas.
del sujeto número 2, de la población 1.
ería: 2; 3,5; 3,5; 5; 5; 5; 6,5; 6,5; 8.
muestral de la media para la Población 2, ordenada, sería: 3,5; 4,25; 4,25; 5; 5; 5; 5,75; 6,5.
muestral de la media para la Población 2, ordenada, sería: 3,5; 4,25; 4,25; 5; 5; 5; 5,75; 6,5.
l emparejar todas las muestras de la Población 1 con la de la Población 2.
as poblacionales desconocidas, pero supuestamente iguales. Se distribuye según la t de Student con (n1
s poblacionales desconocidas, pero supuestamente distintas. Se distribuye según la t de Student, y
les.
ambos grupos:
les.
ambos grupos:
as. Se distribuye según la F de Fisher, con n1 – 1 grados de libertad en el numerador y n2 – 1 grados de
ciones. Una V.D. es dicotómica. Queremos saber si la diferencia entre dos proporciones es igual, mayor o
Y1 : n1 y en el caso de p2, igual, pero con sus datos correspondientes.
ciones. Una V.D. es dicotómica. Queremos saber si la diferencia de proporciones es igual, menor o mayor
y implicados al menos dos grupos, uno de tratamiento y otro de control. A este índice se le aplica la
superior, grande).
TRAL DE LA
MEDIA ARITMÉTICA DE TODAS LAS MUESTRAS POSIBLES, DE
S PARA DOS TAMAÑO n=2, PARA LA POBLACIÓN 1 USAR SÓLO LAS
NDIENTES
CELDAS CON ESTE
COLOR
Y11 Y12 Y13
Y11 2.00 3.50 5.00
Y12 3.50 5.00 6.50
Y13 5.00 6.50 8.00
n 9.00
µ1 5.00
SITUAR LOS RESULTADOS
ANTERIORES ORDENADOS
DE MENOR A MAYOR
2.00 3.50 3.50 5.00 5.00 5.00 6.50 6.50 8.00 ∑ 45.00
σ2 1 3.00
MEDIA ARITMÉTICA DE TODAS LAS MUESTRAS POSIBLES, DE

TAMAÑO n=2, PARA LA POBLACIÓN 2
Y21 Y22 Y23

Y21 3.50 4.25 5.00
Y22 4.25 5.00 5.75
Y23 5.00 5.75 6.50
n 9.00
SITUAR LOS RESULTADOS
µ1 5.00
ANTERIORES ORDENADOS 3.50 4.25 4.25 5.00 5.00 5.00 5.75 5.75 6.50 ∑ 45.00
DE MENOR A MAYOR
σ2 1 0.75
VARIANZA DE LA
DISTRIBUCIÓN MUESTRAL
DE LAS DIFERENCIAS
3.75
sicólogo escolar utiliza un test de comprensión verbal recientemente traducido del inglés, que proporciona puntuaciones en un nivel
medida de intervalo. Se sabe, por investigaciones anteriores, que las varianzas en la población son para niños y niñas σ 21 = 36 y σ22 = 49
ectivamente.
nvestigaciones anteriores también indican que la media es la misma en ambos grupos, pero este último aspecto no ha sido
probado con muestras españolas. El psicólogo considera que la traducción del test no es muy acertada y puede provocar diferencias
en realidad no se deben a la comprensión verbal, por lo que selecciona aleatoriamente una muestra de 100 niños y otra muestra de
niñas obteniendo una media igual a 20 para los niños e igual a 17,5 para las niñas. Con un nivel de confianza del 95%. ¿Podemos
mar que la puntuación media en el test de comprensión verbal es la misma para niños y niñas?
sicólogo escolar utiliza un test de comprensión verbal recientemente traducido del inglés, que proporciona puntuaciones en un nivel
medida de intervalo. Se sabe, por investigaciones anteriores, que las varianzas en la población son para niños y niñas σ 21 = 36 y σ22 = 49
ectivamente.
nvestigaciones anteriores también indican que la media es la misma en ambos grupos, pero este último aspecto no ha sido
probado con muestras españolas. El psicólogo considera que la traducción del test no es muy acertada y puede provocar diferencias
en realidad no se deben a la comprensión verbal, por lo que selecciona aleatoriamente una muestra de 100 niños y otra muestra de
niñas obteniendo una media igual a 20 para los niños e igual a 17,5 para las niñas. Con un nivel de confianza del 95%. ¿Podemos
mar que la puntuación media en el test de comprensión verbal es la misma para niños y niñas?
H0 : µ1 - µ2 = 0
H1 : µ1 - µ2 ≠ 0
Z 3.214122
CÁLCULO DEL NIVEL

CRÍTICO p: En la tabla de
la curva normal, buscamos
el valor de Z calculado
anteriormente y se lo
restamos a 1. Como en
este caso, el contraste es
bilateral, multiplicamos
por dos el resultado
obtenido
En un estudio sobre depresión en personas mayores llevado a cabo en un centro geriátrico, se quiere comprobar si las
personas ingresadas que no reciben visitas de sus familiares tienen una puntuación media en depresión superior a aquellas
personas cuyos familiares les visitan con frecuencia.
Para comprobar esta hipótesis, se seleccionaron aleatoriamente 41 personas que no reciben visitas obteniéndose una
puntuación media de 20 puntos con una cuasivarianza igual a 100, mientras que en una muestra aleatoria de 31 personas
que si reciben visitas con frecuencia la media fue igual a 15 con una cuasivarianza igual a 90. Suponiendo que las varianzas
en la población son iguales para ambos grupos, y con un nivel de confianza del 99% ¿podemos decir que los datos obtenidos
avalan la hipótesis de partida?
T Es el estadístico de
contraste n 1 41 Ȳ 1
20 H0 : µ1 - µ2 ≤ 0
H1 : µ1 - µ2 > 0
p Es el nivel crítico n2 31 Ȳ 2
15
Ȳ 1
Es la media poblacional
1 Ŝ21 100 Ŝ22 90 tn +n -2;1-α/2
1 2
Ȳ 1
Es la media poblacional
1 Ŝ21 100 Ŝ22 90 tn +n -2;1-α/2
1 2
Ȳ Es la media poblacional
2
T E
2
2.1473 max 6.165948
Ŝ2 1 Cuasivarianza
poblacional 1
Ŝ2 2 Cuasivarianza
poblacional 2 d 0.5111 11.16595
n 1
Población 1
Buscamos este dato en las
INTERVALO DE
CONFIANZA
tablas de T, el valor crítico,
n 2
Población 2 que con 70 grados de libertad
y un nivel de confianza del
-1.16595
99%, se encuentra entre las
E max Es el error máximo probabilidades del 0,975 y
0,990. El nivel crítico p, se
encontrará entre estos dos
d Es el tamaño del efecto valores (0,01 < p > 0,025)
Un laboratorio desarrolla un fármaco con el que se pretende reducir la ansiedad. Para comprobarlo, se extrajeron dos
muestras aleatorias de cinco observaciones cada una que suponemos procedentes de poblaciones que se distribuyen
normalmente con distinta varianza. A los sujetos de la primera muestra se les administró el fármaco y los de la segunda una
sustancia placebo. Posteriormente se les midió la ansiedad a todos los sujetos mediante un test en el que cuanto más
elevada es la puntuación mayor es la ansiedad. Los resultados de ambas muestras fueron:
Grupo 1 (con fármaco): 10; 20; 30; 20; 5
Grupo 2 (sin fármaco): 30; 50; 30; 60; 20
Con un nivel de confianza del 95%, ¿podemos afirmar que el fármaco efectivamente reduce la ansiedad?
GRUPO 1 GRUPO 2 n1 n2
10 30 5 5
20 50
30 30
20 60 GRUPO 1 GRUPO 2
5 20 Ŝ2 95 270
∑ 85 190
Ȳ 17 38 T -2.46
Ȳ2 289 1444
∑ Y2 1825 8300 gl 6.50 ͌ 6
S2 76 216 Establecer la regla de decisión en función del nivel de confianza. Buscamos en las
tablas t de Student, el valor que supera a una proporción igual al nivel de confianza,
para los gl calculados. En la figura de la izquierda aparecen los datos con los cálculos
realizados anteriormente.
Según Eysenck (1981), hombres y mujeres tienen la misma puntuación media en cociente intelectual (CI), pero distinta
varianza, siendo esta superior para los hombres. Para comprobar la hipótesis de Eysenck, seleccionamos
aleatoriamente una muestra de 41 hombres y otra de 31 mujeres. Tras aplicar un test de inteligencia en ambas
muestras, observamos que la cuasivarianza en el grupo de hombres es igual a 289, mientras que en el de mujeres vale
225. Con un nivel de confianza del 99% ¿avalan estos datos la hipótesis de Eysenck?
Ŝ2 1 289 Establecer la regla de decisión en función

del nivel de confianza. Buscamos en las
Ŝ2 2 225 F 1.28 tablas F de Snedecor, el valor crítico, con
los grados de libertad calculados y el nivel
de confianza correspondiente. Si el
n 1 41 g.l. 40 30 estadístico de contraste es inferior al
valor crítico, se mantiene la H0.
n 2 31
En unas determinadas oposiciones se presentaron 200 graduados por la UNED, de los
que aprobaron 70, mientras que de 300 candidatos de otras universidades aprobaron 60.
Con un nivel de confianza del 95%, ¿podemos afirmar que la proporción de aprobados es
la misma entre los graduados de la UNED y los de otras universidades?
n 1 200 Aprob.1 70 p1 0.35 Z

n 2 300 Aprob.2 60 p2 0.20 P
Según los datos que maneja el director de una academia especializada en preparar a sus alumnos para unas determinadas
oposiciones, la proporción de aprobados entre los titulados de la UNED es 0,15 puntos superior a la proporción de
aprobados de los titulados procedentes de otras universidades. El director sospecha que el presente curso dicha
proporción será superior a 0,15. Para comprobar esta hipótesis extrae una muestra aleatoria de 60 alumnos procedentes
de la UNED y otra de 100 alumnos procedentes de otras universidades. Somete a ambas muestras a un examen con el
temario de las oposiciones, que es superado por 33 alumnos de la UNED y 30 de otras universidades. Con un nivel de
confianza del 95%, ¿podemos afirmar que los datos que maneja el director de la academia son correctos?
n 1 60 Aprob.1 33 D 0.15 p1 0.55
n 2 100 Aprob.2 30 p2 0.30
Z 1.27
el nombre que se da a una familia de índices que miden el efecto que tiene un tratamiento. Es decir, es un índice que se aplica
grupos, uno de tratamiento y otro de control. Difiere de los contrastes clásicos en que es independiente del tamaño muestral. Este
en el ámbito del meta-análisis aplicado a la psicología, educación, etc.
índice, y teniendo en cuenta que es un medida estandarizada, Cohen (1988) propuso una gradación de la magnitud del efecto en
5” y “grande: d = 0,8 o superior”.
IACIÓN TÍPICA CONJUNTA DE AMBOS Se realiza un experimento por el que se trata de estudiar si la verbalización del
SUS VARIANZAS SON HOMOGÉNEAS proceso facilita la realización de tareas manuales complejas. Se seleccionan
aleatoriamente 60 sujetos y se asignan 30 a cada uno de dos grupos: el experimental,
en el cual los sujetos verbalizan la tarea, y el de control, en el que los sujetos realizan
la tarea en silencio. Como variable dependiente se registra
el tiempo en segundos que se requiere para completar la tarea. Para el grupo control
se obtuvo una media igual a 237 y cuasidesviación típica igual a 38 y para el
experimental media igual a 205 y cuasidesviación típica igual a 35
GRADACIÓN DE LA MAGNITUD DEL EFECTO
PEQUEÑO d = 0,2
36.531
MEDIANO d = 0,5
-0.876 ͌ -0.88
GRANDE d = 0,8, ó sup
cada una de las
terapia contra la
s a medirlo después
ero hay una relación
hermanos son
ar pares de sujetos
75; 6,5.
75; 6,5.
a t de Student con (n1
la t de Student, y
r y n2 – 1 grados de
ones es igual, mayor o
igual, menor o mayor
ice se le aplica la
USAR SÓLO LAS
CELDAS CON ESTE
COLOR
9.00
5.00
45.00
3.00
9.00
5.00
45.00
0.75
na puntuaciones en un nivel
os y niñas σ 21 = 36 y σ22 = 49
specto no ha sido
puede provocar diferencias
00 niños y otra muestra de
nza del 95%. ¿Podemos
na puntuaciones en un nivel
os y niñas σ 21 = 36 y σ22 = 49
specto no ha sido
puede provocar diferencias
00 niños y otra muestra de
nza del 95%. ¿Podemos
uiere comprobar si las

epresión superior a aquellas
itas obteniéndose una

a aleatoria de 31 personas
poniendo que las varianzas
decir que los datos obtenidos
H0 : µ1 - µ2 ≤ 0
H1 : µ1 - µ2 > 0
tn +n -2;1-α/2
1 2 2.6480
tn +n -2;1-α/2
1 2 2.6480
N.C. 99,5%
11.16595
-1.16595
arlo, se extrajeron dos

nes que se distribuyen
maco y los de la segunda una
en el que cuanto más
ansiedad?
fianza. Buscamos en las
gual al nivel de confianza,
los datos con los cálculos
intelectual (CI), pero distinta

seleccionamos
nteligencia en ambas
as que en el de mujeres vale
de decisión en función
nza. Buscamos en las
or, el valor crítico, con
ad calculados y el nivel
spondiente. Si el
raste es inferior al
ntiene la H0.
uados por la UNED, de los
universidades aprobaron 60.
proporción de aprobados es
ersidades?
3.75
0.26
nos para unas determinadas

or a la proporción de
esente curso dicha
e 60 alumnos procedentes
tras a un examen con el
dades. Con un nivel de
correctos?
n índice que se aplica
del tamaño muestral. Este
magnitud del efecto en
i la verbalización del
as. Se seleccionan
os grupos: el experimental,
n el que los sujetos realizan
a
area. Para el grupo control
gual a 38 y para el
ual a 35
UD DEL EFECTO
d = 0,2
d = 0,5
d = 0,8, ó sup
ANÁLISIS DE DATOS PARA D
GRUPOS. MUESTRAS REL
CONCEPTOS
Las muestras relacionadas tienen una ventaja sobre las independientes que consiste en que
relación entre ambas muestras, menor será la varianza de la distribución muestral de las dif

Contraste de hipótesis sobre dos medias en muestras relacionadas. Varianza poblacional c
Supongamos que tenemos una población compuesta por 4 sujetos a los que medimos la var
diferencias:

La población está formada por las diferencias: -2; 1, 2 y 5.
Distribución muestral de las diferencias:

La distribución muestral de las diferencias, estará formada por los valores:

Con media y varianza muestral:

Si conocemos la varianza poblacional de las diferencias, sería una distribución Z.

Contraste de hipótesis sobre dos medias en muestras relacionadas. Varianza poblacional d
media y la varianza insesgada de las puntuaciones de la diferencia.

Contraste de hipótesis sobre dos medias en muestras relacionadas. Varianza poblacional d
media y la varianza insesgada de las puntuaciones de la diferencia.

Ejemplo. Un psicólogo que trabaja en una empresa imparte un curso sobre asertividad. El ob
parte de su departamento. Antes del curso mide la asertividad mediante un test que proporc
indican un comportamiento asertivo. Al finalizar el curso el psicólogo aplica de nuevo el test
en la población la distribución de las diferencias es normal, ¿Podemos decir que el curso rea

La media, la varianza y la varianza insesgada (cuasi varianza), valen:

El contraste de hipótesis será:

El estadístico de contraste se distribuye según la t de Student con n – 1 grados de libertad.

Nivel crítico. Para averiguar el nivel crítico de forma aproximada, buscamos en la tabla t de S
en este caso para 9 grados de libertad observamos: - 3,25 < - 3 < - 2,821, por lo que el nivel
informático se puede calcular el nivel crítico de una forma más precisa, en este caso p = 0,0

Establecer la regla de decisión en función del nivel de confianza. Los grados de libertad del e
delimita cuando mantenemos o rechazamos la hipótesis nula, a un nivel de confianza del 95

Calculamos el intervalo de confianza:

Contraste de hipótesis sobre dos proporciones en muestras relacionadas. La VD es dicotómi

Contraste de hipótesis sobre dos proporciones en muestras relacionadas. La VD es dicotómi
supuestos no son tan estrictos como en el caso de las variables continuas. Tan sólo es precis
asumir la normalidad de la distribución muestral de las diferencias entre proporciones. Gen
la V.D. en dos momentos temporales distintos.
Se basa en que la distribución muestral de la diferencia de proporciones es una distribución
contraste. Para aplicar este estadístico con el fin de contrastar la H0, frente a la H1, el primer
Las respuestas de los N sujetos, recogidos en la tabla de contingencias, se reparten en las ce

Proporción de sujetos con respuesta de éxito “antes” del tratamiento:

Proporción de sujetos con respuesta de éxito “después” del tratamiento:
Contraste de hipótesis:

Por tanto:
Para calcular el estadístico Z:

Sólo se tiene en cuenta a los individuos que aportan información, es decir, aquellos que han

Para calcular el estadístico Z:

Sólo se tiene en cuenta a los individuos que aportan información, es decir, aquellos que han

También se puede calcular la Prueba de McNemar, mediante chi cuadrado con 1 grado de li
del cambio producido y que siempre es positivo, por eso nunca podemos plantear una hipó
dejamos todo α en la parte derecha de la distribución.
CONTRASTES DE HIPÓTESIS SOBRE DOS CONOCIDA LA VARIANZA POBLACIONAL

MEDIAS EN MUESTRAS RELACIONADAS DE LAS DIFERENCIAS
CONTRASTES DE HIPÓTESIS SOBRE DOS CONOCIDA LA VARIANZA POBLACIONAL
MEDIAS EN MUESTRAS RELACIONADAS DE LAS DIFERENCIAS
USAR SOLAMENTE LAS CELDAS DE ESTE COLOR
n 1 36 Ȳ1 21
n 2 36 Ȳ2 19
Z 1.50
σ2d 64 µd 0
Z1-α/2 2.58
5.44
I.C.
-1.44
CONTRASTES DE HIPÓTESIS SOBRE DOS DESCONOCIDA LA VARIANZA

MEDIAS EN MUESTRAS RELACIONADAS POBLACIONAL DE LAS DIFERENCIAS
SUJETO
ANTES
T -3 DESPUÉS
Para averiguar el nivel crítico de forma aproximada, buscamos en la tabla t de Student, di

con los grados de libertad correspondientes (g.l.= n.1) entre que valores se encuentra el
estadístico de contraste calculado. El nivel crítico p se encontrará entre los valores que
aparecen en la tabla
Para averiguar el nivel crítico de forma aproximada, buscamos en la tabla t de Student,
con los grados de libertad correspondientes (g.l.= n.1) entre que valores se encuentra el
estadístico de contraste calculado. El nivel crítico p se encontrará entre los valores que
aparecen en la tabla d 2i
-1.107
I.C.
-7.893
t1-α/2, n-1 2.262
Un empresario, antes de introducir en el mercado un determina

pregunta si comprarían o no dicho producto. A continuación les
CONTRASTES DE HIPÓTESIS SOBRE DOS de la demostración de las ventajas del producto “X”, 400 person
PROPORCIONES EN MUESTRAS lo comprarían. Por otro lado 60 personas estarían dispuestas a c
RELACIONADAS confianza del 99% que, la demostración del producto “X” ha sido
ESTADÍSTICO DE CONTRASTE
FORMULACIÓN DE HIPÓTESIS
ESTADÍSTICO DE MCNEMAR
La diferencia entre los estadísticos Z y χ2 ,
consiste en que el estadístico es insensible a la
dirección del cambio producido
S DE DATOS PARA DISEÑOS DE DOS
OS. MUESTRAS RELACIONADAS.
CONCEPTOS
es que consiste en que nos ayudan a reducir la varianza del error, de maneta que cuanto mayor sea la
ción muestral de las diferencias, obteniendo por lo tanto un estadístico de contraste mayor.
Varianza poblacional conocida. Confeccionamos primero la distribución muestral de las diferencias.
los que medimos la variable dependiente antes y después de una terapia, siendo sus puntuaciones y sus
s valores:
tribución Z.
Varianza poblacional de las diferencias desconocida. Calculamos las diferencias, sus cuadrados, la
Varianza poblacional de las diferencias desconocida. Calculamos las diferencias, sus cuadrados, la
sobre asertividad. El objetivo del curso consiste en fomentar esta habilidad en los directivos que forman
nte un test que proporciona medidas en una escala de intervalo, y en el que las puntuaciones altas
aplica de nuevo el test de asertividad a los asistentes. Con un nivel de confianza del 95%. Suponiendo que
s decir que el curso realizado por el psicólogo ha incrementado la asertividad de los directivos?
n:
1 grados de libertad.
camos en la tabla t de Student del apéndice entre que valores se encuentra el estadístico de contraste,
21, por lo que el nivel crítico p se encontrará entre los valores: 0,005 < p < 0,01 (con un programa
a, en este caso p = 0,0075 ).
grados de libertad del ejemplo son: n – 1 = 9. Acudiendo a la tabla t de Student, el valor crítico que
vel de confianza del 95%, es - 1’833.
das. La VD es dicotómica. Una de las ventajas de trabajar con datos dicotómicos consiste en que los
das. La VD es dicotómica. Una de las ventajas de trabajar con datos dicotómicos consiste en que los
nuas. Tan sólo es preciso que los tamaños de las muestras sean lo suficientemente grandes para poder
ntre proporciones. Generalmente se empleará este contraste cuando se miden los datos de la muestra en
nes es una distribución normal cuando se trabaja con muestras grandes, siendo Z el estadístico de
rente a la H1, el primer paso consiste en organizar una tabla de contingencias 2 x 2.
s, se reparten en las celdas a, b, c y d.

:
nto:
decir, aquellos que han obtenido resultados distintos bajo una u otra condición (b y c).
2
decir, aquellos que han obtenido resultados distintos bajo una u otra condición (b y c).
drado con 1 grado de libertad. La diferencia entre Z y χ2, es que éste último es insensible a la dirección
mos plantear una hipótesis unilateral con dicho estadístico. Al aplicar la prueba de McNemar siempre
Un psicólogo escolar está interesado en estudiar si la presión de los padres para el rendimiento escolar es igual en
chicos y en chicas. Toma una muestra aleatoria de 36 parejas de hermanos (chico y chica), y mediante un test que
proporciona medidas en una escala de intervalo mide la variable “presión para el rendimiento escolar” en todos los
individuos. La media para los chicos (Grupo 1) fue igual a 21 y para el grupo de chicas fue igual a 19. Suponemos que
conocemos la varianza poblacional de las diferencias y que es igual a 64. A un nivel de confianza del 99%. ¿Es igual la
presión para el rendimiento escolar en chicos y chicas?
Un psicólogo escolar está interesado en estudiar si la presión de los padres para el rendimiento escolar es igual en
chicos y en chicas. Toma una muestra aleatoria de 36 parejas de hermanos (chico y chica), y mediante un test que
proporciona medidas en una escala de intervalo mide la variable “presión para el rendimiento escolar” en todos los
individuos. La media para los chicos (Grupo 1) fue igual a 21 y para el grupo de chicas fue igual a 19. Suponemos que
conocemos la varianza poblacional de las diferencias y que es igual a 64. A un nivel de confianza del 99%. ¿Es igual la
presión para el rendimiento escolar en chicos y chicas?
El resultado obtenido de Z, lo buscamos en la tabla de curva normal. Su valor, lo empleamos para el cálculo del nivel
crítico p. En caso de que el contraste sea bilateral, se multiplica 2 por el valor encontrado en las tablas y así
obtendremos p
Un psicólogo que trabaja en una empresa imparte un curso sobre asertividad. El objetivo del curso consiste en fomentar
esta habilidad en los directivos que forman parte de su departamento. Antes del curso mide la asertividad mediante un
test que proporciona medidas en una escala de intervalo, y en el que las puntuaciones altas indican un comportamiento
asertivo. Al finalizar el curso el psicólogo aplica de nuevo el test de asertividad a los asistentes.
Con un nivel de confianza del 95%. Suponiendo que en la población la distribución de las diferencias es normal,
¿Podemos decir que el curso realizado por el psicólogo ha incrementado la asertividad de los directivos?
SUJETO 1 2 3 4 5 6 7 8 9 10 n 10 µd
ANTES 18 24 25 24 27 30 24 31 24 28 Ȳ1 25.5 g.l.
DESPUÉS 24 23 34 22 34 40 35 31 27 30 Ȳ2 30
di -6 1 -9 2 -7 -10 -11 0 -3 -2 D -4.5
d 2i 36 1 81 4 49 100 121 0 9 4 ∑ 405
S2d 20.25
Ŝ2d 22.5
en el mercado un determinado producto “X”, toma una muestra aleatoria de 500 sujetos de la población a la que quiere dirigirse y les
producto. A continuación les muestra las posibles ventajas que aporta el producto “X” y les vuelve a preguntar si lo comprarían. Antes
del producto “X”, 400 personas declaran que no lo comprarían, mientras que después de la demostración son 380 personas las que no
sonas estarían dispuestas a comprar el producto “X” tanto antes como después de la demostración. ¿Podemos afirmar al nivel de
ción del producto “X” ha sido eficaz?
COMPRARÍA "X" DESPUÉS DE LA

DEMOSTRACIÓN?
SI NO
SI a= 60 b= 40
COMPRARÍA "X" ANTES DE LA
DEMOSTRACIÓN? NO c= 60 d= 340
120 380
Z -2
χ2 4
,
le a la
uanto mayor sea la
e mayor.
de las diferencias.
us puntuaciones y sus
us cuadrados, la
us cuadrados, la
irectivos que forman

tuaciones altas
95%. Suponiendo que
directivos?
dístico de contraste,
n un programa
valor crítico que
nsiste en que los

nsiste en que los
grandes para poder
datos de la muestra en
l estadístico de
y c).
y c).
nsible a la dirección
McNemar siempre
ento escolar es igual en

y mediante un test que
ento escolar” en todos los
gual a 19. Suponemos que
fianza del 99%. ¿Es igual la
ento escolar es igual en
y mediante un test que
ento escolar” en todos los
gual a 19. Suponemos que
fianza del 99%. ¿Es igual la
os para el cálculo del nivel

en las tablas y así
el curso consiste en fomentar

e la asertividad mediante un
s indican un comportamiento
tes.
iferencias es normal,
os directivos?
µd 0
g.l. 9
a la que quiere dirigirse y les
untar si lo comprarían. Antes
son 380 personas las que no
emos afirmar al nivel de
TOTALES
100
400
500
DISEÑOS DE MÁS DE D
INDEPENDIENTES. CO
El análisis de varianza (ANOVA) es una técnica de análisis estadístico que se utiliza para com
estudio de la variabilidad observada en los datos.

La regla general para el cálculo de comparaciones a realizar, son las combinaciones del núm
combinaciones posibles son: a (a – 1) / 2. Con el aumento del número de comparaciones, ta
incrementa la probabilidad de rechazar la H0, siendo cierta.

A la hora de realizar un estudio, podemos considerar la variabilidad que se observa a través
partes o componentes:

La que se debe al efecto del factor estudiado, por ejemplo, a las distintas dosis de un fármac
La que se debe a los factores extraños y no controlados, que es lo que recibe el nombre de e
La tarea estará en discernir qué variabilidad corresponde a cada parte y éste es el cometido

Las V.I. que se estudian reciben el nombre de factores y las categorías en que se dividen, n

Diseño de efectos aleatorios o modelo aleatorio. Es aquel en el que los niveles son una mu
a ser para todos ellos. Por ejemplo: una muestra de 3 provincias españolas (pueden ser cua

Diseño de efectos fijos o modelos fijos. Es aquel en el que nuestras conclusiones estarán re
más niveles, pero sólo nos interesan estos. Por ejemplo: una muestra de las provincias de la

Si los grupos o muestras son de distinto número de elementos, el modelo recibe el nombre
tendremos un modelo equilibrado.

En el ANOVA, la H0 que se establece consiste en afirmar que no existe diferencia entre las µ
dichas hipótesis va a ser a través de la variabilidad observada en las puntuaciones.
Un modo de controlar las variables extrañas, es la aleatorización de sujetos, tanto en el mue
asegura que las diferencias observadas entre los niveles no sea fruto del efecto conjunto de

La propia variabilidad de los sujetos sometidos al mismo tratamiento, nos proporciona una

En el modelo más simple del ANOVA (un solo factor), se trataría de realizar dos estimacione

La varianza atribuible a los distintos niveles del factor en estudio, que es lo que conocemos
La varianza atribuible al error, que es o que conocemos como cuasivarianza del error, o tam

La propia variabilidad de los sujetos sometidos al mismo tratamiento, nos proporciona una

En el modelo más simple del ANOVA (un solo factor), se trataría de realizar dos estimacione

La varianza atribuible a los distintos niveles del factor en estudio, que es lo que conocemos
La varianza atribuible al error, que es o que conocemos como cuasivarianza del error, o tam

De la comparación entre ambas, obtenemos la aceptación o rechazo de la H0.

Análisis de varianza de un factor (modelo de efectos fijos). La puntuación Yij, es la puntuació

Un componente al que llamamos αi y que será común a todos los elementos sometidos a es
El componente del error experimental, formado por todos los factores no controlados en el
los niveles, de ahí los dos subíndices).
Una constante, común para todos los valores de la V.D, que llamaremos µ, dado que es la m

La acción de estos tres componentes se supone lineal.

Siendo:

Las hipótesis estadísticas que queremos probar en este tipo de problemas son del tipo:

H0: µ1 = µ2 = µ
H1: µ1 ≠ µ2 ≠ µ3…… ≠ µa (al m

Los supuestos de este contraste de hipótesis son:
Independencia de las observaciones

Normalidad de las distribuciones

Homogeneidad de las varianzas (homocedasticidad)

El estadístico de contraste para poner a prueba la H0 de igualdad de medias entre todos los
grupos (estimada mediante la media cuadrática inter grupos) y la varianza dentro de los gru

Normalidad de las distribuciones

Homogeneidad de las varianzas (homocedasticidad)

El estadístico de contraste para poner a prueba la H0 de igualdad de medias entre todos los
grupos (estimada mediante la media cuadrática inter grupos) y la varianza dentro de los gru

Variabilidad del sistema.
Donde:

SCTOTAL es la suma de cada puntuación menos la media total al cuadrado

SC INTER es la suma de la media de cada nivel menos la media total al cuadrado (ponderad
variabilidad entre los niveles, o variabilidad debida al efecto del factor (A) que estamos estu

SCINTRA es la suma de cada puntuación menos la media de su nivel al cuadrado, es decir, n
error experimental. Representa las desviaciones de las puntuaciones de cada sujeto respect

A su vez, si estas SC las dividimos por a – 1 y N – a, respectivamente, obtendremos la var
que denominaremos, las medias cuadráticas.
Recordemos que la cuasivarianza es igual a la suma de cuadrados de las desviaciones de la m

Varianza entre los grupos, que llamaremos media cuadrática intergrupos y que refleja la va

Varianza dentro de los grupos, que llamaremos media cuadrática intragrupos, y que refleja

De la comparación de ambas varianzas obtenemos la aceptación o rechazo de la hipótesis
mediante el estadístico F.
Tabla de ANO

Tabla de ANO

Siendo a el número de niveles del factor A.

Cálculo del ANOVA.

Ejemplo ilustrativo. Supongamos que tenemos una muestra aleatoria de nueve sujetos que
dosis distintas de cierta droga (0,05 mg, 0,10 mg y 0,20 mg). Queremos comprobar si estas d
Las hipótesis estadísticas que queremos probar son:

H0: µ1 = µ2
H1: µ1 ≠ µ2 ≠ µ3 (al menos

Calculamos la suma de todas las puntuaciones y de todos los cuadrados.

Calculamos a continuación las sumas de los cuadrados.

Construimos ya con estos datos, la tabla ANOVA.

Establecer la regla de decisión en función del nivel de confianza. Cuando realizamos un anál
dejaremos todo el nivel de significación (α) por la parte derecha de la distribución. Por lo ta
igual a 1 - α. En nuestro caso 1 – α = 0,95. Para este nivel de confianza con 2 y 6 grados de li

Conclusión. Con un nivel de confianza del 95% no podemos rechazar la hipótesis nula, pues

En cuanto al nivel crítico p, con un programa informático adecuado, comprobaríamos que e
que el nivel crítico es p > 0,10, puesto que para 2 y 6 grados de libertad observamos que la p

Interpretar el resultado en función del contexto de la investigación. Con un nivel de confian
forma distinta sobre la ansiedad.

Cálculo del ANOVA mediante razones básicas.

Ejemplo ilustrativo: Supongamos un grupo de fumadores que quieren dejar este hábito y es
terapia conductual (a1), hipnosis (a2) y administración de un fármaco (a3). En total se selec
tratamiento, los cuales son asignados aleatoriamente a cada uno de los grupos. En el transc
dependiente fue el número de cigarrillos fumados el día después de seis meses de terapia.

Comparaciones múltiples. Permiten establecer una información más exacta sobre la import

La primera se refiere a la situación más común en la que el investigador, una vez realizado e
debidas al azar. Se trata de las comparaciones no planificadas, a posteriori o post hoc.
La segunda se refiere a cuando el investigador no está interesado en realizar un ANOVA par
del factor, no en todas las posibles, y sabe de antemano qué comparaciones le interesan. Se

Comparaciones planificadas o a priori. Supongamos que estamos interesados en conocer e
conductuales (vamos a suponer cuatro terapias). Tomamos un grupo de sujetos que puntúa
y los otros 4 serán tratados. Al finalizar medimos la V.D. Tendríamos entonces que comparar

Comparaciones no planificadas, a posteriori o post hoc. Prueba de comparaciones múltiple
trabajando, sin aumentarlo en todas las posibles comparaciones que realicemos y obtiene u
Scheffé) por encima de la cual diremos que hay diferencias entre las medias o entre los grup

Donde ci son los coeficientes de las combinaciones lineales que podemos establecer ent
ANOVA.

Por ejemplo. Tenemos tres niveles del factor A y queremos hacer todas las combinaciones p
Observamos que cuando uno de los coeficientes es 0 esto significa que elimina a ese grupo
valores de los coeficientes deben reflejar los grupos a comparar y el tipo de comparación. P

Vamos a ver un caso práctico. Supongamos que tenemos una muestra aleatoria de 21 sujet
de 7 sujetos cada uno. Les suministramos tres dosis distintas de una cierta droga: 0,05 mg, 0
de los sujetos. Se cumplen los supuestos de independencia de las observaciones, normalida
intervalo. Una vez realizado el Análisis de Varianza, los resultados fueron:

Si acudimos a las tablas de la distribución F, el valor crítico para 2 y 18 grados de libertad, tr

resultado con el de las tablas vemos que el estadístico de contraste supera al valor crítico (5
¿entre qué pares de medias está la diferencia que hace que rechacemos la hipótesis nula?

Si queremos comparar todas las medias entre sí, tenemos tres posibles comparaciones, y es
Realizamos las comparaciones para cada par de medias.

La única diferencia significativa (responsable que hayamos rechazado la hipótesis nula e

de CR.

CÁLCULO DEL ANOVA MEDIANTE EL
MÉTODO CLÁSICO FORMULACIÓN DE HIPÓTESIS
a1 a2 a3 a21 a22 a 23
5 6 2 25 36 4
8 7 4 64 49 16
4 8 16 64
3 9
∑ 20 21 6 114 149 20
∑ 20 21 6 114 149 20
n 4 3 2
Ȳ 5 7 3 28.50 49.67 10.00
F.V. S.C. g.l.

Inter 19.56 2
Intra 18.00 6
Total 37.56 8
Cuando realizamos un análisis de la varianza y aunque la hipótesis alternativa siempre será bilateral, dejaremos todo
las tablas la puntuación que supera una proporción igual a 1 - α, con los g.l. del Inter e Intra. En el caso del N.C. 95%,
calculado en la tabla ANOVA, y si éste, es menor, que el valor crítico encontrado en la tabla de F, no podremos recha

CÁLCULO DEL ANOVA MEDIANTE LAS
RAZONES BÁSICAS FORMULACIÓN DE HIPÓTESIS
a1 a2 a3 a21 a22 a 23
4 7 7 16 49 49
3 9 5 9 81 25
7 10 5 49 100 25
8 11 5 64 121 25
9 14 6 81 196 36
12 11 144 121
12 11 144 121
∑ 31 63 39 219 691 281
n 5 6 6
Ȳ 6.2 10.5 6.5 43.80 115.17 46.83
F.V. S.C. g.l.

Inter 66.67 2
Intra 83.80 14
Total 150.47 16
Cuando realizamos un análisis de la varianza y aunque la hipótesis alternativa siempre será bilateral, dejaremos todo
las tablas la puntuación que supera una proporción igual a 1 - α, con los g.l. del Inter e Intra. En el caso del N.C. 95%,
calculado en la tabla ANOVA, y si éste, es menor, que el valor crítico encontrado en la tabla de F, no podremos recha
Supongamos que tenemos una muestra aleatoria de 21 sujetos q

PRUEBA DE COMPARACIONES suministramos tres dosis distintas de una cierta droga: 0,05 mg,
MÚLTIPLES DE SCHEFFÉ (CRITICAL cumplen los supuestos de independencia de las observaciones, n
obtuvimos los datos señalados más abajo.
RANGE DE SCHEFFÉ)
F.V. S.C.
Inter 180.92
Intra 292.86
Total 473.78
Ȳ1-Ȳ2 3.72 Comparamos estos valores si son mayor o menor

que CR de Scheffé, para averiguar si aceptamos la
Ȳ1-Ȳ3 3.14
hipótesis nula (valor inferior a CR) o aceptamos la
hipótesis alternativa (valor superior a CR)
5.749
Ȳ2-Ȳ3 6.86
ÑOS DE MÁS DE DOS GRUPOS
EPENDIENTES. CONCEPTOS
que se utiliza para comparar medias de más de dos grupos, aunque su nombre hace referencia al
ombinaciones del número de grupos tomados de 2 en 2. Siendo a el número de muestras o grupos, las
o de comparaciones, también aumenta la probabilidad de cometer el Error Tipo I (α), esto es, se
ue se observa a través de las puntuaciones, después de haber introducido la V.I., como formada por dos
ntas dosis de un fármaco administrado.

e recibe el nombre de error experimental, dado que introduce una fuente de error en nuestro diseño.
e y éste es el cometido del ANOVA.
as en que se dividen, niveles.
los niveles son una muestra aleatoria de todos los posibles niveles del factor y nuestras conclusiones van
ñolas (pueden ser cualquiera).
onclusiones estarán restringidas a los niveles establecidos para el diseño. Sabemos que pueden existir
de las provincias de la Comunidad Valenciana.
delo recibe el nombre de modelo no equilibrado. En el caso que todas las muestras sean iguales,
e diferencia entre las µ de los distintos grupos o muestras en la V.D., aunque el modelo a contrastar
puntuaciones.
ujetos, tanto en el muestreo como en la asignación a las condiciones experimentales o niveles, pero no
del efecto conjunto de la V.I. y de factores azarosos introducidos en el propio proceso.
, nos proporciona una buena estimación del error experimental.

ealizar dos estimaciones independientes de la varianza general o común (desconocida) por medio de:
es lo que conocemos como cuasivarianza intergrupos.
rianza del error, o también, cuasivarianza intragrupos.
, nos proporciona una buena estimación del error experimental.
ealizar dos estimaciones independientes de la varianza general o común (desconocida) por medio de:
es lo que conocemos como cuasivarianza intergrupos.
rianza del error, o también, cuasivarianza intragrupos.
de la H0.
ción Yij, es la puntuación Y del sujeto que ocupa el lugar j en el nivel i. Está formada por:
mentos sometidos a ese nivel del factor.

es no controlados en el experimento, y que llamamos ε ij (que puede afectar a todos los sujetos y en todos
os µ, dado que es la media de la población.
emas son del tipo:
H0: µ1 = µ2 = µ3…… = µa
…… ≠ µa (al menos para un par de µi)
medias entre todos los niveles del factor manipulado consiste en el cociente entre la varianza entre los
ianza dentro de los grupos (estimada mediante la media cuadrática intra grupos).
medias entre todos los niveles del factor manipulado consiste en el cociente entre la varianza entre los
ianza dentro de los grupos (estimada mediante la media cuadrática intra grupos).
drado
al cuadrado (ponderado por el número de sujetos de cada nivel) es decir, nos está midiendo la
r (A) que estamos estudiando.
al cuadrado, es decir, nos está midiendo la variabilidad dentro de cada nivel o variabilidad debida al
de cada sujeto respecto de la media de su grupo.
te, obtendremos la varianza insesgada ENTRE los niveles y la variaza insesgada DENTRO de los niveles, lo
las desviaciones de la media, dividido por los grados de libertad.
upos y que refleja la varianza atribuible a los distintos niveles del factor en estudio.
ragrupos, y que refleja la variabilidad atribuible al error.
echazo de la hipótesis nula. Por otro lado, podemos contrastar si dos varianzas son iguales o diferentes
Tabla de ANOVA.
Tabla de ANOVA.
de nueve sujetos que puntúan alto en ansiedad con los que formamos tres grupos en función de tres
os comprobar si estas dosis influyen en el estado de ansiedad de los sujetos.
H0: µ1 = µ2 = µ3
2 ≠ µ3 (al menos para un par de µi)
drados.
ndo realizamos un análisis de la varianza y aunque la hipótesis alternativa siempre será bilateral,
a distribución. Por lo tanto, tenemos que buscar en las tablas la puntuación que supera una proporción
a con 2 y 6 grados de libertad, el valor de la tabla es: F 0,95;2;6 = 5,143.
la hipótesis nula, puesto que el estadístico de contraste (3,26) es menor que el valor crítico (5,143).
omprobaríamos que es igual a p = 0,1101. Con las tablas que manejamos tan sólo podríamos concluir
ad observamos que la puntuación que supera una proporción de 0,90 es igual a 3,463.
on un nivel de confianza del 95% no podemos afirmar que los tratamientos suministrados influyan de
n dejar este hábito y están dispuestos a participar en un ensayo en el que se prueban diversas terapias:
o (a3). En total se seleccionan 18 sujetos que consumen 2 cajetillas diarias (40 cigarrillos) antes del
os grupos. En el transcurso de la experiencia un sujeto del grupo a1 abandona la terapia. La variable
seis meses de terapia.
exacta sobre la importancia de cada uno de los niveles de la V.I. Cabe distinguir dos situaciones básicas:
or, una vez realizado el ANOVA y rechazada la H0, desea conocer entre qué medidas hay diferencias no
eriori o post hoc.
realizar un ANOVA para probar todas las medias, sino sólo en algunas comparaciones entre los niveles
aciones le interesan. Se trata de comparaciones planificadas o a priori.
eresados en conocer el efecto que sobre la reducción de la ansiedad tiene el realizar terapias
de sujetos que puntúan semejante en ansiedad y los distribuimos en 5 grupos: uno será el grupo control
entonces que comparar el grupo de control con los otros cuatro (4 comparaciones).
omparaciones múltiples de Scheffé. Esta prueba fija la tasa de error tipo I en el α que estamos
realicemos y obtiene un valor al que llamada diferencia mínima o rango crítico (Critical Range de
medias o entre los grupos de medias que estemos comparando.
odemos establecer entre las distintas medias a comparar y el resto de valores que se pueden obtener del
as las combinaciones posibles 2 a 2 de las medias.
ue elimina a ese grupo de la comparación. Cuando las comparaciones implican a más de dos grupos, los
tipo de comparación. Por ejemplo:
ra aleatoria de 21 sujetos que puntúan alto en ansiedad y los distribuimos aleatoriamente en tres grupos
cierta droga: 0,05 mg, 0,10 mg y 0,20 mg. Queremos ver si estas dosis influyen en el estado de ansiedad
servaciones, normalidad de las distribuciones y homocedasticidad. La variable dependiente es de
ron:
8 grados de libertad, trabajando con un nivel de confianza del 95%, es 3,555. Comparando nuestro
upera al valor crítico (5,069 > 3,555) por lo que rechazaremos la H 0 de igualdad de medias. Ahora bien,
mos la hipótesis nula?
es comparaciones, y establecemos tres combinaciones lineales:
ado la hipótesis nula en el análisis de varianza ómnibus) se da entre los grupos 2 y 3, que supera el valor
Supongamos que tenemos una muestra aleatoria de nueve sujetos que puntúan alto en ansiedad con
LDAS DE ESTE COLOR los que formamos tres grupos en función de tres dosis distintas de cierta droga (0,05 mg, 0,10 mg y
0,20 mg). Queremos comprobar si estas dosis influyen en el estado de ansiedad de los sujetos.
Suponemos que se cumplen los supuestos de independencia de las observaciones, normalidad de las
distribuciones y homocedasticidad. Nivel de confianza 95%.
TESIS
a1 = 0,05 a2 = 0,10 a3 = 0,20
5 6 2 CON n DISTINTOS, SE
8 7 4 DICE QUE NO ESTÁ
EQUILIBRADO
4 8
3
∑∑Yij 47
∑∑Y2ij 283
SCTOTAL 37.556
SCINTER 19.556
SCINTRA 18
M.C. F
9.78 3.26
3.00
4.69
erá bilateral, dejaremos todo el nivel de significación (α) por la parte derecha de la distribución. Por lo tanto, tenemos que buscar en
ntra. En el caso del N.C. 95%, sería: F0,95; g.l. Inter; g.l. Intra. El valor que arroje la tabla de F, lo compararemos con el estadístico de contraste
abla de F, no podremos rechazar la hipótesis nula.
Supongamos que tenemos una muestra aleatoria de nueve sujetos que puntúan alto en ansiedad con
LDAS DE ESTE COLOR los que formamos tres grupos en función de tres dosis distintas de cierta droga (0,05 mg, 0,10 mg y
0,20 mg). Queremos comprobar si estas dosis influyen en el estado de ansiedad de los sujetos.
Suponemos que se cumplen los supuestos de independencia de las observaciones, normalidad de las
distribuciones y homocedasticidad. Nivel de confianza 95%.
TESIS
a1 a2 a3
4 7 7 CON n DISTINTOS, SE
3 9 5 DICE QUE NO ESTÁ
EQUILIBRADO
7 10 5
8 11 5
9 14 6
12 11
[A] 1107.2
T 133 [T] 1040.53
[Y] 1191
SCTOTAL 150.47
SCINTER 66.671
SCINTRA 83.8
M.C. F
33.34 5.569
5.99
erá bilateral, dejaremos todo el nivel de significación (α) por la parte derecha de la distribución. Por lo tanto, tenemos que buscar en
ntra. En el caso del N.C. 95%, sería: F0,95; g.l. Inter; g.l. Intra. El valor que arroje la tabla de F, lo compararemos con el estadístico de contraste
abla de F, no podremos rechazar la hipótesis nula.
stra aleatoria de 21 sujetos que puntúan alto en ansiedad y los distribuimos aleatoriamente en tres grupos de 7 sujetos cada uno. Les
e una cierta droga: 0,05 mg, 0,10 mg y 0,20 mg. Queremos ver si estas dosis influyen en el estado de ansiedad de los sujetos. Se
encia de las observaciones, normalidad de las distribuciones y homocedasticidad. La V.D. es de intervalo. Una vez realizada el ANOVA,
abajo.
S.C. g.l. M.C. F Ȳ1 11.7143
180.92 2 90.46 5.560 Ȳ2 15.43
292.86 18 16.27 Ȳ3 8.57
473.78 20 F0,95;2;18 n 7
3.555
CRScheffé 5.749029731802
5.749
ce referencia al
uestras o grupos, las

α), esto es, se
omo formada por dos
en nuestro diseño.
stras conclusiones van
s que pueden existir
s sean iguales,
delo a contrastar
es o niveles, pero no
eso.
da) por medio de:

da) por medio de:
por:
los sujetos y en todos
a varianza entre los

a varianza entre los
midiendo la
abilidad debida al
NTRO de los niveles, lo
n iguales o diferentes
en función de tres
será bilateral,
pera una proporción
or crítico (5,143).
podríamos concluir
63.
strados influyan de
an diversas terapias:
rillos) antes del
erapia. La variable
s situaciones básicas:
s hay diferencias no
es entre los niveles
ar terapias
o será el grupo control
ue estamos
tical Range de
se pueden obtener del
ás de dos grupos, los

amente en tres grupos
l estado de ansiedad
endiente es de
arando nuestro
medias. Ahora bien,
3, que supera el valor

untúan alto en ansiedad con
droga (0,05 mg, 0,10 mg y
siedad de los sujetos.
rvaciones, normalidad de las
nto, tenemos que buscar en
el estadístico de contraste
untúan alto en ansiedad con

droga (0,05 mg, 0,10 mg y
siedad de los sujetos.
rvaciones, normalidad de las
nto, tenemos que buscar en
os de 7 sujetos cada uno. Les

edad de los sujetos. Se
Una vez realizada el ANOVA,
11.7143
15.43
8.57
7
DISEÑOS DE MÁS DE DOS
MUESTRAS RELACIONADAS
Diseños de medidas repetidas o diseños de medidas dependientes. A cada sujeto se le rep

factor manipulado. Las puntuaciones de un mismo sujeto muestran dependencia estadística

Diseño intra sujetos. Se introduce un factor experimental más, en la tabla ANOVA, represen
diseño inter sujetos.

Sumas cuadráticas. SCA: Variabilidad del factor que estamos manipulando. SCS: Variabilidad
sujetos S.

SCTOTAL = SCA + SC

Supuestos que deben cumplirse para aplicar un ANOVA de un factor intra sujetos:

La V.D. (Y) debe estar medida, al menos, a un nivel de intervalo o de razón.
Las puntuaciones de la V.D. Y en cada nivel del factor deben ser independientes entre sí.
Las puntuaciones de la V.D. Y en cada nivel del factor deben distribuirse según la curva norm
Las varianzas de las puntuaciones para los distintos niveles del factor debes ser iguales entr
Las covarianzas entre todos los niveles del factor deben ser iguales entre sí.

Estadístico de contraste para la tabla ANOVA intrasujetos. El estadístico es F.

Razones básicas:

Sumas de cuadrados:

Sumas de cuadrados:

AS es el sumatorio de cada puntuación al cuadrado. La tabla ANOVA que tenemos que cons

Supongamos que en un experimento de Stroop clásico con tres condic
Con la letra mayúscula A designamos al factor, representando el núme
CÁLCULO DEL ANOVA MEDIANTE LAS aparece en el grueso de la tabla representa la media de TR para varios
(ficticio) se hubiesen utilizado 100 ensayos por condición, esto signific
RAZONES BÁSICAS incongruente y 100 para la neutral). Esto señala un inconveniente de l
ensayos que en el diseño inter-sujetos, lo cual puede introducir efecto
En nuestro ejemplo las condiciones experimentales se presentaron en
la incongruente y por último la neutral; otros pasarían primero por la n
luego la neutral y por último, la congruente). A este procedimiento me
contrabalanceo de las condiciones experimentales. No obstante, esta
mismo tipo se presentan agrupados. En el caso de que todos los estím
congruente a1 incongruente neutral a3 Si S 2i
a2
S1 0.545 0.832 0.620 1.997 3.988
S2 0.630 0.736 0.635 2.001 4.004
S3 0.610 0.663 0.680 1.953 3.814
S4 0.680 0.715 0.660 2.055 4.223
S5 0.590 0.880 0.700 2.170 4.709
S6 0.600 0.790 0.670 2.060 4.244
A1 3.655 4.616 3.965 12.236 24.982
A 21 13.359 21.307 15.721 50.388

F.V.
Factor (A)
Factor (S)
Error (AxS)
Total
OS DE MÁS DE DOS GRUPOS CON
RAS RELACIONADAS. CONCEPTOS
A cada sujeto se le repite la medición de la V.D. en diversas condiciones, tantas como niveles tenga el
ependencia estadística entre ellas.
tabla ANOVA, representado por (AxS). Si fuese fuera de paréntesis o AxS, estaríamos representando un
ando. SCS: Variabilidad de los sujetos. SC(AxS): Variabilidad debida a la interacción entre el factor A y los
SCTOTAL = SCA + SCS + SC(AxS)

ntra sujetos:
azón.
pendientes entre sí.
se según la curva normal.
debes ser iguales entre sí.
ntre sí.
co es F.
que tenemos que construir, sigue el modelo:
troop clásico con tres condiciones hemos obtenido las puntuaciones medias de TR que se observan en la tabla a continuación.
ctor, representando el número de niveles por la misma letra pero en minúscula. En nuestro caso a = 3. Cada valor numérico que
ta la media de TR para varios ensayos (por ejemplo la media en 50 ó 100 ensayos para cada uno de los valores). Si en el experimento
s por condición, esto significaría que cada sujeto habría tenido que realizar 300 ensayos (100 para la condición congruente, 100 para la
señala un inconveniente de los diseños intra-sujetos, a saber, a igualdad de condiciones, los participantes son sometidos a muchos más
cual puede introducir efectos de fatiga y/o aprendizaje.
imentales se presentaron en diferente orden para cada sujeto (a unos sujetos se les presentaría primero la condición congruente, luego
ros pasarían primero por la neutral, luego la congruente y por último, la neutral; otros pasarán primero por la condición incongruente,
te). A este procedimiento metodológico para evitar que el orden de los tratamientos interfiera con los resultados se le conoce como
mentales. No obstante, esta necesidad de contrabalanceo sólo se presenta si utilizamos un diseño en que todos los estímulos del
l caso de que todos los estímulos se presentaran aleatoriamente, el control metodológico del contrabalanceo no tendría sentido.
∑Ai 12.236 [A] 8.398
∑A2i 50.388 [S] 8.327
∑S2j 24.982 [T] 8.318
[AS] 8.444
s 6
SCA 0.080
a 3
SCS 0.009
SC(AxS) 0.037
SCTOTAL 0.1265
F.V. S.C. g.l. M.C. F

Factor (A) 0.080 2 0.0401 10.888
Factor (S) 0.009 5 0.0019 Consultamos el valor crítico, en la tabla F de

Fisher. En el caso del N.C. 95%, sería: F0,95; g.l. Factor
(A); g.l. Error (AxS). El valor que arroje la tabla de F, lo
Error (AxS) 0.037 10 0.0037 compararemos con el estadístico de contraste
calculado en la tabla ANOVA, y si éste, es menor,
Total 0.127 17 0.0074 que el valor crítico encontrado en la tabla de F,
no podremos rechazar la hipótesis nula.
mo niveles tenga el
os representando un
tre el factor A y los

tabla a continuación.
da valor numérico que
ores). Si en el experimento
dición congruente, 100 para la
son sometidos a muchos más
a condición congruente, luego

or la condición incongruente,
ultados se le conoce como
todos los estímulos del
ceo no tendría sentido.
crítico, en la tabla F de
N.C. 95%, sería: F0,95; g.l. Factor
que arroje la tabla de F, lo
ANOVA, y si éste, es menor,
ncontrado en la tabla de F,
ar la hipótesis nula.
DISEÑOS DE MÁS DE DOS
INDEPENDIENTES. ANOVA DE D
SÓLO CONCEPTOS
Un diseño factorial es más eficiente que varios simples. Se pueden alcanzar conclusiones sobre los efectos principales de

Efectos principales: tantos como factores haya.

Hay tantos efectos simples como la suma de niveles de cada factor (2 V.I. que tienen cada una 3 y 2 niveles respectivame

El efecto de interacción se produce por los cruces de los niveles de cada uno de los factores, que está relacionado con lo
cruzarse, o se cruzarían de hecho, en algún lugar del plano.

Una interacción está presente cuando:

Cuando los patrones de diferencias asociados con una V.I. cambian con los diferentes niveles de la otra V.I.
Cuando los efectos simples de una V.I. no son los mismos en todos los niveles de la otra V.I.
Cuando los efectos principales de una V.I., no son representativos de los efectos imples de esa misma variable.
Cuando las diferencias entre las medias de las celdas que representan el efecto del factor en algún nivel del otro factor, n
Cuando los efectos de una de las V.I. están condicionalmente relacionado con los niveles de la otra V.I.
Cuando una V.I. no tiene un efecto constante en todos los niveles de la otra V.I.

Un diseño factorial consiste en un conjunto de diseños simples de un factor, en el cual, la misma variable independiente

Los efectos simples de una V.I. se refieren a las diferencias entre las medias para cada uno de los componentes del expe
efectos imples del factor A en el nivel b 1.

Las interacciones se definen en términos de las comparaciones entre un conjunto de efectos simple. Están presentes cua
niveles de la otra V.I.

Los efectos principales de una V.I., o factor, se refieren a los efectos promedio totales de una variable, y se obtienen com

Fuentes de variación en los diseños factoriales:

SCA: Refleja los efectos principales del factor A
SCB: Refleja los efectos principales del factor B
SCAxB: Refleja la interacción AxB
Formato de un diseño factorial.

SCA: Refleja los efectos principales del factor A
SCB: Refleja los efectos principales del factor B
SCAxB: Refleja la interacción AxB
Formato de un diseño factorial.

Cálculo de medias:

Cálculo de las razones básicas:
a = niveles del factor A. b = niveles del factor B. n = sujetos.

Tabla de ANOVA.

Tabla de ANOVA.

En un diseño de un único factor, SCINTER está basada en las desviaciones de las medias de cada tratamiento respecto a la m
medias de cada tratamiento conjunto AB, respecto de la media total, es decir:

ȲABij - ȲT

Para el factor A:
H0: µA1 = µA2 = µ
H1: µA1 ≠ µA2 ≠ µA3 (al menos para un

Para el factor B:
H0: µB1 = µB2 = µ

H1: µB1 ≠ µB2 ≠ µB3 (al menos para un

Para la interacción:
H0: no existe intera

H1: existe interac

Ejemplo gráfico. introducción sobre mejora de las actitudes hacia las minorías por parte de jóvenes oficiales de policía. E
se producen por el cruce de los 3 tratamientos de cada factor. Llamaremos factor A a las zonas donde se realiza el curso,
niveles, 5, 10 y 15 horas (b=3). Los datos obtenidos son:

El contraste de hipótesis, sigue el formato indicado anteriormente.

Se han de calcular tres estadísticos de contraste, uno para cada una de las hipótesis nula. Calculamos las sumas, las med

El contraste de hipótesis, sigue el formato indicado anteriormente.

Se han de calcular tres estadísticos de contraste, uno para cada una de las hipótesis nula. Calculamos las sumas, las med

A continuación, las razones básicas.

Y a partir de estas, las sumas de los cuadrados.

Se confecciona la tabla ANOVA.

La distribución muestral para todos de los estadísticos de contraste (columna F) sigue el modelo F de Fisher con sus corr

La distribución muestral para todos de los estadísticos de contraste (columna F) sigue el modelo F de Fisher con sus corr
para la interacción 4 y 36 grados de libertad.

Regla de decisión. Mediante un programa informático adecuado (con las tablas se tomarían los grados de libertad más p
3,2595 para los factores A y B y F0,95;4;36 = 2,6335 para la interacción.

Observamos que rechazamos la hipótesis nula para el factor B (13,763 > 3,2595) y para la interacción (5,232 > 2,6335), lo
mantenemos la hipótesis nula para el factor A (1,621 < 3,2595).

Conclusión. Los efectos principales del factor B (duración del curso) y de la interacción son significativos.

El modelo estadístico que subyace en un diseño factorial de dos factores completamente aleatorizados es un modelo line

Análisis de interacción por efectos simples. Recuperamos el caso del ejemplo anterior.

Razones básicas:

Las medias cuadráticas para los efectos simples se obtienen de la misma manera que en el análisis general, dividiendo la
grupos del análisis general, es decir:

Y así, con todos los factores y niveles, construimos la tabla ANOVA

Y así, con todos los factores y niveles, construimos la tabla ANOVA
Cuando se analiza un diseño factorial, se hace la prueba ómnibus para los efectos principales y el efecto de interacción. S
principales. Es decir, en la tabla de ANOVA, sumaríamos las cantidades de SC y g.l. en las fuentes de variación AB y S/AB,

Con el efecto de interacción:

Sin el efecto de interacción:

S DE MÁS DE DOS GRUPOS
NTES. ANOVA DE DOS FACTORES.
SÓLO CONCEPTOS
e los efectos principales del factor y efectos de interacción entre los factores.
a 3 y 2 niveles respectivamente, habría 5 efectos imples).
que está relacionado con los denominados efectos simples. Hay interacción cuando las líneas del gráfico de medias, tenderían a
de la otra V.I.
a misma variable.
algún nivel del otro factor, no son iguales a las correspondientes diferencias en otro nivel de este factor.
otra V.I.
ma variable independiente es manipulada en combinación con una segunda V.I.

los componentes del experimento. Si tenemos un factor A, las diferencias observadas en el nivel b, del factor B, se denominan
simple. Están presentes cuando se encuentra que los efectos simples asociados con una V.I. no son los mismos en todos los
variable, y se obtienen combinando el conjunto completo de componentes experimentales presentes en ese factor.
tratamiento respecto a la media total. En un diseño factorial de dos factores, SC INTER está basada en las desviaciones de las
ȲABij - ȲT
H0: µA1 = µA2 = µA3

(al menos para un par de tratamientos)
H0: µB1 = µB2 = µB3

(al menos para un par de tratamientos)
H0: no existe interacción

H1: existe interacción
venes oficiales de policía. En total hay 45 observaciones repartidas entre las 9 combinaciones de tratamientos, que son los que
s donde se realiza el curso, con tres niveles, alta, media y deprimida (a=3) y factor B a la duración del curso, también con tres
culamos las sumas, las medias y las desviaciones típicas y construimos la matriz AB.
culamos las sumas, las medias y las desviaciones típicas y construimos la matriz AB.
elo F de Fisher con sus correspondientes grados de libertad. En este caso para los factores A y B son 2 y 36 grados de libertad y
elo F de Fisher con sus correspondientes grados de libertad. En este caso para los factores A y B son 2 y 36 grados de libertad y
os grados de libertad más próximos), podemos comprobar que los valores críticos son, al nivel de confianza del 95%: F 0,95;2;36 =
racción (5,232 > 2,6335), lo que queda reflejado en la Tabla 7.4 con un asterisco para los valores F correspondientes, pero
nificativos.
torizados es un modelo lineal en el cual se especifican los componentes que contribuyen a explicar cualquier puntuación Y ijk.
álisis general, dividiendo la suma de cuadrados por los grados de libertad. El denominador de la F es la media cuadrática intra-
y el efecto de interacción. Si ésta última no es significativa, es preciso rehacer el análisis focalizándolo sobre los efectos
tes de variación AB y S/AB, desapareciendo de la nueva tabla ANOVA, la línea de AB.
tenderían a
denominan
odos los
.
s de las
son los que

n con tres
e libertad y
e libertad y
: F 0,95;2;36 =
s, pero
ación Y ijk.
ática intra-
ctos
ANÁLISIS DE REGRESIÓN.
CONCEPTOS
Análisis de regresión simple (ARS). Procedimiento que puede ser usado siempre que una VD c

Análisis de regresión múltiple (ARM). Procedimiento que puede ser usado siempre que una V

Los diseños ex post facto, se caracterizan porque el investigador no puede manipular intencion
niveles de la misma. En estos diseños, el investigador selecciona a los sujetos en función de qu

El análisis de regresión es una técnica idónea para los diseños ex post facto.

Ejemplo práctico. Supongamos que se dispone de las puntuaciones de 16 escolares en dos vari
ortográficos detectados dentro de un texto (variable Y). En el siguiente cuadro, se obtiene la re
nos sirve para observar si existe una tendencia de carácter lineal entre X e Y. En caso afirmativo
número de errores ortográficos.

Realizamos primero las operaciones básicas:

Pendiente de la recta de regresión.

Ordenada en el origen de la recta de regresión, para puntuaciones directas.

Cuando utilizamos el modelo lineal para estimar Y a partir de X, generalmente se comete un er

pronosticado (Y’) y el valor medido (Y) no suelen coincidir. La diferencia entre ambas, es el erro

Al método de ajuste de una recta de regresión se la conoce como ajuste por mínimos cuadrado
error al cuadrado.

Y’ = B0 + BX +
Siendo ε, el error de predicción.

En el análisis de regresión simple, el coeficiente protagonista es el factor B, conocido como p
estimación de la VD (y’) cuando la V.I. (X) aumenta en una unidad.

Y’ = BXi + B0

La constante de la recta de regresión B0, señala el punto en el que ésta corta al eje de ordena
ordenada en el origen.

La expresión Bondad de Ajuste, se refiere a cómo de explicativa es la recta respecto de los dat

El término Σ(Y - Ȳ) representa la suma de cuadrados de Y, o suma de cuadrados total (SCTOTAL) . E
cuadrados de la regresión (SCREG), siendo la suma de cuadrados de error o residual: Σ(Y – Y’) 2 (S

La constante de la recta de regresión B0, señala el punto en el que ésta corta al eje de ordena
ordenada en el origen.

La expresión Bondad de Ajuste, se refiere a cómo de explicativa es la recta respecto de los dat

El término Σ(Y - Ȳ) representa la suma de cuadrados de Y, o suma de cuadrados total (SCTOTAL) . E
cuadrados de la regresión (SCREG), siendo la suma de cuadrados de error o residual: Σ(Y – Y’) 2 (S

Varianza total de Y:

Varianza de la pronosticada:

Varianza de los Errores

En el caso de regresión lineal simple:

r2XY, se designa como R2 y es el coeficiente de determinación y refleja la proporción de variabi
complemento se denomina coeficiente de alienación, y es la parte residual de la variabilidad d

R2 es la proporción en que se reduce el error de la V.D. cuando empleamos la recta de regresi

Diagrama de Venn

Error típico. Cuasivarianza del error. Cuasidesviación típica del error.

Retomando los datos del ejemplo.

Error típico. Cuasivarianza del error. Cuasidesviación típica del error.

Retomando los datos del ejemplo.

Para que sean válidas las inferencias que sobre la V.D. se haga con la recta de regresión, se deb

Independencia de las observaciones
Homocedasticidad
Normalidad de las distribuciones condicionadas
Independencia entre los valores estimados Y’ y los errores de estimación ε, expresado en térm

Contraste sobre el coeficiente de correlación de Pearson:
H0: p = 0
H1: p ≠ 0

El estadístico de contraste se distribuye según t de Student con n – 2 grados de libertad.

Para un N.C. del 99%, en contraste bilateral, el valor crítico es 2,977 (0,99 + 0,005 = 0,995, con

Contraste para el coeficiente de regresión B (ANOVA).

Aplicando nuestras cifras

Contraste para el coeficiente de regresión B. Para determinar si hay evidencia estadística de qu
diferente a una ínea horizontal, se utiliza el siguiente contraste:

H 0: β = 0
H 1: β ≠ 0

Para un nivel de confianza del 95% en un contraste bilateral: 7,40 > 2,145, luego rechazamos la
distinta de cero, siendo el nivel crítico: p = 0,0001 (calculado con un programa informático).

Interpretar el resultado en función del contexto de investigación. Existe relación lineal entre la
un texto (Y), de manera que podemos pronosticar los valores de la VD en función de los valore

Intervalo de confianza. El intervalo de confianza para la pendiente de la recta de regresión se p
Contraste para el coeficiente de regresión B0. En la mayor parte de los estudios suele ser ignora

Con α = 0,05, en un contraste bilateral rechazamos la hipótesis nula de que el intercepto es igu
2,14 y 2,14.

Para el intercepto, el intervalo de confianza será:

Con α = 0,05, en un contraste bilateral rechazamos la hipótesis nula de que el intercepto es igu
2,14 y 2,14.

Para el intercepto, el intervalo de confianza será:

Regresión con dos V.I.

Caso práctico. Supongamos que un psicólogo escolar quiere determinar qué factores pueden in
secundaria. Supone que el tiempo que dedican al estudio en general es importante, y quizás ta
investigación, selecciona al azar una muestra de 15 estudiantes del colegio y registra el tiempo
razonamiento abstracto (variable X2). Las notas obtenidas por estos 15 escolares en el último e
(Y).

Tabla de datos.

El modelo de estimación es:

Siendo B1 el coeficiente de regresión parcial para X1 y B2 el coeficiente de regresión parcial para

Estadísticos descriptivos:

Ecuación de regresión lineal múltiple:

Ecuación de regresión lineal múltiple:

Los coeficientes en puntuaciones típicas (β1 y β2) se les denomina coeficientes de regresión est

Para el cálculo de los coeficientes de regresión parcial, se calcula primero los coeficientes de re

Y a continuación los coeficientes sin estandarizar.

Siendo la constante para la ecuación en puntuaciones directas:

Obtenidos los coeficientes, las ecuaciones de regresión en puntuaciones directas y típicas s

En el caso de la regresión múltiple, las preguntas básicas que hay que responder son:

¿Estiman bien la V.D. el conjunto de V.I.,s?
¿Cuánta variabilidad explica cada variable individualmente una vez que las otras variables han

El estimador insesgado de p2 en la población, se denomina R2 ajustado.

En cuanto a la segunda cuestión. Correlación semiparcial sr y su cuadrado sr2. Se denominan co

Con los datos del ejemplo que estamos siguiendo:

Estos valores, elevados al cuadrado, dan la proporción compartida por cada predictora, habien

Coeficiente de correlación parcial pr.

Coeficiente de correlación parcial pr.

E REGRESIÓN. SÓLO
CONCEPTOS
iempre que una VD cuantitativa pueda ser expresada como función de una variable.
o siempre que una VD cuantitativa pueda ser expresada como función de una combinación de V.I.
e manipular intencionalmente la V.I., ni asignar aleatoriamente a los participantes a los diferentes

etos en función de que posean o no determinadas características.
cto.
escolares en dos variables: una prueba de vocabulario (variable X) y el número de errores

adro, se obtiene la representación gráfica de todos los pares de valores en ambas variables, lo que
e Y. En caso afirmativo, tendrá sentido calcular la ecuación de regresión lineal simple para predecir el
ectas.
ente se comete un error en la estimación de la VD (Y) para cada uno de los sujetos, ya que el valor
ntre ambas, es el error de estimación ε = Y – Y’.
por mínimos cuadrados ya que el objetivo es encontrar los valores B y B 0 que hacen más pequeño el
Y’ = B0 + BX + ε
r B, conocido como pendiente de la recta, y cuantifica el incremento que se produce en la
Y’ = BXi + B0
orta al eje de ordenadas, es decir, el valor estimado de Y cuando X = 0, por lo que se denomina
a respecto de los datos sobre los que se ha ajustado.
rados total (SCTOTAL) . El término en el que se reduce el error original (Σ(Y’ - Ȳ)2) se denomina suma de
residual: Σ(Y – Y’) 2 (SCRES).
orta al eje de ordenadas, es decir, el valor estimado de Y cuando X = 0, por lo que se denomina
a respecto de los datos sobre los que se ha ajustado.
rados total (SCTOTAL) . El término en el que se reduce el error original (Σ(Y’ - Ȳ)2) se denomina suma de
residual: Σ(Y – Y’) 2 (SCRES).
proporción de variabilidad de la V.D. que es explicada (o imputada a ) la variabilidad de la V.I. Su

al de la variabilidad de la V.D., atribuible a otros factores no relacionados linealmente con la V.D.
os la recta de regresión para estimar dicha V.D.

a de regresión, se deben cumplir 4 supuestos básicos:
ε, expresado en términos de Pearson r Y’ε = 0
H0: p = 0
H1: p ≠ 0
os de libertad.
+ 0,005 = 0,995, con 14 g.l. en las tablas 2,977). Dado que 7,40 > 2,977, se rechaza la H 0.
ncia estadística de que la pendiente es diferente de 0, es decir, si la pendiente es significativamente
H 0: β = 0
H 1: β ≠ 0
, luego rechazamos la hipótesis nula, concluyendo que la pendiente de la ecuación de regresión es

ama informático).
elación lineal entre la prueba de vocabulario (X) y el número de errores ortográficos detectados en
función de los valores de la VI.
ecta de regresión se puede calcular mediante la siguiente expresión:
udios suele ser ignorado. Se distribuye según la t de Student con n – 2 g.l.
ue el intercepto es igual a 0 ya que en este caso, para 14 grados de libertad los valores críticos son: -
ue el intercepto es igual a 0 ya que en este caso, para 14 grados de libertad los valores críticos son: -
ué factores pueden influir en el rendimiento en matemáticas en uno de los cursos de educación

mportante, y quizás también su capacidad para el razonamiento abstracto. Para llevar a cabo esta
o y registra el tiempo semanal de estudio (variable X1) y les administra, además, un test de
colares en el último examen que han realizado de matemáticas le sirven como variable dependiente
regresión parcial para X2.

ntes de regresión estandarizados.
los coeficientes de regresión estandarizados.
nes directas y típicas son:
ponder son:
s otras variables han aportado lo suyo?

o.
sr2. Se denominan correlaciones de orden cero.
da predictora, habiendo eliminado el influjo de la otra predictora sobre la misma.

n de V.I.
erentes
s, lo que
predecir el
el valor
queño el
omina
a suma de
omina
a suma de
.I. Su
a V.D.
vamente
esión es
ados en
cos son: -
cos son: -
ación
o esta
e
pendiente
Z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07
-3.5 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002
-3.4 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003
-3.3 0.0005 0.0005 0.0005 0.0004 0.0004 0.0004 0.0004 0.0004
-3.2 0.0007 0.0007 0.0006 0.0006 0.0006 0.0006 0.0006 0.0005
-3.1 0.0010 0.0009 0.0009 0.0009 0.0008 0.0008 0.0008 0.0008
-3 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.0011 0.0011
-2.9 0.0019 0.0018 0.0018 0.0017 0.0016 0.0016 0.0015 0.0015
-2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021
-2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028
-2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038
-2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051
-2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068
-2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089
-2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116
-2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150
-2 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192
-1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244
-1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307
-1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384
-1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475
-1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582
-1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708
-1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853
-1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020
-1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210
-1 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423
-0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660
-0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922
-0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206
-0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514
-0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843
-0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192
-0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557
-0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936
-0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325
-0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721
0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340
1 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756
2 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985
3 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997
3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998
3.6 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.7 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
0.08 0.09
0.0002 0.0002
0.0003 0.0002
0.0004 0.0003
0.0005 0.0005
0.0007 0.0007
0.0010 0.0010
0.0014 0.0014
0.0020 0.0019
0.0027 0.0026
0.0037 0.0036
0.0049 0.0048
0.0066 0.0064
0.0087 0.0084
0.0113 0.0110
0.0146 0.0143
0.0188 0.0183
0.0239 0.0233
0.0301 0.0294
0.0375 0.0367
0.0465 0.0455
0.0571 0.0559
0.0694 0.0681
0.0838 0.0823
0.1003 0.0985
0.1190 0.1170
0.1401 0.1379
0.1635 0.1611
0.1894 0.1867
0.2177 0.2148
0.2483 0.2451
0.2810 0.2776
0.3156 0.3121
0.3520 0.3483
0.3897 0.3859
0.4286 0.4247
0.4681 0.4641
0.5319 0.5359
0.5714 0.5753
0.6103 0.6141
0.6480 0.6517
0.6844 0.6879
0.7190 0.7224
0.7517 0.7549
0.7823 0.7852
0.8106 0.8133
0.8365 0.8389
0.8599 0.8621
0.8810 0.8830
0.8997 0.9015
0.9162 0.9177
0.9306 0.9319
0.9429 0.9441
0.9535 0.9545
0.9625 0.9633
0.9699 0.9706
0.9761 0.9767
0.9812 0.9817
0.9854 0.9857
0.9887 0.9890
0.9913 0.9916
0.9934 0.9936
0.9951 0.9952
0.9963 0.9964
0.9973 0.9974
0.9980 0.9981
0.9986 0.9986
0.9990 0.9990
0.9993 0.9993
0.9995 0.9995
0.9996 0.9997
0.9997 0.9998
0.9998 0.9998
0.9999 0.9999
0.9999 0.9999
0.9999 0.9999
DISTRIBUCIÓN χ2 (CHI CUADRADO)
DISTRIBUCIÓN T DE STUDENT
DISTRIBUCIÓN F DE SNEDECOR-FISHER
-FISHER

Wuolah Free Super Excel Disenos

Cargado por

Copyright:

Formatos disponibles

Wuolah Free Super Excel Disenos

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Wuolah Free Super Excel Disenos

Cargado por

Copyright:

Formatos disponibles

ESTIMACIÓN DE PARÁMETROS Y CO

HIPÓTESIS. SÓLO CONCEP

Pasos del proceso inferencial:

Recordamos también la fórmula de la covarianza, necesaria para el cálculo de la correlación.

Dos procedimientos de la estadística inferencial:

Varianza poblacional conocida σ2:

Intervalo de confianza para la varianza (n > 100).

Unilateral derecha: H0 : µ0 - µ1 ≤ 0 µ 0 - µ1 > 0

CONTRASTE UNILATERAL IZQUIERDO

dístico, recibe el nombre de error típico del estadístico.

las medias de varias muestras de una misma población.

proxima, cuando se cumple al menos uno de los siguientes requisitos:

la variable de la población se distribuye normalmente o n ≥ 30, entonces consideramos que la

e aumenta la n, la varianza de t, se va aproximando a 1 y por tanto, la distribución t se irá

valores de la curva normal como aproximación a los valores t.

le llama genéricamente éxito. Siendo p = x / n, donde x es el número de datos de la muestra que

bilidad que presentan los datos para la variable de estudio.

poblacional, se puede generar a partir de la cuasivarianza poblacional o la varianza de la muestra,

muestreo aleatorio y se tiene que cumplir:

mar parte de la muestra

la población con alfabeto griego.

a muestra como valor del parámetro que se desea estimar.

do en la muestra y el que formulamos como parámetro poblacional. La diferencia observada puede

írica. La H1 es lo que dice el investigador.

Contrastes paramétricos. La hipótesis a contrastar especifica una característica de la poblaci

La potencia de un contraste estadístico es el complementario al Error Tipo II. Primero calcula

CONTRASTE SOBRE LA MEDIA POBLACIONAL.

Ȳ Es la media obtenida en la muestra

µ0 Es el valor de la media poblacional formulado en la

σȲ Es el error típico de la media o desviación típica de la

σ Es la desviación típica poblacional que suponemos

n Es el tamaño de la muestra que estamos utilizando

INTRODUCIR Ȳ 220 Z 2.5

CONTRASTE SOBRE LA MEDIA POBLACIONAL.

Ȳ Es la media obtenida en la muestra

µ0 Es el valor de la media poblacional formulado en la hipótesis

σȲ Es el error típico de la media o desviación típica de la

n Es el tamaño de la muestra que estamos utilizando para

CONTRASTE SOBRE LA PROPORCIÓN

µp Es la media de la distribución muestral de las proporciones

σp Es la desviación típica poblacional

π0 Es la proporción poblacional o hipótesis nula

n Es el tamaño de la muestra que estamos utilizando para

INTERVALO DE CONFIANZA p+Emax 0.2602

CONTRASTE SOBRE LA VARIANZA

S2n Es la varianza muestral

n Es el tamaño de la muestra que estamos utilizando para

S2n-1 Es la cuasivarianza muestral

S2n 4.9 S2n-1 25.01

Χ2n-1;1-α/2 9.8862 Χ2n-1;α/2 42.9800

CÁLCULO DE LA POTENCIA DEL

σ Es la desviación típica poblacional

Ȳ Es la media obtenida en la muestra

n Es el tamaño de la muestra que estamos utilizando para

µ0 Es la media de la distribución muestral

µ0 1000 Error Tipo I 1.64

µ1 1060 Error Tipo II

Error Tipo I. Se basa en el dato de la hipó

NIVEL CRÍTICO p Y ERRORES EN

El nivel crítico p, que se define como el nivel de significación más peque