Manual de Estadistica Aplicada A La Investigación Social

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 208

Verificacin de hiptesis sobre los parmetros poblacionales

El estudio que se acaba de hacer en el Capitulo anterior sobre los conceptos y las tcnicas de la
estimacin puntual y por intervalos ha servido para empezar a familiarizarnos con la inferencia estadstica.
En el presente capitulo se va a considerar otro enfoque de la inferencia estadstica: la verificacin de
hiptesis. A pesar de que los temas referentes a la estimacin por intervalos y a la verificacin de
hiptesis se tratan aqu en captulos separados, no son cuestiones tan diferentes como lo podra
indicar esta forma de tratarlos. Ambas ideas se fundamentan en los conceptos de probabilidad y de
distribucin muestral que se estudiaron en los captulos anteriores. Ambos tambin hacen posible la
toma de decisiones acerca de una poblacin con base en la informacin contenida en una muestra de esa
poblacin.
6.1 HIPOTESIS
La palabra hiptesis se define como:
1. Una afirmacin que esta sujeta a verificacin o comprobacin,
2. Una suposicin que se utiliza como base para una accin.*
El punto clave de estas definiciones esta en que una hiptesis es una afirmacin o suposicin y no
un hecho establecido. De esta manera, al no existir un conocimiento previo sobre la efectividad de dos
mtodos de enseanza, un investigador puede proponer la hiptesis de que para la enseanza de la
lectura a estudiantes de primer ano, el mtodo A es superior al mtodo B. Un fabricante de drogas puede
hacer la hiptesis de que un determinado medicamento es ms efectivo que otro que se vena usando
normalmente en el tratamiento de una enfermedad. Un fabricante de plsticos puede hacer la hiptesis de
que ciertas lminas de determinado tipo de plstico tienen una resistencia a la traccin promedio de 75
libras. Hiptesis de esta naturaleza pueden basarse en la experiencia y la observacin, experimentacin, o
en la intuicin. Las hiptesis establecidas en esta forma proporcionan con frecuencia motivo para
realizar una investigacin. Por esta razn podemos denominarlas hiptesis de investigacin.
Generalmente hay que volver a plantear las hiptesis de investigacin antes de verificarlas
estadsticamente. Cuando ya se han planteado en forma conveniente, de tal forma que se puedan
comprobar por medio de los mtodos estadsticos que se estudian en el presente capitulo, las hiptesis
reciben el nombre de hiptesis estadsticas. Las hiptesis estadsticas son afirmaciones sobre una o mas
poblaciones, o mejor, como es mas frecuente, afirmaciones sobre uno o mas parmetros de una o mas
poblaciones.
Las hiptesis estadsticas son de dos tipos. Primero esta la hiptesis nula, que se simboliza por Ho y
que es la hiptesis que se debe comprobar. La hiptesis nula se llama tambin hiptesis de ninguna
diferencia (por esto el trmino nula). Es una afirmacin en la que se dice que no hay ninguna
diferencia entre dos poblaciones, entre dos parmetros poblacionales o entre el valor verdadero de algn
parmetro y su valor hipottico.
Veamos nuevamente las tres hiptesis de investigacin que se acabaron de enunciar y establezcamos
para cada una de ellas la hiptesis nula correspondiente. En el caso de la hiptesis de investigacin
sobre los mtodos de enseanza de la lectura a alumnos de primer ano, supongamos que el criterio de
efectividad con que se van a comparar los dos mtodos es el puntaje obtenido en una prueba de
rendimiento en lectura hecha al terminar el ao. La hiptesis nula apropiada (Ho) consistira en afirmar que
no hay ninguna diferencia entre la efectividad de los dos mtodos de enseanza de lectura, o mas
especficamente, que el puntaje promedio obtenido en la prueba por los estudiantes que aprendieron
segn el mtodo A es igual (no es diferente de) al puntaje promedio de los estudiantes que
aprendieron segn el mtodo B. Podemos expresar la hiptesis nula en forma mas compacta como

Supongamos que la efectividad de la nueva droga y la de la droga usual que se menciono antes, se
mide en funcin de la proporcin de casos que responden favorablemente al tratamiento mediante cada
una. La hiptesis nula apropiada consistira en afirmar que la proporcin de casos que responden
favorablemente a la nueva droga es igual a la proporcin de casos que responden favorablemente
a la droga usual, o

Finalmente, en el caso de la hiptesis de investigacin que afirma que las laminas de cierto
tipo de plstico tienen una resistencia promedio a la traccin de 75 libras, la hiptesis nula
apropiada consistira en decir que la resistencia a la traccin promedio es de 75 libras, o

Para verificar una hiptesis nula, examinamos los datos de la muestra tomada de la
poblacin pertinente y determinamos si son o no compatibles con la hiptesis nula. Si los datos
de la muestra no son compatibles con la hiptesis nula, entonces H o se rechaza. Si los datos son
compatibles con la hiptesis nula, entonces H o no se rechaza. En la Seccin 6.2 explicaremos el
criterio que se usa para determinar si los datos de la muestra son o no compatibles con la
hiptesis nula.
Si la hiptesis nula no se rechaza, decimos que los datos particulares de la muestra no dan
suficiente evidencia como para que concluyamos que la hiptesis nula es falsa. Si la hiptesis nula
se rechaza, decimos que los datos particulares de la muestra si dan suficiente evidencia como para
hacernos concluir que la hiptesis nula es falsa y que una segunda hiptesis es verda dera. Esta
segunda hiptesis, de la que hemos concluido que es verdadera si la hiptesis nula es rechazada,
se denomina hiptesis alterna y se designa con el smbolo H 1. Generalmente la hiptesis alterna y
la hiptesis de investigacin son la misma.
Vamos a referirnos nuevamente a las hiptesis de investigacin que plan teamos
anteriormente, para establecer en cada caso cual seria la hiptesis nula y la hiptesis alterna
apropiada.
1 hiptesis de investigacin: el mtodo A es superior al mtodo B para la enseanza de la
lectura a alumnos de primer ao.

2 hiptesis de investigacin: la nueva droga es ms efectiva que la dro ga usual en el


tratamiento de la enfermedad X.

3 hiptesis de investigacin: la resistencia promedio verdadera a la traccin de las lminas del


tipo A es 75 libras.

Obsrvese que en los dos primeros casos, la hiptesis de investigacin y la hiptesis alterna
son la misma, mientras que en el tercer caso la hiptesis de investigacin es la misma que la hiptesis
nula.
Cuando se establecen hiptesis del tipo indicado en (1) y en (2) se pro cura generalmente que
las hiptesis nula y alterna se complementen entre si y para esto se incluye una desigualdad en la
hiptesis nula que vaya en direccin opuesta a la de la hiptesis alterna. Por ejemplo, podramos escribir
las hiptesis anteriores (1) y (2) como

Este mtodo de plantear las hiptesis nula y alterna realza el hecho de que cuando la hiptesis
alterna establece una desviacin respecto de una igualdad en una direccin, las desviaciones
respecto de la igualdad en la direccin opuesta no tienen ningn inters. Por ejemplo, el director
del departamento de control de calidad de una empresa manufacturera puede hacer las siguientes
hiptesis como parte del procedimiento para aceptar o rechazar las remesas de materias primas
procedentes de los distintos proveedores.

El director del departamento de control de calidad desea detectar todas aquellas remesas en
que la proporcin de artculos defectuosos sea mayor que o, el nivel mximo aceptable, para
poderlas rechazar. Si la proporcin defectuosa es menor que el nivel aceptable, tanto mejor.
6.2 PROCEDIMIENTO DE VERIFICACION DE HIPOTESIS
Como ilustracin de los procedimientos para verificar hiptesis, examinemos el ejemplo siguiente.
Con base en varios aos de experiencia, un equipo de psiclogos cree que individuos no conformistas
tienen un nivel mayor de amor propio que los conformistas. Aunque los psiclogos recuerdan muchos
casos en que se pueden fundamentar sus aseveraciones, saben que, para darle mas peso a sus
conjeturas, deben emplear un mtodo cientfico en el anlisis de la evidencia. Les parece que un
procedimiento de verificacin de hiptesis estadsticas les resulta ms apropiado. De acuerdo con esto,
establecen la siguiente hiptesis nula y la siguiente hiptesis alterna:

donde x es el puntaje medio poblacional obtenido por los no conformistas en una prueba que
tena por objeto medir el nivel de amor propio y y,. es el puntaje medio poblacional obtenido por
conformistas en la misma prueba.
La poblacin sobre la que desean los psiclogos hacer inferencias, es la poblacin de todas las
personas que se pueden caracterizar como conformistas o no conformistas. Los psiclogos obtienen
muestras independientes de conformistas y de no conformistas que, segn ellos, se pueden tratar
como muestras aleatorias de las poblaciones de inters. Administran las pruebas para medir el amor
propio a los individuos de las dos muestras y calculan el puntaje promedio para cada una. Descubren
que x A = 80 y x B = 75. Aunque la direccin de la diferencia de las medias muestrales es
compatible con su hiptesis de investigacin (y alterna), los psiclogos saben que existen por lo

menos dos maneras de explicar esta diferencia: (1) el puntaje verdadero medio de amor propio de la
poblacin de los no conformistas podra no ser superior al que corresponde a la poblacin de los
conformistas. Los resultados observados en la muestra se deben simplemente a la casualidad. (2) Los
resultados observados en la muestra podran reflejar el verdadero estado de las cosas y es acertado
sacar como conclusin que el puntaje verdadero medio de amor propio para los no conformistas es
superior al de los conformistas. El conocimiento y la comprensin de las sutiles ideas de los
procedimientos de verificacin de hiptesis permitir que los psiclogos puedan escoger entre las dos
explicaciones. Vamos a dedicar el resto de esta seccin a los conceptos y tcnicas especficas que se
utilizan en la verificacin de hiptesis.
Podemos formalizar el procedimiento que se debe seguir para verifi car una hiptesis
estableciendo, en forma secuencial, los diversos pasos que forman el procedimiento. En esta
seccin enumeramos y explicamos cada uno de estos pasos llevando el mismo orden que guardan
normalmente en la prctica. Se pueden identificar nueve pasos principales.
1 Planteamiento de la hiptesis
2 Seleccin del nivel de significacin
3 Descripcin de la poblacin que interesa y planteamiento de las suposiciones necesarias
4 Seleccin del estadstico pertinente
5 Especificacin del estadstico de prueba y consideracin de su distribucin
6 Especificacin de las regiones de rechazo y aceptacin
7 Recoleccin de datos y clculo de los estadsticos necesarios
8 Decisin estadstica
9 conclusin
A continuacin, vamos a describir cada uno de estos pasos en trminos generales y
posteriormente los explicaremos con ejemplos especficos.
1 Planteamiento de la hiptesis. En la Seccin 6.1 vimos las diferentes clases de hiptesis
que se pueden hacer y la forma en que se expresan. En virtud de que el estudiante que se inicia en el
estudio de la estadstica encuentra con frecuencia dificultades cuando tiene que establecer la forma de
plantear la hiptesis nula y la hiptesis alterna, vamos a ampliar esta materia. Generalmente,
queremos obtener una conclusin (paso 9) rechazando la hiptesis nula. Es decir, ordinariamente
preferimos que los datos de nuestra muestra apoyen la hiptesis alterna (en la Seccin 6.4
explicaremos las razones de esto). En consecuencia, al determinar lo que debe ser la hiptesis alterna,
debemos preguntarnos que deseo concluir?" o "que creo que es verdadero?". La respuesta a
estas preguntas constituye la expresin de la hiptesis alterna. Luego, el planteamiento complementario
de la hiptesis alterna, sirve de hiptesis nula.
Por ejemplo, consideremos un investigador que establece como hiptesis de investigacin el
hecho de que, en la enseanza de la lectura a alumnos de primer ao, el mtodo A es
superior al mtodo B. Frente a la pregunta "que deseo concluir?", el investigador responder que
desea sacar la conclusin de que el mtodo A es superior al mtodo B. Por tanto, la hiptesis alterna
consiste en A > B y la hiptesis nula, que es el complemento de este planteamiento, en PA < PB. Este
ejemplo, muestra como, normalmente, se formula primero la hiptesis alterna.
2 Seleccin del nivel de significacin. Teniendo en cuenta los resultados que se obtienen
en el anlisis de los datos de la muestra, rechazamos o no la hiptesis nula. Rechazar la hiptesis nula no

constituye una prueba de que sea falsa. Sin tener en cuenta que tan incompatible sea la evidencia de la
muestra con la hiptesis nula, cabe la posibilidad de que esta ltima sea realmente verdadera.
Anlogamente, el hecho de no rechazar la hiptesis nula no es una prueba de que sea verdadera y de
que la hiptesis alterna sea falsa. De la misma manera que en el caso anterior, aunque la hiptesis
nula no sea rechazada, cabe la posibilidad de que sea falsa. La consideracin de estos hechos nos
lleva a la conclusin de que en el rechazo o el no rechazo de la hiptesis nula se corre el riesgo de
equivocarse. Aunque generalmente no sabemos si en una determinada accin (rechazo o no rechazo
de Ho) cometemos un error o no, podemos indicar los dos tipos de error posibles, de la manera
siguiente:

(a) Rechazo de una hiptesis nula verdadera. Este error se denomina error de Tipo I.
(b) aceptacin de una hiptesis nula falsa. Este error se denomina error de Tipo II.
Podemos ilustrar la relacin entre la certeza de la hiptesis nula (es decir, si es verdadera o
es falsa) y la decisin estadstica (rechazar o no rechazar Ho) como se ve en la Tabla 6.1.
Siguiendo la costumbre que se tiene en estadstica, representaremos con la probabilidad de
cometer un error de tipo I y con la probabilidad de cometer un error de Tipo II. As pues

Para la verificacin de una hiptesis determinada preferiramos que y fueran pequeos. En virtud
de la relacin entre estas dos probabilidades, encontramos que, para un tamao de muestra dado, una
disminucin de tiene como contraparte un aumento de y viceversa.
Siendo esto as, parece prudente que, en una situacin determinada, tratemos de minimizar la
probabilidad de cometer el error mas serio. Desafortunadamente, en muchas reas de investigacin, es
difcil, o imposible, evaluar los dos tipos de error en cuanto a la seriedad de cada uno de ellos. Entonces, lo
que se hace en estas situaciones es seleccionar algn valor pequeo para , digamos 0.10, 0.05 0.01. La
eleccin de refleja la opinin que tiene el investigador sobre la seriedad del error de Tipo I. Mientras
mas serias se consideren las consecuencias de cometer un error de Tipo I, menor ser el valor que se
le asigne a
Con frecuencia, se denomina nivel de significacin. Cuando se escoge un nivel de significacin
igual a y se rechaza la hiptesis nula, decimos que los resultados de la muestra son significativos.
3 Descripcin de la poblacin que interesa y planteamiento de las suposiciones
necesarias. Los procedimientos para la verificacin de hiptesis dependen de las caractersticas de la
distribucin muestral que esta implcita. Las caractersticas de la distribucin muestral dependen en
parte de la naturaleza de la poblacin muestreada. Por esta razn, debemos investigar la naturaleza
de la poblacin muestreada para justificar la seleccin del procedimiento. Generalmente nos interesamos
en conocer el tamao aproximado de la poblacin y en saber si se puede considerar o no normalmente
distribuida, en forma aproximada. Tambin, deseamos establecer el hecho de que sea razonable suponer
que la muestra tomada constituye una muestra aleatoria simple de la poblacin de inters.
4 Seleccin del estadstico pertinente. El estadstico particular que va a formar parte del
procedimiento para la verificacin de hiptesis esta determinado por el parmetro que tiene relacin
con la hiptesis. De esta manera, si se trata de verificar una hiptesis sobre una media poblacional, el

estadstico pertinente es x . o media muestral. tambin podramos considerar la distribucin muestral del
estadstico pertinente. En trminos generales lo que se desea saber es la media, la varianza (o la
desviacin tpica) y la forma funcional aplicable de la distribucin muestral. Por ejemplo, si
estamos verificando una hiptesis sobre una media poblacional y si el muestreo se hace en una poblacin
que esta normalmente distribuida, sabemos que la distribucin de x . la media de la muestra, estar
normalmente distribuida con media y varianza 2/n.
5 Especificacin del estadstico de prueba y consideracin de su distri bucin.
DEFINICION
Un estadstico de prueba es una cantidad numrica que se calcula a partir de los datos
de una muestra y que se utiliza para tomar la decisin de rechazar o no rechazar una
hiptesis nula.
El estadstico de prueba se determina teniendo en cuenta el parmetro sobre el que se hace la
hiptesis y la naturaleza de la distribucin muestral del estadstico pertinente. Cuando el
muestreo se hace en una poblacin normalmente distribuida, con varianza conocida, el estadstico de
prueba que se usa para verificar una hiptesis sobre la media poblacional es:

donde x es la media de una muestra de tamao n, 0 es el valor hipottico de la media poblacional


y es la desviacin tpica de la poblacin. Este esta dstico de prueba se distribuye como la
distribucin normal estandarizada. Cuando el muestreo se hace en una poblacin normalmente
distribuida, con varianza desconocida, el estadstico de prueba que se usa para verificar una hiptesis sobre
la media poblacional es:

donde x , o y n se definen como se hizo anteriormente y S es la desviacin tpica de la muestra.


Este estadstico de prueba sigue la distribucin t de Student con n - 1 grados de libertad.
Posteriormente estudiaremos otros estadsticos de prueba que se encuentran con frecuencia.
6 Especificacin de las regiones de rechazo y de aceptacin.
DEFINICION
En la verificacin de una hiptesis, la regin de rechazo consta de todos aquellos
valores del estadstico de prueba que son de tal magnitud que, de ser el valor
observado del estadstico de prueba igual a uno de ellos, la hiptesis nula se rechaza.
La regin de aceptacin es el complemento de la regin de rechazo. Si el valor observado
del estadstico de prueba es igual a alguno de los valores que componen la regin de
aceptacin, la hiptesis nula no se rechaza.
Tal como vamos a ver, los tamaos de las regiones de rechazo y de acep tacin estn
determinados por .
Para explicar la manera de determinar las regiones de rechazo y aceptacin, consideremos el caso de
que, con el propsito de verificar una hiptesis sobre una media poblacional, se extrae una muestra de una
poblacin normalmente distribuida, con varianza conocida. Como ya lo hemos indicado, el estadstico de

prueba apropiado en este caso es Z.


Supongamos que deseamos verificar la hiptesis nula de que una media poblacional, , es igual a
algn valor particular o, frente a la hiptesis alterna de que no es igual a o. Las hiptesis nula y alterna se
pueden plantear as:

Digamos adems que , probabilidad de rechazar una hiptesis nula verdadera, es 0.05.
Ahora consideremos la distribucin muestral de las medias calculadas a partir de muestras de tamao
n tomadas de nuestra poblacin especfica. De acuerdo con lo que vimos anteriormente sabemos que la
distribucin muestral de x esta normalmente distribuida. Si la hiptesis nula es verdadera, la media de la
distribucin muestral es igual a o. tambin sabemos que el (1 - ) % = 95% de todas las x caern
dentro de 1.96 errores tpicos de la media, que, de ser Ho verdadera, es igual a o. Esto lo podemos
expresar por medio de la siguiente ecuacin de probabilidad:

La Figura 6.1 describe grficamente esta ecuacin y la distribucin muestral. La probabilidad de que
una sola muestra aleatoria simple de tamao n arroje un valor de x igual a o mayor que o + 1.960 x
es igual a /2 = 0.025.La probabilidad de que una sola muestra aleatoria arroje un valor de x igual o
menor que 0 - 1.96 x -, es tambin igual a /2 = 0.025. Si tenemos un valor numrico especfico para o,
podemos calcular valores numricos reales para o 1.96 x . Por ejemplo, supongamos que o = 100
(esto es, hacemos la hiptesis de que es igual a 100), x = 30 y n = 25. Los valores numricos de o
1.96 (30/25) son 88.24 y 111.76.

Podemos decir que la probabilidad de observar un valor de x entre 88.24 y 111.76, siendo H o
verdadera, es igual a 0.95. Si Ho es verdadera, la probabilidad de que una sola muestra aleatoria
simple de tamao 25 arroje una media igual o mayor que 111.76 es igual a 0.025 y la probabilidad de
que una sola muestra aleatoria simple arroje una media igual o menor que 88.24 es igual tambin a
0.025.
Supongamos que en realidad estamos observando un valor de x igual o mayor que 111.76 o igual
o menor que 88.24. Tenemos que concluir que ha ocurrido un caso raro (con una probabilidad de
ocurrir igual a 0.05) u ofrecer otra explicacin. En un procedimiento de verificacin de hiptesis la nica
alternativa que queda es afirmar que la hiptesis nula es falsa; o lo que es lo mismo, que la muestra
no se extrajo de una poblacin que tiene la media hipottica. En realidad, esta ultima explicacin es la
que se acepta cuando las hiptesis son Ho: = o y H1: o el nivel de significacin es y se
presenta un valor de x que es igual o mayor que 0. + Z/2 (n) o uno que es menor o igual a o -Z/2 (/ n). Al aceptar esta explicacin estamos rechazando la hiptesis nula. Si se decide rechazar en estas
circunstancias la' hiptesis Ho se corre un riesgo, , de tomar una decisin equivocada. En
consecuencia debemos asignarle a un valor pequeo (digamos 0.10, 0.05 0.01) para que la

probabilidad de equivocarnos (de rechazar una hiptesis nula verdadera) sea pequea.
Como vamos a rechazar H o : = o en favor de H1 : o, cuando nuestra muestra nica arroje
una media x igual o mayor que o + Z /2 (/'n), o igual o menor que o - Z/2 (/'n), estos valores de
x constituyen la regin de rechazo para nuestra verificacin de hiptesis. Su complemento, conforma
por lo tanto la regin de aceptacin.

Podemos expresar las regiones de aceptacin y de rechazo en funcin del estadstico de prueba, Z,
observando que los nmeros se transforman en - Z/2 y Z/2 respectivamente cuando utilizamos la formula
Z= ( x -o)/ (/'n)

La Figura 6.2 muestra las regiones de aceptacin y de rechazo, tanto en funcin de x como de z,
para verificar, con un nivel de significacin a, H o = 0 frente a la alternativa H1: o .
Si calculamos con base en los datos de la muestra un valor de

y este resulta mayor o igual a Z/2 o menor o igual a Z/2 rechazamos Ho.
En cualquier otro caso, no rechazamos Ho. Se dice que un valor calculado de Z es significativo si nos
lleva a rechazar una hiptesis nula.
Llamamos valores crticos de un estadstico de prueba a aquellos valores que, como Z/2
y - Z/2 de la Figura 6.2 (b), separan una regin de rechazo de una regin de aceptacin. Ellos nos dicen
cuando debemos dejar de creer que la hiptesis nula es verdadera y empezar a creer que es falsa.
Llamamos hiptesis alternas de dos lados o bilateral, a las hiptesis alternas de la forma H 1 o
puesto que generalmente nos conducen a una regin de rechazo que esta compuesta de dos lados o colas
de la distribucin del estadstico de prueba. Y al procedimiento adecuado para verificar una hiptesis nula
frente a una hiptesis alterna bilateral, como el que se describi anteriormente, le damos el nombre de
prueba de hiptesis de dos lados o bilateral.
Con frecuencia, como ya lo hemos visto, la hiptesis nula es de la forma Ho: < o y la hiptesis
alterna de la forma: HI: > o. A una hiptesis alterna de este tipo la Llamamos hiptesis unilateral, puesto
que solo valores grandes del estadstico de prueba causan el rechazo de la hiptesis nula y, por tanto,
la regin de rechazo esta localizada solamente en la cola superior de la distribucin del estadstico de
prueba. Es decir, que toda la probabilidad a esta localizada en una sola cola y no esta dividida por la mitad
como sucede en la prueba bilateral. Por ejemplo, el equipo de psiclogos descrito anteriormente, que esta
interesado en los puntajes de los conformistas y los no conformistas, utilizan una prueba unilateral con la
regin de rechazo localizada solamente en la cola superior. Si seleccionan un nivel de significacin
(probabilidad de rechazar una hiptesis nula verdadera) de 0.05, todo el valor 0.05 constituir el rea de
la cola superior en la distribucin muestral. Para las hiptesis alternas de la forma H1:. < o solamente los
valores pequeos del estadstico de prueba causan el rechazo de la hiptesis nula y, por tanto, toda la
regin de rechazo se encontrara en la cola inferior de la distribucin.

Hasta este momento, nuestros ejemplos sobre la verificacin de hiptesis se han restringido a
pruebas con la media poblacional. En secciones posteriores, vamos a estudiar la verificacin de hiptesis
para aquellos casos en que el muestreo se toma de poblaciones que no estn normalmente distribuidas,
as como tambin para casos en que estn implcitos otros parmetros poblacionales.
7 Recoleccin de datos y clculo de los estadsticos necesarios. Los datos que se
necesitan para verificar las hiptesis formuladas y que satisfacen las suposiciones necesarias de la prueba se
deben recolectar en una forma adecuada. Una vez que se han recogido se calcula el estadstico
apropiado y el estadstico de prueba.
8 Decisin estadstica. Se compara el valor real calculado del estadstico de prueba con
el valor crtico de este. Si el valor calculado esta en la re gin de rechazo, entonces se rechaza
H o , de lo contrario, no se rechaza.
9 conclusin. En tanto que la decisin se expresa en funcin del esta dstico de prueba,
la conclusin se expresa en funcin del parmetro y/o la poblacin a que se refiere la prueba.
Por ejemplo, cuando rechazamos H o: = o , concluimos que "la media de poblacin no es igual
a o ". Cuando no rechazamos la hiptesis nula nuestra conclusin carece de la fuerza de
conviccin que tiene cuando se rechaza una hiptesis nula. Esto se debe a que, aunque de
antemano sabemos que la probabilidad de rechazar una hiptesis nula verdadera es pequea
(esto lo sabemos por la seleccin que hemos hecho de ), generalmente no conocemos el
valor de o probabilidad de aceptar (no rechazar) una hiptesis nula falsa. Esta puede ser, y
frecuentemente lo es, muy grande. (En la Seccin 6.4 analizaremos este punto
detalladamente).
En consecuencia, al no rechazar H o : = o concluimos que "la media de poblacin puede

ser igual a o ".


En las prximas secciones explicaremos, con ejemplos, el procedimiento general para la
verificacin de hiptesis que se ha descrito en esta seccin. Explicaremos la verificacin de
hiptesis cuando los parmetros de inters son la media poblacional, la diferencia entre dos
medias poblacionales, una proporcin poblacional, la diferencia entre dos proporciones
poblacionales, la varianza poblacional y la razn entre dos varianzas poblacio nales.
6.3 VERIFICACION DE UNA HIPOTESIS SOBRE UNA MEDIA POBLACIONAL UNICA
En esta seccin vamos a explicar, con ejemplos, el procedimiento que se usa para la
verificacin, de hiptesis cuando el parmetro de inters es la media poblacional.
Consideraremos tres casos: (1) el caso en que el muestreo se ha ce en una poblacin
normalmente distribuida, con varianza conocida, (2) el caso en que el muestreo se hace en
una poblacin normalmente distribuida con varianza desconocida y (3) el caso en que el
muestreo se hace en una poblacin que no esta normalmente distribuida.
poblacin normalmente distribuida,

conocida

Para explicar la verificacin de hiptesis sobre medidas poblacionales, vamos a considerar


primero el caso de que la poblacin de inters est a distribuida normalmente y se conoce su
varianza.
Ejemplo 6.1
La media y la desviacin tpica del peso de los hombres que jugaron ftbol en una
universidad durante las primeras 10 temporadas son = 162.5 libras y = 18.0 libras. El
departamento de atletismo desea saber si hay alguna razn para creer el peso promedio de los que
jugaron ftbol durante las 10 ultimas temporadas es diferente del peso promedio de los que jugaron
ftbol durante las primeras diez temporadas.
Los miembros del departamento desean basar su conclusin en una muestra de tamao n =
25. El procedimiento para la verificacin de la hiptesis se explica a continuacin.
1 Planteamiento de la hiptesis. Los investigadores que desean saber si el peso promedio de
los que jugaron ftbol durante las 10 ltimas temporadas difiere de 162.5, piensan que una
conclusin de esta naturaleza se justificara si pudieran rechazar la hiptesis nula de que el peso
promedio de la poblacin de inters es igual a 162.5. Las hiptesis correctas, nula y alterna, son
entonces las siguientes:

2 Nivel de significacin. Los investigadores establecen que la probabilidad de cometer un error


de Tipo I ser igual a = 0.05.
3 Descripcin de la poblacin y suposiciones. La poblacin consiste en los pesos de todos
los hombres que jugaron ftbol durante las 10 ltimas temporadas. Los investigadores piensan
que los pesos de esta poblacin estn mas o menos distribuidos normalmente y que tienen una
desviacin tpica igual a 18.0, o desviacin tpica de los pesos correspondientes a los que jugaron
durante las primeras 10 temporadas.
4 El estadstico pertinente. Como las hiptesis se refieren a una media poblacional, el
estadstico apropiado es x o media muestral. En virtud de que se supone que la poblacin esta
distribuida en forma aproximadamente normal, la distribucin muestral de x , para todos los fines

10

prcticos, puede considerarse como distribuida en forma aproximadamente normal. Si la hipte sis
nula es verdadera, x , la media de la distribucin muestral, es igual a 162.5. Si, como lo creen los
investigadores, la desviacin tpica de la poblacin es 18.0 libras, entonces la desviacin tpica de la
distribucin muestral de x (o error tpico de x ) es (x = n = 18.0/25 = 3.6.
5 El estadstico de prueba y su distribucin. Como el estadstico pertinente es x , es
conocida y se supone que x esta normalmente distribuida, el estadstico de prueba es Z, que esta
normalmente distribuido cola media 0 y desviacin tpica 1.
6 Regiones de rechazo y de aceptacin. Como a = 0.05 y como se trata de una prueba
bilateral, la regin de rechazo consta de dos partes. La primera parte, localizada en la cola derecha de
la distribucin de z consiste en todos los valores de z tales que, cuando Ho es verdadera, la
probabilidad de ocurrencia aleatoria de una z de ese tamao o mas grande es igual o menor que 0.025.
La segunda mitad de la regin de rechazo, localizada en la cola izquierda de la distribucin de z, consta
de todos aquellos valores de z tales que, cuando Ho es verdadera, la probabilidad de que ocurra al azar
una z de ese tamao o mas pequea es igual o menor que 0.025. La Tabla E del Apndice muestra que los
valores crticos son z = + 1.96 y z = - 1.96. La regin de aceptacin consta de todos los valores de z
que son menores que + 1.96 pero mayores que - 1.96. Si a partir de los datos de la muestra obtenemos
un valor de z igual o mayor que + 1.96 o igual o menor que - 1.96, rechazaremos la hiptesis nula.
Las zonas de rechazo y de aceptacin tambin se pueden describir en funcin de x . La zona de
rechazo consta de dos conjuntos de valores de x (calculados a partir de muestras de tamao 25
extradas de la poblacin de inters): los que son tan grandes que la probabilidad de ocurrencia de valores
de ese tamao o mas grandes, cuando Ho es verdadera, es igual o menor que 0.025 y los que son tan
pequeos que la probabilidad de ocurrencia de valores de ese tamao o mas pequeos es igual o menor
que 0.025. Los valores crticos para la regin de rechazo son valores de x , que estn localizados a una
distancia de 1.96 errores tpicos a cada lado de la media hipottica. Los valores crticos son:

Si la muestra arroja un valor de x que quede a una distancia de 1.96 errores tpicos o mas medida
desde la media hipottica (esto es, si la x calculada es mayor o igual a 169.6 o menor o igual que
155.4), rechazaremos H, ). En cualquier otro caso, no la rechazaremos. La Figura 6.3 muestra las regiones
de rechazo y de aceptacin en funcin tanto de z como de x .
7 Recoleccin de datos y clculos. Se selecciona una muestra aleatoria simple de los puntajes
de 25 personas que jugaron ftbol durante los d1timos diez anos. La media de los pesos de la muestra
resulta ser igual a 178.7.
8 Decisin estadstica. Con los datos de la muestra se calcula

Como 4.50 es mayor que 1.96, este valor de z cae dentro de la regin de rechazo y por tanto
rechazamos HO.
Obsrvese tambin que 178.7 es mayor que 169.6, el valor critico superior expresado en funcin
de x . Por tanto habramos podido rechazar la hiptesis nula sin necesidad de calcular un valor z.
9 conclusin. Como rechazamos HO, volvemos a la hiptesis alterna para poder sacar una
conclusin. En este ejemplo podemos concluir, con base en los datos de la muestra, que el peso

11

promedio de los jugadores de ftbol de la universidad durante la ltima dcada, es diferente al


peso promedio de los jugadores durante la primera dcada.

Informe de los resultados. En los artculos de las revistas que contienen anlisis estadsticos de
proyectos de investigacin, encontramos una variedad de maneras de presentar los resultados. A
veces, se informa el valor del estadstico de prueba o el del estadstico de la muestra junto con la
afirmacin de si era o no significativo en el nivel de significacin escogido. De acuerdo con este
mtodo, informaramos los resultados del presente ejemplo, poniendo "z = 4.50, significativo en el
nivel 0.05", o x = 178.7, significativo en el nivel 0.05".
Cuando un resultado es significativo tanto en el nivel 0.05 como en el nivel 0.01, muchos
autores lo indican por medio de asteriscos. A los resultados que son significativos en el nivel 0.05, pero
no en el nivel 0.01, se les agrega un asterisco (*) y a los que son significativos en el nivel 0.01, dos
asteriscos (**). Como, en el presente ejemplo, 4.50 es mayor que 2.58 (valor de z en una prueba
bilateral con a = 0.01) el resultado se informara como z = 4.50** 6 x = 178.7**. Tal vez la forma
mas comn de presentar los resultados, en la literatura, es utilizando valores p.
DEFINICION
Un valor p es el valor ms pequeo de con el que se puede rechazar la hiptesis nula.
Existe la probabilidad de obtener, cuando Ho es verdadera, un valor del estadstico de prueba tan
extremo o ms extremo que aquel que realmente se ha observado. Si los resultados estadsticos se
presentan en una tabla, el valor p se indica generalmente en nota de pie de pgina. Si los
resultados se exponen en el texto de un artculo, el valor p se informa generalmente de manera
similar o a veces entre parntesis.
Al determinar un valor p, debemos tener en cuenta si la prueba es unilateral o bilateral. Si la
prueba es bilateral, los valores de p sern dos veces ms grandes de lo que serian en una prueba
unilateral, puesto que habr que tener en cuenta la probabilidad de obtener un valor extremo del
estadstico de prueba en cualquier direccin.
Para obtener el valor de p correspondiente al presente ejemplo, en el que la prueba es bilateral,
debemos buscar la probabilidad de observar un valor de z tan extremo o ms extremo que 4.50, en

12

cualquier direccin, cuando Ho es verdadera. Si consultamos la Tabla E del Apndice, vemos que el valor
tabulado mas grande de z es 3.09 y la probabilidad de obtener un valor de este tamao o mas grande es
0.5 - 0.4990 = 0.001. Como 4.50 esta mucho mas a la derecha de 0 que 3.09, la probabilidad de
observar un valor de z tan grande o mas grande que 4.50, cuando Ho es verdadera, es menor que
0.001. Como z = 4.50 se calcu1 como parte de una prueba bilateral, debemos tener presente un valor
tan extremo como 4.50 en la direccin opuesta. En consecuencia, el valor p que buscamos, es menor
que 2(0.001) = 0.002. Este resultado lo presentaramos en un informe como "p < 0.002". La
Figura 6.4 muestra el valor p correspondiente a este ejemplo.
Verificacin de hiptesis unilateral. Con frecuencia la naturaleza de una hiptesis de
investigacin es tal, que conduce a una hiptesis alterna unilateral que, a su vez, lleva a una prueba
unilateral que utiliza una regin de rechazo unilateral.

Cuando solo valores extremadamente grandes del estadstico de prueba (o solo valores
pequeos) dan origen al rechazo de la hiptesis nula, resulta conveniente utilizar una hiptesis
alterna unilateral. Verificamos la hiptesis nula mediante una prueba unilateral y utilizamos
entonces una regin de rechazo unilateral. Supongamos, por ejemplo, que el muestreo se hace en
una poblacin normalmente distribuida con una varianza de poblacin conocida y que la
naturaleza de la hiptesis de investigacin es tal que las hipte sis estadsticas son

Como solamente valores grandes del estadstico de prueba darn origen al rechazo de H o
(los valores pequeos trataran de apoyar la hiptesis nula), la regin de rechazo estar compuesta
de valores grandes del estadstico de prueba y por tanto, deber localizarse en la cola superior
de la distribucin del estadstico de prueba. En realidad, la regin de rechazo estar compuesta de
aquellos valores del estadstico de prueba tan grandes que la probabilidad de observar valores de ese
tamao o mas grandes, siendo Ho verdadera, es igual o menor que .
Figura 6.5 Regiones de aceptacin y de rechazo para dos conjuntos de hiptesis estadsticas unilaterales. El
muestreo se hizo en una poblacin normalmente distribuida, con varianza de poblacin conocida.

13

Por otra parte, si las hiptesis estadsticas son con un nivel de significacin , la regin de rechazo
estar localizada en la cola inferior de la distribucin del estadstico de prueba, puesto que
solamente valores pequeos del estadstico darn origen al rechazo de la hipte sis nula. La
Figura 6.5 muestra las regiones de aceptacin y de rechazo en estas dos situaciones.

Obsrvese que, para Ho o y H1 > o , existe un gran nmero de valores hipotticos para .
La forma de la hiptesis indica que el procedimiento de la verificacin de hiptesis podra resultar
adecuado para cada uno de los valores hipotticos. Sin embargo, por razones prcticas, se suele verificar
la hiptesis nula, acompaada de una alterna unilateral, solo en el punto de igualdad. Un pequeo clculo
nos demuestra que si se rechaza Ho cuando la prueba se hace en el punto de igualdad, entonces H o se
rechazara para cualquier otro valor hipottico de que este indicado por la hiptesis nula.
Ejemplo 6.2
La experiencia ha demostrado que, el tiempo promedio de reaccin a determinado estimulo en
sujetos normales que estn dentro de cierto limite de edad es de 65 milisegundos con una desviacin
tpica de 15 milisegundos. Un equipo de investigaciones psicolgicas cree que silos individuos reciben
cierto tipo de entrenamiento muestran entonces, en promedio, un tiempo de respuesta mas corto. Con
el fin de aclarar si esta opinin se puede probar, el equipo realizo el siguiente procedimiento para la
verificacin de hiptesis.
1 Planteamiento de la hiptesis. Podemos establecer formalmente la hiptesis de
investigacin correspondiente a este ejemplo as: el tiempo promedio de reaccin al estimulo de los
sujetos normales que reciben entrenamiento experimental es mas corto que el de los sujetos que no
lo reciben". Esta hiptesis de investigacin conduce a las siguientes hiptesis estadsticas:

La hiptesis alterna es unilateral puesto que solo los valores "pequeos" del estadstico de prueba
darn origen al rechazo de la hiptesis nula. Obsrvese tambin que la hiptesis alterna y la hiptesis de
investigacin son la misma.
2 Nivel de significacin. Sea = 0.01.

14

3 Descripcin de la poblacin y suposiciones. La poblacin que consta de todos los valores


de tiempo de respuesta al estimulo en sujetos normales es hipottica, puesto que, en realidad, no
existe en el momento. Los investigadores creen que es razonable suponer que esta poblacin de valores
hipotticos, de obtenerse, estar normalmente distribuida, con una desviacin tpica de 15, desviacin
tpica de los sujetos normales que no reciben entrenamiento. En el experimento participa una muestra
de 20 sujetos.
4 El estadstico pertinente. El estadstico mas importante es x , si suponen que la poblacin
esta normalmente distribuida, los investigadores pueden suponer tambin que la distribucin
muestral de x , ser normal y tendr una media de 65 y una desviacin tpica de ( x = 1520 =
3.35), en caso de que la hiptesis nula sea verdadera.
5 El estadstico de prueba y su distribucin. Como el estadstico mas importante, x , esta
normalmente distribuido y como se supone que es conocida, el estadstico de prueba adecuado es Z.
6 Regiones de rechazo y de aceptacin. En virtud de que solamente valores "pequeos" del
estadstico de prueba calculado darn origen al rechazo de la hiptesis nula, la regin de rechazo estar
localizada en la cola izquierda de la distribucin de z.

En otras palabras, la regin de rechazo constara de todos los valores de z tan pequeos, que la
probabilidad de obtener un valor de ese tamao o menor, cuando H o es verdadera, es igual o menor que
0.01, o nivel de significacin escogido. En la Tabla E del Apndice encontramos que el valor crtico de
z es igual a -2.33. Obtenemos el valor critico, en funcin de x , sabiendo que esta localizado a una
distancia de 2.33 errores tpicos a la izquierda de la media supuesta de la distribucin muestral de x . Como
x = 3.35, esta distancia es igual a 2.33 X 3.35 = 7.81. El valor critico, en funcin de x , es entonces, 65
- 7.81 = 57.19. La Figura 6.6 muestra las zonas de rechazo y de aceptacin tanto en funcin de z como
de x .
7 Recoleccin de datos y clculos. Veinte sujetos normales recibieron el entrenamiento y en
seguida se les hizo una prueba para determinar sus tiempos de reaccin al estimulo. Los investigadores
registraron un tiempo de reaccin promedio de 55.5 milisegundos. Con base en estos datos, podemos
calcular z = (55.5 - 65)/3.35 =-2.84.
8 Decisin estadstica. Como el valor de z calculado,-2.84, es menor que -2.33 (es decir

15

como -2.84 cae en la regin de rechazo), rechazamos Ho. Observemos tambin que x = 55.5 cae
en la regin de rechazo definida en trminos de x . Sin tener en cuenta si el estadstico pertinente (en
este caso x ) o el estadstico de prueba se utilizan para determinar si H o se rechaza o no, en una situacin
dada la decisin siempre ser la misma. La Figura 6.6 muestra donde se localizan los valores calculados
de x y z respecto de los valores crticos. De acuerdo con la Tabla E del Apndice encontramos que la
probabilidad de obtener un valor de z igual o menor que -2.84, cuando H o es verdadera, es 0.0023.
Entonces, la probabilidad de observar un valor de x igual o menor que 55.5, cuando H o es verdadera,
es de 0.0023. Por eso, el valor p correspondiente a este ejemplo es 0.0023 como se indica en la Figura
6.6.
9 Conclusin. Como rechazamos H O, concluimos que Hl es verdadera. Es decir, en el presente
ejemplo, concluimos que el tiempo promedio de reaccin de los sujetos que reciben entrenamiento
especial es mas corto que el de aquellos que no lo reciben.
Poblacin distribuida normalmente, 2 desconocida
Cuando resulta apropiado verificar una hiptesis sobre una media poblacional, la varianza poblacional
2 generalmente es desconocida y en consecuencia no se puede determinar exactamente n, o error
tpico del estadstico pertinente x . Si la muestra es grande, se puede hacer una estimacin satisfactoria de
2 con los datos de la muestra. Si la poblacin de inters esta normalmente distribuida, las medias
muestrales lo estarn tambin y se podr utilizar el estadstico de prueba z. Inclusive cuando la poblacin
no esta normalmente distribuida, la distribucin muestral de la media esta distribuida en forma
aproximadamente normal como consecuencia del teorema del lmite central y, por tanto, se puede
utilizar a z como estadstico de prueba. Sin embargo, cuando el tamao de la muestra es pequeo, no se
puede aplicar el teorema de lmite central y es necesario buscar un estadstico de prueba distinto de z. Si
se sabe que la poblacin esta, al menos aproximadamente, distribuida en forma normal, o si, al no
tenerse un conocimiento preciso esto parece ser una suposicin razonable, el estadstico t, constituye
la mejor eleccin de un estadstico de prueba. En el Capitulo 11 se estudiaran los procedimientos
para la verificacin de hiptesis que son apropiados cuando el tamao de la muestra es pequeo y cuando
no se puede suponer que la poblacin esta normalmente distribuida.
Ejemplo 6.3
Un fabricante de drogas dice que el tiempo promedio para que se disuelva el contenido de cierta
cpsula es de 50 minutos. El equipo de investigaciones de una empresa competitiva no cree en esto. Por
eso, hace una prueba con una muestra al azar de 20 cpsulas y calcula una media muestral de 54 minutos y
desviacin tpica de 15. El equipo de investigaciones deseaba saber si puede concluir que el tiempo
promedio que se requiere para que se disuelva el contenido es mayor que 50 minutos. El equipo
Ilevo a cabo el siguiente procedimiento para la verificacin de hiptesis.
1 Planteamiento de la hiptesis. La hiptesis de investigacin es la siguiente: "el tiempo
promedio requerido para que se disuelva el contenido de la cpsula es mayor que 50 minutos". Las
hiptesis estadsticas son:

2 Nivel de significacin. La probabilidad de cometer un error de Tipo I se fija en = 0.05.


3 Descripcin de la poblacin y suposiciones. El equipo de investigaciones supone que la
poblacin de los tiempos de disolucin esta distribuida en forma aproximadamente normal.
4 El estadstico pertinente. El estadstico pertinente es x , la media de la muestra.
5 El estadstico de prueba y su distribucin. En virtud de que n es pequeo (menor que 30),
es desconocido y se supone que la poblacin de la muestra esta normalmente distribuida, el estadstico

16

de prueba apropiado es:

que sigue la distribucin t, de Student con n - 1 grados de libertad.


6 Regiones de rechazo y de aceptacin. Mediante la Tabla F del Apndice encontramos que el valor
critico de t para una prueba unilateral con = 0.05 y 20 - 1 = 19 grados de libertad, es 1.7291. El
valor critico, expresado en funcin de x esta dado por 50 + (1.7291) (15/20) = 55.8. La Figura 6.7
muestra las regiones de aceptacin y de rechazo en funcin de t .
7 Recoleccin de datos y clculos. Como ya lo anotamos, una muestra al azar de 20
observaciones arrojo una media de 54 y una desviacin tpica de 15. A partir de estos datos
podemos calcular

8 Decisin estadstica. Como el valor de t calculado, 1.19, es menor que 1.7291 (es decir, cae en
la regin de aceptacin) no podemos rechazar H O. Llegamos a la misma decisin observando que x
= 54 es menor que 55.8 valor critico de x . Consultando la Tabla F del Apndice podemos obtener
algn conocimiento de la magnitud del valor p para esta prueba. Observamos que para 19
grados de libertad, la probabilidad de obtener un valor t tan grande o ms grande que 1.328,
cuando H o es verdadera, es 0.10. Como el valor de t calculado, 1.19, es menor que 1.328, concluimos
que para esta prueba p > 0.10. Para obtener un valor ms exacto de p, necesitaramos consultar una
tabla mas completa de la distribucin t.
9 Conclusin. Como hemos rechazado HO, concluimos que Ho puede ser verdadera, es decir, que
el tiempo promedio que se requiere para que el contenido de la cpsula se disuelva puede ser de 50
minutos o de menos.
En el Capitulo 5 vimos que cuando el tamao de la muestra es grande, muchos expertos en
estadstica prefieren utilizar la distribucin z ms bien que la distribucin t cuando construyen
intervalos de confianza para , aunque sea desconocida. De la misma manera, muchos expertos
prefieren z, en vez de t, para verificar hiptesis, cuando tienen muestras grandes, a pesar de que a sea
desconocida.

Esta practica se justifica por el hecho de que, cuando Ho es verdadera, ( = o ) y n es grande, el


estadstico esta distribuido aproximadamente como la distribucin normal estandarizada.

17

Cuando se sigue esta practica, se compara, para la significacin, el valor calculado del estadstico
de prueba con un valor apropiado de la distribucin z.
Muestreo en una poblacin no distribuida normalmente
Con frecuencia, la poblacin de inters no esta normalmente distribuida. En otros
casos, el investigador, que no conoce la forma funcional de la poblacin, no quiere suponer que esta
normalmente distribuida. En situaciones como estos, el estadstico t no es apropiado como estadstico
de prueba y el estadstico z es apropiado nicamente si el tamao de la muestra es grande. En el
siguiente ejemplo, vamos a explicar el procedimiento para la verificacin de hiptesis que se debe
emplear cuando el muestreo se hace en una poblacin no distribuida normalmente, con varianza
desconocida (el caso usual) y cuando el tamao de la muestra es suficientemente grande como para
aplicar el teorema del Lmite central.
Ejemplo 6.4
Un grupo de profesores investigadores de una escuela de educacin de cierta universidad
partan de la hiptesis de que el enriquecimiento del plan de estudios en el colegio hara aumentar los
puntajes en habilidad verbal cuando los estudiantes presentaran los exmenes de admisin de la
universidad. Con el fin de observar si era posible obtener alguna evidencia para apoyar su hiptesis, los
profesores introdujeron un programa de enriquecimiento en el plan de estudios de primer ano de
un colegio local. El programa continuo, con esta clase, hasta el ltimo ano. Al finalizar el ultimo ao,
125 alumnos de esta clase tomaron exmenes de admisin en la universidad. El puntaje verbal promedio
fue de 590 con una desviacin tpica de 35. El puntaje verbal promedio de los estudiantes que
presentaron estos exmenes durante los 5 aos anteriores fue de 580. Los profesores deseaban saber
si podan sacar como conclusin que el enriquecimiento del plan de estudios haba aumentado el puntaje
verbal promedio. Se puede llevar a cabo el siguiente procedimiento para la verificacin de hiptesis.
1 Planteamiento de la hiptesis . hiptesis de investigacin: "el enriquecimiento del plan
de estudios del colegio mejora los puntajes en habilidad verbal de los alumnos que presentan examen
de admisin en la universidad".

2 Nivel de significacin. Sea

0.05.

3 Descripcin de la poblacin y suposiciones. En virtud de que el tamao de la muestra es


grande, se puede aplicar el teorema del lmite central sin tener en cuenta la forma funcional de la
poblacin. Se supone que los 125 puntajes constituyen una muestra aleatoria de una poblacin
grande de puntajes.
4 El estadstico pertinente. Como las hiptesis se refieren a la media de poblacin, el estadstico
ms importante es x , o media muestral. La distribucin de x esta distribuida en forma
aproximadamente normal, puesto que n es grande. Si Ho es verdadera, la media de la distribucin
muestral de x es 580 o menos. Como la prueba se va a realizar en el punto de igualdad, la distribucin
pertinente tiene una media de 580, si Ho es verdadera. El error tpico estimado de x esta dado por

s / n = 35 / 125 = 3.13.
5 El estadstico de prueba y su distribucin. El estadstico de prueba apropiado es z, que
esta normalmente distribuido, con media 0 y desviacin tpica 1.
6 Regiones de rechazo y de aceptacin. El valor crtico de z es 1.645, de modo que la
regin de rechazo consta de todos los valores de z iguales o mayores que 1.645 y la regin de aceptacin
consta de todos los valores de z menores que 1.645. El valor critico de x es 580 + (1.645) (3.13) =

18

585.15. Expresada en funcin de x la regin de rechazo consta de todos los valores de x mayores o
iguales a 585.15 y la regin de aceptacin de todos los valores de x menores que 585.15.
7 Recoleccin de datos y clculos. Como ya lo advertimos, n = 125, x = 590, y S = 35. A
partir de estos datos podemos calcular

8 Decisin estadstica. Como el valor de z calculado, 3.19, es mayor que el valor critico de z,
1.645, rechazamos HO. tambin, puesto que la x observada, 590, es mayor que el valor critico de x ,
585.15, rechazamos HO. El valor p para esta prueba es menor que 0.001.
9 Conclusin. Debido a que se rechaza HO, los profesores pueden concluir que el enriquecimiento
del plan de estudios de un colegio mejora el puntaje en habilidad verbal de los exmenes de admisin en
la universidad.
EJERCICIOS
1 En una poblacin normalmente distribuida con desviacin tpica igual a 32, se extrae una
muestra aleatoria simple de tamao 16, que arroja una media y una desviacin tpica de 520 y 40
respectivamente. A partir de estos datos, se puede concluir, en el nivel de significacin 0.05, que
es mayor que 516? Hacer una grafica para explicar la localizacin de las zonas de rechazo y de
aceptacin en funcin tanto del estadstico pertinente como del estadstico de prueba. Cual es el valor
p para esta prueba?
2 Una muestra aleatoria simple de tamao 9 tomada de una poblacin normalmente distribuida
arrojo una media y una desviacin tpica de 150 y 30 respectivamente. Proporcionan estos
datos evidencia suficiente para po der concluir que la media poblacional es menor que 160? Cual es
el valor p para esta prueba?
3 A partir de los datos de una muestra aleatoria simple de 100 estudiantes de bachillerato
seleccionados en varios colegios de una ciudad se averiguo que los gastos medios semanales de los
estudiantes eran de 3.25 pesos con una desviacin tpica de 1 peso. Proporcionan estos datos suficiente
evidencia como para decir que la media poblacional es diferente de $ 3.00? Cual es el valor p para
esta prueba?
4 Un especialista en lectura cree que los estudiantes de ciases no programadas obtienen puntajes
superiores en pruebas de comprensin de lectura que los estudiantes de clases programadas. El puntaje
medio obtenido en la prueba de comprensin de lectura por los estudiantes de clases programadas que
entraron a 4o. grado durante los 5 aos anteriores es de 4.25. Un grupo de 81 estudiantes que asisti a
clases no programadas durante sus 3 primeros aos, obtuvo un puntaje en la prueba de comprensin de
lectura de 5.30, con una desviacin tpica de 1.8. Proporcionan estos datos evidencia suficiente como
para apoyar la hiptesis del especialista en lectura? Sea = 0.01. Cual es el valor p en esta prueba?
5 Un investigador agrcola crea que el nmero medio de acres que los hacendados de un
determinado estado dedicaban a cierto cultivo era inferior a 6. El investigador envi por correo un
cuestionario a una muestra aleatoria simple de 25 hacendados de ese estado en que les solicitaba
informacin sobre el nmero de acres sembrados. La media y la desviacin tpica de la muestra fue
de 5 y 1,5 acres respectivamente. En el nivel de significacin 0.05 sirven estos datos de apoyo a la
opinin del investigador? Cul es el valor p para esta prueba?
6 Un consejero escolar ha descubierto que durante los ltimos 5 anos los alumnos de ltimo
ano que no tuvieron consejera vocacional y que tomaron una prueba de madurez, obtuvieron un
puntaje promedio de 190. El consejero opina que los estudiantes que reciben consejera

19

vocacional individualmente tienen en promedio un puntaje superior a este. El puntaje promedio de 64


estudiantes de ltimo ano que recibieron consejera vocacional individual durante su ltimo ano de
colegio, fue de 205 con una desviacin tpica de 24. Constituyen estos datos un apoyo para la
opinin del consejero? Sea a = 0.05. Cul es el valor p para esta prueba?
7 Un trabajador social cree que el numero promedio de anos de escola ridad correspondiente
a los adultos que se encuentran inscritos en el bienestar social, es menor que 5. Una muestra aleatoria de
169 de estos adultos arrojo una media de 4.6 aos de escolaridad con una desviacin tpica de
3.9 aos. Proporcionan estos datos evidencia suficiente para que el trabajador social concluya que p < 5
aos? Sea = 0.05. Cul es el valor p para esta prueba?
8 Una muestra aleatoria de 100 familias seleccionadas en un determinado sector arrojo un
promedio de ingresos familiares por ano de 9700 y una desviacin tpica de 1000. Proporcionan estos
resultados suficiente evidencia para indicar que la media verdadera es menor de $10 000? Sea =
0.05.
9 Una muestra aleatoria de 16 hembras de una especie de pequeos mamferos fue
seleccionada en una regin geogrfica. La longitud promedio de la cola de las hembras de la muestra fue
de 94 milmetros con una desviacin tpica de 12 milmetros. La longitud promedio de la cola de las
hembras de esta misma especie en otra regin geogrfica fue de 81 milmetros. Proporcionan estos
datos evidencia suficiente para indicar que la muestra provena de una poblacin con una media mayor que
81? Sea = 0.05. Cul es el valor p para esta prueba? Que suposiciones hay que hacer?
10 Una muestra aleatoria de 25 personas que desempean una ocupacin determinada
obtuvieron un puntaje promedio de actitud espacial de 89, con una desviacin tpica de 20.
Proporcionan estos datos suficiente evidencia para concluir que el puntaje promedio verdadero
para la poblacin
prueba?
11 Un trabajador social cree que el peso promedio de los muchachos de 10 aos que viven en
un sector rural determinado es inferior a 34 kilogramos. Una muestra aleatoria de 25 muchachos tomada
de esa poblacin arrojo un peso promedio de 30 kilogramos y una desviacin tpica de 10.
Proporcionan estos datos evidencia suficiente para concluir que la opinin del trabajador social es
correcta en el nivel de significacin 0.05? Expresar las suposiciones necesarias en la
aplicacin del procedimiento de verificacin y calcular el va lor de p correspondiente.
12 Un nutricionista cree que el consumo diario promedio de protenas en una poblacin es menor
que 75 gramos. Una muestra aleatoria de 16 sujetos arrojo una media de 73.8 gramos con una desviacin
tpica de 2.4 gramos. Constituyen estos datos un fundamento para la opinin del nutricionista? Sea =
0.05. Calcular el valor de p para esta prueba y enunciar las suposiciones que sean necesarias.
13 Una encuesta de 64 empleados profesionales de una institucin correccional revelo que el
tiempo promedio de empleo en el campo correccional era de 5 aos con una desviacin tpica de 4
anos. Sirven estos datos de soporte a la hiptesis de que el tiempo promedio de empleo de todos
los empleados de este tipo esta por debajo de los 6 aos? Sea = 0.05.
14 Una encuesta hecha a 100 estudiantes matriculados en una universidad urbana revelo que
durante un trimestre de primavera, la cantidad promedio de dinero gastado en vestuario se elevo
a $55 con una desviacin tpica de $20.00. Verificar la hiptesis nula de que = $60.00. Sea
= 0.05. Calcular el valor p para esta prueba.
6.4 EL ERROR DE TIPO II Y LA POTENCIA DE UNA PRUEBA
En las pruebas de hiptesis que se acaban de estudiar, a, la probabilidad de cometer un error
de Tipo I (rechazando una hiptesis nula verdadera), ha estado bajo el control del inves tigador y
se le ha fijado un valor pequeo, como 0.05 6 0.01. En esta seccin vamos a estudiar con ms
detalle a , o probabilidad de cometer un error de Tipo II (aceptando una hiptesis nula falsa).

20

El error de Tipo II
Consideremos la hiptesis H o: , = o y H1: o con = 0.05. Supongamos que la
poblacin pertinente esta normalmente distribuida, con varianza conocida 2 . Siendo = 0.05,
la regin de rechazo queda definida y consta de todos los valores de x mayores o iguales a +
1.96 x y menores o iguales a o - 1.96 ,, donde o es la media hipottica de la distribucin
muestral de x . La Figura 6.8 muestra esta distribucin, base de la verificacin de hiptesis.
Si Ho es falsa, la distribucin muestral verdadera de x no estar centrada en o , como se ve en
la Figura 6.8, sino que quedara centrada sobre la media poblacional verdadera. Si es igual a 1,
por ejemplo, la distribucin muestral de x quedara centrada sobre 1. Sin embargo, las regiones de
rechazo y de aceptacin quedaran fijas, puesto que estn determinadas por y por Ho. Si el valor
de x calculado con los datos de la muestra simple, que se extrajo de la poblacin para verificar
Ho, cae en la regin de aceptacin, cuando realmente es igual a 1, Ho ser "aceptada" y se
cometer un error de Tipo II. La probabilidad, , de que este suceso ocurra es igual a la parte del
rea bajo la curva de x centrada sobre 1 que coincide con el rea bajo la curva de x centrada sobre o
que se encuentra entre los valores crticos de x . Ver Figura 6.9.
Figura 6.8- distribucin muestral hipottica de x para Ho: = o , H 1 o , cuando el
muestreo se hace en una poblacin normalmente distribuida con varianza 2 ( = 0.05).

21

Bajo la hiptesis H1 o, puede asumir un numero infinito de valores y por lo tanto existe
un numero infinito de posibles valores de . Aquel que se deba aplicar en una situacin dada,
cuando H o es falsa, depende del valor verdadero de . En la practica, no conocemos el valor verdadero
de cuando Ho es falsa y por tanto no sabemos el valor real de . La Figura 6.9 muestra algunas
alternativas posibles para , cuando Ho es falsa y las correspondientes . En esta figura, las distribuciones
muestrales correspondientes a diversos valores de aparecen verticalmente para ms claridad. Debemos
darnos cuenta de que, en realidad, los diversos valores de estn todos localizados sobre el mismo eje
x y, en consecuencia, todas las curvas de distribucin muestral correspondientes tienen la misma lnea x
como eje horizontal. Tambin debemos darnos cuenta de que, a pesar de que en la Figura 6.9
solamente se muestran seis alternativas diferentes de Ho : = o. existe un numero infinito de ellas. Al
observar la Figura 6.9 se puede ver que las alternativas para o que estn localizadas cerca de o, producen
valores ms grandes de que las alternativas que estn lejos de o. Por ejemplo, la distancia que hay entre
1 y o es mas corta que la distancia que hay entre 2 y o y, en consecuencia, 1 es mayor que 2.
Expliquemos ahora por medio de un ejemplo como se calcula un error de Tipo II.
Ejemplo 6.5
Un psiclogo clnico deseaba verificar, en el nivel de significacin 0.05, la hiptesis de que el
promedio del CI de un grupo de retardados mentales era de 65. Una muestra aleatoria de 50 sujetos
arrojo una desviacin tpica de 12. El psiclogo tambin deseaba calcular la probabilidad de cometer un
error de Tipo II. Los valores diferentes de para los cuales se calculo fueron 1 = 67, 2=70, 3=63, y
4=61.
Los valores crticos para la verificacin de hiptesis son

22

La Figura 6.10 muestra estos valores crticos.


Al determinar para los diferentes valores de , suponemos que S = 12, estimacin muestral de
, es una estimacin apropiada para cada caso. Primero calcularemos para la alternativa l = 67. Si Ho =
65 es falsa porque es realmente igual a 67, la distribucin muestral apropiada de x estara centrada
en 67. Como los valores crticos de x , bajo la hiptesis Ho, son 62 y 68, "aceptaremos" H o siempre que
un valor observado de x caiga entre 62 y 68. Si es realmente igual a 67, estaremos "aceptando"
una hiptesis nula falsa. La probabilidad de "aceptar" una hiptesis nula falsa (cometiendo un error
de Tipo II) cuando = 67 es igual al rea, entre 62 y 68, que esta bajo la curva de x centrada sobre 67.
Podemos expresar esta rea en trminos probabilsticas de la manera siguiente:

Para calcular esta probabilidad convertimos a x en la escala normal estandarizada y obtenemos

La figura 6.11 muestra grficamente este valor 1 de

23

Clculos semejantes para 2 = 70, 3 = 63 y 4 = 61, dan respectivamente los valores 2 =


0.1190, 3 = 0.7208 y 4 = 0.2776. La Figura 6.12 muestra estos distintos valores de y tambin el de
1.

Obsrvese que disminuye cuando la distancia entre o y el otro valor de , para el cual se calcula
13, aumenta. Tambin obsrvese que en el Ejemplo 6.5 todos los valores calculados de , como se ve en
la Figura 6.12, son mayores que el valor preseleccionado de = 0.05. En realidad, hay que seleccionar un
valor de aproximadamente igual a 70.8 o a 59.2 para que el valor correspondiente de sea igual a 0.05.
As pues, la probabilidad de "aceptar" una hiptesis nula falsa, , es siempre mayor que , excepto
cuando la hiptesis nula es falsa porque el verdadero valor de "esta muy lejos" de o.
En muchas situaciones practicas, no estamos motivados para verificar hiptesis sobre medias
poblaciones tales que, si Ho es falsa, el valor real de esta muy lejos de o . Por ejemplo, no podemos
imaginar a alguien que este interesado en verificar estadsticamente la hiptesis nula de que la estatura
promedio de los nios de seis aos es igual a la estatura promedio de los adultos. Por el contrario, no
pondramos en tela de juicio el inters de alguien por verificar la hiptesis nula de que la estatura
promedio de un grupo determinado de mujeres adultas es igual a la estatura promedio de otro grupo de
mujeres. En otras palabras, en muchas situaciones practicas, si Ho es falsa, es falsa porque el valor verdadero
de esta cerca de o. Por otra parte, mientras mas cerca este el valor verdadero de respecto de o,
ms grande ser el valor de , la probabilidad de "aceptar" una hiptesis nula falsa. Es por esta razn que
advertimos que una conclusin que se basa en una hiptesis nula rechazada es mas decisiva que una
que se basa en una hiptesis nula "aceptada".

24

Es tambin por esta razn que, cuando rechazamos una hiptesis nula, decimos que Hl es verdadera,
pero cuando "aceptamos" o dejamos de rechazar una hiptesis nula, decimos que Ho puede ser
verdadera.
La potencia de una prueba
Un concepto muy util para evaluar las verificaciones de hiptesis lo constituye la potencia de una
prueba. La potencia de una prueba es la probabilidad de rechazar una hiptesis nula falsa.
Generalmente viene expresado por 1 - . Para una dada, decimos que una prueba es mas potente que
otra, si el valor de 1 - es mayor en la una que en la otra para todos los valores de .
Con frecuencia, es til contar, para una prueba particular, con lo que se conoce con el nombre de
funcin potencia.
DEFINICION
Una funcin potencia es una funcin que muestra la relacin que existe entre la
probabilidad de rechazar una hiptesis nula y los diferentes valores que puede asumir el
parmetro dadas una hiptesis nula, una hiptesis alterna y un nivel de significacin
determinado.
La Tabla 6.2 da algunos de los valores de la funcin potencia correspondiente al Ejemplo 6.5.
Se puede obtener una curva de potencia representando grficamente la funcin potencia. Los
posibles valores del parmetro se representan sobre el eje horizontal y los valores de 1 - sobre el
eje vertical. La Figura 6.13 muestra el grafico de la funcin potencia de la Tabla 6.2.

La funcin potencia se usa para determinar la magnitud de 1 - cuando son verdaderos los valores
especficos de la hiptesis alterna.
La Figura 6.13 muestra la apariencia general en forma de V de las curvas de potencia
correspondientes a pruebas bilaterales. En trminos generales una prueba bilateral que discrimina bien
entre el valor del parmetro en Ho y los valores en H1 (excepto los que se encuentran cerca al valor
expresado de Ho) da como resultado una curva de potencia en forma de V estrecha. Una curva en V
extendida indica que la prueba discrimina pobremente en un intervalo relativamente amplio de valores
diferentes del parmetro.
La curva de potencia para una prueba unilateral con la regin de rechazo en la cola superior toma la
forma de una S alargada. Una prueba unilateral con la regin de rechazo en la cola inferior de la
distribucin tiene como resultado una curva de potencia que se asemeja a una S alargada pero al revs.
La Figura 6.14 muestra la curva de potencia para el Ejemplo 6.2, que utiliza una prueba unilateral con
regin de rechazo en la cola inferior de la distribucin muestral.

25

EJERCICIOS
1 5 Con los datos del Ejercicio 1, construir y representar grficamente la funcin potencia.
16 Construir y representar grficamente la funcin potencia correspondiente al Ejercicio 3.
17 Construir y representar grficamente la funcin potencia correspondiente al Ejercicio 4.
18 Construir y representar grficamente la funcin potencia correspondiente al Ejercicio 6.
19 Construir y representar grficamente la funcin potencia correspondiente al Ejercicio 7.
20 Construir y representar grficamente la funcin potencia correspondiente al Ejercicio 8.
21 Construir y representar grficamente la funcin potencia correspondiente al Ejercicio 13.
22 Construir y representar grficamente la funcin potencia correspondiente al Ejercicio 14.
6.5 VERIFICACIN DE UNA HIPTESIS SOBRE LA DIFERENCIA ENTRE DOS MEDIAS
PBLACINALES
En el Captulo 5 estudiamos la construccin de intervalos de confianza para la diferencia entre
dos medias poblacionales. En el presente captulo vamos plantearnos el problema de verificar hiptesis
sobre la diferencia entre dos medias poblacionales. El ejemplo que se estudi anteriormente
relacionado con el equipo de psiclogos interesado en los puntajes de amor propio de los
conformistas y de los no conformistas es una ilustracin de este tipo de pruebas de hiptesis. En ese
ejemplo los psiclogos deseaban saber si era posible obtener la conclusin de que los puntajes

26

promedio de amor propio de los no conformistas es mayor que el de los conformistas. Podramos 'citar
otros ejemplos. Un bilogo podra estar interesado en saber si es posible concluir que la duracin
promedio de vida de algn animal es inferior en un tipo determinado de medio ambiente que en otro.
Un socilogo podra querer saber si el nmero promedio de aos de educacin es diferente en dos
poblaciones. Un economista tal vez est interesado en saber si el ingreso familiar promedio es
diferente en dos grupos. Vamos a estudiar pruebas bilaterales y pruebas unilaterales para cada una de las
tres situaciones siguientes: (1) cuando el muestreo se hace en dos poblaciones que estn
distribuidas en forma por lo menos aproximadamente normal, con varianzas conocidas, (2) cuando el
muestreo se hace en dos poblaciones que estn distribuidas en forma por lo menos
aproximadamente normal con varianzas desconocidas pero iguales y (3) cuando el muestreo se hace en
dos poblaciones que no estn normalmente distribuidas.
En el Captulo 4 vimos las distribuciones muestrales apropiadas para cada una de estas situaciones.
Poblaciones normalmente distribuidas, 12 y 22 conocidas
Ejemplo 6.6
En un establecimiento escolar suburbano, se seleccion al azar una muestra de 25 alumnos de
quinto grado (grupo A) de una poblacin de estudiantes pertenecientes a familias en que ambos padres
trabajan. Se seleccion tambin una muestra al azar de 15 estudiantes (grupo B) del mismo grado y
establecimiento escolar entre aquellos estudiantes que pertenecen a familias en que solamente el padre
trabaja. El anlisis de los puntajes de rendimiento escolar de los dos grupos dio los siguientes resultados:
Puntaje promedio ( x )
Grupo
Grupo B

78
85

La experiencia muestra que las poblaciones de puntajes para ambos grupos estn distribuidas en
forma aproximadamente normal, con varianzas de = 81 y ( x ) = 25. Con el fin de determinar si se
puede concluir, con base en estos datos, que la media de la poblacin de la que se seleccion el grupo A
es inferior a la media de la poblacin de la que se seleccion el grupo B, se puede llevar a cabo la
siguiente verificacin de hiptesis.
1 Planteamiento de la hiptesis.

2 Nivel de significacin. = 0.05.


3 Descripcin de las poblaciones y suposiciones. Como ya lo hemos observado se cree
que es razonable suponer que las dos poblaciones estn distribuidas en forma aproximadamente
normal. Las muestras son independientes.
4 El estadstico pertinente. En virtud de que se va a verificar una hiptesis sobre la
diferencia entre dos medias poblacionales, el estadstico ms adecuado es la diferencia entre las medias
muestrales que se calcula a partir de las muestras tomadas de las poblaciones. El estadstico puede
designarse como x 1 - x 2. De acuerdo con lo que vimos en el Captulo 4 , sabemos que, en esta
situacin, podemos considerar que la distribucin muestral de x est normalmente distribuida con varianza
igual a

27

y con media igual a 0, si Ho es verdadera.


5 El estadstico de prueba y su distribucin . Como suponemos que la poblacin est
normalmente distribuida y como conocemos las varianzas poblacionales, el estadstico de prueba ms
adecuado es z, que sigue la distribucin normal estandarizada.
6 Regiones de rechazo y de aceptacin. El valor crtico de z es - 1.645.
El valor crtico de x A, - x B es

7 Recoleccin de datos y clculos. De acuerdo con los resultados dados anteriormente


encontramos que .x .A -.x B = 7 8 - 85 = -7. El valor z que se puede calcular con base en estos datos es

8 Decisin estadstica. Como -7 < -3.64 y -3.16 < -1.645 podemos


rechazar Ho .
9 Conclusin. Se concluye que en ese establecimiento escolar, los punt ajes promedio
generales de rendimiento de los estudiantes de quinto grado que pertenecen a familias en que ambos
padres trabajan son inferiores a los de los estudiantes que pertenecen a familias en que solamente el padre
trabaja.
Podemos hacer una forma semejante a la que se acaba de describir, hiptesis bilaterales que tienen
la siguiente forma:

Poblaciones normalmente distribuidas, 1 y '2 desconocidas pero iguales


Ejemplo 6.7
Dos profesores de una escuela de educacin de una universidad desean comparar los puntajes
totales de rendimiento de los estudiantes de octavo grado que han sido mviles (poblacin 1) durante
sus aos de escuela elemental con los puntajes de los estudiantes que no lo han sido (poblacin 2).
Especficamente desean saber si pueden concluir con los datos de la muestra (n 1 = 15, n 2 = 22), si
el puntaje de rendimiento promedio es diferente en los dos grupos. Los profesores definieron como
estudiantes mviles a aquellos que asistieron a dos o ms escuelas elementales. Clasificaron
como no mviles a los estudiantes que haban asistido a la misma escuela durante todos los aos de
escuela elemental. Los profesores efectan el siguiente procedimiento para la verificacin de hiptesis.
1 Planteamiento de la hiptesis. Como los investigadores no tienen cmo especificar la
direccin de la diferencia que pudiera existir entre las dos medias poblacionales, hacen las siguientes
hiptesis alternas bilaterales:

28

2 Nivel de significacin. Sea = 0.05.


3 Descripcin de las poblaciones y suposiciones. Los profesores suponen que ambas
poblaciones estn distribuidas en forma aproximadamente normal. Las varianzas poblacionales son
desconocidas, pero los profesores suponen que son iguales. Las muestras son independientes.
4 El estadstico pertinente. El estadstico ms adecuado es x 1- x 2, que, en virtud de que se
supone que las dos poblaciones estn distribuidas en forma aproximadamente normal, podemos
considerar como normalmente distribuido. Si Ho es verdadera, la media de la distribucin muestral es 1 -2
= 0 y su varianza es ( 12 / n1 ,) + ( 22 / n2 ). Como 12 / n1 y 22 / n2 son desconocidas, no podemos calcular
la varianza verdadera de x 1- x 2 y, en consecuencia, excluimos a z como estadstico de prueba.
5 El estadstico de prueba. Como se observ en el paso 4, z no es el estadstico de prueba
apropiado. Como se supone que las dos poblaciones estn distribuidas en forma aproximadamente
normal, con varianzas desconocidas pero iguales, el estadstico de prueba ms adecuado es el estadstico
t de Student con n1 + n2 - 2 grados de libertad.
6 Regiones de rechazo y de aceptacin. Como los grados de libertad son 15 + 22 -- 2 =
del Apndice, que los valores crticos de t son
2.0301. No podemos calcular los valores crticos de x 1 -- x 2 , haber calculado las varianzas muestrales.
7 Recoleccin de datos y clculos. Los profesores obtuvieron las siguientes medias y
varianzas muestrales.

La estimacin combinada de la varianza de la poblacin comn es:

que es el error tpico de x 1 - x 2 .


El valor de t que se puede calcular con base en estos datos es:

8 Decisin estadstica. Como -2.0301 < -1.14 < 2.0301 es decir, como -1.14 cae en la
regin de aceptacin, no podemos rechazar Ho.
Hacindolo de otro modo, podramos haber basado nuestra decisin de rechazar o no a HO
en la magnitud de la diferencia observada x 1 - x 2 = 85 - 87 = -2. Los valores crticos de x 1 - x 2
estn dados por
0 (2.0301) (1.76) = -3.57

29

Como --3.57 < -2 < 3.57, no podemos rechazar Ho.


9 Conclusin. Con base en estos datos, los profesores pueden concluir que no debe haber
ninguna diferencia entre las dos medias de poblacin.
Muestreo en poblaciones no distribuidas normalmente
Ejemplo 6.8
Un equipo de consejeros de rehabilitacin juvenil tiene la impresin de que los jvenes
reincidentes y los no reincidentes son diferentes en cuanto al promedio de edad en que caen en
poder de las autoridades. Con el objeto de ver si pueden tener evidencias para corroborar esta idea, el
equipo saca una muestra aleatoria de nR = 50 registros de reincidentes y una de n N = 60 de no
reincidentes. Efectan el siguiente procedimiento para la verificacin de hiptesis.
1 Planteamiento de la hiptesis.

donde N es la edad promedio de los no reincidentes en el momento en que cayeron por


primera vez en manos de la polica y la edad promedio en que los reincidentes cayeron por primera
vez en manos de la polica.
2 Nivel de significacin. Sea
3 Descripcin de las poblaciones y suposiciones. Las formas funcionales de las
poblaciones no se conocen, pero esto no trae ningn problema para la determinacin del estadstico
de prueba, puesto que las muestras son grandes. Podemos suponer que los tamaos de las
muestras son suficientemente grandes como para proporcionar estimaciones aceptables de ( R2 y N2
. Las muestras son independientes.
4 El estadstico pertinente. El estadstico ms adecuado es x N -- x R que, como consecuencia
del teorema del lmite central, est distribuido en forma aproximadamente normal, con un error tpico de

y una media, de 0, si Ho es verdadera. Como R2 y N2 son desconocidas, podemos estimarlas


mediante S R2 y S N2 para poder obtener

2
2
que es una estimacin de ( x N y xR

5 El estadstico de prueba. Con base en las consideraciones hechas en el paso 4, el estadstico


de prueba adecuado es z.
6 Regiones de rechazo y de aceptacin. El valor crtico de z es 1.645. 7 Recoleccin de
datos y clculos. Se obtienen las siguientes medias y varianzas muestrales.

30

Con base en estos datos calculamos

8 Decisin estadstica. Como 5.94 > 1.645, rechazamos Ho. Procediendo de otro modo,
podramos haber basado nuestra decisin en la magnitud de la diferencia entre las medias muestrales x N
-- x R = 14.9 - 12.3 = 2.6, en comparacin con el valor crtico de x N -- x R, que est dado por

Como 2.6 > 0.72, podemos rechazar Ho .


9. Conclusin. La edad promedio en que los no reincidentes tienen su primer contacto con
las autoridades es mayor que la de los reincidentes.
EJERCICIOS
23 Un terapeuta ocupacional realiz un estudio para evaluar los mritos relativos de dos aparatos
prostticos ideados para facilitar la destreza manual. El terapeuta le entreg a 21 pacientes con
idnticas dificultades uno de los dos aparatos para que lo usaran mientras realizaban determinada tarea.
Once pacientes llevaron el aparato A y 10 el B. El investigador registr el tiempo que gast cada paciente
en realizar la tarea y obtuvo los siguientes resultados:

x = 65 segundos, S A2 = 81
x , = 75 segundos, S B2 = 64.
Darn estos datos evidencia suficiente como para concluir que el aparato A es ms efectivo que
el aparato B? Sea = 0.05.

24 Como parte de un estudio relacionado con la conducta de una especie animal, unos zologos
realizaron un experimento para determinar si esa especie animal presentaba en promedio diferentes
tiempos de respuesta a un estmulo bajo dos condiciones diferentes (condicin I y condicin II). Los
investigadores sometieron una muestra aleatoria de 15 animales a la condicin I. Para cada
animal registraron el tiempo transcurrido entre el comienzo del estmulo y la respuesta. Tomaron
los mismos registros con una muestra aleatoria de 17 animales que fueron sometidos a la condicin II.
Sus resultados fueron los siguientes:

Proporcionan estos datos evidencia suficiente como para concluir que el promedio de tiempos de
respuesta es diferente bajo las dos condiciones? Sea = 0.01.
25 Como parte de un proyecto de investigacin, un psiclogo seleccion una muestra aleatoria
de 12 muchachas y otra de 9 muchachos. Luego, le pidi a cada individuo que dibujara una figura
masculina. El tiempo promedio que gastaron las mujeres fue de 8 minutos con una varianza de 18. Para los
hombres el tiempo fue de 13 minutos, con una varianza de 22.5. Indican estos datos que los hombres
en promedio gastan ms tiempo cuando dibujan una figura de hombre que las mujeres? Sea = 0.05.
26 Se llev a cabo una encuesta entre los ancianos de una comunidad para comparar los niveles

31

de amor propio entre los que vivan y los que no vivan en ancianatos (solos o con parientes). Se le dio
a cada uno una prueba para medir su amor propio. Se obtuvieron los siguientes resultados:

Proporcionarn estos datos evidencia suficiente como para deducir que los ancianos que no viven
en los ancianatos tienen un puntaje promedio superior de amor propio a los que viven en ancianatos? Sea
= 0.01.
27 Se llev a cabo un estudio para evaluar los efectos del hacinamiento sobre el aprendizaje, entre
nios de escuela elemental. A una muestra aleatoria de 50 nios se le ense una destreza determinada en
condiciones de hacinamiento y a otra de 45 nios se le ense la misma destreza, con los mismos
profesores, pero sin hacinamiento. Al terminar el experimento se le adminis tr a cada nio una
prueba para determinar su nivel de dominio de la habilidad. Se obtuvieron los siguientes resultados:

Proporcionan estos datos evidencia suficiente como para concluir que la enseanza es menos
efectiva bajo condiciones de hacinamiento? Sea = 0.05.
28 Al comienzo del ao escolar se distribuyeron al azar los alumnos de ltimo ao de un colegio
en dos grupos, cada uno con 50 estudiantes. El grupo A recibi consejera vocacional individual. El
grupo B no recibi ninguna consejera. Al final del ao, se le hizo a cada alumno una prueba para medir
su nivel de conocimientos sobre las distintas carreras. Los resultados fueron los siguientes:

Proporcionan estos datos evidencia suficiente como para concluir que la consejera individual es
efectiva para aumentar el conocimiento de las carreras profesionales? Sea = 0.05.
29 En un estudio cuyo objeto era evaluar los efectos del ruido sobre la capacidad de aprender,
se distribuyeron aleatoriamente en dos grupos 24 estudiantes. Al grupo 1 se le ense una habilidad
en condiciones de ruido. Al grupo 2 se le ense la misma habilidad, con el mismo profesor, pero sin
ruidos. Al final del experimento se administr a cada estudiante una prueba para medir su nivel de
dominio de la habilidad. Los resultados fueron los siguientes:

Proporcionan estos datos evidencia suficiente como para concluir que el ruido es un factor
que impide el aprendizaje? Sea = 0.05.
30 En un laboratorio de psicologa, los investigadores hicieron llegar, por diferentes conductos,
una sustancia txica hasta el sistema nervioso central de varios animales experimentales. La variable de
inters fue el tiempo, en horas, que corri entre la administracin de la toxina y la iniciacin de los
sntomas. Se obtuvieron los siguientes resultados:

32

Proporcionan estos datos evidencia suficiente como para concluir que, en promedio, la iniciacin
de los sntomas se inicia ms pronto cuando la toxina se administra por el conducto B? Sea = 0.05.

6.6 COMPARACIONES PAREADAS


En el Captulo 5 estudiamos la construccin de intervalos de confianza para diferencias entre
medias poblacionales, teniendo en cuenta datos de muestras aleatorias que no son independientes.
Tambin, vimos la razn fundamental y las ventajas que ofrece utilizar este tipo de datos, que se
denominan datos pareados u observaciones pareadas. Partiendo de la misma teora que sirve de
fundamento para la construccin de intervalos de confianza para diferencias entre medias poblacionales,
podemos verificar tambin hiptesis acerca de diferencias entre medias poblacionales. Resulta
conveniente una prueba bilateral cuando la hiptesis nula establece que la media verdadera de las
diferencias entre dos conjuntos de observaciones pareadas es igual a 0, sin ninguna especificacin de que
la diferencia tenga una direccin y no otra. Si la hiptesis alterna establece que el conjunto de
observaciones de una poblacin es mayor (o menor) que el otro conjunto, es conveniente usar una
prueba unilateral. Expliqumonos con un ejemplo.

8 Decisin estadstica. Como el valor calculado de t, 2.20, es mayor que el valor crtico de
1.7613, rechazamos H o.
9 Conclusin. Concluimos que las situaciones que producen ansiedad aumentan el nivel de
ese producto qumico en la sangre.
EJERCICIOS
31 La Tabla 6.4 muestra los puntajes de CI de 12 nios a quienes se les diagnostic
inhabilidad para el aprendizaje antes y despus de 9 meses de la iniciacin de un programa remedial.
Proporcionan estos datos evidencia suficiente como para concluir que el programa remedial es
efectivo para aumentar los puntajes de CI en este tipo de nios? Sea = 0.05.
32 La Tabla 6.5 muestra la concentracin de cierto producto qumico en la orina de 10
adultos despus de la administracin, por dos vas distintas, de una droga que contena ese
producto. Proporcionan esos datos evidencia suficiente como para concluir que la administracin
intramuscular de la droga produce una mayor concentracin del producto qumico en la orina?. Sea

33

= 0.05.

33 Un psiclogo seleccion al azar a 15 seoras con sus maridos entre los residentes de un
sector urbano y les solicit que-completaran un cuestionario para medir el nivel de satisfaccin
respecto de la comunidad donde vivan. La Tabla 6.6 muestra los resultados de la encuesta.
Proporcionan estos datos una indicacin de que los maridos de ese sector estn ms satisfechos con
la comunidad que sus esposas? Sea = 0.05.
6.7 VERIFICACION DE UNA HIPTESIS SOBRE UNA PROPORCIN PBLACINAL NICA
Como ya lo hemos visto, con frecuencia deseamos hacer inferencias acerca de proporciones
poblacionales. En el Captulo 5 vimos cmo se construyen estimaciones por intervalos de confianza de
proporciones poblacionales. En esta seccin, vamos a explicar con ejemplos la verificacin de hiptesis
sobre proporciones poblacionales. En el Captulo 4 estudiamos la distribucin muestral apropiada que
sirve de base para esta prueba.
EJEMPLO 6.10
Un trabajador social cree que menos del 25% de las parejas de cierta regin han utilizado por lo
menos una vez alguna forma de control natal. Con el fin de ver si esta suposicin es razonable, el
trabajador social selecciona una muestra aleatoria de 120 parejas de la regin y realiza el siguiente
procedimiento para la verificacin de hiptesis.

3 Descripcin de la poblacin y suposiciones. La poblacin es binomial y est


compuesta por el conjunto de respuestas a la pregunta "Ha utilizado usted alguna vez una
forma de control natal?" Estas respuestas son del tipo si o no, la poblacin es
suficientemente grande en relacin con el tamao de la muestra para que podamos pasar por
alto el factor de cpf. La muestra tambin es suficientemente grande para que podamos aplicar
la aproximacin normal a la distribucin binomial en la verificacin de la hiptesis.
4 El estadstico pertinente. El estadstico ms adecuado es p o proporcin de parejas

34

de la muestra que ha empleado algn control natal. Bajo H o la distribucin muestral de p


est distribuida en forma aproximadamente normal con una media de p =p o = 0.25
(verificacin en el punto de igualdad) y un error tpico de

Obsrvese que hemos utilizado el valor hipottico de p , p o , en la frmula para el clculo


de p . Esta es una prctica muy lgica puesto que se supone que la hiptesis nula es
verdadera hasta que haya suficiente evidencia para recha zarla.
5 El estadstico de prueba. Como se considera que la distribucin debe ser
aproximadamente normal, el estadstico de prueba ms conveniente es z, que se distribuye
como la distribucin normal estandarizada.
6 Regiones de rechazo y de aceptacin. El valor crtico de z es -1.645, de modo que la
regin de rechazo consta de todos los valores de z iguales o menores que -1.645. La regin de
aceptacin consiste en todos los valores de z mayores que -1.645. El valor crtico de p est
dado por

7 Recoleccin de datos y clculos. De las 120 parejas de la muestra, 20 dijeron que


haban empleado algn mtodo de control natal. Con base en es ta informacin, calculamos

8 Decisin estadstica. Rechazamos la hiptesis nula puesto que -2.03 < -1.645 (o
tambin, 0.17 < 0.18).
9 Conclusin. Concluimos que menos del 25% de las parejas de la regin han utilizado
alguna vez control natal.
Cuando una proporcin poblacional es el parmetro de inters, se pueden efectuar tambin hiptesis
bilaterales y unilaterales con la regin de rechazo en la cola superior segn sea conveniente.
EJERCICIOS
34 Plantear las hiptesis estadsticas apropiadas para un investigador que desea verificar la hiptesis
nula de que una proporcin poblacional es igual a 0.40. Una muestra de tamao 240 arroja una proporcin
muestral de 0.48. Se debe rechazar Ho en el nivel de significacin 0.05? Fundamentar la respuesta con
el procedimiento adecuado para la verificacin de hiptesis.
35 Un empleado de un departamento estatal de rehabilitacin cree que el 20% de los
jvenes admitidos en las escuelas de rehabilitacin del estado es convicto de robo de automviles. En una
muestra aleatoria de 100 admisiones, 16 jvenes haban sido admitidos debido a robo de automviles.
Contradicen estos datos la opinin del empleado?
36 Un empleado del departamento de agricultura cree que ms del 20 de los hacendados de una
regin trabajan en empleos de tiempo parcial adems de trabajar en su hacienda. Una encuesta realizada

35

a 200 hacendados seleccionados al azar revel que 60 trabajaban en empleos de tiempo parcial. Son
estos datos apoyo para la creencia del empleado?
37 Un candidato a un empleo estatal cree que menos del 25 % de las personas que pueden
votar estn a favor de que pase cierto proyecto de ley sobre el que debe l pronunciarse. En una muestra
al azar de 200 votantes, 30 dijeron que estaban a favor del proyecto de ley. Constituyen estos datos un
apoyo para la opinin del candidato, en el nivel de significacin 0.05'?
38 Un socilogo cree que ms del 70% de los adultos que viven en una regin de bajos ingresos
estara a favor del establecimiento de un centro de recreacin de la comunidad. De una muestra aleatoria
de 200 adultos de la regin, 144 estuvieron en favor de la idea. Apoyan estos datos la creencia del
socilogo? Sea = 0.05.
39 Un especialista que trabaja en una escuela de agricultura cree que con una dieta especial se
lograra aumento de peso en tres meses en ms del 80 % de un grupo de cerdos. En una granja
experimental se escogieron al azar 400 cerdos para alimentarlos con esa dieta. Al final de los tres
meses, 340 cerdos haban aumentado su peso. Estos datos sirven de apoyo al especialista? Sea = 0.05.
40 Una muestra aleatoria de 225 habitantes de apartamentos revel que 18 de ellos posean
perros. Proporcionan estos datos evidencia suficiente como para concluir que menos del 10% de los
habitantes de apartamentos poseen perros? Sea = 0.0.5.
41 El alcalde de una ciudad cree que ms del 60 % de los residentes de un suburbio adyacente
est a favor de anexarse a la ciudad. En una muestra aleatoria de 120 adultos, 76 dijeron que estaban a
favor. Proporcionan estos datos evidencia suficiente como para apoyar la opinin del alcalde? Sea
= 0.05.
42 Se estima que menos del 10% de los estudiantes de una universidad utilizan el
transporte pblico para trasladarse a sus clases. En una muestra aleatoria de 225 estudiantes, 20
dijeron que utilizaban el transporte pblico. Ante esta evidencia, ser realista la estimacin? Sea
= 0.05.
43 En una muestra aleatoria de 255 adultos de cierta regin, 25 dijeron que, en su
concepto, la mayora de las enfermedades mentales eran heredita rias. Servirn estos datos de
fundamento para la hiptesis de que menos del 15% de los adultos de la regin opinan de esta
manera? Sea = 0.05.
6.8 VERIFICACION DE UNA HIPOTESIS SOBRE LA DIFERENCIA ENTRE DOS
PROPORCIONES POBLACIONALES
En la prctica surgen situaciones en las que se desea verificar la hiptesis nula de que dos
proporciones poblacionales, p1 y p2 , son iguales o de que difieren en alguna cantidad especfica.
Por ejemplo, quisiramos verificar la hiptesis de que dos grupos de individuos no se diferencian
respecto de la proporcin de ellos que favorecen la aprobacin de alguna ordenanza de la ciudad.
O, tambin, quisiramos saber si se puede obtener la conclusin de que la proporcin de
mujeres que regularmente miran un programa determinado de televisin excede, en alguna
fraccin precisa, a la proporcin de hombres que ven regularmente el programa. Ya vimos
anteriormente la distribucin muestral ms conveniente para verificar esta clase de hiptesis.
Vamos a explicar ahora, con ejemplos, el mtodo para verificar cada uno de estos dos tipos
de hiptesis.

En el Capitulo 4 veamos que la distribucin muestral de la diferencia entre dos proporciones

36

muestrales est distribuida en forma aproximadamente normal si ni y n2 son suficientemente


grandes y que tiene media igual a ,,- y desviacin tpica iguala

Como en la prctica p l y p2 son desconocidas, es preciso hacer una estimacin de p1 p 2


mediante

Si hacemos que x1 sea el nmero de elementos que presentan la caracterstica que interesa en la
muestra tomada de la poblacin 1 y que X2 sea el nmero de elementos que presentan la caracterstica en
la poblacin 2, podemos hacer una estimacin combinada de p = p1 = p2 por medio de

Podemos entonces volver a escribir la frmula del error tpico de la siguiente manera:

El siguiente ejemplo ilustra la situacin en que la hiptesis nula especfica que las dos proporciones
poblacionales son iguales.

EJEMPLO 6.11

Un antroplogo cree que las proporciones de individuos de dos poblaciones, que tienen doble
bucle de cabello en la regin occipital, son la misma. Con el fin de ver si hay alguna razn para
dudar de esta hiptesis, el antroplogo toma muestras aleatorias independientes de cada una de
las dos poblaciones y determina el nmero de individuos en cada muestra con esta caracterstica. Los
resultados son los siguientes:

El investigador puede llevar a cabo el siguiente procedimiento para la verificacin de hiptesis.


1 Planteamiento de la hiptesis.

2 Nivel de significacin. Sea = 0.05.


3 Descripcin de las poblaciones y suposiciones. El antroplogo puede clasificar a cada una
de las personas de las dos poblaciones segn posea o no la caracterstica. Las dos muestras son
independientes.
4 El estadstico pertinente. Como la hiptesis se relaciona con p1- -p2, la diferencia entre las
dos proporciones poblacionales, el estadstico ms importante es p 1 - p 2 que est distribuido en

37

forma aproximadamente normal (puesto que n l y n2 son grandes), con un error tpico que se obtiene
por combinacin y una media igual a 0 si la hiptesis nula es verdadera.
5 El estadstico de prueba y su distribucin. Como la distribucin del estadstico pertinente
es aproximadamente normal, el estadstico de prueba es igual a

que se distribuye aproximadamente como la distribucin normal estandarizada, cuando H o es


verdadera.
6 Regiones de rechazo y de aceptacin. Los valores crticos de z son 1.96. Expresados
en funcin de p1 - P2, los valores crticos estn dados por

7 Recoleccin de datos y clculos. Con base en los datos de la muestra que se dieron
anteriormente, calculamos
su combinacin queda

El error tpico combinado es

El valor calculado para z, entonces, es

Podemos tambin calcular los siguientes valores crticos, en funcin de p 1- p 2

8 Decisin estadstica. Como el valor de z calculado, - 0.67, cae entre -1.96 y +1.96, no
podemos rechazar H o. Procediendo de otro modo, podemos basar nuestra decisin en la magnitud
observada de p 1- p 2 . Como p l - p 2 = 0.23 - 0.27 = -0.04 cae entre -0.12 y +0.12, no podemos
rechazar H0 .
9 Conclusin. En virtud de que no rechazamos H0 concluimos que las dos proporciones
poblacionales pueden ser iguales. Es decir, la proporcin de individuos con doble bucle de cabello en la
regin occipital, puede ser la misma en la poblacin 1 que en la poblacin 2.
En el caso2, la hiptesis nula especifica que p 1 - p2 es distinto de 0. En consecuencia no hay
ninguna justificacin para combinar los datos de las dos muestras al hacer la estimacin de

38

En el caso 2, lo mismo que en el caso 1, p 1 - p2 est distribuido en forma aproximadamente


normal, si n1 y n2 son muestras aleatorias independientes grandes. En el caso 2, p 1- p 2 tiene una media
igual a p 1 -p2 y un error tpico estimado igual a

Ejemplo 6.12

Un especialista en poltica de una universidad cree que la proporcin de votantes del rea A que va a
votar en las prximas elecciones excede en ms de 0.05 a la proporcin de votantes del rea B que
votar en las mismas elecciones.
Con el fin de ver si los hechos corroboran esta hiptesis, el profesor hace una encuesta
entre los votantes del rea A y del rea B, con los siguientes resultados.

El investigador puede llevar a cabo el siguiente procedimiento para la verificacin de hiptesis y as


determinar si los datos observados proporcionan evidencia suficiente como para sustentar la hiptesis (se
supone que los votantes harn lo que dicen que van a hacer).
1 Planteamiento de la hiptesis.

2 Nivel de significacin.
3 Descripcin de las poblaciones y suposiciones. Las poblaciones consisten en los votantes
del rea A y los del rea B. Suponemos que las dos muestras se han tomado independientemente y al azar
en las respectivas poblaciones.
4 El estadstico pertinente. El estadstico ms adecuado es p A- p B, que est distribuido en
forma aproximadamente normal (puesto que nl y n2 son grandes). Si Ho es verdadera, la meda de la
distribucin es 0.05 o menos (la verificacin se hace para 0.05).
5 El estadstico de prueba. El estadstico de prueba es

que, cuando Ho es verdadera, se distribuye aproximadamente como la distribucin normal


estandarizada.
6 Regiones de rechazo y de aceptacin. El valor crtico de z es +1.645.
7 Recoleccin de datos y clculos. Con base en los datos de la muestra calculamos p A, =
113/150 = 0.75 y p B = 104/160 = 0.65. El error tpico es

39

con lo que podemos calcular

8 Decisin estadstica. Como el valor de z calculado, 1.00, es menor que 1.645, no


rechazamos Ho.
9 Conclusin. Con base en estos datos, no podemos concluir que la hiptesis del especialista en
poltica sea verdadera.
EJERCICIOS
44 Un antroplogo cree que la proporcin de individuos que tienen sangre tipo A es la misma
en dos poblaciones, I y II. Una encuesta en las dos poblaciones da la siguiente informacin basada en
muestras aleatorias independientes:

Proporcionan estos datos evidencia suficiente como para concluir que las proporciones de las
dos poblaciones no son iguales? Sea = 0.05.
45 Un socilogo desea verificar la hiptesis nula de que la proporcin de parejas casadas que
participan en actividades informales de grupo es la misma en dos comunidades. Las muestras aleatorias
independientes de parejas de las dos comunidades arrojan los siguientes resultados:

Proporcionan estos datos evidencia suficiente como para concluir que las dos proporciones no son
iguales? Sea = 0.05.
46 Un investigador que trabaja con un departamento correccional cree que entre los jvenes
encarcelados por actos de violencia, el porcentaje de ellos que fue educado en hogares
superpoblados est muy por encima del 10% respecto del porcentaje de personas encarceladas por
todos los dems crmenes que se educaron en hogares superpoblados. Para obtener evidencia que
apoye esta teora, el investigador tom muestras aleatorias independien tes de los registros de los
ltimos cinco aos en los dos tipos de criminales, y obtuvo los siguientes resultados:

Proporcionan estos datos evidencia suficiente como para fundamentar la opinin del investigador
en el nivel de significacin 0.05?
47 Un socilogo cree que la proporcin de hombres que pertenecen a un grupo
socioeconmico determinado (grupo A) y que ven regularmente lucha en televisin, supera en mucho a
un segundo grupo de hombres (grupo B) que tambin ven lucha. Muestras aleatorias simples de los dos

40

grupos arrojaron los siguientes resultados:

0.05.

Proporcionan estos datos evidencia suficiente como para apoyar la tesis del socilogo? Sea =

48 En un estudio sobre la relacin entre la conducta de los adolescentes y varios factores


religiosos, los investigadores examinaron una muestra aleatoria de estudiantes de bachillerato identificados
por sus profesores como pendencieros y una muestra aleatoria independiente de jvenes no pendencieros.
Cada estudiante de las dos muestras fue clasificado por sus compaeros en cuanto al grado de
religiosidad. Los resultados fueron los siguientes:

Proporcionan estos datos evidencia suficiente como para creer que la proporcin de estudiantes
que son tenidos por muy religiosos es ms alta entre los no pendencieros que entre los pendencieros?
Sea = 0.05.
49 Una trabajadora social que desea comparar dos comunidades respecto de varias variables,
selecciona una muestra al azar independiente de 120 hogares de la comunidad A y una muestra aleatoria
independiente de 100 de la comunidad B. Treinta y seis familias de las 120 de la comunidad A y 35 de las
100 de la comunidad B estn recibiendo asistencia oficial. Sern estos datos suficientes para
concluir que las proporciones de los hogares que reci ben asistencia oficial en las dos
comunidades son diferentes? Sea = 0.01.
50 Un consejero de rehabilitacin que trabaja en un departamento correccional, cree que un
programa de rehabilitacin va a reducir en ms de un 15% la reincidencia entre los prisioneros que se
dejan en libertad. Se escogieron al azar 100 prisioneros para participar durante un ao en el programa de
rehabilitacin. Otros 100 se escogieron, tambin al azar, para servir de grupo de control. Se hizo un
seguimiento de los dos grupos durante cinco aos. Al trmino de este perodo, 22 personas del grupo
experimental y 45 del grupo control haban sido halladas nuevamente culpables. Se justifica la tesis del
consejero sobre el programa de rehabilitacin? Sea = 0.05.
51 Un bilogo que investiga los efectos de dos mtodos para hacer que una planta adquiera
resistencia en una enfermedad, en el curso de su investigacin obtiene los siguientes resultados:

Con base en estos datos puede concluir el bilogo que las proporciones de las plantas que
adquieren resistencia son diferentes? Sea = 0.05.

41

42

APE NDICE D TABLAS

43

44

APENDICE D TABLAS

45

46

47

PROCEDIMIENTOS NO PARAMTRICOS DE
PRUEBA DE HIPOTESIS.
Presentacin
El siguiente manual tiene como propsito presentar en forma resumida la lgica de aplicacin de algunas
pruebas no paramtricas y sus procedimientos de clculo mediante las ecuaciones correspondientes y
va el paquete estadstico SPSS1. No pretendemos ser exhaustivos en la revisin de todos los
procedimientos, sino que se abarcan aquellos que corresponden a la asignatura de Estadstica en
el tercer semestre de la carrera de Psicologa impartida en la Facultad de Psicologa de la UNAM.
Las pruebas que se presentan en la primera parte son la prueba X 2 como Bondad de Ajuste
y la prueba del Signo que se consideran poderosas para observaciones en diseos de una
muestra y que tienen como propsito general probar la hiptesis nula de que la distribucin de datos de
una muestra se ajusta a la distribucin de los datos de la poblacin de referencia que tiene
caractersticas especficas (Pruebas de Bondad de Ajuste, Siegel y Castellan, 1995).
En la segunda parte se revisan procedimientos para la prueba de hiptesis a partir de los
datos de dos muestras que tienen como propsito identificar si existen diferencias entre dos
condiciones o tratamientos para evaluar los efectos de una variable independiente sobre una
variable dependiente, o bien entre dos condiciones distintas de observacin
Con tal propsito se pueden tener dos tipos de muestras: relacionadas o independientes.
Las muestras relacionadas implican que un mismo sujeto es medido dos veces, esto alude a
diseos de antes y despus, o de dos condiciones relacionadas; este tipo de diseos reclama que el
sujeto funja como su propio control o bien que se emparejen dos sujetos con caractersticas muy
similares (pares igualados). Las muestras independientes implican una sola medicin para cada
grupo de sujetos.
Por ejemplo si se desea evaluar el efecto de una droga para reducir el nivel de depresin, se
puede tener muestras relacionadas cuando a un sujeto se le mide su nivel de depresin antes de
darle la droga, se le da la droga, y despus de un lapso se le vuelve a medir su nivel de
depresin. El efecto se determina comparando los niveles de depresin antes y despus de la droga.
Se puede tener muestras independientes para probar la misma droga si a un sujeto se le
administra la droga y a otro no (esto es un diseo de grupo experimental y grupo control), y
despus de un tiempo se comparan los niveles de depresin de los dos sujetos para evaluar el efecto de la
droga.
Existen varios procedimientos que cumplen el propsito de comparar dos grupos, ya sean
muestras relacionadas o independientes, en este material se presentan algunos de dichos
procedimientos que se consideran entre los ms poderosos para los diseos que emplean dos muestras.
En la tercera y ltima parte se revisan los anlisis de varianza no paramtricos para k
muestras relacionadas (Prueba de Friedman) y para k muestras independientes (Prueba de
Kruskall Wallis) que permiten probar hiptesis sobre la diferencia estadstica entre varios grupos.
Es importante destacar que los procedimientos estadsticos no permiten establecer
determinantes causales entre variables, sino que slo nos permiten descartar al azar como
explicacin de los datos y/o de las diferencias entre los grupos o condiciones comparadas.
Esperamos que este material sea til para comprender algunos procedimientos no paramtricos
y su adecuada aplicacin en el anlisis de datos.

48

49

Pruebas de Hiptesis Estadsticas sobre una Muestra:


La Prueba X2 como Bondad de
Ajuste y la Prueba del Signo

50

PRUEBA 2 COMO PRUEBA DE BONDAD DE AJUSTE


Con frecuencia el investigador desea conocer el nmero de sujetos que caen en varias categoras de
respuesta o variable, y adems predecir que ciertos tipos sern mas frecuentes que otros. La prueba 2
Ji Cuadrada es til para analizar este tipo de datos. Es bondad de ajuste porque pretende probar si
existen diferencias significativas entre el nmero observado de respuestas a cada categora y un nmero
esperado basado en la hiptesis nula.

OBJETIVO
Determinar si una muestra aleatoria proviene de una poblacin especfica (si la distribucin
de la muestra es igual o diferente que la distribucin de la poblacin)
La lgica de la prueba implica la comparacin de frecuencias observadas de cada una de
las categoras a medir en la muestra contra las frecuencias esperadas para cada categora en
la poblacin, es decir si los datos de una muestra se ajustan a los datos esperados para la
poblacin.
SUPUESTOS
1. Una muestra obtenida en forma aleatoria.
2. Variables categricas con escala de medida nominal
3. Muestras grandes (N > 30)
4. Frecuencia Esperada > 5 (cuando FE es menor a 5 se aplica el procedimiento de correccin de Yates

FO FE 0.5 / FE

(2 (

HIPOTESIS ESTADSTICAS A PROBAR


Ho: La distribucin de la muestra es igual a la distribucin de la poblacin (FE = FO)
Hiptesis alterna sin direccin
Hi: La distribucin de la muestra es diferente a la distribucin de la poblacin (FE FO)
Hiptesis alterna con direccin
Hi: Los datos de la muestra son mayores a los datos de la poblacin (FO > FE)
Hi: Los datos de la muestra son menores a los datos de la poblacin (FO < FE)

DISTRIBUCIN MUESTRAL.
Distribucin que proporciona los valores esperados con k - 1 grados de libertad (Donde k es
el nmero total de categoras observadas)

TIPO DE DATOS

Frecuencias de casos observados en dos o ms categoras propias de la variable. Estas


categoras deben ser mutuamente excluyentes y pertenecer a la misma clase.

51

REGLA DE DECISIN

de k-1

Rechazamos Ho, o bien Si p (X2o) . Rechazamos Ho Con grados de libertad

Se emplea la tabla de valores crticos de X2 para obtener el valor de X2t, considerando la interseccin
en la tabla de los de grados de libertad y el nivel de significacin. Para obtener la p(X2o) se considera
el valor de la X2o o una aproximacin de la misma en relacin con los grados de libertad, la columna
en donde se ubique el valor observado corresponder a la probabilidad deseada.
EJEMPLO PRUEBA X 2 COMO PRUEBA DE BONDAD DE AJUSTE
Se intenta identificar si en la poblacin de adolescentes de la zona sur del D. F. existe una
proporcin similar de eleccin entre ocho carreras comunes. Para tal efecto se tom una muestra
aleatoria de 144 estudiantes de secundaria de la zona sur del D. F., a quienes se encuest sobre su
preferencia vocacional tomando como base las ocho carreras comunes. Se registro la frecuencia
de eleccin de cada carrera. Los datos se presentan en la tabla 1.
Probar la Hiptesis nula de que la distribucin de frecuencias observadas en la muestra es igual a
la distribucin de frecuencias esperadas en la poblacin.

SOLUCIN
Variable Categrica: Tipo de carrera elegida
Nmero de categoras: 8

Paso 1. Establecer las hiptesis a probar


Ho: FO = FE (La distribucin de la muestr a es igual a la distribucin de la poblacin)
Hi: FO FE (La distribucin de la muestra es diferente de la distribucin de la poblacin)

Paso 2. Elegir la prueba estadstica


Dado que nos interesa identificar si efectivamente la proporcin de casos es igual en cada
categora de acuerdo con lo esperado, los datos son nominales, la muestra es mayor a 30 y fue

52

tomada de forma aleatoria y ninguna de las FE es menor a 5, se aplicar la prueba X2 como


prueba de bondad de ajuste

Paso 3. Especificar alfa


mos una N = 144.

Paso 4. Regin de Rechazo


Dado que la Hiptesis alterna es sin direccin la Ho podr ser rechazada si el valor observado
cae en cualquiera de los extremos de la distribucin (Prueba Bilateral).

Paso 5. Decisin
Para obtener el valor observado de 2 y tomar la decisin estadstica se aplica el
procedimiento con la frmula de 2.
5.1 Obtener el estadstico FRMULA

SUSTITUMOS
X2 = [(29 - 18)2 /18+ (19-18)2 / 1 8 + ( 1 8 - 1 8 ) 2 / 18 + (25 - 18)2 /18 + (17-18)2 /18+ (10-18)2 /18 +
(15-18) 2 /18 + (11 -18) 2 /18]=16.33
X2 =16.33

Dado que X2o > X2t, 0.05, gl= 7; podemos rechazar la Ho y sealar que la Hi tiene mayor
probabilidad de ser aceptada.

Decisin estadstica:
Dado que rechazamos Ho podemos decir que si existe diferencia entre la distribucin de la
muestra y la distribucin de la poblacin (las frecuencias esperadas son diferentes de las
frecuencias observadas y esta diferencia no es producto del azar); X 2o = 16.33; a 0.05, gl 7)
Conclusin: Existe suficiente evidencia estadstica para considerar que los adolescentes del sur del
D. F. tienen preferencias vocacionales en proporciones distintas de acuerdo con las carreras
consideradas

53

PROCEDIMIENTO DE CLCULO MEDIANTE EL PAQUETE SPSS


A continuacin se presentan los pasos a seguir para obtener el estadstico de la prueba de X2 de
bondad de ajuste. Para la decisin estadstica se toma la regla de decisin: Si p(z) se
rechaza la Ho

Paso 1 Se elabora la base de datos


Se definen dos variables desde el men Data y el submen Define Variable. Una de ellas para
especificar las categoras etiquetando adecuadamente con nmeros desde el 1 hasta k; la otra variable
se denomina FO y se vacan la frecuencia que le corresponde a cada categora de la variable (Ver
figuras 1 a y l b).
Si consideramos el criterio de la probabilidad asociada a X 2 para tomar la decisin estadstica
debemos ubicar la X2o en la tabla de valores crticos alrededor de los grados de libertad, y observar
en qu columna de a se encuentra. Justamente esa ser la probabilidad aproximada para X2o; en
nuestro ejemplo X2o = 16.33 con 7 grados de libertad, tenemos que 16.27 es el valor ms cercano y
corresponde a la columna de a = 0.001. As la p(X2o) de 0.001 es menor que el a elegido para probar
nuestra Ho, por lo tanto podemos rechazarla.
2

Definir variable carrera

54

Paso 2 Ponderar frecuencias


En todos los casos de ji cuadrada deben ponderarse las frecuencias desde el men
Data y el submenu
Weight Cases
Weight Cases by
Pasar la variable FO

55

Paso 3 Obtener el estadstico

Para obtener el valor de Ji cuadrada debemos seguir la siguiente ruta (ver figura 3)
Desde el men
Statistics y el submenu
Non Parametric Test
Chi Square

En la ventan de la prueba se seala cual es la variable a probar que debe ser la variable categrica, en este
caso carrera (ver figura. 4), una vez seleccionada se oprime la tacla Ok para la hoja de resultados (el

output). El resto de las opciones en la ventana no se, modifican.

56

Figura 4. ventana de la prueba X 2 .


En el caso de que las frecuencias esperadas no se quieran manejar igual para todas las
categoras se le asignan valores en la seccin correspondiente a Expected Values sealando los
valores en values.

57

Paso 4. Tomar la decisin estadstica interpretando la hoja de resultados


El valor del estadstico X 2 es igual a 16.33 con una probabilidad asociada de 0.022. La decisin
estadstica es rechazar la Ho dado que la probabilidad asociada con la X2 (16.33) es de 0.022, valor que
resulta menor al del nivel de significacin elegido de 0.05. Recordemos que el criterio de decisin
es: Si p(z) se rechaza la Ho
La conclusin a la que se llega es exactamente la misma a la planteada al sacar el estadstico mediante
la ecuacin, esto es: Existe suficiente evidencia estadstica para considerar que los adolescentes
del sur del D. F. tienen preferencias vocacionales en proporciones distintas de acuerdo con las
carreras consideradas.

58

TABLA F

Distribucin ji-cuadrada (X2)

59

PRUEBA DEL SIGNO

OBJETIVO
Poner a prueba una hiptesis respecto a la mediana de una pobla cin continua.
La lgica de la prueba se basa en contrastar el nmero de signos + con el de signos-.
Los signos + corresponden a los valores de la muestra que son mayores a la mediana, los signos
- a los que son menores.
Esta prueba se considera la alternativa no paramtrica de la prueba t para una muestra.
SUPUESTOS
1.
2.
3.
4.

Una muestra cuya mediana poblacional es desconocida.


Observaciones independientes.
Muestreo aleatorio.
Variable continua medida en escala ordinal, intervalar o de razn.

TIPO DE HIPTESIS A PROBAR


Ho: La mediana muestra) es igual a la mediana poblacional.
Hiptesis alterna sin direccin
Hi: La mediana muestral es diferente de la mediana poblacional.
Hiptesis alterna con direccin
Hi: La mediana muestral es mayor a la mediana poblacional, o,
Hi: La mediana muestral es menor a la mediana poblacional.
DISTRIBUCIN MUESTRAL
Para muestras con N s 50 se usa la distribucin de N+ que muestra los valores
esperados de N+ para pruebas de una y dos colas. Para N > 50 se usa la distribucin normal.
TIPO DE DATOS
Puntajes individuales en escala ordinal.
PROCEDIMIENTO
Asignar una signo + a los valores que estn por arriba de la mediana y un signo - a los que estn
por debajo de ella. A los valores iguales a la mediana se les asigna un cero y se descartan del
anlisis.
Se cuenta el nmero de signos + y el nmero de signos - para obtener el valor de N, tambin se
cuenta el nmero total de signos obtenidos (n) descartando los valores iguales a 0. El estadstico
de prueba para hiptesis de dos colas es el signo que aparece con menor frecuencia. Para
pruebas de cola inferior el estadstico de prueba es N+ y para cola superior es N-. Una vez
determinado el valor de N se contrasta con el valor de tablas.

60

Para muestras grandes (N > 50) se usa la aproximacin por la normal, aplicando la siguiente
frmula:

REGLA DE DECISIN
Si N+o ( N-o) N+t (o N-t), n, a Rechazamos Ho Si p(z) Rechazamos Ho

EJEMPLO PARA MUESTRAS PEQUEAS


En un estudio sobre el tiempo de reaccin ante un estmulo auditivo se desea saber si el tiempo
de reaccin es diferente de 3.50 segundos. Para probar tal suposicin se selecciona una muestra
aleatoria de 11 sujetos quienes son expuestos al estmulo y se mide su tiempo de reaccin,
obtenindose los siguientes datos:

Determinar con alfa=.05 que el tiempo de reaccin es diferente a 3.50. Se desconoce si la distribucin
de la cual provienen los datos posee una distribucin normal.

SOLUCIN
Variable: tiempo de reaccin en escala intervalar

Paso 1. Establecer las hiptesis a probar


Ho: El tiempo de reaccin es igual a 3.50.
Hiptesis alterna sin direccin
Hi: El tiempo de reaccin es diferente a 3.50.

Paso 2. Elegir la prueba estadstica


Dado que interesa probar que la muestra presenta un tiempo de reaccin diferente a 3.50, se
cuenta con puntajes individuales en escala de razn, la muestra fue tomada de forma aleatoria, pero
se desconoce si su distribucin es normal, se aplicar la prueba del signo.

Paso 3. Especificar alfa


Se emplear un = 0.05

Paso 4. Regin de Rechazo


Dado que la hiptesis alterna es sin direccin la Ho podr ser rechazada si el valor observado
cae en cualquiera de los extremos de la distribucin.

61

Paso 5. Decisin
Para obtener el valor observado de N y tomar la decisin estadstica se aplica el
procedimiento descrito para determinar el valor de N.

5.1. Obtener el estadstico de prueba


Asignar un signo + a los valores que estn por arriba de 3.50, un signo - a los que estn por debajo de
3.50 y cero a los que sean iguales a 3.50.

N+= 1

N-=9

n=10

Para una prueba de dos colas se elige el signo que aparece con menor frecuencia, en este caso N+=1

5.2. Obtener N+ de tablas.


El valor de N+t se obtiene de la tabla E intersectando el tamao de n con el nivel de significancia
especificado para una prueba de dos colas. En este caso n=10, = 0.05.

5.3 Comparar el valor observado y el valor esperado aplicando la regla de decisin


Si N+o N+t, Rechazamos Ho
1= 1
Dado que N+o = N+t,

odemos rechazar Ho

Decisin estadstica:
Dado que rechazamos Ho podemos decir que el tiempo de reaccin es diferente de 3.50.

Conclusin:
Existe suficiente evidencia estadstica para decir que el tiempo de reaccin al estmulo auditivo
al que fueron expuestos los sujetos es diferente de 3.50 segundos.
EJEMPLO PARA MUESTRAS GRANDES
Retomando el mismo ejemplo pero ahora con una muestra de 60 sujetos, supongamos que se obtienen
N+=20, N-=35, cinco valores iguales a 0 y n=55.
SOLUCIN
Variable:
Tiempo de reaccin en escala intervalar

62

Paso 1. Establecer las hiptesis a probar


Ho: El tiempo de reaccin es igual a 3.50.
Hiptesis alterna sin direccin
Hi: El tiempo de reaccin es diferente a 3.50.
Paso 2. Elegir la prueba estadstica
Dado que interesa probar que la muestra presenta un tiempo de reaccin diferente a 3.50,
se cuenta con puntajes individuales en escala de razn, la muestra fue tomada de forma
aleatoria, pero se desconoce si su distribucin es normal, se aplicar la prueba del signo.
Paso 3. Especificar alfa
Se emplear un

= 0.05

Paso 4. Regin de Rechazo


Dado que la hiptesis alterna es sin direccin la Ho podr ser rechazada si el valor observado cae en
cualquiera de los extremos de la distribucin.
Paso 5. Decisin
Para obtener el valor observado de N y tomar la decisin estadstica se aplica el
procedimiento descrito para determinar el valor de N con muestras grandes.
5.1. Obtener el estadstico de prueba

Para una prueba de dos colas se elige el signo que aparece con menor frecuencia, en este caso N+=20

5.3 Comparar el valor observado y el valor esperado aplicando la regla de decisin

63

Decisin estadstica:
Dado que rechazamos Ho podemos decir que el tiempo de reaccin es diferente de 3.50.
Conclusin:
Existe suficiente evidencia estadstica para decir que el tiempo de reaccin al estmulo auditivo al
que fueron expuestos los sujetos es diferente de 3.50 segundos.
Nota: La prueba del signo para una muestra no puede calcularse en SPSS ya que se contiene este
anlisis slo para el caso de 2 muestras.

64

Tabla E. VALORES CRITICOS DE N+ PARA LA PRUIEBA DEL SIGNO.


La tabla puede usarse con todos los valores de n (si el nmero de
observaciones apareadas es menor a 51.
Ejemplo: para una prueba de dos colas con n = 16 y a = 0.05, rechazar la
hiptesis nula si el valor obtenido de N+ es menor o igual que 3 o si el valor
obtenido de N es menor o igual que 3.
Para una prueba de un cola con n = 16 y a = 0.05, si se necesita una prueba
de cola inferior, rechazar la hiptesis nula si el valor de N+ es menor o igual
que 4. si se necesita una prueba de cola superior, rechazar hiptesis nula si
la N obtenida es menor o igual que 4.

65

66

PRUEBA DE HIPOTESIS ESTADSTICAS PARA EL CASO DE DOS


MUESTRAS:
LA PRUEBA DE McNEMAR,
LA PRUEBA DE WILCOXON,
LA PRUEBA 2 COMO PRUEBA DE HOMOGENEIDAD Y
LA PRUEBA U DE MANN-WHITNEY

67

PRUEBA DE McNemar PARA LA SIGNIFICACIN DE LOS


CAMBIOS
La prueba de McNemar para la significacin de los cambios es aplicable a diseos antes-despus, en
donde cada sujeto se utiliza como su propio control. Puede emplearse para probar la efectividad de un
tratamiento.

OBJETIVO
Identificar si existen cambios significativos en la proporcin de casos que presentan cierta
caracterstica medida antes y despus de un tratamiento.
SUPUESTOS
1. Variables discretas con escala de medida nominal u ordinal
2. Diseo antes y despus
3. muestras relacionadas
TIPO DE HIPTESIS A PROBAR
Ho. An = De (No existen cambios significativos despus de un tratamiento)
Hiptesis alterna sin direccin
Hi: An De (Si existen cambios significativos despus del tratamiento)
Hiptesis alterna con direccin
Hi: An > De (Los valores antes del tratamiento son mayores a los valores despus del tratamiento)
Hi: An < De (Los valores antes del tratamiento son menores a los valores despus del tratamiento)
DISTRIBUCIN MUESTRAL
Distribucin X2 que proporciona los valores esperados con gl = 1
TIPO DE DATOS
Frecuencia de cambios observados de la variable (VD) medida en dos momentos (antes y despus
de un tratamiento o VI). Los datos se agrupan en una tabla de contingencia de cuatro entradas en la
siguiente forma

Por ejemplo: si medimos la actitud ante la educacin sexual en las escuelas como a favor y en contra,
antes y despus d una sesin informativa. Al tomar la frecuencia en estas dos mediciones tendramos:

68

Frec.
Frec.
Frec.
Frec.

De
De
De
De

aquellos que opinan a favor antes de la sesin informativa.


quienes opinan en contra antes de la sesin informativa.
quienes opinan a favor despus de la sesin informativa.
aquellos que opinan en contra despus de la sesin informativa.

Los datos que se manejan en la prueba de McNernar son la frecuencia de cambios:


- en contra
+ a favor
A aquellos que estn a favor al principio y despus en contra
B aquellos que siempre estuvieron en contra
C aquellos que siempre estuvieron a favor
D aquellos que estn en contra al principio y despus a favor.

EJEMPLO DE LA PRUEBA DE MCNEMAR PARA LA SIGNIFICACIN DE LOS CAMBIOS


Se intenta identificar el efecto de los textos narrativos sobre la comprensin lectora en nios de 2 de
primaria. Para este propsito participaron 24 nios a los que se les aplic una prueba de
comprensin lectora previa al entrenamiento. Una vez realizada esta evaluacin se procedi al
entrenamiento en comprensin con textos narrativos. Despus de cinco sesiones se aplic la misma
prueba que en la evaluacin anterior. Se registro la frecuencia de casos de comprensin ( + ) y no
comprensin ( - ) en ambas evaluaciones (ver tabla 1).
Probar la Hiptesis alterna de que existen mas cambios de no comprensin a comprensin despus del
entrenamiento.

69

SOLUCIN
VI: Textos narrativos (entrenamiento)
VD: Frec. De comprensin y no comprensin lectora (medida antes y despus del entrenamiento)
Paso 1. Establecer las hiptesis a probar
Ho: No existen cambios significativos despus del entrenamiento
Hi: Existe mayor proporcin de cambios de no comprensin a comprensin

lectora despus del entrenamiento (An < De en la categora de comprensi:n -1


Paso 2. Elegir la prueba estadstica
Dado que nos interesa identificar si existe cambios significativos en la frecuencia de la comprensin
lectora despus de un entrenamiento, que los datos son nominales, se trata de un diseo antes y
despus (muestras relacionadas), se aplicar la prueba de McNemar para la significacin de los
cambios
Paso 3. Especificar alfa
Se emplear un = 0.05 tomando en consideracin que tenemos muestras de tamao 24.
Paso 4. Regin de Rechazo
Dado que la hiptesis alterna es con direccin negativa la Ho podr ser rechazada si el
valor observado cae en el extremo izquierdo de la distribucin X 2 (prueba unilateral)
Paso 5. Decisin
Para obtener el valor observado de X2 y tomar la decisin estadstica se aplica el
procedimiento con la frmula de X2 de la prueba de McNemar.

5.1. Agrupar las frecuencias observadas en una tabla de contingencias.

A los que muestran comprensin antes pero no despus (2)


B los que comprenden antes y despus (6)
C los que no comprenden ni antes ni despus (4)
D los que no comprenden antes pero s despus (12)

5.2. Obtener el estadstico

70

5.3. Obtener X2 t y su probabilidad asociada

5.4. Comparar el valor observado y el valor esperado aplicando la regla de decisin

Dado que X2o > X2t , 0.05, gl 1; y en trminos de probabilidad = 0.02 (valor asociado a X2o) es
menor que el alfa elegido de 0.05, podemos rechazar la Ho descartar el azar como explicacin de los
datos.
Decisin estadstica:
Dado que rechazamos Ho podemos decir que existe la probabilidad de observar mayor proporcin de
cambios .de no comprensin a comprensin lectora despus del entrenamiento: (X 2 5.786, p =
0.02,
gl=1)
Conclusin
Dada la evidencia estadstica podemos decir que los textos narrativos incrementan la
frecuencia de comprensin lectora en nios de 2 de primaria.
PROCEDIMIENTO DE CALCULO DE X 2 PARA LA PRUEBA DE MCNEMAR UTILIZANDO SPSS
A continuacin se presentan los pasos a seguir para obtener la hoja de resultados de la prueba de
McNemar.

Paso 1 Se elabora la base de datos


Como los datos se presentan en una tabla de contingencias deben crearse tre., columnas, una para

71

la primera medicin (antes), otra para la segunda medicin (despus) y una tercera para las
frecuencias observadas. La nomenclatura de las etiquetas que definirn las celdillas tanto en la
primera y segunda medicin, debe ser la misma para sealar el cambio de antes a despus en la base
de datos. En el ejemplo tenemos que comprensin ( + ) y no comprensin ( -) en ambas
evaluaciones; sin embargo, el programa slo acepta variables numricas, por lo tanto, en lugar del
signo + emplearemos el valor 1 y para el signo - el valor 2. La definicin de las variables y sus
etiquetas se realiza como sigue (Ver figura 1):
Desde el men Data y el submen
Define variable: en esta ventana defines la siguiente informacin:
Variable name: nombra la variable para la primera columna (slo acepta 8 caracteres). En
este caso la variable se llama antes.

Labels Para activar esta ventana das clic en el botn Labels de la ventana Define Variable.(ver
figura 2). En este submen capturas el nombre de la variable en label (aqu puedes
poner el mismo nombre y especificarlo usando ms de ocho caracteres.) En el recuadro
value capturas el valor 1 y en el recuadro value label escribes comprensin.Das c iic en
Add. Posteriormente capturas el valor 2 y escribes no comprensin. Das clic en Continue.
Para cerrar la ventana Define variable das clic en OK.
A continuacin, defines la variable despus de la misma forma que la variable antes, incluyendo
las mismas etiquetas. Posteriormente defines la variable frecuencias escribiendo, slo su nombre
en Variable name (recuerda que slo puedes usar 8 caracteres).
Una vez definidas las variables se teclearn los valores conforme a la tabla. Para capturar los datos de la
primera celda (A) escribiramos 1 en la columna antes, 2 en la columna despus y 2 en la columna
frecuence; con esto indicamos que los sujetos que primero comprendan y luego no fueron solamente dos.
Para la segunda celda (B) sera 1, 1, 6, los sujetos que comprendieron antes y despus fueron seis. Para la
tercera celda (C) 2, 2, 4, los sujetos que no comprendieron ni antes ni despus fueron 4. Para la cuarta
celda (D), 2, 1, 12, los sujetos que no comprendan antes pero despus s fueron 12 (ver figura).

72

Paso 2 Ponderar frecuencias


Antes de proceder a realizar el anlisis hay que hacer un paso p revio, el cual consiste en
indicarle al programa que se analizarn las frecuencia . La secuencia de indicaciones es:
Data

Weight cases: en esta ventana hay que seleccionar


Weight cases: dar un clic en el crculo para activarlo.
Frequency variable: pasar la variable frecuenc.
Dar clic en OK (Ver ejemplo en la figura 5)

73

Una vez que se ha hecho la indicacin mencionada se procede a correr el anlisis siguiendo la ruta:
Statistics (o Analize).
Nonparametrics tests
2 related samples (ver figura 6 a)

En la ventana Two-Related Samples Test seleccionar las variables antes y despus y pasarla al
recuadro de Test Par(s) List dando clic en el botn que est en medio de ambos recuadros. Desmarcar
Wilcoxon dando un clic en el cuadro correspondiente y dar clic en McNemar. Dar clic en OK (Ver figura).

74

En el caso de la prueba de McNemar si las frecuencias esperadas son menores a 5 se hace uso de la
distribucin binomial, si son iguales o mayores que 5 se utiliza la distribucin X 2. Con base en esta
consideracin el programa presenta los datos de la binomial o de X2. Cuando proporciona los datos de
la binomial slo presenta la probabilidad de ocurrencia del estadstico (ver hoja de resultados de la
pgina anterior), en el caso de X 2 presenta el valor del estadstico, sus grados de libertad y su
probabilidad asociada (como se muestra al final de este prrafo).

75

Paso 4 Tomar la decisin estadstica interpretando la hoja de resultados


En el ejemplo se presentaron frecuencias esperadas menores a 5 por lo que el programa proporciona
la probabilidad del estadstico con base en la distribucin binomial, la cual fue .013. Como la
probabilidad proporcionada es para una prueba bidireccional y en el ejemplo se plantea una prueba
unidireccional, dicha probabilidad se divide en dos, as .01312= .0065; la cual es contrastada con el alfa
de .05 indicada en el ejemplo. Aplicando la regla de decisin:
Si p(spss) > Aceptamos Ho.
Si p(spss) Rechazamos Ho.
tenemos que . 0065 < .05 y por lo tanto rechazamos Ho.
Dado que rechazamos Ho podemos decir que existe mayor proporcin de cambios de no comprensin a
comprensin lectora despus del entrenamiento, y en consecuencia podemos concluir que los textos
narrativos incrementan la frecuencia de comprensin lectora en nios de 2 de primaria.
Cuando el programa proporcione los datos de la prueba de McNemar con base en la distribucin X2 se
reportan el valor del estadstico, sus grados de libertad y su probabilidad asociada, sta ltima es la que
se contrasta con el alfa establecido en el problema. Dichos datos en el ejemplo son: X2 = 12.893, gl = 1
y p < 0.0001 (dado que la probabilidad no puede ser igual a 0 se aade el nmero 1 y se especifica
como menor que).

76

PRUEBA DE RANGOS SEALADOS Y PARES IGUALADOS T DE


WILCOXON
Esta prueba considera las diferencias relativas de pares de mediciones en cuanto magnitud y direccin,
adjudicando mayor peso a las diferencias de gran magnitud que a las diferencias pequeas entre pares.
Se utiliza con mucho xito en Psicologa cuando deseamos saber que miembros de los pares tienen
mayores diferencias y establecer rangos de las diferencias en orden de tamao absoluto, es decir puede
hacer juicios de mayor que entre los valores de cualquier par, asi como de las diferencias entre dos
pares cualquiera.
OBJETIVO
Identificar si existen diferencias entre dos condiciones en trminos de su magnitud y
direccin en distribuciones ordinales de muestras relacionadas. En otras palabras, se comparan dos
tratamientos o condiciones a las que se expone el mismo grupo de sujetos (un sujeto sirve como su
propio control) o bien sujetos igualados por pares, para identificar si los efectos producidos por cada
condicin son diferentes.
SUPUESTOS
1. Variable continua a Escala ordinal
2. Diseo de dos muestras relacionadas
TIPO DE HIPTESIS A PROBAR
Ho: A = B (No existen diferencias entre las condiciones A y B)
Hiptesis alterna sin direccin
Hi: A B (Existen diferencias significativas entre las condiciones A y B)
Hiptesis alterna con direccin
Hi: A > B (Los puntajes en la condicin A son mayores que los puntajes de
la condicin B)
Hi: A < B (Los puntajes en la condicin A son menores que los puntajes de
la condicin B)
DISTRIBUCIN MUESTRAL
Distribucin T de Wilcoxon que proporciona los valores esperados con n menos aquellas
diferencias iguales a 0 para muestras menores a 25.
Para muestras mayores a 25, se fundamenta en la lgica del rea bajo la curva normal.
TIPO DE DATOS
Puntajes ordinales en dos condiciones de medicin
PROCED IMIENTO
Para muestras menores o iguales a 25, los datos se ordenan por pares de observaciones para
obtener la diferencia y asignar rangos que se transforman al valor T.

77

Rango d: Se considera que el rango 1 ser asignado a la diferencia ms pequea y el ltimo rango
corresponder a la diferencia ms grande. No se considera como dato el valor de diferencias igual a 0, y
adems el signo de la diferencia no tiene valor aritmtico, es decir el 2 es igual que el -2. .

Debe respetarse el signo de la diferencia slo para identificar cul es aquel signo menos
frecuente.

Si existen diferencias iguales (ligas) se asignar el rango promedio. Por ejemplo supongamos
que existen las siguientes diferencias: 4, 7, 8, -5, 8, 2, - 3, 5, 6, 9, 3.

La N para usarlo como valor de tabla siempre ser igual al nmero total de pares menos
aqullos cuya diferencia es igual a 0.

78

REGLA DE DECISIN
Para N 25
Si To

Rechazamos la Ho

Se emplea la tabla de valores crticos T de Wilcoxon tomado en cuenta para la ubicacin de la T de


tablas un valor de a especfico para una o dos colas y cierto valor de N.
Para N > 25
Si p(Z) Rechazamos Ho
Se emplea la tabla del rea bajo la curva normal tomando el rea menor.
EJEMPLO PARA N 25
Se intenta identificar si la presentacin de imgenes asociadas con palabras mejoran el
aprendizaje gramatical de las mismas en nios de primer grado de primaria. Para tal propsito
participaron en un estudio 14 nios de 6 aos. En una primera condicin se les present una
lista de 8 palabras en el pizarrn. Posteriormente se les dict la misma lista, registrndose como
dato el nmero de palabras escritas correctamente. Los mismos nios fueron expuestos a una
segunda condicin donde se les present la misma lista de palabras acompaadas de sus
respectivas imgenes, registrndose tambin el nmero de palabras escritas correctamente despus
del dictado.
Probar la hiptesis alterna de que en la condicin B los puntajes ordinales son ms altos.
SOLUCIN
Variable Independiente: Forma de presentacin de las palabras: Condicin A: Palabras solas
Condicin B: Palabras e imgenes
Variable Dependiente: Nmero de palabras escritas correctamente
Paso 1. Establecer las hiptesis a probar
Ho: A B
Hi: A < B
Paso 2. Elegir la prueba estadstica
Dado que nos interesa identificar si existe diferencias entre las condiciones A y B, tenemos una
Variable Dependiente en escala ordinal medida en dos condiciones, muestras relacionadas y N
menor a 25, aplicaremos la prueba T de Wilcoxon para muestras pequeas.

79

Paso 3. Especificar alfa


muestras de tamao 14.
Paso 4. Regin de Rechazo
Dado que la Hiptesis alterna es con direccin negativa la Ho podr ser rechazada si el valor
observado cae en el extremo izquierdo de la distribucin T de Wilcoxon (Prueba unilateral)
Paso 5. Decisin
Para obtener el valor observado de T y tomar la decisin estadstica se aplica el
procedimiento para N 25
Agrupar los datos en la tabla para obtener los rangos y el valor T como se muestra en la
tabla 2

5.2 Obtener Tt
Dado que la hiptesis alterna es unidreccional, se toma el valor de la tabla correspondiente con
el nivel de significacin de una cola. Se ubica entonces en la tabla y se intersecta con el tamao
de N (sin considerar todas aquellas diferencias iguales a 0).

80

5.3 Comparar el valor observado y el valor esperado aplicando la regla de decisin

Dado que To < Tt Rechazamos Ho.

Decisin estadstica:
Dado que rechazamos Ho podemos decir que las diferencias observados a favor de la condicin A no
son resultado del azar, es decir, se apoya estadsticamente la consideracin de que los puntajes en la
condicin A son menores que los puntajes en la condicin B (To 12; 0.05, N = 13)
Conclusin. Existe suficiente evidencia estadstica para considerar que la presentacin de palabras
e imgenes mejora el aprendizaje gramatical en nios de primero de primaria, por lo menos en esta
muestra.
EJEMPLO PARA N > 25
Tomando en consideracin el ejemplo anterior, con una muestra de 28 nios de 4 de primaria,
con una lista de 60 palabras. Probar la Ho de que las condiciones son iguales.
SOLUCIN
Variable Independiente: Forma de presentacin de las palabras Condicin A: Palabras solas
Condicin B: Palabras e imgenes
Variable Dependiente: Nmero de palabras escritas correctamente
Paso 1. Establecer las hiptesis a probar
Ho: A = B
Hi: A B
Paso 2. Elegir la prueba estadstica
Dado que nos interesa identificar si existe diferencias entre las condiciones A y B, que
tenemos una Variable Dependiente a escala ordinal medida en dos condiciones, muestras
relacionadas y N mayor a 25, aplicaremos la prueba T de Wilcoxon para muestras grandes.
Paso 3. Especificar alfa
Se emplear un a = 0.05 tomando en consideracin que tenemos muestras de tamao 28.
Paso 4. Regin de Rechazo

Dado que la Hiptesis alterna es sin direccin la Ho podr ser rechazada si el valor observado cae en
cualquiera de los extremos de la distribucin normal (Prueba bilateral).
Paso 5. Decisin

81

Para obtener el valor observado de T y tomar la decisin estadstica se aplica el procedimiento


para N > 25
5.1. Agrupar los datos en la tabla para obtener los rangos y el valor T como se muestra en la tabla 3

FORMULA

82

5.3. Obtener la p asociada a z con la tabla del rea bajo la curva normal de rea menor o ms all
de z.
En la tabla de la distribucin normal, se encuentra la columna C que contiene el rea bajo la curva
ms all de z (Pagano, 1998). Para determinar p, primero se ubica el valor de z calculado en la
primera columna, despreciando su signo. (si no aparece el valor exacto se considera el ms
cercano), posteriormente se contina sobre el rengln del valor z identificado hasta la columna C,
siendo el valor encontrado la probabilidad asociada al valor z. Cuando la prueba es de una cola se toma
tal cual el valor encontrado ya que la tabla da los valores del extremo derecho, cuando la prueba es de
dos colas la probabilidad se duplica para considerar los dos extremos. Para el ejemplo: p (z) =
0.0001
5.4. Comparar el valor observado contra el valor esperado y aplicar la regla de decisin
Si p (z)
0.0001 < 0.05

Rechazamos Ho

Dado que p (z) es < que

podemos rechazar la Ho

Decisin estadstica:
Dado que rechazamos Ho podemos decir que las diferencias que existen entre ambas condiciones son
significativas, es decir, descartamos el azar como explicacin de dichas diferencias (T = 29.5; p
= 0.0001, N = 27)

Conclusin.
Existe suficiente evidencia estadstica para considerar que la presentacin de palabras e imgenes
proporciona resultados diferentes que la presentacin de slo palabras, respecto del aprendizaje
gramatical en nios de cuarto de primaria, por lo menos en esta muestra.
PROCEDIMIENTO DE CALCULO DE T PARA LA PRUEBA DE WILCOXON UTILIZANDO SPSS
Paso1 Se elabora la base de datos
Para capturar los datos primero se definen dos variables, una para la primera condicin y otra para
la segunda con el siguiente procedimiento:
Data
Define variable
Variable name: nombra la primera condicin. En este caso es palabras solas.
OK
La segunda condicin se define de la misma forma. En este caso su nombre es palabras e imgenes.
Recuerda que slo puedes emplear ocho caracteres. Una vez definidas las variables teclea los valores
correspondientes en forma de lista (Ver figura).

83

Paso 2. Se obtiene el estadstico


Statistics (o Analize).
Nonparametrics tests
2 related simples
En la ventana Two-Related Samples Test seleccionar las variables antes y despus y pasarla al
recuadro de Test Par(s) List dando clic en el botn que est enmedio de ambos recuadros.
Verificar que est seleccionada la prueba de Wilcoxon. Dar clic en OK (Ver figura).

84

HOJA DE RESULTADOS (OUTPUT


NPar Tests
Wilcoxon Signed Ranks Test

85

1. En este caso el signo de rangos menos frecuente es el negativo porque el programa le


resta a la segunda condicin la primera (paleimag - palabras).
Paso 3 Tomar la decisin estadstica interpretando la hoja de resultados
En el ejemplo para muestras pequeas tenemos que el valor de T es 12 y convertido a
puntaje z es -2.359 con una probabilidad asociada de .018 para una prueba bidireccional.
Como en el ejemplo se plantea una prueba unidireccional la probabilidad asociada al
estadstico se divide en dos, as .01812=.009; por lo tanto, z=-2.359, p=.009 para una cola.
Aplicando la regla de
decisin:
Si p(spss) > Aceptamos Ho.
Si p(spss) Rechazamos Ho.
tenemos que . 009 < .05, por lo que rechazamos Ho.
Podemos concluir que existe suficiente evidencia estadstica para considerar que la presentacin
de palabras e imgenes mejora el aprendizaje gramatical en nios de primero de primaria.

86

TABLA I

Valores crticos de T para la prueba ele rangos con sigue ele Wilcoxon

87

88

APE NDICE D TABLAS

89

90

APENDICE D TABLAS

91

92

PRUEBA X2 COMO PRUEBA HOMOGENEIDAD


OBJETIVO
Identificar si existe diferencias significativas entre grupos o muestras independientes
La lgica de la prueba implica identificar si la diferencia entre la FE y la FO de cada una
de las categoras es significativa como resultado de la diferencia entre los grupos
independientes.
En este caso se maneja una variable categrica como Variable dependiente y una variable
categrica como variable independiente (cada categora de esta ltima representa un grupo o
muestra). Tambin se puede manejar en diseos que no implican necesariamente VI-VD, si
existe algn criterio de definicin de grupos independientes donde se observe la ocurrencia de
datos de variables categricas.
SUPUESTOS
1. Muestreo aleatorio
2. Distribucin normal de los datos (El tamao de la muestra probabiliza que la distribucin de los
datos sea aproximada a la normal de acuerdo con la Ley de los Grandes Nmeros.)
3. Variables categricas con escala de medida nominal
4. Muestras grandes (n 30)
5. Dos o ms muestras independientes
6. F E > 5 (Debemos recordar que si las FE son menores de 5 en alguna de las categoras se aplica el
procedimiento con correccin de Yates)
TIPO DE HIPTESIS A PROBAR
Ho: G1 = G2 = Gn (No existe diferencia entre los grupos)
Hiptesis alterna sin direccin
Hi: G1 G2 Gn (Existe diferencia entre los grupos)
Hiptesis alterna con direccin
Hi: G1 < G2
Hi: G1> G2
En este caso la hiptesis alternativa direccional se plantea con mayor precisin cuando existen dos
grupos independientes; para el caso en donde existen ms de dos grupos es preferible plantear
hiptesis alternativa sin direccin
DISTRIBUCIN MUESTRAL

Distribucin X2 que proporciona los valores esperados para todas las muestras posibles obtenidas

en forma aleatoria. Con gl = (c - 1)(r - 1). Donde c es el nmero total de columnas y r el nmero
total de renglones) se obtiene el valor crtico de X2
TIPO DE DATOS
Frecuencias de casos observados en cada categora propia de las variables medidas.
Cada variable debe incluir por lo menos dos categoras mutuamente excluyentes (los grupos en
el caso de esta prueba representan categoras)
Las frecuencias observadas se vacan en una tabla de contingencias que mnimamente debe

93

ser de cuatro entradas (dos categoras para cada variable o grupo)


TABLA DE CONTINGENCIA

OTRAS FRMULAS:

b) Cuando tenemos una tabla de contingencia de cuatro entradas puede utilizarse la siguiente
ecuacin

REGLA DE DECISIN
Si X2o X2t,

gl Rechazamos Ho

0 bien, Si p (X 2 ) . -. Rechazamos Ho
Se emplea la tabla de valores crticos X2 que nos proporciona el valor esperado o de tablas y su
probabilidad asociada como lo revisamos en el caso de la prueba de Bondad de Ajuste
EJEMPLO PRUEBA X2 COMO PRUEBA HOMOGENEIDAD

94

Se intenta identificar si existen diferencias entre las prcticas de crianza que adoptan
padres con diferentes estilos de relacin de pareja. Para tal propsito se tomaron en forma
aleatoria tres muestras o grupos de 32 parejas cada uno. Cada grupo se diferenci por su estilo de
relacin de pareja. El grupo 1 lo constituan parejas con un estilo agape (relacin apoyada en la
razn); grupo 2 lo constituyeron parejas con un estilo eros (relacin apasionada) y el grupo 3
fueron parejas con un estilo ludus (relacin apoyada en el juego). Se aplic un cuestionario
para clasificar la prctica de crianza adoptado por cada pareja. Se registr la frecuencia de
casos para cada una de las siguientes categoras: autoritario, permisivo, negociador segn el grupo
de pertenencia. Los datos observados se distribuyen normalmente en cada categora. Probar si
existen diferencias significativas entre los grupos.

SOLUCIN
Variable Medida. Estilos de crianza
Categoras: autoritarios, permisivos, negociadores
Variable de agrupamiento: Estilos de relacin de pareja que definen los grupos Categoras: agape
(G1), eros (G2), ludus (G3)
Paso 1. Establecer las hiptesis a probar
Ho: G1 = G2 = Gn
Hi: G1 G2: Gn

Paso 2. Elegir la prueba estadstica


Dado que nos interesa identificar si existe diferencias entre grupos independientes con
respecto a las prcticas de crianza adoptados, que los datos son nominales, las muestras son
mayores a 30 y tomadas de forma aleatoria, la distribucin de los datos es normal, las muestras son
independientes y ninguna de las FE es menor a 5, se aplicar la prueba X 2 como prueba de
homogeneidad

Paso 3. Especificar alfa


N = 96

Paso 4. Regin de Rechazo


Dado que la Hiptesis alterna es sin direccin la Ho podr ser rechazada si el valor
observado cae en cualquiera de los extremos de la distribucin (prueba unidireccional).

Paso 5. Decisin
Para obtener el valor observado de X2 y tomar la decisin estadstica se aplica el
procedimiento con la frmula de X 2.
5.1 Agrupar las frecuencias observadas en una tabla de contingencias y calcular las Frecuencias
esperadas

95

Calculo de las FE

5.2 Obtener el estadstico

5.4 Comparar el valor observado y el valor esperado aplicando la regla de decisin

Dado que X2o (1.754) < X2 t

0.05, gl 4; podernos rechazar la Hi y aceptar la


Ho; la probabilidad asociada al valor observado de ji cuadrada es cercano a 0.8 mucho mayor
que el alfa elegido.
Decisin estadstica:
Dado que rechazarnos Hi podemos decir que no existen diferencias significativas entre grupos
(X20 = 1.754; a 0.05, g1 4), es decir, la decisin estadstica tomada implica que las diferencias
observadas entre grupos son resultado del azar y no de la variable de ag rupamiento.

96

Conclusin
Dada la evidencia estadstica podernos decir que no existen diferencias en las
prcticas de crianza adoptados por padres con diferentes estilos de relacin de pareja, por
lo menos en las muestras observadas.
PROCEDIMIENTO DE CLCULO MEDIANTE EL PAQUETE SPSS
A continuacin se presentan los pasos a seguir para obtener el estadstico de la prueba de X2
de homogeneidad. Para la decisin estadstica se toma la regla de decisin: Si p(z) se
rechaza la Ho
Paso 1 Se elabora la base de datos
Se definen tres columnas. Una de ellas especifica las categoras correspondientes a una variable
(en este caso a los grupos), otra de las columnas corresponde a las categoras de la otra
variable (en este caso prcticas de crianza). Ambas variables deben etiquetarse
adecuadamente con nmeros desde el 1 hasta k categoras; la tercera columna corresponde a
las FO. Una vez definidas se vacan los datos combinando las categoras de grupo y de la otra
variable, es decir la base de datos debe quedar como la tabla de contingencia.
Recuerda que para definir las variables usamos el men Data y el submen Define Variable y
para etiquetar usamos !a opcin label como se muestra en la figura siguiente
As la base de datos debe representar la tabla de contingencia con renglones y columnas (Ver figura)

Paso 2 Ponderar frecuencias


En todos los casos de ji cuadrada deben ponderarse las frecuencias desde el men Data
Weight Cases
Weight Cases by
Pasar la variable FO (Ver figura 10)

97

Como se muestra en la figura, en la ventana de la prueba se seala cual es la variable que


corresponde a los renglones o Row (en este caso prcticas), cual es la variable que corresponde a
las columnas o Columns (en este caso grupos).
Una vez definido lo anterior se da un click a Statistics en esta ventana y se pide la prueba chisquare. Se oprime Continue y para finalizar Ok para que aparezca el output.

Paso 3 Obtener el estadstico


Desde el men
Statistics
Sumarize
Crosstabs se inicia el procedimiento para la X2 de homogeneidad (Ver figura)

98

Paso 4 Tomar la decisin estadstica interpretando la hoja de resultados

Con los datos obtenidos como lo muestra la hoja de resultados podemos decir lo siguiente:
Al aplicar la prueba X2 de homogeneidad para comparar las prcticas de crianza que adoptan los padres
de tres grupos distintos se observo un valor X2 (4) = 1.748 con una probabilidad asociada de 0.789.
Dado que el valor de la probabilidad es mayor al alfa elegido (0.05) se acepta la Ho, por lo tanto no
existen diferencias estadsticamente significativas entre los grupos con respecto a sus prcticas de
crianza.
Hoja de resultados datos del anlisis de X2

99

100

PRUEBA U DE Mann Whitney


OBJETIVO
Identificar si dos muestras independientes pertenecen a la misma poblacin o a distintas poblaciones;
en otras palabras esta prueba nos permite determinar si la distribucin de dos muestras independientes es
semejante o diferente.
La lgica de la prueba implica identificar el orden de los datos segn su valor de menor a mayor
que de cada uno de los grupos. Se asignan rangos para cada valor y se obtiene el rango promedio de
cada grupo, si la diferencia entre tales promedios de rangos es significativa entonces se puede rechazar la
Ho.
Esta prueba se aplica cuando se tienen diseos de dos grupos independientes que pueden ser: dos
grupos experimentales; un grupo control y otro experimental; dos grupos de sujetos definidos por
variables atributivas, entre otros.
SUPUESTOS
1. Variables continuas
2. Escala Ordinal
3. Dos muestras independientes
4. Muestreo aleatorio (Es importante sealar que si el muestreo no fue probabilstico, puede
aplicarse la prueba U si los sujetos a cada grupo son asignados aleatoriamente o bien puede
aplicarse una prueba de aleatoriedad para identificar la misma en los datos y cubrir el supuesto.)
TIPO DE HIPTESIS A PROBAR
Hiptesis Nula:
Ho: No existen diferencias significativas entre la distribucin de la muestra 1 respecto de la distribucin de

la muestra 2. (G1 = G2)

Hiptesis alterna sin direccin


Hi: Si existen diferencias significativas entre la distribucin de la muestra 1 respecto de la distribucin de

la muestra 2. (G1 G2)

Hiptesis alterna con direccin


Hi: G1 > G2
Hi: G, < G2,
DISTRIBUCIN MUESTRAL
Distribucin U de Mann-Whitney que proporciona los valores esperados para todas las
muestras posibles obtenidas al azar de tamao N <_ 20; Para N > 20 los valores esperados los
proporciona el rea bajo la curva normal.
TIPO DE DATOS
Puntajes ordinales correspondientes a dos grupos independientes
Ahora bien, esta prueba puede aplicarse a datos de muestras de diferente tamao sin
alterar su potencia- eficiencia: no obstante los procedimientos y la regla de decisin cambia
conforme aumenta el tamao de n 2 (siendo n2 el grupo independiente mas grande de los dos
comparados y n1 la muestra mas pequea).

101

PROCEDIMIENTOS
El caso de n 2 < 20
1. Se construye una tabla de rangos para cada muestra (tales rangos se asignan considerando el
orden jerrquico y la ligas o datos iguales para los datos agrupados de todas las observaciones,
es decir combinando en cada muestra)

Donde R1 es la suma de los rangos correspondientes a los puntajes de n1 y R2 es la suma de los


puntajes de n2
2. Se calcula el valor de U mediante las siguientes frmulas:

Donde U' es el valor mas grande entre U1 y U2


REGLA DE DECISIN
Si Uo

Rechazamos la Ho

La Ut se obtiene de la tabla de valores crticos de U de Mann -Whitney considerando el tamao


de n1 y n2 para un nivel de significacin particular.
EN EL CASO DE N2 > 20
1. Se aplica el mismo procedimiento anteriormente descrito para obtener U
2. Una vez obtenido el valor de U se aplica las siguientes frmulas segn el caso de:
Frmula para datos no ligados

102

3. Se identifica la p(z) con la tabla de valores del rea bajo la curva normal ms all de z
REGLA DE DECISIN
Si p(Z) Rechazamos Ho
EJEMPLO PARA n 2 20
Un investigador est interesado en identificar si la presencia o ausencia de
retroalimentacin constante durante la enseanza de las matemticas afectan diferencialmente
el aprendizaje de las mismas. Participaron en el estudio 30 estudiantes de secundaria asignados
aleatoriamente a dos grupos independientes. El primer grupo o grupo control no recibi
retroalimentacin durante la prctica de matemticas y el grupo 2 o experimental recibi
retroalimentacin constante durante la prctica. A ambos grupos se les aplic un examen al final de
la prctica que constaba de 80 preguntas.
Con los datos probar la hiptesis nula de que no existen diferencias entre grupos

103

SOLUCIN
Variable Independiente: Retroalimentacin continua Grupo Control: Sin retroalimentacin Grupo
experimental: Con retroalimentacin
Variable Dependiente: Nmero de respuestas correctas en el examen

Paso 1. Establecer las hiptesis a probar


Ho: G1 = G2
Hi: G1 ~ G2

Paso 2. Elegir la prueba estadstica


Dado que nos interesa identificar si existen diferencias entre los grupos como resultado de
la intromisin de la variable independiente (retroalimentacin continua en el GE), que tenemos una
Variable Dependiente (Nmero de respuestas correctas) continua a escala ordinal, dos muestras
independientes y n2 es menor a 20, aplicaremos la prueba U de Mann-Whitney para muestras
pequeas.

Paso 3. Especificar alfa

Paso 4. Regin de Rechazo


Dado que la Hiptesis alterna es sin direccin la Ho podr ser rechazada si el valor
observado cae en cualquiera de los extremos de la distribucin (Prueba bilateral).

Paso 5. Decisin
Para obtener el valor observado de U y tomar la decisin estadstica se aplica el
procedimiento para n _< 20

5.1 Estructurar la tabla de rangos n1 = GC y n2 = GE


Tabla 4. Datos correspondientes a las puntuaciones de los grupos

104

5.2 Calcular U aplicando las frmulas:

5.4 Comparar el valor esperado contra el valor obtenido aplicando la regla de decisin
101.5 > 64

Rechazamos Ho.

Dado que Uo es mayor a Ut rechazamos Hi


Decisin estadstica:
Dado que rechazamos Hi podemos decir que no existen diferencias significativas entre los grupos (U 101.5,
a 0.05), es decir que las diferencia observadas en los puntajes del grupo control respecto del grupo
experimental son resultado del azar.
Conclusin
Existe evidencia estadstica que sugiere que la presencia o ausencia de retroalimentacin no
afectan diferencialmente el desempeo en pruebas de matemticas en estudiantes de secundaria,
por lo menos en esta muestra
EJEMPLO PARA n2 > 20
El mismo estudio se realiz con estudiantes de 6 de primaria con el mismo propsito, slo que se emple
una muestra mayor de sujetos Participaron en el estudio 60 estudiantes de primaria elegidos en forma
aleatoria y asignados al azar al grupo control y al grupo experimental. El resto de las condiciones
fueron las mismas que en el estudio con estudiantes de secundaria. Con los datos probar la Ho
correspondiente.

105

SOLUCIN
Variable Independiente: Retroalimentacin continua Grupo Control: Sin retroalimentacin Grupo
experimental: Con retroalimentacin
Variable Dependiente: Nmero de respuestas correctas en el examen

Paso 1. Establecer las hiptesis a probar


Ho: G1 = G2
Hi: G1 G2

Paso 2. Elegir la prueba estadstica


Dado que nos interesa identificar si existen diferencias entre los grupos como resultado de la
intromisin de la variable independiente (retroalimentacin continua en el GE), que tenemos una
Variable Dependiente (Nmero de respuestas correctas) continua a escala ordinal, dos muestras
independientes y n2 es mayor a 20, aplicaremos la prueba U de Mann-Whitney para muestras
grandes.

Paso 3. Especificar alfa


Se emplear un = 0.05 tomando en consideracin que N = 30

Paso 4. Regin de Rechazo


Dado que la Hiptesis alterna es sin direccin la Ho podr ser rechazada si el valor observado
cae en cualquiera de los extremos de la distribucin (Prueba Bilateral).

Paso 5. Decisin
Para obtener el valor observado de U y tomar la decisin estadstica se aplica el procedimiento
para n > 20

106

5.2 Estructurar la tabla de rangos n 1 = GC y n 2 = GE

5.3 Dado que n2 > 20 se aplica la frmula de z para obtener la pro babilidad asociada a U
mediante el rea, bajo la curva ms all de z

107

5.5 Comparar el valor esperado contra el valor obtenido aplicando la regla de decisin

Decisin estadstica:
Dado que rechazamos Ho podemos decir que existen diferencias significativas entre los grupos que no pueden
ser atribuidas al azar (z = -5.56, p < 0.0001)

Conclusin
Existe evidencia estadstica que sugiere que la presencia o ausencia de retroalimentacin afectan
diferencialmente el desempeo en pruebas de matemticas en estudiantes de primaria, por lo menos
en esta muestra.

Conclusin general
Podemos decir que la retroalimentacin continua tiene efectos significativos sobre el nmero de
respuestas correctas en una prueba de matemticas en estudiantes de 6 de primaria pero no as en
estudiantes de secundaria.

108

PROCEDIMIENTO DE CLCULO MEDIANTE EL PAQUETE SPSS (el procedimiento es el mismo


independientemente del tamao de n2)
A continuacin se presentan los pasos a seguir para obtener el estadstico de la prueba de U de MannWhitney. Se tomar el ejemplo de los grupos de primaria de las pginas anteriores. Para la
decisin estadstica se toma la regla de decisin. Si p(z) se rechaza la Ho

Paso 1 Se elabora la base de datos


Se definen dos columnas. Una de ellas se denomina grupos y se especifican los grupos de pertenencia
con los valores 1 y 2; la otra columna corresponde a los puntajes de cada sujeto para ambos grupos.
Debemos definir la variable grupo etiquetando debidamente y puntaje sin etiquetas. Recuerda que
para definir las variables debes entrar a la ventana de Define Variable desde el men Data. Una vez
en la ventana de definir variable se etiqueta desde la opcin Label (Ver figura)

As la base de datos debe tener una columna de grupos y otra de puntajes como se muestra en la
figura.

109

Pase 2 Obtener el estadstico


Como se muestra en la figura se pide el estadstico desde el men
Statistics
Nonparametric tests
2 Independent samples

En la ventana de !a prueba se seala cual es la variable que se va a probar este caso puntaje) cual es
la variable que corresponde a los grupos. Una vez asignada la varale grupos en la ventana se
activa un botn para definir grupos (en trminos de la Atiquetacin que se asign en la base de
datos), se da un clic y se escribe el nmero que corresponde a cada gi-upo.

110

Una vez definido lo anterior se da un click a la opcin , de la prueba U aparece en el men de


pruebas y para finalizar Ok (Ver figura 16) para que aparezca la hoja de resultados o el output,

111

Paso 4 Tomar la decisin estadstica interpretando la hoja de resultados


Al aplicar la prueba U de Mann-Whitney para comparar el nmero de respuestas correctas en la
prueba de matemticas entre el grupo control y el grupo experimental encontramos que la p(U)
< 0.0001 y dado que es menor al alfa elegido rechazamos Ho.

Decisin estadstica.
Dado que rechazamos Ho podemos decir que existen diferencias significativas entre los grupos no atribuibles
al azar (z = -5.45, p < 0.0001)

Conclusin
Existe evidencia estadstica que sugiere que la presencia o ausencia de retroalimentacin afectan
diferencialmente el desempeo en pruebas de matemticas en estudiantes de primaria, por lo menos en
esta muestra.

112

113

APNDICE D TABLAS

114

115

116

PRUEBA DE HIPOTESIS ESTADSTICAS PARA EL CASO DE


K MUESTRAS:
LA PRUEBA FRIEDMAN
LA PRUEBA KRUSKALL-WALLIS

117

PRUEBA DE FRIEDMAN
OBJETIVO
Identificar si tres o ms muestras relacionadas o igualadas (k muestras) pertenecen a la misma
poblacin o a distintas poblaciones; en otras palabras esta prueba nos permite determinar si la distribucin
de tres o ms muestras relacionadas es semejante o diferente.
La lgica de la prueba implica identificar el orden de los datos segn su valor de menor a mayor que
d cada uno de los grupos. Se asignan rangos para cada valor y se obtiene el rango promedio de cada
grupo, si la diferencia entre tales promedios de rangos es significativa entonces se puede rechazar la Ho.
Esta prueba se aplica cuando se tienen diseos en los que un mismo sujeto es medido tres o ms
veces o cuando sujetos diferentes son igualados en varias variables y se asignan de manera aleatoria a cada
una de las condiciones, de tal suerte que se consideran como una misma fuente de observacin de la cual se
obtienen k medidas.
SUPUESTOS
1. Variable continua
2. Escala Ordinal para la variable medida
3. Tres o ms muestras relacionadas
TIPO DE HIPTESIS A PROBAR
Ho: No existen diferencias significativas entre la distribucin de las distintas muestras
(G1 = G2= G3 = ....Gk)
Hiptesis alterna sin direccin
Hi: Si existen diferencias significativas entre la distribucin de las muestras.
(G1: G2 G3 .... Gk )
DISTRIBUCIN MUESTRAL
Distribucin Xr2 que proporciona los valores esperados para muestras pequeas y la
distribucin X2 proporciona los valores esperados para muestras grandes.
TIPO DE DATOS
Puntajes ordinales correspondientes a los k grupos relacionados. PROCEDIMIENTOS
Muestras pequeas (k=3 4 y n<9)
1. Se ordenan los puntajes en una tabla de dos clasificaciones de k columnas (condiciones) y N
renglones (sujetos). En cada rengln se asigna a cada observacin el rango que le corresponda de
manera ascendente (al valor ms pequeo se le asigna el rango 1, al valor que le sigue el rango 2 y
as sucesivamente) considerando las ligas.
2. Una vez asignados los rangos se calcula para cada condicin la suma de los rangos y/ o su rango
promedio.

118

Donde R1 es la suma de los rangos correspondientes a los puntajes de C 1 y R2 es la suma de los


rangos de C2, etc. R1 es el rango promedio de C1, el cual se calcula dividiendo R1 entre el nmero de
observaciones que tiene C 1.

3. Se calcula el valor del estadstico X r2 (o Fr) mediante la siguiente frmula:

4. Se obtiene el valor esperado de X {2 (Xr2t) de la tabla de valores crticos de X r2 considerando el


nmero de condiciones (k) y el nmero de renglones (N) para un nivel de significacin particular.
REGLA DE DECISIN
Si Xr 2o Xr2t, Rechazamos la Ho
MUESTRAS GRANDES (K 4 Y/O N 6)
1. Se aplica el mismo procedimiento anteriormente descrito para obtener Xr2 si no hay ligas en la
muestra.
2. Si existen ligas Xr2 se calcula con la frmula siguiente:

La frmula para datos ligados se aplica, an en muestras pequeas, cuando existe el 25% o ms de
observaciones ligadas, y particularmente cuando algunos valores de t son grandes; por ejemplo
cuando t=6.
3. Se obtiene el valor esperado de X r2 (Xr2 t) de la tabla de valores crticos de X 2 con gl= k-1 para
un nivel de significacin particular, donde k = nmero de condiciones (o muestras relacionadas).
REGLA DE DECISIN

COMPARACIONES MLTIPLES

119

Xr2 slo indica si las condiciones difieren o no entre s en trminos generales. Cuando Xr2 es significativo,
es decir, se rechaza la hiptesis nula, X r2 slo indica que existen diferencias en la variable
dependiente segn la condicin pero no especifica cules son las condiciones en los que se
observan tales diferencias. Para ello es necesario hacer comparaciones entre pares de condiciones
para detectar entre qu par est dada la diferencia.
PROCEDIMIENTO
1.

Determinar el nmero de comparaciones a realizar.

2.
Obtener la diferencia absoluta, es decir, haciendo caso omiso del s igno, de los rangos
promedio en cada comparacin.

3.
Calcular la diferencia crtica (DC). Como el nmero de casos (N) es el mismo en todas las
condiciones slo se calcula una diferencia crtica.

se obtiene de la tabla A II intersectando el nmero de comparaciones calculado en el paso 1


con el nivel de significancia especificado.
4. Comparar la diferencia de los rangos promedio con la diferencia crtica. La diferencia observada
en el par comparado es significativa si es mayor o igual a DC.
5. Determinar a favor de quin est la diferencia en el par comparado mediante la observacin de sus
rangos promedio.

EJEMPLO PARA MUESTRAS PEQUEAS


En una institucin educativa se ponen a prueba tres mtodos de enseanza para mejorar la
ejecucin en tareas de solucin de problemas matemticos, en alumnos de educacin media superior. Con
tal fin se seleccionaron al azar 5 sujetos quienes fueron expuestos a los tres mtodos a intervalos
de dos semanas. Al trmino de la implementacin de cada mtodo cada sujeto resolvi un examen de
problemas matemticos y se registr el nmero de respuestas correctas (datos en la tabla 1) a .05,
determine si existen diferencias entre los mtodos y cul de ellos es el que debe implementarse. Se sabe
que la distribucin de los datos en cada muestra no presenta normalidad.

120

SOLUCIN
Variable Independiente: Tipo de mtodo
Contiene tres niveles: mtodo1, mtodo2, mtodo3
Variable Dependiente: Nmero de respuestas correctas en el examen

Paso 1. Establecerlas hiptesis aprobar

Paso 2. Elegirla prueba estadstica


Dado que nos interesa identificar si existe diferencias entre las condiciones como resultado de
la intromisin de la variable independiente (tipo de mtodo), que tenemos una Variable
Dependiente (Nmero de respuestas correctas) continua en escala ordinal, tres muestras
relacionadas y el tamao de N es igual a 5, aplicaremos la prueba de Friedman para muestras
pequeas.

Paso 3. Especificar alfa


Se emplear un

Paso 4. Regin de Rechazo


Dado que la Hiptesis alterna es sin direccin la Ho podr ser rechazada si el valor observado
cae en cualquiera de los extremos de la distribucin (Prueba Bilateral)

Paso 5. Decisin
Para obtener el valor observado de Xr2 y tomar la decisin estadstica se aplica el procedimiento para
muestras pequeas.

5.1 . Asignacin de rangos para las observaciones de cada rengln por separado.
Calcular en cada muestra la suma de rangos y el rango promedio.

121

5.2 Calcular Xr2 aplicando la frmula:


En este ejemplo slo existe una liga y su.efecto puede despreciarse, por lo que se aplicar la
frmula sin datos ligados.

SUSTITUIMOS
5.3 Obtener el valor de Xr2t,a, n1, n2, n3

5.4 Comparar el valor esperado contra el valor obtenido aplicando la regla de decisin

Dado que Xr2o es mayor a Xr2t rechazamos Ho


Decisin estadstica:
Dado que rechazamos Ho podemos decir que existen diferencias significativas no atribuibles al
azar entre los distintos mtodos (X r2= 7.95, = 0.05).
Como Xr2o result significativa se procede a realizar comparaciones mltiples para determinar las
diferencias entre los pares de mtodos.

Paso 6. Comparaciones mltiples


6.1.

Determinar el nmero de comparaciones a realizar.

6.2.

Obtener la diferencia absoluta , es decir, haciendo caso omiso del signo, de los rangos
promedio en cada comparacin.

122

6.3.

Calcular la diferencia crtica (DC). Como el tamao de las muestras es igual slo se calcula
una diferencia crtica.

se obtiene de la tabla AII intersectando el nmero de comparaciones calculado en el paso 1 con el nivel
de significancia especificado. En este caso 3 comparaciones con un alfa de .05 para una prueba bidireccional (slo
se desea saber si hay diferencias entre los dos mtodos que se comparan, no se especifica una direccin). Z/k(k-1)
= 2.394

7. Comparar la diferencia de los rangos promedio con la diferencia crtica. La diferencia observada
en el par comparado es significativa si es mayor o igual a DC.

8. En el par comparado cuya diferencia result significativa determinar a favor de quin est la
diferencia mediante la observacin de sus rangos promedio.
IM1 - M3I = 2.7 - 1.0 = 1.7 > 1.51
Como la variable dependiente est medida en trminos del nmero de respuestas correctas, un
puntaje alto indica un mejor desempeo, as el mtodo en el cual se encuentra un rango promedio
alto indica que fue ms efectivo para mejorar la ejecucin. La diferencia entre los rangos
promedio del mtodo 1 y el 3 result significativa siendo el mtodo 1 el que presenta un rango
promedio ms alto, por lo que puede decirse que este mtodo es ms efectivo que el mtodo3.
Conclusin
Existe evidencia estadstica que indica que hay diferencias significativas en la ejecucin de
problemas matemticos segn el mtodo empleado, especficamente entre el mtodo 1 y el mtodo 3,
de los cuales el mtodo 1 es el ms efectivo, por lo que podra decirse que ste es el ms conveniente
para implementarse.
EJEMPLO PARA MUESTRAS GRANDES
Se realiz un estudio semejante al anterior y con el mismo propsito, slo que se emple una muestra
mayor de sujetos y se probaron 4 mtodos de enseanza en lugar de tres (datos en la tabla 3) Participaron en
el estudio 10 estudiantes de educacin media superior, quienes fueron expuestos a los cuatro mtodos.
Con los datos probar la Ho correspondiente.

123

SOLUCIN
Variable Independiente: Tipo de mtodo
Contiene cuatro niveles: mtodo1, mtodo2, mtodo3, mtodo4
Variable Dependiente: Nmero de respuestas correctas en el examen

Paso 1. Establecer las hiptesis a probar

Paso 2. Elegir la prueba estadstica


Dado que nos interesa identificar si existe diferencias entre las cuatro condiciones como
resultado de la intromisin de la variable independiente (tipo de mtodo), que tenemos una Variable
Dependiente (Nmero de respuestas correctas) continua en escala ordinal, cuatro muestras
relacionadas y el tamao de N es igual a 10, aplicaremos la prueba de Friedman para muestras
grandes.

Paso 3. Especificar alfa


Se emplear un a = 0.05.

Paso 4. Regin de Rechazo


Dado que la Hiptesis alterna es sin direccin la Ho podr ser rechazada si el valor
observado cae en cualquiera de los extremos de la distribucin (Prueba Bilateral).

Paso 5. Decisin

124

Para obtener el valor observado de X r


procedimiento para muestras grandes.

y tomar la decisin estadstica se aplica el

5.1. Asignacin de rangos para todas las observaciones de cada rengln por separado. Calcular
en cada muestra la suma de rangos y el rango promedio.
5.2 Calcular Xr 2 aplicando la frmula:
En este ejemplo se aplica la frmula para las ligas ya que el 35% de los datos estn ligados.

En esta frmula las ligas consideran valores de t=1. Para cada rengln determinaremos las ligas
existentes y los valores de t.

125

SUSTITUIMOS

5.4. Obtener el valor de Xr2 t,a, n1, n2, n3, n4


Como n y k exceden los valores que se pueden consultar en la tabla para muestras pequeas,
se emplear la distribucin X2 con gl=k-1.

126

5.5 Comparar el valor esperado contra el valor obtenido aplicando la regla de decisin

Dado que Xr2 o es menor X2 aceptamos Ho


Decisin estadstica:
Dado que aceptamos [lo podemos decir que no existen diferencias significativas entre los distintos mtodos,
es decir, que las diferencias observadas son resultado del azar.
Como Xr2 o result no significativa no se procede a realizar comparaciones mltiples para determinar las
diferencias entre los pares de mtodos.
Conclusin
No existe evidencia estadstica que sugiera que hay diferencias significativas en el rendimiento en la
ejecucin de problemas matemticos segn el mtodo empleado, por lo que podra decirse que los
cuatro mtodos producen el mismo efecto en el rendimiento.
PROCEDIMIENTO
DE
CLCULO
MEDIANTE
EL
PAQUETE
SPSS
(el
procedimiento es el mismo independientemente del nmero y tamao de las muestras)
A continuacin se presentan los pasos a seguir para obtener el estadstico de la prueba de
Friedman. Se tomar el ejemplo de muestras pequeas. Para la decisin estadstica se toma la
regla de decisin: Si p(X2) se rechaza la Ho

Paso 1 Se elabora la base de datos


Se definen k columnas. Cada una de ellas corresponde a una condicin en la cual se capturan los
puntajes de cada sujeto en esa condicin (Ver figura).
Definir cada columna con el nombre de la condicin correspondiente sin etiquetas (Ver figura).

127

Figura 2. Ejemplo de la base de datos para la prueba de Friedman


Paso 2 Obtener el estadstico
Desde el men
Statistics
Nonparametrics test

128

K Related Samples (Ver figura)


En la ventana de la prueba se seala cuales son las variables que se van a probar (en este caso las
columnas de los puntajes de cada una de las condiciones), seleccionando todas las variables a probar
y pasndolas al recuadro de Tests Variables (Ver figura).
Una vez hecho lo anterior se verifica que en el men de pruebas est seleccionada la opcin Friedman,
puesto que el programa la tiene ya seleccionada. Para finalizar se da clic en Ok para que
aparezca la hoja de resultados (Figura).

129

Fig. 5 Ventana principal de la prueba de Friedman

Paso 3. Tomar la decisin estadstica interpretando la hoja de resultados


Al aplicar la prueba de Friedman para comparar el nmero de respuestas correctas en el
examen de problemas matemticos entre los tres mtodos encontramos que la p(X 2) < 0.05 y
dado que es menor al alfa elegido rechazamos Ho.
Decisin estadstica:
Dado que rechazamos Ho podemos decir que existen diferencias significativas entre los mtodos (X 2 =
8.316, p = 0.016). Como se rechaza la hiptesis de nulidad es necesario hacer las comparaciones
mltiples para determinar entre que par de mtodos se encuentra la diferencia. En vista de que el
programa no proporciona dicha informacin es necesario calcularlas a mano (ver seccin de comparaciones
mltiples), para lo cual se pueden retomar los valores de los rangos promedios que proporciona el
programa en la tabla titulada Ranks para calcular las diferencias entre stos.

Conclusin
Existe evidencia estadstica que indica que hay diferencias significativas en el rendimiento en la
ejecucin de problemas matemticos segn el mtodo empleado, especficamente entre el mtodo
1 y el mtodo 3, de los cuales el mtodo 1 es el ms efectivo, por lo que podra decirse que
ste es el ms conveniente para implementarse.

130

Tabla M. Valores crticos para la prueba estadstica de anlisis (de


varianza bifactorial por rangos de Friedman).

131

* # c es el nmero de comparaciones.

132

PRUEBA DE KRUSKAL-WALLIS
OBJETIVO
Identificar si tres o ms muestras independientes (k muestras) pertenecen a la misma poblacin o a
distintas poblaciones; en otras palabras esta prueba nos permite determinar si la distribucin de tres o ms
muestras independientes es semejante o diferente.
La lgica de la prueba implica identificar el orden de los datos segn su valor de menor a mayor
que de cada uno de los grupos. Se asignan rangos para cada valor y se obtiene el rango promedio de cada
grupo, si la diferencia entre tales promedios de rangos es significativa entonces se puede rechazar la Ho.
Esta prueba se aplica cuando se tienen diseos de tres o ms grupos independientes que pueden
ser: dos o ms grupos experimentales y uno control o tres o ms grupos de sujetos definidos por
variables atributivas, entre otros.
SUPUESTOS
1. Variable continua
2. Escala Ordinal para la variable medida
3. Tres o ms muestras independientes
4. Muestreo aleatorio. (Es importante sealar que si el muestreo no fue probabilstico, puede
aplicarse la prueba de Kruskal-Wallis si los sujetos son asignados aleatoriamente a cada grupo o
bien puede aplicarse una prueba de aleatoriedad para identificar la misma en los datos y cubrir el
supuesto).
TIPO DE HIPTESIS A PROBAR
Ho: No existen diferencias significativas entre la distribucin de las distintas muestras (G1
=G2=G3=....Gk)
Hiptesis alterna sin direccin
Hi: Si existen diferencias significativas entre la distribucin de las muestras.
(G1 G2 G3 . . . . Gk)
DISTRIBUCIN MUESTRAL
Distribucin H que proporciona los valores esperados para muestras pequeas y la

distribucin X2 proporciona los valores esperados para muestras grandes.


TIPO DE DATOS

Puntajes ordinales correspondientes a los k grupos independientes.


Esta prueba puede aplicarse a datos de muestras de diferente tamao sin alterar su potenciaeficiencia,
PROCEDIMIENTOS
Muestras pequeas (k=3 y n 5)
1. Todas las muestras se consideran como una sola y a cada observacin se le asigna el rango
que le corresponda de manera ascendente (al valor ms pequeo se le asigna el rango 1, al valor
que le sigue el rango 2 y as sucesivamente) considerando las ligas o datos iguales.

133

2.
Una vez asignados los rangos se calcula para cada muestra la suma de los rangos y su
rango promedio.

Donde R1 es la suma de los rangos correspondientes a los puntajes de n1 y R 2 es la suma de los


rangos de n2, etc. R 1 es el rango promedio de n1, el cual se calcula dividiendo R1 entre el nmero
de observaciones que tiene n1.
3. Se calcula el valor del estadstico H (o KW) mediante la siguiente frmula:

4 Se obtiene el valor esperado de H (Ht) de la tabla de valores crticos de H considerando el


nmero de muestras (k) y el tamao de cada una de ellas (n) para un nivel de significacin
particular.
REGLA DE DECISIN
Si Ho Ht Rechazamos la Ho
4.
Calcular la diferencia crtica (DC). Si el tamao de las muestras es igual slo se calcula una
diferencia crtica, si el tamao es diferente se calcula la diferencia crtica correspondiente a cada par.

Zk(k-1) se obtiene de la tabla AII intersectando el nmero de comparaciones calculado en el paso 1


con el nivel de significancia especificado.
6. Comparar la diferencia de los rangos promedio con la diferencia crtica. La diferencia
observada en el par comparado es significativa si es mayor o igual a DC.
7.

Determinar a favor de quin est la diferencia en el par comparado mediante la observacin


de sus rangos promedio.

EJEMPLO PARA MUESTRAS PEQUEAS


En una institucin educativa se ponen a prueba tres mtodos de enseanza para mejorar la ejecucin en
tareas de solucin de problemas matemticos, en alumnos de educacin media superior. Con tal fin se
asignan al azar 5 sujetos a cada uno de los tres mtodos. Al trmino de la implementacin de cada mtodo
cada sujeto resuelve un examen de problemas matemticos y se registra el nmero de respuestas
correctas (datos en la tabla 5). Usando un alfa igual a .05, determine si existen diferencias entre los

134

mtodos y cul de ellos es el que debe implementarse. Se sabe que la distribucin de los datos en cada
muestra no presenta normalidad.

SOLUCIN
Variable Independiente: Tipo de mtodo Contiene tres niveles: mtodo1, mtodo2, mtodo3
Variable Dependiente: Nmero de respuestas correctas en el examen

Paso 1. Establecerlas hiptesis aprobar

Paso 2. Elegir la prueba estadstica


Dado que nos interesa identificar si existe diferencias entre los grupos como resultado de la
intromisin de la variable independiente (tipo de mtodo), que tenemos una Variable Dependiente
(Nmero de respuestas correctas) continua en escala ordinal, tres muestras independientes y el
tamao de las muestras es igual a 5, aplicaremos la prueba de Kruskal-Wallis para muestras
pequeas.
Paso 3. Especificar alfa
Se emplear un = 0.05.

Paso 4. Regin de Rechazo


Dado que la Hiptesis alterna es sin direccin la Ho podr ser rechazada si el valor observado
cae en cualquiera de los extremos de la distribucin (Prueba Bilateral).
Paso 5. Decisin
Para obtener el valor observado de H y tomar la decisin estadstica se aplica el
procedimiento para muestras pequeas.
5.1 . Asignacin de rangos para todas las observaciones como si se tratara de una sola muestra.
Calcular en cada muestra la suma de rangos y el rango promedio.

135

5.3 Calcular H aplicando la frmula:


En este ejemplo podra aplicarse la frmula para las ligas ya que ms del 25% de los datos
estn ligados (hay 9 datos ligados de un total de 15 lo cual representa el 60%); sin embargo, los
valores de t son pequeos: existen 4 ligas, la primera con los puntajes de 5 con un valor de t=2
(el 5 aparece dos veces), la segunda con los puntajes de 7 con t=2 (el 7 aparece dos veces), la
tercera con los puntajes de 9 con t=3 (el 9 aparece tres veces) y la cuarta con los puntajes de
10 con t=2 (el 10 aparece dos veces). Debido a que los valores de t son tan pequeos el efecto de
las ligas resulta despreciable, por lo cual se aplicar la frmula sin datos ligados.

SUSTITUIMOS
5.3 Obtener el

5.4 Comparar el valor esperado contra el valor obtenido aplicando la regla de decisin
Si Ho Ht, Rechazamos Ho.
10.715 > 5.78
Dado que Ho es mayor a Ht rechazamos Ho

136

Decisin estadstica:
Dado que rechazamos Ho podemos decir que existen diferencias significativas entre los distintos
mtodos no atribuibles al azar (H= 10.715, 0.05).
Como Ho result significativa se procede a realizar comparaciones mltiples para determinar las
diferencias entre los pares de mtodos.
Paso 6. Comparaciones mltiples
8.1.

Determinar el nmero de comparaciones a realizar.

8.2.
Obtener la diferencia absoluta, es decir, haciendo caso omiso del signo, de los rangos promedio
en cada comparacin.

8.3.
Calcular la diferencia crtica (DC). Como el tamao de las muestras es igual slo se calcula
una diferencia crtica.

Z -1) se obtiene de la tabla A intersectando el nmero de comparaciones calculado en el paso 1 con


el nivel de significancia especificado. En este caso 3 comparaciones con un alfa de .05 para una prueba
bidireccional (slo se desea saber si hay diferencias entre los dos mtodos que se comparan, no se
especifica una direccin). (k-1) = 2.394
DC = 2.394< [(15(15+1))!12] (115 + 115) = 6.75
9. Comparar la diferencia de los rangos promedio con la diferencia crtica. La diferencia observada
en el par comparado es significativa si es mayor o igual a DC.
r

10. En el par comparado cuya diferencia result significativa determinar a favor de quin est la
diferencia mediante la observacin de sus rangos promedio.

Como la variable dependiente est medida como el nmero de respuestas correctas, un puntaje alto
indica un mejor desempeo, as el mtodo en el cual se encuentra un rango promedio alto indica
que fue ms efectivo para mejorar la ejecucin. La diferencia entre los rangos promedio del
mtodo 1 y el 3 result significativa siendo el mtodo 1 el que presenta un rango promedio ms

137

alto, por lo que puede decirse que este mtodo es ms efectivo que el mtodo3.

Conclusin
Existe evidencia estadstica que indica que hay diferencias significativas en el rendimiento en la
ejecucin de problemas matemticos segn el mtodo empleado, especficamente entre el
mtodo 1 y el mtodo 3, de los cuales el mtodo 1 es el ms efectivo, por lo que podra
decirse que ste es el ms conveniente para implementarse.

EJEMPLO PARA MUESTRAS GRANDES


Se realiz un estudio semejante al anterior y con el mismo propsito, slo que se emple una
muestra mayor de sujetos y se probaron 4 mtodos de enseanza en lugar de tres (datos en la tabla 7).
Participaron en el estudio 40 estudiantes de educacin media superior, 10 en cada mtodo. Con los
datos probar la Ho correspondiente.

SOLUCIN
Variable Independiente: Tipo de mtodo: Contiene cuatro niveles: mtodol, mtodo2, mtodo3,
mtodo4
Variable Dependiente: Nmero de respuestas correctas en el examen

Paso 1. Establecerlas hiptesis a probar

Paso 2. Elegir la prueba estadstica


Dado que nos interesa identificar si existe diferencias entre los grupos como resultado de la
intromisin de la variable independiente (tipo de mtodo), que tenemos una Variable Dependiente
(Nmero de respuestas correctas) continua en escala ordinal, cuatro muestras independientes y el
tamao de las muestras es igual a 10, aplicaremos la prueba de Kruskal-Wallis para muestras
grandes.

138

Paso 3. Especificar alfa


Se emplear un = 0.05.

Paso 4. Regin de Rechazo


Dado que la Hiptesis alterna es sin direccin la Ho podr ser rechazada si el valor observado
cae en cualquiera de los extremos de la distribucin (prueba Bilateral).

Paso 5. Decisin
Para obtener el valor observado de H y tomar la decisin estadstica se aplica el
procedimiento para muestras grandes.
10.1. Asignacin de rangos para todas las observaciones como si se tratara de una sola muestra. Calcular
en cada muestra la suma de rangos y el rango promedio.

5.2 Calcular H aplicando la frmula:


En este ejemplo se aplica la frmula para las ligas ya que el 95% de los datos estn ligados, adems
hay valores de t grandes (existe una t=11).

139

H = 2.487/.965= 2.569
5.4. Obtener el valor de Ht,a, n1, n2, n3, n4
Como n y k exceden los valores que se pueden consultar en la tabla para muestras pequeas, se
emplear la distribucin X Z con gl=k-1.

5.7 Comparar el valor esperado contra el valor obtenido aplicando la regla de decisin

Dado que Ho es menor X2 aceptamos Ho


Decisin estadstica:
Dado que aceptamos Ho podemos decir que no existen diferencias significativas entre los distintos
mtodos, es decir, que las diferencias observadas entre los datos son resultado de azar.
Como Ho result no significativa no se procede a realizar comparaciones mltiples para determinar las
diferencias entre los pares de mtodos.

Conclusin
No existe evidencia estadstica que sugiera que hay diferencias sign ificativas en el rendimiento en la
ejecucin de problemas matemticos segn el mtodo empleado, por lo que podra decirse que los
cuatro mtodos producen el mismo efecto en el rendimiento.
PROCEDIMIENTO DE CLCULO MEDIANTE EL PAQUETE SPSS (el procedimiento es el
mismo independientemente de/ nmero y tamao de las muestras)
A continuacin se presentan los pasos a seguir para obtener el estadstico de la prueba de KruskalWallis. Se tomar el ejemplo de muestras pequeas. Para la decisin estadstica se toma la regla
de decisin:
Si p(X2) < se rechaza la Ho

140

Paso 1 Se elabora la base de datos


Se definen dos columnas. Una de ellas se denomina grupos y se especifican los grupos de
pertenencia con los valores de 1 a k; la otra columna corresponde al puntaje de cada sujeto para
todos los grupos.
Definir variable grupo etiquetando debidamente y puntaje sin etiquetas. As la base de datos debe
tener una columna de grupos y otra de puntajes (la base de datos queda como en el caso de la
prueba U de Mann-Whitney, slo que en este caso son ms de dos grupos)

Paso 2 Obtener el estadstico


Desde el men
Statstcs
Nonpararnetrics test
K Independent Samples
En la ventana de la prueba se seala cual es la variable que se va a probar (en este caso puntaje)
y cual es la variable que corresponde a los grupos. Una vez
asignada la variable grupos en la ventana se activa un botn para definir los grupos (en
trminos de la etiquetacin que se asigno en la hoja de datos), se da un clic y se escribe
el nmero que corresponde al primer grupo y al ltimo grupo, Una vez definido lo
anterior se da un click a la opcin de la prueba de Kruskal-Wallis que aparece en el men
de pruebas y para finalizar Ok para que aparezca la hoja de resultados (Ver figura 6)

141

142

Paso 3 Tomar la decisin estadstica interpretando la hoja de resultados


Al aplicar la prueba de Kruskal-Wallis para comparar el nmero de respuestas correctas en el examen de
problemas matemticos entre los tres mtodos encontrarnos que es p(X2) < 0.05 por lo tanto se rechaza
la Ho.

Decisin Estadstica:
Dado que rechazamos Ho podemos decir que existen diferencias significativas entre los grupos
(X2 = 10.851, p = 0.004). Como se rechaza la Ho es necesario hacer comparaciones mltiples para
determinar entre que pares de grupos se encuentra la mayor diferencia. En vista de que el
programa no proporciona dicha informacin es necesario calcularlas a mano (ver seccin de
comparaciones mltiples).

Conclusin
Existe evidencia estadstica que indica que hay diferencias significativas en la ejecucin de
problemas matemticos segn el mtodo empleado.

143

Tabla 0. Valores crticos para el anlisis de varianza unifactorial por rangos de Crus kal-Wallis,
K-W.

144

Bibliografa
1. Aguilar, J. (Coord.). (1998). Manual de prcticas de estadstica. Mxico: Facultad de Psicologa,
UNAM.
2. Castillo, A. y Ojeda, M. (1994). Principios de estadstica no paramtrica. Mxico: Universidad
Veracruzana.
3. Daniel, W. (1978). Applied nonparametric statistics. Boston: Houghton Mifflin Company.
4. Daniel, W. (1988). Estadstica con aplicaciones a las ciencias sociales y a la educacin. Mxico:
McGraw-Hill.
5. Downie, N. y Heath, R. (1986). Mtodos estadsticos aplicados. Mxico: Harla.
6. Freund, J. y Simon, G. (1994). Estadstica elemental, 8a. ed. Mxico: PearsonPrentilce-Hall.
7. Hopkins, K; Hopkins, B. R. y Glass, G. (1997) Estadstica bsica para las ciencias sociales y del
comportamiento. Mxico: Prentice-Hall Internacional.
8. Pagano, R. (1999) Estadstica para las ciencias del comportamiento. Mxico:
Thomson Internacional.
9. Siegel, S y Castellan,, N. J. (1995) Estadstica no paramtrica aplicada a las ciencias de la conducta.
Mxico: Trillas
10. Runyon, R. y Haber, A. (1984) Estadstica para las ciencias sociales. Mxico: Fondo Educativo
Interamericano.
11. Weimer, R. (1999). Estadstica, 2a. reimpresin. Mxico: C.E.C.S.A.

145

Presentacin
El siguiente manual tiene como propsito presentar en forma resumida la lgica de aplicacin
de algunas pruebas no paramtricas para determinar la existencia de asociacin entre dos
variables y sus procedimientos de clculo mediante las ecuaciones correspondientes y va el
paquete estadstico SPSS.
No pretendemos ser exhaustivos en la revisin de todos los procedimientos, sino que se
abarcan aquellos que corresponden a la asignatura de Estadstica en el tercer semestre de la
carrera de Psicologa impartida en la Facultad de Psicologa de la UNAM.
Las pruebas que se presentan son la X2 como prueba de independencia y varios coeficientes
de correlacin que permiten al investigador saber si existe asociacin entre dos variables y
cun fuerte es esa asociacin. La tcnica de X2 no es proporciona una medida de correlacin,
ya que su valor no indica la magnitud ni la direccin de la relacin, pero es de utilidad para
saber, en primera instancia, si hay asociacin o no entre variables nominales.
La correlacin se ocupa de establecer la existencia de una relacin entre dos variables, as
como de determinar su magnitud o direccin. La magnitud se refiere a la fuerza o grado de
la asociacin indicado por un valor, llamado coeficiente, que oscila entre 0 y 1:
Nula = 0, no hay correlacin entre las variables.
Dbil = .10
Moderada =. 50
Fuerte = .95
Perfecta = 1, las variables se asocian perfectamente
La direccin indica si se trata de una relacin positiva (conforme los valores de una variable
aumentan los de la otra tambin) o negativa (conforme los valores de una variable aumentan
los de la otra disminuyen). As, el coeficiente de la correlacin puede tener un signo + o un
signo -.

Exceptuando el coeficiente de correlacin de Pearson, el cual est incluido en la estadstica


paramtrica, pero se incluye en este material por su relacin con el tema. z L a elaboracin de
este material se deriv de la revisin; de distintas fuentes bibliogrficas.
Es importante destacar que los procedimientos estadsticos presentados no establecen
determinantes causales entre las variables, sino que slo nos descartar al azar como explicacin
de la relacin encontrada.
Esperamos que este material sea til para comprender procedimientos no paramtricos y su
adecuada aplicacin en el anlisis de datos.

146

Prueba x2 como prueba independencia


OBJETIVO
Identificar si existe relacin estadsticamente significativa entre dos variables categricas.
La lgica de la prueba implica identificar si la diferencia entre la FE y la FO de cada una de las
categoras es significativa como resultado de la asociacin entre las dos variables, es decir, qu
frecuencias se esperara que ocurrieran si no existiera asociacin entre las dos variables, as
mientras mayor sea la discrepancia entre las frecuencias esperadas y las observadas existe
mayor grado de asociacin entre variables.
SUPUESTOS
1. Muestreo aleatorio
2. Distribucin normal de los datos
3. Dos variables categricas con escala de medida nominal
4. Muestras grandes (n 30)
5. FE >5
TIPO DE HIPTESIS A PROBAR
Ho: No existe relacin estadsticamente significativa entre las variables
Hi: Si existe relacin estadsticamente significativa entre las variables
DISTRIBUCIN MUESTRAL
Distribucin X2 que proporciona los valores esperados con gI = (c - 1)(r - 1) (Donde c es el
nmero total de columnas y r el nmero total de renglones) de acuerdo con la lgica de la
distribucin normal
TIPO DE DATOS
Frecuencias de casos observados en cada categora propia de las variables medidas. Cada
variable debe incluir por lo menos dos categoras mutuamente excluyentes.
PROCEDIMIENTO DE CALCULO MANUAL DEL ESTADISTICO X2.
Las frecuencias observadas se vacan en una tabla de contingencias que mnimamente debe ser
de cuatro entradas.

147

REGLA DE DECISIN

Se emplea la tabla de valores crticos de X2 para obtener el valor de X2t, considerando la


interseccin en la tabla de los de grados de libertad y el nivel de significacin. Para obtener la
p(X2o) se considera el valor de la X2o o una aproximacin de la misma en relacin con los
grados de libertad, la columna de a en donde se ubique el valor observado corresponder a la
probabilidad de ocurrencia de dicho valor.
EJEMPLO
Se intenta identificar si la adiccin juvenil a cualquier tipo de estupefacientes est
directamente relacionado con las caractersticas de la comunidad (marginada y no marginada).
Para este fin se encuest a una muestra tomada en forma aleatoria de 480 jvenes entre los 16
y los 21 aos de edad de diferentes escuelas pblicas del D. F. y el rea metropolitana. Los
datos proporcionados permitieron identificar si los estudiantes eran o no adictos y a que tipo de
comunidad pertenecan.
Con los datos probar la hiptesis de que s existe relacin significativa entre las variables.

148

SOLUCIN
Variable 1: Adiccin juvenil
Categoras: Ausencia y presencia
Variable 2: Caractersticas de la comunidad Categoras: Marginada y No marginada
Paso 1. Establecer las hiptesis a probar
Ho: No existe relacin significativa entre las variables
Hi Si existe relacin significativa entre las variables
Paso 2. Elegir la prueba estadstica
Dado que nos interesa identificar si existe relacin entre la adiccin juvenil a cualquier
estupefaciente y las caractersticas de la comunidad, los datos son nominales, la muestra es
mayor a 30 por loo que se asume que su distribucin es normal, fue tomada de forma aleatoria,
y ninguna de las FE es menor a 5, se aplicar la prueba X2 como prueba de independencia
Paso 3. Especificar alfa
Se emplear un = 0.05 tomando en consideracin que tenemos una muestra de tamao
480.
Paso 4. Regin de Rechazo
Dado que la Hiptesis alterna es sin direccin la Ho podr ser rechazada el valor observado cae
en cualquiera de los extremos de la distribucin.
Paso 5. Decisin
Para obtener el valor observado de X2 y tomar la decisin estadstica se aplica el procedimiento
con la frmula de X2.
5.1. Agrupar las frecuencias observadas en una tabla de contingencias y calcular las
frecuencias esperadas

149

Al aplicar esta frmula no es necesario el clculo de las FE ms que para garantizar que no
existen FE menores a 5 (lo cual estar en duda slo si tenemos FO pequeas)

5.4 Comparar el X2o observado y un valor esperado aplicando la rega de decisin

.
Dado que
(31.845)> X2t (3.841) con un 0,05, gl=1, podemos rechazar la Ho y aceptar la
Hi, la probabi!idad asociada al valor observado de Ji cuadrada es menor a 0.01 mucho menor
que el alfa elegido.
X2 o

150

Decisin estadstica:
Dado qua rechazamos Ho podemos decir que si existe relacin significativa entre las variables
(X2o = 31.845; =0.05. g! 1 o bien, X2= =31.845. g!=1. p<.01)
Conclusin:
Existe suficiente evidencia estadstica para considerar que la adiccin juvenil a cualquier
estupefaciente est directamente relacionada con las caractersticas de a comunidad sea sta
marginada o no marginada.
PROCEDIMIENTO DE CALCULO MEDIANTE EL PAQUETE SPSS.
A continuacin se presentan los pasos a seguir para obtener el estadstico de la prueba de X2 de
independencia. Para la decisin estadstica se torna la regla de dedsin: Si p(X2o, gl)
Rechazamos Ho
Como los datos se presentan en una tabla de contingencias deben crearse tres columnas, una
para la variable 1 otra para la variable 2 y una tercera para las frecuencias observadas. Para las
variables es conveniente definir tambin sus categoras. La definicin de las variables y
frecuencias se realiza como se indica a continuacin.
Data
Define variable: en esta defines la siguiente nformacin:
Variable name: nombra la variable 1, adiccin, juvenil, empleando un mximo de
8 caracteres. En este caso la variable se denominar adic,
Labels: Para activa,, esta ventana das clic en e! botn Labels de la ventana
Define Variable. En este submen capturas el nombre de !a variable en
Label (aqu puedes poner el nombre completo usando ms de ocho
caracteres), Para definir sus categorias, en el recuadro Value capturas el
valor 1 y en el recuadro Value label escribes adicto. Das clic en Add.
Posteriormente capturas el valor 2 y escribes no adicto (y as sucesivamente
hasta capturar todas las categoras). Das clic en Continue. Para cerrar la
ventana Define Variable das clic en OK
La figura muestra como se define !a variable junto con sus categor1as.

151

Defines la variable caractersticas de la comunidad de la misma forma que la variable


adiccin juvenil, incluyendo sus categoras. Ver figura arriba.
Define la variable frecuencias escribiendo slo su nombre en Variable name (recuerda que
slo puedes usar 8 caracteres). Ver figura

Una vez definidas las variables se teclearn los valores conforme a la tabla de contingencia,
Para capturar los datos de la primera celda (c11) escribiramos 1 en la columna adic, 1 en la
columna comuna y 125 en la columna frec; con esto indicamos que en la primera celda hay
125 sujetos que son adictos y que viven en una comunidad marginada, Para la segunda
celda (c12) sera 1, 2, 183, indicando que hay 183 sujetos que son adictos y que viven en
una comunidad no marginada; y as sucesivamente hasta terminar con todas las celdas. Ver
figura.
152

Paso 2. Ponderar frecuencias.


Antes de proceder a rea!izar e! anlisis hay que hacer un paso previo, el cual
consiste en indicarle al programa que se analizarn las frecuencias (Ver figura) La secuencia
de indicaciones es:
Data
WeIght cases: en esta ventana hay que indicar Weight cases: dar un clic en,
e! circulo para activarlo,. Frecuency variable: pasa la variable FREC. Dar clic en OK.

153

Paso 3. Obtener el estadstico.


Una vez que se ha hecho la indicacin mencionada se procede a correr el anlisis siguiendo
la ruta:
Statistics (o Analize, segn la versin de SPSS).
Summarize
Crosstabs (ver figura).

En le ventana Crosstabs seleccionar las variables de los renglones, en este caso adcc, y
pasarla al recuadro Row(s) dando clic en el botn que est enmedio de ambos recuadros.
Posteriormente seleccionar la variable de la columna, comuna, y pasarla al recuadro
Colum(s). Ver figura.

154

Una vez seleccionadas las variables dar clic en el botn Statistics que aparece en esta
misma ventana para abrirla y seleccionar Chi-square, dando clic en la opcin que
corresponde a este coeficiente (ver figura arriba) Dar clic en Continue para regresar a la
ventana anterior y luego dar clic en OK para correr el anlisis.
Paso 4. Tomar la decisin estadstica interpretando la hoja de resultados.
Una vez dadas las indicaciones para correr el anlisis se despliega una hoja de resultados
(Output) que muestra los datos correspondientes a la prueba realizada. Con base en la
informacin presentada se toma la decisin estadstica.
HOJA DE RESULTADOS (OUTPUT)

155

El valor de X2 es igual a 31.845 cuya probabilidad asociada es .000, (X2 =31.845, gl=1,
p=.000), la cual es contrastada con el alfa de .05 indicada en el ejemplo. Aplicando la
regla de decisin:

Conclusin
Dado que rechazamos Ho podemos decir que existe suficiente evidencia estadstica,
paro considerar que la adiccin juvenil a cualquier estupefaciente est directamente
relacionada con las caractersticas de la comunidad sea sta marginada o no
marginada.
156

TABLA F Distribucin ji-cuadrada (x2)

157

Coeficiente de correlacin Phi (r)


OBJETIVO
Identificar si existe relacin estadsticamente significativa entre dos variables dicotmicas, as
como la magnitud de esa relacin.
SUPUESTOS
1.
2.
3.
4.

Variables discretas-dicotmicas
Escala nominal
Muestreo aleatorio
Muestras grandes (N 30)
TIPO DE DATOS

Frecuencia de observacin en cada una de las categoras de las variables.


PROCEDIMIENTO DE CALCULO MANUAL DEL COEFICIENTE PHI.
Las frecuencias observadas se vacan en una tabla de contingencias de cuatro entradas, en la
cual se indican los totales marginales por columna y por rengln, as como el total de casos
observados.

PRUEBA DE SIGNIFICANCIA DEL COEFICIENTE

El coeficiente por s mismo no indica si existe asociacin o no entre las variables, para ello es
necesario obtener su significancia usando el estadstico X2, incluyendo los siguientes elementos:
TIPO DE HIPOTESIS A PROBAR
Ho: No existe relacin estadsticamente significativa entre las variables
Hi: Si existe relacin estadsticamente significativa entre las variables
DISTRIBUCIN MUESTRAL
Se utiliza la distribucin X2 que proporciona los valores esperados para todas las muestras
158

posibles obtenidas en forma aleatoria, con gl = (c - 1)(r - 1), donde c es el nmero total de
columnas y r el nmero total de renglones.

Se emplea la tabla de valores crticos de X2 para obtener el valor de X2t, con gl = 1 y el


respectivo nivel de significacin, o su p(X2o).
EJEMPLO
Se intenta identificar si la adiccin juvenil a cualquier tipo de estupefacientes est directamente
relacionado con las caractersticas de la comunidad (marginada y no marginada). Para este fin
se encuest a una muestra tomada en forma aleatoria de 480 jvenes entre los 16 y los 21
aos de edad de diferentes escuelas pblicas del D. F. y el rea metropolitana. Los datos
proporcionados permitieron identificar si los estudiantes eran o no adictos y a qu tipo de
comunidad pertenecan.
Con los datos identificar si existe relacin entre las variables, y cul es la magnitud de esa
relacin.
Datos

Solucin
Vahmble X: ei tipo de comunidad: marginada, no marginada
Variable Y: Presencia o ausencia de adiccin
Paso 1. Elegir la prueba estadstica
Dado que nos interesa identificar no slo la existencia de relacin entre la adiccin juvenil a
cualquier estupefaciente y las caractersticas de la comunidad sino tambin su magnitud, los
datos son dicotmicos, la muestra es mayor a 30 y a!eatoria, se calcular el coeficiente Phi se
probar su significancia con el estadstico X2.
Paso 2. Construir la tabla de contingencia

159

Paso 4. Obtener su significancia


4.1. Establecer las hiptesis a probar
Ho: La relacin entre las variables no es significativa
Hi La relacin entre las variables es significativa
Paso 4.2. Especificar alfa
480.

Se emplear un = 0.05 tomando en consideracin que tenemos una muestra de tamao

Paso 4.3. Regin de Rechazo


Dado que la hiptesis alterna es sin direccin la Ho podr ser rechazada si el valor
observado de X2` cae en cualquiera de los extremos de la distribucin.
Paso 4.4. Calcular el valor de X2

160

Paso 4.5. Decisin

Para tomar la decisin se calcula el valor de tablas de X2 y se aplica el criterio elegido. Dado que
X2o (30.77) > X2t (3.841) con un
Ho y aceptar la Hi; la
probabilidad asociada al valor observado de ji cuadrada es menor a .01, mucho menor que el
alfa elegido.
Conclusin:
Con los datos de esta muestra se observ una correlacin significativa entre la presencia o
ausencia de la adiccin y el tipo de comunidad (X2 = 30.77; gl = 1 y = 0.05), dicha correlacin
fue baja entre (.257). Lo anterior implica que el tipo de comunidad marginada o no marginada
no define en un alto porcentaje la presencia o ausencia de la adiccin (posiblemente existan
variables de mayor relacin).
PROCEDIMIENTO DE CALCULO MEDIANTE EL PAQUETE SPSS.
Paso 1 a 3. Elaboracin de la base de datos, ponderacin de frecuencias y seleccin del
coeficiente.
Como los datos se presentan en una tabla de contingencias se sigue el, mismo
procedimiento descrito para la X2 como prueba de independencia para capturar la base de
datos, ponderar las frecuencias y seleccionar las variables en la ventana de Crosstabs.
Una vez seleccionadas las variables en la ventana Crosstabs dar clic en el botn
Statistics que aparece en esta misma ventana para abrirla y seleccionar el coeficiente Phi,
dando clic en la opcin que corresponde a este coeficiente (ver figura 1). Dar clic en Continue
para regresar a la ventana anterior y luego dar clic en OK para correr el anlisis.

161

Paso 4, Tornar la decisin estadstica interpretando la hoja de resultados.


Una vez dadas las indicaciones para correr el anlisis se despliega una hoja de resultados
(Output) que muestra los datos correspondientes a la prueba realizada. Con base en la
informacin presentada se toma la decisin estadstIca.
El valor del coeficiente Phi es igual .258 cuya probabilidad asociada es (r =.2588, p=:000), la
cual es contrastada con el 'alfa de .05 indicada en el ejemplo.
Aplicando la regia de decisin:

Conclusin:
Con los datos de esta muestra se observ una correlacin significativa baja entre la presencia o
ausencia de la adiccin y el tipo de comunidad (r =.258, p=.000). Lo anterior implica que el
tipo de comunidad marginada o no marginada no define en un alto porcentaje la presencia o
ausencia de la adiccin (posiblemente existan variables de mayor relacin).
HOJA DE RESULTADOS (OUTPUT)

162

La hoja de resultados presenta tres tablas, la primera da informacin sobre el nmero total de
casos vlidos y faltantes, en este caso tenemos todos los casos vlidos, 480 (100%). La
segunda tabla corresponde a la tabla de contingencia capturada, si los datos se metieron de
manera correcta, esta tabla debe ser idntica a la original. La tercera tabla proporciona el valor
del coeficiente Phi en la columna Value y su probabilidad asociada en la columna Approx. Sig.,
.258 y .000, respectivamente.

163

Coeficiente de correlacin V de Cramr


OBJETIVO
Identificar el grado de asociacin entre dos variables categricas en una tabla de
contingencia de r x c, en donde las variables consisten en series no ordenadas de categoras.
SUPUESTOS
1.
2.
3.
4.

Variables con escala de medida nominal (x, y),


Muestreo aleatorio.
Muestras grandes (n 30)
FE >5

TIPO DE DATOS
Frecuencias de casos observados en cada categora propia de las variables medidas. Cada
variable debe incluir por lo menos dos categoras mutuamente excluyentes.
PROCEDIMIENTO DE CALCULO MANUAL DEL COEFICIENTE V DE CRAMER.
Las frecuencias observadas se vacan en una tabla de contingencias que mnimamente debe ser
de cuatro entradas (dos categoras para cada variable) siguiendo la misma estructura para la
prueba de X2.
TABLA DE CONTINGENCIA

1. Calcular las frecuencias esperadas en cada una de las celdas multiplicando los totales
marginales comunes a cada celda y dividiendo este producto por el nmero total de casos, N;
(c11 = TMR1 x TMC1/N, c12 = TMR1 x TMC2/N, c1n= TMR1 x TMCn/N, etc,).

164

2. Calcular el valor de X2, Para tablas de 2 x 2

Para tablas de r x c, donde r y/o c son 2

3. Calcular el valor del coeficiente V de Cramr. Este coeficiente asume valores que van de 0 a
1.

PRUEBA DE SIGNIFICANCIA DEL COEFICIENTE


Para probar que la asociacin entre las variables es significativa se usa el valor calculado de X2.
TIPO DE HIPTESIS A PROBAR
Ho: No existe relacin estadsticamente significativa entre las variables Hi: Si existe relacin
estadisticamente significativa entre las variables
DISTRIBUCIN MUESTRAL
Para probar la significacin de la asociacin se utiliza la distribucin X2 que proporciona los
valores esperados para todas las muestras posibles obtenidas en forma aleatoria, con gl = (c 1)(r - 1), donde c es el nmero total de columnas y r el nmero total de renglones.
165

REGLA DE DECISIN

Se emplea la tabla de valores crticos de X2 para obtener el valor de X2t, con gl = 1 y el


respectivo nivel de significacin, o su p(X2o).
EJEMPLO
En un estudio sobre psicologa social se cree que existe una relacin entre el ser prejuicioso o
no y el nivel de escolaridad. Para probar tal suposicin se tom una muestra aleatoria de 164
sujetos a quienes se aplic un cuestionario para evaluar su nivel de prejuicio (alto, medio, bajo)
y se obtuvo su mximo nivel de estudios (primaria, secundaria, tcnico, preparatoria,
licenciatura, posgrado), y se clasificaron en funcin de estos dos criterios. Con los datos
obtenidos se quiere determinar el grado de asociacin entre las dos variables usando un alfa de
.05.
SOLUCIN
Variable 1: nivel de prejuicio, con tres categoras: alto, medio, bajo.
Variable 2: escolaridad, con 6 categoras: primaria, secundaria, tcnico, preparatoria,
licenciatura, posgrado.
Paso 1. Elegir la prueba estadstica
Dado que nos interesa identificar no slo la existencia de relacin entre el grado de prejuicio y
el nivel de escolaridad adiccin, sino tambin su magnitud, los datos son nominales, la muestra
es mayor a 30 y aleatoria, y ninguna de las FE es menor a 5, se calcular el coeficiente V de
Cramr y se- probar su significancia con el estadstico :X2 .
Paso 2. Construir la tabla de contingencia

Agrupar las frecuencias observadas en una tabla de contingencias.


Paso 3. Calcular el coeficiente V de Cramr
3.1. Clculo de las FE

166

3.2. Obtener el estadstico X2

Paso 4. Obtener su significancia


4.1. Establecer las hiptesis a probar
Ho: La relacin entre as variables no es significativa
Hi La relacin entre las variables es significativa
Paso 4.2. Especificar alfa
164.

Se emplear un = 0.05 tomando en consideracin que tenemos una muestra de tamao

Paso 4.3. Regin de Rechazo


Dado que la hiptesis alterna es sin direccin la Ho podr ser rechazada si el valor
observado de X2` cae en cualquiera de los extremos de la distribucin.
Paso 4.5. Decisin
Para tomar la decisin se compara el valor de X2 calculado con el valor de tablas de X2 y se
aplica el criterio elegido.

167

Dado que X2o (65.41) > X2t (3.841) con un 0.05, gl=10; podemos rechazar la Ho y aceptar la
Hi; la probabilidad asociada al valor observado de ji cuadrada es menor a .01, mucho menor
que el alfa elegido.
Conclusin:
Existe suficiente evidencia estadstica para considerar que el nivel de escolaridad est
directamente relacionado con el ser prejuicioso, (V=.446, X2= 65.41; gI = 10 y = 0.05). La
correlacin entre ambas variables es moderada, y observando las frecuencias vemos que a
mayor escolaridad s es menos prejuicioso.
PROCEDIMIENTO DE CALCULO MEDIANTE EL PAQUETE SPSS.
Paso 1 a 3. Elaboracin de la base de datos, ponderacin de frecuencias y seleccin
de coeficiente.
Como los datos se presentan en una tabla de contingencias se sigue el mismo procedimiento,
descrito para la X2 corno prueba de independencia para capturar la base de datos (ver
figura).ponderar las frecuencias y se!eccionar las variables en la ventana de Crosstabs.
Una vez seleccionadas las variados en a ventana Crosstabs dar clic en el botn Statistics
que aparece en esta misma ventana para abrirla y seleccionar el coeficiente Cramrs V, dando
clic en la opcin que corresponde a este coeficiente (ver figura). Dar clic en Continue para
regresar a la ventana anterior y luego dar clic en OK para correr el anlisis.

168

HOJA DE RESULTADOS (OUTPUT)

La hoja de resultados presenta tres tablas, la primera da informacin sobre el nmero total de
casos vlidos y faltantes, en este caso tenemos todos los casos vlidos, 164 (100%). La
segunda tabla corresponde a la tabla de contingencia capturada, si los datos se metieron de
manera correcta, esta tabla debe ser idntica a la original. La tercera tabla proporciona el valor
del coeficiente V de Crmer en la columna Value y su probabilidad asociada en la columna
Approx. Sig., .447 y .000, respectivamente.

169

Paso 4. Tomar la decisin estadstica interpretando la hoja de resultados.


El valor del coeficiente V de Crmer es igual a .447 cuya probabilidad asociada es .000,
(V=.447, p=.000), la cual es contrastada con el alfa de .05 indicada en el ejemplo. Aplicando la
regla de decisin:

Tenemos que . 000 < .05, por lo que rechazarnos Ho.


Conclusin:
Existe suficiente evidencia estadstica para considerar que el nivel de escolaridad est
directamente relacionado con el ser prejuicioso, V=.447, p=.000). la correlacin entre ambas
variables es moderada, y observando las frecuencias vemos que a mayor escolaridad se es
menos prejuicioso.

170

COEFICIENTE DE CORRELACIN BISERIAL PUNTUAL


OBJETIVO
Identificar el grado de asociacin entre dos variables, una nominal con dos categoras
(dicotmica) y otra intervalar. Este coeficiente es de gran utilidad para validar reactivos de
pruebas y puede asumir valores entre -1 a 1.
SUPUESTOS
1. Una variable con escala de medida nominal, dicotmica por naturaleza.
2. Una variable con escala de medida intervalar.
3. Muestreo aleatorio.
TIPO DE DATOS
Clasificacin de los sujetos en la variable dicotmica, puntajes individuales en la variable
intervalar.
PROCEDIMIENTO DE CALCULO MANUAL DEL COEFICIENTE BISERIALPUNTUAL.
1. Los datos se arreglan en una tabla de dos columnas, una contiene los datos de la variable
intervalar y la otra los de la variable dicotmica.
2. Para cada una de las categoras de la variable nominal se calcula la media correspondiente
en la variable intervalar.
3. Se determina el valor de n (nmero de casos) en cada categora.
4. Se calcula la desviacin estndar para todos los casos en la variable intervalar, (x- x)2/N 1, donde N es el nmero total de casos. Para aplicar esta ecuacin hay que calcular la media de
todos los puntajes.
5. Se calcula el coeficiente biserial-puntual con la siguiente ecuacin:

171

PRUEBA DE SIGNIFICANCIA DEL COEFICIENTE


Se determina la significancia del coeficiente empleando el estadstico t de Student.
TIPO DE HIPTESIS A PROBAR
Ho: No existe relacin estadsticamente significativa entre las variables
Hi: Si existe relacin estadsticamente significativa entre las variables
DISTRIBUCIN MUESTRAL
Para probar la significacin de la asociacin se utiliza la distribucin t de Student que
proporciona los valores esperados para todas las muestras posibles obtenidas en forma
aleatoria, con gl = N-2 donde N es el nmero total de pares x,y.
FORMULA

REGLA DE DECISION

Se emplea la tabla de valores crticos de t de Student para obtener el valor de tt, con gl = n-2 y
el respectivo nivel de significacin, o su p(to, gI).
EJEMPLO
En un estudio sobre psicologa de la salud se desea saber si existe relacin entre el sexo y la
ansiedad. Para ello se us una muestra de 14 sujetos, 6 mujeres y 8 hombres, cuya ansiedad
fue medida con una escala tipo Likert, en la que un puntaje alto indica mayor ansiedad. Con un
alfa de .05 determinar el grado de asociacin entre las variables,

172

SOLUCIN
Variable X: sexo: hombre, mujer
Variable Y: puntaje de ansiedad
Paso 1. Elegir la prueba estadstica
Dado que nos interesa identificar no el grado de asociacin entre una variable dicotmica,
sexo, y una variable intervalar, puntaje de ansiedad, y la muestra es aleatoria, se calcular el
coeficiente biserial-puntual y se probar su significancia con el estadstico t de Student.
Paso 2. Arreglar los datos en una tabla con la codificacin de la variable dicotmica
Con fines de codificacin de los datos, a los hombres se les asign el valor de 0 y a las mujeres
el valor de 1.

Paso 3. Calcular el coeficiente biserial-puntual


X0 = media de la categora mujeres (1) = 38.15
X1 = media de la categora hombres (0) = 23.88
n1 = nmero de casos en la categora 1 = 6
173

nQ= nmero de casos en la categora 2 = 8


n = nmero total de casos en la muestra =14
sX= desviacin estndar de todos los puntajes = (x- x)2/N -1 = 19.48

Paso 4. Obtener su significancia


4.1. Establecer las hiptesis a probar
Ho: La relacin entre las variables no es significativa
Hi La relacin entre las variables es significativa
Paso 4.2. Especificar alfa
Se emplear un = 0.05.
Paso 4.3. Regin de Rechazo
Dado que la hiptesis alterna es sin direccin la Ho podr ser rechazada si el valor
observado de t cae en cualquiera de los extremos de la distribucin.
Paso 4.4. Calcular el valor de t

Paso 4.5. Decisin


Para tomar la decisin se calcula el valor de tablas de t y se aplica el criterio elegido.

Como la prueba es bidireccional, en la tabla de t se identifica el alfa de .05 correspondiente a


pruebas de dos colas, tt, .05, 12 = 2.179

174

Dado que to (1.37) < tt (2.179) con un 0.05, gl=12; podemos aceptar la Ho y rechazar la Hi;
la probabilidad asociada al valor observado de t es mayor a .10, mucho mayor que el alfa
elegido.
Conclusin:
No existe evidencia estadsticamente significativa para afirmar que la ansiedad se asocia con el
sexo (r=,37, to = 1.37; gl = 10 y = 0.05).
PROCEDIMIENTO DE CALCULO MEDIANTE EL PAQUETE SPSS.
Este coeficiente puede calcularse a travs del coeficiente Eta, el cual tambin analiza la relacin
entre una variable intervalar y una nominal pero a diferencia de la biserial puntual, la variable
nominal tiene ms de dos categoras. Adems el coeficiente Eta asume que hay una variable
independiente y otra dependiente.
Paso 1. Elaboracin de la base de datos,
Definir dos columnas, una para la variable dicotmica Junto con sus categoras, y otra para la
variable intervalar. Los datos se capturan en forma de lista en !a variable correspondiente. Ver
figura.

Paso 2. Obtener el estadstico.


Una vez capturada la base se procede a correr el anlisis siguiendo la ruta:
Statistics (o Analize, segn la versin de SPSS).
175

Summarize
Crosstabs: pasar la variable intervalar en Row
Pasar la variable nominal en Column
Ver figura
En el submen Statistics de Crosstabs:
Marcar el coeficiente Eta (ver figura )
Dar clic en Continue
OK

Paso 3. Tomar la decisin estadstica interpretando la hoja de resultados.


Una vez dadas las indicaciones para correr el anlisis se despliega una hoja de resultados
(Output) que muestra los datos correspondientes a la prueba realizada. Con base en la
informacin presentada se toma la decisin estadstica.
HOJA DE RESULTADOS (OUTPUT)

176

El valor del coeficiente biserial-puntual es igual a .377, lo cual indicara que existe una
correlacin moderada entre el sexo y la ansiedad; sin embargo. el programa no muestra la
probabilidad asociada a este coeficiente, por lo tanto, hay que realizar la prueba de
significancia como se explica en la seccin correspondiente para determinar si le correlacin
es significativa o no.
En la prueba de significancia se obtuvo una p>.10 para un valor t-1.37, gl=12, la cual
contrastada con el alfa de .05 resulta mayor pues al aplicar la regla de decisin:

Tenemos que . 10 > .05, por lo que aceptamos Ho.


Conclusin
No existe evidencia estadsticamente significativa para afirmar que la ansiedad se asocia con
el sexo.

177

178

COEFICIENTE DE CORRELACIN R DE SPEARMAN


(RS)
OBJETIVO
Identificar si existe relacin estadsticamente significativa entre dos variables ordinales, as como
la magnitud de esa relacin.
SUPUESTOS
1. Variables continuas
2. Escala ordinal
3. Muestreo aleatorio
TIPO DE DATOS

Puntajes ordinales para las variables X y Y


PROCEDIMIENTO DE CALCULO MANUAL DEL COEFICIENTE rS DE SPEARMAN.
Construir una tabla de datos que incluya los siguientes elementos.
Calcular el coeficiente con alguna de las siguientes frmulas:

179

PRUEBA DE SIGNIFICANCIA DEL COEFCIENTE


Para muestras pequeas se determina la significancia del coeficiente empleando el estadstico t
de Student, para muestras grandes se utiliza la distribucin z.
TIPO DE HIPTESIS A PROBAR
Ho: No existe relacin estadsticamente significativa entre las variables
Hi: Si existe relacin estadsticamente significativa entre las variables
DISTRIBUCIN MUESTRAL
Para probar le significacin de la asociacin se utiliza la distribucin t de Student que
proporciona los valores esperados para todas las muestras pequeas posibles obtenidas en
forma aleatoria, con gl = N-2 donde N es el nmero total de pares x,y.
Para muestras grandes se sigue la lgica de la distribucin normal estndar.
FORMULA

REGLA DE DECISION
Muestras pequeas

Se emplea la tabla de valores crticos de t de Student para obtener el' valor de tt, con gl = n-2 y
el respectivo nivel de significacin, o su p(to, gl).
Muestras grandes

Se emplea la tabla de valores crticos de la distribucin normal estndar para obtener el valor de
zt con l respectivo nivel de significacin, o su p(z).
180

EJEMPLO (Muestras pequeas)


Se intenta identificar si existe relacin significativa entre el nivel de desempeo obtenido por
estudiantes del ltimo grado de secundaria y su calificacin en la prueba de seleccin para el
nivel bachillerato. Se tom una muestra aleatoria de 20 estudiantes de la Escuela Secundaria
nm. 23 del sur del D. F., a quienes se les aplic un inventario de desempeo que proporciona
datos ordinales de 0 a 120; posteriormente se les aplic una prueba similar al examen oficial de
ingreso a bachillerato cuyo mximo puntaje es de 160. Identificar el grado de correlacin entre
las variables
SOLUCIN
Variables:
Nivel de desempeo (X )
Calificacin en la prueba ( Y )
Paso 1. Elegir la prueba estadstica
Dado que nos interesa identificar el grado de asociacin entre el desempeo y la calificacin en
la prueba, los datos son ordinales y la muestra es aleatoria, se calcular el coeficiente de
correlacin de Spearman y se probar su significancia con el estadstico t ya que es una
muestra pequea (n=20).

Paso 3. Calcular el coeficiente


De acuerdo con los datos, como ningn valor se repite se emplea la ecuacin para datos no
ligados

181

Paso 4. Obtener su significancia


4.1. Establecer las hiptesis a probar
Ho: La relacin entre las variables no es significativa
Hi La relacin entre las variables es significativa
Paso 4.2. Especificar alfa
Se emplear un = 0.05.
Paso 4.3. Regin de Rechazo
Dado que la hiptesis alterna es sin direccin la Ho podr ser rechazada si el valor observado de
t cae en cualquiera de los extremos de la distribucin.
Paso 4.4. Calcular el valor de t Para muestras pequeas

Paso 4.5. Decisin


Para tomar la decisin se calcula el valor de tablas de t y se aplica el criterio elegido.

Como la prueba es bidireccional, en la tabla de t se identifica el alfa de .05 correspondiente


182

a pruebas de dos colas, tt, .05, 18 = 2.101


Si p (to, gl)

Ho

Dado que to (12.324) > tt (2.101) con un 0.05, gl=18; podemos rechazar la Ho y aceptar
la Hi; la probabilidad asociada al valor observado de t es menor a .0001, mucho menor que
el alfa elegido.
Conclusin:
En la muestra estudiada, existe un grado de correlacin significativa (to = 12.624; gl = 18 y
= 0.05) de 0.9479 entre el nivel de desempeo obtenido por estudiantes del ltimo grado
de secundaria y su calificacin en la prueba de seleccin para el nivel bachillerato. El valor
del coeficiente indica una correlacin alta y positiva entre las variables, es decir, que su
relacin es muy fuerte y que quienes muestran un mejor desempeo durante el tercer grado
de secundaria obtendrn un puntaje alto en la prueba de seleccin para bachillerato.
EJEMPLO (Muestras grandes)
El mismo estudio se aplic con otra muestra aleatoria de 33 estudiantes de la Escuela
Secundaria Tcnica # 41 del municipio de Tialnepantla. Identificar el grado de correlacin entre
las variables.
SOLUCIN
Variables:
Nivel de desempeo (X )
Calificacin en la prueba ( Y )
Paso 1. Elegir la prueba estadstica
Dado que nos interesa identificar el grado de asociacin entre el desempeo y la calificacin en
la prueba, los datos son ordinales y la muestra es aleatoria, se calcular el coeficiente de
correlacin de Spearman y se probar su significancia con el estadstico z ya que es una
muestra grande (n=33).

183

Paso 3. Calcular el coeficiente

184

Sustituir

Paso 4. Obtener su significancia


4.1. Establecer las hiptesis a probar
Ho: La relacin entre las variables no es significativa
Hi La re!acin entre las variables es significativa
Paso 4.2. Especificar alfa
Se empleara un = 0.05.
Paso 4.3. Regin de Rechazo
Dado que la hiptesis alterna es sin direccin la Ho podr ser rechazada si el valor observado
de z cae en cualquiera de los extremos de la distribucin.

185

Paso 4.4. Calcular el valor de z Para muestras grandes

Paso 4.5. Decisin


Para tomar la decisin se calcula el valor de tablas de z y se aplica el criterio elegido.

Como la prueba es bidireccional, para usar la tabla de z se divide el alfa de .05 entre dos, ya
que la tabla muestra slo un extremo, zt, .05/2 = 1 .96
Como la prueba es bidireccional, la probabilidad de z se multiplica por dos, ya que la tabla
muestra slo un extremo.

Dado que Zo (3.501) > zt (1.96) con un 0.05, podernos rechazar la Ho y aceptar la Hi; la
probabilidad asociada al valor observado de Z es .0004, mucho menor que el alfa elegido.
Conclusin:
En la muestra estudiada, existe un grado de correlacin significativa (zo = 3.501 y = 0.05) de
0.619 entre el nivel de desempeo obtenido por estudiantes dei ltimo grado de secundaria y
su calificacin en la prueba de seleccin para el nivel bachillerato. El valor del coeficiente indica
una correlacin moderada y positiva entre las variables, es decir, que su relacin no es tan
fuerte como el ejemplo anterior, pero si representa una magnitud de considerable importancia,
adems indica que quienes muestran un mejor desempeo durante el tercer grado de
secundaria obtendrn un puntaje alto en la prueba de seleccin para bachillerato.
PROCEDIMIENTO DE CALCULO MEDIANTE EL PAQUETE SPSS.
Paso 1. Elaboracin de la base de datos.
Para elaborar le base de datos se definen dos columnas, una por cada variable (sin etiquetas),
y los datos se capturan en forma de lista. Ver figura .

186

Paso 2. Obtener el estadstico.


Una vez capturada la base se procede a correr el anlisis siguiendo la ruta: Statistics (o Analize,
segn la versin de SPSS).
Correlate
Bivariate (ver figura)
En este submen se pasan las dos variables
Se da clic en Pearson para desmarcarlo y se da clic en Spearman para indicar
que es el coeficiente que se desea calcular.
Si la hiptesis alterna es bidireccional se deja la opcin Two-tailed, si es
unidireccional se selecciona One-tailed.
Se da clic en OK
Ver figura

187

Paso 3. Tomar la decisin estadstica interpretando la hoja de resultados.


Una vez dadas las indicaciones para correr el anlisis se despliega una hoja de resultados
(Output) que muestra los datos correspondientes a la prueba realizada. Con base en la
informacin presentada se toma la decisin estadstica.

188

HOJA DE RESULTADOS (OUTPUT)


Nonparametric Correlations

La hoja de resultados muestra las correlaciones entre todas las variables, incluyendo la
correlacin de la variable consigo misma, cuyo coeficiente es 1,00. Estos coeficientes de 1.00
dibujan una diagonal imaginaria dividiendo la tabla en dos tringulos, superior e inferior, en
cada uno de ellos se encuentra la misma informacin de las correlaciones calculadas. As, la
correlacin entre desempe y califica es la misma en ambos tringulos, por lo que da igual leer
uno u otro.
La correlacin entre el desempeo y la calificacin fue de .82 con una probabilidad asociada de
.000, rS 0.82, p=.000, aplicando la regla de decisin:

tenemos que . 000 < .05, por lo que rechazamos H0 lo cual indica que existe una correlacin
significativa entre las variables.
Conclusin:
En la muestra estudiada, existe una correlacin significativa (rs=.82, p=.000) entre el nivel de
desempeo obtenido por estudiantes del ultimo grado de secundaria y su calificacin en la
prueba de seleccin para el nivel bachillerato. El valor del coeficiente indica una correlacin alta
y positiva entre !as variables, es decir, que su relacin es fuerte, y que quienes muestran un
mejor desempeo durante el tercer grado de secundaria obtendrn un puntaje alto en la
prueba de seleccin para bachillerato.

189

APNDICE D TABLAS

190

191

192

193

194

COEFICIENTE DE CORRELACIN R DE PEARSON


OBJETIVO
Identificar si existe relacin estadsticamente significativa entre dos variables intervalares, as
como la magnitud de esa relacin.
SUPUESTOS
1. Variables continuas (con distribucin normal)
2. Escala intervalar
3. Muestreo aleatorio
TIPO DE DATOS
Puntajes intervalares para los eventos X y Y
PROCEDIMIENTO DE CALCULO MANUAL DEL COEFICIENTE r DE PEARSON.

Calcular el coeficiente
FORMULA (Considerando que son datos agrupados)

PRUEBA DE SIGNIFICANCIA DEL COEFICIENTE


Se determina la s!gnificancia del coeficiente empleando e! estadstico t de Student.
TIPO DE HIPTESIS A PROBAR
Ho: No existe relacin estadsticamente significativa entre las variables
Hi: Si existe relacin estadsticamente significativa entre las variables
DISTRIBUCIN MUESTRAL
Para probar la significacin de la asociacin se utiliza la distribucin t de Student que
195

proporciona los valores esperados para todas las muestras posibles obtenidas en forma
aleatoria, con gl = N-2 donde N es el nmero total de pares x ,y.
FORMULA

REGLA DE DECISION

Se emplea la tabla de valores crticos de t de Student para obtener el valor de tt, con gl = n-2 y
el respectivo nivel de significacin, o su p(to, gl).
EJEMPLO
Se intenta identificar si existe correlacin significativa entre el nivel de razonamiento verbal y el
nivel de razonamiento abstracto en nios de 6 de primaria. Para tal propsito se tom una
muestra aleatoria de 23 nios de la primaria pblica Justo Sierra a quienes se les aplic un
inventario que proporcionaba datos intervalares para ambas variables (puntaje mximo 50).
Identificar el grado de correlacin entre las variables.
SOLUCIN
Variables:
Razonamiento verbal (X )
Razonamiento abstracto ( Y )
Paso 1. Elegir la prueba estadstica
Dado que nos interesa identificar el grado de asociacin entre el razonamiento verbal y el
razonamiento abstracto, los datos son intervalares y la muestra es aleatoria, se calcular el
coeficiente de correlacin de Pearson y se probar su significancia con el estadstico t de
Student.
Paso 2. Construir tabla de datos
Suj

X2

Y2

XY

19

17

361

289

323

31

961

49

217

33

17

1089

289

561

44

28.5

1936

812.25

1254

25

27

625

729

675

35

31

1225

961

1085

34

20

1156

400

680

39

17

1521

289

663

196

44.56

45

1985.59

2025

2005.2

10

44

43

1936

1849

1892

11

24.5

10

600.25

100

245

12

37.5

28.5

1406.25

812.25

1065.75

13

24.6

13.45

605.16

180.25

330.87

14

40

43.2

1600

1866.24

1728

15

42

18

1764

324

756

16

32

16

1024

256

512

17

48

26

2304

676

1248

18

43

17.5

1849

306.25

752.5

19

33.5

36

1122.25

1296

1206

20

47

16

2209

256

752

21

38

37

1444

1369

1406

23

25

30

625

900

750

23

35.3

37.8

1246.09

1428.84

1334.34

EX=
818.96

EY= 581.95

EX2 = 30594.5936

EY 2= 17463.7325

EXY= 21441.66

197

Paso 4. Obtener su significancia


4.1. Establecer las hiptesis a probar
Ho: La relacin entre las variables no es significativa
Hi La relacin entre las variables es significativa
Paso 4.2. Especificar alfa
Se emplear un = 0.05.
Paso 4.3. Regin de Rechazo
Dado que la hiptesis alterna es sin direccin la Ho podr ser rechazada si el valor observado
de t cae en cualquiera de los extremos de la distribucin.
Paso 4.4. Calcular el valor de t

Paso 4.5. Decisin


Para tomar la decisin se calcula el valor de tablas de t y se aplica el criterio elegido.

Como la prueba es bidireccional, en la tabla de t se identifica el alfa de .05 correspondiente a


pruebas de dos colas, tt, .05, 21 = 2.080

Dado que to (1.78) < tt (2.080) con un 0.05, gl=21; podemos aceptar la Ho y rechazar la Hi;
la probabilidad asociada al valor observado de t es mayor a..10, mucho mayor que el alfa
elegido.
198

Conclusin:
No existe evidencia estadsticamente significativa para afirmar que el razonamiento verbal y el
razonamiento abstracto estn relacionados en los nios de 6 de primaria (r=.363, to = 1.78;
91 = 21 y . a = 0.05).
PROCEDIMIENTO DE CALCULO MEDIANTE EL PAQUETE SPSS.
Pasos 1 y 2. Elaboracin de la base de datos y seleccin dei coeficiente.
Para obtener el coeficiente de correlacin r de Pearson y su prueba de significancia se siguen
los mismos pasos que en el caso del coeficiente de Spearman, recordemos que se elabora la
base de datos definiendo una columna para cada una de las variables a correlacionar. Los pasos
para el estadstico son:
Statistics
Correlate Bivariante
Una vez en la ventana principal de las pruebas de correlacin, se sealan ambas
variables a correlacionar y se la un click a la opcin Pearson. Ver figura .

Paso 3. Tomar la decisin estadstica interpretando la hoja de resultados.


Una vez dadas las indicaciones para correr el anlisis se despliega una hoja de resultados
(Output) que muestra los datos correspondientes a la prueba realizada. Con base en la
informacin presentada se toma la decisin estadstica.

199

N es el total de caso evaluados


La correlacin entre el razonamiento verbal y el razonamiento abstracto fue de .36 con una
probabilidad asociada de .086, r=.36, p=.086, aplicando la regla de decisin:

tenemos que . 086 > .05, por lo que aceptamos Ho lo cual indica que no existe una correlacin
significativa entre las variables.
Conclusin:
No existe evidencia estadsticamente significativa para afirmar que el razonamiento verbal y el
razonamiento abstracto estn relacionados en los nios de 6 de primaria (r=.36, p=.086).

200

Coeficiente de concordancia de Kendall


OBJETIVO
Identificar el grado de asociacin entre k variables, con base en las ordenaciones asignadas a N
objetos (personas, reactivos, etc.).
Este coeficiente es de gran utilidad en la validez entre jueces y en estudios de agrupaciones de
variables.
El coeficiente de concordancia de Kendall asume valores de 0 a 1, donde 0 representa no
acuerdo entre las ordenaciones y 1, total acuerdo entre las ordenaciones.
SUPUESTOS
1. Variables con escala de medida ordinal.
2. Las ordenaciones deben ser independientes entre un juez y otro.
3. Muestreo aleatorio.
TIPO DE DATOS
Puntajes individuales en rangos para todas las variables.
PROCEDIMIENTO DE CALCULO MANUAL DEL COEFICIENTE DE CONCORDANCIA DE
KENDALL.
1. Los datos se arreglan en una tabla de k columnas que representan a los N objetos que se
ordenarn, y k renglones que representan a los jueces.
2. Se asignan rangos a cada uno de los N objetos de manera ascendente en cada uno de los
renglones de manera independiente (como en el caso de la prueba de Friedman). Al puntaje
ms bajo se le asigna el rango 1, al que le sigue el rango 2 y as sucesivamente, tomando en
consideracin las ligas.
3. Para cada columna se calcula la suma de los rangos.
4. Se calcula el coeficiente de concordancia con la siguiente ecuacin: Datos no ligados

donde:
R2 = suma de los rangos de la isima columna elevada al cuadrado
k = nmero de jueces
N= nmero de objetos ordenados

201

Datos ligados

donde:
t= nmero de datos ligados en el grupo que conforma la liga.
PRUEBA DE SIGNIFICANCIA DEL COEFICIENTE
La prueba de significancia se obtiene por medio de la X2
TIPO DE HIPTESIS A PROBAR
Ho: La correlacin entre las k variables no es significativa.
Hi: La correlacin entre las k variables es significativa.
DISTRIBUCIN MUESTRAL
Para probar la significacin de la asociacin se utiliza la distribucin W gl proporciona los
valores esperados para todas las muestras pequeas posibles obtenidas en forma aleatoria, con
N (objetos) y k (jueces).
Para muestras grandes se utiliza la distribucin X2 con gl= N-1, donde N = nmero de objetos
ordenados
Para muestras pequeas:
Se obtiene Wt con un valor de k y N dados, y un nivel de significacin especfico (.05, .01)
Para muestras grandes:
Se calcula el valor de X2 con la frmula

REGLA DE DECISION
Muestras pequeas Wo Wt se rechaza Ho
Muestras grandes
Se compara con X2 de tablas, con gl=N-1, donde N= nmero de objetos ordenados, si

EJEMPLO
Se pidi a tres ejecutivos que entrevistarn a seis candidatos para ocupar el puesto de gerente,
en donde evaluarn su grado habilidad para el puesto. A los puntajes originales se les asign el
202

rango correspondiente conforme al procedimiento indicado. Con los datos obtenidos se quiere
determinar el grado de acuerdo en el ordenamiento de los ejecutivos.
SOLUCIN
Variables:
No. de ejecutivos, considerados como jueces (X ): tres jueces
Grado de habilidad ( Y )
Paso 1. Elegir la prueba estadstica
Dado que nos interesa determinar el grado de acuerdo entre los ejecutivos, los cuales pueden
considerarse como jueces, los datos son ordinales dado que ya se les ha asignado los rangos y
la muestra es aleatoria, se calcular el coeficiente de concordancia de Kendall y se
probar su significancia con el estadstico W ya que es una muestra pequea (n=6).
Paso 2. Construir tabla de datos
Como ya se indic se hizo la asignacin de los rangos de la manera descrita y se obtuvo la
suma de los rangos para cada columna.

Paso 3. Calcular el coeficiente


Se aplicada frmula para datos no ligados.

Paso 4. Obtener su significancia


4.1. Establecerlas hiptesis a probar
203

Ho: La relacin entre las variables no es significativa


Hi La relacin entre las variables es significativa
Paso 4.2. Especificar alfa
Se emplear un = 0.05.
Paso 4.3. Regin de Rechazo
Dado que la hiptesis alterna es sin direccin la Ho podr ser rechazada si el valor observado
de W cae en cualquiera de los extremos de la distribucin.
Paso 4.4. Calcular el valor de W
Como la muestra es pequea se puede obtener W de tablas con k y N.
Wt, 3, 6, .05 = .660
Paso 4.5. Decisin
Wo Wt,

Rechazamos Ho .16 <.66

Dado que Wo (.16) < Wt (.66 con un k=3, N=6, 0.05; podemos aceptar la Ho y rechazar la
Hi.
Conclusin:
No existe acuerdo entre los jueces respecto a las asignaciones que hicieron de los
candidatos. (W=.16 < Wo =.66, k=3 N= 6, a = 0.05).
PROCEDIMIENTO DE CALCULO MEDIANTE EL PAQUETE SPSS.
Paso 1. Elaboracin de la base de datos.
Para capturar la base de datos los renglones de la hoja de clculo representan a los jueces
(k) y las columnas representan a los objetos ordenados (N). As se definen N columnas y en
los k renglones se capturan la ordenacin que dio cada juez a los objetos. El primer rengln
contiene la ordenacin del primer juez, el segundo rengln la ordenacin del segundo juez
y as sucesivamente. Ver figura 1.

204

Paso 2. Obtener el estadstico.


Una vez capturada la base se procede a correr el anlisis siguiendo la ruta:
Statistics
Nonparametrics tests
related samples (ver figura 2)
Se pasan todas las columnas definidas
Se da clic en Friedman para desmarcarlo y se da clic en Kendall's W
Ver figura

205

Paso 3. Tomar la decisin estadstica interpretando la hoja de resultados.


Una vez dadas las indicaciones para correr el anlisis se despliega una hoja de resultados
(Output) que muestra los datos correspondientes a la prueba realizada. Con base en la
informacin presentada se toma la decisin estadstica.

El acuerdo entre los ejecutivos presenta un valor del coeficiente W=.162 con una X2 =2.429,
g1=5, p=.787, aplicando la regla de decisin:
206

Si pspss>
Si pspss

Ho.

tenemos que .787 > .05, por lo que aceptamos Ho lo cual indica que no existe un acuerdo
significativo entre las ordenaciones que hicieron los ejecutivos.
Conclusin:
El valor de ji cuadrada no resulta significativo de acuerdo a la regla de decisin descrita, por lo
tanto, W=.16 no muestra evidencia estadsticamente significativa de que hay acuerdo entre los
ejecutivos.

207

Tabla 'I'. Valores crticos del coeficierne de acuerdos W de Kendall.*

208

También podría gustarte