Manual de Estadistica Aplicada A La Investigación Social
Manual de Estadistica Aplicada A La Investigación Social
Manual de Estadistica Aplicada A La Investigación Social
El estudio que se acaba de hacer en el Capitulo anterior sobre los conceptos y las tcnicas de la
estimacin puntual y por intervalos ha servido para empezar a familiarizarnos con la inferencia estadstica.
En el presente capitulo se va a considerar otro enfoque de la inferencia estadstica: la verificacin de
hiptesis. A pesar de que los temas referentes a la estimacin por intervalos y a la verificacin de
hiptesis se tratan aqu en captulos separados, no son cuestiones tan diferentes como lo podra
indicar esta forma de tratarlos. Ambas ideas se fundamentan en los conceptos de probabilidad y de
distribucin muestral que se estudiaron en los captulos anteriores. Ambos tambin hacen posible la
toma de decisiones acerca de una poblacin con base en la informacin contenida en una muestra de esa
poblacin.
6.1 HIPOTESIS
La palabra hiptesis se define como:
1. Una afirmacin que esta sujeta a verificacin o comprobacin,
2. Una suposicin que se utiliza como base para una accin.*
El punto clave de estas definiciones esta en que una hiptesis es una afirmacin o suposicin y no
un hecho establecido. De esta manera, al no existir un conocimiento previo sobre la efectividad de dos
mtodos de enseanza, un investigador puede proponer la hiptesis de que para la enseanza de la
lectura a estudiantes de primer ano, el mtodo A es superior al mtodo B. Un fabricante de drogas puede
hacer la hiptesis de que un determinado medicamento es ms efectivo que otro que se vena usando
normalmente en el tratamiento de una enfermedad. Un fabricante de plsticos puede hacer la hiptesis de
que ciertas lminas de determinado tipo de plstico tienen una resistencia a la traccin promedio de 75
libras. Hiptesis de esta naturaleza pueden basarse en la experiencia y la observacin, experimentacin, o
en la intuicin. Las hiptesis establecidas en esta forma proporcionan con frecuencia motivo para
realizar una investigacin. Por esta razn podemos denominarlas hiptesis de investigacin.
Generalmente hay que volver a plantear las hiptesis de investigacin antes de verificarlas
estadsticamente. Cuando ya se han planteado en forma conveniente, de tal forma que se puedan
comprobar por medio de los mtodos estadsticos que se estudian en el presente capitulo, las hiptesis
reciben el nombre de hiptesis estadsticas. Las hiptesis estadsticas son afirmaciones sobre una o mas
poblaciones, o mejor, como es mas frecuente, afirmaciones sobre uno o mas parmetros de una o mas
poblaciones.
Las hiptesis estadsticas son de dos tipos. Primero esta la hiptesis nula, que se simboliza por Ho y
que es la hiptesis que se debe comprobar. La hiptesis nula se llama tambin hiptesis de ninguna
diferencia (por esto el trmino nula). Es una afirmacin en la que se dice que no hay ninguna
diferencia entre dos poblaciones, entre dos parmetros poblacionales o entre el valor verdadero de algn
parmetro y su valor hipottico.
Veamos nuevamente las tres hiptesis de investigacin que se acabaron de enunciar y establezcamos
para cada una de ellas la hiptesis nula correspondiente. En el caso de la hiptesis de investigacin
sobre los mtodos de enseanza de la lectura a alumnos de primer ano, supongamos que el criterio de
efectividad con que se van a comparar los dos mtodos es el puntaje obtenido en una prueba de
rendimiento en lectura hecha al terminar el ao. La hiptesis nula apropiada (Ho) consistira en afirmar que
no hay ninguna diferencia entre la efectividad de los dos mtodos de enseanza de lectura, o mas
especficamente, que el puntaje promedio obtenido en la prueba por los estudiantes que aprendieron
segn el mtodo A es igual (no es diferente de) al puntaje promedio de los estudiantes que
aprendieron segn el mtodo B. Podemos expresar la hiptesis nula en forma mas compacta como
Supongamos que la efectividad de la nueva droga y la de la droga usual que se menciono antes, se
mide en funcin de la proporcin de casos que responden favorablemente al tratamiento mediante cada
una. La hiptesis nula apropiada consistira en afirmar que la proporcin de casos que responden
favorablemente a la nueva droga es igual a la proporcin de casos que responden favorablemente
a la droga usual, o
Finalmente, en el caso de la hiptesis de investigacin que afirma que las laminas de cierto
tipo de plstico tienen una resistencia promedio a la traccin de 75 libras, la hiptesis nula
apropiada consistira en decir que la resistencia a la traccin promedio es de 75 libras, o
Para verificar una hiptesis nula, examinamos los datos de la muestra tomada de la
poblacin pertinente y determinamos si son o no compatibles con la hiptesis nula. Si los datos
de la muestra no son compatibles con la hiptesis nula, entonces H o se rechaza. Si los datos son
compatibles con la hiptesis nula, entonces H o no se rechaza. En la Seccin 6.2 explicaremos el
criterio que se usa para determinar si los datos de la muestra son o no compatibles con la
hiptesis nula.
Si la hiptesis nula no se rechaza, decimos que los datos particulares de la muestra no dan
suficiente evidencia como para que concluyamos que la hiptesis nula es falsa. Si la hiptesis nula
se rechaza, decimos que los datos particulares de la muestra si dan suficiente evidencia como para
hacernos concluir que la hiptesis nula es falsa y que una segunda hiptesis es verda dera. Esta
segunda hiptesis, de la que hemos concluido que es verdadera si la hiptesis nula es rechazada,
se denomina hiptesis alterna y se designa con el smbolo H 1. Generalmente la hiptesis alterna y
la hiptesis de investigacin son la misma.
Vamos a referirnos nuevamente a las hiptesis de investigacin que plan teamos
anteriormente, para establecer en cada caso cual seria la hiptesis nula y la hiptesis alterna
apropiada.
1 hiptesis de investigacin: el mtodo A es superior al mtodo B para la enseanza de la
lectura a alumnos de primer ao.
Obsrvese que en los dos primeros casos, la hiptesis de investigacin y la hiptesis alterna
son la misma, mientras que en el tercer caso la hiptesis de investigacin es la misma que la hiptesis
nula.
Cuando se establecen hiptesis del tipo indicado en (1) y en (2) se pro cura generalmente que
las hiptesis nula y alterna se complementen entre si y para esto se incluye una desigualdad en la
hiptesis nula que vaya en direccin opuesta a la de la hiptesis alterna. Por ejemplo, podramos escribir
las hiptesis anteriores (1) y (2) como
Este mtodo de plantear las hiptesis nula y alterna realza el hecho de que cuando la hiptesis
alterna establece una desviacin respecto de una igualdad en una direccin, las desviaciones
respecto de la igualdad en la direccin opuesta no tienen ningn inters. Por ejemplo, el director
del departamento de control de calidad de una empresa manufacturera puede hacer las siguientes
hiptesis como parte del procedimiento para aceptar o rechazar las remesas de materias primas
procedentes de los distintos proveedores.
El director del departamento de control de calidad desea detectar todas aquellas remesas en
que la proporcin de artculos defectuosos sea mayor que o, el nivel mximo aceptable, para
poderlas rechazar. Si la proporcin defectuosa es menor que el nivel aceptable, tanto mejor.
6.2 PROCEDIMIENTO DE VERIFICACION DE HIPOTESIS
Como ilustracin de los procedimientos para verificar hiptesis, examinemos el ejemplo siguiente.
Con base en varios aos de experiencia, un equipo de psiclogos cree que individuos no conformistas
tienen un nivel mayor de amor propio que los conformistas. Aunque los psiclogos recuerdan muchos
casos en que se pueden fundamentar sus aseveraciones, saben que, para darle mas peso a sus
conjeturas, deben emplear un mtodo cientfico en el anlisis de la evidencia. Les parece que un
procedimiento de verificacin de hiptesis estadsticas les resulta ms apropiado. De acuerdo con esto,
establecen la siguiente hiptesis nula y la siguiente hiptesis alterna:
donde x es el puntaje medio poblacional obtenido por los no conformistas en una prueba que
tena por objeto medir el nivel de amor propio y y,. es el puntaje medio poblacional obtenido por
conformistas en la misma prueba.
La poblacin sobre la que desean los psiclogos hacer inferencias, es la poblacin de todas las
personas que se pueden caracterizar como conformistas o no conformistas. Los psiclogos obtienen
muestras independientes de conformistas y de no conformistas que, segn ellos, se pueden tratar
como muestras aleatorias de las poblaciones de inters. Administran las pruebas para medir el amor
propio a los individuos de las dos muestras y calculan el puntaje promedio para cada una. Descubren
que x A = 80 y x B = 75. Aunque la direccin de la diferencia de las medias muestrales es
compatible con su hiptesis de investigacin (y alterna), los psiclogos saben que existen por lo
menos dos maneras de explicar esta diferencia: (1) el puntaje verdadero medio de amor propio de la
poblacin de los no conformistas podra no ser superior al que corresponde a la poblacin de los
conformistas. Los resultados observados en la muestra se deben simplemente a la casualidad. (2) Los
resultados observados en la muestra podran reflejar el verdadero estado de las cosas y es acertado
sacar como conclusin que el puntaje verdadero medio de amor propio para los no conformistas es
superior al de los conformistas. El conocimiento y la comprensin de las sutiles ideas de los
procedimientos de verificacin de hiptesis permitir que los psiclogos puedan escoger entre las dos
explicaciones. Vamos a dedicar el resto de esta seccin a los conceptos y tcnicas especficas que se
utilizan en la verificacin de hiptesis.
Podemos formalizar el procedimiento que se debe seguir para verifi car una hiptesis
estableciendo, en forma secuencial, los diversos pasos que forman el procedimiento. En esta
seccin enumeramos y explicamos cada uno de estos pasos llevando el mismo orden que guardan
normalmente en la prctica. Se pueden identificar nueve pasos principales.
1 Planteamiento de la hiptesis
2 Seleccin del nivel de significacin
3 Descripcin de la poblacin que interesa y planteamiento de las suposiciones necesarias
4 Seleccin del estadstico pertinente
5 Especificacin del estadstico de prueba y consideracin de su distribucin
6 Especificacin de las regiones de rechazo y aceptacin
7 Recoleccin de datos y clculo de los estadsticos necesarios
8 Decisin estadstica
9 conclusin
A continuacin, vamos a describir cada uno de estos pasos en trminos generales y
posteriormente los explicaremos con ejemplos especficos.
1 Planteamiento de la hiptesis. En la Seccin 6.1 vimos las diferentes clases de hiptesis
que se pueden hacer y la forma en que se expresan. En virtud de que el estudiante que se inicia en el
estudio de la estadstica encuentra con frecuencia dificultades cuando tiene que establecer la forma de
plantear la hiptesis nula y la hiptesis alterna, vamos a ampliar esta materia. Generalmente,
queremos obtener una conclusin (paso 9) rechazando la hiptesis nula. Es decir, ordinariamente
preferimos que los datos de nuestra muestra apoyen la hiptesis alterna (en la Seccin 6.4
explicaremos las razones de esto). En consecuencia, al determinar lo que debe ser la hiptesis alterna,
debemos preguntarnos que deseo concluir?" o "que creo que es verdadero?". La respuesta a
estas preguntas constituye la expresin de la hiptesis alterna. Luego, el planteamiento complementario
de la hiptesis alterna, sirve de hiptesis nula.
Por ejemplo, consideremos un investigador que establece como hiptesis de investigacin el
hecho de que, en la enseanza de la lectura a alumnos de primer ao, el mtodo A es
superior al mtodo B. Frente a la pregunta "que deseo concluir?", el investigador responder que
desea sacar la conclusin de que el mtodo A es superior al mtodo B. Por tanto, la hiptesis alterna
consiste en A > B y la hiptesis nula, que es el complemento de este planteamiento, en PA < PB. Este
ejemplo, muestra como, normalmente, se formula primero la hiptesis alterna.
2 Seleccin del nivel de significacin. Teniendo en cuenta los resultados que se obtienen
en el anlisis de los datos de la muestra, rechazamos o no la hiptesis nula. Rechazar la hiptesis nula no
constituye una prueba de que sea falsa. Sin tener en cuenta que tan incompatible sea la evidencia de la
muestra con la hiptesis nula, cabe la posibilidad de que esta ltima sea realmente verdadera.
Anlogamente, el hecho de no rechazar la hiptesis nula no es una prueba de que sea verdadera y de
que la hiptesis alterna sea falsa. De la misma manera que en el caso anterior, aunque la hiptesis
nula no sea rechazada, cabe la posibilidad de que sea falsa. La consideracin de estos hechos nos
lleva a la conclusin de que en el rechazo o el no rechazo de la hiptesis nula se corre el riesgo de
equivocarse. Aunque generalmente no sabemos si en una determinada accin (rechazo o no rechazo
de Ho) cometemos un error o no, podemos indicar los dos tipos de error posibles, de la manera
siguiente:
(a) Rechazo de una hiptesis nula verdadera. Este error se denomina error de Tipo I.
(b) aceptacin de una hiptesis nula falsa. Este error se denomina error de Tipo II.
Podemos ilustrar la relacin entre la certeza de la hiptesis nula (es decir, si es verdadera o
es falsa) y la decisin estadstica (rechazar o no rechazar Ho) como se ve en la Tabla 6.1.
Siguiendo la costumbre que se tiene en estadstica, representaremos con la probabilidad de
cometer un error de tipo I y con la probabilidad de cometer un error de Tipo II. As pues
Para la verificacin de una hiptesis determinada preferiramos que y fueran pequeos. En virtud
de la relacin entre estas dos probabilidades, encontramos que, para un tamao de muestra dado, una
disminucin de tiene como contraparte un aumento de y viceversa.
Siendo esto as, parece prudente que, en una situacin determinada, tratemos de minimizar la
probabilidad de cometer el error mas serio. Desafortunadamente, en muchas reas de investigacin, es
difcil, o imposible, evaluar los dos tipos de error en cuanto a la seriedad de cada uno de ellos. Entonces, lo
que se hace en estas situaciones es seleccionar algn valor pequeo para , digamos 0.10, 0.05 0.01. La
eleccin de refleja la opinin que tiene el investigador sobre la seriedad del error de Tipo I. Mientras
mas serias se consideren las consecuencias de cometer un error de Tipo I, menor ser el valor que se
le asigne a
Con frecuencia, se denomina nivel de significacin. Cuando se escoge un nivel de significacin
igual a y se rechaza la hiptesis nula, decimos que los resultados de la muestra son significativos.
3 Descripcin de la poblacin que interesa y planteamiento de las suposiciones
necesarias. Los procedimientos para la verificacin de hiptesis dependen de las caractersticas de la
distribucin muestral que esta implcita. Las caractersticas de la distribucin muestral dependen en
parte de la naturaleza de la poblacin muestreada. Por esta razn, debemos investigar la naturaleza
de la poblacin muestreada para justificar la seleccin del procedimiento. Generalmente nos interesamos
en conocer el tamao aproximado de la poblacin y en saber si se puede considerar o no normalmente
distribuida, en forma aproximada. Tambin, deseamos establecer el hecho de que sea razonable suponer
que la muestra tomada constituye una muestra aleatoria simple de la poblacin de inters.
4 Seleccin del estadstico pertinente. El estadstico particular que va a formar parte del
procedimiento para la verificacin de hiptesis esta determinado por el parmetro que tiene relacin
con la hiptesis. De esta manera, si se trata de verificar una hiptesis sobre una media poblacional, el
estadstico pertinente es x . o media muestral. tambin podramos considerar la distribucin muestral del
estadstico pertinente. En trminos generales lo que se desea saber es la media, la varianza (o la
desviacin tpica) y la forma funcional aplicable de la distribucin muestral. Por ejemplo, si
estamos verificando una hiptesis sobre una media poblacional y si el muestreo se hace en una poblacin
que esta normalmente distribuida, sabemos que la distribucin de x . la media de la muestra, estar
normalmente distribuida con media y varianza 2/n.
5 Especificacin del estadstico de prueba y consideracin de su distri bucin.
DEFINICION
Un estadstico de prueba es una cantidad numrica que se calcula a partir de los datos
de una muestra y que se utiliza para tomar la decisin de rechazar o no rechazar una
hiptesis nula.
El estadstico de prueba se determina teniendo en cuenta el parmetro sobre el que se hace la
hiptesis y la naturaleza de la distribucin muestral del estadstico pertinente. Cuando el
muestreo se hace en una poblacin normalmente distribuida, con varianza conocida, el estadstico de
prueba que se usa para verificar una hiptesis sobre la media poblacional es:
Digamos adems que , probabilidad de rechazar una hiptesis nula verdadera, es 0.05.
Ahora consideremos la distribucin muestral de las medias calculadas a partir de muestras de tamao
n tomadas de nuestra poblacin especfica. De acuerdo con lo que vimos anteriormente sabemos que la
distribucin muestral de x esta normalmente distribuida. Si la hiptesis nula es verdadera, la media de la
distribucin muestral es igual a o. tambin sabemos que el (1 - ) % = 95% de todas las x caern
dentro de 1.96 errores tpicos de la media, que, de ser Ho verdadera, es igual a o. Esto lo podemos
expresar por medio de la siguiente ecuacin de probabilidad:
La Figura 6.1 describe grficamente esta ecuacin y la distribucin muestral. La probabilidad de que
una sola muestra aleatoria simple de tamao n arroje un valor de x igual a o mayor que o + 1.960 x
es igual a /2 = 0.025.La probabilidad de que una sola muestra aleatoria arroje un valor de x igual o
menor que 0 - 1.96 x -, es tambin igual a /2 = 0.025. Si tenemos un valor numrico especfico para o,
podemos calcular valores numricos reales para o 1.96 x . Por ejemplo, supongamos que o = 100
(esto es, hacemos la hiptesis de que es igual a 100), x = 30 y n = 25. Los valores numricos de o
1.96 (30/25) son 88.24 y 111.76.
Podemos decir que la probabilidad de observar un valor de x entre 88.24 y 111.76, siendo H o
verdadera, es igual a 0.95. Si Ho es verdadera, la probabilidad de que una sola muestra aleatoria
simple de tamao 25 arroje una media igual o mayor que 111.76 es igual a 0.025 y la probabilidad de
que una sola muestra aleatoria simple arroje una media igual o menor que 88.24 es igual tambin a
0.025.
Supongamos que en realidad estamos observando un valor de x igual o mayor que 111.76 o igual
o menor que 88.24. Tenemos que concluir que ha ocurrido un caso raro (con una probabilidad de
ocurrir igual a 0.05) u ofrecer otra explicacin. En un procedimiento de verificacin de hiptesis la nica
alternativa que queda es afirmar que la hiptesis nula es falsa; o lo que es lo mismo, que la muestra
no se extrajo de una poblacin que tiene la media hipottica. En realidad, esta ultima explicacin es la
que se acepta cuando las hiptesis son Ho: = o y H1: o el nivel de significacin es y se
presenta un valor de x que es igual o mayor que 0. + Z/2 (n) o uno que es menor o igual a o -Z/2 (/ n). Al aceptar esta explicacin estamos rechazando la hiptesis nula. Si se decide rechazar en estas
circunstancias la' hiptesis Ho se corre un riesgo, , de tomar una decisin equivocada. En
consecuencia debemos asignarle a un valor pequeo (digamos 0.10, 0.05 0.01) para que la
probabilidad de equivocarnos (de rechazar una hiptesis nula verdadera) sea pequea.
Como vamos a rechazar H o : = o en favor de H1 : o, cuando nuestra muestra nica arroje
una media x igual o mayor que o + Z /2 (/'n), o igual o menor que o - Z/2 (/'n), estos valores de
x constituyen la regin de rechazo para nuestra verificacin de hiptesis. Su complemento, conforma
por lo tanto la regin de aceptacin.
Podemos expresar las regiones de aceptacin y de rechazo en funcin del estadstico de prueba, Z,
observando que los nmeros se transforman en - Z/2 y Z/2 respectivamente cuando utilizamos la formula
Z= ( x -o)/ (/'n)
La Figura 6.2 muestra las regiones de aceptacin y de rechazo, tanto en funcin de x como de z,
para verificar, con un nivel de significacin a, H o = 0 frente a la alternativa H1: o .
Si calculamos con base en los datos de la muestra un valor de
y este resulta mayor o igual a Z/2 o menor o igual a Z/2 rechazamos Ho.
En cualquier otro caso, no rechazamos Ho. Se dice que un valor calculado de Z es significativo si nos
lleva a rechazar una hiptesis nula.
Llamamos valores crticos de un estadstico de prueba a aquellos valores que, como Z/2
y - Z/2 de la Figura 6.2 (b), separan una regin de rechazo de una regin de aceptacin. Ellos nos dicen
cuando debemos dejar de creer que la hiptesis nula es verdadera y empezar a creer que es falsa.
Llamamos hiptesis alternas de dos lados o bilateral, a las hiptesis alternas de la forma H 1 o
puesto que generalmente nos conducen a una regin de rechazo que esta compuesta de dos lados o colas
de la distribucin del estadstico de prueba. Y al procedimiento adecuado para verificar una hiptesis nula
frente a una hiptesis alterna bilateral, como el que se describi anteriormente, le damos el nombre de
prueba de hiptesis de dos lados o bilateral.
Con frecuencia, como ya lo hemos visto, la hiptesis nula es de la forma Ho: < o y la hiptesis
alterna de la forma: HI: > o. A una hiptesis alterna de este tipo la Llamamos hiptesis unilateral, puesto
que solo valores grandes del estadstico de prueba causan el rechazo de la hiptesis nula y, por tanto,
la regin de rechazo esta localizada solamente en la cola superior de la distribucin del estadstico de
prueba. Es decir, que toda la probabilidad a esta localizada en una sola cola y no esta dividida por la mitad
como sucede en la prueba bilateral. Por ejemplo, el equipo de psiclogos descrito anteriormente, que esta
interesado en los puntajes de los conformistas y los no conformistas, utilizan una prueba unilateral con la
regin de rechazo localizada solamente en la cola superior. Si seleccionan un nivel de significacin
(probabilidad de rechazar una hiptesis nula verdadera) de 0.05, todo el valor 0.05 constituir el rea de
la cola superior en la distribucin muestral. Para las hiptesis alternas de la forma H1:. < o solamente los
valores pequeos del estadstico de prueba causan el rechazo de la hiptesis nula y, por tanto, toda la
regin de rechazo se encontrara en la cola inferior de la distribucin.
Hasta este momento, nuestros ejemplos sobre la verificacin de hiptesis se han restringido a
pruebas con la media poblacional. En secciones posteriores, vamos a estudiar la verificacin de hiptesis
para aquellos casos en que el muestreo se toma de poblaciones que no estn normalmente distribuidas,
as como tambin para casos en que estn implcitos otros parmetros poblacionales.
7 Recoleccin de datos y clculo de los estadsticos necesarios. Los datos que se
necesitan para verificar las hiptesis formuladas y que satisfacen las suposiciones necesarias de la prueba se
deben recolectar en una forma adecuada. Una vez que se han recogido se calcula el estadstico
apropiado y el estadstico de prueba.
8 Decisin estadstica. Se compara el valor real calculado del estadstico de prueba con
el valor crtico de este. Si el valor calculado esta en la re gin de rechazo, entonces se rechaza
H o , de lo contrario, no se rechaza.
9 conclusin. En tanto que la decisin se expresa en funcin del esta dstico de prueba,
la conclusin se expresa en funcin del parmetro y/o la poblacin a que se refiere la prueba.
Por ejemplo, cuando rechazamos H o: = o , concluimos que "la media de poblacin no es igual
a o ". Cuando no rechazamos la hiptesis nula nuestra conclusin carece de la fuerza de
conviccin que tiene cuando se rechaza una hiptesis nula. Esto se debe a que, aunque de
antemano sabemos que la probabilidad de rechazar una hiptesis nula verdadera es pequea
(esto lo sabemos por la seleccin que hemos hecho de ), generalmente no conocemos el
valor de o probabilidad de aceptar (no rechazar) una hiptesis nula falsa. Esta puede ser, y
frecuentemente lo es, muy grande. (En la Seccin 6.4 analizaremos este punto
detalladamente).
En consecuencia, al no rechazar H o : = o concluimos que "la media de poblacin puede
conocida
10
prcticos, puede considerarse como distribuida en forma aproximadamente normal. Si la hipte sis
nula es verdadera, x , la media de la distribucin muestral, es igual a 162.5. Si, como lo creen los
investigadores, la desviacin tpica de la poblacin es 18.0 libras, entonces la desviacin tpica de la
distribucin muestral de x (o error tpico de x ) es (x = n = 18.0/25 = 3.6.
5 El estadstico de prueba y su distribucin. Como el estadstico pertinente es x , es
conocida y se supone que x esta normalmente distribuida, el estadstico de prueba es Z, que esta
normalmente distribuido cola media 0 y desviacin tpica 1.
6 Regiones de rechazo y de aceptacin. Como a = 0.05 y como se trata de una prueba
bilateral, la regin de rechazo consta de dos partes. La primera parte, localizada en la cola derecha de
la distribucin de z consiste en todos los valores de z tales que, cuando Ho es verdadera, la
probabilidad de ocurrencia aleatoria de una z de ese tamao o mas grande es igual o menor que 0.025.
La segunda mitad de la regin de rechazo, localizada en la cola izquierda de la distribucin de z, consta
de todos aquellos valores de z tales que, cuando Ho es verdadera, la probabilidad de que ocurra al azar
una z de ese tamao o mas pequea es igual o menor que 0.025. La Tabla E del Apndice muestra que los
valores crticos son z = + 1.96 y z = - 1.96. La regin de aceptacin consta de todos los valores de z
que son menores que + 1.96 pero mayores que - 1.96. Si a partir de los datos de la muestra obtenemos
un valor de z igual o mayor que + 1.96 o igual o menor que - 1.96, rechazaremos la hiptesis nula.
Las zonas de rechazo y de aceptacin tambin se pueden describir en funcin de x . La zona de
rechazo consta de dos conjuntos de valores de x (calculados a partir de muestras de tamao 25
extradas de la poblacin de inters): los que son tan grandes que la probabilidad de ocurrencia de valores
de ese tamao o mas grandes, cuando Ho es verdadera, es igual o menor que 0.025 y los que son tan
pequeos que la probabilidad de ocurrencia de valores de ese tamao o mas pequeos es igual o menor
que 0.025. Los valores crticos para la regin de rechazo son valores de x , que estn localizados a una
distancia de 1.96 errores tpicos a cada lado de la media hipottica. Los valores crticos son:
Si la muestra arroja un valor de x que quede a una distancia de 1.96 errores tpicos o mas medida
desde la media hipottica (esto es, si la x calculada es mayor o igual a 169.6 o menor o igual que
155.4), rechazaremos H, ). En cualquier otro caso, no la rechazaremos. La Figura 6.3 muestra las regiones
de rechazo y de aceptacin en funcin tanto de z como de x .
7 Recoleccin de datos y clculos. Se selecciona una muestra aleatoria simple de los puntajes
de 25 personas que jugaron ftbol durante los d1timos diez anos. La media de los pesos de la muestra
resulta ser igual a 178.7.
8 Decisin estadstica. Con los datos de la muestra se calcula
Como 4.50 es mayor que 1.96, este valor de z cae dentro de la regin de rechazo y por tanto
rechazamos HO.
Obsrvese tambin que 178.7 es mayor que 169.6, el valor critico superior expresado en funcin
de x . Por tanto habramos podido rechazar la hiptesis nula sin necesidad de calcular un valor z.
9 conclusin. Como rechazamos HO, volvemos a la hiptesis alterna para poder sacar una
conclusin. En este ejemplo podemos concluir, con base en los datos de la muestra, que el peso
11
Informe de los resultados. En los artculos de las revistas que contienen anlisis estadsticos de
proyectos de investigacin, encontramos una variedad de maneras de presentar los resultados. A
veces, se informa el valor del estadstico de prueba o el del estadstico de la muestra junto con la
afirmacin de si era o no significativo en el nivel de significacin escogido. De acuerdo con este
mtodo, informaramos los resultados del presente ejemplo, poniendo "z = 4.50, significativo en el
nivel 0.05", o x = 178.7, significativo en el nivel 0.05".
Cuando un resultado es significativo tanto en el nivel 0.05 como en el nivel 0.01, muchos
autores lo indican por medio de asteriscos. A los resultados que son significativos en el nivel 0.05, pero
no en el nivel 0.01, se les agrega un asterisco (*) y a los que son significativos en el nivel 0.01, dos
asteriscos (**). Como, en el presente ejemplo, 4.50 es mayor que 2.58 (valor de z en una prueba
bilateral con a = 0.01) el resultado se informara como z = 4.50** 6 x = 178.7**. Tal vez la forma
mas comn de presentar los resultados, en la literatura, es utilizando valores p.
DEFINICION
Un valor p es el valor ms pequeo de con el que se puede rechazar la hiptesis nula.
Existe la probabilidad de obtener, cuando Ho es verdadera, un valor del estadstico de prueba tan
extremo o ms extremo que aquel que realmente se ha observado. Si los resultados estadsticos se
presentan en una tabla, el valor p se indica generalmente en nota de pie de pgina. Si los
resultados se exponen en el texto de un artculo, el valor p se informa generalmente de manera
similar o a veces entre parntesis.
Al determinar un valor p, debemos tener en cuenta si la prueba es unilateral o bilateral. Si la
prueba es bilateral, los valores de p sern dos veces ms grandes de lo que serian en una prueba
unilateral, puesto que habr que tener en cuenta la probabilidad de obtener un valor extremo del
estadstico de prueba en cualquier direccin.
Para obtener el valor de p correspondiente al presente ejemplo, en el que la prueba es bilateral,
debemos buscar la probabilidad de observar un valor de z tan extremo o ms extremo que 4.50, en
12
cualquier direccin, cuando Ho es verdadera. Si consultamos la Tabla E del Apndice, vemos que el valor
tabulado mas grande de z es 3.09 y la probabilidad de obtener un valor de este tamao o mas grande es
0.5 - 0.4990 = 0.001. Como 4.50 esta mucho mas a la derecha de 0 que 3.09, la probabilidad de
observar un valor de z tan grande o mas grande que 4.50, cuando Ho es verdadera, es menor que
0.001. Como z = 4.50 se calcu1 como parte de una prueba bilateral, debemos tener presente un valor
tan extremo como 4.50 en la direccin opuesta. En consecuencia, el valor p que buscamos, es menor
que 2(0.001) = 0.002. Este resultado lo presentaramos en un informe como "p < 0.002". La
Figura 6.4 muestra el valor p correspondiente a este ejemplo.
Verificacin de hiptesis unilateral. Con frecuencia la naturaleza de una hiptesis de
investigacin es tal, que conduce a una hiptesis alterna unilateral que, a su vez, lleva a una prueba
unilateral que utiliza una regin de rechazo unilateral.
Cuando solo valores extremadamente grandes del estadstico de prueba (o solo valores
pequeos) dan origen al rechazo de la hiptesis nula, resulta conveniente utilizar una hiptesis
alterna unilateral. Verificamos la hiptesis nula mediante una prueba unilateral y utilizamos
entonces una regin de rechazo unilateral. Supongamos, por ejemplo, que el muestreo se hace en
una poblacin normalmente distribuida con una varianza de poblacin conocida y que la
naturaleza de la hiptesis de investigacin es tal que las hipte sis estadsticas son
Como solamente valores grandes del estadstico de prueba darn origen al rechazo de H o
(los valores pequeos trataran de apoyar la hiptesis nula), la regin de rechazo estar compuesta
de valores grandes del estadstico de prueba y por tanto, deber localizarse en la cola superior
de la distribucin del estadstico de prueba. En realidad, la regin de rechazo estar compuesta de
aquellos valores del estadstico de prueba tan grandes que la probabilidad de observar valores de ese
tamao o mas grandes, siendo Ho verdadera, es igual o menor que .
Figura 6.5 Regiones de aceptacin y de rechazo para dos conjuntos de hiptesis estadsticas unilaterales. El
muestreo se hizo en una poblacin normalmente distribuida, con varianza de poblacin conocida.
13
Por otra parte, si las hiptesis estadsticas son con un nivel de significacin , la regin de rechazo
estar localizada en la cola inferior de la distribucin del estadstico de prueba, puesto que
solamente valores pequeos del estadstico darn origen al rechazo de la hipte sis nula. La
Figura 6.5 muestra las regiones de aceptacin y de rechazo en estas dos situaciones.
Obsrvese que, para Ho o y H1 > o , existe un gran nmero de valores hipotticos para .
La forma de la hiptesis indica que el procedimiento de la verificacin de hiptesis podra resultar
adecuado para cada uno de los valores hipotticos. Sin embargo, por razones prcticas, se suele verificar
la hiptesis nula, acompaada de una alterna unilateral, solo en el punto de igualdad. Un pequeo clculo
nos demuestra que si se rechaza Ho cuando la prueba se hace en el punto de igualdad, entonces H o se
rechazara para cualquier otro valor hipottico de que este indicado por la hiptesis nula.
Ejemplo 6.2
La experiencia ha demostrado que, el tiempo promedio de reaccin a determinado estimulo en
sujetos normales que estn dentro de cierto limite de edad es de 65 milisegundos con una desviacin
tpica de 15 milisegundos. Un equipo de investigaciones psicolgicas cree que silos individuos reciben
cierto tipo de entrenamiento muestran entonces, en promedio, un tiempo de respuesta mas corto. Con
el fin de aclarar si esta opinin se puede probar, el equipo realizo el siguiente procedimiento para la
verificacin de hiptesis.
1 Planteamiento de la hiptesis. Podemos establecer formalmente la hiptesis de
investigacin correspondiente a este ejemplo as: el tiempo promedio de reaccin al estimulo de los
sujetos normales que reciben entrenamiento experimental es mas corto que el de los sujetos que no
lo reciben". Esta hiptesis de investigacin conduce a las siguientes hiptesis estadsticas:
La hiptesis alterna es unilateral puesto que solo los valores "pequeos" del estadstico de prueba
darn origen al rechazo de la hiptesis nula. Obsrvese tambin que la hiptesis alterna y la hiptesis de
investigacin son la misma.
2 Nivel de significacin. Sea = 0.01.
14
En otras palabras, la regin de rechazo constara de todos los valores de z tan pequeos, que la
probabilidad de obtener un valor de ese tamao o menor, cuando H o es verdadera, es igual o menor que
0.01, o nivel de significacin escogido. En la Tabla E del Apndice encontramos que el valor crtico de
z es igual a -2.33. Obtenemos el valor critico, en funcin de x , sabiendo que esta localizado a una
distancia de 2.33 errores tpicos a la izquierda de la media supuesta de la distribucin muestral de x . Como
x = 3.35, esta distancia es igual a 2.33 X 3.35 = 7.81. El valor critico, en funcin de x , es entonces, 65
- 7.81 = 57.19. La Figura 6.6 muestra las zonas de rechazo y de aceptacin tanto en funcin de z como
de x .
7 Recoleccin de datos y clculos. Veinte sujetos normales recibieron el entrenamiento y en
seguida se les hizo una prueba para determinar sus tiempos de reaccin al estimulo. Los investigadores
registraron un tiempo de reaccin promedio de 55.5 milisegundos. Con base en estos datos, podemos
calcular z = (55.5 - 65)/3.35 =-2.84.
8 Decisin estadstica. Como el valor de z calculado,-2.84, es menor que -2.33 (es decir
15
como -2.84 cae en la regin de rechazo), rechazamos Ho. Observemos tambin que x = 55.5 cae
en la regin de rechazo definida en trminos de x . Sin tener en cuenta si el estadstico pertinente (en
este caso x ) o el estadstico de prueba se utilizan para determinar si H o se rechaza o no, en una situacin
dada la decisin siempre ser la misma. La Figura 6.6 muestra donde se localizan los valores calculados
de x y z respecto de los valores crticos. De acuerdo con la Tabla E del Apndice encontramos que la
probabilidad de obtener un valor de z igual o menor que -2.84, cuando H o es verdadera, es 0.0023.
Entonces, la probabilidad de observar un valor de x igual o menor que 55.5, cuando H o es verdadera,
es de 0.0023. Por eso, el valor p correspondiente a este ejemplo es 0.0023 como se indica en la Figura
6.6.
9 Conclusin. Como rechazamos H O, concluimos que Hl es verdadera. Es decir, en el presente
ejemplo, concluimos que el tiempo promedio de reaccin de los sujetos que reciben entrenamiento
especial es mas corto que el de aquellos que no lo reciben.
Poblacin distribuida normalmente, 2 desconocida
Cuando resulta apropiado verificar una hiptesis sobre una media poblacional, la varianza poblacional
2 generalmente es desconocida y en consecuencia no se puede determinar exactamente n, o error
tpico del estadstico pertinente x . Si la muestra es grande, se puede hacer una estimacin satisfactoria de
2 con los datos de la muestra. Si la poblacin de inters esta normalmente distribuida, las medias
muestrales lo estarn tambin y se podr utilizar el estadstico de prueba z. Inclusive cuando la poblacin
no esta normalmente distribuida, la distribucin muestral de la media esta distribuida en forma
aproximadamente normal como consecuencia del teorema del lmite central y, por tanto, se puede
utilizar a z como estadstico de prueba. Sin embargo, cuando el tamao de la muestra es pequeo, no se
puede aplicar el teorema de lmite central y es necesario buscar un estadstico de prueba distinto de z. Si
se sabe que la poblacin esta, al menos aproximadamente, distribuida en forma normal, o si, al no
tenerse un conocimiento preciso esto parece ser una suposicin razonable, el estadstico t, constituye
la mejor eleccin de un estadstico de prueba. En el Capitulo 11 se estudiaran los procedimientos
para la verificacin de hiptesis que son apropiados cuando el tamao de la muestra es pequeo y cuando
no se puede suponer que la poblacin esta normalmente distribuida.
Ejemplo 6.3
Un fabricante de drogas dice que el tiempo promedio para que se disuelva el contenido de cierta
cpsula es de 50 minutos. El equipo de investigaciones de una empresa competitiva no cree en esto. Por
eso, hace una prueba con una muestra al azar de 20 cpsulas y calcula una media muestral de 54 minutos y
desviacin tpica de 15. El equipo de investigaciones deseaba saber si puede concluir que el tiempo
promedio que se requiere para que se disuelva el contenido es mayor que 50 minutos. El equipo
Ilevo a cabo el siguiente procedimiento para la verificacin de hiptesis.
1 Planteamiento de la hiptesis. La hiptesis de investigacin es la siguiente: "el tiempo
promedio requerido para que se disuelva el contenido de la cpsula es mayor que 50 minutos". Las
hiptesis estadsticas son:
16
8 Decisin estadstica. Como el valor de t calculado, 1.19, es menor que 1.7291 (es decir, cae en
la regin de aceptacin) no podemos rechazar H O. Llegamos a la misma decisin observando que x
= 54 es menor que 55.8 valor critico de x . Consultando la Tabla F del Apndice podemos obtener
algn conocimiento de la magnitud del valor p para esta prueba. Observamos que para 19
grados de libertad, la probabilidad de obtener un valor t tan grande o ms grande que 1.328,
cuando H o es verdadera, es 0.10. Como el valor de t calculado, 1.19, es menor que 1.328, concluimos
que para esta prueba p > 0.10. Para obtener un valor ms exacto de p, necesitaramos consultar una
tabla mas completa de la distribucin t.
9 Conclusin. Como hemos rechazado HO, concluimos que Ho puede ser verdadera, es decir, que
el tiempo promedio que se requiere para que el contenido de la cpsula se disuelva puede ser de 50
minutos o de menos.
En el Capitulo 5 vimos que cuando el tamao de la muestra es grande, muchos expertos en
estadstica prefieren utilizar la distribucin z ms bien que la distribucin t cuando construyen
intervalos de confianza para , aunque sea desconocida. De la misma manera, muchos expertos
prefieren z, en vez de t, para verificar hiptesis, cuando tienen muestras grandes, a pesar de que a sea
desconocida.
17
Cuando se sigue esta practica, se compara, para la significacin, el valor calculado del estadstico
de prueba con un valor apropiado de la distribucin z.
Muestreo en una poblacin no distribuida normalmente
Con frecuencia, la poblacin de inters no esta normalmente distribuida. En otros
casos, el investigador, que no conoce la forma funcional de la poblacin, no quiere suponer que esta
normalmente distribuida. En situaciones como estos, el estadstico t no es apropiado como estadstico
de prueba y el estadstico z es apropiado nicamente si el tamao de la muestra es grande. En el
siguiente ejemplo, vamos a explicar el procedimiento para la verificacin de hiptesis que se debe
emplear cuando el muestreo se hace en una poblacin no distribuida normalmente, con varianza
desconocida (el caso usual) y cuando el tamao de la muestra es suficientemente grande como para
aplicar el teorema del Lmite central.
Ejemplo 6.4
Un grupo de profesores investigadores de una escuela de educacin de cierta universidad
partan de la hiptesis de que el enriquecimiento del plan de estudios en el colegio hara aumentar los
puntajes en habilidad verbal cuando los estudiantes presentaran los exmenes de admisin de la
universidad. Con el fin de observar si era posible obtener alguna evidencia para apoyar su hiptesis, los
profesores introdujeron un programa de enriquecimiento en el plan de estudios de primer ano de
un colegio local. El programa continuo, con esta clase, hasta el ltimo ano. Al finalizar el ultimo ao,
125 alumnos de esta clase tomaron exmenes de admisin en la universidad. El puntaje verbal promedio
fue de 590 con una desviacin tpica de 35. El puntaje verbal promedio de los estudiantes que
presentaron estos exmenes durante los 5 aos anteriores fue de 580. Los profesores deseaban saber
si podan sacar como conclusin que el enriquecimiento del plan de estudios haba aumentado el puntaje
verbal promedio. Se puede llevar a cabo el siguiente procedimiento para la verificacin de hiptesis.
1 Planteamiento de la hiptesis . hiptesis de investigacin: "el enriquecimiento del plan
de estudios del colegio mejora los puntajes en habilidad verbal de los alumnos que presentan examen
de admisin en la universidad".
0.05.
s / n = 35 / 125 = 3.13.
5 El estadstico de prueba y su distribucin. El estadstico de prueba apropiado es z, que
esta normalmente distribuido, con media 0 y desviacin tpica 1.
6 Regiones de rechazo y de aceptacin. El valor crtico de z es 1.645, de modo que la
regin de rechazo consta de todos los valores de z iguales o mayores que 1.645 y la regin de aceptacin
consta de todos los valores de z menores que 1.645. El valor critico de x es 580 + (1.645) (3.13) =
18
585.15. Expresada en funcin de x la regin de rechazo consta de todos los valores de x mayores o
iguales a 585.15 y la regin de aceptacin de todos los valores de x menores que 585.15.
7 Recoleccin de datos y clculos. Como ya lo advertimos, n = 125, x = 590, y S = 35. A
partir de estos datos podemos calcular
8 Decisin estadstica. Como el valor de z calculado, 3.19, es mayor que el valor critico de z,
1.645, rechazamos HO. tambin, puesto que la x observada, 590, es mayor que el valor critico de x ,
585.15, rechazamos HO. El valor p para esta prueba es menor que 0.001.
9 Conclusin. Debido a que se rechaza HO, los profesores pueden concluir que el enriquecimiento
del plan de estudios de un colegio mejora el puntaje en habilidad verbal de los exmenes de admisin en
la universidad.
EJERCICIOS
1 En una poblacin normalmente distribuida con desviacin tpica igual a 32, se extrae una
muestra aleatoria simple de tamao 16, que arroja una media y una desviacin tpica de 520 y 40
respectivamente. A partir de estos datos, se puede concluir, en el nivel de significacin 0.05, que
es mayor que 516? Hacer una grafica para explicar la localizacin de las zonas de rechazo y de
aceptacin en funcin tanto del estadstico pertinente como del estadstico de prueba. Cual es el valor
p para esta prueba?
2 Una muestra aleatoria simple de tamao 9 tomada de una poblacin normalmente distribuida
arrojo una media y una desviacin tpica de 150 y 30 respectivamente. Proporcionan estos
datos evidencia suficiente para po der concluir que la media poblacional es menor que 160? Cual es
el valor p para esta prueba?
3 A partir de los datos de una muestra aleatoria simple de 100 estudiantes de bachillerato
seleccionados en varios colegios de una ciudad se averiguo que los gastos medios semanales de los
estudiantes eran de 3.25 pesos con una desviacin tpica de 1 peso. Proporcionan estos datos suficiente
evidencia como para decir que la media poblacional es diferente de $ 3.00? Cual es el valor p para
esta prueba?
4 Un especialista en lectura cree que los estudiantes de ciases no programadas obtienen puntajes
superiores en pruebas de comprensin de lectura que los estudiantes de clases programadas. El puntaje
medio obtenido en la prueba de comprensin de lectura por los estudiantes de clases programadas que
entraron a 4o. grado durante los 5 aos anteriores es de 4.25. Un grupo de 81 estudiantes que asisti a
clases no programadas durante sus 3 primeros aos, obtuvo un puntaje en la prueba de comprensin de
lectura de 5.30, con una desviacin tpica de 1.8. Proporcionan estos datos evidencia suficiente como
para apoyar la hiptesis del especialista en lectura? Sea = 0.01. Cual es el valor p en esta prueba?
5 Un investigador agrcola crea que el nmero medio de acres que los hacendados de un
determinado estado dedicaban a cierto cultivo era inferior a 6. El investigador envi por correo un
cuestionario a una muestra aleatoria simple de 25 hacendados de ese estado en que les solicitaba
informacin sobre el nmero de acres sembrados. La media y la desviacin tpica de la muestra fue
de 5 y 1,5 acres respectivamente. En el nivel de significacin 0.05 sirven estos datos de apoyo a la
opinin del investigador? Cul es el valor p para esta prueba?
6 Un consejero escolar ha descubierto que durante los ltimos 5 anos los alumnos de ltimo
ano que no tuvieron consejera vocacional y que tomaron una prueba de madurez, obtuvieron un
puntaje promedio de 190. El consejero opina que los estudiantes que reciben consejera
19
20
El error de Tipo II
Consideremos la hiptesis H o: , = o y H1: o con = 0.05. Supongamos que la
poblacin pertinente esta normalmente distribuida, con varianza conocida 2 . Siendo = 0.05,
la regin de rechazo queda definida y consta de todos los valores de x mayores o iguales a +
1.96 x y menores o iguales a o - 1.96 ,, donde o es la media hipottica de la distribucin
muestral de x . La Figura 6.8 muestra esta distribucin, base de la verificacin de hiptesis.
Si Ho es falsa, la distribucin muestral verdadera de x no estar centrada en o , como se ve en
la Figura 6.8, sino que quedara centrada sobre la media poblacional verdadera. Si es igual a 1,
por ejemplo, la distribucin muestral de x quedara centrada sobre 1. Sin embargo, las regiones de
rechazo y de aceptacin quedaran fijas, puesto que estn determinadas por y por Ho. Si el valor
de x calculado con los datos de la muestra simple, que se extrajo de la poblacin para verificar
Ho, cae en la regin de aceptacin, cuando realmente es igual a 1, Ho ser "aceptada" y se
cometer un error de Tipo II. La probabilidad, , de que este suceso ocurra es igual a la parte del
rea bajo la curva de x centrada sobre 1 que coincide con el rea bajo la curva de x centrada sobre o
que se encuentra entre los valores crticos de x . Ver Figura 6.9.
Figura 6.8- distribucin muestral hipottica de x para Ho: = o , H 1 o , cuando el
muestreo se hace en una poblacin normalmente distribuida con varianza 2 ( = 0.05).
21
Bajo la hiptesis H1 o, puede asumir un numero infinito de valores y por lo tanto existe
un numero infinito de posibles valores de . Aquel que se deba aplicar en una situacin dada,
cuando H o es falsa, depende del valor verdadero de . En la practica, no conocemos el valor verdadero
de cuando Ho es falsa y por tanto no sabemos el valor real de . La Figura 6.9 muestra algunas
alternativas posibles para , cuando Ho es falsa y las correspondientes . En esta figura, las distribuciones
muestrales correspondientes a diversos valores de aparecen verticalmente para ms claridad. Debemos
darnos cuenta de que, en realidad, los diversos valores de estn todos localizados sobre el mismo eje
x y, en consecuencia, todas las curvas de distribucin muestral correspondientes tienen la misma lnea x
como eje horizontal. Tambin debemos darnos cuenta de que, a pesar de que en la Figura 6.9
solamente se muestran seis alternativas diferentes de Ho : = o. existe un numero infinito de ellas. Al
observar la Figura 6.9 se puede ver que las alternativas para o que estn localizadas cerca de o, producen
valores ms grandes de que las alternativas que estn lejos de o. Por ejemplo, la distancia que hay entre
1 y o es mas corta que la distancia que hay entre 2 y o y, en consecuencia, 1 es mayor que 2.
Expliquemos ahora por medio de un ejemplo como se calcula un error de Tipo II.
Ejemplo 6.5
Un psiclogo clnico deseaba verificar, en el nivel de significacin 0.05, la hiptesis de que el
promedio del CI de un grupo de retardados mentales era de 65. Una muestra aleatoria de 50 sujetos
arrojo una desviacin tpica de 12. El psiclogo tambin deseaba calcular la probabilidad de cometer un
error de Tipo II. Los valores diferentes de para los cuales se calculo fueron 1 = 67, 2=70, 3=63, y
4=61.
Los valores crticos para la verificacin de hiptesis son
22
23
Obsrvese que disminuye cuando la distancia entre o y el otro valor de , para el cual se calcula
13, aumenta. Tambin obsrvese que en el Ejemplo 6.5 todos los valores calculados de , como se ve en
la Figura 6.12, son mayores que el valor preseleccionado de = 0.05. En realidad, hay que seleccionar un
valor de aproximadamente igual a 70.8 o a 59.2 para que el valor correspondiente de sea igual a 0.05.
As pues, la probabilidad de "aceptar" una hiptesis nula falsa, , es siempre mayor que , excepto
cuando la hiptesis nula es falsa porque el verdadero valor de "esta muy lejos" de o.
En muchas situaciones practicas, no estamos motivados para verificar hiptesis sobre medias
poblaciones tales que, si Ho es falsa, el valor real de esta muy lejos de o . Por ejemplo, no podemos
imaginar a alguien que este interesado en verificar estadsticamente la hiptesis nula de que la estatura
promedio de los nios de seis aos es igual a la estatura promedio de los adultos. Por el contrario, no
pondramos en tela de juicio el inters de alguien por verificar la hiptesis nula de que la estatura
promedio de un grupo determinado de mujeres adultas es igual a la estatura promedio de otro grupo de
mujeres. En otras palabras, en muchas situaciones practicas, si Ho es falsa, es falsa porque el valor verdadero
de esta cerca de o. Por otra parte, mientras mas cerca este el valor verdadero de respecto de o,
ms grande ser el valor de , la probabilidad de "aceptar" una hiptesis nula falsa. Es por esta razn que
advertimos que una conclusin que se basa en una hiptesis nula rechazada es mas decisiva que una
que se basa en una hiptesis nula "aceptada".
24
Es tambin por esta razn que, cuando rechazamos una hiptesis nula, decimos que Hl es verdadera,
pero cuando "aceptamos" o dejamos de rechazar una hiptesis nula, decimos que Ho puede ser
verdadera.
La potencia de una prueba
Un concepto muy util para evaluar las verificaciones de hiptesis lo constituye la potencia de una
prueba. La potencia de una prueba es la probabilidad de rechazar una hiptesis nula falsa.
Generalmente viene expresado por 1 - . Para una dada, decimos que una prueba es mas potente que
otra, si el valor de 1 - es mayor en la una que en la otra para todos los valores de .
Con frecuencia, es til contar, para una prueba particular, con lo que se conoce con el nombre de
funcin potencia.
DEFINICION
Una funcin potencia es una funcin que muestra la relacin que existe entre la
probabilidad de rechazar una hiptesis nula y los diferentes valores que puede asumir el
parmetro dadas una hiptesis nula, una hiptesis alterna y un nivel de significacin
determinado.
La Tabla 6.2 da algunos de los valores de la funcin potencia correspondiente al Ejemplo 6.5.
Se puede obtener una curva de potencia representando grficamente la funcin potencia. Los
posibles valores del parmetro se representan sobre el eje horizontal y los valores de 1 - sobre el
eje vertical. La Figura 6.13 muestra el grafico de la funcin potencia de la Tabla 6.2.
La funcin potencia se usa para determinar la magnitud de 1 - cuando son verdaderos los valores
especficos de la hiptesis alterna.
La Figura 6.13 muestra la apariencia general en forma de V de las curvas de potencia
correspondientes a pruebas bilaterales. En trminos generales una prueba bilateral que discrimina bien
entre el valor del parmetro en Ho y los valores en H1 (excepto los que se encuentran cerca al valor
expresado de Ho) da como resultado una curva de potencia en forma de V estrecha. Una curva en V
extendida indica que la prueba discrimina pobremente en un intervalo relativamente amplio de valores
diferentes del parmetro.
La curva de potencia para una prueba unilateral con la regin de rechazo en la cola superior toma la
forma de una S alargada. Una prueba unilateral con la regin de rechazo en la cola inferior de la
distribucin tiene como resultado una curva de potencia que se asemeja a una S alargada pero al revs.
La Figura 6.14 muestra la curva de potencia para el Ejemplo 6.2, que utiliza una prueba unilateral con
regin de rechazo en la cola inferior de la distribucin muestral.
25
EJERCICIOS
1 5 Con los datos del Ejercicio 1, construir y representar grficamente la funcin potencia.
16 Construir y representar grficamente la funcin potencia correspondiente al Ejercicio 3.
17 Construir y representar grficamente la funcin potencia correspondiente al Ejercicio 4.
18 Construir y representar grficamente la funcin potencia correspondiente al Ejercicio 6.
19 Construir y representar grficamente la funcin potencia correspondiente al Ejercicio 7.
20 Construir y representar grficamente la funcin potencia correspondiente al Ejercicio 8.
21 Construir y representar grficamente la funcin potencia correspondiente al Ejercicio 13.
22 Construir y representar grficamente la funcin potencia correspondiente al Ejercicio 14.
6.5 VERIFICACIN DE UNA HIPTESIS SOBRE LA DIFERENCIA ENTRE DOS MEDIAS
PBLACINALES
En el Captulo 5 estudiamos la construccin de intervalos de confianza para la diferencia entre
dos medias poblacionales. En el presente captulo vamos plantearnos el problema de verificar hiptesis
sobre la diferencia entre dos medias poblacionales. El ejemplo que se estudi anteriormente
relacionado con el equipo de psiclogos interesado en los puntajes de amor propio de los
conformistas y de los no conformistas es una ilustracin de este tipo de pruebas de hiptesis. En ese
ejemplo los psiclogos deseaban saber si era posible obtener la conclusin de que los puntajes
26
promedio de amor propio de los no conformistas es mayor que el de los conformistas. Podramos 'citar
otros ejemplos. Un bilogo podra estar interesado en saber si es posible concluir que la duracin
promedio de vida de algn animal es inferior en un tipo determinado de medio ambiente que en otro.
Un socilogo podra querer saber si el nmero promedio de aos de educacin es diferente en dos
poblaciones. Un economista tal vez est interesado en saber si el ingreso familiar promedio es
diferente en dos grupos. Vamos a estudiar pruebas bilaterales y pruebas unilaterales para cada una de las
tres situaciones siguientes: (1) cuando el muestreo se hace en dos poblaciones que estn
distribuidas en forma por lo menos aproximadamente normal, con varianzas conocidas, (2) cuando el
muestreo se hace en dos poblaciones que estn distribuidas en forma por lo menos
aproximadamente normal con varianzas desconocidas pero iguales y (3) cuando el muestreo se hace en
dos poblaciones que no estn normalmente distribuidas.
En el Captulo 4 vimos las distribuciones muestrales apropiadas para cada una de estas situaciones.
Poblaciones normalmente distribuidas, 12 y 22 conocidas
Ejemplo 6.6
En un establecimiento escolar suburbano, se seleccion al azar una muestra de 25 alumnos de
quinto grado (grupo A) de una poblacin de estudiantes pertenecientes a familias en que ambos padres
trabajan. Se seleccion tambin una muestra al azar de 15 estudiantes (grupo B) del mismo grado y
establecimiento escolar entre aquellos estudiantes que pertenecen a familias en que solamente el padre
trabaja. El anlisis de los puntajes de rendimiento escolar de los dos grupos dio los siguientes resultados:
Puntaje promedio ( x )
Grupo
Grupo B
78
85
La experiencia muestra que las poblaciones de puntajes para ambos grupos estn distribuidas en
forma aproximadamente normal, con varianzas de = 81 y ( x ) = 25. Con el fin de determinar si se
puede concluir, con base en estos datos, que la media de la poblacin de la que se seleccion el grupo A
es inferior a la media de la poblacin de la que se seleccion el grupo B, se puede llevar a cabo la
siguiente verificacin de hiptesis.
1 Planteamiento de la hiptesis.
27
28
8 Decisin estadstica. Como -2.0301 < -1.14 < 2.0301 es decir, como -1.14 cae en la
regin de aceptacin, no podemos rechazar Ho.
Hacindolo de otro modo, podramos haber basado nuestra decisin de rechazar o no a HO
en la magnitud de la diferencia observada x 1 - x 2 = 85 - 87 = -2. Los valores crticos de x 1 - x 2
estn dados por
0 (2.0301) (1.76) = -3.57
29
2
2
que es una estimacin de ( x N y xR
30
8 Decisin estadstica. Como 5.94 > 1.645, rechazamos Ho. Procediendo de otro modo,
podramos haber basado nuestra decisin en la magnitud de la diferencia entre las medias muestrales x N
-- x R = 14.9 - 12.3 = 2.6, en comparacin con el valor crtico de x N -- x R, que est dado por
x = 65 segundos, S A2 = 81
x , = 75 segundos, S B2 = 64.
Darn estos datos evidencia suficiente como para concluir que el aparato A es ms efectivo que
el aparato B? Sea = 0.05.
24 Como parte de un estudio relacionado con la conducta de una especie animal, unos zologos
realizaron un experimento para determinar si esa especie animal presentaba en promedio diferentes
tiempos de respuesta a un estmulo bajo dos condiciones diferentes (condicin I y condicin II). Los
investigadores sometieron una muestra aleatoria de 15 animales a la condicin I. Para cada
animal registraron el tiempo transcurrido entre el comienzo del estmulo y la respuesta. Tomaron
los mismos registros con una muestra aleatoria de 17 animales que fueron sometidos a la condicin II.
Sus resultados fueron los siguientes:
Proporcionan estos datos evidencia suficiente como para concluir que el promedio de tiempos de
respuesta es diferente bajo las dos condiciones? Sea = 0.01.
25 Como parte de un proyecto de investigacin, un psiclogo seleccion una muestra aleatoria
de 12 muchachas y otra de 9 muchachos. Luego, le pidi a cada individuo que dibujara una figura
masculina. El tiempo promedio que gastaron las mujeres fue de 8 minutos con una varianza de 18. Para los
hombres el tiempo fue de 13 minutos, con una varianza de 22.5. Indican estos datos que los hombres
en promedio gastan ms tiempo cuando dibujan una figura de hombre que las mujeres? Sea = 0.05.
26 Se llev a cabo una encuesta entre los ancianos de una comunidad para comparar los niveles
31
de amor propio entre los que vivan y los que no vivan en ancianatos (solos o con parientes). Se le dio
a cada uno una prueba para medir su amor propio. Se obtuvieron los siguientes resultados:
Proporcionarn estos datos evidencia suficiente como para deducir que los ancianos que no viven
en los ancianatos tienen un puntaje promedio superior de amor propio a los que viven en ancianatos? Sea
= 0.01.
27 Se llev a cabo un estudio para evaluar los efectos del hacinamiento sobre el aprendizaje, entre
nios de escuela elemental. A una muestra aleatoria de 50 nios se le ense una destreza determinada en
condiciones de hacinamiento y a otra de 45 nios se le ense la misma destreza, con los mismos
profesores, pero sin hacinamiento. Al terminar el experimento se le adminis tr a cada nio una
prueba para determinar su nivel de dominio de la habilidad. Se obtuvieron los siguientes resultados:
Proporcionan estos datos evidencia suficiente como para concluir que la enseanza es menos
efectiva bajo condiciones de hacinamiento? Sea = 0.05.
28 Al comienzo del ao escolar se distribuyeron al azar los alumnos de ltimo ao de un colegio
en dos grupos, cada uno con 50 estudiantes. El grupo A recibi consejera vocacional individual. El
grupo B no recibi ninguna consejera. Al final del ao, se le hizo a cada alumno una prueba para medir
su nivel de conocimientos sobre las distintas carreras. Los resultados fueron los siguientes:
Proporcionan estos datos evidencia suficiente como para concluir que la consejera individual es
efectiva para aumentar el conocimiento de las carreras profesionales? Sea = 0.05.
29 En un estudio cuyo objeto era evaluar los efectos del ruido sobre la capacidad de aprender,
se distribuyeron aleatoriamente en dos grupos 24 estudiantes. Al grupo 1 se le ense una habilidad
en condiciones de ruido. Al grupo 2 se le ense la misma habilidad, con el mismo profesor, pero sin
ruidos. Al final del experimento se administr a cada estudiante una prueba para medir su nivel de
dominio de la habilidad. Los resultados fueron los siguientes:
Proporcionan estos datos evidencia suficiente como para concluir que el ruido es un factor
que impide el aprendizaje? Sea = 0.05.
30 En un laboratorio de psicologa, los investigadores hicieron llegar, por diferentes conductos,
una sustancia txica hasta el sistema nervioso central de varios animales experimentales. La variable de
inters fue el tiempo, en horas, que corri entre la administracin de la toxina y la iniciacin de los
sntomas. Se obtuvieron los siguientes resultados:
32
Proporcionan estos datos evidencia suficiente como para concluir que, en promedio, la iniciacin
de los sntomas se inicia ms pronto cuando la toxina se administra por el conducto B? Sea = 0.05.
8 Decisin estadstica. Como el valor calculado de t, 2.20, es mayor que el valor crtico de
1.7613, rechazamos H o.
9 Conclusin. Concluimos que las situaciones que producen ansiedad aumentan el nivel de
ese producto qumico en la sangre.
EJERCICIOS
31 La Tabla 6.4 muestra los puntajes de CI de 12 nios a quienes se les diagnostic
inhabilidad para el aprendizaje antes y despus de 9 meses de la iniciacin de un programa remedial.
Proporcionan estos datos evidencia suficiente como para concluir que el programa remedial es
efectivo para aumentar los puntajes de CI en este tipo de nios? Sea = 0.05.
32 La Tabla 6.5 muestra la concentracin de cierto producto qumico en la orina de 10
adultos despus de la administracin, por dos vas distintas, de una droga que contena ese
producto. Proporcionan esos datos evidencia suficiente como para concluir que la administracin
intramuscular de la droga produce una mayor concentracin del producto qumico en la orina?. Sea
33
= 0.05.
33 Un psiclogo seleccion al azar a 15 seoras con sus maridos entre los residentes de un
sector urbano y les solicit que-completaran un cuestionario para medir el nivel de satisfaccin
respecto de la comunidad donde vivan. La Tabla 6.6 muestra los resultados de la encuesta.
Proporcionan estos datos una indicacin de que los maridos de ese sector estn ms satisfechos con
la comunidad que sus esposas? Sea = 0.05.
6.7 VERIFICACION DE UNA HIPTESIS SOBRE UNA PROPORCIN PBLACINAL NICA
Como ya lo hemos visto, con frecuencia deseamos hacer inferencias acerca de proporciones
poblacionales. En el Captulo 5 vimos cmo se construyen estimaciones por intervalos de confianza de
proporciones poblacionales. En esta seccin, vamos a explicar con ejemplos la verificacin de hiptesis
sobre proporciones poblacionales. En el Captulo 4 estudiamos la distribucin muestral apropiada que
sirve de base para esta prueba.
EJEMPLO 6.10
Un trabajador social cree que menos del 25% de las parejas de cierta regin han utilizado por lo
menos una vez alguna forma de control natal. Con el fin de ver si esta suposicin es razonable, el
trabajador social selecciona una muestra aleatoria de 120 parejas de la regin y realiza el siguiente
procedimiento para la verificacin de hiptesis.
34
8 Decisin estadstica. Rechazamos la hiptesis nula puesto que -2.03 < -1.645 (o
tambin, 0.17 < 0.18).
9 Conclusin. Concluimos que menos del 25% de las parejas de la regin han utilizado
alguna vez control natal.
Cuando una proporcin poblacional es el parmetro de inters, se pueden efectuar tambin hiptesis
bilaterales y unilaterales con la regin de rechazo en la cola superior segn sea conveniente.
EJERCICIOS
34 Plantear las hiptesis estadsticas apropiadas para un investigador que desea verificar la hiptesis
nula de que una proporcin poblacional es igual a 0.40. Una muestra de tamao 240 arroja una proporcin
muestral de 0.48. Se debe rechazar Ho en el nivel de significacin 0.05? Fundamentar la respuesta con
el procedimiento adecuado para la verificacin de hiptesis.
35 Un empleado de un departamento estatal de rehabilitacin cree que el 20% de los
jvenes admitidos en las escuelas de rehabilitacin del estado es convicto de robo de automviles. En una
muestra aleatoria de 100 admisiones, 16 jvenes haban sido admitidos debido a robo de automviles.
Contradicen estos datos la opinin del empleado?
36 Un empleado del departamento de agricultura cree que ms del 20 de los hacendados de una
regin trabajan en empleos de tiempo parcial adems de trabajar en su hacienda. Una encuesta realizada
35
a 200 hacendados seleccionados al azar revel que 60 trabajaban en empleos de tiempo parcial. Son
estos datos apoyo para la creencia del empleado?
37 Un candidato a un empleo estatal cree que menos del 25 % de las personas que pueden
votar estn a favor de que pase cierto proyecto de ley sobre el que debe l pronunciarse. En una muestra
al azar de 200 votantes, 30 dijeron que estaban a favor del proyecto de ley. Constituyen estos datos un
apoyo para la opinin del candidato, en el nivel de significacin 0.05'?
38 Un socilogo cree que ms del 70% de los adultos que viven en una regin de bajos ingresos
estara a favor del establecimiento de un centro de recreacin de la comunidad. De una muestra aleatoria
de 200 adultos de la regin, 144 estuvieron en favor de la idea. Apoyan estos datos la creencia del
socilogo? Sea = 0.05.
39 Un especialista que trabaja en una escuela de agricultura cree que con una dieta especial se
lograra aumento de peso en tres meses en ms del 80 % de un grupo de cerdos. En una granja
experimental se escogieron al azar 400 cerdos para alimentarlos con esa dieta. Al final de los tres
meses, 340 cerdos haban aumentado su peso. Estos datos sirven de apoyo al especialista? Sea = 0.05.
40 Una muestra aleatoria de 225 habitantes de apartamentos revel que 18 de ellos posean
perros. Proporcionan estos datos evidencia suficiente como para concluir que menos del 10% de los
habitantes de apartamentos poseen perros? Sea = 0.0.5.
41 El alcalde de una ciudad cree que ms del 60 % de los residentes de un suburbio adyacente
est a favor de anexarse a la ciudad. En una muestra aleatoria de 120 adultos, 76 dijeron que estaban a
favor. Proporcionan estos datos evidencia suficiente como para apoyar la opinin del alcalde? Sea
= 0.05.
42 Se estima que menos del 10% de los estudiantes de una universidad utilizan el
transporte pblico para trasladarse a sus clases. En una muestra aleatoria de 225 estudiantes, 20
dijeron que utilizaban el transporte pblico. Ante esta evidencia, ser realista la estimacin? Sea
= 0.05.
43 En una muestra aleatoria de 255 adultos de cierta regin, 25 dijeron que, en su
concepto, la mayora de las enfermedades mentales eran heredita rias. Servirn estos datos de
fundamento para la hiptesis de que menos del 15% de los adultos de la regin opinan de esta
manera? Sea = 0.05.
6.8 VERIFICACION DE UNA HIPOTESIS SOBRE LA DIFERENCIA ENTRE DOS
PROPORCIONES POBLACIONALES
En la prctica surgen situaciones en las que se desea verificar la hiptesis nula de que dos
proporciones poblacionales, p1 y p2 , son iguales o de que difieren en alguna cantidad especfica.
Por ejemplo, quisiramos verificar la hiptesis de que dos grupos de individuos no se diferencian
respecto de la proporcin de ellos que favorecen la aprobacin de alguna ordenanza de la ciudad.
O, tambin, quisiramos saber si se puede obtener la conclusin de que la proporcin de
mujeres que regularmente miran un programa determinado de televisin excede, en alguna
fraccin precisa, a la proporcin de hombres que ven regularmente el programa. Ya vimos
anteriormente la distribucin muestral ms conveniente para verificar esta clase de hiptesis.
Vamos a explicar ahora, con ejemplos, el mtodo para verificar cada uno de estos dos tipos
de hiptesis.
36
Si hacemos que x1 sea el nmero de elementos que presentan la caracterstica que interesa en la
muestra tomada de la poblacin 1 y que X2 sea el nmero de elementos que presentan la caracterstica en
la poblacin 2, podemos hacer una estimacin combinada de p = p1 = p2 por medio de
Podemos entonces volver a escribir la frmula del error tpico de la siguiente manera:
El siguiente ejemplo ilustra la situacin en que la hiptesis nula especfica que las dos proporciones
poblacionales son iguales.
EJEMPLO 6.11
Un antroplogo cree que las proporciones de individuos de dos poblaciones, que tienen doble
bucle de cabello en la regin occipital, son la misma. Con el fin de ver si hay alguna razn para
dudar de esta hiptesis, el antroplogo toma muestras aleatorias independientes de cada una de
las dos poblaciones y determina el nmero de individuos en cada muestra con esta caracterstica. Los
resultados son los siguientes:
37
forma aproximadamente normal (puesto que n l y n2 son grandes), con un error tpico que se obtiene
por combinacin y una media igual a 0 si la hiptesis nula es verdadera.
5 El estadstico de prueba y su distribucin. Como la distribucin del estadstico pertinente
es aproximadamente normal, el estadstico de prueba es igual a
7 Recoleccin de datos y clculos. Con base en los datos de la muestra que se dieron
anteriormente, calculamos
su combinacin queda
8 Decisin estadstica. Como el valor de z calculado, - 0.67, cae entre -1.96 y +1.96, no
podemos rechazar H o. Procediendo de otro modo, podemos basar nuestra decisin en la magnitud
observada de p 1- p 2 . Como p l - p 2 = 0.23 - 0.27 = -0.04 cae entre -0.12 y +0.12, no podemos
rechazar H0 .
9 Conclusin. En virtud de que no rechazamos H0 concluimos que las dos proporciones
poblacionales pueden ser iguales. Es decir, la proporcin de individuos con doble bucle de cabello en la
regin occipital, puede ser la misma en la poblacin 1 que en la poblacin 2.
En el caso2, la hiptesis nula especifica que p 1 - p2 es distinto de 0. En consecuencia no hay
ninguna justificacin para combinar los datos de las dos muestras al hacer la estimacin de
38
Ejemplo 6.12
Un especialista en poltica de una universidad cree que la proporcin de votantes del rea A que va a
votar en las prximas elecciones excede en ms de 0.05 a la proporcin de votantes del rea B que
votar en las mismas elecciones.
Con el fin de ver si los hechos corroboran esta hiptesis, el profesor hace una encuesta
entre los votantes del rea A y del rea B, con los siguientes resultados.
2 Nivel de significacin.
3 Descripcin de las poblaciones y suposiciones. Las poblaciones consisten en los votantes
del rea A y los del rea B. Suponemos que las dos muestras se han tomado independientemente y al azar
en las respectivas poblaciones.
4 El estadstico pertinente. El estadstico ms adecuado es p A- p B, que est distribuido en
forma aproximadamente normal (puesto que nl y n2 son grandes). Si Ho es verdadera, la meda de la
distribucin es 0.05 o menos (la verificacin se hace para 0.05).
5 El estadstico de prueba. El estadstico de prueba es
39
Proporcionan estos datos evidencia suficiente como para concluir que las proporciones de las
dos poblaciones no son iguales? Sea = 0.05.
45 Un socilogo desea verificar la hiptesis nula de que la proporcin de parejas casadas que
participan en actividades informales de grupo es la misma en dos comunidades. Las muestras aleatorias
independientes de parejas de las dos comunidades arrojan los siguientes resultados:
Proporcionan estos datos evidencia suficiente como para concluir que las dos proporciones no son
iguales? Sea = 0.05.
46 Un investigador que trabaja con un departamento correccional cree que entre los jvenes
encarcelados por actos de violencia, el porcentaje de ellos que fue educado en hogares
superpoblados est muy por encima del 10% respecto del porcentaje de personas encarceladas por
todos los dems crmenes que se educaron en hogares superpoblados. Para obtener evidencia que
apoye esta teora, el investigador tom muestras aleatorias independien tes de los registros de los
ltimos cinco aos en los dos tipos de criminales, y obtuvo los siguientes resultados:
Proporcionan estos datos evidencia suficiente como para fundamentar la opinin del investigador
en el nivel de significacin 0.05?
47 Un socilogo cree que la proporcin de hombres que pertenecen a un grupo
socioeconmico determinado (grupo A) y que ven regularmente lucha en televisin, supera en mucho a
un segundo grupo de hombres (grupo B) que tambin ven lucha. Muestras aleatorias simples de los dos
40
0.05.
Proporcionan estos datos evidencia suficiente como para apoyar la tesis del socilogo? Sea =
Proporcionan estos datos evidencia suficiente como para creer que la proporcin de estudiantes
que son tenidos por muy religiosos es ms alta entre los no pendencieros que entre los pendencieros?
Sea = 0.05.
49 Una trabajadora social que desea comparar dos comunidades respecto de varias variables,
selecciona una muestra al azar independiente de 120 hogares de la comunidad A y una muestra aleatoria
independiente de 100 de la comunidad B. Treinta y seis familias de las 120 de la comunidad A y 35 de las
100 de la comunidad B estn recibiendo asistencia oficial. Sern estos datos suficientes para
concluir que las proporciones de los hogares que reci ben asistencia oficial en las dos
comunidades son diferentes? Sea = 0.01.
50 Un consejero de rehabilitacin que trabaja en un departamento correccional, cree que un
programa de rehabilitacin va a reducir en ms de un 15% la reincidencia entre los prisioneros que se
dejan en libertad. Se escogieron al azar 100 prisioneros para participar durante un ao en el programa de
rehabilitacin. Otros 100 se escogieron, tambin al azar, para servir de grupo de control. Se hizo un
seguimiento de los dos grupos durante cinco aos. Al trmino de este perodo, 22 personas del grupo
experimental y 45 del grupo control haban sido halladas nuevamente culpables. Se justifica la tesis del
consejero sobre el programa de rehabilitacin? Sea = 0.05.
51 Un bilogo que investiga los efectos de dos mtodos para hacer que una planta adquiera
resistencia en una enfermedad, en el curso de su investigacin obtiene los siguientes resultados:
Con base en estos datos puede concluir el bilogo que las proporciones de las plantas que
adquieren resistencia son diferentes? Sea = 0.05.
41
42
43
44
APENDICE D TABLAS
45
46
47
PROCEDIMIENTOS NO PARAMTRICOS DE
PRUEBA DE HIPOTESIS.
Presentacin
El siguiente manual tiene como propsito presentar en forma resumida la lgica de aplicacin de algunas
pruebas no paramtricas y sus procedimientos de clculo mediante las ecuaciones correspondientes y
va el paquete estadstico SPSS1. No pretendemos ser exhaustivos en la revisin de todos los
procedimientos, sino que se abarcan aquellos que corresponden a la asignatura de Estadstica en
el tercer semestre de la carrera de Psicologa impartida en la Facultad de Psicologa de la UNAM.
Las pruebas que se presentan en la primera parte son la prueba X 2 como Bondad de Ajuste
y la prueba del Signo que se consideran poderosas para observaciones en diseos de una
muestra y que tienen como propsito general probar la hiptesis nula de que la distribucin de datos de
una muestra se ajusta a la distribucin de los datos de la poblacin de referencia que tiene
caractersticas especficas (Pruebas de Bondad de Ajuste, Siegel y Castellan, 1995).
En la segunda parte se revisan procedimientos para la prueba de hiptesis a partir de los
datos de dos muestras que tienen como propsito identificar si existen diferencias entre dos
condiciones o tratamientos para evaluar los efectos de una variable independiente sobre una
variable dependiente, o bien entre dos condiciones distintas de observacin
Con tal propsito se pueden tener dos tipos de muestras: relacionadas o independientes.
Las muestras relacionadas implican que un mismo sujeto es medido dos veces, esto alude a
diseos de antes y despus, o de dos condiciones relacionadas; este tipo de diseos reclama que el
sujeto funja como su propio control o bien que se emparejen dos sujetos con caractersticas muy
similares (pares igualados). Las muestras independientes implican una sola medicin para cada
grupo de sujetos.
Por ejemplo si se desea evaluar el efecto de una droga para reducir el nivel de depresin, se
puede tener muestras relacionadas cuando a un sujeto se le mide su nivel de depresin antes de
darle la droga, se le da la droga, y despus de un lapso se le vuelve a medir su nivel de
depresin. El efecto se determina comparando los niveles de depresin antes y despus de la droga.
Se puede tener muestras independientes para probar la misma droga si a un sujeto se le
administra la droga y a otro no (esto es un diseo de grupo experimental y grupo control), y
despus de un tiempo se comparan los niveles de depresin de los dos sujetos para evaluar el efecto de la
droga.
Existen varios procedimientos que cumplen el propsito de comparar dos grupos, ya sean
muestras relacionadas o independientes, en este material se presentan algunos de dichos
procedimientos que se consideran entre los ms poderosos para los diseos que emplean dos muestras.
En la tercera y ltima parte se revisan los anlisis de varianza no paramtricos para k
muestras relacionadas (Prueba de Friedman) y para k muestras independientes (Prueba de
Kruskall Wallis) que permiten probar hiptesis sobre la diferencia estadstica entre varios grupos.
Es importante destacar que los procedimientos estadsticos no permiten establecer
determinantes causales entre variables, sino que slo nos permiten descartar al azar como
explicacin de los datos y/o de las diferencias entre los grupos o condiciones comparadas.
Esperamos que este material sea til para comprender algunos procedimientos no paramtricos
y su adecuada aplicacin en el anlisis de datos.
48
49
50
OBJETIVO
Determinar si una muestra aleatoria proviene de una poblacin especfica (si la distribucin
de la muestra es igual o diferente que la distribucin de la poblacin)
La lgica de la prueba implica la comparacin de frecuencias observadas de cada una de
las categoras a medir en la muestra contra las frecuencias esperadas para cada categora en
la poblacin, es decir si los datos de una muestra se ajustan a los datos esperados para la
poblacin.
SUPUESTOS
1. Una muestra obtenida en forma aleatoria.
2. Variables categricas con escala de medida nominal
3. Muestras grandes (N > 30)
4. Frecuencia Esperada > 5 (cuando FE es menor a 5 se aplica el procedimiento de correccin de Yates
FO FE 0.5 / FE
(2 (
DISTRIBUCIN MUESTRAL.
Distribucin que proporciona los valores esperados con k - 1 grados de libertad (Donde k es
el nmero total de categoras observadas)
TIPO DE DATOS
51
REGLA DE DECISIN
de k-1
Se emplea la tabla de valores crticos de X2 para obtener el valor de X2t, considerando la interseccin
en la tabla de los de grados de libertad y el nivel de significacin. Para obtener la p(X2o) se considera
el valor de la X2o o una aproximacin de la misma en relacin con los grados de libertad, la columna
en donde se ubique el valor observado corresponder a la probabilidad deseada.
EJEMPLO PRUEBA X 2 COMO PRUEBA DE BONDAD DE AJUSTE
Se intenta identificar si en la poblacin de adolescentes de la zona sur del D. F. existe una
proporcin similar de eleccin entre ocho carreras comunes. Para tal efecto se tom una muestra
aleatoria de 144 estudiantes de secundaria de la zona sur del D. F., a quienes se encuest sobre su
preferencia vocacional tomando como base las ocho carreras comunes. Se registro la frecuencia
de eleccin de cada carrera. Los datos se presentan en la tabla 1.
Probar la Hiptesis nula de que la distribucin de frecuencias observadas en la muestra es igual a
la distribucin de frecuencias esperadas en la poblacin.
SOLUCIN
Variable Categrica: Tipo de carrera elegida
Nmero de categoras: 8
52
Paso 5. Decisin
Para obtener el valor observado de 2 y tomar la decisin estadstica se aplica el
procedimiento con la frmula de 2.
5.1 Obtener el estadstico FRMULA
SUSTITUMOS
X2 = [(29 - 18)2 /18+ (19-18)2 / 1 8 + ( 1 8 - 1 8 ) 2 / 18 + (25 - 18)2 /18 + (17-18)2 /18+ (10-18)2 /18 +
(15-18) 2 /18 + (11 -18) 2 /18]=16.33
X2 =16.33
Dado que X2o > X2t, 0.05, gl= 7; podemos rechazar la Ho y sealar que la Hi tiene mayor
probabilidad de ser aceptada.
Decisin estadstica:
Dado que rechazamos Ho podemos decir que si existe diferencia entre la distribucin de la
muestra y la distribucin de la poblacin (las frecuencias esperadas son diferentes de las
frecuencias observadas y esta diferencia no es producto del azar); X 2o = 16.33; a 0.05, gl 7)
Conclusin: Existe suficiente evidencia estadstica para considerar que los adolescentes del sur del
D. F. tienen preferencias vocacionales en proporciones distintas de acuerdo con las carreras
consideradas
53
54
55
Para obtener el valor de Ji cuadrada debemos seguir la siguiente ruta (ver figura 3)
Desde el men
Statistics y el submenu
Non Parametric Test
Chi Square
En la ventan de la prueba se seala cual es la variable a probar que debe ser la variable categrica, en este
caso carrera (ver figura. 4), una vez seleccionada se oprime la tacla Ok para la hoja de resultados (el
56
57
58
TABLA F
59
OBJETIVO
Poner a prueba una hiptesis respecto a la mediana de una pobla cin continua.
La lgica de la prueba se basa en contrastar el nmero de signos + con el de signos-.
Los signos + corresponden a los valores de la muestra que son mayores a la mediana, los signos
- a los que son menores.
Esta prueba se considera la alternativa no paramtrica de la prueba t para una muestra.
SUPUESTOS
1.
2.
3.
4.
60
Para muestras grandes (N > 50) se usa la aproximacin por la normal, aplicando la siguiente
frmula:
REGLA DE DECISIN
Si N+o ( N-o) N+t (o N-t), n, a Rechazamos Ho Si p(z) Rechazamos Ho
Determinar con alfa=.05 que el tiempo de reaccin es diferente a 3.50. Se desconoce si la distribucin
de la cual provienen los datos posee una distribucin normal.
SOLUCIN
Variable: tiempo de reaccin en escala intervalar
61
Paso 5. Decisin
Para obtener el valor observado de N y tomar la decisin estadstica se aplica el
procedimiento descrito para determinar el valor de N.
N+= 1
N-=9
n=10
Para una prueba de dos colas se elige el signo que aparece con menor frecuencia, en este caso N+=1
odemos rechazar Ho
Decisin estadstica:
Dado que rechazamos Ho podemos decir que el tiempo de reaccin es diferente de 3.50.
Conclusin:
Existe suficiente evidencia estadstica para decir que el tiempo de reaccin al estmulo auditivo
al que fueron expuestos los sujetos es diferente de 3.50 segundos.
EJEMPLO PARA MUESTRAS GRANDES
Retomando el mismo ejemplo pero ahora con una muestra de 60 sujetos, supongamos que se obtienen
N+=20, N-=35, cinco valores iguales a 0 y n=55.
SOLUCIN
Variable:
Tiempo de reaccin en escala intervalar
62
= 0.05
Para una prueba de dos colas se elige el signo que aparece con menor frecuencia, en este caso N+=20
63
Decisin estadstica:
Dado que rechazamos Ho podemos decir que el tiempo de reaccin es diferente de 3.50.
Conclusin:
Existe suficiente evidencia estadstica para decir que el tiempo de reaccin al estmulo auditivo al
que fueron expuestos los sujetos es diferente de 3.50 segundos.
Nota: La prueba del signo para una muestra no puede calcularse en SPSS ya que se contiene este
anlisis slo para el caso de 2 muestras.
64
65
66
67
OBJETIVO
Identificar si existen cambios significativos en la proporcin de casos que presentan cierta
caracterstica medida antes y despus de un tratamiento.
SUPUESTOS
1. Variables discretas con escala de medida nominal u ordinal
2. Diseo antes y despus
3. muestras relacionadas
TIPO DE HIPTESIS A PROBAR
Ho. An = De (No existen cambios significativos despus de un tratamiento)
Hiptesis alterna sin direccin
Hi: An De (Si existen cambios significativos despus del tratamiento)
Hiptesis alterna con direccin
Hi: An > De (Los valores antes del tratamiento son mayores a los valores despus del tratamiento)
Hi: An < De (Los valores antes del tratamiento son menores a los valores despus del tratamiento)
DISTRIBUCIN MUESTRAL
Distribucin X2 que proporciona los valores esperados con gl = 1
TIPO DE DATOS
Frecuencia de cambios observados de la variable (VD) medida en dos momentos (antes y despus
de un tratamiento o VI). Los datos se agrupan en una tabla de contingencia de cuatro entradas en la
siguiente forma
Por ejemplo: si medimos la actitud ante la educacin sexual en las escuelas como a favor y en contra,
antes y despus d una sesin informativa. Al tomar la frecuencia en estas dos mediciones tendramos:
68
Frec.
Frec.
Frec.
Frec.
De
De
De
De
69
SOLUCIN
VI: Textos narrativos (entrenamiento)
VD: Frec. De comprensin y no comprensin lectora (medida antes y despus del entrenamiento)
Paso 1. Establecer las hiptesis a probar
Ho: No existen cambios significativos despus del entrenamiento
Hi: Existe mayor proporcin de cambios de no comprensin a comprensin
70
Dado que X2o > X2t , 0.05, gl 1; y en trminos de probabilidad = 0.02 (valor asociado a X2o) es
menor que el alfa elegido de 0.05, podemos rechazar la Ho descartar el azar como explicacin de los
datos.
Decisin estadstica:
Dado que rechazamos Ho podemos decir que existe la probabilidad de observar mayor proporcin de
cambios .de no comprensin a comprensin lectora despus del entrenamiento: (X 2 5.786, p =
0.02,
gl=1)
Conclusin
Dada la evidencia estadstica podemos decir que los textos narrativos incrementan la
frecuencia de comprensin lectora en nios de 2 de primaria.
PROCEDIMIENTO DE CALCULO DE X 2 PARA LA PRUEBA DE MCNEMAR UTILIZANDO SPSS
A continuacin se presentan los pasos a seguir para obtener la hoja de resultados de la prueba de
McNemar.
71
la primera medicin (antes), otra para la segunda medicin (despus) y una tercera para las
frecuencias observadas. La nomenclatura de las etiquetas que definirn las celdillas tanto en la
primera y segunda medicin, debe ser la misma para sealar el cambio de antes a despus en la base
de datos. En el ejemplo tenemos que comprensin ( + ) y no comprensin ( -) en ambas
evaluaciones; sin embargo, el programa slo acepta variables numricas, por lo tanto, en lugar del
signo + emplearemos el valor 1 y para el signo - el valor 2. La definicin de las variables y sus
etiquetas se realiza como sigue (Ver figura 1):
Desde el men Data y el submen
Define variable: en esta ventana defines la siguiente informacin:
Variable name: nombra la variable para la primera columna (slo acepta 8 caracteres). En
este caso la variable se llama antes.
Labels Para activar esta ventana das clic en el botn Labels de la ventana Define Variable.(ver
figura 2). En este submen capturas el nombre de la variable en label (aqu puedes
poner el mismo nombre y especificarlo usando ms de ocho caracteres.) En el recuadro
value capturas el valor 1 y en el recuadro value label escribes comprensin.Das c iic en
Add. Posteriormente capturas el valor 2 y escribes no comprensin. Das clic en Continue.
Para cerrar la ventana Define variable das clic en OK.
A continuacin, defines la variable despus de la misma forma que la variable antes, incluyendo
las mismas etiquetas. Posteriormente defines la variable frecuencias escribiendo, slo su nombre
en Variable name (recuerda que slo puedes usar 8 caracteres).
Una vez definidas las variables se teclearn los valores conforme a la tabla. Para capturar los datos de la
primera celda (A) escribiramos 1 en la columna antes, 2 en la columna despus y 2 en la columna
frecuence; con esto indicamos que los sujetos que primero comprendan y luego no fueron solamente dos.
Para la segunda celda (B) sera 1, 1, 6, los sujetos que comprendieron antes y despus fueron seis. Para la
tercera celda (C) 2, 2, 4, los sujetos que no comprendieron ni antes ni despus fueron 4. Para la cuarta
celda (D), 2, 1, 12, los sujetos que no comprendan antes pero despus s fueron 12 (ver figura).
72
73
Una vez que se ha hecho la indicacin mencionada se procede a correr el anlisis siguiendo la ruta:
Statistics (o Analize).
Nonparametrics tests
2 related samples (ver figura 6 a)
En la ventana Two-Related Samples Test seleccionar las variables antes y despus y pasarla al
recuadro de Test Par(s) List dando clic en el botn que est en medio de ambos recuadros. Desmarcar
Wilcoxon dando un clic en el cuadro correspondiente y dar clic en McNemar. Dar clic en OK (Ver figura).
74
En el caso de la prueba de McNemar si las frecuencias esperadas son menores a 5 se hace uso de la
distribucin binomial, si son iguales o mayores que 5 se utiliza la distribucin X 2. Con base en esta
consideracin el programa presenta los datos de la binomial o de X2. Cuando proporciona los datos de
la binomial slo presenta la probabilidad de ocurrencia del estadstico (ver hoja de resultados de la
pgina anterior), en el caso de X 2 presenta el valor del estadstico, sus grados de libertad y su
probabilidad asociada (como se muestra al final de este prrafo).
75
76
77
Rango d: Se considera que el rango 1 ser asignado a la diferencia ms pequea y el ltimo rango
corresponder a la diferencia ms grande. No se considera como dato el valor de diferencias igual a 0, y
adems el signo de la diferencia no tiene valor aritmtico, es decir el 2 es igual que el -2. .
Debe respetarse el signo de la diferencia slo para identificar cul es aquel signo menos
frecuente.
Si existen diferencias iguales (ligas) se asignar el rango promedio. Por ejemplo supongamos
que existen las siguientes diferencias: 4, 7, 8, -5, 8, 2, - 3, 5, 6, 9, 3.
La N para usarlo como valor de tabla siempre ser igual al nmero total de pares menos
aqullos cuya diferencia es igual a 0.
78
REGLA DE DECISIN
Para N 25
Si To
Rechazamos la Ho
79
5.2 Obtener Tt
Dado que la hiptesis alterna es unidreccional, se toma el valor de la tabla correspondiente con
el nivel de significacin de una cola. Se ubica entonces en la tabla y se intersecta con el tamao
de N (sin considerar todas aquellas diferencias iguales a 0).
80
Decisin estadstica:
Dado que rechazamos Ho podemos decir que las diferencias observados a favor de la condicin A no
son resultado del azar, es decir, se apoya estadsticamente la consideracin de que los puntajes en la
condicin A son menores que los puntajes en la condicin B (To 12; 0.05, N = 13)
Conclusin. Existe suficiente evidencia estadstica para considerar que la presentacin de palabras
e imgenes mejora el aprendizaje gramatical en nios de primero de primaria, por lo menos en esta
muestra.
EJEMPLO PARA N > 25
Tomando en consideracin el ejemplo anterior, con una muestra de 28 nios de 4 de primaria,
con una lista de 60 palabras. Probar la Ho de que las condiciones son iguales.
SOLUCIN
Variable Independiente: Forma de presentacin de las palabras Condicin A: Palabras solas
Condicin B: Palabras e imgenes
Variable Dependiente: Nmero de palabras escritas correctamente
Paso 1. Establecer las hiptesis a probar
Ho: A = B
Hi: A B
Paso 2. Elegir la prueba estadstica
Dado que nos interesa identificar si existe diferencias entre las condiciones A y B, que
tenemos una Variable Dependiente a escala ordinal medida en dos condiciones, muestras
relacionadas y N mayor a 25, aplicaremos la prueba T de Wilcoxon para muestras grandes.
Paso 3. Especificar alfa
Se emplear un a = 0.05 tomando en consideracin que tenemos muestras de tamao 28.
Paso 4. Regin de Rechazo
Dado que la Hiptesis alterna es sin direccin la Ho podr ser rechazada si el valor observado cae en
cualquiera de los extremos de la distribucin normal (Prueba bilateral).
Paso 5. Decisin
81
FORMULA
82
5.3. Obtener la p asociada a z con la tabla del rea bajo la curva normal de rea menor o ms all
de z.
En la tabla de la distribucin normal, se encuentra la columna C que contiene el rea bajo la curva
ms all de z (Pagano, 1998). Para determinar p, primero se ubica el valor de z calculado en la
primera columna, despreciando su signo. (si no aparece el valor exacto se considera el ms
cercano), posteriormente se contina sobre el rengln del valor z identificado hasta la columna C,
siendo el valor encontrado la probabilidad asociada al valor z. Cuando la prueba es de una cola se toma
tal cual el valor encontrado ya que la tabla da los valores del extremo derecho, cuando la prueba es de
dos colas la probabilidad se duplica para considerar los dos extremos. Para el ejemplo: p (z) =
0.0001
5.4. Comparar el valor observado contra el valor esperado y aplicar la regla de decisin
Si p (z)
0.0001 < 0.05
Rechazamos Ho
podemos rechazar la Ho
Decisin estadstica:
Dado que rechazamos Ho podemos decir que las diferencias que existen entre ambas condiciones son
significativas, es decir, descartamos el azar como explicacin de dichas diferencias (T = 29.5; p
= 0.0001, N = 27)
Conclusin.
Existe suficiente evidencia estadstica para considerar que la presentacin de palabras e imgenes
proporciona resultados diferentes que la presentacin de slo palabras, respecto del aprendizaje
gramatical en nios de cuarto de primaria, por lo menos en esta muestra.
PROCEDIMIENTO DE CALCULO DE T PARA LA PRUEBA DE WILCOXON UTILIZANDO SPSS
Paso1 Se elabora la base de datos
Para capturar los datos primero se definen dos variables, una para la primera condicin y otra para
la segunda con el siguiente procedimiento:
Data
Define variable
Variable name: nombra la primera condicin. En este caso es palabras solas.
OK
La segunda condicin se define de la misma forma. En este caso su nombre es palabras e imgenes.
Recuerda que slo puedes emplear ocho caracteres. Una vez definidas las variables teclea los valores
correspondientes en forma de lista (Ver figura).
83
84
85
86
TABLA I
Valores crticos de T para la prueba ele rangos con sigue ele Wilcoxon
87
88
89
90
APENDICE D TABLAS
91
92
Distribucin X2 que proporciona los valores esperados para todas las muestras posibles obtenidas
en forma aleatoria. Con gl = (c - 1)(r - 1). Donde c es el nmero total de columnas y r el nmero
total de renglones) se obtiene el valor crtico de X2
TIPO DE DATOS
Frecuencias de casos observados en cada categora propia de las variables medidas.
Cada variable debe incluir por lo menos dos categoras mutuamente excluyentes (los grupos en
el caso de esta prueba representan categoras)
Las frecuencias observadas se vacan en una tabla de contingencias que mnimamente debe
93
OTRAS FRMULAS:
b) Cuando tenemos una tabla de contingencia de cuatro entradas puede utilizarse la siguiente
ecuacin
REGLA DE DECISIN
Si X2o X2t,
gl Rechazamos Ho
0 bien, Si p (X 2 ) . -. Rechazamos Ho
Se emplea la tabla de valores crticos X2 que nos proporciona el valor esperado o de tablas y su
probabilidad asociada como lo revisamos en el caso de la prueba de Bondad de Ajuste
EJEMPLO PRUEBA X2 COMO PRUEBA HOMOGENEIDAD
94
Se intenta identificar si existen diferencias entre las prcticas de crianza que adoptan
padres con diferentes estilos de relacin de pareja. Para tal propsito se tomaron en forma
aleatoria tres muestras o grupos de 32 parejas cada uno. Cada grupo se diferenci por su estilo de
relacin de pareja. El grupo 1 lo constituan parejas con un estilo agape (relacin apoyada en la
razn); grupo 2 lo constituyeron parejas con un estilo eros (relacin apasionada) y el grupo 3
fueron parejas con un estilo ludus (relacin apoyada en el juego). Se aplic un cuestionario
para clasificar la prctica de crianza adoptado por cada pareja. Se registr la frecuencia de
casos para cada una de las siguientes categoras: autoritario, permisivo, negociador segn el grupo
de pertenencia. Los datos observados se distribuyen normalmente en cada categora. Probar si
existen diferencias significativas entre los grupos.
SOLUCIN
Variable Medida. Estilos de crianza
Categoras: autoritarios, permisivos, negociadores
Variable de agrupamiento: Estilos de relacin de pareja que definen los grupos Categoras: agape
(G1), eros (G2), ludus (G3)
Paso 1. Establecer las hiptesis a probar
Ho: G1 = G2 = Gn
Hi: G1 G2: Gn
Paso 5. Decisin
Para obtener el valor observado de X2 y tomar la decisin estadstica se aplica el
procedimiento con la frmula de X 2.
5.1 Agrupar las frecuencias observadas en una tabla de contingencias y calcular las Frecuencias
esperadas
95
Calculo de las FE
96
Conclusin
Dada la evidencia estadstica podernos decir que no existen diferencias en las
prcticas de crianza adoptados por padres con diferentes estilos de relacin de pareja, por
lo menos en las muestras observadas.
PROCEDIMIENTO DE CLCULO MEDIANTE EL PAQUETE SPSS
A continuacin se presentan los pasos a seguir para obtener el estadstico de la prueba de X2
de homogeneidad. Para la decisin estadstica se toma la regla de decisin: Si p(z) se
rechaza la Ho
Paso 1 Se elabora la base de datos
Se definen tres columnas. Una de ellas especifica las categoras correspondientes a una variable
(en este caso a los grupos), otra de las columnas corresponde a las categoras de la otra
variable (en este caso prcticas de crianza). Ambas variables deben etiquetarse
adecuadamente con nmeros desde el 1 hasta k categoras; la tercera columna corresponde a
las FO. Una vez definidas se vacan los datos combinando las categoras de grupo y de la otra
variable, es decir la base de datos debe quedar como la tabla de contingencia.
Recuerda que para definir las variables usamos el men Data y el submen Define Variable y
para etiquetar usamos !a opcin label como se muestra en la figura siguiente
As la base de datos debe representar la tabla de contingencia con renglones y columnas (Ver figura)
97
98
Con los datos obtenidos como lo muestra la hoja de resultados podemos decir lo siguiente:
Al aplicar la prueba X2 de homogeneidad para comparar las prcticas de crianza que adoptan los padres
de tres grupos distintos se observo un valor X2 (4) = 1.748 con una probabilidad asociada de 0.789.
Dado que el valor de la probabilidad es mayor al alfa elegido (0.05) se acepta la Ho, por lo tanto no
existen diferencias estadsticamente significativas entre los grupos con respecto a sus prcticas de
crianza.
Hoja de resultados datos del anlisis de X2
99
100
101
PROCEDIMIENTOS
El caso de n 2 < 20
1. Se construye una tabla de rangos para cada muestra (tales rangos se asignan considerando el
orden jerrquico y la ligas o datos iguales para los datos agrupados de todas las observaciones,
es decir combinando en cada muestra)
Rechazamos la Ho
102
3. Se identifica la p(z) con la tabla de valores del rea bajo la curva normal ms all de z
REGLA DE DECISIN
Si p(Z) Rechazamos Ho
EJEMPLO PARA n 2 20
Un investigador est interesado en identificar si la presencia o ausencia de
retroalimentacin constante durante la enseanza de las matemticas afectan diferencialmente
el aprendizaje de las mismas. Participaron en el estudio 30 estudiantes de secundaria asignados
aleatoriamente a dos grupos independientes. El primer grupo o grupo control no recibi
retroalimentacin durante la prctica de matemticas y el grupo 2 o experimental recibi
retroalimentacin constante durante la prctica. A ambos grupos se les aplic un examen al final de
la prctica que constaba de 80 preguntas.
Con los datos probar la hiptesis nula de que no existen diferencias entre grupos
103
SOLUCIN
Variable Independiente: Retroalimentacin continua Grupo Control: Sin retroalimentacin Grupo
experimental: Con retroalimentacin
Variable Dependiente: Nmero de respuestas correctas en el examen
Paso 5. Decisin
Para obtener el valor observado de U y tomar la decisin estadstica se aplica el
procedimiento para n _< 20
104
5.4 Comparar el valor esperado contra el valor obtenido aplicando la regla de decisin
101.5 > 64
Rechazamos Ho.
105
SOLUCIN
Variable Independiente: Retroalimentacin continua Grupo Control: Sin retroalimentacin Grupo
experimental: Con retroalimentacin
Variable Dependiente: Nmero de respuestas correctas en el examen
Paso 5. Decisin
Para obtener el valor observado de U y tomar la decisin estadstica se aplica el procedimiento
para n > 20
106
5.3 Dado que n2 > 20 se aplica la frmula de z para obtener la pro babilidad asociada a U
mediante el rea, bajo la curva ms all de z
107
5.5 Comparar el valor esperado contra el valor obtenido aplicando la regla de decisin
Decisin estadstica:
Dado que rechazamos Ho podemos decir que existen diferencias significativas entre los grupos que no pueden
ser atribuidas al azar (z = -5.56, p < 0.0001)
Conclusin
Existe evidencia estadstica que sugiere que la presencia o ausencia de retroalimentacin afectan
diferencialmente el desempeo en pruebas de matemticas en estudiantes de primaria, por lo menos
en esta muestra.
Conclusin general
Podemos decir que la retroalimentacin continua tiene efectos significativos sobre el nmero de
respuestas correctas en una prueba de matemticas en estudiantes de 6 de primaria pero no as en
estudiantes de secundaria.
108
As la base de datos debe tener una columna de grupos y otra de puntajes como se muestra en la
figura.
109
En la ventana de !a prueba se seala cual es la variable que se va a probar este caso puntaje) cual es
la variable que corresponde a los grupos. Una vez asignada la varale grupos en la ventana se
activa un botn para definir grupos (en trminos de la Atiquetacin que se asign en la base de
datos), se da un clic y se escribe el nmero que corresponde a cada gi-upo.
110
111
Decisin estadstica.
Dado que rechazamos Ho podemos decir que existen diferencias significativas entre los grupos no atribuibles
al azar (z = -5.45, p < 0.0001)
Conclusin
Existe evidencia estadstica que sugiere que la presencia o ausencia de retroalimentacin afectan
diferencialmente el desempeo en pruebas de matemticas en estudiantes de primaria, por lo menos en
esta muestra.
112
113
APNDICE D TABLAS
114
115
116
117
PRUEBA DE FRIEDMAN
OBJETIVO
Identificar si tres o ms muestras relacionadas o igualadas (k muestras) pertenecen a la misma
poblacin o a distintas poblaciones; en otras palabras esta prueba nos permite determinar si la distribucin
de tres o ms muestras relacionadas es semejante o diferente.
La lgica de la prueba implica identificar el orden de los datos segn su valor de menor a mayor que
d cada uno de los grupos. Se asignan rangos para cada valor y se obtiene el rango promedio de cada
grupo, si la diferencia entre tales promedios de rangos es significativa entonces se puede rechazar la Ho.
Esta prueba se aplica cuando se tienen diseos en los que un mismo sujeto es medido tres o ms
veces o cuando sujetos diferentes son igualados en varias variables y se asignan de manera aleatoria a cada
una de las condiciones, de tal suerte que se consideran como una misma fuente de observacin de la cual se
obtienen k medidas.
SUPUESTOS
1. Variable continua
2. Escala Ordinal para la variable medida
3. Tres o ms muestras relacionadas
TIPO DE HIPTESIS A PROBAR
Ho: No existen diferencias significativas entre la distribucin de las distintas muestras
(G1 = G2= G3 = ....Gk)
Hiptesis alterna sin direccin
Hi: Si existen diferencias significativas entre la distribucin de las muestras.
(G1: G2 G3 .... Gk )
DISTRIBUCIN MUESTRAL
Distribucin Xr2 que proporciona los valores esperados para muestras pequeas y la
distribucin X2 proporciona los valores esperados para muestras grandes.
TIPO DE DATOS
Puntajes ordinales correspondientes a los k grupos relacionados. PROCEDIMIENTOS
Muestras pequeas (k=3 4 y n<9)
1. Se ordenan los puntajes en una tabla de dos clasificaciones de k columnas (condiciones) y N
renglones (sujetos). En cada rengln se asigna a cada observacin el rango que le corresponda de
manera ascendente (al valor ms pequeo se le asigna el rango 1, al valor que le sigue el rango 2 y
as sucesivamente) considerando las ligas.
2. Una vez asignados los rangos se calcula para cada condicin la suma de los rangos y/ o su rango
promedio.
118
La frmula para datos ligados se aplica, an en muestras pequeas, cuando existe el 25% o ms de
observaciones ligadas, y particularmente cuando algunos valores de t son grandes; por ejemplo
cuando t=6.
3. Se obtiene el valor esperado de X r2 (Xr2 t) de la tabla de valores crticos de X 2 con gl= k-1 para
un nivel de significacin particular, donde k = nmero de condiciones (o muestras relacionadas).
REGLA DE DECISIN
COMPARACIONES MLTIPLES
119
Xr2 slo indica si las condiciones difieren o no entre s en trminos generales. Cuando Xr2 es significativo,
es decir, se rechaza la hiptesis nula, X r2 slo indica que existen diferencias en la variable
dependiente segn la condicin pero no especifica cules son las condiciones en los que se
observan tales diferencias. Para ello es necesario hacer comparaciones entre pares de condiciones
para detectar entre qu par est dada la diferencia.
PROCEDIMIENTO
1.
2.
Obtener la diferencia absoluta, es decir, haciendo caso omiso del s igno, de los rangos
promedio en cada comparacin.
3.
Calcular la diferencia crtica (DC). Como el nmero de casos (N) es el mismo en todas las
condiciones slo se calcula una diferencia crtica.
120
SOLUCIN
Variable Independiente: Tipo de mtodo
Contiene tres niveles: mtodo1, mtodo2, mtodo3
Variable Dependiente: Nmero de respuestas correctas en el examen
Paso 5. Decisin
Para obtener el valor observado de Xr2 y tomar la decisin estadstica se aplica el procedimiento para
muestras pequeas.
5.1 . Asignacin de rangos para las observaciones de cada rengln por separado.
Calcular en cada muestra la suma de rangos y el rango promedio.
121
SUSTITUIMOS
5.3 Obtener el valor de Xr2t,a, n1, n2, n3
5.4 Comparar el valor esperado contra el valor obtenido aplicando la regla de decisin
6.2.
Obtener la diferencia absoluta , es decir, haciendo caso omiso del signo, de los rangos
promedio en cada comparacin.
122
6.3.
Calcular la diferencia crtica (DC). Como el tamao de las muestras es igual slo se calcula
una diferencia crtica.
se obtiene de la tabla AII intersectando el nmero de comparaciones calculado en el paso 1 con el nivel
de significancia especificado. En este caso 3 comparaciones con un alfa de .05 para una prueba bidireccional (slo
se desea saber si hay diferencias entre los dos mtodos que se comparan, no se especifica una direccin). Z/k(k-1)
= 2.394
7. Comparar la diferencia de los rangos promedio con la diferencia crtica. La diferencia observada
en el par comparado es significativa si es mayor o igual a DC.
8. En el par comparado cuya diferencia result significativa determinar a favor de quin est la
diferencia mediante la observacin de sus rangos promedio.
IM1 - M3I = 2.7 - 1.0 = 1.7 > 1.51
Como la variable dependiente est medida en trminos del nmero de respuestas correctas, un
puntaje alto indica un mejor desempeo, as el mtodo en el cual se encuentra un rango promedio
alto indica que fue ms efectivo para mejorar la ejecucin. La diferencia entre los rangos
promedio del mtodo 1 y el 3 result significativa siendo el mtodo 1 el que presenta un rango
promedio ms alto, por lo que puede decirse que este mtodo es ms efectivo que el mtodo3.
Conclusin
Existe evidencia estadstica que indica que hay diferencias significativas en la ejecucin de
problemas matemticos segn el mtodo empleado, especficamente entre el mtodo 1 y el mtodo 3,
de los cuales el mtodo 1 es el ms efectivo, por lo que podra decirse que ste es el ms conveniente
para implementarse.
EJEMPLO PARA MUESTRAS GRANDES
Se realiz un estudio semejante al anterior y con el mismo propsito, slo que se emple una muestra
mayor de sujetos y se probaron 4 mtodos de enseanza en lugar de tres (datos en la tabla 3) Participaron en
el estudio 10 estudiantes de educacin media superior, quienes fueron expuestos a los cuatro mtodos.
Con los datos probar la Ho correspondiente.
123
SOLUCIN
Variable Independiente: Tipo de mtodo
Contiene cuatro niveles: mtodo1, mtodo2, mtodo3, mtodo4
Variable Dependiente: Nmero de respuestas correctas en el examen
Paso 5. Decisin
124
5.1. Asignacin de rangos para todas las observaciones de cada rengln por separado. Calcular
en cada muestra la suma de rangos y el rango promedio.
5.2 Calcular Xr 2 aplicando la frmula:
En este ejemplo se aplica la frmula para las ligas ya que el 35% de los datos estn ligados.
En esta frmula las ligas consideran valores de t=1. Para cada rengln determinaremos las ligas
existentes y los valores de t.
125
SUSTITUIMOS
126
5.5 Comparar el valor esperado contra el valor obtenido aplicando la regla de decisin
127
128
129
Conclusin
Existe evidencia estadstica que indica que hay diferencias significativas en el rendimiento en la
ejecucin de problemas matemticos segn el mtodo empleado, especficamente entre el mtodo
1 y el mtodo 3, de los cuales el mtodo 1 es el ms efectivo, por lo que podra decirse que
ste es el ms conveniente para implementarse.
130
131
* # c es el nmero de comparaciones.
132
PRUEBA DE KRUSKAL-WALLIS
OBJETIVO
Identificar si tres o ms muestras independientes (k muestras) pertenecen a la misma poblacin o a
distintas poblaciones; en otras palabras esta prueba nos permite determinar si la distribucin de tres o ms
muestras independientes es semejante o diferente.
La lgica de la prueba implica identificar el orden de los datos segn su valor de menor a mayor
que de cada uno de los grupos. Se asignan rangos para cada valor y se obtiene el rango promedio de cada
grupo, si la diferencia entre tales promedios de rangos es significativa entonces se puede rechazar la Ho.
Esta prueba se aplica cuando se tienen diseos de tres o ms grupos independientes que pueden
ser: dos o ms grupos experimentales y uno control o tres o ms grupos de sujetos definidos por
variables atributivas, entre otros.
SUPUESTOS
1. Variable continua
2. Escala Ordinal para la variable medida
3. Tres o ms muestras independientes
4. Muestreo aleatorio. (Es importante sealar que si el muestreo no fue probabilstico, puede
aplicarse la prueba de Kruskal-Wallis si los sujetos son asignados aleatoriamente a cada grupo o
bien puede aplicarse una prueba de aleatoriedad para identificar la misma en los datos y cubrir el
supuesto).
TIPO DE HIPTESIS A PROBAR
Ho: No existen diferencias significativas entre la distribucin de las distintas muestras (G1
=G2=G3=....Gk)
Hiptesis alterna sin direccin
Hi: Si existen diferencias significativas entre la distribucin de las muestras.
(G1 G2 G3 . . . . Gk)
DISTRIBUCIN MUESTRAL
Distribucin H que proporciona los valores esperados para muestras pequeas y la
133
2.
Una vez asignados los rangos se calcula para cada muestra la suma de los rangos y su
rango promedio.
134
mtodos y cul de ellos es el que debe implementarse. Se sabe que la distribucin de los datos en cada
muestra no presenta normalidad.
SOLUCIN
Variable Independiente: Tipo de mtodo Contiene tres niveles: mtodo1, mtodo2, mtodo3
Variable Dependiente: Nmero de respuestas correctas en el examen
135
SUSTITUIMOS
5.3 Obtener el
5.4 Comparar el valor esperado contra el valor obtenido aplicando la regla de decisin
Si Ho Ht, Rechazamos Ho.
10.715 > 5.78
Dado que Ho es mayor a Ht rechazamos Ho
136
Decisin estadstica:
Dado que rechazamos Ho podemos decir que existen diferencias significativas entre los distintos
mtodos no atribuibles al azar (H= 10.715, 0.05).
Como Ho result significativa se procede a realizar comparaciones mltiples para determinar las
diferencias entre los pares de mtodos.
Paso 6. Comparaciones mltiples
8.1.
8.2.
Obtener la diferencia absoluta, es decir, haciendo caso omiso del signo, de los rangos promedio
en cada comparacin.
8.3.
Calcular la diferencia crtica (DC). Como el tamao de las muestras es igual slo se calcula
una diferencia crtica.
10. En el par comparado cuya diferencia result significativa determinar a favor de quin est la
diferencia mediante la observacin de sus rangos promedio.
Como la variable dependiente est medida como el nmero de respuestas correctas, un puntaje alto
indica un mejor desempeo, as el mtodo en el cual se encuentra un rango promedio alto indica
que fue ms efectivo para mejorar la ejecucin. La diferencia entre los rangos promedio del
mtodo 1 y el 3 result significativa siendo el mtodo 1 el que presenta un rango promedio ms
137
alto, por lo que puede decirse que este mtodo es ms efectivo que el mtodo3.
Conclusin
Existe evidencia estadstica que indica que hay diferencias significativas en el rendimiento en la
ejecucin de problemas matemticos segn el mtodo empleado, especficamente entre el
mtodo 1 y el mtodo 3, de los cuales el mtodo 1 es el ms efectivo, por lo que podra
decirse que ste es el ms conveniente para implementarse.
SOLUCIN
Variable Independiente: Tipo de mtodo: Contiene cuatro niveles: mtodol, mtodo2, mtodo3,
mtodo4
Variable Dependiente: Nmero de respuestas correctas en el examen
138
Paso 5. Decisin
Para obtener el valor observado de H y tomar la decisin estadstica se aplica el
procedimiento para muestras grandes.
10.1. Asignacin de rangos para todas las observaciones como si se tratara de una sola muestra. Calcular
en cada muestra la suma de rangos y el rango promedio.
139
H = 2.487/.965= 2.569
5.4. Obtener el valor de Ht,a, n1, n2, n3, n4
Como n y k exceden los valores que se pueden consultar en la tabla para muestras pequeas, se
emplear la distribucin X Z con gl=k-1.
5.7 Comparar el valor esperado contra el valor obtenido aplicando la regla de decisin
Conclusin
No existe evidencia estadstica que sugiera que hay diferencias sign ificativas en el rendimiento en la
ejecucin de problemas matemticos segn el mtodo empleado, por lo que podra decirse que los
cuatro mtodos producen el mismo efecto en el rendimiento.
PROCEDIMIENTO DE CLCULO MEDIANTE EL PAQUETE SPSS (el procedimiento es el
mismo independientemente de/ nmero y tamao de las muestras)
A continuacin se presentan los pasos a seguir para obtener el estadstico de la prueba de KruskalWallis. Se tomar el ejemplo de muestras pequeas. Para la decisin estadstica se toma la regla
de decisin:
Si p(X2) < se rechaza la Ho
140
141
142
Decisin Estadstica:
Dado que rechazamos Ho podemos decir que existen diferencias significativas entre los grupos
(X2 = 10.851, p = 0.004). Como se rechaza la Ho es necesario hacer comparaciones mltiples para
determinar entre que pares de grupos se encuentra la mayor diferencia. En vista de que el
programa no proporciona dicha informacin es necesario calcularlas a mano (ver seccin de
comparaciones mltiples).
Conclusin
Existe evidencia estadstica que indica que hay diferencias significativas en la ejecucin de
problemas matemticos segn el mtodo empleado.
143
Tabla 0. Valores crticos para el anlisis de varianza unifactorial por rangos de Crus kal-Wallis,
K-W.
144
Bibliografa
1. Aguilar, J. (Coord.). (1998). Manual de prcticas de estadstica. Mxico: Facultad de Psicologa,
UNAM.
2. Castillo, A. y Ojeda, M. (1994). Principios de estadstica no paramtrica. Mxico: Universidad
Veracruzana.
3. Daniel, W. (1978). Applied nonparametric statistics. Boston: Houghton Mifflin Company.
4. Daniel, W. (1988). Estadstica con aplicaciones a las ciencias sociales y a la educacin. Mxico:
McGraw-Hill.
5. Downie, N. y Heath, R. (1986). Mtodos estadsticos aplicados. Mxico: Harla.
6. Freund, J. y Simon, G. (1994). Estadstica elemental, 8a. ed. Mxico: PearsonPrentilce-Hall.
7. Hopkins, K; Hopkins, B. R. y Glass, G. (1997) Estadstica bsica para las ciencias sociales y del
comportamiento. Mxico: Prentice-Hall Internacional.
8. Pagano, R. (1999) Estadstica para las ciencias del comportamiento. Mxico:
Thomson Internacional.
9. Siegel, S y Castellan,, N. J. (1995) Estadstica no paramtrica aplicada a las ciencias de la conducta.
Mxico: Trillas
10. Runyon, R. y Haber, A. (1984) Estadstica para las ciencias sociales. Mxico: Fondo Educativo
Interamericano.
11. Weimer, R. (1999). Estadstica, 2a. reimpresin. Mxico: C.E.C.S.A.
145
Presentacin
El siguiente manual tiene como propsito presentar en forma resumida la lgica de aplicacin
de algunas pruebas no paramtricas para determinar la existencia de asociacin entre dos
variables y sus procedimientos de clculo mediante las ecuaciones correspondientes y va el
paquete estadstico SPSS.
No pretendemos ser exhaustivos en la revisin de todos los procedimientos, sino que se
abarcan aquellos que corresponden a la asignatura de Estadstica en el tercer semestre de la
carrera de Psicologa impartida en la Facultad de Psicologa de la UNAM.
Las pruebas que se presentan son la X2 como prueba de independencia y varios coeficientes
de correlacin que permiten al investigador saber si existe asociacin entre dos variables y
cun fuerte es esa asociacin. La tcnica de X2 no es proporciona una medida de correlacin,
ya que su valor no indica la magnitud ni la direccin de la relacin, pero es de utilidad para
saber, en primera instancia, si hay asociacin o no entre variables nominales.
La correlacin se ocupa de establecer la existencia de una relacin entre dos variables, as
como de determinar su magnitud o direccin. La magnitud se refiere a la fuerza o grado de
la asociacin indicado por un valor, llamado coeficiente, que oscila entre 0 y 1:
Nula = 0, no hay correlacin entre las variables.
Dbil = .10
Moderada =. 50
Fuerte = .95
Perfecta = 1, las variables se asocian perfectamente
La direccin indica si se trata de una relacin positiva (conforme los valores de una variable
aumentan los de la otra tambin) o negativa (conforme los valores de una variable aumentan
los de la otra disminuyen). As, el coeficiente de la correlacin puede tener un signo + o un
signo -.
146
147
REGLA DE DECISIN
148
SOLUCIN
Variable 1: Adiccin juvenil
Categoras: Ausencia y presencia
Variable 2: Caractersticas de la comunidad Categoras: Marginada y No marginada
Paso 1. Establecer las hiptesis a probar
Ho: No existe relacin significativa entre las variables
Hi Si existe relacin significativa entre las variables
Paso 2. Elegir la prueba estadstica
Dado que nos interesa identificar si existe relacin entre la adiccin juvenil a cualquier
estupefaciente y las caractersticas de la comunidad, los datos son nominales, la muestra es
mayor a 30 por loo que se asume que su distribucin es normal, fue tomada de forma aleatoria,
y ninguna de las FE es menor a 5, se aplicar la prueba X2 como prueba de independencia
Paso 3. Especificar alfa
Se emplear un = 0.05 tomando en consideracin que tenemos una muestra de tamao
480.
Paso 4. Regin de Rechazo
Dado que la Hiptesis alterna es sin direccin la Ho podr ser rechazada el valor observado cae
en cualquiera de los extremos de la distribucin.
Paso 5. Decisin
Para obtener el valor observado de X2 y tomar la decisin estadstica se aplica el procedimiento
con la frmula de X2.
5.1. Agrupar las frecuencias observadas en una tabla de contingencias y calcular las
frecuencias esperadas
149
Al aplicar esta frmula no es necesario el clculo de las FE ms que para garantizar que no
existen FE menores a 5 (lo cual estar en duda slo si tenemos FO pequeas)
.
Dado que
(31.845)> X2t (3.841) con un 0,05, gl=1, podemos rechazar la Ho y aceptar la
Hi, la probabi!idad asociada al valor observado de Ji cuadrada es menor a 0.01 mucho menor
que el alfa elegido.
X2 o
150
Decisin estadstica:
Dado qua rechazamos Ho podemos decir que si existe relacin significativa entre las variables
(X2o = 31.845; =0.05. g! 1 o bien, X2= =31.845. g!=1. p<.01)
Conclusin:
Existe suficiente evidencia estadstica para considerar que la adiccin juvenil a cualquier
estupefaciente est directamente relacionada con las caractersticas de a comunidad sea sta
marginada o no marginada.
PROCEDIMIENTO DE CALCULO MEDIANTE EL PAQUETE SPSS.
A continuacin se presentan los pasos a seguir para obtener el estadstico de la prueba de X2 de
independencia. Para la decisin estadstica se torna la regla de dedsin: Si p(X2o, gl)
Rechazamos Ho
Como los datos se presentan en una tabla de contingencias deben crearse tres columnas, una
para la variable 1 otra para la variable 2 y una tercera para las frecuencias observadas. Para las
variables es conveniente definir tambin sus categoras. La definicin de las variables y
frecuencias se realiza como se indica a continuacin.
Data
Define variable: en esta defines la siguiente nformacin:
Variable name: nombra la variable 1, adiccin, juvenil, empleando un mximo de
8 caracteres. En este caso la variable se denominar adic,
Labels: Para activa,, esta ventana das clic en e! botn Labels de la ventana
Define Variable. En este submen capturas el nombre de !a variable en
Label (aqu puedes poner el nombre completo usando ms de ocho
caracteres), Para definir sus categorias, en el recuadro Value capturas el
valor 1 y en el recuadro Value label escribes adicto. Das clic en Add.
Posteriormente capturas el valor 2 y escribes no adicto (y as sucesivamente
hasta capturar todas las categoras). Das clic en Continue. Para cerrar la
ventana Define Variable das clic en OK
La figura muestra como se define !a variable junto con sus categor1as.
151
Una vez definidas las variables se teclearn los valores conforme a la tabla de contingencia,
Para capturar los datos de la primera celda (c11) escribiramos 1 en la columna adic, 1 en la
columna comuna y 125 en la columna frec; con esto indicamos que en la primera celda hay
125 sujetos que son adictos y que viven en una comunidad marginada, Para la segunda
celda (c12) sera 1, 2, 183, indicando que hay 183 sujetos que son adictos y que viven en
una comunidad no marginada; y as sucesivamente hasta terminar con todas las celdas. Ver
figura.
152
153
En le ventana Crosstabs seleccionar las variables de los renglones, en este caso adcc, y
pasarla al recuadro Row(s) dando clic en el botn que est enmedio de ambos recuadros.
Posteriormente seleccionar la variable de la columna, comuna, y pasarla al recuadro
Colum(s). Ver figura.
154
Una vez seleccionadas las variables dar clic en el botn Statistics que aparece en esta
misma ventana para abrirla y seleccionar Chi-square, dando clic en la opcin que
corresponde a este coeficiente (ver figura arriba) Dar clic en Continue para regresar a la
ventana anterior y luego dar clic en OK para correr el anlisis.
Paso 4. Tomar la decisin estadstica interpretando la hoja de resultados.
Una vez dadas las indicaciones para correr el anlisis se despliega una hoja de resultados
(Output) que muestra los datos correspondientes a la prueba realizada. Con base en la
informacin presentada se toma la decisin estadstica.
HOJA DE RESULTADOS (OUTPUT)
155
El valor de X2 es igual a 31.845 cuya probabilidad asociada es .000, (X2 =31.845, gl=1,
p=.000), la cual es contrastada con el alfa de .05 indicada en el ejemplo. Aplicando la
regla de decisin:
Conclusin
Dado que rechazamos Ho podemos decir que existe suficiente evidencia estadstica,
paro considerar que la adiccin juvenil a cualquier estupefaciente est directamente
relacionada con las caractersticas de la comunidad sea sta marginada o no
marginada.
156
157
Variables discretas-dicotmicas
Escala nominal
Muestreo aleatorio
Muestras grandes (N 30)
TIPO DE DATOS
El coeficiente por s mismo no indica si existe asociacin o no entre las variables, para ello es
necesario obtener su significancia usando el estadstico X2, incluyendo los siguientes elementos:
TIPO DE HIPOTESIS A PROBAR
Ho: No existe relacin estadsticamente significativa entre las variables
Hi: Si existe relacin estadsticamente significativa entre las variables
DISTRIBUCIN MUESTRAL
Se utiliza la distribucin X2 que proporciona los valores esperados para todas las muestras
158
posibles obtenidas en forma aleatoria, con gl = (c - 1)(r - 1), donde c es el nmero total de
columnas y r el nmero total de renglones.
Solucin
Vahmble X: ei tipo de comunidad: marginada, no marginada
Variable Y: Presencia o ausencia de adiccin
Paso 1. Elegir la prueba estadstica
Dado que nos interesa identificar no slo la existencia de relacin entre la adiccin juvenil a
cualquier estupefaciente y las caractersticas de la comunidad sino tambin su magnitud, los
datos son dicotmicos, la muestra es mayor a 30 y a!eatoria, se calcular el coeficiente Phi se
probar su significancia con el estadstico X2.
Paso 2. Construir la tabla de contingencia
159
160
Para tomar la decisin se calcula el valor de tablas de X2 y se aplica el criterio elegido. Dado que
X2o (30.77) > X2t (3.841) con un
Ho y aceptar la Hi; la
probabilidad asociada al valor observado de ji cuadrada es menor a .01, mucho menor que el
alfa elegido.
Conclusin:
Con los datos de esta muestra se observ una correlacin significativa entre la presencia o
ausencia de la adiccin y el tipo de comunidad (X2 = 30.77; gl = 1 y = 0.05), dicha correlacin
fue baja entre (.257). Lo anterior implica que el tipo de comunidad marginada o no marginada
no define en un alto porcentaje la presencia o ausencia de la adiccin (posiblemente existan
variables de mayor relacin).
PROCEDIMIENTO DE CALCULO MEDIANTE EL PAQUETE SPSS.
Paso 1 a 3. Elaboracin de la base de datos, ponderacin de frecuencias y seleccin del
coeficiente.
Como los datos se presentan en una tabla de contingencias se sigue el, mismo
procedimiento descrito para la X2 como prueba de independencia para capturar la base de
datos, ponderar las frecuencias y seleccionar las variables en la ventana de Crosstabs.
Una vez seleccionadas las variables en la ventana Crosstabs dar clic en el botn
Statistics que aparece en esta misma ventana para abrirla y seleccionar el coeficiente Phi,
dando clic en la opcin que corresponde a este coeficiente (ver figura 1). Dar clic en Continue
para regresar a la ventana anterior y luego dar clic en OK para correr el anlisis.
161
Conclusin:
Con los datos de esta muestra se observ una correlacin significativa baja entre la presencia o
ausencia de la adiccin y el tipo de comunidad (r =.258, p=.000). Lo anterior implica que el
tipo de comunidad marginada o no marginada no define en un alto porcentaje la presencia o
ausencia de la adiccin (posiblemente existan variables de mayor relacin).
HOJA DE RESULTADOS (OUTPUT)
162
La hoja de resultados presenta tres tablas, la primera da informacin sobre el nmero total de
casos vlidos y faltantes, en este caso tenemos todos los casos vlidos, 480 (100%). La
segunda tabla corresponde a la tabla de contingencia capturada, si los datos se metieron de
manera correcta, esta tabla debe ser idntica a la original. La tercera tabla proporciona el valor
del coeficiente Phi en la columna Value y su probabilidad asociada en la columna Approx. Sig.,
.258 y .000, respectivamente.
163
TIPO DE DATOS
Frecuencias de casos observados en cada categora propia de las variables medidas. Cada
variable debe incluir por lo menos dos categoras mutuamente excluyentes.
PROCEDIMIENTO DE CALCULO MANUAL DEL COEFICIENTE V DE CRAMER.
Las frecuencias observadas se vacan en una tabla de contingencias que mnimamente debe ser
de cuatro entradas (dos categoras para cada variable) siguiendo la misma estructura para la
prueba de X2.
TABLA DE CONTINGENCIA
1. Calcular las frecuencias esperadas en cada una de las celdas multiplicando los totales
marginales comunes a cada celda y dividiendo este producto por el nmero total de casos, N;
(c11 = TMR1 x TMC1/N, c12 = TMR1 x TMC2/N, c1n= TMR1 x TMCn/N, etc,).
164
3. Calcular el valor del coeficiente V de Cramr. Este coeficiente asume valores que van de 0 a
1.
REGLA DE DECISIN
166
167
Dado que X2o (65.41) > X2t (3.841) con un 0.05, gl=10; podemos rechazar la Ho y aceptar la
Hi; la probabilidad asociada al valor observado de ji cuadrada es menor a .01, mucho menor
que el alfa elegido.
Conclusin:
Existe suficiente evidencia estadstica para considerar que el nivel de escolaridad est
directamente relacionado con el ser prejuicioso, (V=.446, X2= 65.41; gI = 10 y = 0.05). La
correlacin entre ambas variables es moderada, y observando las frecuencias vemos que a
mayor escolaridad s es menos prejuicioso.
PROCEDIMIENTO DE CALCULO MEDIANTE EL PAQUETE SPSS.
Paso 1 a 3. Elaboracin de la base de datos, ponderacin de frecuencias y seleccin
de coeficiente.
Como los datos se presentan en una tabla de contingencias se sigue el mismo procedimiento,
descrito para la X2 corno prueba de independencia para capturar la base de datos (ver
figura).ponderar las frecuencias y se!eccionar las variables en la ventana de Crosstabs.
Una vez seleccionadas las variados en a ventana Crosstabs dar clic en el botn Statistics
que aparece en esta misma ventana para abrirla y seleccionar el coeficiente Cramrs V, dando
clic en la opcin que corresponde a este coeficiente (ver figura). Dar clic en Continue para
regresar a la ventana anterior y luego dar clic en OK para correr el anlisis.
168
La hoja de resultados presenta tres tablas, la primera da informacin sobre el nmero total de
casos vlidos y faltantes, en este caso tenemos todos los casos vlidos, 164 (100%). La
segunda tabla corresponde a la tabla de contingencia capturada, si los datos se metieron de
manera correcta, esta tabla debe ser idntica a la original. La tercera tabla proporciona el valor
del coeficiente V de Crmer en la columna Value y su probabilidad asociada en la columna
Approx. Sig., .447 y .000, respectivamente.
169
170
171
REGLA DE DECISION
Se emplea la tabla de valores crticos de t de Student para obtener el valor de tt, con gl = n-2 y
el respectivo nivel de significacin, o su p(to, gI).
EJEMPLO
En un estudio sobre psicologa de la salud se desea saber si existe relacin entre el sexo y la
ansiedad. Para ello se us una muestra de 14 sujetos, 6 mujeres y 8 hombres, cuya ansiedad
fue medida con una escala tipo Likert, en la que un puntaje alto indica mayor ansiedad. Con un
alfa de .05 determinar el grado de asociacin entre las variables,
172
SOLUCIN
Variable X: sexo: hombre, mujer
Variable Y: puntaje de ansiedad
Paso 1. Elegir la prueba estadstica
Dado que nos interesa identificar no el grado de asociacin entre una variable dicotmica,
sexo, y una variable intervalar, puntaje de ansiedad, y la muestra es aleatoria, se calcular el
coeficiente biserial-puntual y se probar su significancia con el estadstico t de Student.
Paso 2. Arreglar los datos en una tabla con la codificacin de la variable dicotmica
Con fines de codificacin de los datos, a los hombres se les asign el valor de 0 y a las mujeres
el valor de 1.
174
Dado que to (1.37) < tt (2.179) con un 0.05, gl=12; podemos aceptar la Ho y rechazar la Hi;
la probabilidad asociada al valor observado de t es mayor a .10, mucho mayor que el alfa
elegido.
Conclusin:
No existe evidencia estadsticamente significativa para afirmar que la ansiedad se asocia con el
sexo (r=,37, to = 1.37; gl = 10 y = 0.05).
PROCEDIMIENTO DE CALCULO MEDIANTE EL PAQUETE SPSS.
Este coeficiente puede calcularse a travs del coeficiente Eta, el cual tambin analiza la relacin
entre una variable intervalar y una nominal pero a diferencia de la biserial puntual, la variable
nominal tiene ms de dos categoras. Adems el coeficiente Eta asume que hay una variable
independiente y otra dependiente.
Paso 1. Elaboracin de la base de datos,
Definir dos columnas, una para la variable dicotmica Junto con sus categoras, y otra para la
variable intervalar. Los datos se capturan en forma de lista en !a variable correspondiente. Ver
figura.
Summarize
Crosstabs: pasar la variable intervalar en Row
Pasar la variable nominal en Column
Ver figura
En el submen Statistics de Crosstabs:
Marcar el coeficiente Eta (ver figura )
Dar clic en Continue
OK
176
El valor del coeficiente biserial-puntual es igual a .377, lo cual indicara que existe una
correlacin moderada entre el sexo y la ansiedad; sin embargo. el programa no muestra la
probabilidad asociada a este coeficiente, por lo tanto, hay que realizar la prueba de
significancia como se explica en la seccin correspondiente para determinar si le correlacin
es significativa o no.
En la prueba de significancia se obtuvo una p>.10 para un valor t-1.37, gl=12, la cual
contrastada con el alfa de .05 resulta mayor pues al aplicar la regla de decisin:
177
178
179
REGLA DE DECISION
Muestras pequeas
Se emplea la tabla de valores crticos de t de Student para obtener el' valor de tt, con gl = n-2 y
el respectivo nivel de significacin, o su p(to, gl).
Muestras grandes
Se emplea la tabla de valores crticos de la distribucin normal estndar para obtener el valor de
zt con l respectivo nivel de significacin, o su p(z).
180
181
Ho
Dado que to (12.324) > tt (2.101) con un 0.05, gl=18; podemos rechazar la Ho y aceptar
la Hi; la probabilidad asociada al valor observado de t es menor a .0001, mucho menor que
el alfa elegido.
Conclusin:
En la muestra estudiada, existe un grado de correlacin significativa (to = 12.624; gl = 18 y
= 0.05) de 0.9479 entre el nivel de desempeo obtenido por estudiantes del ltimo grado
de secundaria y su calificacin en la prueba de seleccin para el nivel bachillerato. El valor
del coeficiente indica una correlacin alta y positiva entre las variables, es decir, que su
relacin es muy fuerte y que quienes muestran un mejor desempeo durante el tercer grado
de secundaria obtendrn un puntaje alto en la prueba de seleccin para bachillerato.
EJEMPLO (Muestras grandes)
El mismo estudio se aplic con otra muestra aleatoria de 33 estudiantes de la Escuela
Secundaria Tcnica # 41 del municipio de Tialnepantla. Identificar el grado de correlacin entre
las variables.
SOLUCIN
Variables:
Nivel de desempeo (X )
Calificacin en la prueba ( Y )
Paso 1. Elegir la prueba estadstica
Dado que nos interesa identificar el grado de asociacin entre el desempeo y la calificacin en
la prueba, los datos son ordinales y la muestra es aleatoria, se calcular el coeficiente de
correlacin de Spearman y se probar su significancia con el estadstico z ya que es una
muestra grande (n=33).
183
184
Sustituir
185
Como la prueba es bidireccional, para usar la tabla de z se divide el alfa de .05 entre dos, ya
que la tabla muestra slo un extremo, zt, .05/2 = 1 .96
Como la prueba es bidireccional, la probabilidad de z se multiplica por dos, ya que la tabla
muestra slo un extremo.
Dado que Zo (3.501) > zt (1.96) con un 0.05, podernos rechazar la Ho y aceptar la Hi; la
probabilidad asociada al valor observado de Z es .0004, mucho menor que el alfa elegido.
Conclusin:
En la muestra estudiada, existe un grado de correlacin significativa (zo = 3.501 y = 0.05) de
0.619 entre el nivel de desempeo obtenido por estudiantes dei ltimo grado de secundaria y
su calificacin en la prueba de seleccin para el nivel bachillerato. El valor del coeficiente indica
una correlacin moderada y positiva entre las variables, es decir, que su relacin no es tan
fuerte como el ejemplo anterior, pero si representa una magnitud de considerable importancia,
adems indica que quienes muestran un mejor desempeo durante el tercer grado de
secundaria obtendrn un puntaje alto en la prueba de seleccin para bachillerato.
PROCEDIMIENTO DE CALCULO MEDIANTE EL PAQUETE SPSS.
Paso 1. Elaboracin de la base de datos.
Para elaborar le base de datos se definen dos columnas, una por cada variable (sin etiquetas),
y los datos se capturan en forma de lista. Ver figura .
186
187
188
La hoja de resultados muestra las correlaciones entre todas las variables, incluyendo la
correlacin de la variable consigo misma, cuyo coeficiente es 1,00. Estos coeficientes de 1.00
dibujan una diagonal imaginaria dividiendo la tabla en dos tringulos, superior e inferior, en
cada uno de ellos se encuentra la misma informacin de las correlaciones calculadas. As, la
correlacin entre desempe y califica es la misma en ambos tringulos, por lo que da igual leer
uno u otro.
La correlacin entre el desempeo y la calificacin fue de .82 con una probabilidad asociada de
.000, rS 0.82, p=.000, aplicando la regla de decisin:
tenemos que . 000 < .05, por lo que rechazamos H0 lo cual indica que existe una correlacin
significativa entre las variables.
Conclusin:
En la muestra estudiada, existe una correlacin significativa (rs=.82, p=.000) entre el nivel de
desempeo obtenido por estudiantes del ultimo grado de secundaria y su calificacin en la
prueba de seleccin para el nivel bachillerato. El valor del coeficiente indica una correlacin alta
y positiva entre !as variables, es decir, que su relacin es fuerte, y que quienes muestran un
mejor desempeo durante el tercer grado de secundaria obtendrn un puntaje alto en la
prueba de seleccin para bachillerato.
189
APNDICE D TABLAS
190
191
192
193
194
Calcular el coeficiente
FORMULA (Considerando que son datos agrupados)
proporciona los valores esperados para todas las muestras posibles obtenidas en forma
aleatoria, con gl = N-2 donde N es el nmero total de pares x ,y.
FORMULA
REGLA DE DECISION
Se emplea la tabla de valores crticos de t de Student para obtener el valor de tt, con gl = n-2 y
el respectivo nivel de significacin, o su p(to, gl).
EJEMPLO
Se intenta identificar si existe correlacin significativa entre el nivel de razonamiento verbal y el
nivel de razonamiento abstracto en nios de 6 de primaria. Para tal propsito se tom una
muestra aleatoria de 23 nios de la primaria pblica Justo Sierra a quienes se les aplic un
inventario que proporcionaba datos intervalares para ambas variables (puntaje mximo 50).
Identificar el grado de correlacin entre las variables.
SOLUCIN
Variables:
Razonamiento verbal (X )
Razonamiento abstracto ( Y )
Paso 1. Elegir la prueba estadstica
Dado que nos interesa identificar el grado de asociacin entre el razonamiento verbal y el
razonamiento abstracto, los datos son intervalares y la muestra es aleatoria, se calcular el
coeficiente de correlacin de Pearson y se probar su significancia con el estadstico t de
Student.
Paso 2. Construir tabla de datos
Suj
X2
Y2
XY
19
17
361
289
323
31
961
49
217
33
17
1089
289
561
44
28.5
1936
812.25
1254
25
27
625
729
675
35
31
1225
961
1085
34
20
1156
400
680
39
17
1521
289
663
196
44.56
45
1985.59
2025
2005.2
10
44
43
1936
1849
1892
11
24.5
10
600.25
100
245
12
37.5
28.5
1406.25
812.25
1065.75
13
24.6
13.45
605.16
180.25
330.87
14
40
43.2
1600
1866.24
1728
15
42
18
1764
324
756
16
32
16
1024
256
512
17
48
26
2304
676
1248
18
43
17.5
1849
306.25
752.5
19
33.5
36
1122.25
1296
1206
20
47
16
2209
256
752
21
38
37
1444
1369
1406
23
25
30
625
900
750
23
35.3
37.8
1246.09
1428.84
1334.34
EX=
818.96
EY= 581.95
EX2 = 30594.5936
EY 2= 17463.7325
EXY= 21441.66
197
Dado que to (1.78) < tt (2.080) con un 0.05, gl=21; podemos aceptar la Ho y rechazar la Hi;
la probabilidad asociada al valor observado de t es mayor a..10, mucho mayor que el alfa
elegido.
198
Conclusin:
No existe evidencia estadsticamente significativa para afirmar que el razonamiento verbal y el
razonamiento abstracto estn relacionados en los nios de 6 de primaria (r=.363, to = 1.78;
91 = 21 y . a = 0.05).
PROCEDIMIENTO DE CALCULO MEDIANTE EL PAQUETE SPSS.
Pasos 1 y 2. Elaboracin de la base de datos y seleccin dei coeficiente.
Para obtener el coeficiente de correlacin r de Pearson y su prueba de significancia se siguen
los mismos pasos que en el caso del coeficiente de Spearman, recordemos que se elabora la
base de datos definiendo una columna para cada una de las variables a correlacionar. Los pasos
para el estadstico son:
Statistics
Correlate Bivariante
Una vez en la ventana principal de las pruebas de correlacin, se sealan ambas
variables a correlacionar y se la un click a la opcin Pearson. Ver figura .
199
tenemos que . 086 > .05, por lo que aceptamos Ho lo cual indica que no existe una correlacin
significativa entre las variables.
Conclusin:
No existe evidencia estadsticamente significativa para afirmar que el razonamiento verbal y el
razonamiento abstracto estn relacionados en los nios de 6 de primaria (r=.36, p=.086).
200
donde:
R2 = suma de los rangos de la isima columna elevada al cuadrado
k = nmero de jueces
N= nmero de objetos ordenados
201
Datos ligados
donde:
t= nmero de datos ligados en el grupo que conforma la liga.
PRUEBA DE SIGNIFICANCIA DEL COEFICIENTE
La prueba de significancia se obtiene por medio de la X2
TIPO DE HIPTESIS A PROBAR
Ho: La correlacin entre las k variables no es significativa.
Hi: La correlacin entre las k variables es significativa.
DISTRIBUCIN MUESTRAL
Para probar la significacin de la asociacin se utiliza la distribucin W gl proporciona los
valores esperados para todas las muestras pequeas posibles obtenidas en forma aleatoria, con
N (objetos) y k (jueces).
Para muestras grandes se utiliza la distribucin X2 con gl= N-1, donde N = nmero de objetos
ordenados
Para muestras pequeas:
Se obtiene Wt con un valor de k y N dados, y un nivel de significacin especfico (.05, .01)
Para muestras grandes:
Se calcula el valor de X2 con la frmula
REGLA DE DECISION
Muestras pequeas Wo Wt se rechaza Ho
Muestras grandes
Se compara con X2 de tablas, con gl=N-1, donde N= nmero de objetos ordenados, si
EJEMPLO
Se pidi a tres ejecutivos que entrevistarn a seis candidatos para ocupar el puesto de gerente,
en donde evaluarn su grado habilidad para el puesto. A los puntajes originales se les asign el
202
rango correspondiente conforme al procedimiento indicado. Con los datos obtenidos se quiere
determinar el grado de acuerdo en el ordenamiento de los ejecutivos.
SOLUCIN
Variables:
No. de ejecutivos, considerados como jueces (X ): tres jueces
Grado de habilidad ( Y )
Paso 1. Elegir la prueba estadstica
Dado que nos interesa determinar el grado de acuerdo entre los ejecutivos, los cuales pueden
considerarse como jueces, los datos son ordinales dado que ya se les ha asignado los rangos y
la muestra es aleatoria, se calcular el coeficiente de concordancia de Kendall y se
probar su significancia con el estadstico W ya que es una muestra pequea (n=6).
Paso 2. Construir tabla de datos
Como ya se indic se hizo la asignacin de los rangos de la manera descrita y se obtuvo la
suma de los rangos para cada columna.
Dado que Wo (.16) < Wt (.66 con un k=3, N=6, 0.05; podemos aceptar la Ho y rechazar la
Hi.
Conclusin:
No existe acuerdo entre los jueces respecto a las asignaciones que hicieron de los
candidatos. (W=.16 < Wo =.66, k=3 N= 6, a = 0.05).
PROCEDIMIENTO DE CALCULO MEDIANTE EL PAQUETE SPSS.
Paso 1. Elaboracin de la base de datos.
Para capturar la base de datos los renglones de la hoja de clculo representan a los jueces
(k) y las columnas representan a los objetos ordenados (N). As se definen N columnas y en
los k renglones se capturan la ordenacin que dio cada juez a los objetos. El primer rengln
contiene la ordenacin del primer juez, el segundo rengln la ordenacin del segundo juez
y as sucesivamente. Ver figura 1.
204
205
El acuerdo entre los ejecutivos presenta un valor del coeficiente W=.162 con una X2 =2.429,
g1=5, p=.787, aplicando la regla de decisin:
206
Si pspss>
Si pspss
Ho.
tenemos que .787 > .05, por lo que aceptamos Ho lo cual indica que no existe un acuerdo
significativo entre las ordenaciones que hicieron los ejecutivos.
Conclusin:
El valor de ji cuadrada no resulta significativo de acuerdo a la regla de decisin descrita, por lo
tanto, W=.16 no muestra evidencia estadsticamente significativa de que hay acuerdo entre los
ejecutivos.
207
208