Trabajo de Estadistica Unidad 5 Grupo 5
Trabajo de Estadistica Unidad 5 Grupo 5
Trabajo de Estadistica Unidad 5 Grupo 5
INTEGRANTES
RAIFEL MORALES
EVELYN QUINTERO
YARIAM SANCHEZ
WILLIAM LEE
En el mbito del Mtodo Estadstico, se busca un estimador del parmetro poblacional por
que se desea comprobar, probar, verificar o contrastar una determinada Afirmacin,
Supuesto al cual se le denomina Hiptesis Nula, H0, contra otra Hiptesis llamada
Hiptesis de Trabajo o Hiptesis Alternativa, H1, proveniente de los resultados de la
Estimacin dando como resultado la Aceptacin o el Rechazo de la Hiptesis Nula.
La estimacin se divide en tres grandes bloques, cada uno de los cuales tiene distintos
mtodos que se usan en funcin de las caractersticas y propsitos del estudio:
Estimacin punctual.
o Mtodo de los momentos;
o Mtodo de la mxima verosimilitud;
o Mtodo de los mnimos cuadrados;
Estimacin por intervalos.
Estimacin bayesiana.
Estimador
Un estimador es una regla que establece cmo calcular una estimacin basada en las
mediciones contenidas en una muestra estadstica.
Estimacin puntual
Consiste en la estimacin del valor del parmetro mediante un slo valor, obtenido de una
frmula determinada. Por ejemplo, si se pretende estimar la talla media de un determinado
grupo de individuos, puede extraerse una muestra y ofrecer como estimacin puntual la
talla media de los individuos. Lo ms importante de un estimador, es que sea un estimador
eficiente. Es decir, que sea insesgado(ausencia de sesgos) y estable en el muestreo o
eficiente (varianza mnima).
Ejemplo:
Sea X N(, ), con desconocido. Seleccionada una m.a.s. X1, ..., Xn, con realizacin
x1, ..., xn, estimamos el parmetro por ambos mtodos. Segn el mtodo de los
momentos: E(X) = Xn i=1 Xi n = X, y al ser = E(X) se obtiene que = x. Por el
mtodo de mxima verosimilitud: L(x1, ..., xn) = Yn i=1 f(xi ) = = Yn i=1 1 2 e
(xi) 2 2.
Estimacin por Intervalos de conanza 109 y maximizamos en tal funcin; en este caso
resulta ms fcil maximizar su logaritmo: lnL(x1, ..., xn) = 1 2 2 Xn i=1 (xi ) 2 n
ln( 2) lnL(x1, ..., xn) = 1 2 Xn i=1 (xi ) = n x n 2 = 0 =
Consiste en la obtencin de un intervalo dentro del cual estar el valor del parmetro
estimado con una cierta probabilidad. En la estimacin por intervalos se usan los siguientes
conceptos:
Intervalo de confianza
Si no se conoce, puede obtenerse una aproximacin en los datos aportados por la literatura
cientfica o en un estudio piloto. Tambin hay mtodos para calcular el tamao de la
muestra que prescinden de este aspecto. Habitualmente se usa como medida de esta
variabilidad la desviacin tpica poblacional y se denota .
Error de la estimacin
Lmite de Confianza
Valor
Tambin llamado nivel de significacin. Es la probabilidad (en tanto por uno) de fallar en
nuestra estimacin, esto es, la diferencia entre la certeza (1) y el nivel de confianza (1-).
Por ejemplo, en una estimacin con un nivel de confianza del 95%, el valor es (100-
95)/100 = 0,05.
Valor crtico
Se representa por Z/2. Es el valor de la abscisa en una determinada distribucin que deja a
su derecha un rea igual a /2, siendo 1- el nivel de confianza. Normalmente los valores
crticos estn tabulados o pueden calcularse en funcin de la distribucin de la poblacin.
Por ejemplo, para una distribucin normal, de media 0 y desviacin tpica 1, el valor crtico
para = 0,1 se calculara del siguiente modo: se busca en la tabla de la distribucin ese
valor (o el ms aproximado), bajo la columna "rea"; se observa que se corresponde con -
1,28. Entonces Z/2 = 1,64. Si la media o desviacin tpica de la distribucin normal no
coinciden con las de la tabla, se puede realizar el cambio de variable t =(X-)/ para su
clculo.
Con estas definiciones, si tras la extraccin de una muestra se dice que "3 es una estimacin
de la media con un margen de error de 0,6 y un nivel de confianza del 99%", podemos
interpretar que el verdadero valor de la media se encuentra entre 2,7 y 3,3, con una
probabilidad del 99%. Los valores 2,7 y 3,3 se obtienen restando y sumando,
respectivamente, la mitad del error, para obtener el intervalo de confianza segn las
definiciones dadas.
Para un tamao fijo de la muestra, los conceptos de error y nivel de confianza van
relacionados. Si admitimos un error mayor, esto es, aumentamos el tamao del intervalo de
confianza, tenemos tambin una mayor probabilidad de xito en nuestra estimacin, es
decir, un mayor nivel de confianza.
ERROR MUESTRAL
Cualquier medida conlleva algn error. Si se usa la media para medir, estimar, la media
poblacional , entonces la media muestral, como medida, conlleva algn error. Por
ejemplo, supongamos que se ha obtenido una muestra aleatoria de tamao 25 de una
poblacin con media = 15: si la media de la muestra es x=12, entonces a la diferencia
observada x- = -3 se le denomina el error muestral. Una media muestral x puede
pensarse como la suma de dos cantidades, la media poblacional y el error muestral; si e
denota el error muestral, entonces:
Ejemplo 1.5
x = (3+4+3+4+5+5+2+4+6)/9 = 4
(2,2) 2 2 4 = -2
(2,4) 3 3 4 = -1
(2,6) 4 44=0
(4,2) 3 3 4 = -1
(4,4) 4 44=0
(4,6) 5 54=1
(6,2) 4 44=0
(6,4) 5 54=1
(6,6) 6 64=2
Distribuciones Muestrales
Las muestras aleatorias obtenidas de una poblacin son, por naturaleza propia,
impredecibles. No se esperara que dos muestras aleatorias del mismo tamao y tomadas de
la misma poblacin tenga la misma media muestral o que sean completamente parecidas;
puede esperarse que cualquier estadstico, como la media muestral, calculado a partir de las
medias en una muestra aleatoria, cambie su valor de una muestra a otra, por ello, se quiere
estudiar la distribucin de todos los valores posibles de un estadstico. Tales distribuciones
sern muy importantes en el estudio de la estadstica inferencial, porque las inferencias
sobre las poblaciones se harn usando estadsticas muestrales. Como el anlisis de las
distribuciones asociadas con los estadsticos muestrales, podremos juzgar la confiabilidad
de un estadstico muestral como un instrumento para hacer inferencias sobre un parmetro
poblacional desconocido.
Como los valores de un estadstico, tal como x, varan de una muestra aleatoria a otra, se le
puede considerar como una variable aleatoria con su correspondiente distribucin de
frecuencias.
Ejemplo 1.6
, la media poblacional.
Solucin:
Como para cualquier variable aleatoria, la dsitribucin muestral de medias tiene una media
o valor esperado, una varianza y una desviacin estndar, se puede demostrar que la
distribucin muestral de medias tiene una media igual a la media poblacional. Esto es:
Distribuciones muestrales
Despus de haber realizado el ejercicio anterior se puede ver que una distribucin muestral
se genera extrayendo todas las posibles muestras del mismo tamao de la poblacin y
calculndoles a stas su estadstico.
Se pueden usar distintos estimadores para estimar un mismo parmetro. Por ejemplo para estimar la
media poblacional se puede usar la media muestral, la mediana, la moda, el promedio entre el valor
ms chico y ms grande de la muestra, etc.
Cada estimador obtenido de muestras de tamao fijo n, vara con cada muestra que se toma. Por lo
tanto, los estimadores son variables aleatorias y pueden considerarse sus distribuciones muestrales
(similar a los estadsticos que se estudiaron la clase pasada).
La distribuciones de muestreo de los estimadores se usan para compararlos y decidir cul de todos
es el mejor. Se prefiere un estimador que tenga una distribucin muestral cuya media coincida con
el parmetro que se desea estimar y cuya extensin o dispersin (medida con la variancia) sea lo
menor posible.
Notacin. Si denota un parmetro entonces denotar la estadstica correspondiente.
Como dijimos anteriormente, se prefiere una estadstica que tenga una distribucin muestral cuya
media coincida con el parmetro que se desea estimar. Un estimador de este tipo se llama
insesgado.
Si es un estimador de un parmetro y si la media de la distribucin de es , es decir,
E( ) = ,
entonces se dice que es un estimador insesgado. De otra manera, se llama sesgado.
Si se calcula una vez lo ms probable es que se encuentre cerca de la media E( ). Entonces en
el primer caso lo ms probable es que se encuentre cerca de y en el segundo que sea ms grande
que .
Se prefiere una estadstica que adems tenga una distribucin muestral cuya extensin o dispersin
(medida con la variancia) sea lo menor posible. Nota: Para simplificar se habla de variancia del
estimador para referirnos a la variancia de la distribucin muestral del estimador.
Si se calcula una vez , en ambos casos, lo ms probable es que se encuentre cerca de la media E(
). Pero como la desviacin estndar del primero es menor que la del segundo, es ms probable
que en el primer caso se encuentre ms cerca de la media que en el segundo caso.
En base a lo anterior se elige de todas las estadsticas disponibles aquella con el menor sesgo y
variancia posible. Ms an, el mejor estimador posible es aquel que es insesgado y que de todos los
insesgados tiene la menor variancia, a este estimador se lo llama estimador insesgado de menor
variancia (EIMV).
En este curso definiremos poblaciones y los parmetros de inters y se dir en cada caso cual es el
estimador adecuado, su media y su desviacin estndar.
Observar que en cada caso, se toma como estimador la estadstica que corresponde al parmetro que
se quiere estimar.
Teniendo en cuenta esto y como estamos interesados en muestras grandes, en adelante supondremos
que n 30, y que trabajamos con un estimador insesgado de que tiene una distribucin normal.
Una manera de evaluar la bondad de una estimacin puntual es a travs de la distancia entre el
estimador y el parmetro. Esta cantidad se denomina
Error de estimacin. | |.
Como se desea que este error sea lo menor posible, interesa saber si es menor que una cierta cota
que se suele expresar en trminos de la desviacin estndar del estimador:
Ahora bien, no se puede saber si | | < c pues desconocemos . Sin embargo, conociendo las
caractersticas de la distribucin de , se puede calcular la probabilidad de que | | < c , es
decir,
P(| | < c )
Por ejemplo, si c = 1.96 y suponiendo que la distribucin de es normal,
P(| | < 1.96 ) = 0.95
En la siguiente figura aparece el rea correspondiente.
Ejemplo. Se quiere estimar la media de una poblacin. Se toma una muestra de tamao n = 50 y
se obtiene x = 9.1, s = 0.24. Dar una estimacin para y evaluar la exactitud de la estimacin
con c = 1.96.
Parmetro
Estimador x (insesgado E( x ) = y tiene una distribucin de muestreo normal si el tamao de la
muestra es grande).
Estimacin para : 9.1.
Cota para el error de estimacin (usando s para aproximar ):
1.96 x = 1.96 / n 1.96 s / n = 1.96 0.24 / 50 0.07.
Como
P(| x | < 1.96 x ) = 0.95 P(| x | < 0.07) = 0.95
podemos decir que la probabilidad de que el error de estimacin sea menor que 0.07 es de 95%.
En la siguiente figura aparece el rea correspondiente.
ESTIMACIN DE LA MEDIA POR INTERVALO USANDO MUESTRAS
GRANDES CON VARIANZA POBLACIONAL CONOCIDA Y CON VARIANZA
POBLACIONAL DESCONOCIDA
Supongamos que disponemos de una poblacin en la que tenemos una v.a. con distribucin
N( ,) con conocida (de estudios previos, por ejemplo). Obtenemos una muestra
de tamao n y deseamos estimar la media de la poblacin.
la cantidad
Figura 1: Seleccin de los puntos crticos para el cculo del intervalo de confianza.
Sustituyendo Z por su valor en este caso particular
en la prctica, de todos los posibles valores de tenemos uno slo y por tanto un nico
intervalo de todos los posibles para distintas muestras
En la prctica disponemos de una nica repeticin del experimento, y por tanto de un nico
intervalo de confianza, el sealado en negro en el grfico, por ejemplo. Confiamos en que
nuestro intervalo sea de la mayora que con tiene al verdadero valor objetivo aunque no
tenemos la seguridad de que sea as, tenemos concretamente un riesgo del 5% de
equivocarnos.
Figura 2: Interpretacin del nivel de conmfianza en el intervalo para la media de una
distribicin normal.
Esto puede conseguirse modificando las distintas cantidades que aparecen en la frmula: el
nivel de confianza, a travs del valor crtico, la variabilidad y el tamao muestral.
Estudiaremos cada una por separado
-NIVEL DE CONFIANZA
-VARIANZA
Teniendo en cuenta la distribucin normal asociada a las medias y combinndola con la ji-
cuadrado, obtenemos una distribucin t de Student:
podemos escribir
Despejando n de la igualdad
obtenemos la expresin deseada para el tamao muestral.
Obsrvese que en el clculo del tamao muestral se han igualado el error fijado a priori con
el error en la estimacin obtenido del intervalo de confianza y que este ltimo incluye el
nivel de confianza. En este aprtado un nivel de confianzadel 95%, por ejemplo, implicaria
que en el 95% de las veces que repitieramos el experimento con el tamao muestral
calculado, obtendramos un error por debajo del prefijado, mientras que en el 5% restante
obtendramos un error superior.
En este apartado describimos el uso del SPSS para el anlisis de una muestra mediante
la obtencin de intervalos de confianza y la resolucin de contrastes de hiptesis, todos
ellos referidos a la media de la poblacin de la que proviene la muestra.
Una vez abierto un banco de datos, por ejemplo AMBIENTE, podemos invocar el
Procedimiento:
Ejercicio:
En estudios previos se concluy que el nivel medio de sulfato era de 5.1. Confirman los
datos del fichero AMBIENTE las conclusiones de dichos estudios?
Es frecuente, en los sondeos de opinin, investigar las preferencias de la poblacin por una
determinada opcin A, frente a otra opcin B.
Por ejemplo : qu proporcin de posibles votantes optan por un candidato A frente a otro
B?.
Otras veces interesa saber, qu proporcin de individuos de una poblacin, presentan una
caracterstica A, frente a los que no la presentan.
En cualquier caso, como normalmente no podemos estudiar a todos los individuos de una
poblacin porque, o es muy caro o sencillamente es imposible, tenemos que tomar una
muestra
Que tambin sigue una distribucin binomial y que bajo ciertas condiciones, se puede
aproximar por una distribucin normal estndar.
Como :
<="" p="">
As pues, el valor ms esperado (la media) de las proporciones de las muestras ,P, es la
proporcin de la poblacin p y adems cuando aumenta el tamao de las muestras, P
se aproxima a p.
En la prctica, las concidiones que se consideran suficientes para que la estima sea
aceptable, son :
Por ejemplo, supongamos que queremos que la probabilidad de que la proporcin de una
muestra est dentro de un intervalo a calcular, sea de 0,95; slo tenemos que tipificar P y
mediante la tabla de la distribucin normal estndar, calcular tpara = 1-0,95=0,05.
Como no conocemos la proporcin de la poblacin, p, la sustituimos por la proporcin
de la muestra, P, con lo cual el intervalo ser diferente para cada muestra, pero, con
probabilidad 1- , la proporcin de la poblacin, estar dentro del intervalo as
calculado y tendremos una estimacin de la proporcin de la poblacin por un
intervalo.
Tamao de la muestra
DETERMINACIN DEL TAMAO DE MUESTRA PARA ESTIMAR UNA
PROPORCIN POBLACIONAL
donded es el radio mximo deseado para el intervalo y z/2 tiene el significado habitual.
Ntese que no hemos tenido en cuenta el ltimo trmino de la primera expresin.
A partir de la frmula puede comprobarse que el tamao muestral requerido, una vez fijada
p, crece al incrementarse la confianza del intervalo y crece tambin al incrementarse la
precisin (al disminuir el radio).
Con el programa siguiente podemos calcular los tamaos muestrales necesarios para
conseguir una precisin determinada bajo diferentes supuestos.
Si no se posee estimacin previa para la p, hay que dejar el valor por defecto p = 0,5.
Ho; = 50 cm/s
H1; 50 cm/s
Supngase que se realiza una prueba sobre una muestra de 10 especmenes, y que se
observa cual es la rapidez de combustin promedio muestral. La media muestral es un
estimador de la media verdadera de la poblacin. Un valor de la media muestral que este
prximo al valor hipottico = 50 cm/s es una evidencia de que el verdadero valor de la
media es realmente 50 cm/s; esto es, tal evidencia apoya la hiptesis nula Ho. Por otra
parte, una media muestral muy diferente de 50 cm/s constituye una evidencia que apoya la
hiptesis alternativa H1. Por tanto, en este caso, la media muestral es el estadstico de
prueba.
La media muestral puede tomar muchos valores diferentes. Supngase que si 48.5
51.5, entonces no se rechaza la hiptesis nula Ho; = 50 cm/s, y que si <48.5 >51.5,
entonces se acepta la hiptesis alternativa H1; 50 cm/s.
Los valores de que son menores que 48.5 o mayores que 51.5 constituyen la regin
crtica de la prueba, mientras que todos los valores que estn en el intervalo 48.5 51.5
forman la regin de aceptacin. Las fronteras entre las regiones crtica y de aceptacin
reciben el nombre de valores crticos. La costumbre es establecer conclusiones con
respecto a la hiptesis nula Ho. Por tanto, se rechaza Ho en favor de H1 si el estadstico de
prueba cae en la regin crtica, de lo contrario, no se rechaza Ho.
Todo este tipo de resultados estadsticos en ningn modo sustituyen a la revisin exhaustiva
de la literatura y el estudio del marco terico-conceptual en el que se inscribe el trabajo de
investigacin, pero constituyen una informacin complementaria en manos del investigador
a la hora de concretar el objeto de inters y fundamentar su estudio.
Por otra parte, a veces la formulacin del problema no se apoya slo en resultados de
investigaciones anteriores, sino que el investigador recurre a trabajos descriptivos previos o
estudios pilotos, en los que el empleo de la Estadstica puede contribuir a clarificar el
problema en estudio. Los resultados de una descripcin estadstica acerca de determinadas
variables implicadas en algn fenmeno educativo, podran dar pie a que se formularan
hiptesis en las que se contemple la relacin entre variables; y estudios basados en la
obtencin de medidas estadsticas de correlacin entre variables facilitaran el
planteamiento de problemas y la formulacin de hiptesis que suponen relaciones de
causalidad. Tatsuoka y Tiedeman (1963), en su trabajo sobre la Estadstica en el mtodo
cientfico, insisten en esta posibilidad, afirmando el papel de las tcnicas estadsticas en el
desarrollo de constructos tericos e hiptesis acerca de las relaciones entre ellos. De este
modo, la Estadstica est presente en la fase inductiva del mtodocientfico, contribuyendo
a la creacin de modelos tericos a partir de los cuales se deducirn hiptesis contrastables
que relacionan variables observables.
b) Diseo de investigacin
La recoleccin de datos es una tarea en la que aparentemente no parecen jugar un papel las
tcnicas estadsticas. Sin embargo, la Estadstica est de manera implcita presente si
consideramos el modo en que se elaboran los instrumentos utilizados para la recogida de
datos (tests, cuestionarios, protocolos de observacin, etc.). A esta disciplina corresponde
un papel crucial en la construccin de tales instrumentos, dado que las tcnicas estadsticas
estn en la base de los procedimientos por los cuales se analizan sus caractersticas
tcnicas. Por citar algunos ejemplos, la determinacin de la fiabilidad y validez de algunos
instrumentos se apoya directamente en coeficientes de correlacin; la aplicacin de tcnicas
de anlisis de componentes principales o anlisis factorial permite explorar o confirmar la
dimensionalidad de los instrumentos; los mtodos para el anlisis de items, en la teora
clsica de los tests o en la teora de res- puesta al tem, se basan en correlaciones y en la
estimacin de parmetros recurriendo a diferentes procedimientos estadsticos, tales como
los mtodos de mxima verosimilitud o los mtodos de inferencia bayesiana; tests como el
de chi-cuadrado permiten valorar el grado de ajuste de las respuestas a los items a modelos
logsticos de uno, dos o tres parmetros.
Al margen de todo el aparato estadstico que se esconde tras la elaboracin o el anlisis de
los instrumentos de recogida de datos, la Estadstica puede participar indirectamente en la
operacin de recogida proporcionando primeras elaboraciones de los datos en el momento
mismo de su registro. Por ejemplo, cuando tras aplicar un test se registran los resultados en
forma de percentiles o eneatipos, resultantes de la comparacin de la puntuacin del sujeto
con un grupo normativo.
c) Anlisis de datos
Una prueba de ello puede hallarse en el interesante estudio emprico de Morales (1995),
realizado sobre una muestra de 92 artculos y captulos de libros referidos a las
metodologas de investigacin cualitativa y/o cuantitativa. De acuerdo con las conclusiones
de aquel estudio, el modelo ideal de metodologa cuantitativa se caracteriza, entre otros
aspectos, por su asociacin a las concepciones epistemolgicas positivistas y por el uso de
la Estadstica en el anlisis de datos, mientras que la metodologa cualitativa queda
caracterizada por concepciones interpretativas o fenomenolgicas y por el anlisis de los
datos siguiendo vas diferentes a la Estadstica.
Tomando como marco la presencia de las tcnicas estadsticas directa o indirecta- mente en
los diferentes momentos del proceso de investigacin educativa, podramos destacar
tcnicas y procedimientos estadsticos que resultan especialmente caractersticos de los
mtodos descriptivos, correlacionales y experimentales emplea- dos en la investigacin
desarrollada desde una perspectiva cientfico-experimental.
En el caso de los mtodos descriptivos, el propsito del investigador es llegar a describir las
caractersticas de un objeto, hecho o fenmeno a partir de algn modo de observacin
sistemtica del mismo, una vez que ste ya se ha producido. La Estadstica cuenta con un
amplio abanico de tcnicas que contribuyen directa o indirectamente al objetivo de la
descripcin de un conjunto de datos. Por ejemplo, cuando los datos recogidos se refieren a
una sola variable, las tcnicas estadsticas disponibles son las propias de la Estadstica
descriptiva univariable, y la Estadstica multivariante tambin cuenta con tcnicas
apropiadas al objetivo de la descripcin de fenmenos o realidades educativas.
En los mtodos correlacionales, la presencia de la Estadstica es indispensable, en la
medida en que el establecimiento de relaciones entre variables se apoya directamenteen
ndices, tcnicas o procedimientos estadsticos especficos. Adems del uso de la
correlacin, los mtodos correlacionales se caracterizan por el empleo de tcnicas esta-
dsticas que permiten estudiar las covariaciones que se dan entre los fenmenos educativos
en los que concurren mltiples aspectos o dimensiones.
Si bien los procedimientos fsicos resultan ser el medio ms adecuado para el control de
variables en la experimentacin desarrollada en ciencias fsico-naturales, en el campo de las
ciencias humanas, y en particular en la investigacin educativa, este tipo de control no es
posible. En nuestro campo, estamos lejos de lograr situaciones en las que el experimentador
posee un dominio casi absoluto, como se contempla en la tradicin experimental de Fisher.
En este contexto, la solucin al control de las variables se consigue a travs de tcnicas
estadsticas. Por ejemplo, conseguir la aleatorizacin en la constitucin de grupos cuando
stos existen de forma natural sera difcil. Por ese motivo, las variables extraas podran
estar presentes en los grupos constituidos con distintos niveles, haciendo que los grupos
sean diferentes antes de comenzar el experimento. Gracias a la utilizacin de tcnicas
estadsticas como el anlisis de covarianza, es posible suplir el control riguroso de la
situacin en este tipo de experimentos, pues mediante tal tcnica se consigue un ajuste
estadstico de los datos que permita comparar los grupos despus de la aplicacin del
tratamiento como si se hubiera partido de una situacin inicial de equivalencia.Esta
potencialidad de las tcnicas estadsticas cuando el experimentador carece de control sobre
la situacin experimental era ya anunciada por Campbell y Stanley (1963), al afirmar que
una capacitacin ms a fondo de los investigadores educacionales en tcnicas modernas de
estadstica experimental permitira elevar la calidad de la experimentacin pedaggica.
Partiendo de las frecuencias con que se dan determinados fenmenos o estn pre- sentes
determinados temas en los textos, identificaramos las relaciones que se dan entre los
elementos mediante la aplicacin de determinadas tcnicas estadsticas, cuya importancia
en el contexto de un anlisis de datos cualitativos vara ampliamente, desde una presencia
nula hasta el uso de tcnicas estadsticas de variado grado de complejidad (Wilcox, 1982).
Cuando los resultados de la cuantificacin de textos son analizados estadstica- mente,
conviene emplear pruebas estadsticas inferenciales, preferentemente no para- mtricas,
dado que con este tipo de datos no es posible mantener el supuesto de normalidad de la
poblacin, en el que en gran medida se apoya la Estadstica clsica. Adems, no podramos
pasar mucho ms all de un nivel de medida nominal y ordinal. Una revisin de las tcnicas
estadsticas aplicables a datos categricos resultantes de la reduccin cuantitativa de datos
textuales puede consultarse en el trabajo de Garca, Gil y Rodrguez (1994).
Desde determinados enfoques, los procedimientos estadsticos ganan importancia frente a
las tcnicas cualitativas de anlisis. Es el caso del anlisis de contenido tradicional, donde
el inters del investigador se diriga al recuento de frecuencias de aparicin de palabras o
temas de especial relevancia en el estudio, con el objetivo deproceder a su tratamiento
estadstico. Desde muy pronto, los programas de anlisis automtico de textos se han
basado en los recuentos y el tratamiento estadstico. Cabe citar el programa GENERAL
INQUIRER (Stone y Otros, 1966), uno de los pioneros, o el programa WORDS (Iker,
1975), con el que llegan a ser extrados los temas presentes en un texto sometiendo a
tratamiento estadstico las frecuencias de las palabras en cada unidad considerada.
Con este tipo de enfoques, la cuantificacin y el procesamiento estadstico pueden llegar a
ser la va exclusiva por la que se analizan los textos. Sirva como ejemplo la aplicacin de
las tcnicas de anlisis de datos de la escuela francesa al anlisis de textos procedentes de
respuestas abiertas a cuestionarios, entrevistas, textos literarios, etc., permitiendo el
recuento de unidades elementales en los textos y la realizacin de anlisis estadsticos
multivariantes (anlisis de correspondencias, clasificaciones) a partir del mismo. Este tipo
de enfoques se ha desarrollado enormemente, dando lugar a la denominada Estadstica
textual (Lebart y Salem, 1994).
Hasta ahora hemos comentado la amplia gama de posibilidades que la Estadstica ofrece en
las diferentes etapas del proceso de investigacin y en los modos diversos de afrontar la
indagacin acerca de la realidad educativa. De alguna forma, la Estadstica es una
herramienta fundamental en la metodologa de investigacin, hasta el punto de que ha
llegado a ser considerada como el lenguaje de la ciencia.
Pero si el progreso de la Estadstica puede ser entendido como un verdadero motor para el
desarrollo de la investigacin pedaggica, bien es verdad que la aplicacin de la Estadstica
en el campo de la investigacin educativa se ve limitada por fronteras que surgen a veces de
una mala concepcin de estas herramientas, traducida en un uso inadecuado o para fines
cuestionables, y otras, de las limitaciones con las que las propias tcnicas cuentan,
especialmente cuando se trata de abordar un objeto de estudio tan complejo como es la
educacin.
a) Fines cuestionables
Cabra aqu recoger las palabras de Cormack (1971) cuando afirma que la Estadstica es
una combinacin de tcnicas y sentido comn, sin que ste pueda ser sustituidopor
aqullas. El autor citado refleja su pensamiento con una muy ilustrativa metfora:
las tcnicas son los caballos; el sentido comn sostiene las riendas (1971:164). En
nuestro campo de estudio, podemos sealar parafraseando la afirmacin anterior que
la aplicacin de la Estadstica supone una combinacin de tcnicas y conocimiento
sobre lo educativo. Al aplicar la Estadstica en la investigacin educativa es preciso no
olvidar el conocimiento no estadstico. Como afirman Box, Hunter y Hunter (1989) al
ocuparse de la utilizacin de la Estadstica, las tcnicas son ms efectivas cuando se
combinan con el apropiado conocimiento del tema al que se aplican.
c) Violacin de supuestos
Por tanto, cada tcnica de anlisis estadstico requiere el cumplimiento de unas condiciones
para poder ser aplicada, y esta aplicacin ha de ir precedida de un estudio sobre el
cumplimiento o no de tales condiciones. A veces, la violacin de los supuestos de partida
conlleva pequeas alteraciones sobre los resultados que en parte pueden ser previstas por el
investigador; pero como norma general, y ante el desconocimiento de la robustez de las
pruebas y los efectos que la violacin de los supuestos pueda acarrear sobre los resultados,
es preferible ajustarse a la ms pura ortodoxia si no queremos que las conclusiones
extradas puedan resultar poco vlidas.
En cuanto a los lmites propios de las tcnicas estadsticas, podemos comenzar hablando de
la incertidumbre respecto a los resultados. El conocimiento al que llegamos a travs de la
Estadstica no es exacto sino probable. No debemos olvidar que las conclusiones
alcanzadas por medio de los procedimientos inferenciales se apoyan en conceptos
probabilsticos y contemplan la posibilidad de un margen de error.
En relacin a este aspecto puede hacerse una consideracin adicional. Cabra cuestionar el
modo en que se logra la inferencia inductiva cuando rechazamos la hiptesis nula y
adoptamos para ello el nivel de significacin del 0.05. Como seala Cohen (1990), las ideas
de Fisher se han convertido en la base de la inferencia estadstica debido a que ofrecen un
esquema determinista, mecnico y objetivo que permite, con independencia del contenido,
llegar a decisiones de aceptacin o rechazo. Sin embargo, el nivel establecido para la toma
de decisiones (a=0.05) no deja de ser un criterio arbitrario y convencional, un punto de
referencia en el continuo de probabilidades asocia- das a la hiptesis nula. Ante una
probabilidad p=0.050 y una probabilidad p=0.051 no podemos afirmar taxativamente que
existen razones ontolgicas para justificar una decisin de signo contrario en la
investigacin educativa. Tal vez este dogma sea una de las razones que llevaban a Salsburg
(1985) a afirmar que la aplicacin de la Estadstica en las ciencias sociales se asemeja a la
prctica de una religin secular.
Por otra parte, los resultados del anlisis estadstico pueden resultar incompletos en s
mismos. Por ejemplo, al realizar un anlisis de la varianza somos capaces de determinar los
factores que explican la varianza experimental, pero desconocemos qu se esconde detrs
de la varianza de error. En un anlisis de regresin llegamos a explicar slo un porcentaje
de la varianza en la variable criterio, pero desconocemos qu elementos se esconden tras la
varianza no explicada. De alguna forma, el conocimiento que nos permiten las tcnicas
estadsticas es limitado.
Cuando la Estadstica es aplicada a la investigacin educativa surgen limitaciones
adicionales derivadas de la complejidad del objeto de estudio. Las realidades educativas,
los comportamientos humanos resultan extremadamente multifacticos y estrechamente
vinculados a las caractersticas del contexto en el que se dan, de tal forma que muchos
consideran difcil que los nmeros sean capaces de reflejarlos. El nmero supone alejarse
de la riqueza de significados asociada al objeto de estudio. Por otra parte, las tcnicas
estadsticas implican seleccionar un modelo que traduce la realidad emprica en un sistema
formal de elementos relacionados; si tratamos de que este modelo sea simple nos alejamos
del fenmeno real, mientras que si incluimos en este modelo la complejidad de la situacin
convertiramos el problema en prcticamente inabordable desde el punto de vista de la
metodologa estadstica.
La aleatoriedad de las muestras no es el nico caso. Buena parte de los supuestos exigidos
para la aplicacin de las tcnicas estadsticas no siempre se dan en la realidad educativa. Es
el caso de la distribucin normal de las variables o del supuesto de homoscedasticidad de
varianzas. Por otra parte, la aditividad resulta difcil de aceptar cuando medimos realidades
no observables directamente. Adems, gran parte de la Estadstica inferencial se apoya en
distribuciones de frecuencias para poblaciones infinitas, cuando en el mundo real, y en
particular en el mundo educativo, se suelen estudiar poblaciones finitas.
Adems de estas objeciones epistemolgicas, la medida en educacin presenta ciertas
dificultades que limitan el alcance de los resultados a los que nos conduce el anlisis
estadstico de los datos. Como seala Tejedor (1988), entre los problemas ms importantes
de la ciencia pedaggica se encuentra la obtencin de mtodos adecuados de medicin: en
nuestro campo no existen a veces instrumentos adecuados o unidades de medida para
valorar dimensiones o caractersticas de los fenmenos.
Todo ello hace que, an reconociendo el importante papel que desempean las tc- nicas
estadsticas en la investigacin educativa, su empleo sea contemplado con cierta cautela,
puesto que un uso incorrecto de las tcnicas de anlisis, bien por desvirtuar sus fines y su
lugar natural en el proceso de investigacin, o bien por desconocimiento, puede llevarnos a
cuestionar su pertinencia para el estudio de los problemas plantea- dos. Adems, es preciso
ser conscientes de las propias limitaciones de los mtodos estadsticos y de los supuestos
estadsticos que imponen a las situaciones estudiadas,que en el caso de las educativas
podran resultar difciles de cumplir. En la medida en que se tengan en cuenta
consideraciones de este tipo, conseguiremos combatir la ima- gen negativa que no pocas
veces se proyecta de la Estadstica.
Este camino de la evolucin nos ha permitido comprender los principios bsicos del
Universo de manera concreta. Gracias a nuestros cinco sentidos, sabemos que cada accin
es una causa que provoca un efecto, y que cada efecto posee una causa. De tal forma que el
proceso de percepcin involucra a su vez cuatro etapas, conocidas como: formacin de
imgenes, establecimiento de sensaciones, esclarecimiento de ideas y elaboracin de
conceptos.
Estas cuatro etapas en conjunto conducen al proceso de observacin. De tal forma que la
observacin es la utilizacin de los sentidos para la percepcin de hechos o fenmenos que
nos rodean, o son de inters del investigador.
Desde el punto de vista de la Epistemologa, existen tres herramientas bsicas para abordar
a los hechos, o todo aquelloque sucede en la naturaleza: observando,midiendo y
experimentando. Lo cual puede realizarse en una accin a la vez, o las tres de manera
simultnea. Esto quiere decir que un fenmeno se est observando.
Por lo que, la observacin metdica y sistemtica de los hechos, permitir a travs del
tiempo, generar informacin (o datos) acerca de su comportamiento. De esto resulta, que un
hecho o fenmeno, podr observarse en trminos de fracciones de segundo, como en una
reaccin qumica, o de manera perpetua, como en el movimiento de los planetas, o de
alguna variable del clima. Y la disponibilidad de datos a su vez permite observar, medir o
experimentar en torno al fenmeno estudiado, todo en un proceso dialctico.
Los astrlogos caldeos de los siglos VII y VI a. C., quienes al igual que sus antecesores
babilonios, crean que los cielos eran divinos, y por lo tanto identificaban a cada planeta
con una deidad (Mercurio, Venus, Marte). Pensaban que observando sus movimientos
podan predecir sus intenciones. Si la conducta de los planetas hubiera sido irregular,
haciendo algo nuevo cada vez, la tarea de los astrlogos habra sido muy difcil y,
probablemente no lo habran iniciado. Pero dado que los movimientos eran cclicos y se
repetan una y otra vez, la operacin no pareca tan difcil y, por tanto, tena sentido ser
extremadamente cuidadoso y preciso en las observaciones. Kidinnu (siglo VI a. C.) calcul
el movimiento del sol con una exactitud tal que slo fue superada en el siglo XX. Cabe
recordar que caldeos, babilonios y griegos, carecan de telescopios.
El evento que permite generar experiencia y que est ampliamente relacionado con el de
observacin puede ejemplificarse con la formidable actividad de Tyge o Tico Brahe; l
nunca hizo grandes descubrimientos, salvo uno, que lo convirti en el padre de la
Astronoma moderna, fundada en la observacin. El descubrimiento estriba en que la
astronoma tena necesidad de datos observados, precisos y continuos. Guardad todos
silencio y escuchad a Tico, quien dedic treinta y ocho aos de su vida a la observacin del
movimiento de los planetas (de 1563 a 1601).
Poco se ha escrito e investigado acerca de las ciencias entre los pueblos mesoamericanos.
Sin embargo una constante emerge entre lo que normalmente se pone de relieve: la
observacin detallada y continua de los astros para obtener la precisin de los clculos
astronmicos. Eli de Gortari presenta en su libro, "La ciencia en la historia de Mxico" la
siguiente tabla, en la cual es posible comprender la magnitud e importancia de la
observacin.
Perodo Sindico
CLCULO MAYA CLCULO MODERNO
Luna 29.530864 29.53058877
Mercurio 115 115.667
Venus 584 583.92
Marte 780 779.936
Jpiter 389.6 398.867
Hiptesis estadsticas:
Ejemplos:
Estimacin: Hi: X > 90 Para una hiptesis deinvestigacin descriptiva de una variable
que diceel promedio de la clase es mayor de 90. Se leantepone una hiptesis nula que
estadsticamentesera Ho: X = 90 y la hiptesis alternativa podrarepresentarse
estadsticamente como: Ha: X < 90.
Algunos investigadores consideran las hiptesis deestimacin como de diferencia dado que
se evala ladiferencia entre un valor hipottico y uno observadoen una sola muestra.
Ejemplo:
Ho: X < 200 ( El promedio mensual de casos es menor que 200)y la hiptesis
alternativa sera:
Hi: r x y = 0
Ho: rxy = 0 (Las dos variables no estn correlacionadas; su correlacin es cero.)
Otro ejemplo:
Hi: R xyz = 0 (La correlacin entre las variables autonoma, variedad y motivacin
intr nseca no es igual a cero.)
Ho: R xyz = 0 (No hay correlacin.)
C. Diferencia: (entre grupos o sujetos a partir de una misma medida oestadgrafo - media,
mediana, rango, porcentajes).
Supngase la hiptesis de investigacin que dice que los porcentajesde individuos que
prefieren una locin en particular difieren segn elnivel acadmico (3 niveles).
Es decir, no hay diferencia entre los porcentajes de los gruposconstituidos por los niveles
acadmicos.
Las hiptesis contienen tres elementos estructurales que son:Las unidades de anlisis o de
observacin. A saber, individuos,instituciones, conglomerados.
El enlace lgico o trmino de relacin. Que describe la relacinexistente entre las unidades
de anlisis con las variables y de stas entres.
Se trata de cuatro columnas la primera identifica la variable porsu nombre, la segunda nos
dice qu es? cmo se defineconceptualmente, la tercera columna no da la respuesta a
lapregunta cmo se observa esta variable? y contiene losindicadores de la misma. La
cuarta columna nos responde lapregunta cmo se mide? (suponiendo que se trata de
unavariable medible). La definicin operacional permite conocercon claridad el nivel de
medicin de la variable (Nominal,ordinal, escalar o de razn)
HIPTESIS NULA E HIPTESIS ALTERNATIVA
Un contraste de hiptesis estadstico se plantea como una decisin entre dos hiptesis.
H0: = 0
H1: = 1
En la teora del contraste de hiptesis este tipo de planteamiento se conoce como contraste
de hiptesis simple contra simple.
As pues, una hiptesis simple postula que el parmetro slo puede tomar un valor o bien,
ms tcnicamente, que el conjunto de parmetros asociado a una hiptesis simple consiste
en un slo punto.
H o : o
Prueba de 2 colas
H1 : o
H o : o
Prueba de cola izquierda
H1 : o
H o : o
Prueba de cola derecha
H1 : o
Es importante recordar que las hiptesis siempre son proposiciones sobre la poblacin o
distribucin bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del
parmetro de la poblacin especificado en la hiptesis nula se determina en una de tres
maneras diferentes:
1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso,
entonces el objetivo de la prueba de hiptesis usualmente es determinar si ha
cambiado el valor del parmetro.
2. Puede obtenerse a partir de alguna teora o modelo que se relaciona con el proceso
bajo estudio. En este caso, el objetivo de la prueba de hiptesis es verificar la teora
o modelo.
3. Cuando el valor del parmetro proviene de consideraciones externas, tales como las
especificaciones de diseo o ingeniera, o de obligaciones contractuales. En esta
situacin, el objetivo usual de la prueba de hiptesis es probar el cumplimiento de
las especificaciones.
Prueba unilateral
Prueba de hiptesis con muestra grande ( 30), acerca de una media de la poblacin
para una prueba unilateral de la forma:
0 : 0
1 : < 0
Estadstico de prueba:conocida.
0
=
Estadstico de prueba: desconocida
0
=
Una prueba de una cola o unilateral para la media poblacional tiene una de las dos formas
siguientes.
Prueba de la cola inferior Prueba de la cola superior (o
(o izquierda) derecha)
0 : 0 0 : 0
1 : < 0 1 : >
Ejemplo:
La comisin Federal de Comercio lleva a cabo estudios peridicos para probar las
afirmaciones que hacen los fabricantes acerca de sus productos. Por ejemplo, la etiqueta de
una lata grande de caf Cumbre dice que ese envase contiene, cuando menos, tres libras de
caf Cumbre dice que ese envase contiene, cuando menos, tres libras de caf. Supongamos
que deseamos comprobar esta aseveracin mediante la prueba de hiptesis.
Con el nivel de significancia = .01 se tiene una prueba de -2.33 que ser nuestro punto
crtico (notificar con la tabla de Valores crticos de Z en las pruebas de hiptesis)
1 0
2.66
De acuerdo a las reglas que se mencionaron antes, se rechaza la hiptesis nula, ya que entra
en la zona de rechazo, en donde se acepta la hiptesis nula.
Por lo que nuestra conclusin queda as:
Se rechaza la hiptesis nula ya que no cumplen con la afirmacin de que cada envase
contiene cuando menos 3 libras de caf y los fabricantes no cumplen con sus afirmaciones
y con el contenido que dicen sus etiquetas.
Ejercicio:
De acuerdo con la Asociacin Nacional de Vendedores de Automviles, la media del precio
de los automviles usados es de $10,192 dlares. Un gerente de una agenda de automviles
usados en la cuidad de Kansas reviso en su establecimiento una muestra de 100 ventas. El
precio de la media de la muestra fue de $9300 dlares y la desviacin estndar de la
muestra fue de $4500 dlares. Si representa la media del precio de la poblacin de
automviles usados en esa agencia, pruebe la hiptesis:
0 : 10,192
1 : < 10,192
= 100
= 9300
Estadstico de prueba:
=
9300 10192 892
= 4500 = = 1.98
450
100
Con el nivel de significancia = .05 se tiene una prueba de -1.645 que ser nuestro punto
crtico (notificar con la tabla de Valores crticos de Z en las pruebas de hiptesis)
1.98
Conclusin:
Se rechaza que el promedio del precio de los automviles sea mayor que $10,192 dlares,
el gerente que realizo la prueba debe de estar seguro que la afirmacin nula que se hiso es
aberrante y que puede considerar o aceptar que el precio de los automviles usados es
menor que $10192 dlares.
Prueba bilateral
La pruebas bilaterales difieren de las unilaterales en que la regin de rechazo esta
simultneamente en las colas o extremos inferior o superior, de la distribucin muestral.
Debe rechazar 0 para valores del estadstico que caigan en la cola inferior o en la cola
superior de la distribucin de la muestra. A esto se le llama prueba bilateral de hiptesis.
Prueba de hiptesis con muestra grande ( ) respecto a una media de poblacin para
una prueba bilateral de la forma:
: =
:
Estadstico de prueba: conocida
=
Estadstico de prueba: desconocida
=
Regla de rechazo a un nivel de significancia
< >
0 2 Cuando se desconoce.
Ejemplo:
La Asociacin Americana de Golf ha establecido reglas que deben cumplir los fabricantes
de equipos de golf para que sus productos se acepten en los eventos de USGA. Una de las
reglas, para la fabricacin de las pelotas de golf, dice: una marca de pelota de golf, al
probarse en l aparato aprobado por la USGA en el campo de la USGA no debe de llagar
a una distancia promedio mayor , en el aire y en el rodamiento, que sea de 280 yardas.
Suponga que Sperflight, Inc., acaba de desarrollar un mtodo da fabricacin con alta
tecnologa que puede producir pelotas de golf para alcanzar una distancia promedio de 280
yardas.
Dio como resultado la siguiente prueba bilateral.
0 : = 280
1 : 280
Apara probar esta hiptesis:
Con un nivel de significacin = .05,
Se muestrearon n=36 pelotas
Se determino una media de la muestra para la distancia = 278.5 yardas
Desviacin estndar de la muestra = 12 yardas
Sustituyendo estos resultados con 2 ---- 1.96
2
12
= 278.5 1.96
36
= 278.5 3.92
274.58 282.42 (275,283)
Se acepta con un 95% de confianza, la medida de la distancia para la poblacin de pelotas
de golf est entre 275 y 283 yardas. La conclusin de la prueba es que no se puede rechazar
la hiptesis nula : = 280
Ejercicio:
LA oficina de Anlisis Econmico, del departamento de Comercio en Estados Unidos,
informo que la media del ingreso anual de un residente de Carolina del Norte es de $18,688
dlares. Un investigador de Carolina del Sur desea probar:
0 : = 18688
1 : 18688
Apara probar esta hiptesis:
Con un nivel de significacin = .05,
Se muestrearon n=400 residentes
Se determino una media del ingreso anual = 16860 dlares
Desviacin estndar de = 14624 dlares
Sustituyendo estos resultados con 2 ---- 1.96
2
14624
= 16860 1.96
400
= 16860 1433.152
15,427 18294 (15427,18294)
Anexo:
Tabla de Valores crticos de Z en las pruebas de hiptesis.
Tipo de prueba
Nivel de significancia
Unilateral Bilateral
+1.645
5% 1.96
1.645
+2.33
1% 2.58
2.33
ERRORES TIPO I Y II.
Una muestra de 50 tarjetas de circuito impreso que se recibieron, revelo que 4 de estas es
decir 8% estaban fuera de especificaciones. El embarque se rechaz porque exceda el
mximo de 6% de tarjetas abajo del estndar. Si la remesa era en realidad fuera de
especificaciones, entonces la decisin de devolver las tarjetas al proveedor fue adecuada.
Sin embargo supngase que las 4 tarjetas fueran de especificaciones que se encontraron en
la muestra de 50, eran las nicas que estaban abajo del estndar, en el envi de 4 000
tarjetas.
Supngase que 2 de las 50 tarjetas de las muestras (4%) estuvieron debajo del estndar, y
que 48 de las 50 tarjetas de circuito impreso fueron aceptables. De acuerdo con el
procedimiento establecido, como la muestra contena menos del 6% de tarjetas abajo del
estndar, se acepto el envi Podra ser que debido al azar, las 48 tarjetas en buen estado
que se seleccionaron en la muestra fueran las nicas aceptables en la remesa completa,
integrada por miles de tarjetas.
Ejemplo con error de tipo I y error de tipo II:
En la siguiente tabla se resumen las decisiones que pueden tomar el investigador y las
consecuencias posibles.
Ejemplo 1:
Un fabricante est evaluando dos tipos de equipo para fabricar un artculo. Se obtiene una
muestra aleatoria de n1 = 50 para la primera marca de equipo y se encuentra que 5 de ellos
tiene defectos. Se obtiene una muestra aleatoria de n2 = 80 para la segunda marca y se
encuentra que 6 de ellos tienen defectos. La tasa de fabricacin es la misma para las dos
marcas. Sin embargo, como la primera cuesta bastante menos, el fabricante le otorga a esa
marca el beneficio de la duda y plantea la hiptesis H0: 1 2 . Pruebe la hiptesis en el
nivel de significancia del 5%.
Datos
n1 = 50 n2 = 80
1 = .10 2 = .075
H0 (1 2 ) 0H1 (1 2 ) > 0
= (= 0.05) = +1.645
Operaciones
n1 p1 + n2 p2 50(0.10) + 80(0.075) 5 + 6
= = = = 0.085
n1 + n2 50 + 80 130
(1 +
) (1 +
) (0.085)(0.915) (0.085)(0.915)
p1p2 =
+ = +
n1 n2 50 80
0.0778 0.0778
= + = 0.0016 + 0.0010 = 0.051
50 80
p1 p2 0.10 0.075 0.025
z= = = = +0.49
p1 p2
0.051 0.051
El valor calculado de z de +0.49 no es mayor que +1.645 para esta prueba del extremo
superior. Por ello, no puede rechazarse la hiptesis nula en el nivel de significancia del 5%.
MATRIZ DE DECISIN.
Para mejorar la calidad una matriz de decisin puede ser til en la seleccin de un proyecto,
en laevaluacin de soluciones alternativas a problemas, y en el diseo de los
recursos.Dependiendo de las necesidades del equipo, estos pueden ser producto /
prestaciones del
servicio; etapas del proceso, los proyectos, o las posibles soluciones.
- Criterio optimista: Se denomina tambin maxi-max, es el que elegira una persona que
pensase que fuese cualfuese la estrategia que eligiera, siempre se le presentara el estado de
la naturaleza ms favorable, por ello elegirala estrategia que presentase el mejor resultado.
- Criterio pesimista o de Wald: Este criterio lo elegira una persona que creyera que una vez
elegida una estrategia,se le presentara el estado de la naturaleza ms desfavorable. En este
caso se podra escoger el valor mximo entrelos mnimos (criterio maxi-min), es decir,
elegira la estrategia que proporcionara el valor mximo entre los mnimosexistentes de
todas las opciones; o el valor mnimo entre los mximos (criterio mini-max).
- Criterio de Laplace: En este caso al no conocerse las probabilidades de cada uno de los
estados de la naturaleza,se asigna a cada uno la misma probabilidad. A continuacin se
calcula el valor monetario esperado de cadaestrategia, y se elige la que ofrezca un valor
ms alto.
- Criterio de Hurwicz: Al utilizar este criterio se consideran slo los valores mximos y
mnimos de cada estrategia, ya que se suma el mejor resultado de cada estrategia ponderado
con el coeficiente de optimismo (), con el peor resultado de cada estrategia ponderado con
el coeficiente de pesimismo (1 - ). El coeficiente de optimismo es subjetivo en la medida
en que lo decide la persona que toma las decisiones.
- Criterio de Savage: Lo utilizaran las personas que tienen miedo a equivocarse, por ello se
crea una nueva matriz de desenlaces en trminos de coste de oportunidad.
Sustituyendo los valores anteriores o resultados por los perjuicios resultantes de no haber
elegido la mejor estrategia, es decir, el coste de oportunidad. De este modo este criterio
muestra lo que se deja de ganar por escoger una estrategia equivocada.
Ejemplo-Aplicacin
Una empresa dedicada a la fabricacin de calzado tiene que analizar entre diferentes
estrategias de produccin, aquella que le proporcione ms ventas, y, en consecuencia, ms
beneficios. Los posibles productos son: botas, zapatos y sandalias.
La decisin la debe tomar en funcin de las predicciones del tiempo que haga en los
prximos meses, ya que esto determinar que se venda ms un producto u otro. Los estados
de la naturaleza previstos son tres: tiempo fro, normal y clido.
La fabricacin de botas le dara unos beneficios (en euros) de 60.000, 15.000 y 2.500, si el
tiempo es fro, normal o clido respectivamente.
La fabricacin de zapatos le dara unos beneficios (en euros) de 5.000, 30.000 y 10.000, si
el tiempo es fro, normal o clido respectivamente.
La fabricacin de sandalias le dara unos beneficios (en euros) de -5.000, 7.500 y 50.000, si
el tiempo es fro, normal o clido respectivamente.
I. Situacin de riesgo
Elaborar la matriz de decisin.
Calcular los valores esperados de cada una de las estrategias.
II. Situacin de incertidumbre
Suponiendo que no conociera la probabilidad que existe de que el tiempo sea fro, normal o
clido:
Utilizando el criterio pesimista o de Wald, indicar qu opcin se elegira.
Qu opcin se elegira si se utiliza el criterio optimista?
Qu decisin se adoptara si se utiliza el criterio de Laplace?
Indicar qu opcin elegira el directivo si selecciona el criterio de Hurwicz para tomar la
decisin, conociendo que el
criterio de optimismo es 0,7.
Cul sera la opcin elegida si se utilizara el criterio de Savage?
I. Situacin de riesgo
a) Matriz de decisin:
Los valores mnimos de cada opcin son 2.500 (botas), 5.000 (zapatos), y 5.000
(sandalias). Segn este criterio eldirectivo elegira la estrategia que le presentara el valor
mximo de los mnimos, por ello la opcin elegida sera la dezapatos porque asegura como
mnimo unas ganancias de 5.000 unidades monetarias.
Los valores mximos de cada opcin son 60.000 (botas), 30.000 (zapatos), y 50.000
(sandalias); por ello la opcinelegida sera la de botas que supone el valor mximo entre los
mximos de las tres alternativas (el beneficioesperado en la mejor de las opciones es el
superior).
e) Opcin elegida segn el criterio de La Place: este criterio supone que no se conoce la
probabilidad de queocurra cada una de las alternativas posibles, por ello el directivo
considera que cada una de ellas tiene la mismaprobabilidad de que ocurra; en este caso,
como son tres las opciones, sera 1/3 en cada una de ellas. El valoresperado se calcula
teniendo en cuenta esta probabilidad y se elige la mejor opcin.
En este caso se elegira la opcin de fabricar botas que es la que ms beneficios podra
proporcionar (25.575 unidades monetarias).
La alternativa elegida sera la de botas porque, al ponderar con estos coeficientes, ofrece el
valor esperado ms alto.
g) Utilizar el criterio de Savage para tomar una decisin significa elaborar una matriz de
coste de oportunidad. Para ello, en cada estado de la naturaleza se da valor 0 a la mejor
opcin, en el resto de las opciones se halla la diferencia en relacin con la mejor:
Una investigacin bien planificada debe incluir en su diseo referencias precisas acerca de
las tcnicas estadsticas que se utilizan en el anlisis de los datos.
El anlisis estadstico es el procedimiento objetivo por medio del cual se puede aceptar o
rechazar un conjunto de datos como confirmatorios de una hiptesis. El desarrollo de las
pruebas estadsticas se ha incrementado a tal grado que en la actualidad se cuenta con
varias pruebas alternativas, las cuales se pueden usar para casi todo diseo experimental, de
modo que el investigador se encuentra ante el dilema de seleccionar la ms apropiada y
econmica, para las preguntas que, mediante.la.investigacin,.deseacontestar.
Ante esa situacin, es necesario tener una base racional, por medio de la cual se
seleccione la prueba ms apropiada. Esta seleccin constituye el punto crtico del anlisis
estadstico.
a. Tipo de escala.
b. Hiptesis.
c. Potencia y eficiencia de la prueba.
d. Caractersticas muestrales.
e. Tendencia rectilnea o curvilnea del fenmeno.
El sistema numrico es una creacin altamente lgica, que ofrece mltiples posibilidades,
para manifestaciones tambin de carcter lgico. Si se puede, de manera legtima, asignar
nmeros al describir caractersticas, objetos y eventos, ser factible operar con ellos en
todos sus modos permisibles y, de esas operaciones, derivar conclusiones aplicables a los
fenmenos observados y medidos. Entonces, se justifica describir cosas reales por medio de
nmeros, siempre y cuando exista un grado de isomorfismo (semejanza de propiedades)
entre las cosas reales y el sistema numrico, es decir, ciertas propiedades de los nmeros
deben tener paralelismo con los fenmenos observados, para que confiadamente se pueda
asignar los nmeros.
1- IDENTIDAD: Cada nmero slo es igual a s mismo, de manera que ningn otro es
igual a l, es decir, posee identidad y, por lo tanto, a cualquier objeto o evento diferenciable
de los dems, que tenga identidad, se le podr aplicar un nmero. Este carcter de identidad
de los nmeros da origen a la escala nominal, que es un mtodo para identificar
cualitativamente los distintos objetos y eventos, y resulta obvio que no se le puede dar
ningn significado cuantitativo, por ejemplo: si en un modelo experimental se cuenta una
serie de clases, en las cuales se consignan sus frecuencias, stas revelan un conjunto de
cada clase.
Grupo de 120 nios con y sin Dislexia.
SERIES DE FRECUENCIAS
FRECUENCIAS
Nias con Dislexia 40
Nias sin Dislexia 20
Nios con Dislexia 50
Nios sin Dislexia 10
TOTAL 120
Bajo el contexto de la tabla anterior, una muestra de 120 individuos en edad infantil se ha
clasificado en dos grupos por sexo (masculino y femenino) y por la presencia o ausencia de
Dislexia.
Por otro lado, las frecuencias informan de conjuntos de nios o serie de clases con una
categora e identidad, que dan una medida de las observaciones y son los valores sujetos a
operaciones aritmticas. En estas condiciones, se puede contrastar hiptesis de la
distribucin de los casos, mediante la aplicacin de pruebas estadsticas. No todas estas
pruebas son apropiadas para datos nominales, pues revelan las frecuencias en las categoras,
es decir, en datos enumerativos.
2- ORDINALIDAD: las pruebas tambin tienen un orden o rango siempre mayor que otro,
el cual le precede en un continuum ascendente. Los objetos y eventos susceptibles de un
ordenamiento a lo largo de un continuum tienen una escala ordinal.
En conclusin, cabe establecer que mientras las escalas nominales slo clasifican, las
ordinales clasifican y ordenan, de manera que dan como resultado una serie de clases y
categoras mutuamente exclusivas, llamadas rangos.
3- ADITIVIDAD:los nmeros tienen propiedad aditiva, lo cual quiere decir que la suma de
un nmero con otro debe dar un tercer nmero nico. Esta propiedad de los nmeros no
slo identifica y ordena, sino adems puede sujetarse a todas las operaciones aritmticas de
los nmeros. Las conclusiones de tales operaciones son vlidas para las observaciones y
dan lugar a la denominada escala de intervalo.
b) HIPTESIS: La Hiptesis Alterna(H1) que se desea analizar debe ser precisa, tan
completa como resulte posible, pues se trata de la aseveracin operacional de la
hiptesis de investigacin por el experimentador. Conjuntamente al proceso
anterior, se declara la Hiptesis Nula (Ho), en la cual simplemente se establece la
ausencia de diferencia y se declara, pare percibir con claridad, que la hiptesis se
ajusta a la prueba estadstica.
Bajo los trminos expresados, el investigador debe ser meticuloso al elegir la prueba
estadstica y al plantear la hiptesis, el nivel de significancia y la zona de rechazo, en virtud
de que es factible cometer dos errores graves en la decisin estadstica: a) Error tipo I.
Rechazar la (Ho), siendo verdadera.
Escala de probabilidad.
Entre el 0 y el 1 existen valores intermedios, mientras que donde marca 0.95 existe
una diferencia de 0.05 con respecto a 1. Este lmite corresponde al nivel de
significancia o error alfa, donde todo valor igual o menor que 0.05 se acepta Ha. Por
lo tanto, 1 - alfa = beta.
* Las pruebas paramtricas son las ms eficaces y de uso comn en la investigacin, como
las de comparacin de promedios o prueba t de Student y la de anlisis de varianza de
Fischer (ANOVA).
* Cuando por cualquier razn no se puedan cumplir los requisitos de las pruebas
paramtricas, el investigador podr recurrir a las no paramtricas. En ellas no hay
exigencia de homogeneidad de varianzas y, auxiliadas por un modelo matemtico de ajuste,
se puede obtener una eficacia que es muy cercana a la de las pruebas t de Student y de
anlisis de varianza.
Cabe sealar que, conforme menos condiciones o presunciones exige una prueba
estadstica, en que se basa su modelo matemtico, ms generales son sus conclusiones
derivadas de su aplicacin; sin embargo, tambin es menos eficaz para rechazar la
influencia del azar, cuando ste no desempea un papel importante.
Por ejemplo: Para saber si los pacientes han alcanzado una total remisin de una
enfermedad, se atiende a los hallazgos de tiempo de sobrevida y a las alteraciones clnicas
de la patologa. Si cuenta con varios tratamientos, se plantea la pregunta de cul de ellos ha
sido el ms efectivo.
Un ejemplo vlido es el de un investigador que trabaja con roedores, para estudiar las
caractersticas conductuales de agresividad y la concentracin de neurotransmisores en el
sistema nervioso central. El conjunto de la muestra est constituido por cobayos, ratas y
ratones, que representan grupos con tres gradientes de agresividad. En estas condiciones, el
diseo experimental tiene tres muestras independientes. La eleccin de la prueba estadstica
se basar en las dos caractersticas y en el tipo de escala de las mediciones. En el supuesto
de que las concentraciones de neurotransmisores tengan una medicin cuantitativa, una
variable continua, una escala de intervalo y una distribucin normal, con varianzas
homogneas, la eleccin ms adecuada ser el ANOVA de Fischer de una entrada.
dnde:
dnde:
N = Total de la poblacin
Za2 = 1.962 (si la seguridad es del 95%)
p = proporcin esperada (en este caso 5% = 0.05)
q = 1 p (en este caso 1-0.05 = 0.95)
d = precisin (en este caso deseamos un 3%).
Ejemplo: Si deseamos conocer la media de la glucemia basal de una poblacin, con una
seguridad del 95 % y una precisin de 3 mg/dl y tenemos informacin por un estudio
piloto o revisin bibliogrfica que la varianza es de 250 mg/dl
Si la poblacin es finita, como previamente se seal, es decir conocemos el total de la
poblacin y desearamos saber cuantos del total tendramos que estudiar, la respuesta sera:
Donde:
Donde:
En todos los estudios es preciso estimar las posibles perdidas de pacientes por
razones diversas (prdida de informacin, abandono, no respuesta.) por lo que se debe
incrementar el tamao muestral respecto a dichas prdidas.
Objetivo:
Aqu no se busca Estimar el parmetro sino determinar cul de las hiptesis contrapuestas
propuestas por el investigador es la correcta para cierto nivel.
Procedimiento de Prueba de Hiptesis
El investigador establecer las hiptesis en base a la teora que quiere verificar, para un
parmetro .
Tomar una muestra aleatoria de la poblacin en estudio.
Comparar lo observado con su teora, si lo observado se contrapone a su teora se rechaza
su hiptesis en caso contrario se dice que no se observ cambio.
Primero definiremos los elementos necesarios para lleva adelante una Prueba de hiptesis.
a) El investigador debe establecer las hiptesis contrapuestas de inters para , llamadas
Hiptesis Nula () e Hiptesis Alternativa ().
><
b) Estadstico de Prueba: estadstico con distribucin conocida bajo hiptesis nula, sobre
el cual se basar la decisin a tomar.
c) Regin de Rechazo (RR): conjunto de valores del estadstico de prueba para los cuales
ser rechazada.
d) Luego ser rechazada si el valor observado o alcanzado del estadstico pertenece a la
RR, en cuyo caso diremos que la es la correcta. En caso contario diremos que no se
encontr evidencia suficiente para rechazar .
En resumen los pasos a seguir para realizar una Prueba de Hiptesis son:
a) Identificar el parmetro de inters.
b) Determinar las Hiptesis nula y alternativa para el problema.
c) Determinar el Estadstico de Prueba adecuado, con distribucin conocida bajo .
d) Fijado un nivel de significancia determinar la Regin de Rechazo.
e) Calcular el valor observado o alcanzado del estadstico de prueba con la muestra
obtenida.
f) Determinar si debe ser rechazada o no para el nivel de significacin dado,
estableciendo una conclusin en el contexto del problema.
PROBLEMA:
Supongamos que el 10% de las tarjetas de circuito producidas por cierto fabricante son
defectuosas.
Con el fin de reducir la proporcin de tarjetas defectuosas se ha sugerido un nuevo proceso
de produccin.
En este caso = es la verdadera proporcin de tarjetas defectuosas con este nuevo mtodo
de produccin.
a) Establecer las hiptesis de inters.
b) Se tom una muestra aleatoria de n=200 tarjetas producidas con este nuevo mtodo.
Determinar el Estadstico de Prueba.
c) Dada la = 15 , calcular el nivel de significancia aproximado y hallar una
expresin para la probabilidad aproximada de cometer el Error de tipo II.
d) Si ahora la = 12 , calcular el nivel de significancia aproximado.
e) Si en la muestra aleatoria se obtuvo x=13 cul sera su conclusin? Usando la regin de
rechazo dada en el tem c).
Observaciones:
i) crece cuando se aproxima a 0,10.
ii) =max0,10 = 0,10 .Luego esta prueba sigue teniendo el mismo nivel de
significancia para la hiptesis simplificada 0:=0,10.
Por lo tanto de ahora en ms nuestra hiptesis nula ser: =
La prueba de hiptesis para dos muestras es casi semejante a la prueba de una sola muestra
es decir que este captulo se tomaran dos muestras aleatorias para determinar si proviene de
una misma poblacin o a su vez de poblaciones iguales.
As mismo puedo entender que en el caso de que se den las dos poblaciones iguales, se
esperar que la media entre las dos medias mustrales sea cero.
En el caso que existan poblaciones independientes, estas son iguales a la suma de dos
variables individuales.
Por ende las muestras deben ser suficientemente grandes para que la distribucin de las
medias mustrales siga una distribucin normal.
As mismo constituyo que para realizar una comparacin de poblaciones con muestras
pequeas es necesario tener en cuenta las siguientes suposiciones: las dos muestras
provienen de poblaciones independientes, de igual manera las desviaciones estndar de las
dos poblaciones son iguales, as mismo las poblaciones muestreadas siguen una
distribucin normal.
Existen casos en que las muestras no son independiente sino son dependientes o que a su
ves estas estn relacionadas entre si.
Por tal razn puedo entender que existen dos tipos de muestras dependientes:
1.- las que se caracterizan por una medicin, una intervencin de cierto tipo y est a su ves
otra medicin.
2.- existe una formacin de pares de las observaciones correspondientes.
Para tener una idea ms concreta formulare la existencia de una comparacin de las
muestras independientes y dependientes.
Las muestra dependiente son aquellas que se caracteriza por una medicin seguida, por un
intervalo de algn tipo y despus otra medida. A esta tambin se la puede llamar un estudio
antes o despus.
PROBLEMA
Se realiza un estudio acerca del impacto que tiene el Programa de Planificacin Familiar
que
lleva a cabo el HMI Ramos Larrea en dos asentamientos humanos de su jurisdiccin, uno
ubicado en rea urbana (A) y otro en rea rural(B), tomando para ello dos muestras de
mujeres
en edad frtil y con actividad sexual: nA = 30 y nB = 30. Despus de aplicado el
instrumento de
medicin, se obtienen los siguientes datos:
Segn los datos obtenidos y suponiendo normalidad, podramos decir que el impacto fue
mayor en las mujeres del asentamiento humano ubicado en el rea urbana? Utilizar un nivel
de
significacin del 5%.
Solucin:
1. Planteamiento de hiptesis:
Ho: 1 2
H1: 1 >2
2. Nivel de significancia: = 0.05
3. Prueba estadstica:
Conclusiones:
Se rechaza la hiptesis nula (Ho), se acepta la hiptesis alterna (H1) a un nivel de
significancia de = 0.05. La prueba result ser significativa.
La evidencia estadstica no permite aceptar la hiptesis nula.
La evidencia estadstica disponible permite concluir que probablemente el impacto
del
Programa de Planificacin Familiar fue mayor en las mujeres del asentamiento humano del
rea urbana.
En ocasiones interesa definir un intervalo de valores tal que permita establecer cuales son
los valores mnimo y mximo aceptables para la diferencia entre las medias de dos
poblaciones. Pueden darse dos situaciones segn las muestras sean o no independientes;
siendo en ambos casos condicin necesaria que las poblaciones de origen sean normales o
aproximadamente normales:
MUESTRAS INDEPENDIENTES
Si puede suponerse que las varianzas de ambas poblaciones son iguales, el intervalo de
confianza para la diferencia de medias poblacionales est centrado en la diferencia de las
medias muestrales, siendo sus lmites superior e inferior:
Si las varianzas poblacionales no pueden suponerse iguales los lmites del intervalo de
confianza son:
Analizar
Comparar medias
Los grupos pueden definirse en funcin de una variable cuantitativa o de una cualitativa. Si
la variable de agrupacin presenta slo dos valores o modalidades, entonces se debe
seleccionar Usar valores especificados e indicar la modalidad que define el grupo 1 y la del
grupo 2. Si la variable tiene ms de 2 valores o modalidades se elige la opcin Punto de
corte indicando el valor de la variable que induce una particin en dos grupos, uno de los
cuales estar formado por todos los casos con valores menores que el especificado y el otro
por el resto de casos.
Al aceptar se obtienen:
Analizar
Comparar medias
Las variables se deben seleccionar por parejas. Haciendo clic sobre las variables de la lista
aparecen sus nombres en el cuadro Selecciones actuales; una vez seleccionadas las dos
variables se trasladan al recuadro Variables relacionadas de la forma habitual. En cada
sesin se pueden seleccionar tantos pares de variables como medias se quieran comparar.
- Intervalo de confianza, por defecto al 95%, para la diferencia de medias poblacionales que
viene dado por:
EJEMPLO
Ejemplo 1
Con los datos de la encuesta Enctran.sav obtener la estimacin puntual y los intervalos de
confianza del 95 y del 99% para la media de la poblacin de la variable Coste.
En el cuadro de dilogo Explorar, que se obtiene con la secuencia Analizar > Estadsticos
descriptivos > Explorar, se selecciona como variable dependiente la variable Coste. En
Estadsticos comprobamos que est activada la opcin Descriptivos y que el intervalo para
la media definido es el del 95%.
La estimacin puntual del valor esperado del coste es 5236,40 Pta. Esta estimacin tiene un
error tpico de 365,97. Los lmites inferior y superior del intervalo de confianza del 95%
son 4511,34 y 5951,46, respectivamente. Este resultado se interpreta como que de los
intervalos obtenidos con este mtodo el 95% contendrn el verdadero valor esperado del
coste. Una medida del grado de precisin con el que se est estimando el valor esperado es
la amplitud del intervalo, que en este caso es igual a 1450,12 y la mitad de la amplitud, que
es 725,06, es el error mximo de estimacin que puede garantizarse con una probabilidad
de 0,95. Este error mximo es igual a donde t /2 , es el valor crtico para =0,05
Los lmites del intervalo de confianza del 99% son 4277,54 y 6195,27; la confianza de que
este intervalo contenga el verdadero valor esperado del coste es 0,99. La amplitud de este
intervalo es 2217,73 que es mayor que la amplitud del intervalo del 95%, por lo tanto,
1108,865, es el error mximo de estimacin que puede garantizarse con una probabilidad
de
0,99. Como puede verse, a medida que aumenta el grado de confianza del intervalo
disminuye la precisin de la estimacin.
Ejemplo 2.
Para la misma variable Coste verificar si se puede aceptar el supuesto de que el valor
esperado del Coste es superior a 6000.
Con la secuencia Analizar > Comparar medias > Prueba T para una media se abre el
cuadro de dilogo Prueba T para una muestra en el cual se selecciona la variable Coste y
se indica como Valor de prueba 6000. Esto quiere decir que las hiptesis que se estn
contrastando son Se trata por tanto de un contraste a
una sola cola.
El estadstico de prueba toma el valor t=-2,086, que en las tablas de la
distribucin t de Student con 113 grados de libertad deja por debajo un rea de 0,0195. Esto
quiere decir que se rechaza la hiptesis nula en favor de la alternativa para niveles de
significacin superiores a 0,0195. Obsrvese que 0,0195 es la mitad del nivel de
significacin para la prueba de dos colas que aparece en el cuadro de resultados.
Ejemplo 3.
Con la secuencia Analizar> Comparar medias > Prueba T para muestras independientes
se abre el cuadro de dilogo Prueba T para muestras independientes en el cual se
selecciona la variable Coste y se indica como Variable de agrupacin Resid. En la opcin
Definir grupos se asigna al Grupo 1 el valor 1 (vive en Barcelona) y al Grupo 2 el valor 2
(no vive en Barcelona). Aceptando se obtienen entre otros los siguientes resultados:
Las hiptesis que se estn contrastando son frente Para
realizar este contraste previamente se debe comprobar si es aceptable la hiptesis de
varianzas poblacionales iguales para los dos grupos . El estadstico F de la
prueba de Levene* no permite aceptar la igualdad de varianzas poblacionales, por lo cual el
valor del estadstico de prueba es t=-3,750 que para cualquier nivel de significacin lleva a
rechazar la hiptesis de igualdad de medias. El signo negativo del estadstico t indica que el
coste del transporte es significativamente superior para los que viven fuera de Barcelona.
Ejemplo 4.
Con los datos de la encuesta Encinf.sav contrastar si existe diferencia significativa entre
las puntuaciones medias asignadas a las aulas de inforntica en cuanto a la Dotacin y
Software.
Las puntuaciones que se quiere comparar han sido generadas dos a dos por los mismos
individuos; se trata por tanto del caso de muestras relacionadas. Las hiptesis que se
contrastan son
El anlisis slo ha considerado los casos que no presentan ningn valor missing en el par de
puntuaciones, quedando nicamente 106 casos vlidos de los 114.
El error estndar de la media (llamado en ingls "standard error of the mean" (SEM))
cuantifica4 las oscilaciones de la media muestral (media obtenida en los datos) alrededor de
la media poblacional (verdadero valor de la media). El EEM o SEM se estima generalmente
dividiendo la desviacin estndar de la poblacin entre la raz cuadrada del tamao de la
muestra (asumiendo independencia estadstica de los valores en la muestra):
donde
Esta estimacin puede ser comparada con la frmula de la verdadera desviacin estndar de
la media de la muestra:
donde
As la frmula del estadstico z para probar una hiptesis referente al valor de la proporcin
de la poblacin es
0
=
EJERCICIO PRCTICO
0 . 10 .05 . 05
= = = = +2.27
. 022 . 022
El valor calculado de z es de +2.27 el cual es mayor que el valor crtico de +1.645 de esta
prueba de cola superior. Por lo tanto, con 10 partes de 100 detectadas como defectuosas, la
hiptesis de que la proporcin de partes defectuosas de la poblacin es de o inferior a .05
se rechaza, con el uso en la prueba del nivel de significancia de 5%.
1 1+ 2 2
=
1 + 2
La formula de la estadstica z para probar la hiptesis nula de que no existe diferencia entre
dos proporciones poblacionales es
1 2
=
1 2
Una prueba de la diferencia entre proporciones puede realizarse ya sea como prueba
unilateral o como prueba bilateral.
EJERCICIO PRCTICO
Una muestra de 50 hogares de una comunidad revela que 10 de ellos vieron un programa
especial de televisin sobre la economa nacional. En una segunda comunidad, 15 hogares
de una muestra aleatoria de 50 vieron ese programa especial de televisin. Probamos la
hiptesis de que la proporcin global de espectadores de las dos comunidades no difiere,
con un nivel de significancia de 1% de la siguiente manera:
0 : (1 2 ) = 0
1 : (1 2 ) 0
1 2 . 20 .30 .10
= = = = 1.15
1 2 . 087 . 087
-1.15
EJERCICIO PRACTICO 2
(1 ) (1 )
1 2 = +
1 2
1 2 . 10 .075 . 025
= = = = +.49
1 2 . 051 . 051
El valor calculado de z de +.49 no es mayor que +1.645 en esta prueba de cola superior. Por
tanto, la hiptesis nula no puede ser rechazada al nivel de significancia de 5%
-4 -3 -2 -1 0 1 2 3
PRUEBAS PARAMTRICAS
El nivel de medicin debe ser al menos de intervalo. Debemos tomar una decisin a cerca
de nuestra variable dependiente. Es realmente un nivel de intervalo? Si es una escala no
estandarizada, o si se basa en estimaciones o calificaciones con humanos. Frecuentemente
aparecen como intervalo pero lo reducimos a nivel ordinal al darles rango.
PRUEBAS NO PARAMTRICAS
Las pruebas no paramtricas nos permiten analizar datos en escala nominal u ordinal a
pesar de que no se conozcan los parmetros de una poblacin, utilizada para hacer un
contraste de hiptesis.
* ji2 = X2
BIBLIOGRAFIA
1.- Mood A. M., Graybill F. A., Boes D. C. Introduccin a la teora de estadstica. McGraw
Hill, 1983.
4.-https://sites.google.com/site/aprendizajedeestadistica/
5.-https://sites.google.com/site/estadisticaconelspss/
6.-http://estadisticacomputarizada.wordpress.com
7.-http://hamletylaestadisticaugma.jimdo.com/
8.-http://hamletyestadisticaspss.jimdo.com/
9.-http://ocwus.us.es/metodos-de-investigacion-y-diagnostico-en-educacion/analisis-de-
datos-en-la-investigacion-educativa/guia_aprendizaje.pdf
10.- ftp://ftp.repec.org/opt/ReDIF/RePEc/iad/wpaper/0311.pdf