Estadistica Inferencial Con Microsoft Excel
Estadistica Inferencial Con Microsoft Excel
Estadistica Inferencial Con Microsoft Excel
html
1. INTRODUCCION:
La inferencia es la rama de la estadística que se dedica a elaborar conclusiones válidas para
toda una población, a partir de un conjunto de datos, que generalmente son solamente una
fracción del total de datos (muestra).
Existe una variedad de técnicas para elaborar dichas conclusiones, las que dependen
básicamente de tres cosas:
a) La naturaleza de los datos (cuantitativos, cualitativos)
b) La cantidad de datos
c) La naturaleza de la comparación realizada
Microsoft Excel es una herramienta ampliamente utilizada en la sociedad actual, sin embargo
se desconocen muchas de sus capacidades de cálculo en diferentes áreas. El objetivo de
este curso corto es dar a conocer las aplicaciones de Excel en la inferencia estadística, que
están disponibles para el usuario.
MUESTRA: Es una fracción de la población extraída para el estudio de la misma. Para que
los resultados sean válidos, es necesario que la muestra sea REPRESENTATIVA de la
población de donde proviene. Para ello, debe reunir los siguientes requisitos
a) Debe extraerse al azar
1
b) Debe generar suficiente varianza
c) Debe tener un tamaño apropiado
HIPÓTESIS
Cualquier suposición preliminar acerca de cualquier fenómeno. En el caso de la estadística,
la suposición se realiza sobre los parámetros de una población. Básicamente existen dos
tipos de hipótesis: la Nula (Ho), que se plantea con la intención de ser rechazada, y la alterna
(Ha) que se plantea con la intención de ser aceptada.
El procedimiento para una prueba de hipótesis, incluye las siguientes etapas:
a) Planteamiento de las hipótesis
b) Cálculo de un estadístico de prueba (Z, t, F, o Chi cuadrado)
c) Obtención de un comparador, de una tabla (Z, t, F, Chi Cuadrado)
d) Aplicación de una regla de decisión
En este curso no se hará énfasis en las fórmulas sino en las aplicaciones, tomando en
cuenta la naturaleza de los datos.
2
Aunque las opciones se encuentran en un orden extraño, se describirán en el orden lógico de
un curso de estadística inferencial.
4. Análisis descriptivo:
Aunque Excel tiene funciones individuales para análisis de datos cuantitativos, existe la
opción de un análisis más extenso. Para ello se selecciona la pestaña ESTADISTICA
DESCRIPTIVA en el menú de análisis de datos.
El rango de entrada puede tener una o más variables, las cuales pueden estar ordenadas por
filas o por columnas. Se debe definir esto activando el indicador respectivo. Si en la primera
fila o columna hay nombres de variables, se debe activar la opción Rótulos en la primera fila
3
Los resultados se pueden mostrar en una hoja nueva, un libro nuevo, pero usualmente es en
la misma hoja, para lo cual se debe definir el lugar .
EJERCICIO:
Para el siguiente conjunto de datos, calcule las estadísticas más importantes y un intervalo
de confianza al 97%
15 9 20 11 18 12 14 19 22 18 17 19 14 12 10 10 18 10 15
4
5. Prueba de igualdad de varianzas
El objetivo de esta prueba es determinar si las varianzas de dos poblaciones (o en todo caso
de sus muestras son iguales)
Se requieren datos de las dos poblaciones y no se asume normalidad de las variables.
El estadístico de prueba es un F, la razón de dos varianzas.
En el menú de análisis de datos se escoge la opción “Prueba de F para varianzas de dos
muestras”: Se debe ingresar la ubicación de los datos y el nivel de significancia deseado.
Ejemplo:para los siguientes datos, comprube con 5% de significancia si las
varianzas son iguales
Se toman 10 datos al azar de ambas secciones de un curso son los siguientes resultados:
SECCION 1 2 3 4 5 6 7 8 9 10
A 62 48 55 33 65 46 70 55 40 49
B 33 38 15 39 57 45 38 40 42 55
5
Se debe escoger la opción “Prueba de Z para medias de dos muestras”. Además de los
datos de las dos poblaciones se ingresan los datos de las varianzas poblacionales.
Ejemplo: Se conoce que las varianzas de las calificaciones de los Cursos de Matemática 1
Sección “A” y Matemática 1 sección “B” son respecivamente 625 y 2,500 puntos cuadrados.
Se toman 10 datos al azar de ambas secciones son los siguientes resultados:
SECCION 1 2 3 4 5 6 7 8 9 10
A 62 48 55 33 65 46 70 55 40 49
B 33 38 15 39 57 45 38 40 42 55
Pruebe la hipótesis que los alumnos de la sección “A” tienen mayor promedio que los de la
sección “B” , con un 97% de confianza.
6
Ejemplo: Se desea probar si hay diferencia entre los salarios diarios de los empleados de
dos diferentes empresas. Los resultados del muestreo son los siguientes.
POBLACION 1 2 3 4 5 6 7 8 9
Empresa1 350 419 385 360 405 395 389 409 375
Empresa 2 370 425 369 375 389 385 395 425 400
Ejercicio: con los datos del archivo nuevo compruebe si las notas de los graduados de
establecimientos públicos son iguales que las de graduados de establecimientos privados.
ORIGEN 1 2 3 4 5 6 7 8 9
JAPONES 66 67 68 66 67 67 68 65 68
COREANO 61 69 66 59 60 62 69 63 65
8
En este caso se trata de dos poblaciones que de alguna manera están correlacionadas, por
ejemplo Antes/después. El número de datos es el mismo para cada población porque hay
una correspondencia de uno a uno entre los mismos. Se aplica una prueba de t de student .
Ejemplo
Un investigador compara las calificaciones de diez estudiantes antes y después de tomar una
pastilla a base de Ginko biloba (que se supone mejora la inteligencia). En base a los
resultados indique con un 97% de confianza si se produce un aumento de 10 puntos en los
resultados, si se usan las cápsulas.
JUAN PEDRO CARLOS ESTELA MARTIN JUANY KARLA JOSE MANUEL STEFANI
ANTES 45 52 61 33 49 75 64 39 54 60
DESPUES 48 55 59 33 54 80 64 39 53 68
Ejercicio: con los datos del archivo nuevos compruebe si las notas de álgebra son iguales a
las notas de física .
9
“Alien X”. Se aplicaron a especimenes dosis de los productos y se midiò la variable
respuesta: porcentaje de destrucción de tejidos. Los resultados finales fueron:
10
a) realice el análisis de varianza al 5%
b) calcule el coeficiente de varianza
c) escriba conclusiones y recomendaciones
Esta opción no permite el caso de los diseños desbalanceados. En este caso se deben
estimar los datos faltantes y efectuar el ajuste manual de grados de libertad, cuadrados
medios, F calculada y F tabulada.
Ejemplo:
En un hospital hay cuatro sillones dentales, que son operados por cinco operadores distintos.
Se cree que hay diferencias en el tiempo que tardan en cada sillón para realizar una
extracción, por lo que se realiza un experimento en el cual cada operador realiza una
extracción en cada sillòn dental. Se mide el tiempo necesario en minutos. Los resultados
finales fueron:
Sillones/operador JOSE CARLOS XIMENA KARLA MANUEL
1 15 9 20 11 18
2 12 14 25 19 22
3 18 17 19 14 12
4 10 10 18 10 15
11
Análisis de Regresión
Excel puede realizar análisis de regresión para modelos simples y múltiples, El módulo de
análisis tiene una opción para regresión:
Se debe definir el rango que contiene los datos de la variable dependiente (y)
En el rango de x, si el modelo es múltiple se ingresan varias columnas según la cantidad de
variables independientes.
Ejemplo:
Los siguientes datos muestran el crecimiento poblacional de una aldea del interior del país:
año habitantes
1900 300
1925 750
1950 1500
1975 4000
2000 7500
efectúe el ajuste del modelo lineal y estime que población habrá en la aldea para el año
2012
12
13