Estadistica Materia
Estadistica Materia
Estadistica Materia
Población
Muestra
Parámetro
Estadístico
Variables
Por otra parte, en ocasiones, el muestreo puede ser más exacto que el estudio de
toda la población porque el manejo de un menor número de datos provoca también
menos errores en su manipulación. En cualquier caso, el conjunto de individuos de
la muestra son los sujetos realmente estudiados.
A continuación vamos a ver los diferentes instrumentos y técnicas que tenemos para
recolectar información.
Podemos decir que son las herramientas con las que se cuenta para la recolección
de datos. Son los procedimientos especiales utilizados para obtener y evaluar las
evidencias necesarias, suficientes y competentes que permiten formar un juicio
profesional y objetivo; en resumen, podemos decir que son cualquier recurso que
recopile información referente a nuestro proyecto.
La observación
La encuesta
La entrevista
La observación
La entrevista
La encuesta
Clasificación de la encuesta.
Etapas
Tipos de variables
Diseño de la encuesta
El diseño del cuestionario constituye el elemento principal de la encuesta, por lo
tanto, su estructura es muy importante. Dado esto, tenemos que formular preguntas
directas y concretas, que abarquen la necesidad de información que el proyecto
requiere, de tal manera que en el momento de procesar toda esta información, esta
no sea insuficiente ni inconsistente.
Las preguntas que se van a formular se pueden clasificar, entre otras, de la siguiente
manera:
• Interesante.
• Sencillo de entender.
• Preciso y claro en las preguntas.
• Ordenado.
• Debe tener un vocabulario adecuado.
• Debe tener espacio suficiente para respuestas.
Una vez que ya tengamos listos los apartados anteriores, procedemos a realizar
una prueba piloto o experimental, con el fin de identificar puntos críticos en los que
exista controversia en las respuestas, debido a una mala formulación de alguna(s)
pregunta(s), esta(s) se reformula(n) o en ciertos casos se elimina(n).
a) Distribuciones de frecuencias
Una distribución de frecuencias se puede tomar como una tabla donde los datos
están categorizados por filas y su ocurrencia o frecuencia en columnas, la finalidad
que tiene esta distribución es hacer más fácil la obtención de información de los
datos.
El número de veces que aparece un valor o la frecuencia con que aparece un valor
se llama frecuencia absoluta (fi), y la suma de estas frecuencias absolutas nos
tiene que dar como resultado el número de datos.
El intervalo de clase son las divisiones o ancho de los valores que se encuentran
dentro de una clase. Para determinar este valor se resta el límite superior menos el
límite inferior. Lo mejor es hacer iguales los intervalos de clase de una distribución
de frecuencias, de esta manera podemos facilitar la interpretación estadística.
Ejemplo n.° 01
Desarrollo
Ejemplo n.° 02
Elaborar una tabla de frecuencias acumuladas con criterio “menor que” y “o más”.
Desarrollo
Utilizando los contenidos estudiados, se sabe que se debe tomar en cuenta el límite
inferior de cada intervalo de clase.
1. Criterio “menor que”
2. Criterio “o más”
e) Tablas de contingencias
Gráfico circular
Presenta los datos en forma de círculo o tarta y de ahí que se lo llama también
gráfico de pastel. El círculo que lo describe se encuentra dividido en segmentos en
donde cada área de cada uno de los segmentos es proporcional al número de casos
en esa categoría. De manera general, se usan porcentajes para cada categoría.
Una muestra de cómo se ve el gráfico de pastel se presenta en el gráfico n.° 01.
Gráfico de barras
Histograma
Es un método útil y muy corriente de visualizar datos. Coloca las clases de una
distribución de frecuencias en el eje horizontal y las frecuencias en el eje vertical.
Representa los datos de manera similar que el diagrama de barras, es decir, que el
área de cada barra rectangular es proporcional a la frecuencia de la clase. Se usa
para datos cuantitativos.
Es un gráfico de línea trazado sobre las marcas de clase. Puede obtenerse uniendo
los puntos medios de los techos de los rectángulos en el histograma.
Una primera medida es la media poblacional, que es la suma de todos los valores
observados en la población divididos por el número de datos en la población.
La media muestral es la suma de todos los valores de la muestra divididos por el
número de datos en la muestra.
La mediana es el punto medio de los valores una vez que se han ordenado de
menor a mayor. Si el número de datos es par, la mediana es la media aritmética de
los dos valores centrales. Si el número de datos es impar, la mediana es el único
dato central. Las principales propiedades de la mediana son que no es influida por
la presencia de valores extremos y que es calculable en el caso da datos de nivel
ordinal o más altos.
La moda es el dato que aparece con mayor frecuencia. En una distribución puede
haber una o más modas o no haber ninguna. La moda puede determinarse para
todos los niveles de datos y tiene la ventaja de que no influyen en ella los valores
extremos. Sin embargo, se usa menos que la media o la mediana, ya que en muchos
casos no hay moda o hay más de una.
Si Media = Mediana = Moda, la distribución es simétrica. Si Media > Mediana >
Moda, la distribución no es simétrica y tiene sesgo positivo. Si Moda > Mediana
>Media, la distribución no es simétrica y tiene sesgo negativo.
Ejemplo
Con los siguientes datos: 8, 2, 3, 5, 4, 2, 6, 3, 1, 3, 13, 4, calcular la media aritmética,
la media geométrica, la mediana y la moda. Indicar además si hay un valor extremo
y cuál es el tipo de sesgo de la distribución.
1) Media aritmética:
6) Tipo de sesgo: Media > Mediana > Moda sesgo positivo o a la derecha
Media aritmética
Donde:
= límite inferior de la clase de la mediana
= frecuencia acumulada de la clase anterior a la clase de la mediana.
Moda
Medidas de dispersión
Una medida de dispersión pequeña indica que los datos se acumulan con
proximidad alrededor de la media aritmética mientras que una medida de dispersión
grande indica que hay uno o varios datos alejados de la media aritmética.
AV = límite superior de la clase más alta – límite inferior de la clase más baja
Ejemplo:
AV = 9 – 1
AV = 8
Ejemplo
Calcular la desviación estándar de los siguientes datos considerando que son datos
a) de un población y b) de una muestra.
458796
b) Para la desviación estándar muestral, el cálculo de la sumatoria es el mismo solo que
en lugar de µ se usa X .̅
La
desviación estándar es una medida de dispersión más adecuada que el rango ya
que en su cálculo entran todos los datos. Esta medida se utiliza normalmente para
comparar la dispersión de dos o más conjuntos de datos.
Desviación estándar
Ejemplo
mX = marca de clase
= media muestral
f = frecuencia
La curva es platicúrtica.
CUARTILES
Dividen a la distribución en cuatro partes iguales, es decir tiene tres divisiones, Q1,
Q2, y Q3, que corresponden al 25%, 50%, 75%.
Ejemplo
Ejemplo
PERCENTILES
CUARTILES
Terminología
Ejemplos:
Ejemplo:
Ejemplos:
Clasificación de la Probabilidad
Probabilidad clásica de Laplace, A Priori o Teórica: Supone que todos los eventos
tienen la misma probabilidad de ocurrencia, supóngase un suceso E, que de un
total de n casos posibles, todos igualmente posibles, puede presentarse en h de
los casos. Entonces la probabilidad de aparición del suceso (es decir la
probabilidad de ocurrencia) viene dada por:
Ejemplo:
Ejemplo:
Ejemplo:
Si alguien dice “Creo que hay un 90% de posibilidades de que empiece a llover
antes en la tarde”, estará dando un ejemplo de probabilidad subjetiva.
Reglas de probabilidad
Probabilidad condicional
Es la probabilidad de que ocurra un evento B, dado que ya ocurrió un evento A.
o también la probabilidad de que ocurra un evento A dado que ya ocurrió el evento
B. Esto se escribe:
Obsérvese que la probabilidad de que la primera vez salga roja es 3 /10, pero al
haber sacado una roja ahora nos quedan en total 9 bolas, de las cuales 2 son
blancas.
Ejemplo: El personal que labora en una empresa está formado por hombres y
mujeres que trabajan en las siguientes secciones: Gerencia, Profesional y Técnica,
cuyos datos se resumen en la siguiente tabla:
Solución:
A la tabla de los datos le añadimos una fila y una columna para los totales parciales
de las filas y de las columnas. En la celda del extremo inferior derecho se coloca el
total horizontal y vertical.
1. a) P(Mujer) = 54/136
2. b) P(Hombre y Técnica) = 50/136
3. c) P(Gerencia o Profesional) = P(Gerencia) + P(Profesional) = 11/136 +
40/136 = 51/136
4. d) P(Gerencia/ Mujer) = 3/54 En la columna de MUJER vemos que 3 de las
54 trabajan en También se puede aplicar la fórmula de la probabilidad
condicional.
1.
e) P(Hombre/ Técnica) = 50/85 En la fila TECNICA se ve que 50 de los 85
técnicos son hombres.
Aplicando la fórmula:
Para poder aplicar el teorema de Bayes correctamente tenemos que estar seguro
de que los eventos son mutuamente excluyentes y colectivamente exhaustivos.
Ejemplo
Primero definimos los 2 eventos con los que vamos a trabajar y los datos que
tenemos:
Diagrama de árbol
Un diagrama de árbol es una herramienta que se utiliza para determinar todos los
posibles resultados de un experimento aleatorio (su uso es más característico en
el Teorema de Bayes).
Existe un principio sencillo de los diagramas de árbol que hace que éstos sean
mucho más útiles para los cálculos rápidos de probabilidad: multiplicamos las
probabilidades si se trata de ramas adyacentes (contiguas).
Ejemplos
Las mujeres están repartidas uniformemente, siendo un 60% del total en cada
facultad.
¿Probabilidad de encontrar una alumna de la primera facultad?
Los números de dos cifras construidos con los dígitos 1, 2 y 3 son efectivamente
6, tal como usted puede ver:
12 13 21 23 31 32
3.- Combinaciones:
Observe que en este caso no importa el orden porque por ejemplo las sumas 1+2 y
2+1 son las mismas, entonces el número de sumas distintas son:
Ejemplo: ¿Cuantas combinaciones de dos letras se pueden formar con las letras
A, B, C y D?
Importante.