Estadistica Investigacion CC
Estadistica Investigacion CC
Estadistica Investigacion CC
ESTADISTICA APLICADA
PARALELO: 3
TRABAJO DE INVESTIGACIÓN N° 1
1.- TEORÍA DEL MUESTREO
La teoría de muestreo se refiere al estudio de las relaciones que existen entre un colectivo o población
y las muestras que se extraen de las mismas. El estudio de las muestras permite hacer estimaciones
de características desconocidas de la población. Estas estimaciones se hacen a partir del conocimiento
de las características de las muestras
Las características o medidas obtenidas de una muestra se llaman estadísticos; y las medidas
correspondientes a la población parámetros.
Cuando una medida muestral o estadístico es
utilizada como representante de una
característica poblacional o parámetro se
denomina estimador.1
PROCESO DE TABULACION
Detallar las variables identificadas y que serán objeto de estudio, según la definición
de variables y los instrumentos elaborados.
Determinar las variables que ameritan ser analizadas individualmente o presentadas
en cuadros simple de una variable, según los objetivos y las hipótesis.
Determinar las variables que deben cruzarse, según los objetivos y las hipótesis.
Esquematizar en algunos casos el cuadro para determinar la posibilidad del cruce de
variables, según el número de estas que debe relacionarse y las escalas de
clasificación.
Hacer el listado de los cuadros que deberán presentarse.4
3.- MEDIDAS DE TENDENCIA CENTRAL
Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor a
un conjunto de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto de
los datos. Las medidas de tendencia central más utilizadas son: media, mediana y moda. Las medidas
de dispersión en cambio miden el grado de dispersión de los valores de la variable. Dicho en otros
términos las medidas de dispersión pretenden evaluar en qué medida los datos difieren entre sí. De
esta forma, ambos tipos de medidas usadas en conjunto permiten describir un conjunto de datos
entregando información acerca de su posición y su dispersión.
Los procedimientos para obtener las medidas estadísticas difieren levemente dependiendo de la forma
en que se encuentren los datos. Si los datos se encuentran ordenados en una tabla estadística diremos
que se encuentran “agrupados” y si los datos no están en una tabla hablaremos de datos “no
agrupados”.
Según este criterio, haremos primero el estudio de las medidas estadísticas para datos no agrupados
y luego para datos agrupados.
MODA. - La moda de una distribución se define como el valor de la variable que más se repite.
En un polígono de frecuencia la
moda corresponde al valor de la
variable que está bajo el punto
más alto del gráfico. Una
muestra puede tener más de
una moda.
RANGO DE VARIACIÓN. - Se define como la diferencia entre el mayor valor de la variable y el
menor valor de la variable.
La mejor medida de dispersión, y la más generalizada es la varianza, o su raíz cuadrada, la
desviación estándar. La varianza se representa con el símbolo σ² (sigma cuadrado) para el
universo o población y con el símbolo s2 (s cuadrado), cuando se trata de la muestra. La
desviación estándar, que es la raíz cuadrada de la varianza, se representa por σ (sigma) cuando
pertenece al universo o población y por “s”, cuando pertenece a la muestra. σ² y σ son
parámetros, constantes para una población particular; s2 y s son estadígrafos, valores que
cambian de muestra en muestra dentro de una misma población. La varianza se expresa en
unidades de variable al cuadrado y la desviación estándar simplemente en unidades de
variable.
COEFICIENTE DE VARIACIÓN. - Es una medida de la dispersión relativa de los datos. Se define
como la desviación estándar de la muestra expresada como porcentaje de la media muestral.
Es de particular utilidad para comparar la dispersión entre variables con distintas unidades de
medida. Esto porque el coeficiente de variación, a diferencia de la desviación estándar, es
independiente de la unidad de medida de la variable de estudio.5
4.- MEDIDAS DE UBICACIÓN
Las medi da s de p osi ci ón dividen un conjunto de datos en grupos con el mismo número de
individuos. Nos proporcionan los datos estandarizados o generales de una muestra o población de
estudio.
Para calcular las medi d a s de p o si ci ón es necesario que los dat os estén ordenados de men or
a ma y o r .
Cuartiles. - Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes
al 25%, al 50% y al 75% de los datos. Q2 coincide con la mediana
Deciles. - Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos. D5 coincide
con la mediana.
estadisticalidia.com
Percentiles. - Los percentiles son los 99 valores que dividen la serie de datos en 100 partes
iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.6
estadisticalidia.com
5.- MEDIDAS DE DISPERSIÓN
Las medidas de dispersión pueden definirse como los valores numéricos cuyo objeto es analizar el
grado de separación de los valores de una serie estadística con respecto a las medidas de tendencia
central consideradas.
La distribución normal, o campana de Gauss, es una función simétrica (con la media aritmética en el
centro de la serie) con un grado de dispersión bajo (la mayoría de los valores están comprendidos
dentro del valor de la desviación típica).
RECORRIDO
DESVIACIÓN MEDIA
Como medida de dispersión más frecuentemente utilizada, la desviación media se define como
la media aritmética de los valores absolutos de la desviación de cada valor de la variable con respecto
a la media. Su formulación matemática es la siguiente:
La desviación media no siempre suministra una idea clara del grado de separación entre los valores de
una variable estadística. Para estudios científicos, se prefiere utilizar una pareja de parámetros
relacionados que se conocen como varianza y desviación típica.
La varianza se define como el cociente entre la suma de los cuadrados de las desviaciones de los valores
de la variable y el número de datos del estudio. 7
www.enciclopediafinanciera.com
BIBLIOGRAFIA
1 http://cigeg.uneg.edu.ve/documentos/curso/TEORIA%20ELEMENTAL%20DE%20MUESTREO.pdf
2 https://www.monografias.com/trabajos11/tebas/tebas.shtml
4 https://slideplayer.es/slide/133708/
5 https://www.medwave.cl/link.cgi/Medwave/Series/MBE04/4934
6 https://www.monografias.com/trabajos27/datos-agrupados/datos-agrupados.shtml
7 https://www.hiru.eus/es/matematicas/medidas-de-dispersion