Plantilla Protocolo Colaborativo de La Unidad 3 Estadistica

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 11

Asignatura Datos del CIPA Fecha

Nombre CIPA: los financieros


Integrantes: Yenifer Solpa Julio
Estadística
Martha Lucia Correa Barrios 12/05/2020
descriptiva
Daniela Cardenas alvares
Alisawer Calderin Vargas

Actividad
Protocolo colaborativo de la unidad n°: 3

Análisis y síntesis: 
Síntesis e interpretación colaborativa de los temas vistos en la unidad

Medidas de tendencia central y de dispersión


Las medidas de tendencia central son medidas estadísticas que pretenden
resumir en un solo valor a un conjunto de valores. Representan un centro
entorno al cual se encuentran ubicado el conjunto de los datos. Las medidas de
tendencia central más utilizadas son la media, la moda y la mediana. Las
medidas de dispersión en cambio miden el grado de dispersión de los valores
de las variables. Dicho en otros términos las medidas de dispersión pretenden
evaluar en que medidas los datos difieren entre sí. De esta forma, ambos tipos
de medidas usadas en conjunto permiten describir un conjunto de datos
entregando información acerca de su posición y su dispersión.
Los procedimientos para obtener las medidas estadísticas difieren levemente
dependiendo de la forma en que se encuentren los datos. Si los datos se
encuentran ordenados en una tabla estadística diremos que se encuentran
agrupados y si los datos no están en una tabla hablaremos de datos no
agrupados.
Según este criterio haremos primero el estudio de las estadísticas para datos
no agrupados y luego para datos agrupados.
MEDIA ARITMÉTICA, MEDIANA Y MODA PARA DATOS NO AGRUPADOS

Media aritmética: La media aritmética o promedio de un conjunto de datos. Se


la representa con x se halla con una fórmula.

Mediana: Para calcular a la mediana, se ordenan los datos y se encuentra el


punto medio de éstos (la posición (n+1)/2). Si la media y la mediana coinciden,
la distribución es simétrica. Si la media es mayor que la mediana, la distribución
es asimétrica positiva; si la mediana es mayor, la distribución es asimétrica
negativa. Ejemplo: 13, 6, 3, 1, 7, 11, 9, 8 Primero debemos ordenar los datos
para determinar cuál es el valor que está en la mitad. 1, 3, 6, 8, 9, 11, 13 por la
tanto Me=8

Moda: Se le representa con Mo y es el dato que tiene la mayor frecuencia. La


moda puede existir o no y pueden ser uno o más valores es decir no es única.
Ejemplo: 4, 6, 6, 9, 7, 6, 3, 4, 5 Mo= 6.
Asignatura Datos del CIPA Fecha
Nombre CIPA: los financieros
Integrantes: Yenifer Solpa Julio
Estadística
Martha Lucia Correa Barrios 12/05/2020
descriptiva
Daniela Cardenas alvares
Alisawer Calderin Vargas

Medidas estadísticas en datos no agrupados


Medidas de tendencia central
PROMEDIO O MEDIA: la media de tendencia central más conocida y utilizada
es la media aritmética o promedio aritmético, se representa por la letra griega μ
cundo se trata del promedio del universo o población y por ӯ (se lee y barra)
cuando se trata del promedio de la muestra. Es importante destacar que μ es
una cantidad fija mientras que el promedio de la muestra es variable puesto que
diferentes muestras extraídas de la misma población tienden a tener diferentes
medias. La media se expresa en la misma unidad que los datos originales:
centímetros, horas, gramos, etc.
Si una muestra tienen cuatro observaciones: 3,5,2 y 2, por definición el
estadígrafo será:
3+5+2+2 12
Ӯ= = =3
4 2
Estos cálculos se pueden simbolizar:
Y 1+Y 2+Y 3 +Y 4
Ӯ=
4
Donde Y1 es el valor de la variable en la primera observación, Y2 es el valor de
la segunda variable y así sucesivamente. En general, con “n” observaciones,
Y1 representa el valor de la i-esima observación. En este caso el promedio
está dado por.
Desviación: se define como la desviación de un dato a la diferencia entre el
valor del dato y la media.
Desviación = (Y i – Ӯ).
Ejemplo de desviaciones:
Yi Ӯ (Y i –
Ӯ)
3 3 0
5 3 +2
2 3 -1
2 3 -1
suma 0
Asignatura Datos del CIPA Fecha
Nombre CIPA: los financieros
Integrantes: Yenifer Solpa Julio
Estadística
Martha Lucia Correa Barrios 12/05/2020
descriptiva
Daniela Cardenas alvares
Alisawer Calderin Vargas

Una propiedad interesante de la media aritmética es que la suma de las


desviaciones es cero.
Media
La media es el valor de la variable que ocupa la posición central, cuando los
datos se disponen en orden de magnitud. Es decir, el 50% de las
observaciones tiene valores iguales o inferiores a la media y el otro 50% tiene
valores iguales o superiores a la mediana. Si el número de observaciones es
par, la mediana corresponde al promedio de los valores centrales. Por ejemplo:
en la muestra 3, 9,11, 15, la mediana es (9+11)/2=10
Moda
La moda de una distribución se define como el valor de la variable que más se
repite. En un polígono de frecuencia la moda corresponde al valor de la variable
que está bajo el punto más alto del gráfico. Una muestra puede tener más de
una moda.
Medidas de dispersión
Las medidas de dispersión entregan información sobre la variación del variable.
Pretenden resumir en un solo valor la dispersión que tiene un conjunto de
datos. Las medidas de dispersión más utilizadas son: rango de variación,
varianza, desviación estándar, coeficiente de variación.
Rango de variación
Se define como la diferencia entre el mayor valor de la variable y el menor valor
de la variable.
Rango de variación= máximo- mínimo
La mejor medida de dispersión, y la más generalizada es la varianza, o su raíz
cuadrada, la desviación estándar. La variación se representa con el símbolo σ2
(sigma
cuadrado) para el universo o población y con el símbolo S2 (s cuadrado),
cuando se trata de la muestra. La desviación estándar que es la raíz cuadrada
de la varianza, se representa por σ2 y σ son parámetros, constantes para una
población particular;s2 y s son estadígrafos, valores que cambian de muestra en
muestra dentro de una misma población. La varianza se expresa en unidades de
variable al cuadrado y la desviación estándar simplemente en unidades de
variable.
Formulas donde μ es el promedio de la población.

σ2 = ¿ ¿
Asignatura Datos del CIPA Fecha
Nombre CIPA: los financieros
Integrantes: Yenifer Solpa Julio
Estadística
Martha Lucia Correa Barrios 12/05/2020
descriptiva
Daniela Cardenas alvares
Alisawer Calderin Vargas

Donde ӯ es el promedio de la población.

s2 = ¿ ¿

consideremos a modo de ejemplo una muestra de 4 observaciones


Según la formula el promedio calculado es 7, veamos ahora el calculo de las
mediadas de dispersión.
y1 ¿ ¿ ¿ ӯ ¿2
3 -4 16
6 -1 1
8 +1 1
11 +4 16
34

s2= 34/3=11,33 varianza de la muestra


la desviación estándar de la muestra (s) será la raíz cuadrada de 11,33= 3,4
Interpretación de la varianza, también la desviación estándar: un alto valor de la
varianza indica que los datos están alejados del promedio. Es difícil hacer una
interpretación de la varianza teniendo un solo valor de ella. La actuación es
más clara si se comparan la varianza de dos muestras, por ejemplo varianza
de la música igual 18 y varianza de la muestra b igual 25. En este caso diremos
que los datos de la muestra b tienen mayor dispersión que los datos de la
muestra a. esto significa que en la muestra a los datos están más cerca del
promedio y en cambio en la muestra b los datos están más alejados del
promedio.
Coeficiente de variación
Es una medida de la dispersión relativa de los datos. Se define como la
desviación estándar de la muestra expresada como porcentaje de la media
maestral.
σx
Cv=
¿ X∨¿ ¿
Es de particular utilidad para comparar la dispersión entre variables con distintas
Asignatura Datos del CIPA Fecha
Nombre CIPA: los financieros
Integrantes: Yenifer Solpa Julio
Estadística
Martha Lucia Correa Barrios 12/05/2020
descriptiva
Daniela Cardenas alvares
Alisawer Calderin Vargas

unidades de medida. Esto porque el coeficiente de variación, a diferencia de la


desviación estándar, es independiente de la unidad de media de la variable de
estudio.
Medidas de tendencia central y de dispersión en datos agrupados
Se identifica como datos agrupados a los datos puestos en una distribución de
frecuencia. En tal caso las fórmulas de cálculo de promedio, mediana, moda,
varianza y desviación estándar deben incluir una leve modificación.
Promedio en datos agrupados
La fórmula es la siguiente:
n
Y in
Σ i

Ӯ=
i …1
n
Donde ni representa cada una de las frecuencias correspondientes a los
diferentes valores de Yi.
Considermos como un ejemplo una distribución de frecuencias de madres que
asiten a un programa de lactancia materna, clasificadas según el numero de
partos. Por tratarse de una variable en escala discreta, las clases o categorías
asumen solo ciertos valores: 1,2,3,4,5.
YI- n° ni Yi ni Ni (frec.
de acumulada
partos
1 4 4 4
2 13 26 17
3 16 48 33
4 6 24 39
5 3 15 42
total 42 117

n
Y in
Σ 117
i

Ӯ= = =2,78
i …1 42
n
Asignatura Datos del CIPA Fecha
Nombre CIPA: los financieros
Integrantes: Yenifer Solpa Julio
Estadística
Martha Lucia Correa Barrios 12/05/2020
descriptiva
Daniela Cardenas alvares
Alisawer Calderin Vargas

Entonces las 42 madres han tenido en promedio, 2,78 partos.


Si la variable de interés es de tipo continuo será necesario determinar, para
cada intervalo, un valor medio que lo represente. Este valor se llama la marca
de clase (Yc) y se calcula dividendo por 2 la suma de los límites reales del
intervalo de clase. De ahí en adelante se procede del mismo modo que en el
ejercicio anterior, reemplazando, en la fórmula de promedio, Yi por Yc.
Mediana en datos agrupados
Si la variable es de tipo discreto la mediana será el valor de la variable que
corresponda a la frecuencia acumulada que supere inmediatamente a n/2. En
los daros de la tabla 1 Me=3, ya que 42/2 es igual a 21 y la frecuencia
acumulada que supera inmediatamente a 21 es 33, que corresponde a un valor
de variable (Yi) igual a 3.
Si la variable es de tipo continuo es necesario, primero ,identificar la frecuencia
acumulada que supere en forma inmediata a n/2, y luego aplicar la siguiente
formula:
n
[ −N i−1 ]
Me= LI+ 2 Ai
n1
Donde:
Li= límite inferior del intervalo de clases que contiene a la mediana
N= tamaño de la muestra
N i−1 = frecuencia acumulada del intervalo anterior
A= amplitud del intervalo ( diferencia entre los limites)
Moda en datos agrupados
Si la variable es de tipo discreto la moda será el valor de la variable (Yi) que
tenga la mayor frecuencia absoluta (). En los datos de la tabla 1 el valor de la
moda es 3 ya que este valor de variable corresponde a la mayor frecuencia
absoluta =16.
Varianza en datos agrupados
Para el cálculo de la varianza en datos agrupados se utiliza la formula
Σ
2
s = ¿¿
i
Con los datos del ejemplo y recordando que el promedio (Y) resulto ser 2,78
Asignatura Datos del CIPA Fecha
Nombre CIPA: los financieros
Integrantes: Yenifer Solpa Julio
Estadística
Martha Lucia Correa Barrios 12/05/2020
descriptiva
Daniela Cardenas alvares
Alisawer Calderin Vargas

partos por madre,


Yi ni Y i y ij ¿¿ (Y i− ӯ ¿ 2 ni
1 4 4 3,1684 12,67
2 13 26 0,6084 7,9
3 16 48 0,6084 0,7744
4 6 24 1,4884 8,93
5 3 15 4,9284 14,7852
total 42 117 45,06

Σ
¿ ¿ = 45,06 / 42 -1 = 45, 06 / 41 = 1,1
i
Cuando los datos están agrupados en intervalos de clase, se trabaja con la
marca de clase (Yc), de tal modo que la formula queda:
Σ
¿¿
i
Donde Yc es el punto medio del intervalo y se llama marca de clase del
intervalo Yc= límite inferior del intervalo + límite superior del intervalo/ 2

DESVIACIÓN ESTÁNDAR O TIPICA


La desviación estándar (o desviación típica) es una medida de dispersión para
variables de razón (ratio o cociente) y de intervalo, de gran utilidad en
la estadística descriptiva. Es una medida (cuadrática) de lo que se apartan los
datos de su media, y por tanto, se mide en las mismas unidades que la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las
medidas de tendencia central, sino que necesitamos conocer también la
desviación que representan los datos en su distribución, con objeto de tener una
visión de los mismos más acorde con la realidad a la hora de describirlos e
interpretarlos para la toma de decisiones.
Esta medida nos permite determinar el promedio aritmético de fluctuación de los
datos respecto a su punto central o media. La desviación estándar nos da como
resultado un valor numérico que representa el promedio de diferencia que hay
entre los datos y la media. Para calcular la desviación estándar basta con hallar
la raíz cuadrada de la varianza, por lo tanto su ecuación sería:
Asignatura Datos del CIPA Fecha
Nombre CIPA: los financieros
Integrantes: Yenifer Solpa Julio
Estadística
Martha Lucia Correa Barrios 12/05/2020
descriptiva
Daniela Cardenas alvares
Alisawer Calderin Vargas

MEDIDAS DE DISPERSIÓN. Parámetros estadísticos que indican cómo se


alejan los datos respecto de la media aritmética, sirven como indicador de la
variabilidad de los datos. Las medidas de dispersión más utilizadas son el rango,
la desviación estándar y la varianza.
Rango: Indica la dispersión entre los valores extremos de una variable. se
calcula como la diferencia entre el mayor y el menor valor de la variable. Se
denota como R.
Desviación media: Es la media aritmética de los valores absolutos de las
diferencias de cada dato respecto a la media
Desviación estándar: La desviación estándar mide el grado de disersión de los
datos con respecto a la media, se denota como s para una muestra o
como σ para la población. Se define como la raíz cuadrada de la varianza según
la expresión.
Varianza: Es otro parámetro utilizado para medir la dispersión de los valores de
una variable respecto a la media. Corresponde a la media aritmética de los
cuadrados de las desviaciones respecto a la media
Coeficiente de Variación: Permite determinar la razón existente entre la
desviación estándar (s) y la media. Se denota como CV. El coeficiente de
variación permite decidir con mayor claridad sobre la dispersión de los datos

MEDIDAS DE POSICIÓN NO CENTRAL (CUANTILES)

Los cuantiles: son aquellos valores de la variable, que ordenados de menor a


mayor, dividen a la distribución en partes, de tal manera que cada una de ellas
contiene el mismo número de frecuencias, los más importantes son los cuartiles,
quintiles, deciles y percentiles.

Cuartiles: son tres valores que divides la serie de datos en cuatro partes


iguales. Se representan por Q1(cuartil primero), Q2 (cuartil segundo) y Q3 (cuartil
tercero)
Quintiles: son cuatro valores que dividen la serie de datos en cinco partes
iguales: K1, K2, K3 y K4.
Deciles: (Di) son los valores de la variable que dividen a la distribución en las
partes iguales, cada una de las cuales engloba el 10% de los datos. En total
habrá 9 deciles.( Q2 = D5 =Me)
Percentiles: son los valores que dividen a la distribución en 100 partes
iguales, cada una de las cuales engloba el 1% de las observaciones. En total
Asignatura Datos del CIPA Fecha
Nombre CIPA: los financieros
Integrantes: Yenifer Solpa Julio
Estadística
Martha Lucia Correa Barrios 12/05/2020
descriptiva
Daniela Cardenas alvares
Alisawer Calderin Vargas

habrá 99 percentiles. (Q2 = D5 = Me = P50).


Ventajas y desventajas de la media
 Ventajas
La media aritmética tiene diversas características que la hacen muy útil para los
estudios realizados en los negocios y en las ciencias sociales.
 Se puede calcular en cualquier conjunto de datos numéricos. 2.
 Un conjunto de datos numéricos tiene una y solo una media, de modo
que siempre es única.
 Toma en cuenta todos los datos de una muestra o población.
La media aritmética, en su carácter de ser un solo número que representa a
todo conjunto de datos, tiene importantes ventajas.
 Primero se trata de un término que es fácil de comprender y es
institutoramente claro
 Según todas las muestras o poblaciones tienen un valor promedio
evitando, así confusiones el análisis de datos
 Por último, la media es útil para llevar acabo procedimientos
estadísticos como la comparación de medias entre diferentes
conjuntos de datos
Desventajas: sensibilidad a valores extremos. Valores extremos = muy altos o
muy bajos.
Ventajas y desventajas de la moda
Al obtener la moda de un conjunto de datos pueden darse los siguientes casos
 Si no hay datos repetidos no existirá moda; por ejemplo, si se tienen los
datos siguientes: 32, 45, 62, 35, 44.

 Si hay datos repetidos que tengan valor cero, la moda es cero, pero no
puede decirse que no hay moda; por ejemplo, si se tienen los siguientes
datos de ventas de automóviles de lujo por día: 1, 0, 2, 0, 3, 0, 5.

 Si hay más de un dato repetido igual número de veces existirá más de


una moda, es decir, es una distribución multimodal, lo que representa una
desventaja como medida de tendencia central; por ejemplo, si el siguiente
conjunto de datos es el número de veces que aparece un comercial de
tres productos (A, B, C) en la televisión en una hora: A, C, A, B, C, A, B,
C, B. Con esos datos se tienen tres modas, ya que los comerciales de los
Asignatura Datos del CIPA Fecha
Nombre CIPA: los financieros
Integrantes: Yenifer Solpa Julio
Estadística
Martha Lucia Correa Barrios 12/05/2020
descriptiva
Daniela Cardenas alvares
Alisawer Calderin Vargas

productos A, B y C aparecen tres veces en una hora, por lo que la moda


de los tres productos es tres.
DESVENTAJAS: puede no existir en algunos datos. Puede estar demasiado
lejos de la mitad de los datos.
Ventajas y desventajas de la mediana
La mediana tiene diversas ventajas sobre otras medidas de tendencia central.
Una de ellas es que nos señala el valor que se encuentra exactamente a la
mitad de una serie ordenada de datos, por lo cual es considerada como el límite
o el lindero que divide al 50% de los datos con mayor valor del 50% de los datos
con menor valor.
La mediana también cuenta con algunas características de la media aritmética.
Por ejemplo, también proporciona un solo número que representa a todo el
conjunto de datos, por lo que es un término fácil de comprender y es
intuitivamente claro; todas las muestras o poblaciones tienen una sola mediana;
además, la mediana también es útil para la comparación de diferentes conjuntos
de datos.
Sin embargo, la mediana no toma en cuenta todos los datos de una serie, sino
únicamente el valor del dato que se encuentra exactamente a la mitad de la
serie ordenada, en caso de que n sea impar, o los valores de los dos datos que
se encuentran a la mitad de la serie ordenada, en caso de que n sea par. Esta
peculiaridad puede considerase como una ventaja o desventaja, dependiendo
de la naturaleza del conjunto de datos.
Por ejemplo, a diferencia de la media, la mediana no se ve afectada cuando se
tiene la presencia de datos extremos o atípicos, pues únicamente toma en
cuenta uno o dos valores que se encuentran en el centro de la serie ordenada.
Por esta razón, la mediana es la medida de tendencia central que más se utiliza
cuando se tienen datos extremos.
Desventajas: se deben ordenar los datos para el cálculo. Los valores extremos
pueden ser importantes.
Relación entre la media, la mediana y la moda
Cuando se tiene que decidir cuál medida de tendencia central es la mejor para
describir la forma en que tienden a concentrarse los datos, la respuesta
dependerá de la figura que adquiera la distribución de frecuencias de los datos,
pues ésta hace posible comparar la media, la mediana y la moda de manera
simultánea.
La distribución de frecuencias se encuentra muy relacionada con el histograma
visto en la unidad pasada. El eje vertical representa las frecuencias que
adquieren los valores de la serie de datos y el eje horizontal incluye los valores
Asignatura Datos del CIPA Fecha
Nombre CIPA: los financieros
Integrantes: Yenifer Solpa Julio
Estadística
Martha Lucia Correa Barrios 12/05/2020
descriptiva
Daniela Cardenas alvares
Alisawer Calderin Vargas

que toma la variable a lo largo de la serie. Si la serie está compuesta de muchos


datos, se observa que la gráfica se encuentra más suavizada que lo observado
en los histogramas de la unidad pasada. Las distribuciones de frecuencias
pueden adquirir las siguientes figuras:
 Simétrica con una sola moda.
 Simétrica con dos o más modas.
 Asimétrica con sesgo positivo o derecho.
 Asimetría con sesgo negativo o izquierdo.

Discusión: 
Dudas, desacuerdos, discusiones

También podría gustarte