Esta Di Stica
Esta Di Stica
Esta Di Stica
en estadística
Como hemos dicho, para que los datos tengan sentido es necesario
compararlos. Y para poder compararlos debemos utilizar escalas de
medición. Dichas escalas tendrán diferentes propiedades en función de las
características de los datos que se compararán. En estadística existen cuatro
escalas de medición: nominal, ordinal, de intervalo y de razón.
Escala nominal
Cuando un dato identifica una etiqueta (o el nombre de un atributo) de un
elemento, se considera que la escala de medición es una escala nominal. En
esta carecen de sentido el orden de las etiquetas, así como la comparación y
las operaciones aritméticas. La única finalidad de este tipo de datos es
clasificar a las observaciones. Ejemplo:
Una variable que indica si el visitante de este post es «hombre» o «mujer».
En esta variable se tienen dos etiquetas para clasificar a los visitantes. El orden
carece de sentido, así como la comparación u operaciones aritméticas.
Escala ordinal
Cuando los datos muestran las propiedades de los datos nominales, pero
además tiene sentido el orden (o jerarquía) de estos, se utiliza una escala
ordinal. Ejemplo:
Una variable que mide la calidad de un post. La variable puede tomar valores
enteros del 1 al 5, donde el valor 1 es el peor y el 5 el mejor.
En esta variable sigue sin tener sentido las operaciones aritméticas, pero ahora
sí tiene sentido el orden. Si un post tiene valor 4 y otro tiene valor 2, el primero
se entiende que es mejor que es segundo.
Escala de intervalo
En una escala de intervalo, los datos tienen las propiedades de los datos
ordinales, pero a su vez la separación entre las variables tiene sentido. Este
tipo de datos siempre es numérico, y el valor cero no indica la ausencia de la
propiedad. Veamos un ejemplo:
La temperatura (en grados centígrados) media de una ciudad.
En esta escala, los número mayores corresponden a temperaturas mayores. Es
decir, el orden importa, pero a la vez la diferencias entre las temperaturas
importa.
Escala de razón
En una escala de razón, los datos tienen todas las propiedades de los datos
de intervalo, y la proporción entre ellos tiene sentido. Para esto se requiere que
el valor cero de la escala indique la ausencia de la propiedad a medir. Ejemplos
de este tipo de variables son el peso de una persona a el tiempo utilizado para
una tarea. Ejemplo:
Una variable que mide el salario de una persona.
En esta variable, si una persona gana 100, y otra 10, la primera gana más que
la segunda (comparación). También tiene sentido decir que la primera gana 90
más que la segunda (diferencia), o que gana 10 veces más (proporción).
Variables en estadística
Las variables se las suele dividir según distintos criterios, en función las
características de los valores que estas puedan tomar.
Variables cuantitativas y cualitativas
De acuerdo al tipo de escala que se utilizan se puede clasificar en cualitativas o
cuantitativas.
Las variables cualitativas son aquellas que se usan para identificar un
atributo de un elemento. Se emplean con la escala nominal o la ordinal, y
pueden ser numéricos o no. Los datos contenidos en estas variables se
resumen contando el número de observaciones de cada valor que toma la
variable, o la proporción en entre estos. Un hecho importante a tener en cuenta
es que, aun cuando para los datos cualitativos se use un código numérico, las
operaciones aritméticas como la suma o la multiplicación no tienen sentido.
Ejemplo:
El color de un auto.
Luego, las variables cuantitativas son aquellas que requieren valores
numéricos para definir los datos. Se emplean con las escalas de medición de
intervalo o de razón. En estas sí tienen sentido las operaciones aritméticas.
Ejemplo:
La altura de una persona.
En general hay más alternativas para el análisis estadístico cuando se tienen
variables cuantitativas que con las variables cualitativas.
Variables continuas y discretas
El siguiente criterio de clasificación (solo para variables cuantitativas) es según
como es el conjunto de valores sobre el cual estas pueden tomar valores.
Una variable continua puede tomar valores dentro de un intervalo continuo, es
decir, dado dos puntos de un intervalo, la variable siempre podrá tomar infinitos
valores entre ambos puntos. Ejemplo:
La temperatura en una habitación.
En cambio, una variable discreta solo puede tomar valores sobre un conjunto
finito de valores o un conjunto infinito numerable (un conjunto infinito, pero
cuyos elementos se pueden contar). En otras palabras, no puede tomar valores
sobre cualquier punto del intervalo, sino solamente sobre aquellos incluidos en
el conjunto al que pertenece. Esto hace que surja el concepto de valores
observados sucesivos, lo cual significa que, dado una observación, puede
existir una observación previa y otra posterior. Ejemplo:
Cantidad de años de vida de una persona.
Datos de sección transversal y de series de
tiempo
Por último, otra clasificación típica que se suele realizar sobre los datos
es respecto del tiempo en que estos son adquiridos.
Los datos de sección transversal son los obtenidos en el mismo (o
aproximadamente) momento.
En un mismo periodo, cual es el PBI de un grupo de paises
MÁS INFORMACIÓN
¿Sabías que...?
Media geométrica
Media cuadrática
Cuantiles
Medidas de centralización
Se llama medidas de posición, tendencia central o centralización a unos valores numéricos en
torno a los cuales se agrupan, en mayor o menor medida, los valores de una variable estadística.
Estas medidas se conocen también como promedios.
Para que un valor pueda ser considerado promedio, debe cumplirse que esté situado entre el menor y
el mayor de la serie y que su cálculo y utilización resulten sencillos en términos matemáticos.
Se distinguen dos clases principales de valores promedio:
Las medidas de posición centrales: medias (aritmética, geométrica, cuadrática, ponderada),
mediana y moda.
Las medidas de posición no centrales: entre las que destacan especialmente los cuantiles.
Media aritmética
Se define media aritmética de una serie de valores como el resultado producido al sumar todos ellos
y dividir la suma por el número total de valores. La media aritmética se expresada como .
Dada una variable x que toma los valores x 1, x2, ..., xn, con frecuencias absolutas simbolizadas por f1,
f2, ..., fn, la media aritmética de todos estos valores vendrá dada por:
Media ponderada
En algunas series estadísticas, no todos los valores tienen la misma importancia. Entonces, para
calcular la media se ponderan dichos valores según su peso, con lo que se obtiene una media
ponderada.
Si se tiene una variable con valores x 1, x2, ..., xn, a los que se asigna un peso mediante valores
numéricos p1, p2, ..., pn, la media ponderada se calculará como sigue:
Mediana
La media aritmética no siempre es representativa de una serie estadística. Para complementarla, se
utiliza un valor numérico conocido como mediana o valor central.
Dado un conjunto de valores ordenados, su mediana se define como un valor numérico tal que se
encuentra en el centro de la serie, con igual número de valores superiores a él que inferiores.
Normalmente, la mediana se expresa como Me.
La mediana es única para cada grupo de valores. Cuando el número de valores ordenados (de mayor
a menor, o de menor a mayor) de la serie es impar, la mediana corresponderá al valor que ocupe la
posición (n + 1)/2 de la serie. Si el número de valores es par, ninguno de ellos ocupará la posición
central. Entonces, se tomará como mediana la media aritmética entre los dos valores centrales.
Moda
En una serie de valores a los que se asocia una frecuencia, se define moda como el valor de la
variable que posee una frecuencia mayor que los restantes. La moda se simboliza normalmente por
Mo.
Un grupo de valores puede tener varias modas. Una serie de valores con sólo una moda se denomina
unimodal; si tiene dos modas, es bimodal, y así sucesivamente.
Estadística. Medidas de tendencia central.
1. 1. Estadística Medidas de tendencia central Bachiller: Mariangel Vivenzio G. C.I:
26.346.930 Sección MV
2. 2. Medidas de Tendencia Central • Las medidas de tendencia central, son medidas
estadísticas que pretenden resumir en un solo valor a un conjunto de valores.
Representan un centro en torno al cual se encuentra ubicado el conjunto de los
datos. Las medidas de tendencia central más utilizadas son: media, mediana y
moda. Las medidas de dispersión en cambio miden el grado de dispersión de los
valores de la variable. Dicho en otros términos las medidas de dispersión
pretenden evaluar en qué medida los datos difieren entre sí. De esta forma, ambos
tipos de medidas usadas en conjunto permiten describir un conjunto de datos
entregando información acerca de su posición y su dispersión.
3. 3. Importancia de medidas de tendencia central Las medidas de tendencia central
(media, mediana y moda) sirven como puntos de referencia para interpretar las
calificaciones que se obtienen en una prueba. En resumen, el propósito de las
medidas de tendencia central es: • Mostrar en qué lugar se ubica la persona
promedio o típica del grupo. • Sirve como un método para comparar o interpretar
cualquier puntaje en relación con el puntaje central o típico. • Sirve como un
método para comparar el puntaje obtenido por una misma persona en dos
diferentes ocasiones. • Sirve como un método para comparar los resultados
medios obtenidos por dos o más grupos.
4. 4. Tipos de promedios, matematicos y estadísticos • La media aritmética, es la
medida de posición utilizada con más frecuencia. Si se tienen n valores de
observaciones, la media aritmética es la suma de todos y caca uno de los valores
dividida entre el total de valores: Lo que indica que puede ser afectada por los
valores extremos, por lo que puede dar una imagen distorsionada de la información
de los datos. • La Mediana, es el valor que ocupa la posición central en un conjunto
de datos, que deben estar ordenados, de esta manera la mitad de las
observaciones es menor que la mediana y la otra mitad es mayor que la mediana,
resulta muy apropiada cuando se poseen observaciones extremas. • La Moda, es
el valor de un conjunto de datos que aparece con mayor frecuencia. No depende
de valores extremos, pero es más variables que la media y la mediana. • La media
geométrica, es un promedio muy útil en conjuntos de números que son
interpretados en orden de su producto, no de su suma (tal y como ocurre con la
media aritmética). Por ejemplo, las velocidades de crecimiento. • La media
armónica, es un promedio muy útil en conjuntos de números que se definen en
relación con alguna unidad, por ejemplo la velocidad (distancia por unidad de
tiempo).
5. 5. Rango Medio es la media de las observaciones menor y mayor. como
intervienen solamente estas observaciones, si hay valores extremos, se distorsiona
como medida de posición, pero ofrece un valor adecuado, rápido y sencillo para
resumir al conjunto de datos.
6. 6. Calculo y Aplicación • Media Aritmética Es aquella medida que se obtiene al
dividir la suma de todos los valores de una variable por la frecuencia total. En
palabras más simples, corresponde a la suma de un conjunto de datos dividida por
el número total de dichos datos. 𝑋 = 𝑆𝑢𝑚𝑎 𝑑𝑒 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒
𝑑𝑎𝑡𝑜𝑠 = 𝑋1 + 𝑋2 + 𝑋3 + 𝑋4 + ⋯ + 𝑋 𝑛 𝑁 Ejemplo: En matemáticas, un alumno tiene
las siguientes notas: 4, 7, 7, 2, 5, 3 n = 6 (número total de datos) 𝑋 = 4 + 7 + 7 + 2
+ 5 + 3 6 = 28 6 = 4,8 La media aritmética de las notas de esa asignatura es 4,8.
Este número representa el promedio.
7. 7. • Promedio Geometrico Dadas “N” cantidades, su promedio geométrico es la raíz
enésima del producto de dichas cantidades o números. 𝑃𝐺 = 𝑛 𝑎1 ∙ 𝑎2∙ 𝑎3 ∙∙∙ 𝑎 𝑛
Ejemplo: Calcular el promedio geométrico de 48, 45, 100. 𝑃𝐺 = 3 48 ∙ 45 ∙ 100 𝑃𝐺 =
3 26 ∙ 33 ∙ 53 𝑃𝐺 = 26/3 ∙ 3 3 3 ∙ 5 3 3 𝑃𝐺 = 22 ∙ 31 ∙ 51 𝑃𝐺 = 60
8. 8. • Moda Es la medida que indica cual dato tiene la mayor frecuencia en un
conjunto de datos; o sea, cual se repite más. Ejemplo: Determinar la moda en el
siguiente conjunto de datos que corresponden a las edades de niñas de un Jardín
Infantil. 5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3. La edad que más se repite es 3, por lo
tanto, la Moda es 3 (Mo = 3)
9. 9. • Mediana Para reconocer la mediana, es necesario tener ordenados los valores
sea de mayor a menor o lo contrario. Usted divide el total de casos (N) entre dos, y
el valor resultante corresponde al número del caso que representa la mediana de
la distribución. Es el valor central de un conjunto de valores ordenados en forma
creciente o decreciente. Dicho en otras palabras, la Mediana corresponde al valor
que deja igual número de valores antes y después de él en un conjunto de datos
agrupados. Según el número de valores que se tengan se pueden presentar dos
casos: Si el número de valores es impar, la Mediana corresponderá al valor central
de dicho conjunto de datos. Si el número de valores es par, la Mediana
corresponderá al promedio de los dos valores centrales (los valores centrales se
suman y se dividen por 2). Ejemplo impar: si el numero de datos es impar, la
mediana se encuentra ubicada en el centro del conjunto de los datos. Se tienen los
siguientes datos: 5, 4, 8, 10, 9, 1, 2 Al ordenarlos en forma creciente, es decir de
menor a mayor, se tiene: 1, 2, 4, 5, 8, 9, 10 El 5 corresponde a la Mediana, porque
es el valor central en este conjunto de datos impares. Ejemplo par: si el numero de
datos es par, la mediana se determina por el promedio aritmetico de los dos
valores centrales. Se tienen los siguientes datos: 2, 4, 5, 8, 7, 9, 3, 1, al ordenarlos
en forma creciente, se tiene: 1,2,3,4,5,7,8,9, se tiene que los dos datos centrales
son el 4 y 5. se determinaria de la siguiente manera: MD = 4+5 2 = 4,5
10. 10. Medidas de dispersión Las medidas de dispersión muestran la variabilidad de
una distribución, indicando por medio de un número, si las diferentes puntuaciones
de una variable están muy alejadas de la media. Cuanto mayor sea ese valor,
mayor será la variabilidad, cuanto menor sea, más homogénea será a la media.
Así se sabe si todos los casos son parecidos o varían mucho entre ellos. Para
calcular la variabilidad que una distribución tiene respecto de su media, se calcula
la media de las desviaciones de las puntuaciones respecto a la media aritmética.
Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases
de estrategias para salvar este problema. Una es tomando las desviaciones en
valor absoluto (desviación media) y otra es tomando las desviaciones al cuadrado
(varianza).
11. 11. Medidas de dispersión para series simples Rango o recorrido El rango es la
diferencia entre el mayor y el menor de los datos de una distribución estadística.
Desviación media La desviación respecto a la media es la diferencia entre cada
valor de la variable estadística y la media aritmética. Di = X - 𝑋 La desviación
media es la media aritmética de los valores absolutos de las desviaciones respecto
a la media. La desviación media se representa por: 𝐷 𝑋 = 𝑋1 − 𝑋 + 𝑋2 − 𝑋 + ⋯ + 𝑋
𝑛 − 𝑋 𝑁 𝐷 𝑋 = 𝑖=1 𝑛 𝑋𝑖 − 𝑋 𝑁
12. 12. Medidas de dispersión para datos agrupados • Rango • Varianza
13. 13. • Media • Desviación Estandar
14. 14. • Coeficiente de variación
15. 15. Medidas de posición Son indicadores usados para señalar que porcentaje de
datos dentro de una distribución de frecuencias superan estas expresiones, cuyo
valor representa el valor del dato que se encuentra en el centro de la distribución
de frecuencia, por lo que también se les llama " Medidas de Tendencia Central ".
Pero estas medidas de posición de una distribución de frecuencias han de cumplir
determinadas condiciones para que lean verdaderamente representativas de la
variable a la que resumen. Toda síntesis de una distribución se considerara como
operativa si intervienen en su determinación todos y cada uno de los valores de la
distribución, siendo única para cada distribución de frecuencias y siendo siempre
calculable y de fácil obtención. A continuación se describen las medidas de
posición más comunes utilizadas en estadística, como lo son: • Cuartiles: Hay 3
cuartiles que dividen a una distribución en 4 partes iguales: primero, segundo y
tercer cuartil. • Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero
al noveno decil). • Percentiles: Hay 99 percentiles que dividen a una serie en 100
partes iguales: (primero al noventa y nueve percentil).
16. 16. • Cuartiles (Q1, Q2, Q3) Aquel valor de una serie que supera al 25% de los
datos y es superado por el 75% restante. Formula de Q1 para series de Datos
Agrupados en Clase. Donde: Posición de Q1, la cual se localiza en la primera
frecuencia acumulada que la contenga, siendo la clase de Q1, la correspondiente a
tal frecuencia acumulada. Li, faa, fi, Ic : idéntico a los conceptos vistos para
Mediana pero referidos a la medida de la posición correspondiente. • Primer cuartil
(Q1): • Segundo cuartil (Q2): Coincide, es idéntico o similar al valor de la Mediana
(Q2 = Md). Es decir, supera y es superado por el 50% de los valores de una Serie.
• c) Tercer cuartil (Q3): Aquel valor, termino o dato que supera al 75% y es
superado por el 25% de los datos restantes de la Serie. Formula de Q3 para series
de Datos Agrupados en Clase. Donde:
17. 17. Posición de Q3, todo idéntico al calculo de la Mediana. Deciles (D1, D2, … D9)
Primer Decil (D1), Quinto Decil (D5) y Noveno Decil (D9). El primer decil es aquel
valor de una serie que supera a 1/10 parte de los datos y es superado por las 9/10
partes restantes (respectivamente, hablando en porcentajes, supera al 10% y es
superado por el 90% restante),
18. 18. Conclusión • Las medidas de tendencia central, nos permiten identificar los
valores más representativos de los datos, de acuerdo a la manera como se tienden
a concentrar. • La Media nos indica el promedio de los datos; es decir, nos informa
el valor que obtendría cada uno de los individuos si se distribuyeran los valores en
partes iguales. • La Mediana por el contrario nos informa el valor que separa los
datos en dos partes iguales, cada una de las cuales cuenta con el cincuenta por
ciento de los datos. • La Moda nos indica el valor que más se repite dentro de los
datos