0% encontró este documento útil (0 votos)
32 vistas17 páginas

La Estadística

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1/ 17

La estadística (la forma femenina del término alemán Statistik, derivado a su vez del italiano

statista, "hombre de Estado"),1 es la rama de las matemáticas que estudia la variabilidad, así como
el proceso aleatorio que la genera siguiendo las leyes de la probabilidad.2 Como parte de la
matemática, la estadística es una ciencia formal deductiva, con un conocimiento propio, dinámico
y en continuo desarrollo obtenido a través del método científico formal. En ocasiones, las ciencias
fácticas necesitan utilizar técnicas estadísticas durante su proceso de investigación factual, con el
fin de obtener nuevos conocimientos basados en la experimentación y en la observación. En estos
casos, la aplicación de la estadística permite el análisis de datos provenientes de una muestra
representativa, que busca explicar las correlaciones y dependencias de un fenómeno físico o
natural, de ocurrencia en forma aleatoria o condicional. La estadística es útil para una amplia
variedad de ciencias fácticas, desde la física hasta las ciencias sociales, desde las ciencias de la
salud hasta el control de calidad. Además, se usa en áreas de negocios o instituciones
gubernamentales con el objetivo de describir el conjunto de datos obtenidos para la toma de
decisiones, o bien para realizar generalizaciones sobre las características observadas. En la
actualidad, la estadística aplicada a las ciencias fácticas permite estudiar una determinada
población a partir de la recopilación de información, el análisis de datos y la interpretación de
resultados. Del mismo modo, también es una ciencia esencial para el estudio cuantitativo de los
fenómenos de masa o colectivos.

. Población
Es el conjunto de todos los elementos cuyas propiedades se van a
estudiar. También es llamada universo.
Una población puede ser finita o infinita:

 Población finita: es aquella cuya cantidad de elementos es


posible de determinar. Ejemplo: conjunto de librerías de la ciudad
de Lima.
 Población infinita: es aquella cuya cantidad de elementos es
imposible de determinar. Ejemplo: conjunto de lápices fabricados
en un proceso continuo.
Muestra
Es un subconjunto de la población. En muchas ocasiones, es importante
trabajar con una muestra representativa de la población, para ello,
debemos trabajar con criterios y técnicas de muestreo. Una muestra
representativa debe reflejar las características de la población.
En la práctica, para estudiar una población grande, debemos tomar
una muestra. Por ejemplo, si queremos saber cuál es el candidato
preferido para las próximas elecciones presidenciales de Colombia,
tomaría mucho tiempo preguntarle a todos los electores por su candidato
preferido, además, sería muy caro contratar tantos encuestadores,
digitadores y estadísticos. Por ello, es mejor, analizar una muestra de
electores, aplicar una encuesta, y a partir de allí sacar conclusiones de la
población.

Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un
solo valor a un conjunto de valores. Representan un centro en torno al cual se encuentra
ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas
son: media, mediana y moda. Las medidas de dispersión en cambio miden el grado
de dispersión de los valores de la variable. Dicho en otros términos las medidas de
dispersión pretenden evaluar en qué medida los datos difieren entre sí. De esta forma,
ambos tipos de medidas usadas en conjunto permiten describir un conjunto de datos
entregando información acerca de su posición y su dispersión. Los procedimientos para
obtener las medidas estadísticas difieren levemente dependiendo de la forma en que se
encuentren los datos. Si los datos se encuentran ordenados en una tabla estadística diremos
que se encuentran “agrupados” y si los datos no están en una tabla hablaremos de datos “no
agrupados”.
La medida de tendencia central (moda,media y mediana), parámetro de tendencia
central o medida de centralización es un número situado hacia el centro de la distribución
de los valores de una serie de observaciones (medidas), en la que se encuentra ubicado el
conjunto de los datos. Las medidas de tendencia central más utilizadas son: media, mediana y
moda. Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la
distribución, independientemente de que esté más o menos centrada, se habla de estas
medidas como medidas de posición.1 En este caso se incluyen también los cuantiles entre
estas medidas.
Entre las medidas de tendencia central tenemos lo siguientes:

 Media aritmética
 Media ponderada
 Media geométrica
 Media armónica
 Mediana (estadística)
 Moda (estadística)
Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo que
las medidas de posición o medidas de tendencia se usan de acuerdo al tipo de variable
que se está observando, en este caso se observan variables cuantitativas.

La media aritmética[editar]
Artículo principal: Media aritmética

La media aritmética es el valor obtenido por la suma de todos sus valores dividida entre el
número de sumadores.
Por ejemplo, las notas de 5 alumnos en una prueba:

Niño Nota

1 6.0

2 5.4

3 3.1

4 7.0

5 6.1

 Primero, se suman las notas:

 Luego el total se divide entre la cantidad de alumnos:


La media aritmética en este ejemplo es 5.52.
La media aritmética es, probablemente, uno de los parámetros estadísticos más extendidos.2
Se le llama también promedio o, simplemente, media.

Definición formal[editar]
Dado un conjunto numérico de datos, x1, x2, ..., xn, se define su media aritmética como
Esta definición varía, aunque no sustancialmente, cuando se trata de variables continuas,
esto es, también puede calcularse para variables agrupadas en intervalos.

Propiedades[editar]
Las principales propiedades de la media aritmética son:3

 Su cálculo es muy sencillo y en él intervienen todos los datos.

 Su valor es único para una serie de datos dada.

 Se usa con frecuencia para comparar poblaciones, aunque es más apropiado


acompañarla de una medida de dispersión.

 Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de


datos, ya que tiene la propiedad de equilibrar las desviaciones de los datos
respecto de su propio valor:
 Minimiza las desviaciones cuadráticas de los datos respecto de cualquier
valor prefijado, esto es, el valor de  es mínimo cuando . Este resultado se
conoce como Teorema de König. Esta propiedad permite interpretar uno
de los parámetros de dispersión más importantes: la varianza.

 Se ve afectada por transformaciones afines (cambios de origen y escala),


esto es, si
 entonces , donde  es la media aritmética de los , para i = 1, ..., n y a y b números
reales.

 Es poco sensible a fluctuaciones muestrales, por lo que es un


parámetro muy útil en inferencia estadística.
Inconvenientes de su uso[editar]
Este parámetro, aun teniendo múltiples propiedades que aconsejan su uso en
situaciones muy diversas, tiene también algunos inconvenientes, como son:

 Para datos agrupados en intervalos (variables continuas) su valor


oscila en función de la cantidad y amplitud de los intervalos que se
consideren.

La estatura media como resumen de una población homogénea (abajo) o heterogénea


(arriba).

 Es una medida a cuyo significado afecta sobremanera la dispersión,


de modo que cuanto menos homogéneos sean los datos, menos
información proporciona. Dicho de otro modo, poblaciones muy
distintas en su composición pueden tener la misma media.4 Por
ejemplo, un equipo de baloncesto con cinco jugadores de igual
estatura, 1,95 m, evidentemente, tendría una estatura media de 1,95
m, valor que representa fielmente a esta población homogénea. Sin
embargo, un equipo de jugadores de estaturas más heterogéneas,
2,20 m, 2,15 m, 1,95 m, 1,75 m y 1,70 m, por ejemplo, tendría
también, como puede comprobarse, una estatura media de 1,95 m,
valor que no representa a casi ninguno de sus componentes.

 En el cálculo de la media no todos los valores contribuyen de la


misma manera. Los valores altos tienen más peso que los valores
cercanos a cero. Por ejemplo, en el cálculo del salario medio de una
empresa, el salario de un alto directivo que gane 10 000 € tiene tanto
peso como el de diez empleados "normales" que ganen 1000 €. En
otras palabras, se ve muy afectada por valores extremos.

 No se puede determinar si en una distribución de frecuencias hay


intervalos de clase abiertos.
Media aritmética ponderada[editar]
A veces puede ser útil otorgar pesos o valores a los datos dependiendo de su
relevancia para determinado estudio. En esos casos se puede utilizar una media
ponderada.
Si  son nuestros datos y  son sus "pesos" respectivos, la media ponderada se
define de la siguiente forma:

Media muestral[editar]
Esencialmente, la media muestral es el mismo parámetro que el anterior,
aunque el adjetivo "muestral" se aplica a aquellas situaciones en las que la
media aritmética se calcula para un subconjunto de la población objeto de
estudio.
La media muestral es un parámetro de extrema importancia en la inferencia
estadística, siendo de gran utilidad para la estimación de la media
poblacional, entre otros usos.

Moda[editar]
Artículo principal: Moda (estadística)

La moda es el dato más repetido de la encuesta, el valor de la variable con


mayor frecuencia absoluta.5 En cierto sentido la definición matemática
corresponde con la locución "estar de moda", esto es, ser lo que más se lleva.
Su cálculo en la moda es extremadamente sencillo, pues solo necesita un
recuento. En variables continuas, expresadas en intervalos, existe el
denominado intervalo modal o, en su defecto, si es necesario obtener un valor
concreto de la variable, se recurre a la interpolación.
Por ejemplo, el número de personas en distintos vehículos en una carretera:
5-7-4-6-9-5-6-1-5-3-7. El número que más se repite es 5, entonces la moda es
5.
Hablaremos de una distribución bimodal de los datos, cuando encontremos
dos modas, es decir, dos datos que tengan la misma frecuencia absoluta
máxima. Cuando en una distribución de datos se encuentran tres o más
modas, entonces es multimodal. Por último, si todas las variables tienen la
misma frecuencia diremos que no hay moda.
Cuando tratamos con datos agrupados en intervalos, antes de calcular la
moda, se ha de definir el intervalo modal. El intervalo modal es el de mayor
frecuencia absoluta.
La moda, cuando los datos están agrupados, es un punto que divide el
intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del
intervalo, que verifiquen que:
Siendo  la frecuencia absoluta del intervalo modal y  y  las frecuencias
absolutas de los intervalos anterior y posterior, respectivamente, al
intervalo modal.
Las calificaciones en la asignatura de Matemáticas de 39 alumnos de una
clase viene dada por la siguiente tabla (debajo):

Calificaciones 1 2 3 4 5 6 7 8 9

Número de alumnos 2 2 4 5 8 9 3 4 2

Propiedades[editar]
Sus principales propiedades son:

 Cálculo sencillo.
 Interpretación muy clara.
 Al depender solo de las frecuencias, puede calcularse
para variables cualitativas. Es por ello el parámetro más
utilizado cuando al resumir una población no es posible
realizar otros cálculos, por ejemplo, cuando se enumeran en
medios periodísticos las características más frecuentes de
determinado sector social. Esto se conoce informalmente
como "retrato robot".6
Inconvenientes[editar]
 Su valor es independiente de la mayor parte de los datos, lo
que la hace muy sensible a variaciones muestrales. Por otra
parte, en variables agrupadas en intervalos, su valor depende
excesivamente del número de intervalos y de su amplitud.
 Usa muy pocas observaciones, de tal modo que grandes
variaciones en los datos fuera de la moda, no afectan en
modo alguno a su valor.
 No siempre se sitúa hacia el centro de la distribución.
 Puede haber más de una moda en el caso en que dos o más
valores de la variable presenten la misma frecuencia
(distribuciones bimodales o multimodales).

Mediana[editar]
Artículo principal: Mediana (estadística)

La mediana es un valor de la variable que deja por debajo de sí a la mitad


de los datos, una vez que éstos están ordenados de menor a mayor.7 Por
ejemplo, la mediana del número de hijos de un conjunto de trece familias,
cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2,
puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3,
4, el que ocupa la posición central es 2:
En caso de un número par de datos, la mediana no correspondería a
ningún valor de la variable, por lo que se conviene en tomar como
mediana el valor intermedio entre los dos valores centrales. Por
ejemplo, en el caso de doce datos como los siguientes:
Se toma como mediana 
x i fi Fi
Existen métodos de cálculo más rápidos para
datos más numerosos (véase el artículo 1 2 2
principal dedicado a este parámetro). Del mismo
modo, para valores agrupados en intervalos, se 2 2 4
halla el "intervalo mediano" y, dentro de éste, se
obtiene un valor concreto por interpolación.
3 4 8
Cálculo de la mediana para datos
4 5 13
agrupados[editar]
Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla del 5 6 19 = 19
margen derecho).
6 9 28
Así, aplicando la fórmula asociada a la mediana para n impar,
obtenemos X(39+1)/2 = X20 y basándonos en la fórmula que hace referencia a 7 4 32
las frecuencias absolutas:
Ni-1< n/2 <Ni = N19 < 19.5 < N20 8 4 36

Por tanto la mediana será el valor de la 9 2 38


variable que ocupe el vigésimo lugar. En
nuestro ejemplo, 21 (frecuencia absoluta
acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos (es
aconsejable no olvidar las unidades; en este caso como
estamos hablando de calificaciones, serán puntos)
La mitad de la clase ha obtenido un 5 o más, y la otra mitad
un 5 o más.
Ejemplo (N par)
Las calificaciones en la asignatura de Matemáticas de 38
alumnos de una clase viene dada por la siguiente tabla
(debajo):

Calificaciones 1 2 3 4 5 6 7 8 9

Número de alumnos 2 2 4 5 6 9 4 4 2

Cálculo de la Mediana:
Primero hallamos las frecuencias absolutas
acumuladas Fi (ver tabla margen derecho).
Si volvemos a utilizar la fórmula asociada a la mediana
para n par, obtenemos X(38/2) = X19 y basándonos en la
fórmula que hace referencia a las frecuencias absolutas
--> Ni-1< n/2 < Ni = N18 < 19 < N19
Con lo cual la mediana será la media aritmética de los
valores de la variable que ocupen el decimonoveno y el
vigésimo lugar.
En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el
vigésimo el 6, (desde el vigésimo hasta el vigésimo octavo)
con lo que Me = (5+6)/2 = 5,5 puntos.

¿Qué es un histograma?
 

Un histograma es la representación gráfica en forma de barras, que simboliza la


distribución de un conjunto de datos. Sirven para obtener una "primera vista" general, o
panorama, de la distribución de la población, o de la muestra, respecto a una característica,
cuantitativa y continua.

En un histograma el eje de las   (o abscisas) consiste del rango en el cual se encuentran
los datos. Ahora, las bases de los rectángulos consisten de los intervalos en los cuales
agrupamos dichos datos.

Por otro lado, en el eje de las   (u ordenadas) tenemos más opciones, dependiendo estas
opciones es el tipo de histograma que tenemos. Los dos tipos principales de histogramas
son los siguientes:

 Histograma de frecuencias absolutas. Representa la frecuencia absoluta mediante


la altura de las barras.

 Histograma de frecuencias relativas.Representa la frecuencia relativa mediante la


altura de las barras.
 

Así, ya que conocemos las características de un histograma, tenemos que para construir
uno, dado un conjunto de datos, debemos seguir los siguientes pasos.

 Dibujamos el eje de las abscisas de tal forma que incluya como mínimo el rango de
los datos y, posteriormente, dividimos este rango en los intervalos dados.

 Dibujamos el eje de las ordenadas representando las frecuencias absolutas o


relativas según sea el caso.

 Se dibujan los rectángulos de anchura igual y proporcional al intervalo (en nuestro


caso todos tendrán la misma anchura) y de altura igual a la frecuencia absoluta o
relativa, según sea el caso.

Ejemplo. Consideremos los siguientes datos

Edad Personas

Total:

Nuestro histograma de frecuencias absolutas sería el siguiente


 

Por otro lado, nuestro histograma de frecuencias relativas sería el siguiente

 
¿Qué es un polígono de frecuencias?
Un polígono de frecuencias es una herramienta gráfica que se emplea a
partir de un histograma de frecuencia (es decir, otro tipo de gráfico que
expresa las frecuencias mediante columnas verticales). Para ello, se unen con una
línea los distintos puntos medios de las columnas del histograma, sin
dejar espacio entre una y otra, logrando así una forma geométrica o polígono.

Ads by scrollerads.com

Ads by scrollerads.com

Con esta herramienta gráfica pueden representarse variables cuantitativas o


distribuciones diferentes, cosa que tradicionalmente no hace un histograma, de
un modo rápido y sencillo. Además cuenta con la virtud de ser apreciable a simple
vista.

Por esta razón es sumamente empleado dentro de las ciencias sociales y ciencias


económicas, permitiendo así establecer comparaciones útiles entre los distintos
resultados de un mismo proceso.
Puede servirte: Método cuantitativo

Características del polígono de frecuencias


Los polígonos de frecuencia se conforman uniendo los puntos medios de
cada fase o columna mediante segmentos de recta, de modo que consisten
en un tipo de representación visual de la información cuantitativa. Los datos de la
tabla se hallan siempre por debajo de la curvatura del polígono, y su punto más
alto es siempre el de mayor frecuencia del conjunto.

¿Para qué sirve un polígono de frecuencias?


Se emplean los polígonos de frecuencias cuando es necesario graficar o resaltar
distintas distribuciones conjuntas o bien una clasificación cruzada de una
variable cuantitativa continua, junto con otra variable cualitativa o cuantitativa
discreta, todo dentro de un mismo gráfico.

¿Cómo hacer un polígono de frecuencias?

El polígono de frecuencias surge de un histograma.


Como hemos dicho ya, se obtiene un polígono de frecuencias siempre a partir de
un histograma de frecuencia, cuando se unen consecuentemente todos los puntos
medios de cada elemento con su respectiva frecuencia. Para ello se deben seguir
los siguientes pasos:

 Recolectar la información cuantitativa de lo que se estudiará. Después se


establecerán los límites inferiores y superiores de todos los elementos estudiados.
 Determinar la frecuencia de cada tipo de elemento dentro de
los límites establecidos, y se hará el cálculo promedio de los límites.
 Trazar el gráfico lineal cerrado, juntando los puntos medios de
los datos obtenidos.

Ejemplos de polígonos de frecuencias

El diagrama circular (también llamado gráfica circular, gráfica de


pastel o diagrama de sectores) sirve para representar variables
cualitativas o discretas. Se utiliza para representar la proporción de
elementos de cada uno de los valores de la variable.
Consiste en partir el círculo en porciones proporcionales a
la frecuencia relativa. Entiéndase como porción la parte del círculo que
representa a cada valor que toma la variable.
Cálculo de los sectores
Un círculo completo son 360º (o 2π radianes). El ángulo de cada porción
debe ser proporcional a la frecuencia de cada valor. Por ejemplo, si un valor
representa un 50% del total de elementos, su sector del círculo tendrá un ángulo
de 180º (o π radianes).
Sea (X ,X ,…,X ) un conjunto de elementos. La fórmula para calcular
1 2 N

el ángulo de cada sector es la siguiente:

El ángulo de cada sector se calcula como 360º dividido por el total de


sujetos (N) y multiplicado por la frecuencia absoluta (n ), o bien el producto de
i

la frecuencia relativa (f ) por 360º. También podemos calcular el ángulo


i

en radianes:

Ejemplo
ANUNCIOS
Los continentes suponen el 29,1% de superficie de la Tierra, el resto es
agua. Supongamos que se pretende representar mediante un diagrama
circular la proporción de superficie de cada continente respecto a la superficie de
todos los continentes.
Para dibujar el diagrama, calcula el ángulo de cada uno de los sectores (que
serán Europa, África, América, Asia, Oceanía, la Antártida). Se obtiene la
siguiente tabla:

Una vez calculados los ángulos, puede representarlos gráficamente.


El diagrama circular será el siguiente:

 Compartir en Facebook
 Compartir en Twitter
 Compartir en Whatsapp
 Enviar por email
Mostrar comentarios

 Vacunación contra Covid-19 en México iniciaría el 22 de diciembre


 Coronavirus México: ¿Pueden mascotas transmitir Covid-19?
El Covid-19 está golpeando severamente en algunas partes del
mundo, después de haber salido poco a poco de algunos países. La
segunda oleada de contagios obligó de nueva a algunos sectores a
tener que restringir actividades, y en algunos otros casos, a volver
al confinamiento social; sin embargo, con lo aprendido durante la
cuarentena, se espera que las acciones preventivas se apliquen
correctamente para que no sea necesario un encierro prolongado.
México acaba de salir entre las 10 naciones con más contagios, a
pesar de que en estas semanas ha incrementado sus cifras por culpa de esta
enfermedad; sumando 2,076,882 casos confirmados y 184,474 muertes.
Algunos países siguen aumentando los contagios por la pandemia
del Covid-19, este virus que ha cobrado la vida de 2,463,614 personas en todo
el mundo, cifras que lamentablemente podrían aumentar, si no se ejerce una
acción individual preventiva, ante las diversas actividades de fin de año.
Al principio, Europa registró cifras espeluznantes de contagios, mismos que se
fueron expandiendo hasta llegar al continente americano, en donde hoy
existen tres países dentro del top 10 de los más afectados por el
coronavirus, todos ellos encabezados por Estados Unidos.
A pesar de ello, poco a poco se ve la luz al final del túnel, con los diversos
avances que se han gestado respecto a una posible vacuna. Moderna,
Pfizer y BioNTech, los más avanzados en sus respectivos procesos.
En MARCA Claro te presentamos a los 10 países con más casos
confirmados por el brote de Covid-19.
1. Estados Unidos | 29,136,912 contagios
2. India | 11,079,979 contagios
3. Brasil | 10,457,794 contagios
4. Rusia | 4.223.186 contagios
5. Reino Unido | 4.163.085 contagios
6. Francia | 3.712.020 contagios
7. España | 3,188,553 contagios
8. Italia | 2,888,923 contagios
9. Turquía | 2.683.971 contagios
10. Alemania | 2,436,506 contagios

Países de América Latina


En Latinoamérica los países que han aumentado cifras de contagios son
varios, Brasil encabeza la lista, sin embargo tres países más rebasan
el millón de casos. Perú se acerca a ser la cuarta nación en llegar a
esa cifra
Los 5 países latinoamericanos con más contagios
1. Brasil | 10,457,794 contagios
2. Colombia | 2,244,792 contagios
3. Argentina | 2,098,728 contagios
4. México | 2,076,882 contagios
5. Perú | 1,316,363 contagios

Los países con más casos de Covid-19 en cada


continente
Si dividimos el planeta en continentes, en América se registra en la
actualidad en mayor número de casos confirmados con Estados
Unidos y, si nos vamos al territorio sudamericano nos encontramos
con Brasil, ambos países dentro del Top 10 más afectado. Mientras, en
Europa, Rusia aparece como el país con más contagios (debido a su
amplia extensión geográfica), aunque Francia se acerca peligrosamente a dichas
cifras. En Asia, India superó a Irán; África tiene a Sudáfrica y Oceanía
a Australia.
1. América | Estados Unidos | 29,136,912 contagios
2. Asia | India | 11,079,979 contagios
3. Europa | Rusia | 4.223.186 contagios
4. África | Sudáfrica | 1,487,681 contagios
5. Oceanía | Australia | 28,892 contagios

10º puesto con 76.625 fallecidos.

También podría gustarte