Qué Es La Estadística - KarenRocha.1578785

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 10

PROCESAR LA INFORMACIÓN

TALLER DE ESTADÍSTICA

PRESENTADO A: ENRIQUE ROBLES

PRESENTADO POR: KAREN ALEJANDRA ROCHA FONSECA


TECNÓLOGOS EN GESTIÓN EMPRESARIAL
GRUPO: 1578785

SERVICIO NACIONAL DE APRENDIZAJE-SENA


SUB SEDE-CENTRO DE GESTION ADMINISTRATIVA
BOGOTÁ, D.C MAYO 28 DE 2018
1. ¿QUÉ ES ESTADÍSTICA?
La estadística podría definirse como la ciencia que se encarga de recopilar,
organizar, procesar, analizar e interpretar datos con el fin de deducir las
características de una población objetivo.

1.1. TIPOS DE ESTADÍSTICA

1.1.1. Estadística matemática


Es un formato de estadística en el que existe el trabajo formal de los datos
mediante la teoría que más se ajuste a las necesidades del objeto de estudio.
Dichas teorías tiene que ver con el tema de la probabilidad y otras áreas de la
matemática.
Características:
- Obtener información a través de una serie de datos numéricos

1.1.2. Estadística inferencial o inductiva


Se trabaja a través del manejo de una serie de datos que se obtienen en una
muestra predeterminada, con la finalidad específica de obtener una serie de
predicciones que permitan fundamentar las conclusiones a las que ha llegado en
el objeto de estudio.
Características
- Llegar a conclusiones validas en relación a la muestra que se definió
- Presentar probables niveles e incertidumbre respecto a un escenario con su
respectiva explicación.

1.1.3. Estadística descriptiva o deductiva


Esta se emplea con la finalidad de poder analizar y describir una serie de
conjuntos de tipo numérico, tales series numéricas buscan representar distintos
niveles de fenómenos para el mejor manejo de sus análisis. Este tipo de
estadísticas no es muy factible llegar a conclusiones definitivas
2. MEDIDAS DE DISPERSIÓN

Las medidas de tendencia central dan una idea aproximada del comportamiento
de una serie estadística. No obstante, no resultan suficientes para expresar sus
características: una misma media puede provenir de valores cercanos a la misma
o resultar de la confluencia de datos estadísticos enormemente dispares.
Para conocer en qué grado las medidas de tendencia central son representativas
de la serie, se han de complementar con medidas de dispersión como la varianza
o la desviación típica.

2.1. CONCENTRACION Y DISPESION


Las medidas de centralización ayudan a determinar el «centro de gravedad» de
una distribución estadística. Para describir el comportamiento general de la serie
se necesita, sin embargo, una información complementaria para saber si los datos
están dispersos o agrupados.
Así, las medidas de dispersión pueden definirse como los valores numéricos
cuyo objeto es analizar el grado de separación de los valores de una serie
estadística con respecto a las medidas de tendencia central consideradas.

Las medidas de dispersión son de dos tipos:

● Medidas de dispersión absoluta: como recorrido, desviación media, varianza


y desviación típica, que se usan en los análisis estadísticos generales.

● Medidas de dispersión relativa: que determinan la dispersión de la


distribución estadística independientemente de las unidades en que se exprese
la variable. Se trata de parámetros más técnicos y utilizados en estudios
específicos, y entre ellas se encuentran los coeficientes de apertura, el
recorrido relativo, el coeficiente de variación (índice de dispersión de Pearson)
y el índice de dispersión mediana.

La distribución normal, o campana de Gauss, es una función simétrica (con la


media aritmética en el centro de la serie) con un grado de dispersión bajo (la
mayoría de los valores están comprendidos dentro del valor de la desviación
típica).

2.2. RECORRIDO
La medida de dispersión más inmediata es el recorrido de la distribución
estadística, también llamado rango o amplitud. Dada una serie de valores x1,
x2,..., xn, su recorrido es la diferencia aritmética entre el máximo y el mínimo de
estos valores:

2.3. DESVIACION MEDIA


Como medida de dispersión más frecuentemente utilizada, la desviación
media se define como la media aritmética de los valores absolutos de la
desviación de cada valor de la variable con respecto a la media.

2.4. VARIANZA Y DESVIACIÓN TÍPICA

La desviación media no siempre suministra una idea clara del grado de separación
entre los valores de una variable estadística. Para estudios científicos, se prefiere
utilizar una pareja de parámetros relacionados que se conocen
como varianza y desviación típica.
La varianza se define como el cociente entre la suma de los cuadrados de las
desviaciones de los valores de la variable y el número de datos del estudio.
Matemáticamente

Por su parte, la desviación típica, simbolizada por s, se define sencillamente como


la raíz cuadrada de la varianza:

Por lo tanto, se tiene que:

La varianza y la desviación típica, cada una con su respectivo valor, se usan


indistintamente en los estudios estadísticos.

3. MEDIDAS DE TENDENCIA CENTRAL

La estadística busca entre otras cosas, describir las características típicas de


conjuntos de datos. Las medidas de tendencia central corresponden a valores que
generalmente se ubican en la parte central de un conjunto de datos, que nos
ayuda a resumir la información en un sólo número.
Las medidas de tendencia central más utilizadas son: media, mediana y moda.
Las medidas de dispersión en cambio miden el grado de dispersión de los valores
de la variable. Dicho en otros términos las medidas de dispersión pretenden
evaluar en qué medida los datos difieren entre sí. De esta forma, ambos tipos de
medidas usadas en conjunto permiten describir un conjunto de datos entregando
información acerca de su posición y su dispersión.
MEDIDAS DE CENTRALOZACION
Se llama medidas de posición, tendencia central o centralización a unos valores
numéricos en torno a los cuales se agrupan, en mayor o menor medida, los
valores de una variable estadística. Estas medidas se conocen también
como promedios.
Para que un valor pueda ser considerado promedio, debe cumplirse que esté
situado entre el menor y el mayor de la serie y que su cálculo y utilización resulten
sencillos en términos matemáticos.

Se distinguen dos clases principales de valores promedio:


● Las medidas de posición centrales: medias (aritmética, geométrica, cuadrática,
ponderada), mediana y moda.
● Las medidas de posición no centrales: entre las que destacan especialmente
los cuantiles.
Las medidas de centralización son parámetros representativos de distribuciones
de frecuencia como las que ilustra la imagen.

MEDIA ARITMETICA
Se define media aritmética de una serie de valores como el resultado producido
al sumar todos ellos y dividir la suma por el número total de valores. La media
aritmética se expresada como .

MEDIA PONDERADA
En algunas series estadísticas, no todos los valores tienen la misma importancia.
Entonces, para calcular la media se ponderan dichos valores según su peso, con
lo que se obtiene una media ponderada.

MEDIANA
La media aritmética no siempre es representativa de una serie estadística. Para
complementarla, se utiliza un valor numérico conocido como mediana o valor
central.
Dado un conjunto de valores ordenados, su mediana se define como un valor
numérico tal que se encuentra en el centro de la serie, con igual número de
valores superiores a él que inferiores. Normalmente, la mediana se expresa como
Me.
La mediana es única para cada grupo de valores. Cuando el número de valores
ordenados (de mayor a menor, o de menor a mayor) de la serie es impar, la
mediana corresponderá al valor que ocupe la posición (n + 1)/2 de la serie. Si el
número de valores es par, ninguno de ellos ocupará la posición central. Entonces,
se tomará como mediana la media aritmética entre los dos valores centrales.
Determinación de la mediana de una serie de valores.

MODA
En una serie de valores a los que se asocia una frecuencia, se define moda como
el valor de la variable que posee una frecuencia mayor que los restantes. La moda
se simboliza normalmente por Mo.
Un grupo de valores puede tener varias modas. Una serie de valores con sólo una
moda se denomina uni-modal; si tiene dos modas, es bimodal, y así
sucesivamente.

4. CLASES DE VARIABLES O DATOS QUE SE MANEJA EN LA


ESTADISTICA
Cualitativa (o categórica): son las variables que pueden tomar como valores
cualidades o categorías.
Ejemplos:
Sexo (hombre, mujer)
Salud (buena, regular, mala)
Cuantitativas (o numérica): variables que toman valores numéricos.
Ejemplos:
Número de casas (1, 2,…). Discreta.
Edad (12,5; 24,3; 35;…). Continua.
Las variables cualitativas (o variables categóricas) se pueden clasificar según
sigan una jerarquía o un orden determinado.
5. VARIABLE DISCRETA
Una variable discreta es una variable que no puede tomar algunos valores dentro
de un mínimo conjunto numerable, quiere decir, no acepta cualquier valor,
únicamente aquellos que pertenecen al conjunto.
EJEMPLOS:

● El número de hijos de una familia.

● La cantidad de dedos que tienes en la mano.

● El número de faltas en un partido de fútbol.

● El número de árboles que hay en un parque.

● El número de canales de televisión que tienes en casa.

6. VARIABLE CONTINUA
Las variables continuas son variables numéricas que tienen un número infinito de
valores entre dos valores cualesquiera. Una variable continua puede ser numérica
o de fecha/hora. Por ejemplo, la longitud de una pieza o la fecha y hora en que se
recibe un pago.
EJEMPLOS

● a estatura de tu mejor amigo.

● El ancho de una pelota de fútbol.

● El peso de una persona.

● La velocidad a la que va a un auto.

7. DISTRIBUCIÓN DE FRECUENCIAS

Llamamos distribución de frecuencias al conjunto de valores que puede presentar


una variable junto con sus frecuencias, estas frecuencias pueden ser cualquiera
de las anteriores. Según la naturaleza de la variable estudiada las distribuciones
de frecuencias pueden ser:

7.1. NO AGRUPADAS:

Se presentan cuando el número de valores que puede presentar la variable no es


muy elevado, y en ese caso podemos observar todos los valores de esa variable.
Este caso se presenta cuando la variable es discreta y no presenta excesivos
valores.

7.2. AGRUPADAS EN INTERVALOS:

Se presenta cuando la variable es continua o cuando es discreta pero con elevado


número de valores. en esta situación se agrupan dichos valores en intervalos o
clases. Los intervalos se notan: ei-1-ei es intervalo i-ésimo.

- Se llama amplitud del intervalo a la distancia que existe entre los extremos, y se
nota ai:
- ai = ei -ei-1
- Se llama marca de clase al punto medio de un intervalo. Este punto es
importante porque es el representante del intervalo. Se nota xi:
xi = (ei + ei-1)/2
-Se llama densidad de frecuencia de un intervalo a la frecuencia correspondiente a
cada unidad de la variable en dicho intervalo, se nota di: di = ni /ai
Los intervalos se suelen tomar abiertos por la izquierda y cerrados por la derecha,
salvo el primero que se toma cerrado por los dos lados.

En este tipo de distribuciones se pierde parte de la información al agruparlas en


intervalos, ya no se puede hablar de valores concretos sino de intervalos. Cuanto
mayor sea la amplitud de los intervalos menos intervalos habrá, y por tanto menos
precisión tendremos. En cambio, cuanto menor sea la amplitud de los intervalos
menos intervalos habrá, y mayor será la precisión, sin embargo la distribución será
más grande y más difícil de manejar.

8. ¿QUÉ ES UNA TABLA DE FRECUENCIA?

Una tabla de frecuencias (también conocida como tabla de relaciones de


frecuencias) es una tabla en la que se organizan los datos en clases, es decir, en
grupos de valores que escriben una característica de los datos y muestra el
número de observaciones del conjunto de datos que caen en cada una de las
clases. 

La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numérico. En


principio, en la tabla de frencuencias se detalla cada uno de los valores diferentes
en el conjunto de datos junto con el número de veces que aparece, es decir, su
frecuencia absoluta. Se puede complementar la frecuencia absoluta con la
denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el
total de datos.

En variables cuantitativas se distinguen por otra parte la frecuencia simple y la


frecuencia acumulada. La tabla de frecuencias puede representarse gráficamente
en un histograma. Normalmente en el eje vertical se coloca las frecuencias y en el
horizontal los intervalos de valores.

9. ¿QUÉ ES POBLACIÓN?

La población estadística es una variable aleatoria relacionada con los objetos o


individuos que se pretende estudiar en una investigación. Cada uno de los
elementos de la población se denomina individuo y estos comparten algunas
características.

Una población estadística puede ser un grupo de objetos/personas realmente


existentes (por ejemplo, el conjunto de todas las personas de un pueblo) o un
grupo hipotético y potencialmente infinito de objetos concebidos como una
generalización (por ejemplo, el conjunto de todas las jugadas posibles en ajedrez).
9.1. ¿QUÉ ES MUESTRA?

Una muestra estadística (o una muestra) es un subconjunto de elementos de la


población estadística.

El mejor resultado para un proceso estadístico sería estudiar a toda la población.


Pero esto generalmente resulta imposible, ya sea porque supone un coste
económico alto o porque requiere demasiado tiempo.
Frente a la dificultad de hacer un censo (estudio de toda la población), se examina
una muestra estadística que representará a la totalidad de los sujetos. Con el
resultado obtenido mediante la muestra, se intentará inferir las propiedades de
todos los elementos, mediante la estadística inferencial.

9.2. ¿QUÉ ES UNIDAD?

Se llama unidades estadísticas o individuales a los componentes de una


determinada población de datos.

9.3. ¿QUÉ SON DATOS?

Son números que representan las modalidades de las variables. Por ejemplo, el 1
puede representar la modalidad "Mujer", el 6.3 representa una de las magnitudes
que podemos registrar en la variable "grado de conocimiento de las técnicas
estadísticas". Los datos pueden ser clasificados según diferentes criterios, uno de
los cuales se basa en las modalidades que presentan: Se dirá que son datos
dicotómicos los que provienen de variables que solo admiten dos modalidades
(por ejemplo la variable "género"), son datos victimizados aquellos que presentan
dos categorías pero provienen de variables con más de dos modalidades (por
ejemplo datos con valores 1 y 0 que representan aprobado y suspenso).

También podría gustarte