Texto Estadistica
Texto Estadistica
Texto Estadistica
PACCIOLI
¿QUE ES LA ESTADISTICA?
En el lenguaje común en termino estadística significa un poco más que datos o informaciones
numéricas y se emplea generalmente en plural. El termino estadística también se emplea para
designar un área de estudio, una disciplina.
La estadística es una ciencia que proporciona un conjunto de métodos que se utilizan para
recolectar, resumir, clasificar, analizar e interpretar el comportamiento de los datos con respecto a
una característica materia de estudio o investigación. En primera instancia se encarga de obtener
información, describirla y luego usa esta información a fin de predecir algo respecto a la fuente de
información.
DIVISION DE LA ESTADISTICA Para un mejor estudio, la Estadística se divide en dos partes:
a) Estadística Descriptiva, cuya función es organizar, presentar y resumir los datos de una
población o una muestra, a fin de describir y analizar sus características mediante valores numéricos
y atributos. Por lo tanto, es el conjunto de métodos que implica la recolección, presentación y
caracterización de un conjunto de datos a fin de describir en forma apropiada diversas características
de estas. Es decir, un estudio estadístico se considera descriptiva cuando solo se analiza y describe
los datos.
Muchas de las técnicas de la Estadística Descriptiva se han empleado desde hace más de
200 años y se han originado en estudios y actividades de censos. La moderna tecnología de las
computadoras, en particular las gráficas por computadora y los paquetes estadísticos, han ampliado
en forma considerable el campo de la Estadística Descriptiva en los últimos años.
Elementos de la estadística
Ejemplo:
las edades de los estudiantes de BOLIVIA
las edades de los alumnos del sistema educativo.
Los diámetros de la producción diaria de tuercas.
Los pesos de los melones de una cosecha de la cooperativa
Las placas de los automóviles que circulan en un país
Los enfermos de SIDA tratado con uno de tres tratamientos diferentes.
La muestra es una parte o un subconjunto representativo de la población. Y al proceso de obtener
la muestra se llama muestreo. El número de observaciones (o tamaño) de la muestra se denota por n.
Desde luego, el número de observaciones en una muestra es menor que el número de observaciones
posibles en la población, de otra forma, la muestra seria la población misma.
La selección y el estudio de una muestra, tiene por objeto la extracción de conclusiones que sean
válidas para la población del cual se obtuvo dicha muestra. En otras palabras, nuestro propósito es
conocer la población, para lo cual se extrae una muestra de esta.
Es un subconjunto de la población y se utiliza con el propósito de representar la población o
universo y permitir los trabajos empíricos. La muestra es aplicable en los universos o poblaciones
que no son manejables puesto que se reducen costos y tiempo y, las conclusiones no distan mucho
de la realidad.
La muestra cumple la función de caracterizar los elementos de una población a partir de un
número limitado de los elementos de la población. Los elementos que caracterizan a una muestra se
denominan estadígrafos y se representan por las letras del alfabeto latino.
TIPOS DE DATOS
Sea cual fuera la fuente de la que obtenemos la información, esta puede estar referida a
características cualitativas o cuantitativas. La primera se refiere a cualidades tales como, color:
blanco, azul, etc.; estado civil: casado, soltero, etc.; profesión: economista, ingeniero, etc.; calidad
de un producto: bueno, regular, etc.; los segundos se refieren a cantidades tales como: estatura en
cm., salario en bolivianos, número de hijos de una familia, numero de dormitorios por vivienda, etc.
Con cada característica materia de investigación, asociamos una variable; así, podemos dar la
definición siguiente.
VARIABLE es una característica de la población que se va investigar y que puede tomar diferentes
valores. Una variable es una propiedad característica de la población en estudio, susceptible de
tomar diferentes valores, los cuales se pueden observar y medir.
Las variables pueden ser de dos tipos: cualitativas y cuantitativas. Las variables cualitativas se
clasifican a su vez en nominales y ordinales, en tanto que las variables cuantitativas se clasifican a
su vez en discretas y continuas.
Notación: las variables se denotarán por X, Y, etc.
Las variables se clasifican en: cualitativas y cuantitativas.
VARIBLES CUALITATIVA: se llama así, cuando la variable está asociada a una característica
cualitativa. Es decir, son variables cuyos valores son cualidades que presenta la población.
Se clasifica en nominales (categoría sin orden) y ordinales (objetos, individuos en categoría
ordenadas).
Nominales: son datos que corresponden a categorías que por su naturaleza no admiten un orden.
Por ejemplo: sexo (masculino y femenino); carrera de estudio: economía, contabilidad,
administración, etc.
Ordinales: son aquellos que corresponden a evaluaciones subjetivas que se pueden ordenar o
jerarquizar. Por ejemplo: en una competencia artística las posiciones de los ganadores se ordenan o
jerarquizan en primer lugar, segundo lugar, tercer lugar, cuarto lugar, etc.
VARIABLE CUANTITATIVA: se llama así, cuando la variable está asociada a una característica
cuantitativa. Es decir, surgen cuando se puede establecer cuanto o en qué cantidad se posee una
determinada característica.
Se clasifican en discretas (valores enteros) y continuas (valores decimales).
Discretas: estas son aquellas que sólo pueden tomar valores enteros como 1, 2, 8, -4, etc. En este
sentido, los hermano en una familia podrán ser: 1, 2, 3..., etc. Sin embargo, nunca podrán ser 1.5 o
2.3.
Continuas: son aquellas que pueden tomar cualquier valor real dentro de un intervalo o rango. Por
ejemplo, los litros de leche ordeñados podrán se 1.5 o 10.3 etc.
Técnicas de Recolección de datos
Caso practico
Reconocer que tipo de variables es
1. El deporte favorito.
2. Medalla de plata ganada en una competición deportiva.
3. Peso de 5 amigos.
4. Color de ojos de 10 amigos.
5. Número de mascotas de 3 amigos.
6. Lugar que ocupan 10 amigos en la cola del cine.
7. Tiempo que se tarda en recorrer 1 Km.
8. Participantes de una yincana.
9. Primer apellido de los habitantes de un pueblo.
10. Pluviosidad de una ciudad.
TEMA # 2
ORGANIZACIÓN DE DATOS
- N*3=nT-n1-n2
- frecuencia relativa acumulada mayor que H*i
- H*1 = hT
- H*2=hT –h1
- H*3=hT-h1-h2
- porcentaje PI =hi * 100
- frecuencia absoluta total nT = n1+n2+n3+ …
TABLA DE DISTRIBUCION DE FRECUENCIA DEL NUMERO DE HIJOS
Frecuencia
Frecuencia Frecuencia Frecuencia
absoluta
Frecuencia Frecuencia relativa absoluta relativa
observaciones acumulada porcentaje
absoluta relativa acumulada acumulada acumulada
yi menor que Pi
ni hi menor que mayor que mayor que
Ni
Hi N*i H*i
y1 n1 h1 N1 H1 N*1 H*1 P1
y2 n2 h2 N2 H2 N*2 H*2 P2
y3 n3 h3 N3 H3 N*3 H*3 P3
y4 n4 h4 N4 H4 N*4 H*4 P4
totales nT hT PT
Se llama clase a cada uno de los grupos en que se divide el conjunto de dato 𝑦í⬚
2. paso calcular el rango o amplitud del recorrido (l), es la longitud del recorrido del conjunto
de datos.
O sea, l = xmax – xmin , una vez determinado el número de clase en que se divide los datos, se divide
el recorrido del conjunto de datos en tantos intervalos como clase se desee, que en adelante
llamaremos intervalos de clase.
3. Paso Amplitud de clase es la longitud del intervalo que define la clase. Y se calcula de la
siguiente manera, : ci = m/l
en este paso se debe tener mucho cuidado, ya que solo debes trabajar con la cantidad de
intervalos obtenidos en el primer paso
𝐼
1. [𝑦í−1 = Xmin - 𝑦í𝐼 = Xmin + 1*C )
𝐼
2. [𝑦í−1 = Xmin + 1*C - 𝑦í𝐼 = Xmin + 2*C )
𝐼
3. [𝑦í−1 = Xmin + 2*C - 𝑦í𝐼 = Xmin + 3*C )
𝐼
4. [𝑦í−1 = Xmin + 3*C - 𝑦í𝐼 = Xmin + 4*C )
𝐼
5. [𝑦í−1 = Xmin + 4*C - 𝑦í𝐼 = Xmin + 5*C )
6. ETC. …
El extremo del último intervalo debe ser mayor o igual que el valor máximo es decir ≥ Xmax
5. La marca de clase es el punto medio del intervalo que representa a dicha clase. Para ello se
debe sumar los extremos de cada intervalo y dividirlo entre 2
6. Los siguientes procedimientos son los mismos que se trabajo para la tabla no agrupada
- Frecuencia absoluta ni número de veces que aparece de la observación
𝑛𝑖
- frecuencia relativa hi =
𝑛𝑇