Unidad #1 Introducción
Unidad #1 Introducción
Unidad #1 Introducción
1. DEFINICION DE ESTADÍSTICA
La palabra estadística deriva del Italiano “statista”, que significa Estadista: que
es la persona que trabaja para el estado, reuniendo información y gestionando
información relacionada con el estado (población, economía, territorio, etc.)
2. APLICACIONES DE LA ESTADÍSTICA
Estadística
Inferencial Estudia los métodos para realizar pronósticos o predicciones, a partir del análisis de
datos.
3. POBLACIÓN Y MUESTRA
Esta definición incluye, por ejemplo, a todos los sucesos en que podría
concretarse un fenómeno o experimento cualesquiera. Una población puede ser
finita o infinita.
Pe.
Los habitantes de un país, los planetas del Sistema Solar, el número de razas de una
especie animal, etc., son elementos de una población finita. Sin embargo, el número de
posibles medidas que se puedan hacer de la velocidad de la luz, o de tiradas de un dado,
forman poblaciones infinitas.
Pe.
Si se quiere estudiar las propiedades de las estrellas en nuestra Galaxia, no tendremos
la oportunidad de observarlas todas; tendremos que conformarnos con una muestra
representativa. Obviamente, elegir de forma representativa los elementos de una
muestra es algo muy importante. De hecho, existe un grave problema, conocido como
efecto de selección, que puede condicionar el resultado de un estudio si no se realiza
una selección correcta de los elementos que conforman una muestra.
A cada uno de los componentes de una Población o de una muestra, se denomina
“elemento”; al número de elementos de una población o de una muestra, se
denomina: Tamaño de la población (N) o Tamaño de la muestra (n).
4. VARIABLE ESTADÍSTICA
4.1. Definición
Una Variable Estadística, es una característica de los elementos de una población
o de una muestra que interesa al análisis a realizar, que puede tomar diferentes
valores; en estadística a las variables se los representa por las letras: x, y, z,…
Pe.
Todos los estudiantes de la Facultad Integral de los Valles Cruceños FIVC, puede
considerarse como una población estadística, de la cual podría elegirse varias muestras
estadística; para el análisis estadístico, el interés podría ser ciertas características de los
estudiantes de la FIVC, como ser: su edad, su desempeño académico, su procedencia,
su estado civil, el número de materias aprobadas, etc. A estas características de los
estudiantes, se denomina “Variables Estadísticas”.
V. Cualitativa
Nominal
Variable
Cualitativa
V. Cualitativa
Ordinal
Variable
estadísticas
V. Cuantitativa
Discreta
Variable
Cuantitativa
V. Cuantitativa
Continua
a) Variables Cualitativas
Son variables que no se pueden cuantificar (representar numéricamente), solo
es posible establecer su cualidad o atributo; Pe: estado civil, procedencia,
semestre vencido, etc.)
5. FUENTES DE INFORMACIÓN
Es siempre recomendable citar la fuente de información de los datos con los que
se trabaja.
• Revisión de datos
• Ordenamiento
• Organización y sistematización de datos
• Representación de datos (tablas o cuadros estadísticos y gráficas)
Pe.
Los siguientes datos corresponden a los datos de una muestra, sobre la variable
estatura (cm) de un conjunto de 60 personas que acuden a un control médico;
para este conjunto de datos se requiere elaborar un ordenamiento de datos:
150 160 161 160 160 172 162 160 172 151 161 172 160 169 169 176 160 173 184 172
160 170 153 167 167 175 166 173 169 178 170 179 175 174 160 174 149 162 161 168
170 173 156 159 154 156 160 166 170 169 163 168 171 178 179 164 176 163 182 162
Ordenamiento de datos:
a) Tabulación discreta
DISTRIBUCIÓN DE FRECUENCIAS
(TABULACIÓN DISCRETA)
10
8
6
4
2
0
151
154
167
176
149
150
153
156
159
160
161
162
163
164
166
168
169
170
171
172
173
174
175
178
179
182
184
Además de la frecuencia absoluta “f”, también existen otro tipo de frecuencias, como ser:
1° Ordenamiento de datos:
15 15 15 16 16 17 17 17 17 17 18 18 18
18 18 18 18 18 19 19 19 19 20 20 25
4° Frecuencias Porcentuales
FRECUENCIAS PORCENTUALES
15 16 17 18 19 20 25
4%
8% 12%
8%
16%
20%
32%
OJIBAS
15 17 19 21 23 25 27
FRECUENCIA MAYOR QUE F FRECUENCIA A. MENOR QUE F´
Finalmente, con la tabla de frecuencias se puede responder a las preguntas
planteadas:
¿Cuántos huertos tienen 18 plantas infestadas?
R: Ocho huertos (frecuencia absoluta)
¿Qué cantidad de huertos tienen 20 plantas o más, atacadas por este mal?
R: Tres huertos tienen 20 o más plantas infestadas (frecuencia acumulada Mayor que)
Si el conjunto de datos corresponde a una variable continua (valores que pueden contener
decimales, dentro de un intervalo), la organización, sistematización y presentación de este tipo
de datos recibe el nombre de “Clasificación”.
a) Rango (R): Es el tamaño del intervalo dentro del cual están comprendidos los
datos; se determina restando el dato mayor, menos el dato menor: R = x n – x1.
x1 Rango xn
x1 Rango xn
𝑹
𝑨=
𝒌
d) Frecuencia Absoluta “f”: es el número de datos comprendidos en cada
clase.
Pe.
La unidad operativa de Tránsito, ha levantado datos sobre la velocidad con la que circulan las
movilidades en un punto determinado de la ciudad de Santa Cruz; la información obtenida con
un radar en Km/hr, es la siguiente (N = 55):
PROCEDIMIENTO:
Rango R = 48
15 63
3° Definir el Número de Clases (k):
Existen dos alternativas para determinar el número de clases:
1° Alternativa: √𝑛 = √55 = 7,416 Adoptar: 8
2° Alternativa: 1+ 3,3 Log(n) = 1+3,3 Log(55) = 6,743 Adoptar: 7
De los dos valores se asumen como el ancho de clase al menor valor:
k=7
4° Determinar el Ancho o Amplitud de cada clase (A):
𝑅 48
El ancho de clase es igual a: 𝐴 = = = 6,8571428
𝑘 7
Este ancho de clase no es muy cómodo de manejar, por lo tanto, se asume como
ancho de clase A´= 7. Pero el modificar el ancho de clase ocasiona que el Rango se
incremente; como son 7 clases de ancho igual a 7, por lo tanto, el rango modificado
será: R´= 49
Rango R = 48
15 63
15 64
El incremento del rango es de: ∆𝑅 = 𝑅´ − 𝑅 = 49 − 48 = 1
Este incremento del rango debe ser compartido: la mitad se coloca al inicio del Rango
original y la otra mitad al final del rango original:
Rango Definitivo R´ = 49
14,5 15 63 63,5
Las siete clases son también intervalos, donde cada uno de ellos tiene un límite inferior y un
límite superior:
DISTRIBUCION DE FRECUENCIAS
30
25
Frecuencia
20
15
10
5
0
18 25 32 39 46 53 60
Marca de clase
Frecuencias Porcentuales
0% 2%
7% 13%
9%
24%
45%
FRECUENCIAS ACUMULADAS
60
55 55
Frecuencias acumuladas
54 54
50 48 50
45
40
30 32
23
20
10 10
7 5
0 1 1
18 23 28 33 38 43 48 53 58 63
Marca de Clase