Lab 4 Practico
Lab 4 Practico
Taller 4
La estadística es una disciplina que se ocupa de los métodos y procedimientos para recoger, clasificar,
resumir y analizar la variabilidad de los datos, con la finalidad de ayudar a la toma de decisiones y en
su caso formular predicciones
Variable. Llamaremos variable a una característica medible que nos interesa estudiar de la
población. Una variable se puede clasificar de la siguiente manera:
Tablas de frecuencia.
Una distribución de frecuencias es una tabla en la cual se agrupan los posibles valores para una
variable y se registra el número de valores observados que corresponden a cada clase.
Este tipo de tablas se requiere cuando el propósito es resumir y posteriormente analizar la información
registrada, individualmente para cada una de las variables de interés y sus categorías. Se denomina
Tabla de Distribución de frecuencia porque ella contiene el conjunto de diferentes valores que ha
tomado una variable (los datos sin repetir) ordenados de menor a mayor o por categorías con sus
correspondientes frecuencias
Tenemos dos tipos de tablas de frecuencia, las que se presentan por categoría y las que se agrupan en
intervalos. El uso de una u otra depende de la naturaleza de nuestra variable. Una forma de orientar
el trabajo es analizar la clasificación de la variable, si es cualitativa o continua. Esta clasificación no
es única ni tampoco rígida, su uso depende de diversos factores tales como la variabilidad de los
datos, el rango y la frecuencia.
Recuerde que las tablas de ser de utilidad para la investigación que se está realizando.
edad=c(21,18,19,20,21,20,22,20,20,20,21,20,20,21,21,21,20,20,22,20,22,
23,21,20,21,20,22,21)
t1=table(edad)
t1
FA=cumsum(t1$Freq)
t1=cbind(t1,fa)
t1
d) Calcule la frecuencia relativa y relativa acumulada. Usando el comando cbind incorpórelos
a la tabla t1
fr=prop.table(t1$Freq)
fr
FRA=cumsum(fr)
FRA
t1=cbind(t1,fr,FRA)
t1
e) Realice un gráfico de barras de la variable edad. Usando el comando Help investigue las
diversas opciones que entrega la función barplot.
barplot(table(edad),main="Edad",ylab="Frecuencia Absoluta",
col="darkblue")
e) Realice una nueva tabla, cambiando el criterio para realizar el número de intervalos
tabla2 =fdt(peso,breaks="Sturges")
tabla
g) Usando Help investigue que criterio usa Rstudio para la división por intervalos usada para
la creación del histograma. ¿Qué diferencia existe entre un hsitograma y un gráfico de barras?
• Estadísticos de Tendencia Central: son los valores que nos ayudan a describir el centro de la
distribución de los datos. (Media aritmética, mediana, moda, entre otros)
ESTADÍSTICOS DE RESUMEN EN R
Recuerde que dependiendo del tipo de variable se utiliza un estadístico. Por ejemplo si la variable es
cualitativa puede usar la moda como medida de tendencia central y en caso de que sea cuantitativa,
puede usar la media aritmética y/o la mediana.
ACTIVIDAD
Los datos contenidos en el archivo bmichil.xls corresponde a una muestra de 152 niños, de tres o
cuatro años de edad, en su primer año de jardín de infantes en las escuelas de Burdeos (Gironda,
suroeste de Francia) a los cuales se sometió a un chequeo físico entre los años 1996 y 1997. Las
variables que se midieron son:
a) Realice tablas de distribución de frecuencias para las variables Género, Zep, Peso, años y
altura.
b) Calcule medidas de resumen para las variables que considere necesarias. Interprete.