0% encontró este documento útil (0 votos)
34 vistas6 páginas

Lab 4 Practico

Este documento describe conceptos básicos de estadística descriptiva como tablas de frecuencia, estadísticos de resumen y su aplicación en R. Explica que las tablas de frecuencia agrupan valores de variables para contar frecuencias y resumir datos, y que los estadísticos de resumen como la media, mediana y desviación estándar describen tendencias centrales y variabilidad en los datos. También muestra cómo crear tablas de frecuencia y calcular estadísticos de resumen en R para resumir conjuntos de datos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
34 vistas6 páginas

Lab 4 Practico

Este documento describe conceptos básicos de estadística descriptiva como tablas de frecuencia, estadísticos de resumen y su aplicación en R. Explica que las tablas de frecuencia agrupan valores de variables para contar frecuencias y resumir datos, y que los estadísticos de resumen como la media, mediana y desviación estándar describen tendencias centrales y variabilidad en los datos. También muestra cómo crear tablas de frecuencia y calcular estadísticos de resumen en R para resumir conjuntos de datos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 6

Universidad Finis Terrae

Taller 4

La estadística es una disciplina que se ocupa de los métodos y procedimientos para recoger, clasificar,
resumir y analizar la variabilidad de los datos, con la finalidad de ayudar a la toma de decisiones y en
su caso formular predicciones

Una de sus clasificaciones es la siguiente:

• Estadística descriptiva. Se encarga de describir, analizar y representar un grupo de datos


utilizando métodos numéricos y gráficos que resumen y presentan la información contenida
en ellos
• Estadística Inferencial. Apoyándose en el calculo de probabilidades y a partir de datos
muéstrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un
conjunto mayor de datos.

Variable. Llamaremos variable a una característica medible que nos interesa estudiar de la
población. Una variable se puede clasificar de la siguiente manera:

Tablas de frecuencia.

Una distribución de frecuencias es una tabla en la cual se agrupan los posibles valores para una
variable y se registra el número de valores observados que corresponden a cada clase.

Este tipo de tablas se requiere cuando el propósito es resumir y posteriormente analizar la información
registrada, individualmente para cada una de las variables de interés y sus categorías. Se denomina
Tabla de Distribución de frecuencia porque ella contiene el conjunto de diferentes valores que ha
tomado una variable (los datos sin repetir) ordenados de menor a mayor o por categorías con sus
correspondientes frecuencias
Tenemos dos tipos de tablas de frecuencia, las que se presentan por categoría y las que se agrupan en
intervalos. El uso de una u otra depende de la naturaleza de nuestra variable. Una forma de orientar
el trabajo es analizar la clasificación de la variable, si es cualitativa o continua. Esta clasificación no
es única ni tampoco rígida, su uso depende de diversos factores tales como la variabilidad de los
datos, el rango y la frecuencia.

Recuerde que las tablas de ser de utilidad para la investigación que se está realizando.

Analice las siguientes tablas de frecuencia, ¿Cuáles son lo errores cometidos?

a) Tabla de frecuencia para la variable edad.

b) Tabla de frecuencia para la variable número de idiomas hablados por estudiantes de un


establecimiento educacional.
TABLAS DE FRECUENCIA EN R

1. Los siguientes datos corresponde a la edad de 28 estudiantes de un curso de estadística. Con


los datos crearemos una tabla de frecuencia.
a) Ingrese los datos y usando el comando table cree una tabla que incluya frecuencia absoluta.

edad=c(21,18,19,20,21,20,22,20,20,20,21,20,20,21,21,21,20,20,22,20,22,
23,21,20,21,20,22,21)
t1=table(edad)
t1

b) Convierta la tabla creada en un data frame, use el comando:


t1=as. data.frame(t1)

c) Calcule la frecuencia absoluta acumulada e incorpore esa variable a la tabla anteriormente


creada, use el comando cbind.

FA=cumsum(t1$Freq)
t1=cbind(t1,fa)
t1
d) Calcule la frecuencia relativa y relativa acumulada. Usando el comando cbind incorpórelos
a la tabla t1

fr=prop.table(t1$Freq)
fr
FRA=cumsum(fr)
FRA
t1=cbind(t1,fr,FRA)
t1
e) Realice un gráfico de barras de la variable edad. Usando el comando Help investigue las
diversas opciones que entrega la función barplot.

barplot(table(edad),main="Edad",ylab="Frecuencia Absoluta",
col="darkblue")

f) Comente lo que puede observar del gráfico.


2. Considere los datos usados en clase en relación al peso de 21 personas, medido en kilogramos.
Usando la librería fdth realizaremos tablas de frecuencias por intervalos.
a) Instale la librería fdth
b) Cárguela usando el código:
library(fdth)

c) Ingrese la variable peso en forma de vector.


peso=c(61,33,35,74,48,53,53,48,23,19,15,57,72,40,27,25,75,66,34,27,
38,16,42,57,27,59,37,63,71,48)

d) Realice una tabla de frecuencia:


tabla1=fdt(peso, k=6) #k número de clases
tabla1

e) Realice una nueva tabla, cambiando el criterio para realizar el número de intervalos
tabla2 =fdt(peso,breaks="Sturges")
tabla

f) Realice un histograma de la variable peso.


hist(peso, main="Histograma de la variable peso", xlab="Peso en Kg",
ylab = "Frecuencia Absoluta")

g) Usando Help investigue que criterio usa Rstudio para la división por intervalos usada para
la creación del histograma. ¿Qué diferencia existe entre un hsitograma y un gráfico de barras?

h) Usando el comando plot y la opción “cfh” se obtiene el gráfico de frecuencias acumuladas.


plot(tabla2, type="cfh")
ESTADÍSTICOS DE RESUMEN.
Son números descriptivos que nos ayudan a conocer la distribución de una variable en la muestra. Se
dividen en 3 categorías:

• Estadísticos de Tendencia Central: son los valores que nos ayudan a describir el centro de la
distribución de los datos. (Media aritmética, mediana, moda, entre otros)

• Estadísticos de Variación: describen la dispersión de los datos (varianza, desviación estándar,


rango, coeficiente de variación, entre otros)

• Estadísticos de Posición Relativa: describen la posición relativa de una observación dentro


del conjunto de datos (cuantiles, quintiles, cuartiles, entre otros)

ESTADÍSTICOS DE RESUMEN EN R

Recuerde que dependiendo del tipo de variable se utiliza un estadístico. Por ejemplo si la variable es
cualitativa puede usar la moda como medida de tendencia central y en caso de que sea cuantitativa,
puede usar la media aritmética y/o la mediana.
ACTIVIDAD
Los datos contenidos en el archivo bmichil.xls corresponde a una muestra de 152 niños, de tres o
cuatro años de edad, en su primer año de jardín de infantes en las escuelas de Burdeos (Gironda,
suroeste de Francia) a los cuales se sometió a un chequeo físico entre los años 1996 y 1997. Las
variables que se midieron son:

Los datos se encuentran en la carpeta compartida, _Sesión 2.

a) Realice tablas de distribución de frecuencias para las variables Género, Zep, Peso, años y
altura.

b) Calcule medidas de resumen para las variables que considere necesarias. Interprete.

También podría gustarte