Manual de Bioestadística

Manual de Bioestadística
Nathalia Jemima Pedroza García
1
Tabla de contenido
ELABORACIÓN UNA TABLA DE DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS AGRUPADOS ............................ 4
HISTOGRAMA. ....................................................................................................................................... 6
PRESENTACIÓN TABLA DE ESTADÍSTICA DESCRIPTIVA. ..................................................................... 6
PRUEBA DE HIPÓTESIS ...................................................................................................................... 8
Describir los pasos para la realización de una prueba de hipótesis................................................ 8
VALOR DE P ...................................................................................................................................... 10
MEDIAS INDEPENDIENTES ..................................................................................................................... 10
MEDIAS DEPENDIENTES O PAREADAS ............................................................................................... 10
ANEXO. .............................................................................................................................................. 11
FÓRMULAS .................................................................................................................................... 11
MEDIA. ...................................................................................................................................... 11
DESVIACIÓN ESTÁNDAR ........................................................................................................... 11
VARIANZA ................................................................................................................................. 12
COEFICIENTE DE VARIACIÓN .................................................................................................... 12
SOFTWARE ........................................................................................................................................ 13
ESTADÍSTICA DESCRIPTIVA ................................................................................................................ 13
StatDisk...................................................................................................................................... 13
HISTOGRAMA .................................................................................................................................. 13
StatDisk...................................................................................................................................... 13
PREVALENCIA ............................................................................................................................... 13
Winstat ...................................................................................................................................... 13
HIPÓTESIS ..................................................................................................................................... 14
StatDisk...................................................................................................................................... 14
MEDIAS INDEPENDIENTES .................................................................................................................. 14
2
STAT DISK..................................................................................................................................... 14
MEDIAS PAREADAS .......................................................................................................................... 15

Stat disk ..................................................................................................................................... 15
CORRELACIÓN Y REGESIÓN LINEAL............................................................................................ 15
STATDISK ................................................................................................................................... 15
3
ELABORACIÓN UNA TABLA DE DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS AGRUPADOS
Por lo general una tabla de frecuencias con datos agrupados se realiza cuando
la cantidad de datos es grande y/o la variable es continua.
Básicamente consiste en agrupar los datos en intervalos de una misma amplitud,

denominados clases. A cada clase se le asignan valores de cada tipo
de frecuencias.
Pasos a seguir:
Paso 1: Identificar el valor máximo y mínimo

Paso 2: Calcular el Rango
El rango es el valor numérico que sirve para manifestar la diferencia entre
el valor máximo y el valor mínimo de una muestra poblacional.
Para calcular el rango se utiliza la siguiente fórmula:
R = Máxx - Mínx
Paso 3: Calcular la cantidad de Intervalos
A los intervalos también se les conoce como clases. Simplemente son

las «categorías» e)n las cuales vamos a encasillar a nuestros encuestados. Hay
varias formas de calcular cuántos intervalos debemos utilizar. Las cuales son:
Intervalos = n
n=x = 1 + 3.322 Log(n)
Para ambas formas de calcular la cantidad de intervalos a utilizar, el valor de n
corresponde a la cantidad de datos que tenemos para analizar.
Con la primera forma tendríamos que redondear el resultado, ya que el intervalo
corresponde a cantidades enteras.
La segunda forma se conoce como Regla de Sturges, y el resultado obtenido se

debe aproximar por ARRIBA, es decir, al entero siguiente.
Paso: Calcular la Amplitud de los Intervalos
4
Ya sabemos el Rango de edad en la que se mueven nuestros encuestados…. y
sabemos entre cuántos intervalos hay que REPARTIR las categorías… Así se
calcula la amplitud:
AMPLITUD = RANGO/ INTERVALOS
Paso 5: Construcción de los intervalos
El primer intervalo viene con límite inferior igual al valor mínimo de los datos, Se
suma el valor de la amplitud para obtener el límite superior.
sucesivamente hasta que se obtenga el último intervalo que debe finalizar en

el valor máximo (terminando en corchetes).
Paso 6: Cálculo de la Marca de Clase de cada intervalo

La marca de clase simplemente es el punto medio que hay en cada intervalo.
Lo que se debe hacer es sumar límite inferior y superior de cada intervalo y
dividir el resultado entre 2.
Paso 7: Determinar la Frecuencia Absoluta de cada intervalo
La frecuencia absoluta sólo consiste en CONTAR la cantidad de datos que caen

en cada intervalo. Se representa con la f minúscula y un subíndice que indica el
intervalo en el cual está ubicada la frecuencia absoluta (fi).
Paso 8: Determinar la Frecuencia Absoluta Acumulada de cada intervalo
La Frecuencia Absoluta Acumulada (Fi) de cada intervalo consiste en sumar

todas las frecuencias absolutas de los intervalos anteriores y el actual. Para
diferenciar su símbolo de la frecuencia absoluta.
Paso 10: Determinar la Frecuencia Relativa Acumulada de cada intervalo
La Frecuencia Relativa Acumulada (Fr) de cada intervalo consiste en sumar

todas las frecuencias relativas de los intervalos anteriores y el actual. Para
diferenciar su símbolo de la frecuencia relativa, simplemente utiliza la F mayúscula
(Guerra Dávila, 2014).
5
HISTOGRAMA.
Un histograma es una representación gráfica de una variable en forma de

barras, teniendo en cuenta que la superficie de cada barra es proporcional a la
frecuencia de los valores representados. Un histograma nos permite ver cómo se
distribuyen los valores de la variable en estudio.
Usamos los histogramas cuando analizamos variables continuas, o cuando

trabajamos con variables discretas que toman un gran número de valores y son
agrupadas en intervalos. Cuando tenemos variables cualitativas, se emplean los
diagramas de barras.
¿Cómo construir un histograma?
Partimos de una tabla de frecuencias con datos agrupados, y seguimos los

siguientes pasos:
1. En el eje horizontal (X), colocamos los límites de clase. Opcionalmente,

puedes colocar las marcas de clase.
2. En el eje vertical (Y), colocamos las frecuencias. Se suele tomar la
frecuencia absoluta, pero también se puede trabajar con la frecuencia
relativa o con la frecuencia porcentual.
3. Dibujamos las barras de cada clase, teniendo en cuenta que la altura de cada
barra es igual a la frecuencia.
PRESENTACIÓN TABLA DE ESTADÍSTICA DESCRIPTIVA.
❖ Variable: La variable es una característica, cualidad o propiedad observada

que puede adquirir diferentes valores y es susceptible de ser cuantificada
o medida en una investigación. Para ser nominada como tal, debe tener la
posibilidad de variar entre dos valores, como mínimo.
❖ Media: La media es el estadístico descriptivo por excelencia, y nos muestra

de laforma más simple la tendencia hacia el centro de la distribución de
un grupo de datos de una variable, por eso se llaman medidas de
tendencia central.
6
La media se calcula sumando todos los valores y dividiendo la suma entre el
número total de valores
Desviación estándar: es una medida de la dispersión de los datos, cuanto mayor

sea la dispersión mayor es la desviación estándar, si no hubiera ninguna
variación en los datos, es decir, si fueran todos iguales, la desviación estándar
sería cero.
media: es el valor que cuantifica cuánto se apartan losvalores de la media de

la población.
Varianza: es una medida de dispersión que se utiliza para representar

lavariabilidad de un conjunto de datos respecto de la media aritmética
de los onjunto de datos respecto de la media aritmética de los mismo.
Así, se calcula como la suma de los residuos elevados al cuadrado y
divididos entre el total de observaciones.
Coeficiente de variación: dispersión que permite el análisis de las

desviaciones de los datos con respecto a la media y al mismo tiempo
las dispersiones que tienen los datos dispersos entre sí.
Rango: El rango es un valor numérico que indica la diferencia entre el

valor máximo y el mínimo de una población o muestra estadística.
Dato mínimo: Un mínimo local es el valor más pequeño que tiene la función en
un intervalo.
Dato máximo: Un máximo es el valor más grande que tiene la función local o
globalmente. Un mínimo es el valor más pequeño que tiene la función local o
globalmente.
Intervalo de confianza: a un par o varios pares de números entre los cuales se

estima que estará cierto valor desconocido respecto de un parámetro poblacional
con un determinado nivel de confianza.
7
PRUEBA DE HIPÓTESIS
Es una suposición de algo posible o imposible para sacar de ello una

consecuencia.
Es una idea que puede no ser verdadera, basada en información previa. Su valor
reside la capacidad para establecer más relaciones entre los hechos y explicar por
qué se producen. Normalmente se plantean primero las razones claras por las
que uno cree que algo es posible y finalmente se pone, en conclusión. Este
método se usa en la rama científica para luego comprobar las hipótesis a través
de los experimentos.
Las pruebas de hipótesis evalúan la probabilidad asociada a la hipótesis nula (H0)

de que no hay efecto o diferencia. El valor de p obtenido refleja la probabilidad
de rechazar la H0 siendo esta verdadera; en ningún caso prueba que la hipótesis
alternativa, de que, si hay efecto o diferencia, sea verdadera.
¿Para qué se usa una prueba de hipótesis?
Como la hipótesis es una proposición que puede o no ser verdadera pero que se
adopta provisionalmente hasta recabar información que sugiera lo contrario. Si
hay inconsistencia, se rechaza la hipótesis. Las pruebas de hipótesis se usan
precisamente para evaluar el grado de esa inconsistencia.
Describir los pasos para la realización de una prueba de hipótesis.
Se puede describir formalmente los pasos a seguir:
• Formular la hipótesis y su alternativa. Normalmente la hipótesis de trabajo

(por ejemplo, tal tratamiento es mejor que el control o tal procedimiento
tiene menos morbilidad) es contrastada con una hipótesis estadística que
supone que no existe tal efecto o tal diferencia. La razón para hacer esto
es que se puede calcular de antemano la distribución de probabilidades
asociadas con tal situación. Esta hipótesis se conoce con el nombre de
hipótesis nula que se abrevia como H0 (Nullus: Nula, falto de valor y fuerza
para obligar o tener efecto).
8
La expresión matemática es H0: < 1= > 2. La hipótesis alternativa es que el efecto
sí existe, que es distinto de cero, y que en algunos casos se puede especificar el
signo de esa diferencia.
Normalmente corresponde a la hipótesis de trabajo, se abrevia como H1 y tiene

tres alternativas: μ 1≠ μ 2, μ 1< μ 2 o bien μ 1> μ 2.
• 2. Elegir la prueba estadística apropiada de acuerdo al diseño

experimental, el tipo de
datos y el número de grupos que se comparan. La cifra que resulta de usar la
prueba
(aplicar la o las fórmulas) en los datos recolectados se conoce como el estadístico
del test en cuestión: z; estadístico t o de Student, la r de Pearson, F del análisis de
varianza, 2. La distribución del estadístico puede ser calculada de antemano
cuando la H0 es verdadera y por lo tanto conocer los valores que delimitarán
distintas porciones del área bajo la curva de esa distribución; éstas se conocen
como
distribuciones de muestreo. Vale la pena decir aquí, y lo reiteraremos luego, que
las
pruebas de hipótesis en ningún caso prueban la veracidad de la hipótesis
alternativa
o de trabajo, limitándose a decir que no hay suficiente evidencia para rechazar la

hipótesis nula basándose en un nivel preestablecido de probabilidades.
3. Elegir el nivel de significación α de la prueba, el límite para rechazar H0. En

general, se acepta α = 0,01 ó 0,05, cifras que implican un 1%, o un 5%
respectivamente, de posibilidades de equivocarse cuando se rechaza H0, de decir
que hay una diferencia cuando en realidad no la hay. Este es el llamado error tipo
I.
4. Calcular el valor de P. Esta es la probabilidad de obtener los resultados

observados
u otros más extremos si la H0 es verdadera, cifra que es determinada por el área
de la distribución que queda más allá del valor calculado.
5. Si p es menor que α, rechazar H0 y aceptar la alternativa; en caso contrario, se

acepta la hipótesis nula. El conjunto de valores que resultarían en el rechazo de
H0 – calculados conociendo la prueba usada, α y el número de observaciones –
9
se conoce con el nombre de región crítica. Este punto puede refrasearse así: se
rechaza la H0 si el estadístico cae en la región crítica. En los apéndices de los
textos de estadística aparecen tablas con la distribución de estos estadísticos,
dando el valor de p y donde el tamaño de la muestra se considera en los grados
de libertad.
VALOR DE P
El valor de p obtenido refleja la probabilidad de rechazar la H0 siendo esta

verdadera; en ningún caso prueba que la hipótesis alternativa, de que, si hay
efecto o diferencia, sea verdadera (p= <0.05).
MEDIAS INDEPENDIENTES
Las muestras independientes son muestras que se seleccionan de forma aleatoria
para que sus observaciones no dependan de los valores de otras observaciones.
Muchos análisis estadísticos se basan en el supuesto de que las muestras son
independientes.
De un modo general, dos muestras se dice que son independientes cuando las
observaciones de una de ellas no coincidan para nada a las observaciones de la
otra, siendo dependientes en caso contrario.
MEDIAS DEPENDIENTES O PAREADAS
Ls medias son dependientes o pareadas cuando proceden de grupos o muestras

dependientes, esto es, cuando existe una relación entre las observaciones de las
muestras. Este escenario ocurre a menudo cuando los resultados se generan a
partir de los mismos individuos bajo dos condiciones distintas.
10
ANEXO.
FÓRMULAS
MEDIA.
DESVIACIÓN ESTÁNDAR
11
VARIANZA
COEFICIENTE DE VARIACIÓN
12
SOFTWARE
ESTADÍSTICA DESCRIPTIVA
StatDisk
1. Abrir programa
2. Seleccionar “Explore Data”
3. Seleccionar “Desciptive Statistics”.
4. Seleccionar “comunas a analizar”.
5. Seleccionar evaluar “Evaluar”
HISTOGRAMA
StatDisk
1. Abrir programa
2. Seleccionar “Data”
3. Seleccionar Histogram”
4. Seleccionar “Auto-fit”.
5. Seleccionar “User definer”.
6. Seleccionar “Class width “(primer intervalo)
7. Seleccionar “Class start “(amplitud)
8. Seleccionar “Frecuency (Counts)” y/o “Relative Freq.(%).”
9. Seleccionar “Plot”.
10. Copiar a word
PREVALENCIA
Winstat
1. Abrir programa
2. Seleccionar “WIndow”
3. Seleccionar “Probability”
4. Seleccionar “normal”
5. Seleccionar “CALC”
13
6. Seleccionar “Parámetros”
7. Anotar media y desviación estándar
8. Seleccionar “Ok”
Prevalencia (multipliar por 100 para obtener prevalencia %)
HIPÓTESIS
StatDisk
1. “Abrir programa”
2. “Analisys”
3. “Hipothesis testing”
4. “Mean-Two Independent Samples”
5. Seleccionar “Pop.Mean 1> Pop. Mean 2”
6. Seleccionar “Prelim.F-Test”
7. Seleccionar “Sample size n1” (tamaño de muestra)
8. Seleccionar “Samble 1 mean” (media)
9. Seleccionar “Sample 1 St Desv” (desviación estándar)
10. Seleccionar “Seleccionar Sample size n2” (tamaño de muestra)
11. Seleccionar “Samble 2 mean (media)”
12. Seleccionar “Sample 2 St Desv” (desviación estándar)”
13. Seleccionar Evaluar
MEDIAS INDEPENDIENTES
STAT DISK
1. Seleccionar “Analisys”.
2. Seleccionar “Hipothesis testing”.
3. Seeccionar “Mean Two Independent Samples”.
4. Seleccionar “Population Mean >Population Mean 2”.
5. Seleccionar “Prelim.F-Test”
6. Seleccionar “Sample size n1” (tamaño de muestra)
7. Seleccionar “Samble 1 mean” (media)
8. Seleccionar “Sample 1 St Desv” (desviación estándar)
9. Seleccionar “Seleccionar Sample size n2” (tamaño de muestra)
14
10. Seleccionar “Samble 2 mean (media)”
11. Seleccionar “Sample 2 St Desv” (desviación estándar)”
12. Seleccionar Evaluar.
MEDIAS PAREADAS
Stat disk
13. Abrir programa

14. Seleccionar “Analisys”.
15. Seleccionar “Hipothesis testing”.
16. Seeccionar “Mean Matched-Pairs”.
17. Seleccionar “Mean of diferecences >0”
18. Seleccionar columnas (2,1)
19. Evaluar
CORRELACIÓN Y REGESIÓN LINEAL
STATDISK
1. Abrir programa
2. Analysis
3. Correlation and regression
4. Seleccionar variables.
5. Evaluar.
RANGO DE CORRELACIÓN
STAT DISK
1. Abrir programa
2. Analysis
3. Rank Correlation.
4. Seleccionar columnas
5. Evaluar
6. Plot.
15
7. Copiar y pegar en Word.
16

Manual de Bioestadística

Cargado por

Copyright:

Formatos disponibles

Manual de Bioestadística

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Manual de Bioestadística

Cargado por

Copyright:

Formatos disponibles

Manual de Bioestadística

Nathalia Jemima Pedroza García

MEDIAS PAREADAS .......................................................................................................................... 15

Básicamente consiste en agrupar los datos en intervalos de una misma amplitud,

Paso 1: Identificar el valor máximo y mínimo

Paso 3: Calcular la cantidad de Intervalos

A los intervalos también se les conoce como clases. Simplemente son

La segunda forma se conoce como Regla de Sturges, y el resultado obtenido se

Paso: Calcular la Amplitud de los Intervalos

AMPLITUD = RANGO/ INTERVALOS

Paso 5: Construcción de los intervalos

sucesivamente hasta que se obtenga el último intervalo que debe finalizar en

Paso 6: Cálculo de la Marca de Clase de cada intervalo

Paso 7: Determinar la Frecuencia Absoluta de cada intervalo

La frecuencia absoluta sólo consiste en CONTAR la cantidad de datos que caen

Paso 8: Determinar la Frecuencia Absoluta Acumulada de cada intervalo

La Frecuencia Absoluta Acumulada (Fi) de cada intervalo consiste en sumar

La Frecuencia Relativa Acumulada (Fr) de cada intervalo consiste en sumar

Un histograma es una representación gráfica de una variable en forma de

Usamos los histogramas cuando analizamos variables continuas, o cuando

¿Cómo construir un histograma?

Partimos de una tabla de frecuencias con datos agrupados, y seguimos los

1. En el eje horizontal (X), colocamos los límites de clase. Opcionalmente,

PRESENTACIÓN TABLA DE ESTADÍSTICA DESCRIPTIVA.

❖ Variable: La variable es una característica, cualidad o propiedad observada

❖ Media: La media es el estadístico descriptivo por excelencia, y nos muestra

Desviación estándar: es una medida de la dispersión de los datos, cuanto mayor

media: es el valor que cuantifica cuánto se apartan losvalores de la media de

Varianza: es una medida de dispersión que se utiliza para representar

Coeficiente de variación: dispersión que permite el análisis de las

Rango: El rango es un valor numérico que indica la diferencia entre el

Intervalo de confianza: a un par o varios pares de números entre los cuales se

Es una suposición de algo posible o imposible para sacar de ello una

Las pruebas de hipótesis evalúan la probabilidad asociada a la hipótesis nula (H0)

¿Para qué se usa una prueba de hipótesis?

Describir los pasos para la realización de una prueba de hipótesis.

Se puede describir formalmente los pasos a seguir:

• Formular la hipótesis y su alternativa. Normalmente la hipótesis de trabajo

Normalmente corresponde a la hipótesis de trabajo, se abrevia como H1 y tiene

• 2. Elegir la prueba estadística apropiada de acuerdo al diseño

o de trabajo, limitándose a decir que no hay suficiente evidencia para rechazar la

3. Elegir el nivel de significación α de la prueba, el límite para rechazar H0. En

4. Calcular el valor de P. Esta es la probabilidad de obtener los resultados

5. Si p es menor que α, rechazar H0 y aceptar la alternativa; en caso contrario, se

El valor de p obtenido refleja la probabilidad de rechazar la H0 siendo esta

MEDIAS DEPENDIENTES O PAREADAS

Ls medias son dependientes o pareadas cuando proceden de grupos o muestras

Prevalencia (multipliar por 100 para obtener prevalencia %)

13. Abrir programa

CORRELACIÓN Y REGESIÓN LINEAL

También podría gustarte