Manual de Bioestadística

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 16

Manual de Bioestadística

Nathalia Jemima Pedroza García

1
Tabla de contenido
ELABORACIÓN UNA TABLA DE DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS AGRUPADOS ............................ 4
HISTOGRAMA. ....................................................................................................................................... 6
PRESENTACIÓN TABLA DE ESTADÍSTICA DESCRIPTIVA. ..................................................................... 6
PRUEBA DE HIPÓTESIS ...................................................................................................................... 8
Describir los pasos para la realización de una prueba de hipótesis................................................ 8
VALOR DE P ...................................................................................................................................... 10
MEDIAS INDEPENDIENTES ..................................................................................................................... 10
MEDIAS DEPENDIENTES O PAREADAS ............................................................................................... 10
ANEXO. .............................................................................................................................................. 11
FÓRMULAS .................................................................................................................................... 11
MEDIA. ...................................................................................................................................... 11
DESVIACIÓN ESTÁNDAR ........................................................................................................... 11
VARIANZA ................................................................................................................................. 12
COEFICIENTE DE VARIACIÓN .................................................................................................... 12
SOFTWARE ........................................................................................................................................ 13
ESTADÍSTICA DESCRIPTIVA ................................................................................................................ 13
StatDisk...................................................................................................................................... 13
HISTOGRAMA .................................................................................................................................. 13
StatDisk...................................................................................................................................... 13
PREVALENCIA ............................................................................................................................... 13
Winstat ...................................................................................................................................... 13
HIPÓTESIS ..................................................................................................................................... 14
StatDisk...................................................................................................................................... 14
MEDIAS INDEPENDIENTES .................................................................................................................. 14

2
STAT DISK..................................................................................................................................... 14

MEDIAS PAREADAS .......................................................................................................................... 15


Stat disk ..................................................................................................................................... 15
CORRELACIÓN Y REGESIÓN LINEAL............................................................................................ 15
STATDISK ................................................................................................................................... 15

3
ELABORACIÓN UNA TABLA DE DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS AGRUPADOS

Por lo general una tabla de frecuencias con datos agrupados se realiza cuando
la cantidad de datos es grande y/o la variable es continua.

Básicamente consiste en agrupar los datos en intervalos de una misma amplitud,


denominados clases. A cada clase se le asignan valores de cada tipo
de frecuencias.

Pasos a seguir:

Paso 1: Identificar el valor máximo y mínimo


Paso 2: Calcular el Rango
El rango es el valor numérico que sirve para manifestar la diferencia entre
el valor máximo y el valor mínimo de una muestra poblacional.
Para calcular el rango se utiliza la siguiente fórmula:

R = Máxx - Mínx

Paso 3: Calcular la cantidad de Intervalos

A los intervalos también se les conoce como clases. Simplemente son


las «categorías» e)n las cuales vamos a encasillar a nuestros encuestados. Hay
varias formas de calcular cuántos intervalos debemos utilizar. Las cuales son:

Intervalos = n
n=x = 1 + 3.322 Log(n)
Para ambas formas de calcular la cantidad de intervalos a utilizar, el valor de n
corresponde a la cantidad de datos que tenemos para analizar.
Con la primera forma tendríamos que redondear el resultado, ya que el intervalo
corresponde a cantidades enteras.

La segunda forma se conoce como Regla de Sturges, y el resultado obtenido se


debe aproximar por ARRIBA, es decir, al entero siguiente.

Paso: Calcular la Amplitud de los Intervalos

4
Ya sabemos el Rango de edad en la que se mueven nuestros encuestados…. y
sabemos entre cuántos intervalos hay que REPARTIR las categorías… Así se
calcula la amplitud:

AMPLITUD = RANGO/ INTERVALOS

Paso 5: Construcción de los intervalos

El primer intervalo viene con límite inferior igual al valor mínimo de los datos, Se
suma el valor de la amplitud para obtener el límite superior.

sucesivamente hasta que se obtenga el último intervalo que debe finalizar en


el valor máximo (terminando en corchetes).

Paso 6: Cálculo de la Marca de Clase de cada intervalo


La marca de clase simplemente es el punto medio que hay en cada intervalo.
Lo que se debe hacer es sumar límite inferior y superior de cada intervalo y
dividir el resultado entre 2.

Paso 7: Determinar la Frecuencia Absoluta de cada intervalo

La frecuencia absoluta sólo consiste en CONTAR la cantidad de datos que caen


en cada intervalo. Se representa con la f minúscula y un subíndice que indica el
intervalo en el cual está ubicada la frecuencia absoluta (fi).

Paso 8: Determinar la Frecuencia Absoluta Acumulada de cada intervalo

La Frecuencia Absoluta Acumulada (Fi) de cada intervalo consiste en sumar


todas las frecuencias absolutas de los intervalos anteriores y el actual. Para
diferenciar su símbolo de la frecuencia absoluta.
Paso 10: Determinar la Frecuencia Relativa Acumulada de cada intervalo

La Frecuencia Relativa Acumulada (Fr) de cada intervalo consiste en sumar


todas las frecuencias relativas de los intervalos anteriores y el actual. Para
diferenciar su símbolo de la frecuencia relativa, simplemente utiliza la F mayúscula
(Guerra Dávila, 2014).

5
HISTOGRAMA.

Un histograma es una representación gráfica de una variable en forma de


barras, teniendo en cuenta que la superficie de cada barra es proporcional a la
frecuencia de los valores representados. Un histograma nos permite ver cómo se
distribuyen los valores de la variable en estudio.

Usamos los histogramas cuando analizamos variables continuas, o cuando


trabajamos con variables discretas que toman un gran número de valores y son
agrupadas en intervalos. Cuando tenemos variables cualitativas, se emplean los
diagramas de barras.

¿Cómo construir un histograma?

Partimos de una tabla de frecuencias con datos agrupados, y seguimos los


siguientes pasos:

1. En el eje horizontal (X), colocamos los límites de clase. Opcionalmente,


puedes colocar las marcas de clase.
2. En el eje vertical (Y), colocamos las frecuencias. Se suele tomar la
frecuencia absoluta, pero también se puede trabajar con la frecuencia
relativa o con la frecuencia porcentual.
3. Dibujamos las barras de cada clase, teniendo en cuenta que la altura de cada
barra es igual a la frecuencia.

PRESENTACIÓN TABLA DE ESTADÍSTICA DESCRIPTIVA.

❖ Variable: La variable es una característica, cualidad o propiedad observada


que puede adquirir diferentes valores y es susceptible de ser cuantificada
o medida en una investigación. Para ser nominada como tal, debe tener la
posibilidad de variar entre dos valores, como mínimo.

❖ Media: La media es el estadístico descriptivo por excelencia, y nos muestra


de laforma más simple la tendencia hacia el centro de la distribución de
un grupo de datos de una variable, por eso se llaman medidas de
tendencia central.

6
La media se calcula sumando todos los valores y dividiendo la suma entre el
número total de valores

Desviación estándar: es una medida de la dispersión de los datos, cuanto mayor


sea la dispersión mayor es la desviación estándar, si no hubiera ninguna
variación en los datos, es decir, si fueran todos iguales, la desviación estándar
sería cero.

media: es el valor que cuantifica cuánto se apartan losvalores de la media de


la población.

Varianza: es una medida de dispersión que se utiliza para representar


lavariabilidad de un conjunto de datos respecto de la media aritmética
de los onjunto de datos respecto de la media aritmética de los mismo.
Así, se calcula como la suma de los residuos elevados al cuadrado y
divididos entre el total de observaciones.

Coeficiente de variación: dispersión que permite el análisis de las


desviaciones de los datos con respecto a la media y al mismo tiempo
las dispersiones que tienen los datos dispersos entre sí.

Rango: El rango es un valor numérico que indica la diferencia entre el


valor máximo y el mínimo de una población o muestra estadística.

Dato mínimo: Un mínimo local es el valor más pequeño que tiene la función en
un intervalo.
Dato máximo: Un máximo es el valor más grande que tiene la función local o
globalmente. Un mínimo es el valor más pequeño que tiene la función local o
globalmente.

Intervalo de confianza: a un par o varios pares de números entre los cuales se


estima que estará cierto valor desconocido respecto de un parámetro poblacional
con un determinado nivel de confianza.

7
PRUEBA DE HIPÓTESIS

Es una suposición de algo posible o imposible para sacar de ello una


consecuencia.
Es una idea que puede no ser verdadera, basada en información previa. Su valor
reside la capacidad para establecer más relaciones entre los hechos y explicar por
qué se producen. Normalmente se plantean primero las razones claras por las
que uno cree que algo es posible y finalmente se pone, en conclusión. Este
método se usa en la rama científica para luego comprobar las hipótesis a través
de los experimentos.

Las pruebas de hipótesis evalúan la probabilidad asociada a la hipótesis nula (H0)


de que no hay efecto o diferencia. El valor de p obtenido refleja la probabilidad
de rechazar la H0 siendo esta verdadera; en ningún caso prueba que la hipótesis
alternativa, de que, si hay efecto o diferencia, sea verdadera.

¿Para qué se usa una prueba de hipótesis?

Como la hipótesis es una proposición que puede o no ser verdadera pero que se
adopta provisionalmente hasta recabar información que sugiera lo contrario. Si
hay inconsistencia, se rechaza la hipótesis. Las pruebas de hipótesis se usan
precisamente para evaluar el grado de esa inconsistencia.

Describir los pasos para la realización de una prueba de hipótesis.

Se puede describir formalmente los pasos a seguir:

• Formular la hipótesis y su alternativa. Normalmente la hipótesis de trabajo


(por ejemplo, tal tratamiento es mejor que el control o tal procedimiento
tiene menos morbilidad) es contrastada con una hipótesis estadística que
supone que no existe tal efecto o tal diferencia. La razón para hacer esto
es que se puede calcular de antemano la distribución de probabilidades
asociadas con tal situación. Esta hipótesis se conoce con el nombre de
hipótesis nula que se abrevia como H0 (Nullus: Nula, falto de valor y fuerza
para obligar o tener efecto).

8
La expresión matemática es H0: < 1= > 2. La hipótesis alternativa es que el efecto
sí existe, que es distinto de cero, y que en algunos casos se puede especificar el
signo de esa diferencia.

Normalmente corresponde a la hipótesis de trabajo, se abrevia como H1 y tiene


tres alternativas: μ 1≠ μ 2, μ 1< μ 2 o bien μ 1> μ 2.

• 2. Elegir la prueba estadística apropiada de acuerdo al diseño


experimental, el tipo de
datos y el número de grupos que se comparan. La cifra que resulta de usar la
prueba
(aplicar la o las fórmulas) en los datos recolectados se conoce como el estadístico
del test en cuestión: z; estadístico t o de Student, la r de Pearson, F del análisis de
varianza, 2. La distribución del estadístico puede ser calculada de antemano
cuando la H0 es verdadera y por lo tanto conocer los valores que delimitarán
distintas porciones del área bajo la curva de esa distribución; éstas se conocen
como
distribuciones de muestreo. Vale la pena decir aquí, y lo reiteraremos luego, que
las
pruebas de hipótesis en ningún caso prueban la veracidad de la hipótesis
alternativa

o de trabajo, limitándose a decir que no hay suficiente evidencia para rechazar la


hipótesis nula basándose en un nivel preestablecido de probabilidades.

3. Elegir el nivel de significación α de la prueba, el límite para rechazar H0. En


general, se acepta α = 0,01 ó 0,05, cifras que implican un 1%, o un 5%
respectivamente, de posibilidades de equivocarse cuando se rechaza H0, de decir
que hay una diferencia cuando en realidad no la hay. Este es el llamado error tipo
I.

4. Calcular el valor de P. Esta es la probabilidad de obtener los resultados


observados
u otros más extremos si la H0 es verdadera, cifra que es determinada por el área
de la distribución que queda más allá del valor calculado.

5. Si p es menor que α, rechazar H0 y aceptar la alternativa; en caso contrario, se


acepta la hipótesis nula. El conjunto de valores que resultarían en el rechazo de
H0 – calculados conociendo la prueba usada, α y el número de observaciones –
9
se conoce con el nombre de región crítica. Este punto puede refrasearse así: se
rechaza la H0 si el estadístico cae en la región crítica. En los apéndices de los
textos de estadística aparecen tablas con la distribución de estos estadísticos,
dando el valor de p y donde el tamaño de la muestra se considera en los grados
de libertad.

VALOR DE P

El valor de p obtenido refleja la probabilidad de rechazar la H0 siendo esta


verdadera; en ningún caso prueba que la hipótesis alternativa, de que, si hay
efecto o diferencia, sea verdadera (p= <0.05).

MEDIAS INDEPENDIENTES
Las muestras independientes son muestras que se seleccionan de forma aleatoria
para que sus observaciones no dependan de los valores de otras observaciones.
Muchos análisis estadísticos se basan en el supuesto de que las muestras son
independientes.

De un modo general, dos muestras se dice que son independientes cuando las
observaciones de una de ellas no coincidan para nada a las observaciones de la
otra, siendo dependientes en caso contrario.

MEDIAS DEPENDIENTES O PAREADAS

Ls medias son dependientes o pareadas cuando proceden de grupos o muestras


dependientes, esto es, cuando existe una relación entre las observaciones de las
muestras. Este escenario ocurre a menudo cuando los resultados se generan a
partir de los mismos individuos bajo dos condiciones distintas.

10
ANEXO.

FÓRMULAS
MEDIA.

DESVIACIÓN ESTÁNDAR

11
VARIANZA

COEFICIENTE DE VARIACIÓN

12
SOFTWARE

ESTADÍSTICA DESCRIPTIVA
StatDisk

1. Abrir programa
2. Seleccionar “Explore Data”
3. Seleccionar “Desciptive Statistics”.
4. Seleccionar “comunas a analizar”.
5. Seleccionar evaluar “Evaluar”

HISTOGRAMA
StatDisk

1. Abrir programa
2. Seleccionar “Data”
3. Seleccionar Histogram”
4. Seleccionar “Auto-fit”.
5. Seleccionar “User definer”.
6. Seleccionar “Class width “(primer intervalo)
7. Seleccionar “Class start “(amplitud)
8. Seleccionar “Frecuency (Counts)” y/o “Relative Freq.(%).”
9. Seleccionar “Plot”.
10. Copiar a word

PREVALENCIA

Winstat

1. Abrir programa
2. Seleccionar “WIndow”
3. Seleccionar “Probability”
4. Seleccionar “normal”
5. Seleccionar “CALC”
13
6. Seleccionar “Parámetros”
7. Anotar media y desviación estándar
8. Seleccionar “Ok”

Prevalencia (multipliar por 100 para obtener prevalencia %)

HIPÓTESIS

StatDisk

1. “Abrir programa”
2. “Analisys”
3. “Hipothesis testing”
4. “Mean-Two Independent Samples”
5. Seleccionar “Pop.Mean 1> Pop. Mean 2”
6. Seleccionar “Prelim.F-Test”
7. Seleccionar “Sample size n1” (tamaño de muestra)
8. Seleccionar “Samble 1 mean” (media)
9. Seleccionar “Sample 1 St Desv” (desviación estándar)
10. Seleccionar “Seleccionar Sample size n2” (tamaño de muestra)
11. Seleccionar “Samble 2 mean (media)”
12. Seleccionar “Sample 2 St Desv” (desviación estándar)”
13. Seleccionar Evaluar

MEDIAS INDEPENDIENTES
STAT DISK

1. Seleccionar “Analisys”.
2. Seleccionar “Hipothesis testing”.
3. Seeccionar “Mean Two Independent Samples”.
4. Seleccionar “Population Mean >Population Mean 2”.
5. Seleccionar “Prelim.F-Test”
6. Seleccionar “Sample size n1” (tamaño de muestra)
7. Seleccionar “Samble 1 mean” (media)
8. Seleccionar “Sample 1 St Desv” (desviación estándar)
9. Seleccionar “Seleccionar Sample size n2” (tamaño de muestra)
14
10. Seleccionar “Samble 2 mean (media)”
11. Seleccionar “Sample 2 St Desv” (desviación estándar)”
12. Seleccionar Evaluar.

MEDIAS PAREADAS

Stat disk

13. Abrir programa


14. Seleccionar “Analisys”.
15. Seleccionar “Hipothesis testing”.
16. Seeccionar “Mean Matched-Pairs”.
17. Seleccionar “Mean of diferecences >0”
18. Seleccionar columnas (2,1)
19. Evaluar

CORRELACIÓN Y REGESIÓN LINEAL

STATDISK

1. Abrir programa
2. Analysis
3. Correlation and regression
4. Seleccionar variables.
5. Evaluar.

RANGO DE CORRELACIÓN

STAT DISK

1. Abrir programa
2. Analysis
3. Rank Correlation.
4. Seleccionar columnas
5. Evaluar
6. Plot.
15
7. Copiar y pegar en Word.

16

También podría gustarte