Analisis Estadístico
Analisis Estadístico
Analisis Estadístico
Análisis estadístico
IMAGEN: educabarrie.org
y
IMAGEN: unpasomas.fundacion.telefonica.com
cuantitativos.
3
Datos cuantitativos
La información que nos proporcionan
hace referencia a datos contados
(discretos) o medidos (continuos)
usando una escala numérica.
Ejemplos:
- Concentración
- Temperatura
- Longitud
- Actividad enzimática…,etc.
Por tanto, los datos cuantitativos se
obtienen mediante la medición
(cuantificación).
Cuando se hacen mediciones pueden
ocurrir errores, lo cual hace que los
datos obtenidos sean imprecisos. Se
distinguen dos tipos de errores.
IMAGEN: danielaza.files.wordpress.com/2012/01/medici1.jpg
4
Errores sistemáticos versus aleatorios
Los errores aleatorios son aquellos errores inevitables que se producen
por eventos imposibles de controlar durante el proceso de medición.
Son numerosos y pequeños, y su acumulación hace que las medidas
fluctúen alrededor de una media.
Las fuentes de los errores aleatorios son difíciles de identificar o sus efectos
no pueden corregirse del todo, pero se pueden mantener en un nivel
mínimo mediante una selección meticulosa del material y bajo un cuidado
control de las variables.
IMAGEN: virtual.unal.edu.co
5
Errores sistemáticos versus aleatorios
Ejemplos de errores aleatorios son:
- El tiempo de respuesta a la hora de pulsar un cronómetro, ya que
algunas veces se pulsará antes y otras después, por lo que se medirá
más o menos.
- Las fluctuaciones aleatorias a temperatura ambiente.
- El contenido en agua de distintas patatas procedentes de la misma
bolsa.
IMAGEN: viverosdelpozo.com
IMAGEN: virtual.unal.edu.co 7
Errores sistemáticos versus aleatorios
Ejemplos de errores sistemáticos son:
- Cuando una balanza está mal calibrada y no el cero
mide apropiadamente.
- Cuando un cronómetro no funciona bien y siempre se obtiene el
mismo intervalo de tiempo mayor (o menor).
IMAGEN: mscjoseapacheco.files.wordpress.com
IMAGEN: femto.es 8
Precisión versus exactitud
Precisión se refiere a la dispersión del conjunto de valores obtenidos de
mediciones repetidas de una magnitud. Cuanto menor es la dispersión
mayor la precisión. Una medida común de la variabilidad es la
desviación estándar de las mediciones y la precisión se puede estimar
como una función de ella. Es el grado de ausencia de error aleatorio.
Exactitud se refiere a cómo de cerca del
valor real se encuentra el valor medido.
IMAGEN: encrypted-tbn3.gstatic.com/
IMAGEN: es.wikipedia.org 9
Cuantificación = medición
La toma de datos en la muestra de estudio debe ser medida
cuidadosamente, utilizando el equipamiento del laboratorio (sensor de pH,
balanza, pipeta, termómetro, etc.).
IMAGEN: www.monografias.com
13
Comparando medias
Cuando necesitamos medir con
precisión algo, repetimos la
medida varias veces y
calculamos un valor medio.
Realizamos el mismo
procedimiento para
nuestra próxima
medida.
14
Comparando medias
Una vez que se han obtenido las medias para cada conjunto de datos,
los valores pueden ser presentados conjuntamente en una gráfica,
para visualizar la relación entre ambos.
15
Representando barras de error
Las barras de error muestran la distancia entre el valor medio y la
medida más alejada de éste. Es decir, representan la variabilidad de
los datos o la desviación típica de los mismos.
Valor más
alejado de
la media
D
i
s
t
a
n
c
i
a
c 16
a
¿Qué sugieren las barras de error?
Si las barras de error se solapan, es probable que no haya una diferencia
significativa entre los valores medios medidos.
IMAGEN: ime.usp.br/~rvicente/IntroEstatistica.pdf 18
Distribución normal
Simplemente midiendo la longitud de cada una y representando cuantas
pertenencen a cada longitud.
IMAGEN: ime.usp.br/~rvicente/IntroEstatistica.pdf 19
Distribución normal
Si lo alisamos, el histograma adquiere esta forma de campana o curva de
distribución gaussiana.
IMAGEN: images.cnitblog.com/ 21
Curva de distribución típica
23
Resumiendo la SD
La desviación típica es un parámetro estadístico que indica como de
cerca se disponen todos los datos en torno a la media en un conjunto
de mediciones. La SD se considera pequeña si es menos del 33% de la
media.
24
Contraste de hipótesis
Aunque el objetivo al llevar a cabo una investigación es, por lo general,
conocer las características de los individuos de una población, en la
práctica suele ser difícil, cuando no imposible.
Para obviar estos inconvenientes, se recurre al estudio de
una muestra, a partir de la cual podemos inferir o
estimar las características de la población entera de la cual
aquella ha sido extraída (estadística inferencial).
IMAGEN: virtual.unal.edu.co
25
Contraste de hipótesis
La estadística inferencial comprueba hipótesis estadísticas, por lo que son
diferentes de las hipótesis experimentales. Para entender su significado,
veamos el siguiente ejemplo.
EJEMPLO: Se realiza un experimento para comprobar el “efecto del
nitrógeno sobre el crecimiento del maíz”. La hipótesis experimental es que sí
lo favorece, al ser un bioelemento necesario para síntesis de proteínas y
ácidos nucleicos. Para comprobar esta hipótesis, se cultiva una parcela de
plantas de maíz con nitrógeno y otra sin el mismo. Al cabo de un mes, se
mide el ancho de la hoja de 10 plantas de cada parcela, obteniéndose una
media de 56.2 cm y 48.5 cm, respectivamente.
¿Indica este resultado que hay
una diferencia entre las dos
poblaciones y que el nitrógeno
promueve el crecimiento
vegetal? ¿O se debe la
diferencia observada entre
ambas medias al simple azar?
IMAGEN: pastaoro.com.ve
IMAGEN: pastaoro.com.ve
29
t-test
Se aplica cuando los datos:
Son independientes.
Tienen una distribución normal (curva gausiana).
Tienen un tamaño mínimo de muestra de 10 valores cada conjunto
de datos.
Tienen una variabilidad similar.
El valor de t se calcula usando la fórmula:
30
t-test
Una vez calculado, dicho valor
se busca en una tabla
estandarizada de valores de t.
En dicha tabla, hay dos
columnas denominadas “grados
de libertad” y “nivel de
significación o probabilidad
(valores de p)”.
Los grados de libertad se
calculan como (n1 + n2)-2.
El nivel de significación de
referencia es p ≤ 0.05.
Si el valor de t obtenido (tobt) >
la hipótesis nula se
t0.05,
rechaza.
31
t-Test: Ejemplo práctico
Ejemplo: Un grupo de investigación ha estudiado el uso de hormonas
como forma de aumentar la tasa de crecimiento en animales. Para ello,
han inyectado la hormona tiroxina (afecta a la tasa metabólica) a 12
ratas, mientras que usaron otras 12 ratas como grupo control.
Tras cuatro semanas, se volvieron a pesar las ratas y la diferencia en
masa observada se recogió en la siguiente tabla:
32
t-Test: Ejemplo práctico
Para calcular el t-test a partir de la fórmula, tan solo hay
que completar la siguiente tabla usando Excel:
33
t-Test: Ejemplo práctico
Grados de libertad: (12 + 12) - 2
= 22
Para un grado de libertad de 22,
tenemos que el valor de t crítico es
2.08 (p=0.05) o mayor.
Como el valor calculado
tobt
(5.22)
de es mayor que el valor crítico
para t0.05 (2.08), concretamente en
torno al valor de podemos
t0.001,
concluir que existe una probabilidad
>99% de que la diferencia entre
* ambas medias sea significativa.
Por tanto, podemos rechazar la
hipótesis nula, es decir, que las
hormona tiroxina no tiene efecto
sobre el crecimiento de las ratas.
34
t-Test: Ejercicio
Se ha investigado si la longitud de la concha de los percebes pudiera estar
condicionada por la cercanía de estos al mar. Para ello, se comparó la
longitud de la concha de dos grupos de percebes, un grupo 1 que vive
más cerca del agua que otro grupo 2. Se ha medido la longitud de 15
percebes de cada grupo, cuyos resultados se encuentran a continuación:
35
Correlaciones
Frecuentemente parece que dos variables pudieran estar ligadas. Por
ejemplo, la intensidad de luz y la densidad de vegetación.
Dos conjuntos de datos pueden ser respresentados gráficamente y
hallada la línea de mejor ajuste. Esta línea puede mostrar que existe una
correlación positiva, negativa o no haberla.
37
Test de correlación de Spearman
Una vez calculado, dicho valor se busca en una tabla estandarizada de
valores de rs, siendo n el número de datos.
Como siempre, el nivel de significación de referencia es p ≤ 0.05, de
manera que si el valor de rsobtenido > rs0.05, la hipótesis nula se rechaza.
38
Test de correlación de Spearman: Ejemplo
¿Existe una correlación entre el número de árboles que hay en
una determinada zona y el número de animales que pasan por ella?
1 40 8
2 8 2
3 25 5
4 60 15
5 12 7
6 18 3
7 19 4
8 27 8
9 24 7
10 21 6
11 64 19
12 70 22
39
Test de correlación de Spearman: Ejemplo
El rango se determina de mayor a menor, siendo el 1º la zona con más
animales o árboles, y el 12º la que menos, pudiendo o no coincidir.
2 8 12 2 12 0 0
3 25 6 5 9 -3 9
4 60 3 15 3 0 0
5 12 11 7 6,5 4,5 20,25
6 18 10 3 11 -1 1
7 19 9 4 10 -1 1
8 27 5 8 4,5 0,5 0,25
9 24 7 7 6,5 0,5 0,25
10 21 8 6 8 0 0
11 64 2 19 2 0 0
12 70 1 22 1 0 0
40
Test de correlación de Spearman: Ejemplo
Sustituyendo en la fórmula:
6Σd2 192
n(n2-1) 1716
6Σd2/n(n2-1)
0,111
rs
0,888
Observados 25 12 18 15 70
45
chi-cuadrado test
Una vez calculado, dicho valor se busca en una tabla estandarizada de
valores de X2.
Los grados de libertad se calculan restando 1 al número de categorías en
la investigación.
Como siempre, el nivel de significación de referencia es p ≤ 0.05, de
manera que si el valor de X2obt > X20.05, la hipótesis nula se rechaza.
46
chi-cuadrado test: Ejemplo práctico
Para calcular el chi cuadrado test a partir de la fórmula, tan
solo hay que completar la siguiente tabla usando Excel:
Resultados 25 12 18 15
obervados (O)
Resultados 17,5 17,5 17,5 17,5
esperados (E)
O-E
7,5 -5,5 0,5 -2,5
(O-E)2
56,25 30,25 0,25 6,25
(O-E)2/E
3,214 1,729 0,014 0,357
Σ(O-E)2/E
5,314
La hipótesis nula (Ho) sería: La ardilla roja no tiene preferencias por una
especie de árbol en concreto para poner sus madrigueras.
47
chi-cuadrado test: Ejemplo práctico
Grados de libertad: 4 - 1 = 3
Para un grado de libertad de 3, tenemos que el valor de X2 crítico es 7.82
(p=0.05) o mayor.
Como el valor calculado de X2 (5.314) es menor que ese valor crítico, y se
encuentra entre p = 0.1 y 0.2, podemos concluir que existe una
probabilidad del 10-20% de que los resultados no sean significativos.
48
Chi-cuadrado test: Ejercicio
En la mosca de la fruta la longitud del ala grande domina sobre la
pequeña mientras que el color del ojo rojo domina sobre el blanco. Se
realizó un cruzamiento entre moscas de la frutas todas ellas
heterocigóticas para ambos caracteres, obteniéndose un total de 448
descendientes en la F1. La siguiente tabla muestra los resultados
observados. ¿Podemos asegurar que ambos caracteres siguen un patron
de herencia 9:3:3:1 típico de caracteres autosómicos independientes con
dominancia?
Descendencia Observados
TOTAL 448
50
Chi-cuadrado test: Ejercicio
Para determiner los resultados esperados, se divide el total (448) entre 16
(9+3+3+1). El resultado obtenido equivale al ratio de 1.
Descendencia Observados (O) Esperados (E) O-E (O-E)2 (O-E)2/E