Cotraste de Hipotesis
Cotraste de Hipotesis
Cotraste de Hipotesis
La regla de decisión es el criterio que se usa para decidir si la Ho planteada debe o no ser
rechazada, esta regla se basa en la partición de la distribución muestral del estadístico de
contraste en dos zonas exclusivas y exhaustivas: la zona de rechazo y la zona de aceptación.
Hipótesis nihilista – hipótesis nula: asume que no hay efecto alguno del tratamiento o que la
correlación es cero.
3 problemas
Los argumentos del contraste de hipótesis de pueden reunir en dos grandes grupos:
relacionados con la dimensión estadística del contraste y otro referido a los aspectos de corte
metodológico.
Criticas:
Ataques:
Abelson: MAGIC: dar buenos argumentos que expliquen diferencias comparativas, con la
esperanza de que se haga de un modo interesante.
Didácticas
Falacia de afirmar el consecuente: hallar evidencia estadística acorde con una teoría no prueba
que la teoría es cierta.
Restringir su uso a los estudios experimentales; apelar al análisis exploratorio de datos; utilizar
métodos de análisis visual de datos; emplear límites de confianza; calcular y tomar en cuenta el
poder de la prueba; estimar la magnitud del efecto; recurrir al meta-análisis; utilizar métodos
robustos de estimación y contraste de hipótesis; acudir a técnicas de remuestreo; valerse de
métodos bayesianos.
Metodológicas
P: probabilidad de rechazar Ho
Prep: indica la probabilidad a largo plazo de que una replicación exacta de la investigación apoye
la disposición original.
- Descartar el uso de la hipótesis nula como sinónimo de una relación nula de toda nulidad
(la hipótesis nihilista); en todos los casos el investigador debe estimar a priori, pero con
fundamento, cual es el efecto esperable por azar y, claro está, cual por acción de las VI’s.
- Efectuar el AF que mejor muestre las características de las variables en cuestión, de
modo que se minimice el número de supuestos necesarios y se verifiquen todos aquellos
que resultan imprescindibles.
- Realizar el contraste de hipótesis tradicional, cuidando la representatividad y tamaño
de la muestra, teniendo en cuenta lo que ciertamente significa rechazar o aceptar las
hipótesis en juego.
- Calcular el poder de la prueba y la magnitud del efecto, así como la Prep.
Intervalo de confianza
Conjunto de valores, con un límite inferior y uno superior, que con una determinada confianza
se espera que contenga el valor del parámetro de interés en una población especifica. El
resultado puntual obtenido pudo ser uno presente en las diferentes muestras que se hubiera
podido tomar. El grado de confianza se refiere a la probabilidad de que al aplicar repetidamente
el procedimiento, el intervalo contenga el parámetro.
La confianza del intervalo debe ser entendida como la fracción de intervalos calculados a partir
de una gran serie de muestras de tamaño idéntico que contienen el valor verdadero del
parámetro poblacional.
La precisión esta en relación con el tamaño muestral y con la variabilidad de los datos,
representados en las desviaciones estándar.
La amplitud del IC depende del error estándar de la estimación que puede haber sido influida
por el tamaño muestral y por lo tanto tiene implicación clínica relevante. Los extremos del IC
proporcionan la verdadera significancia en el campo clínico cotidiano.
Los IC no son más que la suma y resta de dos errores típicos al valor agregado.
Potencia estadística, sensibilidad y tamaño de efecto: ¿un nuevo canon para la investigación?
Ho: es aquella según la cual los promedios no son estadísticamente diferentes (la intuición inicial
de los investigadores no se ve respaldada por los datos).
H1: es aquella según la cual si hay diferencias estadísticamente significativas entre los promedios
de los grupos comparados (la que la razón a los investigadores).
*las pruebas que emplean la t de student se utilizan para contrastar los promedios de dos grupos.
Las pruebas ANOVA se utilizan para comparar los promedios de tres o más grupos.
Error tipo I es el más grave y peligroso en cualquier investigación cuantitativa y por tanto el que
mayor atención recibe y el que más se controla.
Error tipo II es el error que se comete cuando se acepta una Ho que en realidad es falsa, se puede
cometer por distintas razones, una de ellas es un tamaño muestral bajo (cuando d es bajo, para
detectar estadísticamente las diferencias se necesita un tamaño muestral más alto, o de lo
contrario es posible que las diferencias existentes entre las poblaciones pasen desapercibidas).
La potencia es igual a 1-B, el nivel ideal de potencia debiera ser siempre igual o superior a 1 –
0.2, es decir, 0.8. Es una escala que va de 0 a 1.
El valor de alpha lo determina el investigador. La potencia deseada va a ser siempre 0.8 o más y
el tamaño de efecto lo podemos ingresar recurriendo a las tablas de Cohen.
La potencia es una convención. Un término matemático que permite abordar ciertas cuestiones
estadísticas a partir de grados de mayor o menor probabilidad, y como tal descansa sobre ciertos
supuestos y es en más de alguna medida arbitrario.
Cuando comparamos dos medias nos suele interesar responder a estas tres preguntas:
PAG 63 – 64
Completar el contraste de medias con el cálculo del tamaño del efecto nos permite:
Desviación típica…
PAG 69
Valoración de la magnitud del tamaño del efecto: 0.20 pequeño; 0.350 moderado; 0.80 grande.
PAG 71
Para valorar la magnitud de una diferencia en términos del tamaño del efecto disponemos al
menos de tres tipos de criterios (compatibles entre sí):
El tamaño del efecto es un dato sobre la magnitud de la diferencia independiente del número
de sujetos, y no sobre la seguridad con que afirmamos la diferencia y es importante al menos
para cuantificar cambios, hacer comparaciones o para resumir resultados.
- Los efectos grandes si lis hay, se pueden detectar en muestras relativamente pequeñas;
en torno a los 25 sujetos.
- Los efectos moderados pueden detectarse en muestras de entre 50 a 100 sujetos.
- Para detectar efectos pequeños hacen falta muestras mayores, cercanas a los 500
sujetos.
La fórmula básica del tamaño del efecto es la diferencia entre dos medias dividida por una
desviación típica.
Muestras relacionadas: pre y post-test sin grupo de control: al comparar las medias del pre y
post test se divide la diferencia por la desviación típica del post-test.
PAG 90 RESUMEN
El tamaño del efecto nos dice cuanto de la VD se puede controlar, predecir o explicar por la VI o
en qué grado la Ho es falsa. Nos permite hablar de magnitudes, de diferencias grandes o
pequeñas y consiguientemente de la relevancia de la diferencia encontrada.
Se trata en definitiva de llegar a una métrica común que facilite la interpretación y la integración
de resultados. Es importante completar el contraste de medias con el calculo del tamaño del
efecto porque nos permite:
- Interpretar mejor una diferencia estadísticamente significativa (e incluso una diferencia
no sig, que también puede tener su interés).
- Establecer comparaciones entre diferencias que proceden de pares de grupos de
tamaño muy distinto.
- Hacer síntesis claras e interpretables que proceden de estudios distintos.
*Homocedasticidad:
Diagrama de tallo y hojas – permite observar al conjunto de datos como un todo y destacar
algunas características (simetría del conjunto de datos; variabilidad de los datos; presencia o no
de outliers; concentración de los datos; brechas en el conjunto de datos).
El análisis inferencial trata de estimar a partir de los estadísticos obtenidos de la muestra, los
parámetros de la población, según un determinado modelo o distribución supuesto para ella.
Suele ser de tipo confirmatorio, es decir, trata de evaluar una hipótesis de partida mas que
meramente estimar el valor de unos determinados parámetros; intenta comprobar si se cumple
nuestra hipótesis según el modelo propuesto.
Fase exploratoria
Un investigador debería obtener la máxima información de una variable antes de utilizar los
datos para poner a prueba las hipótesis, en la inferencia estadística, y asi poder enriquecer la
teoría subyacente bajo estudio.
Según Hartwig y Dearing cabe desarrollar dos principios básicos que guían a todo investigador
que siga la perspectiva del AED: el escepticismo y una actitud abierta
- Estadísticos resistentes
Un estadístico es resistente cuando el valor de este no se halla apenas afectado por cambios
arbitrarios en una pequeña parte del conjunto de datos; no se halla apenas afectado por un
pequeño numero de puntuaciones extremas o por cierto numero de errores de rondeo,
truncado o agrupamiento (puntuaciones atipicas). Los métodos resistentes prestan mucha
atención al cuerpo de los datos y poco a las puntuaciones extremas, de modo que puedan
‘’resistir’’ pequeñas alteraciones de los datos. La media y la varianza muestrales no pueden ser
consideradas como tales, una sola puntuación extrema puede afectarlas a ambas.
- Datos residuales
Los datos residuales son los datos que tras la aplicación del modelo no encajan en el mismo. El
AED mantiene estos datos para avisar de aspectos sistemáticos importantes de los datos que
puedan necesitar de atención tales como la curvatura, no aditividad y no constancia de la
variabilidad. Se emplea para detectar inadecuaciones de los modelos teóricos puestos a prueba,
en los que habitualmente se supone que los residuales son meramente error aleatorio, sin
ningún tipo de sistematismo.
- Transformación de datos
Se refiere al cambio en la medida de la escala de la variable objeto de estudio, para adecuar los
datos a los supuestos de los modelos paramétricos. Ej: para realizar un análisis de varianza
(ANOVA) los datos deben seguir la distribución normal…la transformación de los datos va
referida a que el investigador pueda analizar los datos a través de la utilización de otra escala
que pueda simplificar el análisis de datos. Se trata de considera si la escala original de medida
es satisfactoria; en el caso de que no lo sea, la transformación de datos en otra escala puede dar
lugar a la deseada simetría de la distribución…
- Revelación
Importancia de las representaciones gráficas. Estructura de los datos. Sirven para la búsqueda y
exploración de características y como una vía de comunicar información a audiencia no técnica.
La media se ve afectada por todos los datos. La desviación típica también se ve afectada por la
asimetría.
Estimador robusto: funciona bien para varios tipos distintos de distribuciones teóricas, aunque
pueda no ser el mejor estimador disponible para ningún tipo concreto de distribución. Se refiere
a la insensibilidad de un estimador a violar los supuestos subyacentes bajo un modelo
probabilístico o distribución teórica. La media y varianza no lo son. Son métodos paramétricos.
Son aquellos que no se ven (o solo ligeramente) influidos por pequeños cambios en los datos.
Datos anómalos: aquella observación que parece ser inconsistente con el resto de los valores de
la serie, en relación con el modelo supuesto.
__
El primer pilar del proceso de investigacion es el diseño, que puede definirse como un plan que
proporciona una estructura para integrar todos los elementos de un estudio empirico de modo
que los resultados sea creibles, libres de sesgo y generalizables. Dos tipos de validez determinan
la calidad de la aplicacion del diseño: la interna (capacidad de controlar el efecto de terceras
variables que pueden ser causadas alternativas a la causa investigada) y la externa (capacidad
de generalizar los resultados a otros participantes a otros contextos y a otros momentos
temporales)
META ANALISIS
CRITERIOS: Identificar los diseños de los estudios admisibles para el meta análisis; definir los
tipos de programas, tratamientos o intervenciones que se pretenden investigar; definir las
características de los participantes en los estudios; determinar los datos estadísticos que deben
aportar los estudios para poder calcular los tamaños del efecto y; identificar como han de venir
medidas las variables de estudios (ej: escalas psicológicas, pruebas de rendimiento debidamente
baremadas, medidas de autoinforme, etc.). idioma y rango temporal que se pretende examinar.
Elaborar un manual de codificación en el que se hagan explicitos los criterios mediante los cuales
se van a codificar las características de los estudios. La razón de examinar dichas características
no es otra que comprobar qué características de los estudios pueden estar moderando o
afectando a los resultados. Existen dos enfoques para la medición de la calidad, el que se centra
en el análisis de componentes individuales de calidad (consiste en identificar dimensiones
especificas que hagan referencia a algún aspecto de la calidad metodológica…PAG 26 SESGOS)
y el que aplica escalas de calidad ().
El tamaño del efecto es un índice estadístico que mide el grado en que existe el fenómeno que
se esta investifando en cada estudio y no se deja afectar por el tamaño muestral, como ocurre
con las pruebas de significación estadística. Los índices del tamaño del efecto mas utilizados en
los meta análisis son: a) la familia d, especialmente indicada para estudios que aplican diseños
de dos grupos y el resultado se mide de forma continua, y que consuste en calcular la diferencia
entre las medias de los dos grupos y, opcionalmente, dividirla por la desviación típica conkinta
de ambos grupos; b) la familia r, especialmente indicada para estudios correlacionales, que se
basa en la obtención de un coeficiente de correlacion, y c) la familia de índices de riesgo, que
esta indicada para estudios de dos grupos en los que la variable de respuesta es dicotómica.
Calculo del tamaño del efecto medio con su IC y valoración de su significación estadístico;
análisis de la heterogeneidad de los tamaños del efecto y; si los tamaños del efecto son
heterogéneos, búsqueda de variables moderadoras de tal variabilidad. Cuanto mayor es el
tamaño muestral de un estudio, tanto mayor es su precisión…