Criterios para Seleccionar Una Prueba Estadística

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 9

Criterios para seleccionar una prueba estadstica

Una investigacin bien planificada debe incluir en su diseo referencias precisas acerca de las tcnicas estadsticas que se utilizan en el anlisis de los datos. El anlisis estadstico es el procedimiento objetivo por medio del cual se puede aceptar o rechazar un conjunto de datos como confirmatorios de una hiptesis, conocido el riesgo que se corre -en funcin de la probabilidad- al tomar tal decisin. En las ltimas dcadas, el desarrollo de las pruebas estadsticas se ha incrementado a tal grado que en la actualidad se cuenta con varias pruebas alternativas, las cuales se pueden usar para casi todo diseo experimental, de modo que el investigador se encuentra ante el dilema de seleccionar la ms apropiada y econmica, para las preguntas que, mediante la investigacin, desea contestar. Ante esa situacin, es necesario tener una base racional, por medio de la cual se seleccione la prueba ms apropiada. Esta seleccin constituye el punto crtico del anlisis estadstico. En la seleccin de una prueba estadstica, se deben aplicar los criterios siguientes: a. b. c. d. e. Tipo de escala. Hiptesis. Potencia y eficiencia de la prueba. Caractersticas muestrales. Tendencia rectilnea o curvilnea del fenmeno.

Tipo de escala.
En las observaciones de una investigacin se puede dar una medicin que en este campo consiste en asignar nmeros a objetos y eventos de acuerdo con reglas de la lgica aceptables. El sistema numrico es una creacin altamente lgica, que ofrece mltiples posibilidades, para manifestaciones tambin de carcter lgico. Si se puede, de manera legtima, asignar nmeros al describir caractersticas, objetos y eventos, ser factible operar con ellos en todos sus modos permisibles y, de esas operaciones, derivar conclusiones aplicables a los fenmenos observados y medidos. Entonces, se justifica describir cosas reales por medio de nmeros, siempre y cuando exista un grado de isomorfismo (semejanza de propiedades) entre las cosas reales y el sistema numrico, es decir, ciertas propiedades de los nmeros deben tener paralelismo con los fenmenos observados, para que confiadamente se pueda asignar los nmeros. Tres propiedades fundamentales de los nmeros permiten su aplicacin en el campo de la investigacin cientfica: identidad, ordinalidad y aditividad.

Identidad. Cada nmero slo es igual a s mismo, de manera que ningn otro es igual a l, es decir, posee identidad y, por lo tanto, a cualquier objeto o evento diferenciable de los dems, que tenga identidad, se le podr aplicar un nmero. Este carcter de identidad de los nmeros de origen a la escala nominal, que es un mtodo para identificar cualitativamente los distintos objetos y eventos, y resulta obvio que no se le puede dar ningn significado cuantitativo, por ejemplo: si en un modelo experimental se cuenta una serie de clases, en las cuales se consignan sus frecuencias, stas revelan un conjunto de cada clase. Grupo de 200 nios con y sin estrabismo.

Bajo el contexto de la tabla anterior, una muestra de 200 individuos en edad infantil se ha clasificado en dos grupos por sexo (masculino y femenino) y por la presencia o ausencia de estrabismo. Como punto de partida, la operacin de escalamiento consiste en que, a partir de una clase dada, se forman subclases que se excluyen mutuamente. La nica relacin implicada es la de equivalencia, esto es, los miembros de cualquier subclase deben ser equivalentes en la propiedad de medida. A su vez, la relacin de equivalencia es reflexiva, simtrica y transitiva. Por otro lado, las frecuencias informan de conjuntos de nios o serie de clases con una categora e identidad, que dan una medida de las observaciones y son los valores sujetos a operaciones aritmticas. En estas condiciones, se puede contrastar hiptesis de la distribucin de los casos, mediante la aplicacin de pruebas estadsticas no paramtricas del tipo de prueba binomial, ji cuadrada y McNemar. Todas estas pruebas son apropiadas para datos nominales, pues revelan las frecuencias en las categoras, es decir, en datos enumerativos.

Ordinalidad. Adems de contar con la propiedad de identidad, las pruebas tambin tienen un orden o rango siempre mayor que otro, el cual le precede en un continuum ascendente. Los objetos y eventos susceptibles de un ordenamiento a lo largo de un continuum tienen una escala ordinal. Las escalas ordinales se emplean frecuentemente en la investigacin clnica, en la que el refinamiento cuantitativo a veces no es posible; por ejemplo: cuando se clasifica una respuesta en pacientes bajo los trminos sin cambio, mejorado, curado, esto indica un rango de orden y clasificacin.

En conclusin, cabe establecer que mientras las escalas nominales slo clasifican, las ordinales clasifican y ordenan, de manera que dan como resultado una serie de clases y categoras mutuamente exclusivas, llamadas rangos.

Aditividad. Es importante comprender que los nmeros tienen propiedad aditiva, lo cual quiere decir que la suma de un nmero con otro debe dar un tercer nmero nico. Esta propiedad de los nmeros no slo identifica y ordena, sino adems puede sujetarse a todas las operaciones aritmticas de los nmeros. Las conclusiones de tales operaciones son vlidas para las observaciones y dan lugar a la denominada escala de intervalo. De las mediciones que en el terreno de la investigacin se hayan realizado, puede inferirse que el tipo de escala (nominal, ordinal e intervalo), de modo que ste es el primer paso para elegir un procedimiento estadstico: la prueba paramtrica y la no paramtrica. Mediciones, variables y escala para la eleccin de la prueba estadstica.

Hiptesis.
La declaracin de la hiptesis alterna (Ha) que se desea analizar debe ser precisa, tan completa como resulte posible, pues se trata de la aseveracin operacional de la hiptesis de investigacin por el experimentador. Debe precisar la direccin que se espera o la ausencia de direccin. Este ltimo punto es fundamental para decidir si la prueba estadstica por elegir ser de una o dos colas. Conjuntamente al proceso anterior, se declara la hiptesis nula (Ho), en la cual simplemente se establece la ausencia de diferencia y se declara, pare percibir con claridad, que la hiptesis se ajusta a la prueba estadstica. Esto significa que al analizar un conjunto de observaciones, stas deben sujetarse a un ensayo de hiptesis nula, condicin en la que se basan todas las pruebas estadsticas. El investigador, al contrastar hiptesis de diferencias y/o correlacin, lo establece en funcin de una hiptesis alterna (Ha) -punto fundamental de la experimentacin-, en contra de la hiptesis nula (Ho). Para decidirse por una o por la otra, debe proponerse un razonable nivel de significancia, desde antes de aplicar la prueba estadstica. El nivel de significancia o significacin corresponde al lmite de confianza, del riesgo de error, que enjuicia el investigador para aceptar su Ha como verdadera. De manera universal y arbitraria, dicho nivel se ha fijado en 0.05 y 0.01 de error y en 0.95 y 0.99 de certeza para aceptar hiptesis en el rea psicolgica, por que se espera un 5% de variacin en las mediciones.

En la teora contempornea de la decisin estadstica, se han tratado de rechazar los procedimientos que implican adhesin al nivel de significancia comentados, y se favorece el uso de procedimientos en los que las decisiones se toman en trminos de funcin de prdida, utilizando principios de minimax; sin embargo, aunque parece conveniente esta tcnica, las posibilidades de aplicacin prctica son dudosas en gran parte, en la investigacin psicolgica. Contrariamente a lo anterior, tambin se debe establecer la zona de rechazo, la cual corresponde al lmite de confianza, en que el investigador rechaza la hiptesis alterna y acepta la hiptesis nula. Bajo los trminos expresados, el investigador debe ser meticuloso al elegir la prueba estadstica y al plantear la hiptesis, el nivel de significancia y la zona de rechazo, en virtud de que es factible cometer dos errores graves en la decisin estadstica: a. Error del tipo I. Rechazar la hiptesis nula (Ho), siendo verdadera. b. Error del tipo II. Aceptar la hiptesis nula (Ho), siendo falsa. Debe quedar claro que en cualquier inferencia estadstica existe el peligro de cometer cualquiera de los errores mencionados y que el investigador equilibre en un nivel ptimo las propiedades de incurrir en uno u otro tipo de error. La probabilidad de cometer un error del tipo I est dada por (alfa), de manera que cuanto mayor sea alfa, ms probable ser que Ho se rechace, siendo verdadera; a su vez, el error de tipo II est representado por (beta). La siguiente figura muestra una escala de falso a verdadero, donde cero es falso y el valor uno verdadero. Entre el 0 y el 1 existen valores intermedios, mientras que donde marca 0.95 existe una diferencia de 0.05 con respecto a 1. Este lmite corresponde al nivel de significancia o error alfa, donde todo valor igual o meno que 0.05 se acepta Ha. Por lo tanto, 1 - alfa = beta. Se dice que en esta circunstancia, el investigador elige una cola en la decisin estadstica. Por otra parte, cuando adems de imponer un valor de alfa razonablemente pequeo para aceptar Ha, tambin define un valor de beta para aceptar Ho, elige dos colas. De no decidir entre una u otra

Escala de probabilidad.

hiptesis, el investigador se plantea la alternativa de aumentar el tamao de la muestra, para que el fenmeno se define con ms claridad y la decisin en el contraste de la hiptesis sea ms consistente.

Eficiencia de la prueba.
La validez del anlisis estadstico depende mucho de la eficacia de la prueba estadstica empleada. Se acepta que una prueba estadstica es eficaz cuando tiene una probabilidad muy pequea de rechazar una hiptesis verdadera, y una alta probabilidad de rechazar la hiptesis cuando sta es falsa. En presencia de dos pruebas estadsticas, cuya probabilidad de rechazar hiptesis falsas sea igual, la seleccin en principio debe inclinarse hacia la prueba que tenga la mayor probabilidad de aceptar la hiptesis cuando es verdadera. La pruebas estadsticas se dividen en dos grandes grupos: paramtricas y no paramtricas. Las primeras son aquellas cuyo modelo especifica ciertas condiciones o premisas que debe tener la poblacin, de la cual se ha derivado la muestra bajo anlisis; adems se requiere expresar las observaciones en escala de intervalo o tasa. Por otra parte, las pruebas no paramtricas, como su nombre lo indica, no requieren satisfacer esas condiciones o premisas.

Las pruebas paramtricas son las ms eficaces y de uso comn en la investigacin, como las de comparacin de promedios o prueba t de Student y la de anlisis de varianza de Fischer. Ambos procedimientos deben cumplir las premisas siguientes: a. Las observaciones deben ser independientes. Al seleccionar un caso, para incluirlo en la muestra, no se deben prejuiciar las probabilidades de seleccin de ningn otro caso de la poblacin, asimismo, la puntuacin que se d a una observacin no debe prejuiciar a ninguna otra. b. Las poblaciones deben provenir de universos cuya distribucin siga una curva normal. c. Las poblaciones deben tener la misma varianza, aunque en casos especiales es suficiente con saber la tasa de sus varianzas. d. Las variables consideradas en el estudio deben ser medidas por lo menos en escala de intervalo, para que sea posible hacer operaciones aritmticas. Cuando por cualquier razn no se puedan cumplir los requisitos de las pruebas paramtricas, el investigador podr recurrir a las llamadas pruebas alternas, como la prueba t de Student-Welch, la F asimilada de Cochran y la F de Tukey. En ellas no hay exigencia de homogeneidad de varianzas y, auxiliadas por un modelo matemtico de ajuste, se puede obtener una eficacia que es muy cercana a la de las pruebas t de Student y de anlisis de varianza. Cabe sealar que, conforme menos condiciones o presunciones exige una prueba estadstica, en que se basa su modelo matemtico, ms generales son sus conclusiones derivadas de su aplicacin; sin embargo, tambin es menos eficaz para rechazar la influencia del azar, cuando ste no desempea un papel importante. Cuando las observaciones en escala de intervalo no se ajustan a las premisas de las pruebas paramtricas, el investigador debe estimar la prdida de eficacia para decidir utilizar los procedimientos no paramtricos, y transformar aquellas en escalas nominales u ordinales.

Caractersticas muestrales.
La manera en que influye la muestra para elegir una prueba estadstica est en funcin de su tamao, seleccin y distribucin en el diseo experimental.

Tamao de la muestra. Anteriormente se habl de que la eficacia de una prueba estadstica disminuye cuando se reducen las condiciones o premisas del modelo; sin embargo, a medida que aumenta el tamao de la muestra, se incrementa tambin la eficacia. Dicha aseveracin generalmente es verdadera para muestras de tamao definido, pero pueden carecer de veracidad al compararse dos pruebas estadsticas con muestras de tamaos diferentes, es decir, si con un tamao de 30 por cada grupo, una prueba A puede ser ms eficaz que la prueba B; en cambio, la prueba B es ms

eficaz que A cuando sta slo cuenta con un tamao de muestra igual a 20. En otras palabras, se puede evitar escoger entre potencias y generalizacin, para lo cual se selecciona una prueba estadstica que tenga amplia generalizacin, y luego aumentar su eficacia, comparable a la prueba ms til, incrementando el tamao de la muestra. Seleccin de la muestra. Las muestras por analizar pueden ser independientes y dependientes o relacionadas. Muestras independientes. Son aquellas cuyo universo de poblacin resulta diferente, lo cual no quiere decir que provengan de reas desconocidas, sino que, en trminos de estadstica, la fenomenologa estudiada puede ser consecuencia de variables distintas y que, por cada variable existente, hay un universo finito o infinito; por ejemplo, en la Tierra hay un nmero finito de seres humanos, pero la variable sexo divide en dos universos diferentes: hombres y mujeres. En el mismo sentido, el estado civil define otros universos distintos, solteros, casados, divorciados, viudos, etc. De esta manera, se pueden enumerar mltiples variables, que dan lugar a una infinidad de universos muestrales, de donde es factible elegir muestras independientes. o Muestras dependientes o relacionadas. Se refieren a las provenientes de un universo muestral, a las que se aplicar un plan experimental, mediante el cual se espera un cambio, que obligadamente exige un punto de referencia de no cambio. Para esta condicin, el mismo grupo experimental sirve como control o testigo, en el momento previo al tratamiento. De esta manera, en el anlisis de las observaciones existen dos perodos: antes y despus del tratamiento. Distribucin de la muestra en el diseo experimental. En los diseos experimentales, el nmero de muestras con que est elaborado el modelo de investigacin tiene singular valor para elegir la prueba estadstica, pues las conclusiones a que se llegue al no aplicar la prueba adecuada darn lugar a falsas interpretaciones del experimento. En los modelos de investigacin, se puede contar con una, dos o muchas muestras. Asimismo, puede tratarse de muestras independientes o dependientes o relacionadas. Estas caractersticas dan un atributo al diseo experimental, que obliga a analizar los datos de manera diferente, acorde con el modelo estadstico que mejor se ajuste a contestar las preguntas planteadas por la hiptesis. Para saber si los pacientes han alcanzado una total remisin de la enfermedad, se atiende a los hallazgos de tiempo de sobrevida y a las alteraciones clnicas de la patologa. Si cuenta con varios tratamientos, se plantea la pregunta de cul de ellos ha sido ms efectivo. As, se puede decir que una investigacin cuanta con subclases diferentes. Para analizar sus observaciones y tomar una decisin de la efectividad de los tratamientos, se pueden elegir las pruebas estadsticas diseadas para contrastar una hiptesis y para una muestra. Un ejemplo vlido es el de un investigador que trabaja con roedores, para estudiar las caractersticas conductuales de agresividad y la concentracin de
o

neurotrasmisores en el sistema nervioso central. El conjunto de la muestra est constituido por cobayos, ratas y ratones, que representan grupos con tres gradientes de agresividad. En estas condiciones, el diseo experimental tiene tres muestras independientes. La eleccin de la prueba estadstica se basar en las dos caractersticas y en el tipo de escala de las mediciones. En el supuesto de que las concentraciones de neurotrasmisores tenga una medicin cuantitativa, una variable continua, una escala de intervalo y una distribucin normal, con varianzas homogneas, la eleccin ms adecuada ser el anlisis de varianzas de Fischer de una entrada. Si la decisin del investigador fuera utilizar la prueba t de Student, diseada para dos muestras, cometera tres errores graves: a) prdida de tiempo, b) las comparaciones seran mltiples, tantas como combinaciones existan (cobayos con ratas, cobayos con ratones y ratas con ratones), c) el ms trascendente, desde el punto de vista de la decisin estadstica: las conclusiones a que se llegue no sern consecuencia de comparaciones independientes, sino resultarn aisladas y en pequeos pares de grupos de contraste. Es decir, si el investigador supone de antemano que entre los grupos existe variacin en el grado de agresividad, perder la informacin que la variacin entre y dentro de grupos le demuestre la existencia de una diferencia verdadera, al no incluir simultneamente a los tres grupos. El ejemplo descrito permite comprender que cuando se analizan simultneamente diversos grupos de muestras, las variaciones manifestadas entre los grupos de estudio dan lugar a una diferenciacin falsa o verdadera. Los contrastes parciales que se verifiquen llevan el ttulo de independientes, porque se supone una simultnea variacin o discordancia entre los grupos. As, se dice que, en estas condiciones, el modelo experimental conserva ortogonalidad. A veces, debido al diseo creado por el investigador, se proponen comparaciones con un modelo de referencia, en el cual se supone la no existencia de modificaciones con respecto a la aplicacin de tratamientos o variables. Estos grupos, tambin denominados control o testigo, servirn de lnea base para medir los cambios que pudieran presentarse en los otros grupos. De esta manera, la magnitud del cambio ser dependiente de lo que suceda en el control. Este tipo de diseo experimental, debido a las comparaciones dependientes, ha perdido ortogonalidad. (Con mediciones de intervalo, se tiene la prueba de Tukey.)

Tendencia rectilnea o curvilnea del fenmeno.


Cuando la hiptesis resulta probar la asociacin o correlacin de variables, es importante conocer la linealidad del fenmeno. Si es rectilneo y tiene una escala de intervalo, la aplicacin del coeficiente de correlacin de Pearson parece adecuada; pero si este mismo procedimiento se aplica a un fenmeno curvilneo -an cuando exista una verdadera asociacin-, dar lugar a aceptar hiptesis de no asociacin.

Un fenmeno curvilneo puede tornarse en rectilneo, mediante transformaciones matemticas (logaritmos, funcin recproca, seno, coseno, etc.) y as aplicar la correlacin de Pearson. Si se desconoce la linealidad, se deber utilizar la prueba de anlisis de covarianza para determinar la funcin matemtica ms acorde con el fenmeno estudiado.

También podría gustarte