2do Parcial Estadistica

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 14

2° Parcial de EstadIística

UNIDAD 4: MODELOS MATEMÁTICOS DE VARIABLES PSICOLÓGICAS

1) Explique qué y para qué sirve un modelo de variable, cómo se denominan las frecuencias relativas en el
modelo y cuáles son las propiedades de la misma.

Un modelo es una construcción teórica, una presentación simplificada de la realidad que:

posibilita una mejor comprensión de esta,


facilita su análisis e interpretación,
permite formular conclusiones y realizar predicciones.

Contar con un modelo para una variable le permite al estadístico deducir conclusiones que luego confrontará con la
realidad observada.

Podemos definir que: Un modelo para una variable es una distribución de frecuencias relativas teóricas. Estas
frecuencias relativas NO se fundamentan en la observación directa, sino que son postuladas.

Las fr en el modelo se llaman probabilidades. Por esto se dice que un modelo para una variable es una distribución de
probabilidades.

La probabilidad de un valor de la variable tiene las propiedades de la fr, es decir, es una cantidad no negativa y la suma
de las probabilidades es uno.

Ejemplos de 2 modelos de distribución de probabilidades (sobre la ansiedad)

ANSIEDAD PROBABILIDAD
Significado de estas probabilidades: En el modelo 1,
2) ANSIEDAD PROBABILIDAD
4 0,05 4 0,10 para una muestra elegida al azar de una población,
3 0,25 3 0,40 se espera que el 40 % de los individuos de la
2 0,40 2 0,30 muestra tenga un puntaje en ansiedad igual a 2.
1 0,25 1 0,15 El valor 3 de la ansiedad tiene una probabilidad de
0 0,05 0 0,05 0,25. Esto significa que en una muestra al azar el
Desarrolle el concepto de 25% de las personas tiene un puntaje 3 de ansiedad
distribución de probabilidades de una variable. ¿Para qué
requiere el estadístico contar con un modelo teórico de una variable?

Poner lo de arriba.

3) ¿Qué es una variable Bernoulli? Indique qué valores toma y con qué probabilidades.

Es una variable que puede tomar sólo dos valores. A uno de los valores se lo denomina ‘éxito’ y al otro ‘fracaso’.

Ej. horario preferido por los alumnos de psicología, sus valores son tarde o noche. A uno de estos valores hay que
denominarlo como éxito y al otro como fracaso.

La letra p indica la probabilidad del éxito. Esta probabilidad es un numero entre 0 y 1 (la fr asignada al éxito). El fracaso
tiene una fr de 1 – p.

Valores de la variable Probabilidades


Éxito P P es el parámetro de la variable Bernoulli
Fracaso 1–p

Ej. del libro: supongamos que el 65% de los alumnos prefiere estudiar de tarde y el 35% restante de noche. La variable
que toma el valor “éxito” si el alumno prefiere estudiar de tarde y de fracaso en el caso contrario, es Bernoulli de
parámetro p = 0,65. Con la variable de Bernoulli se puede reconocer una variable, su éxito y probabilidad.

1
4) Dada la variable "Condición laboral" con sus valores Trabaja - No trabaja, ¿a qué modelo de variable responde? Si
para una muestra de n individuos se cuenta el número de ellos que trabajan, ¿qué modelo de variable sería adecuado
para estudiar la variable que se generaría? Explique qué condiciones deben darse para ello.

La variable “condición laboral” es Bernoulli porque solo puede tomar dos valores: trabaja y no trabaja. Para estudiar en
una muestra de n individuos el numero de quienes trabajan, el modelo adecuado seria es de variable binomial.

(las condiciones de la variable binomial las pongo después).

5) ¿Qué expresa a través de sus valores la variable binomial? ¿Qué parámetros intervienen en la fórmula que
asigna probabilidad a sus valores y qué significan dichos parámetros?

Variable binomial: cuenta la cantidad de éxitos en n observaciones de una variable Bernoulli, si se verifican las dos
condiciones siguientes:

condición de estabilidad: la probabilidad de éxito, p, debe permanecer constante en las n observaciones de la


variable Bernoulli, y
condición de independencia: la probabilidad de obtener éxito en una observación no aumenta ni disminuye si se
conoce el resultado de otra observación.

n y p son los parámetros de la variable Binomial. p es la probabilidad del éxito y n es la cantidad de veces que se
observa la variable Bernoulli.

La variable binomial puede tomar cualquiera de los valores enteros comprendidos entre 0 y n. Por lo tanto, es una
variable cuantitativa discreta. Su recorrido consta de n+1 valores. (El recorrido es: 0, 1, 2, 3, ...n.)

POWER POINT  Cálculo de resúmenes estadísticos de una variable Binomial de parámetros n y p

1−2 p
Media: µ = n*p Varianza: σ2 = n*p*(1-p) Asimetría: α3 ¿
√ np (1− p )
5) ¿Qué relación hay entre una variable Bernoulli y una Binomial? Defina ambas.

Bernoulli es el modelo más simple de probabilidad. Se aplica a situaciones en las que un valor de una variable aparece
con probabilidad p (éxito) y otro con probabilidad 1- p (fracaso). Se aplica en variables que sólo admiten dos resultados
posibles (uno llamado éxito y el otro fracaso). Por ejemplo: Un tratamiento médico puede ser efectivo o
inefectivo. (Internet)

Situaciones en las que se observa repe-tidamente a una variable Bernoulli es en la variable binomial y normal.

- (DEFINIR A LAS DOS CON LO ANTERIOR)

6) ¿Bajo qué condiciones la cantidad de éxitos obtenidos al observar repetidamente una variable Bernoulli puede
suponerse que es una variable binomial?

(Creo que son las condiciones de la variable binomial)

7) ¿Cuál es la media y la varianza de la distribución normal estándar? ¿Cómo se relaciona esta distribución
con otras distribuciones normales?

En los modelos teóricos se pueden calcular medidas de tendencia central y de dispersión. Se usa la letra griega μ para
designar la media y la σ para el desvió estándar.

No se  la distribución normal es de gran importancia porque se la utiliza en variables cuantitativas continuas de


ocurrencia natural. Es un modelo útil en situaciones no anormales. Su importancia reside en sus propiedades
matemáticas que le dan a la estadística una base para la práctica, en su utilidad como aproximación a otras
distribuciones, en su relación con medias muestrales de cualquier distribución, y en su aplicación a muchas variables

2
aleatorias que se distribuyen de manera normal. La palabra “normal” hace referencia a un uso común. Los parámetros
de la variable Normal son µ (media poblacional) y σ (desvío poblacional).

Se la gráfica mediante la “curva normal” o “curva de gauss”

8)

Describa las características de la curva normal.

Según los valores de µ y σ tendremos una curva normal distinta. Pero todas ellas coinciden con algunas características

Tienen un único máximo para x = µ (ósea, un único pico o moda). Las distribuciones normales son unimodales.
Tienen 2 puntos de inflexión donde cambia la concavidad: uno en x= µ-σ (la curva pasa de ser cóncava hacia arriba
a cóncava hacia abajo) y otro en x= µ+σ (la curva pasa de cóncava hacia abajo a cóncava hacia arriba)
Se acercan asintóticamente al eje de abscisas, pero nunca llegan a tocarla.
Son simétricas respecto al eje vertical que pasa por la media.
La distribución normal es simétrica y unimodal, por lo tanto, coinciden media, mediana y moda.
El área debajo de la curva es 1 e indica la probabilidad de la totalidad de los valores. Bajo la curva normal están
comprendido el 100% de los casos.

9) ¿Qué efecto produce sobre la curva normal el cambio de valor del parámetro µ o del parámetro σ?

Estando fijo σ, variar µ desplaza toda la curva hacia la izquierda o derecha, según el valor de la variación.
Estando fijo µ, variar σ acerca o aleja de µ las abscisas de los puntos de inflexión. Si σ es menor hay menos
dispersión y si σ es mayor hay más dispersión. La altura de la curva decrece a medida que los valores de x se alejan
de la media (haciéndose mas improbables).

10) ¿Qué importancia tiene el modelo teórico de la distribución normal dentro de la práctica estadística?

(Creo que ya está)

11) Cómo se relaciona esta curva con las probabilidades asignadas a los conjuntos de valores de una variable normal?

¿?: entre las desviaciones típicas por izquierda y derecha se encuentra el 68,27% de probabilidad. Entre 2 desviaciones
típicas el 95,45% y entre 3 desviaciones típicas se encuentra el 99,74% de probabilidad.

12) ¿En qué consiste el procedimiento llamado "tipificación"? ¿Qué ventaja proporciona en el cálculo de las
probabilidades normales? COPIARTE

La distribución normal es una familia de distribuciones según muchos valores diferentes de µ y σ. Por eso es esencial
una simplificación para asignar probabilidades normales a varios valores de parámetros.

Esta simplificación es posible gracias a un procedimiento llamado tipificación. Geométricamente equivale a convertir la
escala básica de valores de x de modo que se mida en una escala patrón en la que corresponda el valor cero y en la que
la unidad de medida sea 1 desviación típica; es decir, se convierten las medidas a números expresados en desviaciones
típicas como unidades por encima o por debajo de la media.

CARPETA:
Histograma de área: a diferencia del anterior, su altura no es la frecuencia sino el
fr
área (f= b*h y h= ). Cuando los intervalos se achican, tienden a cero y obtengo
b
una curva normal o curva de Gauss.
-Cuanto mas me acerco a la media es mas probable que suceda ej. es mas
probable encontrar mujeres que midan 1,50 que 1,40
3
EJERCICIOS DE VARIABLE BINOMIAL (LIBRO)
Una encuesta estableció que el 62% de los alumnos de la facultad de psicología estan a favor de una propuesta del
centro de estudiantes. ¿Cuál es la probabilidad de encontrar 1, en una muestra de 8 estudiantes, que este en contra de
la propuesta?

La variable Bernoulli es “opinión sobre la propuesta”. Solo existen dos valores posibles: estar a favor (éxito) o estar en
contra (fracaso). La probabilidad de éxito es p = 0,62. Es binomial con p= 0,62 y n= 8.

La variable X: cantidad de estudiantes entre 8 que estan a favor de la propuesta.

Rta: P (X=7) = 0,1070  Encontrar un estudiante entre los 8 que estén en contra de la propuesta equivale a
encontrar 7 que estén a favor.

Un psicológico aplica un tratamiento a sus pacientes. El 80% de los pacientes se recuperaron. Si se seleccionan al azar 12
de estos pacientes para conformar una nueva muestra ¿Cuál es la probabilidad de encontrar 9 recuperados?

Variable X: cantidad de pacientes recuperados entre los 12 seleccionados. Es una variable binomial con n = 12 y p = 0,80.
La probabilidad de encontrar 9 recuperados es Rta: P(X=9) = 0,2363

Otra forma de resolver es considerar Y: cantidad de pacientes no recuperados entre 12 seleccionados. Si consideramos
éxito a la condición de no recuperado, la probabilidad de éxito es de p = 0,20 y n = 12 Rta: P(Y=3) = 0,2353

EJERCICIOS DE LA GUÍA
EJERCICIO 2: Estudios realizados en Alemania indican que el 25% de la población padece un ligero miedo a que se rían
de ellos. Considere la variable “Cantidad de personas que padecen un ligero miedo a que se rían de ellas entre doce
elegidas al azar de la población alemana” y que el modelo binomial la explica convenientemente.
A. Construya una tabla. En la primera columna coloque los valores de la variable, en la segunda, la probabilidad
que le corresponde a cada valor y, en la tercera, las probabilidades acumuladas.
B. Utilice la tabla construida para calcular la probabilidad de encontrar en la muestra:
i. exactamente una persona que padezca un ligero miedo a que se rían de ella.
ii. a lo sumo dos personas que padezcan un ligero miedo a que se rían de ellas.
iii. más de una persona que padezca un ligero miedo a que se rían de ella.
iv. por lo menos dos personas que padezcan un ligero miedo a que se rían de ellas.
C. Obtenga la media y el desvío de la variable considerada.
D. Indique que tipo de asimetría presenta la variable y cuál es su moda

A) X= Cantidad de personas que padecen un ligero miedo a que se rían de ellas entre
doce elegidas al azar de la población alemana.

X ~ B (12; 0,25) n= 12 p= 0,25 X=1

B. i) P (X=11) = 0,12671 (esto sig. Que hay 1% de probabilidad que a una persona le pase esto)

ii) P (X ≤ 2) = 0,39068 (hay un 32% de prob. De que hayan 2 que les pase esto)

iii) P (X > 1) = P (X ≥ 2) = 0,84161

iv) P (X ≥ 2) = 0,84161

D) La distribución es asimétrica positiva. Las probabilidades mayores


C) µ = n*p σ = √ n∗p ( 1−p )
corresponden a los valores bajos de la variable y los valores altos son
µ = 12* 0,25 = 3 σ = √ 12∗0 , 25∗0 , 71
poco probables. El coeficiente de asimetría α3 = 0,3086, mayor que cero,
da cuenta de4 la presencia de asimetría positiva. Moda: X = 3
σ = √ 2 ,25 = 1,5

EJERCICIO 5 En un servicio de psicopatología, de un centro público de salud mental, se conoce que, la quinta parte de
los pacientes abandona el tratamiento antes de culminar el número de sesiones establecidas por el psicólogo. El
próximo mes iniciarán su tratamiento 30 pacientes elegidos al azar.
Mencione la variable Bernoulli presente en este ejercicio y defina la variable binomial en la que se basará para calcular
la probabilidad de:
a) …retener a todos los pacientes hasta la culminación de sus sesiones?
b) …que abandone, antes de cumplir con todas sus sesiones, alguno de esos pacientes?
c) …que cumpla con todas sus sesiones alguno de esos pacientes?
d) …que culmine con sus sesiones a lo sumo la tercera parte de los pacientes?

La variable Bernoulli: “Conducta de un paciente que se trata en el servicio de Psicopatología de un centro público de
salud mental” con valores ‘Abandona el tratamiento antes de culminar el número de sesiones establecidas por el
psicólogo’ / ‘No abandona el tratamiento antes de culminar el número de sesiones establecidas por el psicólogo’.

Si Éxito= ‘No abandona el tratamiento antes de culminar el número de sesiones establecidas por el psicólogo’, la
probabilidad de éxito es p=0.80. La variable X es binomial con parámetros n=30 y p=0.80

Variable X: “Cantidad de pacientes que no abandonan el tratamiento antes de culminar el número de sesiones
establecidas por el psicólogo entre 30 pacientes que iniciarán su tratamiento el próximo mes”

X~B (30; 0,80)

a) P (X=30) = 0,0012 b) Para b) una posibilidad es considerar la variable Y: “Cantidad de pacientes que abandonan el
tratamiento antes de culminar el número de sesiones establecidas por el psicólogo entre 30
c) P (X  1) = 1 pacientes que iniciarán su tratamiento el próximo mes”. Si Éxito= ‘Abandona el tratamiento antes
d) P (X ≤ 10) = 0 de culminar el número de sesiones establecidas por el psicólogo’, la probabilidad de éxito es
p=0.20. La variable Y es binomial con parámetros n=30 y p=0.20 b) P (Y  1) = 0,9988

EJERCICIOS SOBRE VARIABLE NORMAL


Los adultos mayores de la ciudad C tienen una media de 34 y un desvío estándar de 4 con respecto al estilo del Humor
Mejoramiento Personal. Suponga que los valores referidos a dicho estilo de Humor están normalmente distribuidos.
A) ¿Qué porcentaje de adultos mayores de la ciudad C presenta un puntaje en Mejoramiento Personal menor a 27?
B) ¿Qué porcentaje de adultos mayores de la ciudad C presenta un puntaje en Mejoramiento Personal mayor a 36?
C) ¿Qué porcentaje de adultos mayores de la ciudad C presenta un puntaje en Mejoramiento Personal entre 27 y 38?

X ~ N (34; 4)

Variable: puntaje en relación al estilo del Humor Mejoramiento Personal.

a) P (X < 27) = 0,0401  4% c) P (27 < X < 38)

b) P (X > 36) = 1 – P (X ≤ 36)  (porque todo vale 1) P (X ≤ 38) – P (X ≤ 27)


1 – 0,6915 = 0,3085  30,85% 0,08413 – 0,0401 = 0,8012  80,12%

La media y el desvío de las puntuaciones que los varones de la región B obtienen en el estilo del Humor Agresivo son 40
y 5 respectivamente. Suponga que estas puntuaciones están normalmente distribuidas.
A. ¿Cuál es la puntuación que supera al 20% de las puntuaciones?
B. ¿Cuál es la puntuación superada por el 30% de las puntuaciones?

A) P (X < Xb) = 0,20  X = 35,79

5
B) P (X > Xa) = 0,30  X = 42,62

P (X ≤ X) = 0,70  X = 35,79

EJERCICIOS DE LA GUÍA
EJERCICIO 2 Una escala de desarrollo intelectual da un cociente de inteligencia (CI) distribuido normalmente con media
μ = 100 y desvío estándar σ = 15. En la población para la cual se ha construido esta escala:
A. ¿Cuál es el porcentaje de sujetos con un CI
i. inferior a 64?
ii. superior a 110?
iii. superior a 70?
iv. comprendido entre 100 y 120?
v. entre 90 y 110?
B. ¿Cuál es el CI superado sólo por el 10% de la población?
C. ¿Cuáles son los límites de la interquintila central?

X= cociente de inteligencia X ~ N (100; 15)

A. i) P (X < 64) = 0,0082  0,8%

ii) P (X > 110) = 0,2524  25,24%

iii) P (X > 70) =0,977  97,7% de los sujetos tienen un CI superior a 70.

iv) P (100 < X < 120)


P (X < 120) – P (X < 100)
0,9087 – 0,5 = 0,4087  40,87%

v) P (90 < X < 110)


P (X < 110) – P (X < 90)
0,74751 – 0,25249 = 0,4950 2  49,5%

B. P (X > Xa) = 0,10 o P (X < Xa) = 0,9


Xa= 119,22  el CI = 119,22 es superado por el 10% de las observaciones poblacionales.

C. Los límites de la interquintila central son la segunda quintila c2 y la tercera quintila c3.
Como P (c2 < X ≤ c3) = 20 es P (X ≤ c2) = 0,40 y P (X ≤ c3) = 0,60. Para encontrar c2 y c3 se procede como en la parte b).

P (X < c2) = 0,40  c2= 96,20


P (X < c3) = 0,60  c3= 103,80

Rta: Los límites de la interquintila central son: c2 = 96,20 y c3 = 103,80

UNIDAD 5: EL INDIVIDUO Y EL GRUPO

Transformación afín es una transformación de los valores de una variable X en otros de una variable Y mediante una
función de la forma: Y = a + b.X

 Donde a y b son constantes, con b ≠ 0 (si b = 0 entonces Y = a, y todos los valores de X se transforman en a
perdiéndose la variabilidad)
 La variable X es, en este contexto, la puntuación en una prueba y a sus valores los llamamos puntuaciones brutas u
originales.
 La variable Y recibe el nombre de variable transformada por la transformación afín.

Propiedades

1. La media de las puntuaciones transformadas es igual a la transformada de la media de las puntuaciones originales
6
Y =a+b . X

2. La varianza de las puntuaciones transformadas es igual al cuadrado de b por la varianza de las puntuaciones
originales.

s 2Y = b2.s2X
3. La desviación estándar de las puntuaciones transformadas es igual al producto del valor absoluto de b por la
desviación estándar de las puntuaciones originales.
s y=|b|. sx
Ejemplo: Las puntuaciones en un test de Razonamiento Lógico de seis niños de séptimo grado de una escuela de la
C.A.B.A. fueron: 3, 6, 7, 8, 9 y 9.

a) Aplique las siguientes transformaciones afines a las puntuaciones originales


1) Y1=5+X 2) Y2=0+3*X 3) Y3=0-3*X 4) Y4=5+3*X

b) Calcule la media y el desvío de las puntuaciones originales, y de las puntuaciones


transformadas en a). Verifique que se cumplen las propiedades de la transformación
afín.

c) Transforme afínmente las puntuaciones originales en


otras con media 20 y desvió 3
Datos:
Para las puntuaciones originales: X =7 y sx= 2,2804
Para las puntuaciones transformadas: Y =20 y sy=3

---------------------------------------------------------------------------------------------------------------------------------------------------------------

 Puntaje bruto o directo: es el puntaje original  Xi


 Puntaje diferencial: es la puntuación directa menos la media  Xi - X
 Puntaje típico o Z: nos dice a cuantos desvíos de la media está un puntaje. Tiene media 0 y desviación estándar 1
Xi−X
- Puntaje Z muestral: puntuación diferencial dividida por la desviación típica 
Sx
Xi−µ
- Puntaje Z poblacional:
σ

1) ¿Qué se entiende por puntuaciones típicas (o estándar) y qué ventajas tienen sobre las puntuaciones brutas?
Las puntuaciones brutas no son comparables entre sí.
Las puntuaciones típicas permiten hacer comparaciones, llevando los resultados a una escala común. Son útiles para:
 Para hacer comparaciones entre unidades de distintos grupos. Es decir, podemos comparar mediante las puntuaciones
típicas, distintas observaciones de un mismo sujeto o de sujetos diferentes.
 Para hacer comparaciones entre observaciones de variables medidas de distinta forma o entre distintas variables. Esto
se debe a que las puntuaciones típicas son adimensionales. Por ejemplo, comparar un peso expresado en kilogramos
con otro expresado en gramos, o bien comparar la posición
relativa de un sujeto según su peso y altura.

Las puntuaciones típicas tienen indudables ventajas, pero tienen


el inconveniente de que algunas son negativas y tienen
decimales. Por esta razón hay otras puntuaciones que permitan
resolver estas dificultades. Algunos puntajes derivados a partir del
puntaje Z son:

7
1. Puntaje T definido por la transformación afín: T = 50 + 10. Z (la media es 50 y la desviación típica es 10). La ventaja
que ofrece da números no negativos y redondea las cifras decimales.
2. Puntaje CI (Cociente Intelectual) definido por la transformación afín: CI = 100 + 15. Z (con media 100 y desviación
típica 15)

2) ¿Con qué finalidad se tipifican las puntuaciones de los tests? ¿Qué información proporciona una puntuación z?
Tipificar un test es transformar las puntuaciones directas en otras que sean fácilmente interpretables ya que la
puntuación tipifica o Z nos revelará la posición del sujeto respecto al grupo, y nos permitirá hacer comparaciones (poner
lo de arriba).

3) ¿Qué características debe tener el grupo normativo para proporcionar una adecuada descripción estadística del
sujeto?
Para proporcionar una adecuada descripción estadística del sujeto, el grupo de sujetos denominado grupo normativo,
debe ser representativo de la población a la que va destinado el test y debe tener un tamaño adecuado, para dar
estimaciones seguras y dentro de los limites aceptables del error muestral. El grupo debe ser homogéneo (todos los
individuos sean miembro de la población objetivo)

4) Explique los conceptos de rango percentilar de un puntaje y percentil. Dé un ejemplo.


Rango Percentilar (Power point):
 indica la posición de un sujeto según el porcentaje de las puntuaciones del grupo de pertenencia que se encuentran
debajo de su puntuación.
 Muestra la posición del sujeto en el grupo según el porcentaje de puntuaciones que supera.

Ejemplo: RP 66 significa que el 66% de las observaciones estan por debajo del grupo, y el 44% estan por encima.

Percentil k
Sea k un rango percentilar (0  k  100). Se llama Percentil k (Pk) al valor de la variable (o promedio de valores) que
supera, a lo sumo, al k% de las observaciones y es superado, a lo sumo, por el (100-k)% de las observaciones.
EJEMPLOS: Si el sujeto con rango percentilar 70 obtuvo 8 puntos, decimos que el percentil 70 es 8 (P 70=8). El percentil 50
coincide con la mediana: P50=Mdn
Para el grupo de Malena: * en RL: P69,15=13 * en RV: P15,87=12 * en MV: P97,72=10

5) Para conseguir buenas normas de un test hay que realizar un estudio de tipificación ¿Cuáles son los pasos que
deben seguirse para dicho estudio?
1) identificar la población objetivo ej. todos los niños matriculados en cuarto grado de primaria.
2) especificar los estadísticos que se van calcular ej. media, desviaciones típicas, etc.
3) determinar la cantidad de error muestral tolerable para los estadísticos del apartado anterior.
4) diseño muestral, siguiendo alguna de las técnicas de muestreo probabilístico
5) fijar el tamaño muestral requerido para mantener el error dentro de los límites fijados. el tamaño dependerá de la
estrategia muestral utilizada.
6) extraer la muestra y recoger los datos, documentando los casos de no respuesta y las posibles causas
7) calcular los valores de los estadísticos en la muestra y sus errores típicos
8) identificar los tipos de puntuaciones normativas necesarias y preparar las tablas de conversión
9) preparar la documentación escrita sobre el proceso de tipificación del test y la guía para la interpretación de las
puntuaciones normativas

6) En el contexto de la teoría y de la práctica de los tests psicológicos ¿Qué son las normas? Mencione algunos tipos
de normas y explique uno de ellos.
7) Comente las similitudes y diferencias entre las normas nacionales y locales y las de usuario y conveniencia.

Las normas son una descripción de la posición del sujeto respecto del grupo. Pueden ser nacionales, locales y normas de
usuario y de conveniencia.

8
Normas nacionales es el tipo más frecuente de normas, por niveles de edad, profesiones, etc. a los que se aplique el
test. Estas normas están basadas en muestras representativas a nivel nacional. En la Selección del grupo normativo,
debe tenerse en cuenta que tiene que representar a la población en todas aquellas características relevantes que
puedan influir en los resultados del test: edad, sexo, raza, estatus socioeconómico, etc.

Normas locales: las normas basadas en subpoblaciones definidas sobre unidades educativas o geográficas limitadas, se
denominan normas locales. Su utilidad es muy grande especialmente en la toma de decisiones educativas, por ej. las
normas de un test de rendimiento académico para ingresar a una escuela. Con los datos de los estudiantes se
construyen normas generales en términos de percentiles. Un estudiante está en el percentil 80, y quiere ingresar a un
centro muy selectivo cuyas normas se sitúan en el percentil 10, teniendo en cuenta esta información es poco probable
que el centro decida admitir al estudiante.

Normas de usuario y normas de conveniencia: las normas basadas en las puntuaciones de los sujetos a los que se le
administra el test durante un período de tiempo determinado, pero sin consideraciones de muestreo, se denominan
normas de usuario. Tienen el problema de que los sujetos no son representativos de una población definida. En muchas
ocasiones, las normas se basan en grupos de sujetos que son accesibles al constructor del test por ej. a los niños de
colegio de una determinada ciudad a los que el autor tiene acceso, estas normas tienen escasa utilidad ya que
seguramente no representan a ninguna población.

EJERCICIOS DE CLASE
PROBLEMA 1: Malena obtuvo 13 puntos en una prueba de Razonamiento Lógico (RL), 12 puntos en una de
Razonamiento Verbal (RV) y 10 puntos en una de Memoria Visual (MV). Se sabe que las medias y desviaciones típicas
de los puntajes de cada prueba son (12,2), (14,2) y (8,1) respectivamente. ¿En qué prueba tuvo el peor rendimiento
relativo?
La media más chica es la de MV, sin
ZRL = (13-12)/2 = 0.5
embargo, cuando transformamos en
ZRV = (12-14)/2 = -1 puntaje Z vemos que le fue peor en
RV, que está dos desvíos por debajo
ZMV = (10-8)/1 = 2

PROBLEMA 2: Si se sabe que las puntuaciones en Razonamiento Lógico (RL), Razonamiento Verbal (RV) y Memoria
Visual (MV) mencionadas anteriormente se distribuyen normalmente, es posible obtener el rango percentilar de Malena
en cada una de tales pruebas.

RLMalena= 13 entonces P(RL<13)= 0,6915 luego a Malena en RL le corresponde el rango percentilar 69,15

RVMalena= 12 entonces P(RV<12)= 0,1587 luego a Malena en RV le corresponde el rango percentilar 15,87

MVMalena= 10 entonces P(MV<10)=0,9772 luego a Malena en MV le corresponde el rango percentilar 97,72

Cuando se sabe que las puntuaciones originales se distribuyen normalmente, el rango percentilar puede obtenerse de
manera análoga a partir de las puntuaciones Z, o de las derivadas. En ese caso, el porcentaje de casos que la puntuación
supera (rango percentilar) puede calcularse considerando que las correspondientes puntuaciones:

Z tienen distribución normal estándar (µ=0 y =1)

T tienen distribución normal (µ=50 y =10)

CI tienen distribución normal (µ=100 y =15)

PROBLEMA 4: Santiago obtuvo 49 puntos en el Estilo del Humor Mejoramiento Personal. Si se sabe que los puntajes
en dicha prueba se distribuyen normalmente con media 40 y desvío estándar 6. ¿Qué rango percentilar le
corresponde a Santiago por su puntuación en Mejoramiento Personal?

MP= 49  entonces P(MP<49)= 0,9332  Santiago supera al 93% de su grupo y es superado por el 6%

PROBLEMA 5 Jeremías fue superado por el 85% del grupo normativo por su puntuación en Descalificación Personal. Si
se sabe que las puntuaciones en dicho Estilo del Humor se distribuyen normalmente con media 22 y desvío estándar
4. ¿Cuál fue la puntuación de Jeremías en Descalificación Personal?
9
Si fue superado por el 85% el RP= 15

P(X<X1)= 0,15  entonces P15= 17,85

UNIDAD 6: MUESTREO Y PRUEBA DE HIPÓTESIS

MUESTREO

Importancia: De cómo se seleccionen las unidades de observación depende la calidad de la información que se recoja.
Por eso deben invertirse el tiempo y el esfuerzo en la ejecución del diseño de la muestra.

Definición y acotación de la población: Consiste en mencionar las características esenciales que ubican a la población
en un espacio y tiempo concretos. Para ello han de tenerse en cuenta el problema y los objetivos principales de la
investigación.

Marco de muestreo: Es el listado que comprende las unidades de la población (no de la muestra). Se utiliza para buscar
la documentación que ayuda a la identificación de la población de estudio. Sus requisitos son:

 comprehensividad (abarcar todas las unidades)


 actualizado
 sin duplicidad (nadie puede aparecer dos veces)
 sin unidades de otras poblaciones
 con información suplementaria que ayude a la localización de las unidades.
 fácil de utilizar

Tamaño de la muestra: Está determinado por los siguientes factores:

 Tiempo y recursos disponibles (económicos, materiales o humanos): los plazos para realizar la investigación o la
disponibilidad económica que se tenga aumentan o disminuyen el tamaño de la M.
 Modalidad de muestreo seleccionada
 Tipo de análisis de datos previstos.
 Varianza poblacional.
 Error máximo admisible para la estimación de los parámetros.
 Nivel de confianza de la estimación.

Error muestral: Es la diferencia existente entre las estimaciones (obtenidas a partir de la muestra) y los parámetros
(características poblacionales). Una estimación es más precisa cuando su error muestral es menor. A medida que
aumenta el tamaño de la muestra decrece el error muestral
Nivel de confianza: Expresa el grado de confianza que el investigador tiene en que su estimación se ajuste a la realidad.
Proviene del nivel de probabilidad utilizado en el método de estimación.

Tipos de muestreo: probabilístico y no probabilístico

Probabilístico: Utiliza la aleatorización como criterio esencial de selección muestral.


 Cada unidad tiene una probabilidad igual (o establecida a priori) de ser seleccionada para la muestra
 La elección de cada unidad es independiente de las demás.
 Permite controlar el error muestral.
 Algunos de ellos: aleatorio simple – sistemático – estratificado – por conglomerados
- Muestreo aleatorio simple: muestreo probabilístico, su realización exige la existencia de un marco muestral. Una
vez localizado se asigna a cada unidad de la población (en el listado) un número de identificación para
posteriormente proceder a la extracción aleatoria de los integrantes de la muestra. La selección muestral puede
hacerse siguiendo una tabla de números aleatorios o mediante un programa de computadora.

No probabilístico: no utiliza la aleatorización sino criterios como la conveniencia o criterios subjetivos. Ello puede
10
producir:
 Que algunas unidades de la población tengan mayor probabilidad que otras de ser seleccionadas para la muestra.
 Dificultad para calcular el error muestral.
 Introducción de sesgos.
 Algunos de ellos: por cuotas – estratégico – bola de nieve
- Muestreo por cuotas: muestreo no probabilístico que segmenta la población de interés en grupos a partir de
variables relacionadas con los objetivos de la investigación. Su realización conlleva a la elaboración de una matriz
con las características básicas de la población que se analiza (proporción de la población diferenciada por género y
edad, nivel de instrucción, clase social). Esta información suele obtenerse del último censo poblacional, padrón de
habitantes, etc. El propósito es seleccionar una muestra que se ajuste a las características fundamentales de la
población. Ej. si el objetivo de estudio fuese comprobar la influencia del nivel educativo de las personas en sus
actividades de ocio, la población debería al menos estratificarte por nivel educativo. Las cuotas más habituales son
las determinadas por las variables de género y edad

Muchas encuestas requieren ser realizadas a individuos que constituyan una muestra representativa. ¿Cuál es la
necesidad de este requerimiento? ¿Cómo debe ser y obtenerse una muestra representativa?
La muestra tiene que ser representativa para que permita hacer inferencias sobre la población. Una muestra es
representativa si con una cantidad menor de unidades reproduce a la población. Para que una muestra sea
representativa existen métodos de muestreo. La 1° condición para extraer una MR es definir la población de manera
precisa, esto precisara el método de muestreo a seguir para obtenerla. El mejor método de extracción de una muestra
representativa es el probabilístico (explicar)

---------------------------------------------------------------------------------------------------------------------------------------------------------------

INFERENCIA ESTADÍSTICA: hace conclusiones sobre toda la población a partir de una muestra de dicha población.

Un estadístico es una variable cuyos valores dependen de la muestra (característica de una muestra por lo que es
variable) ej. s, s2, x . Un parámetro es una característica fija de la población Ej. µ, σ, σ2. Los estadísticos se usan para
estimar parámetros (se los llama estimadores) o para tomar decisiones (se los llama estadísticos de prueba o contraste).

X , es un estimador insesgado de 
s2 es un estimador insesgado de 2
Estimador de un parámetro: variable cuyos valores se considera estan próximos al parámetro. Todo estimador es un
estadístico, pero no todo estadístico es un estimador.

Prueba de hipótesis: es un método de inferencia estadística que proporciona un criterio racional de decisión para optar
por una entre 2 hipótesis que se confrontan: la hipótesis nula (H0) y la hipótesis alternativa (H1). El método se basa sobre
información muestral pero las hipótesis se refieren a caracteristicas poblacionales, de modo que hay posibilidad de
cometer un error en la decisión de rechazar o no la hipótesis formulada. El método permite controlar la posibilidad de
los distintos tipos de errores que se pueden cometer

Hipótesis en estadística, es una afirmación referida a cualquier característica de la distribución de probabilidades de una
o mas variables aleatorias. Como las variables modelizan lo que acontece a nivel poblacional, también puede decirse
que las hipótesis estadísticas son hipótesis referidas a cualquier característica poblacional.

Ejemplos de hipótesis estadísticas paramétricas (o sea sobre parámetros)

1. los puntajes en un test de humor se distribuyen normalmente


2. los puntajes tienen una media de 62 (µ= 62)
3. los puntajes en el test tienen una distribución estándar menor a 9 (σ < 9)
4. la proporción de individuos con puntaje superior a 60 es 0,5 (p=0.85)

Ejemplos de hipotesis que relacionan dos variables (no paramétricas)

1. la condición de aprobación de los alumnos de estadística es independiente de la banda horaria de la cursada

11
2. la nota de estadística correlaciona positivamente con la de técnicas y evaluación de diagnóstico.

Lógica de una prueba de hipotesis: suponiendo provisoriamente verdadera la hipotesis nula (H0), se sabe que ciertos
resultados muestrales en favor de la alternativa tienen poca probabilidad (α) de ocurrir. Si al tomar una muestra de la
población se observare uno de tales resultados hay dos posibilidades: 1) La H0 es falsa; 2) H0 es verdadera, pero algo
poco probable ocurrió (ej. no voy a la facultad porque me puede caer algo sobre la cabeza). Lo racional es elegir la
opción 1, ósea rechazar la H0.

Uno puede equivocarse en la decisión de rechazar o no la hipotesis.

Tipos de errores en la decisión: uno puede equivocarse en la decisión de rechazar o no la hipotesis.

Error de tipo I: Es rechazar H0 cuando H0 es verdadera. Si H0 es verdadera NO se rechaza H0 (decisión correcta)


Error de tipo II: es no rechazar H0 cuando H0 es falsa. Si H0 es falsa hay que rechazar H0 (decisión correcta)

Nivel de significación (α) en una prueba de hipotesis es la probabilidad de cometer el error de tipo I. Es decir, la
probabilidad de rechazar H0 dado que H0 es verdadera.

Explique el carácter variable de la media muestral. ¿Qué significa que la misma es un estimador insesgado de la
media poblacional?
2
X y S son variables aleatorias pues sus valores varían con las muestras las cuales son seleccionadas al azar (IMPPP.
usamos mayúscula para distinguirlas de cada valor particular). X , es un estimador insesgado de , y s2 es un estimador
insesgado de 2, por eso X y S2 son además estimadores. Un estimador se dice insesgado cuando su media coincide con
el parámetro que pretende estimar.

Respecto de la media muestral considerada como variable ¿Qué se puede decir de su distribución, su media y su
desvío estándar? (NOSE SI ESTA COMPLETA)

Distribución de la media muestral X : cuando el tamaño muestra es suficientemente grande, la distribución de X es


aproximadamente normal (más normal cuanto mayor es el tamaño de la muestra) con media μ y varianza σ2/n. esto se
refiere al teorema central del límite.
Teorema Central del Límite: Dada una variable X con media  y varianza 2, la variable media muestral X , de muestras
de tamaño n, se distribuye de manera aproximadamente normal con la misma media, , y varianza igual a la enésima
parte de la varianza, 2/n.

3) ¿Cómo se otorga carácter variable a la media muestral? Responda y ejemplifique

X y S2 son variables aleatorias pues sus valores varían con las muestras, las cuales son seleccionadas al azar. Es decir,
que al cambiar las muestras se obtienen diferentes medias.

Ejemplo: la población es todas las mujeres de la argentina, variable: altura. Si se toman distintas muestras en esta
población tendrían distintas medias ej. 1,60 otra 1,59, etc.

5) ¿Cuáles son las cuatro consecuencias que resultan de comparar la decisión tomada en la prueba de hipótesis con el
estado real de la población?

Con la decisión pueden pasar cuatro cosas


1) Error de tipo I: Es rechazar H0 cuando H0 es verdadera.
2) Error de tipo II: es no rechazar H0 cuando H0 es falsa.
3) Decisión correcta: Si H0 es falsa hay que rechazar H0
4) Decisión correcta: Si H0 es verdadera NO se rechazar H0
12
6) defina “nivel de significación de una prueba de hipotesis” y explique ¿cómo se relaciona con la regla de decisión (o
zona de rechazo)?
Nivel de significación (α) en una prueba de hipotesis es la probabilidad de cometer el error de tipo I. Es decir, la
probabilidad de rechazar H0 dado que H0 es verdadera.
La zona de rechazo es el conjunto de valores del recorrido del estadístico de prueba, con los cuales se rechaza la H 0 y se
llama punto critico a la frontera de la región critica.

Zona de rechazo en pruebas unilaterales

Zona de rechazo en las pruebas bilaterales

Regla de decisión: 1) se rechaza la H0, si el estadístico de prueba “cae” en la zona de rechazo; 2) no se rechaza la H0 si el
estadístico de prueba “cae fuera” de la zona de rechazo.

7) La zona de rechazo queda determinada a partir de la consideración de 3 cosas. Menciónalas y explique.

8) Cuando se dice que una prueba es estadísticamente significativa ¿A que diferencia se hace mención y a que alude
el término “significativa”

Decimos que una diferencia es significativa cuando sometida la igualdad a una prueba de hipótesis, resulta que se
rechaza la hipótesis nula.

9) Explique los términos: estadístico, parámetro y estimador de un parámetro. YA ESTA

10) ¿Qué nombre reciben las hipótesis que intervienen en una prueba y qué refleja cada una de ellas?

La Hipótesis nula se simboliza H0. Es la hipótesis donde se afirma un valor numérico de un parámetro (en los casos de
hipótesis paramétricas), es la hipótesis de la igualdad. Si se rechaza la hipótesis nula, hay otra que es cierta, es la
hipótesis alternativa que se simboliza H1. Muchas veces se dice que la H0 es la hipótesis contraria a lo que quiere probar
el investigador, mientras que la hipótesis alternativa es la hipótesis que se quiere probar. Esto es cierto en muchos
casos, pero no siempre, ej. se quiere probar que con otros métodos se logran iguales resultados, en este caso el éxito es
no rechazar la H0

11) ¿Cuáles son los errores que se pueden cometer en una prueba de hipótesis y en qué consiste cada uno? YA ESTA

12) En una prueba de hipótesis ¿qué criterio se emplea para rechazar la hipótesis nula y en qué consideraciones se
funda?

La zona de rechazo es el conjunto de valores del recorrido del estadístico de prueba, con los cuales se rechaza la H 0 y se
llama punto crítico a la frontera de la región critica.
Regla de decisión: 1) se rechaza la H0, si el estadístico de prueba “cae” en la zona de rechazo; 2) no se rechaza la H0 si el
estadístico de prueba “cae fuera” de la zona de rechazo

Fundamento de rechazar H0: la prueba de hipótesis se basa en un principio que dice que los sucesos de probabilidad
pequeña se toman como improbables (ejemplo 0,05 o 0,01 se consideran de probabilidad pequeña). Si el estadístico de
prueba toma un valor que cae en la zona de rechazo (o sea es un valor poco probable) como se considera que los
sucesos de probabilidad pequeña no ocurren estamos en una contradicción por lo tanto se rechaza la hipótesis nula.

13) ¿en que consiste el proceso de inferencia estadística? YA ESTA

78. Pregunta: ¿De qué manera se debería organizar una experiencia para que luego fuese posible realizar una
interpretación causalista de los resultados hallados?.

13
80. En la organización de las experiencias debe establecerse el tipo de muestras por usar y la manera de obtenerlas.
Explique en qué consiste esto, las limitaciones prácticas que se encuentran para la obtención de las muestras deseadas y
sus implicancias.

14

También podría gustarte