Regresi N Logistica
Regresi N Logistica
Regresi N Logistica
Samuel Martı́nez
April 4, 2020
1 Introducción
La regresión lineal tiene en cuenta que la variable respuesta es de tipo numérica.
En los casos que la variable dependiente es dicotómica. Por ejemplo; aprobado
o reprobado, positivo o negativo en un test...etc. Por tanto, se debe realizar una
transformación sobre la variable dependiente para garantizar que la relación con
las variables independientes sea lineal.
Luego, vamos a definir p la probabilidad de éxito y 1 − p la probabilidad de
fracaso. Donde se utiliza la función log para predecir la probabilidad de que un
evento ocurra para una situación particular.
p
Log = β0 + x1 β1 + xx β2 + ... + xn βn
1−p
Se despeja la variable p del logaritmo natural y se llega a la expresión de
interés que es:
exp β0 + x1 β1 + xx β2 + ... + xn βn
p=
1 + exp β0 + x1 β1 + xx β2 + ... + xn βn
Donde el modelo de regresión logı́stica permite predecir la probabilidad de
ocurrencia p en función de los valores de las variables independientes.
1
3. Los betas estimados sobre las variable independientes. El estadı́stico uti-
lizado para la estimación es un estadı́stico de W ald y la hipótesis nula es
igual a la del modelo de regresión.
4. Tabla de clasificación: Muestra el porcentaje de clasificación correcta de
los datos por el modelo. Un porcentaje mı́nimo aceptable es del 50%.
1.2 Ejercicios
1. Se hizo un estudio para investigar compras de automóviles nuevos. Se
seleccionó una muestra de 20 familias. Cada familia se encuestó para
determinar la edad de su coche más viejo y su ingreso familiar total. Se
hizo una encuesta de seguimiento 6 meses después, para determinar si en
realidad habı́an comprado un nuevo vehı́culo en ese lapso (y = 1 indica sı́,
y y = 0 indica no). Los datos del estudio aparecen en la siguiente tabla.
2
2. Consumer Report le realizó una prueba de sabor a 19 marcas de chocolates.
En los datos a continuación se da el precio por porción, en base al tamaño
de porción de la FDA que es de 1.4 onzas, ası́ como una evaluación de la
calidad de los 19 chocolates tomados para la prueba (Consumer Report,
febrero 2002).
Suponga que desea determinar si los productos que son más caros son
mejor evaluados. Para los propósitos de este ejercicio, emplee la siguiente
variable binaria dependiente.
3
3. Los siguientes datos muestran los resultados de los aspirantes a un pro-
grama de doctorado de una universidad. La variable respuesta es la ad-
misión en términos del genero, el departamento y el puntaje de admisión.
4
4. La tabla siguiente presenta los resultados de disparo de 25 misiles an-
tiaéreos, de superficie a aire, con blancos de diversas velocidades. El re-
sultado de cada prueba es un éxito (y = 1) o un fracaso (y = O).
5
6. La tabla presenta los datos de 30 encuestados, de los cuales 15 son leales
a la marca (indicando 1) y 15 no lo son (indicados con 0). También se
miden las actitudes hacia la marca (Marca), hacı́a la categorı́a del producto
(Producto) y hacia las compras (Compras), todo en una escala de 1 (no
favorable) a 7 (favorable). El objetivo es calcular la probabilidad de que
un consumidor sea leal a la marca como función de la actitud hacia la
marca, la categorı́a del producto y las compras.
6
7. Se hizo un estudio tratando de relacionar la propiedad de casas con el
ingreso familiar. Se seleccionaron 20 familias, se estimó su ingreso y otra
información acerca de la propiedad de la vivienda (y = 1 indica sı́, y y = 0
indica no). Los datos se ven a continuación.
7
Ingreso
Visitas a Familiar Actitud Importancia
Tamaño de Edad jefe de
centros Anual en hacia los de los viajes
la Familia la familia
comerciales miles de viajes familiares
dólares
1 1 50.20 5 8 3 43
2 1 70.30 6 7 4 61
3 1 62.90 7 5 6 52
4 1 48.50 7 5 5 36
5 1 52.70 6 6 4 55
6 1 75.00 8 7 5 68
7 1 46.20 5 3 3 62
8 1 57.00 2 4 6 51
9 1 64.10 7 5 4 57
10 1 68.10 7 6 5 45
11 1 73.40 6 7 5 44
12 1 71.90 5 8 4 64
13 1 56.20 1 8 6 54
14 1 49.30 4 2 3 56
15 1 62.00 5 6 2 58
16 2 32.10 5 4 3 58
17 2 36.20 4 3 2 55
18 2 43.20 2 5 2 57
19 2 50.40 5 2 4 37
20 2 44.10 6 6 3 42
21 2 38.30 6 6 2 45
22 2 55.00 1 2 2 57
23 2 46.10 3 5 3 51
24 2 35.00 6 4 5 64
25 2 37.30 2 7 4 54
26 2 41.80 5 1 3 56
27 2 57.00 8 3 2 36
28 2 33.40 6 8 2 50
29 2 37.50 3 2 3 48
30 2 41.30 3 3 2 42
31 1 50.80 4 7 3 45
32 1 63.60 7 4 7 55
33 1 54.00 6 7 4 58
34 1 45.00 5 4 3 60
35 1 68.00 6 6 6 46
36 1 62.10 5 6 3 56
37 2 35.00 4 3 4 54
38 2 49.60 5 3 5 39
39 2 39.40 6 5 3 44
40 2 37.00 2 6 5 51
41 2 54.50 7 3 3 37
42 2 38.20 2 2 3 49
8