Puebla 2017
Puebla 2017
Puebla 2017
ESTADÍSTICA Y
PROBABILIDAD
Editores:
Hugo Adán Cruz Suárez
Bulmaro Juárez Hernández
Francisco Solano Tajonar Sanabria
Hortensia Josefina Reyes Cervantes
Fernando Velasco Luna
José Dionicio Zacarías Flores
Víctor Hugo Vázquez Guevara.
Modelación con Estadística y Probabilidad
ISBN: 978-607-525-442-5
© Benemérita Universidad Autónoma de Puebla
Dirección de Fomento Editorial
2 Norte 1404, C.P. 72000
Puebla, Puebla.
Teléfono y fax: 01 222 246 8559
Impreso y hecho en México
Printed and made in Mexico
Comité Editorial
Esta obra recopila las investigaciones realizadas por investigadores y académicos de diferentes
instituciones de Educación Superior, se abarcan distintas áreas del conocimiento relacionadas con
temáticas diversas de la Probabilidad y Estadística.
En este libro tenemos 15 capítulos en los cuales se tratan temas de aplicaciones y trabajos teóricos,
en particular hay cuatro de ellos en el área de Probabilidad y once en el área de Estadística. En el
capítulo 1 se presenta una aplicación de los modelos de decisión de Markov, en el capítulo 2 se
presenta una aplicación de la probabilidad a la mecánica cuántica, en el capítulo 3 está relacionado
con los modelos de ecuaciones estructurales. En el capítulo 4 se presenta una aplicación de modelos
de crecimiento a estudios económicos. Un estudio relacionado a la salud sexual y reproductiva y
fecundidad de adolescentes es presentado en el capítulo 5. Un análisis de puntos de cambio en
espacio tiempo es llevado a cabo en el capítulo 6, se presenta una revisión del punto de cambio
tratado sobre el enfoque de máxima verosimilitud. En el capítulo 7 se realiza un análisis de regresión
logística para estudiar las elaciones en relación con educación sexual y el conocimiento de
preservativos. En el capítulo 8 se lleva a cabo un análisis de componentes principales para construir
un indicador de calidad de viviendas. En el capítulo 9 se presenta la caracterización de los efectos
aleatorios en términos del modelo lineal mixto. El capítulo 10 presenta el tema de la teoría de
respuesta al Ítem aplicada n el análisis de un cuestionario de bienestar familiar. Una aplicación de
modelos de ecuaciones estructurales es llevada a cabo en el capítulo 11, se estudian las principales
características de la construcción de la satisfacción estudiantil. En el capítulo 12 e presenta una
introducción a la estadística bayesiana y dos Aplicaciones en elecciones electorales en México. En
el capítulo 13 se utiliza la técnica de credit scoring usando regresión logística para la evaluación del
riesgo crediticio. Un estudio sobre sostenibilidad empresarial es llevado en el capítulo 14, este
estudio se realiza a través de la implementación de la metodología Biplot. Finalmente, en el capítulo
15 una aplicación del modelo Weibull en el análisis de supervivencia es llevada a cabo.
Los trabajos fueron sometidos a un arbitraje coordinado por el Comité Editorial del Cuerpo de
Probabilidad y Estadística. Se les agradece a los revisores el gran esfuerzo que hicieron para lograr
a tiempo sus sugerencias que se incluyeron en el trabajo final de esta obra.
Los integrantes del Cuerpo Académico de Probabilidad y Estadística esperan que el presente libro
logre evidenciar que el trabajo multidisciplinario es necesario a fin de abordar problemas reales.
Comité Editorial
Modelación con Estadı́stica y Probabilidad
ISBN: 978-607-525-442-5
Índice general
Índice general I
i
3.3.1. El Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.3.2. Los Pesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.3.3. El Algoritmo de MCP . . . . . . . . . . . . . . . . . . . . . . 35
3.4. Evaluación del Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.4.1. Evaluación del Modelo de Medición . . . . . . . . . . . . . . 35
3.4.2. Evaluación del Modelo Estructural . . . . . . . . . . . . . . . 36
3.5. Modelo de Satisfacción INSPOCH . . . . . . . . . . . . . . . . . . . 37
3.6. Modelo de Satisfacción INSPOCH . . . . . . . . . . . . . . . . . . . 37
3.6.1. Ecuaciones del Modelo . . . . . . . . . . . . . . . . . . . . . . 39
3.6.2. Cálculo del ı́ndice de Satisfacción . . . . . . . . . . . . . . . . 40
3.7. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.8. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
ii
7.3. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
7.3.1. Algunas Caracterı́sticas de Educación Sexual que Recibieron
los Alumnos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
7.3.2. Educación Sexual y Buen Conocimiento del Condón. Análisis
Bi-variado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
7.3.3. Educación Sexual y Buen Conocimiento del Condón. Modelos
de Regresión Logı́stica . . . . . . . . . . . . . . . . . . . . . . 98
7.4. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
iii
10.2.4. Bondad del Ajuste de los Modelos de la TRI . . . . . . . . . 132
10.2.5. Criterios para la Aplicación de la TRI . . . . . . . . . . . . . 132
10.2.6. Posibles Softwares: el Paquete ltm . . . . . . . . . . . . . . . 134
10.3. Aplicación de la TRI al Cuestionario de Bienestar Familiar . . . . . 134
10.3.1. Presentación del Cuestionario y su Elaboración . . . . . . . . 134
10.3.2. Aplicación de la Teorı́a de Respuesta al Ítem (TRI) a las
Subescalas del Cuestionario Bienestar Familiar y Selección de
los Mejores Ítems. . . . . . . . . . . . . . . . . . . . . . . . . 135
10.4. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
10.5. Anexo: Cuestionario de Bienestar Familiar . . . . . . . . . . . . . . . 144
iv
13.4.3. Valoración de la Capacidad Predictiva del Modelo . . . . . . 179
13.5. Credit Score . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
13.5.1. Ventajas del Scoring . . . . . . . . . . . . . . . . . . . . . . . 181
13.5.2. Desventajas del Scoring . . . . . . . . . . . . . . . . . . . . . 182
13.6. Caso práctico: Análisis de Datos . . . . . . . . . . . . . . . . . . . . 183
13.7. Descripción de la Base . . . . . . . . . . . . . . . . . . . . . . . . . . 183
13.8. Estimación del Modelo en SPSS . . . . . . . . . . . . . . . . . . . . . 185
13.8.1. Ajuste del Modelo . . . . . . . . . . . . . . . . . . . . . . . . 185
13.8.2. Poder Predictivo . . . . . . . . . . . . . . . . . . . . . . . . . 185
13.8.3. Clasificación . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
13.8.4. Poder Discriminatorio . . . . . . . . . . . . . . . . . . . . . . 186
13.8.5. Interpretación . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
13.8.6. Validación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
13.9. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
1
2
Modelación con Estadı́stica y Probabilidad
ISBN: 978-607-525-442-5
CAPÍTULO 1
3
1.1. Introducción
En este artı́culo se presenta un sistema de inventarios, el cual es observado de
forma discreta a través del tiempo y cuya dinámica presenta incertidumbre, en
este caso debido a la demanda del producto de interés. Además, suponemos que el
sistema se encuentra inmerso en una dinámica markoviana, en especı́fico se propone
una dinámica de tipo caminata aleatoria de Lindley (o proceso de Lindley). Dicho
proceso fue propuesto por David Lindley para el estudio de sistemas de lı́neas de
espera ([10]). Ahora, en este trabajo se propone una versión modificada, en la cual
introducimos una variable de control, cuya finalidad es minimizar una función de
costo a un horizonte infinito, bajo un factor de descuento.
La metodologı́a para resolver el problema anterior es programación dinámica, para
ello primeramente se identifica al problema de inventarios con un Proceso de
Decisión de Markov (PDM). Los PDMs son adecuados para modelar esta clase
de problemas, los cuales son dinámicos y presentan incertidumbre en alguna de
sus componentes [2]. En la literatura es posible encontrar diversos trabajos que
estudian sistemas de inventarios utilizando como herramienta de los PDMs. Algunos
de ellos se pueden consultar en [4], [6] y [11], por ejemplo. Ahora nos enfocamos a un
sistema de inventarios cuya producción posiblemente no es acotada y la dinámica
del sistema es inducida por una caminata tipo Lindley. En el documento se procede,
en una primera etapa, a garantizar la existencia de una solución vı́a programación
dinámica. Posteriormente, se presentan algunos ejemplos numéricos, en los cuales
se encuentra explı́citamente la solución del problema de control.
El trabajo se encuentra organizado de la siguiente manera. En la Sección 1 se
presenta una explicación breve de los componentes en un sistema de inventarios y
se expone el modelo de inventarios regido por la caminata aleatoria de Lindley. En
la siguiente sección se muestra la necesidad de agregar una variable de control al
modelo, de este modo se propone el modelo controlado de Lindley. En la tercera
sección se aborda el problema principal del trabajo, el cual consiste en encontrar
una polı́tica óptima que minimice los costos por cada etapa del proceso y encontrar
el valor óptimo de costo. Después, en la cuarta sección, se demuestra la existencia
de la polı́tica óptima para el modelo. Finalmente, se presentan las aproximaciones
a las polı́ticas óptimas mediante un ejemplo numérico.
Tiempo de espera: El tiempo que transcurre desde que se hace el pedido hasta
que la empresa recibe el producto.
Tamaño del pedido: Número de artı́culos que conforman el orden del pedido.
4
Nivel de inventario: Número de artı́culos que se encuentran en el inventario.
Punto de reorden: Nivel de inventario en el que la empresa define en que
momento hacer un nuevo pedido.
Como una primera aproximación para el estudio de nuestro sistema de inventarios,
considere la siguiente situación.
Sea xt ≡ stock al tiempo t y ξt la demanda del producto en el tiempo t, cuya
dinámica es regida por la siguiente ecuación en diferencias:
xt+1 = (xt − ξt+1 )+ , (1.1)
+
con t ∈ N ∪ {0} y la notación r := max(r, 0).
Observación 1.2.1 El sistema estocástico anterior fue propuesto por primera vez
por David Lindley en [10] para estudiar un modelo de lı́neas de espera. Además de
inventarios cuenta con diversas aplicaciones, por ejemplo en el área de presas [4],
economı́a [6] y teorı́a de riesgo [14]. En la literatura se conoce como proceso de
Lindley.
De acuerdo al modelo de inventarios cada xt se encuentran en el conjunto
X := [0, ∞) con una ley de transición Q o también llamado kérnel estocástico,
inducido por (1.1). Además suponemos que {ξt } es una sucesión variables aleatorias
independientes e idénticamente distribuidas (v.a.i.i.d.) sobre [0, ∞) con esperanza
finita definidas en un espacio de probabilidad (Ω, F, γ).
Una de las desventajas del modelo (1.1) se debe a que no se considera un tamaño de
pedido o producción. En consecuencia, ocurre que el estado 0 es absorbente, como
a continuación se ilustra:
Q[x1 = 0|x0 = 0] = γ[(−ξ0 )+ = 0]
= γ[−ξ0 < 0]
(1.2)
= γ[ξ0 ≥ 0]
= 1,
la última ecuación se debe a que la variable aleatoria ξ0 tiene rango [0, ∞).
Por lo tanto, la relación (1.2) demuestra que con probabilidad 1 el sistema de
inventarios en algún tiempo t ≥ 0 se mantendrá con un nivel de 0 productos, con esto
el sistema colapsarı́a ante la demanda. Por lo cual en la práctica no es un modelo
conveniente de implementar ya que se busca tener un nivel mı́nimo en inventario
con la finalidad de suplir demandas en cada periodo y no caer en pérdidas. Por esta
razón, se considera el punto de reorden y es agregada una nueva variable. Lo anterior
resuelve el problema de no caer en el estado absorbente cero, sin embargo, queda
por responder cual es la cantidad óptima de producto solicitado en cada periodo
de observación, esta problemática puede ser abordada desde el punto de vista de
la teorı́a de control, lo cual se presenta en la siguiente sección, considerando a la
variable de control como la cantidad de productos solicitados o producidos.
5
Controlada, el cual se expresa mediante la siguiente ecuación en diferencias:
con t ∈ N ∪ {0} y x0 = x.
Tenemos que xt ∈ X = [0, ∞), y at ∈ A := [0, θ] denota la cantidad de producto
ordenada que se proporciona al principio del periodo t con θ el nivel máximo de
almacenaje en el sistema.
En cada tiempo t es natural considerar los costos y ganancias de la siguiente manera:
costo de producción + costo de almacenaje - ingresos de ventas,
de esta forma se define la función de costo:
donde
p es el costo de producción por unidad,
m es el costo de almacenaje por unidad,
k es el precio de venta por unidad,
con k, p, m constantes positivas y satisfacen que,
m + p ≤ k. (1.5)
Naturalmente (1.5) ı́ndica que los costos son menores al precio de venta por unidad.
Observe que la función de costo dada en (1.4) no necesariamente es positiva. Si la
función toma valores negativos se consideran ganancias. Además, si ξ representa un
valor genérico de la sucesión {ξt }, suponemos que:
Tienen rango [0, ∞) y función de densidad continua y acotada ∆ con función
de distribución F .
θ < µ := E[ξ] < ∞, es decir, su valor promedio se supone mayor que la
cantidad de producto solicitado.
Para el modelo controlado de Lindley hemos construido la quı́ntupla
6
1.4.1. Polı́ticas
En general existen diversas polı́ticas que se pueden utilizar, a continuación se
define formalmente lo que consideraremos como una polı́tica.
Primeramente, se define el espacio de historias observadas en un modelo de control
hasta un tiempo t, el cual se denota por Ht , y se define como:
H0 = X,
Ht = K × Ht−1 = Kt × X,
donde K := {(x, a)|x ∈ X, a ∈ A(x)}. Cada ht ∈ Ht es un vector de la forma
(x0 , a0 , x1 , a1 , . . . , at−1 , xt ), donde (xi , ai ) ∈ K para i = 0, ..., t − 1 y xt ∈ X.
Existen diversos tipos de polı́ticas, pero en este trabajo se hace mención a dos.
Definición 1.4.2 Sea Φ el conjunto de todas las probabilidades condicionales ϕ en
P(A|X) tal que para toda x ∈ X se tiene ϕ(A(x)|x) = 1. Una polı́tica π ∈ Π es:
1. Markoviana Aleatorizada (ΠRM ). Si existe una sucesión {ϕt } ⊆ Φ
(definidas sobre A dado X), tal que πt (·|ht ) = ϕt (·|xt ) para toda ht ∈ Ht
y t ≥ 0.
2. Markoviana Aleatorizada Estacionaria (ΠRS ). Si existe ϕ ∈ Φ, tal que:
πt (·|ht ) = ϕ(·|xt ) para toda ht ∈ Ht y t ≥ 0.
Una vez definido el concepto de polı́tica, procederemos a la construcción del Proceso
de Decisión de Markov.
Sea (Ω, F) el espacio medible que consiste del espacio muestral canónico Ω := H∞ =
(X × A)∞ y F su correspondiente σ-álgebra producto.
Sea π = {πt } una polı́tica de control. Por el teorema de Ionescu-Tulcea [8], existe
una única medida de probabilidad Pxπ en (Ω, F) tal que, para cada B ∈ B(X),
C ∈ B(A) y ht ∈ Ht
7
implementar para minimizar los costos y satisfacer la demanda en cada estado.
Resulta que tenemos un problema de optimización y para esto se requiere una
función objetivo. Si requerimos minimizar los costos en cada estado una propuesta
de función es:
"N −1 #
X
π t
vα,N (π, x) := Ex α (pa + m(x + a) − kE[min(x + a, ξ)]) , x ∈ [0, ∞),
t=0
(1.6)
donde α ∈ (0, 1) es llamado valor de descuento, el cual representa la traslación a
tiempo actual del valor de costo. Se denomina horizonte del problema, al último
tiempo que sea desea estudiar el procesos estocástico, el cual puede ser finito o
infinito y se denota por N . El caso de horizonte infinito se denotará a la función vα
en lugar de vα,∞ . A (1.6), le llamaremos Criterio Descontado.
La función de valor óptimo se define como:
Vα∗ (x) := inf vα (π, x), x ∈ [0, ∞). (1.7)
π∈Π
8
con (x, a) ∈ K. Veamos que la función la función g(x, a) := E[|x + a + ξ|] es continua
en K.
Considere {xn } y {an } sucesiones convergentes en [0, ∞) y [0, θ], con lı́mites x y a,
respectivamente. Ahora, definimos hn y h como:
hn (s) = |xn + an − s|∆(s),
h(s) = |x + a − s|∆(s),
note que hn (s) → h(s), cuando n → ∞ para s ∈ [0, ∞).
Por otra parte,
hn (s) ≤ (|xn | + |an | + s)∆(s)
≤ (M + a)∆(s).
La última desigualdad se cumple ya que {xn } y {an } son convergentes, por tanto,
son acotadas ambas por alguna constante positiva M , ası́
Z Z
hn (s)∆(s)ds ≤ (M + s)∆(s)ds
[0,∞) [0,∞)
= M + µ < ∞.
Ahora por el Teorema de Convergencia Dominada [7], tenemos que
Z
lim g(xn , an ) = lim |xn + an − s|∆(s)ds
n→∞ n→∞ [0,∞)
Z
= lim |xn + an |∆(s)ds
[0,∞) n→∞
Z
= |x + a − s|∆(s)ds
[0,∞)
= g(x, a).
Ası́, g es continua en K. Por lo tanto la función de costo, (1.4), es continua en
K, con lo cual (a) se cumple.
Procederemos a demostrar que (b) se satisface. Sean x ∈ X fijo y µ ∈ B([0, ∞)),
para a ∈ [0, θ] se tiene,
Z ∞
µ(x, a) = µ[(x + a − s)+ ]ds
0
Z x+a (1.10)
= µ(0)[1 − F (x + a)] + µ(x + a − s)∆(s)ds .
0
para cada a ∈ A(x). Sea {an } una sucesión convergente en [0, θ], donde su lı́mite es
a ∈ A(x), luego
Z x+an
lim µ0 (x, an ) = lim µ(0)[1 − F (x + an )] + µ(s)∆(x + an − s)ds
n→∞ n→∞ 0
9
Z ∞
= lim µ(0)[1 − F (x + an )] + I[0,x+an ] µ(s)∆(x + an − s)ds .
n→∞ 0
Como ∆ es continua y acotada entonces F también lo es, en consecuencia,
Z ∞
0
lim µ (x, an ) = µ(0)[1 − F (x + a)] + lim I[0,xn ,an ] u(s)∆(x + an − s)ds.
n→∞ n→∞ 0
Para resolver el problema con horizonte infinito en los PDM se requieren más
suposiciones al modelo (véase [8]) además del Lema 1.5.1. Se consideran condiciones
sobre el crecimiento de la función de costo.
Lema 1.5.3 Dado la Caminata Controlada de Lindley existen constantes no
negativas M β, b con 1 ≤ β ≤ α1 y una función de peso w ≥ 1 sobre [0, ∞) tal
que para cada estado x ≥ 0,
a) supa∈[0,θ] |pa + m(x + a) − kE[min(x + a, ξ)]| ≤ M w(x),
R
b) supa∈[0,θ] [0,∞) w(y)Q(dx|x, a) ≤ βw(x) + b.
es continua.
Demostración. Se busca una función de peso w : X → [1, ∞) que satisfaga las
condiciones descritas en este lema.
Para esto considere la función generadora de momentos ψza de la variable aleatoria
za := a − ξ, con a ∈ [0, θ],
10
Como ψa (0) = 1 y ψz0 a (0) < 1 entonces existe un número positivo ρ tal que
como w(0) = 1, [1 − F (x + a)] ≤ 1 y ρ(a − s) ≤ ρ(θ − s), para cada a ∈ [0, θ], se
obtiene
w0 (x, a) ≤ [1 − F (x + a)] + ψzθ (ρ)w(x)
≤ τ w(x) + b, ∀x ≤ 0,
con
β := ψzθ (ρ), b := 1.
Por lo tanto, (a) se cumple. Por otro lado, usando (1.4) se tiene,
11
El conjunto Bw ([0, ∞)) es Banach (véase [7]), ya que si {µn } es una sucesión de
Cauchy con la w − norma, entonces { µwn } es sucesión de Cauchy con la norma
uniforme, como B([0, ∞)) es un espacio de Banach, entonces se puede encontrar
una función µ ∈ B([0, ∞)) la cual sea w− lı́mite de {µn }.
Definimos el siguiente operador Tα sobre Bw ([0, ∞)),
( Z )
Tα (µ(x)) := inf pa + m(x + a) − kE[min(x + a, ξ)] + α µ(y)Q(dy|x, a) .
a∈[0,θ] [0,∞)
( Z )
Vα∗ (x) = min pa + m(x + a) − kE[min(x + a, ξ)] + α Vα∗ (y)Q(dy|x, a) .
[0,θ] [0,∞)
(1.12)
Mediante el teorema de Banach y su demostración [13], se encuentran
aproximaciones al punto fijo, de esta manera podemos encontrar una aproximación
a la función de valor óptimo, llamada algoritmo de iteración de valores óptimos α
descontada,
( Z )
vn (x) := min pa + m(x + a) − kE[min(x + a, ξ)] + α vn−1 (y)Q(dy|x, a) ,
a∈[0,θ]) [0,∞)
(1.13)
para cada n ≥ 1 y x ≥ 0, con v0 (·) ≡ 0.
Si n ≥ 1, vn es el costo óptimo en el n-ésimo paso, i.e.,
vn (x) := inf Vn (π, x), x ≥ 0,
π∈Π
donde "n−1 #
X
Vn (π, x) := Exπ t
α (pa + m(x + a) − kE[min(x + a, ξ)]) .
t=0
Finalmente se tiene el teorema de existencia de polı́ticas óptimas.
Teorema 1.5.4 Sea β dada en Lema 1.5.3 (a). Se define γ = αβ, entonces para
la Caminata Controlada de Lindley se cumple:
a) la función de valor óptimo Vα∗ es la única solución de la ecuación de valor
óptimo (1.12) en el espacio Bw ([0, ∞), y
M γn
k vn − Vα∗ kw ≤ , n = 0, 1, ... (1.14)
(1 − γ)
donde M es la constante dada en el Lema 1.5.3.
b) Existe una polı́tica óptima para la Caminata Controlada de Lindley.
Demostración. Utilizando el teorema de existencia de una polı́tica óptima
markoviana con criterio descontado y horizonte infinito presentado en [8] y por
el Lema 1.5.3, se tiene la conclusión de nuestro teorema.
12
1.6. Aproximación a las Polı́ticas Óptimas
En la sección anterior demostramos la existencia de una polı́tica óptima para el
modelo. Para aproximar a tal polı́tica óptima se requiere el algoritmo de iteración
de valores óptimos con la función de costo dada en (1.4), para cada n ≥ 1 y x ≥ 0.
y Z
+
E[vn−1 (x + a − ξt ) ] = vn−1 (y)Q(dy|x, a).
X
para cada y ∈ [x, θ + x] es una función convexa, ya que la función L(y) es cóncava
y por tanto, −L(y) es convexa en [0, θ + x] y la recta (p + m)y tambien lo es, ası́,
G1 es convexa en [x, x + θ].
Supongamos que vn−1 es convexa, entonces para n tenemos,
13
Sean y1 , y2 ∈ [0, ∞) y 0 < λ < 1, entonces,
Z
W (λy1 + (1 − λ)y2 ) = [vn−1 (λy1 + (1 − λ)y2 − s)+ ]∆(s)ds
X
= vn−1 (0)[1 − F (λy1 + (1 − λ)y2 )]
Z λy1 +(1−λ)y2
+ vn−1 (λy1 + (1 − λ)y2 )s∆(s)ds,
0
como s = λs + (1 − λ)s vn−1 (0) = λvn−1 (0) + (1 − λ)vn−1 (0) y usando la hipótesis
inductiva que vn−1 es una función convexa tenemos,
Z Z
W (λy1 + (1 − λ)y2 ) = λ vn−1 (y1 − s)+ ∆(s)ds + (1 − λ) vn−1 (y2 − s)+ ∆(s)ds
X X
= λW (y1 ) + (1 − λ)W (y2 ).
Lema 1.6.2 Las polı́ticas óptimas para la Caminata Controlada de Lindley son:
0, si sn < x,
fn (x) = sn − x, si sn ∈ [x, x + θ], (1.19)
θ, si sn > θ + x.
Por lo tanto,
G01 (y) = p + m − k[1 − F (y)]. (1.20)
Igualando a cero, la ecuación (1.20),
k − (p + m)
F (s1 ) = .
k
14
Dado que F es creciente, existe F −1 , ası́ el punto,
−1 k − (p + m)
s1 = F ,
k
Equivalentemente,
0, si s1 < x,
f1 (x) = s1 − x, si s1 ∈ [x, x + θ],
θ, si s1 > θ + x.
Sustituyendo en v1 , se tiene,
mx + L(x), si s1 < x,
v1 (x) = p(s1 − x) + ms1 − L(s1 ), si s1 ∈ [x, x + θ],
pθ + m(θ + x) − L(x + θ), si s1 > θ + x.
Por otra parte, para cada n ∈ N, la función Gn (y), n ∈ N es convexa para cada
y ∈ [x, x + θ] y se tiene un mı́nimo en un punto sn debido a la Lema 1.6.1. Por lo
tanto al minimizar cada función Gn , se obtiene que los minimizadores son,
0, si sn < x,
fn (x) = sn − x, si sn ∈ [x, x + θ], (1.21)
θ, si sn > θ + x.
y
mx − L(x) + αE[vn (x − ξn )+ ],
si sn < x,
vn (x) = p(sn − x) + msn − L(sn ) + αE[vn−1 (sn − ξn )+ ], si sn ∈ [x, x + θ],
pθ + m(θ + x) − L(θ + x) + αE[vn−1 (θ + x − ξn )+ ], si sn > θ + x.
15
Usando el software Mathematica 10.1, se aproximaron los valores sn dados en (1.21), de
tal forma que buscamos una T ∈ N tal que,
T vT (x0 ) sT
.0001 3 -0.488312 0.0881961
.00001 8 -0.488319 0.0881961
Tiempo xt Costo
1 12.45 719.13
2 22.31 916.39
3 31.59 1101.98
5 50.52 1480.46
10 99.58 2460.49
20 187.30 4216.08
1.7. Conclusiones
En este trabajo se presenta un ejemplo de sistema de inventarios el cual llamamos
Caminata Controlada de Lindley. Se resolvió el problema de control óptimo para el modelo
en estudio y además encontramos las polı́ticas óptimas y aproximaciones al valor óptimo.
En el ejemplo numérico se observa la rapidez de convergencia del procedimiento de iteración
de valores óptimos, ya que a partir de la etapa T = 3 se estabiliza debido a la ecuación
(1.14) además toman valores negativos, lo cual significa ganancias. Finalmente, se observa
que los costos van teniendo un aumento uniforme en relación al tiempo.
Referencias
1. Ash, R. B. y Doléans-Dade, C.A., Probability and Measure Theory, Academic Press
Elsevier, San Diego, 2005.
2. Bellman R., Dynamic Programming, Dover, 2003.
3. Bhat, U. N., An introduction to queueing theory, modeling and analysis in
applications, Birkhauser, 2015.
4. Blomquist, N., A heavy traffic result for the finite dam. Journal of Applied
Probability, 223-228, 1973.
5. Choy Murphy, Cheong L.F., Identification of Demand through Statistical
Distribution Modeling for Improved Demand, School of Information Systems,
Singapore Management University, 2011.
16
6. Ghosal, A., Some aspects of queueing and storage systems, Vol. 23. Springer Science
and Business Media, 2012.
7. Hernández-Lerma, O., Lasserre, J.B., Further Topics on Discrete-Time Markov
Control Processes, Springer, New York, 1999.
8. Hernández-Lerma, O., Lasserre, J.B., Discrete-Time Markov Control Processes,
Basic Optimality Criteria, Springer, New York, 1989.
9. Hernández-Lerma, O., Adaptive Markov Control Processes, Springer, New York,
1989.
10. Lindley D.V., The theory of queues with single server, Proc. Cambridge Philos. Soc.
48, p.p. 277-289, 1952.
11. Moran, P.A.P., The theory of Storage, Metheun and Co., London, 1959.
12. Schal, M., For optimality and for the limit of n-stage optimal policies to be optimal,
Z. Whars. Verw. Geb. 32, p.p. 179-196, 1975.
13. Stromberg K.R., Introduction to Classical Real Analysis, Wadsworth International
Group, Belmont, California, 1981.
14. Tang Q., Gurami T., Precise estimates fot the ruin probability in finite horizon in a
discrete-time model with heavy-tailes insurance and financial risks, Vol. 108, No. 2,
p.p. 299-325, 2003.
17
18
Modelación con Estadı́stica y Probabilidad
ISBN: 978-607-525-442-5
CAPÍTULO 2
2.1. Introducción
El nombre de oscilador isotónico debe su nombre a que su espectro de energı́as es
idéntico al del oscilador armónico [1], excepto por una constante aditiva. También recibe el
nombre de oscilador singular debido a que su potencial tiene un término que representa una
19
pared infinita [2]. Este sistema cuántico tiene aplicaciones prácticas importantes; aquı́ sólo
mencionamos una de ellas: sirve para diseñar trampas cuánticas para atrapar partı́culas
cargadas en ciertos materiales [3]. Este tipo de aplicaciones puede ser útil, por ejemplo,
en nanotecnologı́a. Se ha encontrado solución exacta para este sistema cuántico por el
método tradicional de series de potencias, pero también por el método de factorización [4].
En este trabajo empleamos el método algebraico de factorización para resolver de nuevo
el problema del oscilador isotónico, particularmente el empleado en la Ref. [4], por lo que
nos referiremos de aquı́ en adelante como oscilador de Dongpei, por el autor de dicha
referencia. La novedad consiste en que empezamos con dicho método de factorización
del hamiltoniano por medio de operadores diferenciales de primer orden, como ocurre
con el oscilador armónico lineal, como se reporta en muchos textos de introducción a
la mecánica cuántica [5], pero a diferencia de éste oscilador lineal, los operadores que
factorizan al hamiltoniano del oscilador de Dongpei no sirven como operadores de escalera
es decir, operadores que suben y bajan de nivel cuántico, pues es necesario introducir
otros operadores para ese papel de operadores de escalera, y además, estos operadores son
de segundo orden en las derivadas, lo cual complica el álgebra necesaria para encontrar
la solución. Lo que hemos encontrado y que reportamos en este artı́culo, es que esos
operadores de segundo orden
- se reducen a operadores de primer orden,
- se encuentra un mecanismo que evita realizar las derivadas, incluso las de primer
orden.
El proceso se basa en asegurarse de que en la solución aparezcan los polinomios
asociados de Laguerre, para que entonces se utilicen las propiedades de dichos polinomios,
las cuales se encuentran en la literatura sobre el tema de funciones especiales de la
fı́sica o de polinomios ortogonales de tipo Sturm-Liouville. El trabajo se desarrolla de
la siguiente manera: En la Sección 2 hacemos un repaso del método de factorización
aplicado al oscilador armónico. En la Sección 3 introducimos al oscilador isotónico y sus
principales propiedades. A continuación, en la Sección 4 introducimos los operadores de
segundo orden y algunas de sus propiedades, para que en la Sección 5 los apliquemos al
estado base o estado de mı́nima energı́a. En la Sección 6 construimos los operadores que
factorizan al hamiltoniano y comprobamos que coinciden con los de la Ref. [4]. Después,
en la Sección 7 demostramos la reducción de los operadores de escalera de segundo orden
a operadores de primer orden y luego, utilizando algunas propiedades de los polinomios
asociados de Laguerre, encontramos las funciones de onda y el espectro de energı́as para
el oscilador isotónico. En la Sección 8 calculamos la densidad de probabilidad para este
sistema isotónico y mostramos algunas gráficas para los primeros estados cuánticos que
muestran los lugares donde la partı́cula puede estar. Finalmente en la Sección 9 damos
algunas conclusiones.
1 d2 ψ
− + V (x) ψ = Eψ, (2.1)
2 dx2
se empleó por primera vez y con éxito (en los primeros años de la mecánica cuántica)
para el problema del oscilador armónico. Es un método de solución algebraico muy claro
y elegante. Desafortunadamente no se puede aplicar a cualquier potencial, por lo que
se emplea para pocos sistemas cuánticos. Aquı́ damos una descripción muy breve para el
20
oscilador armónico para que en las siguientes secciones lo apliquemos en detalle al oscilador
isotónico de Dongpei.
El hamiltoniano del oscilador armónico y su factorización están dados por
2
b OA = − 1 d + 1 x2 = b
H ab
1
a+ − , (2.2)
2 dx2 2 2
donde bayb a+ son respectivamente los operadores de ascenso y descenso [5]:
1 d
a= √
b +x (2.3)
2 dx
1 d
a+ = √
b − +x . (2.4)
2 dx
Cada uno de estos operadores son el adjunto uno del otro. Aquı́ debemos recalcar que
los operadores ba+ y ba cumplen las dos condiciones mencionadas arriba:
1) factorizan al hamiltoniano de acuerdo con (2.2),
2) son operadores de escalera en el sentido de que si φn es la función de onda
correspondiente al estado cuántico n, entonces
a+ φn
φn+1 = b (2.5)
φn−1 = b
aφn . (2.6)
Es decir, si se conoce la función de onda de algún estado, con los operadores de escalera
se pueden encontrar absolutamente todas las funciones de onda de todos los estados
propios del hamiltoniano (2.2). Normalmente se encuentra el conjunto de soluciones φ0 ,
φ1 , φ3 ,...,φn ,... de la siguiente manera: Debido a la forma del potencial, el cual es positivo
definido, debe existir un estado de energı́a mı́nima E0 y su función de onda correspondiente
φ0 . Esto se puede representar por
aφ0 = 0
b (2.7)
lo cual indica que ya no hay estados por abajo de E0 . La solución de la ecuación diferencial
(2.7) de primer orden es
2
φ0 (x) = e−x /2
.
Luego, los estados llamados estados excitados E1 , E2 ,..., En ,... se encuentran por la acción
del operador de ascenso de acuerdo a (2.5), empezando con φ0 :
φ1 = a+ φ0
b
φ2 = a+ φ1 = b
b a+ b
a+ φ0
···
21
2.3. Oscilador Isotónico
Como mencionamos en la introducción, este sistema cuántico está definido por un
potencial del tipo
1 2 g
V (x) = x + 2. (2.10)
2 2x
Este potencial tiene un término que es el del oscilador armónico mas un término que
representa una barrera infinita de potencial en el origen, como lo muestra la Figura 1 para
g = 1.
Figura 1: 12 x2 en verde. 1
2x2 en rojo. V (x) = 12 x2 + 1
2x2 en negro
g = l (l + 1) ,
donde l > 0 puede representar el momento angular de la partı́cula en ese potencial esférico.
En nuestro caso l es una constante positiva. Entonces el potencial de este oscilador isotónico
es
1 2 l (l + 1)
Vl (x) = x + (2.11)
2 2x2
De la Figura 2 concluimos que las condiciones de frontera que debe cumplir la función
de onda ψ (x), solución de la ecuación de Schrodinger:
2
b = Eψ =⇒ − 1 d ψ + 1 x2 + l (l + 1) ψ = Eψ,
Hψ (2.12)
2 dx2 2 2x2
son
22
Figura 2: Potencial isotónico
H
b =H b OA + l (l + 1) . (2.15)
2x2
El segundo término de (2.15) sugiere una forma para los nuevos operadores de escalera
mas compleja que (2.3) y (2.4). Tratamos con operadores de segundo orden. En la literatura
se han propuesto varias formas de operadores que contienen segundas derivadas. Tomando
en cuenta la forma del hamiltoniano (2.15), nosotros proponemos al operador
l (l + 1)
Ab=b a−
ab , (2.16)
2x2
que coincide con la que aparece en la Ref. [4], excepto por el denominador (consideramos
que se cometió un error en esa referencia). Sin embargo esta forma no nos permite crear el
estado base o estado de mı́nima energı́a. Una forma mas apropiada para este propósito es
1 1
Ab= b a + √ g2 (x) b a + √ g1 (x) , (2.17)
2 2
donde ba es el operador de descenso (2.3) del oscilador armónico. La expresión (2.17) es
una factorización de (2.15). Las funciones gi (x) , i = 1, 2, dependen solo de la variable
x, sujetas a la condición (2.16). A continuación vamos a ver cómo son esas funciones.
Desarrollando (2.17) encontramos
1 dg1 1 d 1
Ab=b ab
a+ + (g1 + g2 ) + x + g1 g2 . (2.18)
2 dx 2 dx 2
Comparando (2.16) y (2.18), observamos que en el lado derecho de (2.16) no existe el
operador derivada, por lo que g1 + g2 = 0. Esto nos permite concluir que
g1 = −g2 = g,
23
y (2.18) se convierte en
1 dg
Ab=b aba+ − g2 . (2.19)
2 dx
La comparación de (2.16) y (2.19) da lugar a una ecuación tipo Ricatti
dg l (l + 1)
− g2 = − . (2.20)
dx 2x2
Es suficiente con encontrar una solución particular para g (x); sólo debemos cuidar
que se cumplan las condiciones de frontera (2.13) y (2.14). Observando (2.20) podemos
proponer la siguiente forma para g (x):
c
g (x) = . (2.21)
x
Al sustituir (2.21) en (2.20) obtenemos la ecuación algebraica
c2 + c = l (l + 1) ,
con soluciones
l
c= (2.22)
−l − 1
Ası́, la forma deseada de A
b es
c c
A
b= a− √
b a+ √
b . (2.23)
2x 2x
Tenemos entonces dos posibilidades para la constante c. Como hemos dicho antes las
soluciones fı́sicamente aceptables deben cumplir las condiciones de frontera (2.13) y (2.14).
Esto es lo que nos permitirı́a elegir el valor correcto para c.
ψn−1 (x) = Aψ
b n (x) .
En particular, si ψ0 (x) es la función de onda del estado de mı́nima energı́a (ya vimos
que debe existir este estado), entonces
Aψ
b 0 (x) = 0,
lo cual es equivalente, utilizando la forma (2.3) para ba, a la ecuación diferencial de primer
orden
d c
+x+ ψ0 (x) = 0,
dx x
cuya solución es
1 2
ψ0 (x) = x−c e− 2 x .
De los valores (2.22) para c, debemos elegir c = −l − 1 para que se cumpla la condición
de frontera (2.13). Ası́ pues, la función de onda del estado base del oscilador de Dongpei
es
1 2
ψ0 (x) = xl+1 e− 2 x . (2.24)
24
2.6. La Factorización del Halmitoniano
Aunque estamos construyendo un operador de descenso A b y su adjunto A b+ , el cual
servirı́a de operador de ascenso, debemos enfatizar que estos operadores no factorizan
al hamiltoniano (2.15) a la manera del oscilador armónico, (2.2). Aunque para nuestro
propósito no es necesario tener estos operadores, por completez vamos a demostrar a
continuación que existen. Con la elección correcta para la constante c, el operador A b es
l+1 l+1
Ab= b a+ √ a− √
b . (2.25)
2x 2x
La expresión anterior sugiere definir el operador
l+1
b=b
b a− √ . (2.26)
2x
Se encuentra fácilmente que su adjunto es
l+1
bb+ = b
a+ − √ . (2.27)
2x
Para demostrar que factorizan al hamiltoniano del oscilador isotónico (2.15), hacemos
b+b
el producto b a+ y b
b. En términos de b a ese producto es
l (l + 1)
b+b
b b=b a+ b
a+ − l − 1.
2x2
Pero de la ecuación (2.2) obtenemos
1 d2 1 1
a+ b
a=− + x2 − ,
2 dx2
b
2 2
por lo que
1 d2 1 l (l + 1) 3 b − l − 3.
b+b
b b=− + x2 + −l− =H
2 dx2 2 2x2 2 2
De la ecuación (2.2) para el hamiltoniano obtenemos finalmente la factorización de H
b
3
Hb =bb+bb+l+ . (2.28)
2
La ecuación (2.28) coincide con la ecuación (2.4) de Dongpei [4], aunque con diferente
notación. Como una nota final de esta sección, podemos afirmar que la idea común de
que los operadores que factorizan al hamiltoniano son también los operadores de ascenso
y descenso, no es correcta, al menos en este oscilador isotónico de Dongpei.
b+ = b l (l + 1)
A a+ b
a+ − , (2.29)
2x2
lo cual se demuestra con un cálculo sencillo. Al sustituir la expresión diferencial (2.4) de
a+ en (2.29) obtenemos
2
b+ = 1 d − 2x d + x2 − 1 − l (l + 1) .
A (2.30)
2 dx2 dx x2
25
Apliquemos este operador al estado base,
1 2
ψ0 (x) = xl+1 e− 2 x ,
obteniéndose
b+ ψ0 = −2 −x2 + l + 1 + 1 ψ0 .
A (2.31)
2
El polinomio asociado de Laguerre de grado 1 es Ref. [6]
Lα
1 (ξ) = −ξ + α + 1. (2.32)
La identificación de (2.31) y (2.32) nos permite escribir a (2.31), con el cambio de
variable ξ = x2 y con α = l + 21 , ası́:
b+ ψ0 = −2Lα
A 1 x
2
ψ0 .
b+ es el operador de ascenso, entonces la función de onda del primer
Si efectivamente A
estado excitado del oscilador isotónico es
l+ 1
b+ ψ0 = C1 L x2 ψ0 (x) ,
2
ψ1 (x) = c1 A 1 (2.33)
donde c1 y C1 son constantes de fase que no tienen ningún papel relevante en lo que sigue.
Se puede demostrar que ψ1 (x) se puede escribir ası́:
1 d2 Lα 2α dLα
0 0 α α
ψ1 (x) = + −4x + − 4L1 L 0 ψ0 ,
2 dx2 x dx
siendo Lα0 el polinomio de Laguerre de grado cero. De la misma manera se demuestra que
1 d2 Lα 2α dLα
1 1 α α
ψ2 (x) = + −4x + − 4L1 L 1 ψ0 ,
2 dx2 x dx
y, en general que
1 d2 Lα 2α dLα
n n α α
ψn+1 (x) = + −4x + − 4L 1 L n ψ0 . (2.34)
2 dx2 x dx
Ahora vamos a reducir el orden de la segunda derivada. Recordando que ξ = x2 , la
relación entre derivadas es
d2 Lα dLα
ξ 2
n
+ (α + 1 − ξ) n
+ nLα n = 0. (2.36)
dξ dξ
Combinando (2.35) y (2.36) encontramos que la segunda derivada en términos de
variable x es
d2 Lα dLα
2α + 1
2
n
= − + 2x n
− 4nLα n. (2.37)
dx x dx
Uno de los usos que se le puede dar a esta última igualdad es transformar al operador
b+ , que en su versión original (2.30) es un operador diferencial de segundo orden, a un
A
operador de primer orden pero aplicado únicamente a polinomios de Laguerre
2α + 1 dLα
2
b+ Lα x −1 l (l + 1)
A n = − n
+ − − 2n Lα
n.
2x dx 2 2x2
26
Sin embargo no es éste nuestro propósito. Sustituyendo (2.37) en (2.34) conseguimos
una nueva manera de calcular ψn+1 (x):
dLα
ψn+1 (x) = −x n − (2n + 2Lα α
1 ) Ln ψ0 . (2.38)
dx
Hemos reducido el orden de la derivada, pero no nos quedamos ası́. En [6] se encuentra
la siguiente propiedad de los polinomios asociados de Laguerre
d α
ξ Ln (ξ) = (n + 1) Lα α
n+1 (ξ) − (n + α + 1 − ξ) Ln (ξ) .
dξ
De nuevo cambiamos de variable ξ = x2 y entonces la expresión anterior se convierte
en
d α 2
Ln x − 2n + 2Lα 2 α
Ln x2 = −2 (n + 1) Lα 2
−x 1 x n+1 x .
dx
Sustituyendo la expresión dentro del paréntesis cuadrado de la Ec. (2.38) llegamos
finalmente a la función de onda del estado n:
Ab+ H
b =H bA b+ − 2Ab+ . (2.40)
Aplicamos el operador hamiltoniano, Ec. (2.28), a la función del estado base
3 3
Hψ
b 0= b b+b b+l+ ψ0 = l + ψ0 , (2.41)
2 2
pues ya vimos que
l+1
bψ0 = b
b a− √ ψ0 = 0.
2x
Ahora aplicamos el operador de ascenso a (2.41) quedando
A b 0 = l+ 3 A
b+ Hψ b+ ψ0 = l + 3 ψ1 . (2.42)
2 2
Ahora sustituimos (2.40) en el lado izquierdo de (2.42) y con la relación de valor propio
Hψ
b 1 = E1 ψ1 encontramos la energı́a del primer estado excitado
3
E1 = 2 + l +.
2
Repitiendo el mismo procedimiento encontramos el espectro de energı́a
3
En = 2n + l + , n = 0, 1, 2, . . . (2.43)
2
Con la función de onda (2.39) para el estado n y su correspondiente energı́a (2.43),
hemos resuelto el problema del oscilador isotónico de Dongpei. Enfatizamos el hecho de
que para encontrar la función de onda (2.39) no tuvimos que hacer derivaciones en ningún
momento; únicamente utilizamos propiedades del polinomio asociado de Laguerre.
27
2.8. Densidad de Probabilidad
En esta sección vamos a analizar algunas consecuencias que se derivan de los resultados
obtenidos en las secciones anteriores, en relación con el aspecto probabilı́stico de la función
de onda, la cual expresamos, mediante (2.22) y (2.37), como
1 2
ψn (x) = Cn xl+1 e− 2 x Lα
n x
2
. (2.44)
Como toda teorı́a probabilı́stica, la mecánica cuántica tiene una función de distribución,
la cual es, para el estado cuántico n:
2 2
ρln (x) = |ψn (x)|2 = Cn2 x2l+2 e−x Lα 2
n x (2.45)
y con la condición
Z ∞
ρln (x) dx = 1. (2.46)
−∞
1 2 l (l + 1)
Vl (x) = x + .
2 2x2
A continuación vamos a graficar la densidad de probabilidad para los estados n = 0, 1, 2
de la familia l = 1. El potencial para la familia de sistemas l = 1 es
1 2 2
x + 2
Vl=1 (x) =
2 2x
y la densidad de probabilidad correspondiente es
2 2
ρ1n (x) = x4 e−x Lα 2
n x .
Estado cuántico n = 0
2
1 2 2
ρ00 (x) = L02 x2 e−x = x2 e−x .
Estado cuántico n = 1
2 2
3 2 5 2
ρ11 (x) = L12 x4 e−x = −x2 + x4 e−x .
2
Estado cuántico n = 2
2 2
3 2 1 35 2
ρ12 (x) = L22 x4 e−x = x4 − 5x2 + x4 e−x .
2 4
Observamos alguno hechos que son comunes a los tres estados cuántico de la familia
l = 1: Al acercarse a x = 0 la densidad de probabilidad se anula, lo cual es un reflejo de la
condición de frontera para la función de onda
limx→0 ψ (x) = 0.
y lo mismo ocurre para la segunda condición de frontera en −→ ∞
28
Figura 3: Gráfica de ρ10 (x)
lim ψ (x) = 0.
x→∞
El segundo hecho que se observa en las gráficas es que existen picos o máximos, lo
mismo que valles o mı́nimos. Esto es un reflejo del carácter ondulatorio de los objetos
cuánticos. Los máximos se pueden interpretar como aquellos lugares donde la partı́cula
puede estar con mayor probabilidad. Para los mı́nimos la probabilidad de localización es
menor.
2.9. Conclusiones
En este trabajo hemos analizado algunos aspectos del oscilador isotónico de Dongpei,
como la naturaleza del potencial que presenta una pared infinita en el origen, el método
algebraico de solución, en el que hemos realizado una contribución que permite encontrar
esa solución de manera clara y rápida, y finalmente hemos hecho un análisis gráfico de las
soluciones que resaltan la naturaleza probabilistica de la mecánica cuántica.
29
Figura 5: Gráfica de ρ12 (x)
Referencias
1. F. Calogero, Solution of a three-body problem in one dimension, Journal of
Mathematical Physics 10, 1969.
2. P. Camiz et al, Exact solution of a time-dependent quantal harmonic oscilator with
a singular perturbation, Journal of Mathematical Physics 12, 1971.
3. V. V. Dodonov et al. Quantum singular oscillator as a model of a two-ion trap: An
amplification of transition probabilities due to a small-time variations of the binding
potential, Physical Review A 57, 1998.
4. Z. Dongpei. A new potential with the spectrum of an isotonic oscillator, Journal of
Physics 20, 1897.
5. D. J. Griffiths, Introduction to Quantum Mechanics, 2nd ed., Prentice Hall, N.J.,
2005.
6. I. S. Gradshtein and I. M. Ryzhik, Table of Integrals, Series and Products, Seventh
Edition, D. Zwillinger, Editor, Academic Press, Amsterdam, 2007.
30
Modelación con Estadı́stica y Probabilidad
ISBN: 978-607-525-442-5
CAPÍTULO 3
Abstract. Structural equation models allow estimating the effect and relationships
between multiple latent variables by proposing the type and direction of relations between
them. Partial least squares (PLS) is an fit technique of these models. The methodology of
the adjusted models with PLS is presented. The modeling is illustrated with a study to
measure the satisfaction of the students’Polytechnic University of Chimborazo (Ecuador).
The cause-effect structure used considers seven latent variables: Image, Expectation,
Hardware, Software, Perceived Value, Satisfaction and Loyalty.
3.1. Introducción
Los modelos de ecuaciones estructurales (MEE) son modelos estadı́sticos que nacen de
la necesidad de dar de mayor flexibilidad a los modelos de regresión y su uso se ha extendido
31
entre las ciencias sociales en particular esta difusión se ha observado en el campo de la
economı́a y la dirección de empresas (Cepeda y Roldan, 2004).
Los MEE implican generalizaciones y extensiones de las técnicas de análisis
multivariado de primera generación (Chin, 1998), tales como el análisis de regresión, el
análisis de trayectorias, el análisis factorial, el análisis de correlación canónico, ANOVA,
MANOVA, ANCOVA, MANCOVA, los sistemas de ecuaciones simultáneas y el análisis de
las matrices multiconcepto-multimétodo.
Los MEE, superan considerablemente a las diversas técnicas del análisis multivariado
de primera generación ya que permiten estimar una serie de relaciones de dependencia
interrelacionadas simultáneamente por medio de la combinación de aspectos de la regresión
múltiple y el análisis factorial. Por tanto, esta técnica estadı́stica posibilita analizar de
forma única, sistemática e integrada, el modelo de medición, que vincula a un constructo
latente con sus variables observables y el modelo estructural, que relaciona a los diferentes
constructos entre sı́ (Cepeda y Roldan, 2006).
Hernan Wold desarrolló en 1957 un enfoque de estimación conocido como Mı́nimos
Cuadrados Parciales (MCP). Los procedimientos matemáticos y estadı́sticos subyacentes
a MCP son rigurosos y robustos pero a la vez permiten que el modelo sea flexible en el
sentido de que no establece premisas relativas a los niveles de medición, la distribución de
los datos ni al tamaño de la muestra.
Como consecuencia de su habilidad para modelar constructos latentes bajo condiciones
de no normalidad y con tamaños muestrales pequeños y medianos (Chin et al., 2003), la
utilización de esta técnica de optimización de MCP ha sido objeto de un interés creciente
entre los investigadores en ciencias sociales en los últimos años (Campeau y Higgins, 1995;
Aubert, et al., 1994; Chin y Gopal, 1995).
Para realizar el análisis a través de MEE podemos utilizar dos tipos de técnicas
estadı́sticas y sus correspondientes programas informáticos de referencia: Métodos basados
en el análisis de covarianzas y los Métodos basados en MCP.
La elección de un método u otro dependerá básicamente de los objetivos de la
investigación, del conocimiento que se tenga de la teorı́a, de las propiedades de los datos
y del desarrollo de medidas (Chin, 1998a).
En este sentido, no se trata de procedimientos excluyentes, sino complementarios, al
ser técnicas de análisis multivariado que tratan de modelar las relaciones entre variables
latentes dependientes e independientes de manera simultánea (Chin et al., 1996; Gefen et
al., 2000).
Finalmente, ilustramos esta metodologı́a con un estudio para medir la calidad de la
educación en la Escuela Superior Politécnica del Chimborazo (Ecuador), desde la visión
de la satisfacción de los estudiantes. Presentamos una propuesta para construir ı́ndices
compuestos con Modelos de Ecuaciones Estructurales (MEE) ajustados con Mı́nimos
Cuadrados Parciales (MCP), usando el paquete Plspm de R.
32
p × q, respectivamente. El componente ε es un vector p × 1 de errores aleatorios.
Los supuestos del modelo estructural es que sus componentes estocásticos satisfacen
las condiciones E (ε) = 0, Var (ε) = Σε , Cov (η, ε) = 0, Cov (ξ, ε) = 0, lo que tiene como
consecuencia la especificación predictiva
E (η | η, ξ) = Bη + Γξ.
Y = ΛY η + δY
X = ΛXη + δX
33
Sea ξ = ξ1 , . . . , ξp el vector de variables latentes (tanto exógenas como endógenas).
Cada variable latente ξj tiene sus variables de medición o indicadoras, estas variables se
observan en n elementos, lo que resulta en p matrices X1 , . . . , XP de tamaño n × kj , (j =
1, . . . , p). El modelo estructural tiene p ecuaciones que describen las relaciones entre ellas
X
ξj = βj0 + i → j βji ξi + εj
i→j
donde significa que la variable latente ξi es predictora para la variable latente ξj . Los
coeficientes βji se llaman coeficientes estructurales, βj0 es el intercepto y εj es un término
de error aleatorio. En el algoritmo de MCP la especificación estructural del modelo debe
ser recursiva, esto significa que no debe contener ciclos causales, es decir que en alguna
ecuación del modelo una variable latente sea explicatoria de otra y en otra ecuación del
modelo los roles se inviertan. Los supuestos distribucionales son
X
E (ξj | ξi ) = Bj0 + βji ξi .
i→j
El modelo de medición postula las relaciones entre las variables latentes con sus
respectivas variables de medición, es decir, el modelo de medición relaciona a ξj con sus
respectiva matriz Xj . Como ya se vio en la sección anterior, esto puede ser de forma
reflexiva o formativa. Si la especificación es reflexiva se tiene:
En ambas especificaciones, reflexiva o formativa, los coeficientes λjk se llaman cargas y los
λ0 son interceptos.
Los coeficientes ωjk se llaman pesos y las variables latentes estimadas ξˆj se llaman scores.
Este aspecto es fundamental en MCP y estimación de las variables latentes mediante los
scores se hace en términos de sus indicadoras sin importar si la especificación del modelo
de medición es reflexiva o formativa.
34
3.3.3. El Algoritmo de MCP
Los enfoques más conocidos para analizar MEE, y por tanto más utilizados, son los
basados en el Análisis de Estructuras de Covarianzas, estos enfoques buscan proporcionar
una descripción de los mecanismos causales.
Wold desarrolló en 1957 un enfoque de estimación conocido como Mı́nimos Cuadrados
Parciales (MCP).
El algoritmo de MCP tiene tres etapas:
1. Producir los pesos ωjk para construir los scores ξˆj .
2. Estimar los coeficientes estructurales βji del modelo estructural.
3. Estimar las cargas λjk del modelo de medición.
La etapa clave del algoritmo es la primera: obtener los escores ξˆj . Esta etapa se lleva a
cabo mediante un proceso iterativo. Este proceso inicia con valores arbitrarios iniciales de
los pesos, con estos valores se producen otros valores de los pesos y ası́ sucesivamente
hasta que se alcanza un criterio de convergencia numérica y se obtienen los scores |
ξˆj , (j = 1, . . . , p). Notemos que cada ξˆj es un vector n × 1, es decir, ξˆj = ξˆ1j , ξˆ2j , . . . , ξˆnj
y que ξˆij es el score de la variable latente j del elemento i. Wold, H. (1980).
En la etapa 2 se obtiene al modelo estructural estimando a los coeficientes estructurales
βji de cada ecuación del modelo estructural
X
ξj = βj0 + βji ξi + ξi
i→j
35
1. La unidimensionalidad de ξj se verifica con un análisis de componentes principales
de Xj , si el primer eigenvalor es mayor que 1 y el segundo eigenvalor es menor que
1 se considera que hay unidimensionalidad.
2. El alfa de Cronbach
P
h6=h0 Corr(Xhj , Xh0 j ) kj
αj = P × .
kj + h6=h0 Corr(Xhj , Xh0 j ) kj − 1
Valores de αj mayores que 0.7 se consideran indicativos de unidimensionalidad.
3. La ρ de Dillon-Goldstein
P 2
kj
k=1 λkj Var(ξj )
ρ j = P 2 .
kj Pkj
k=1 λkj Var(ξj ) + k=1 Var(εkj )
2. Las cargas λ̂ij . Son las correlaciones de cada variable de medición con las
variables latentes construidas con el modelo ajustado y las cargas cruzadas son
las correlaciones entre una variable latente con las restantes variables de medición.
En este caso, las cargas son mayores que las cargas cruzadas.
3. Los ı́ndices de comunalidad cuantifican la calidad de medición de cada variable
latente ξj en términos de sus indicadoras Xj
kj
1 X
ICj = Corr2 Xkj , ξˆj .
kj
k=1
Un ICj mayor que 0.5 es lo ideal ya que esto señala que las indicadoras explican
más del 50 % de varianza de ξj .
36
3.5. Modelo de Satisfacción INSPOCH
El ı́ndice de satisfacción INSPOCH está anidado en una estructura de relaciones que
inicia con la Imagen y la Calidad Percibida, ésta se divide en dos variables:
37
38
3.6.1. Ecuaciones del Modelo
Se proponen las ecuaciones para los modelos: Estructural y de Medición de las
siguientes variables latentes:
LV1 : Imagen
LV2 : Expectativa
LV3 : Hardware
LV4 : Software
LV5 : Valor Percibido
LV6 : Satisfacción
LV7 : Lealtad
Cov (LVj , ej ) = 0
Para el cálculo del INSPOCH las ecuaciones del modelo estructural son
donde Xjk son las variables manifiestas del modelo. Sus especificaciones distribucionales
son
E (Xjk | LVj ) = λ0jk + λjk LVj
Para el cálculo del INSPOCH las ecuaciones del modelo la medición son
X11 = λ011 + λ11 LV1 + e11
X12 = λ012 + λ12 LV1 + e12
Para LV1
X13 = λ013 + λ13 LV1 + e13
X14 = λ014 + λ14 LV1 + e14
X21 = λ021 + λ21 LV2 + e21
X22 = λ022 + λ22 LV2 + e22
X23 = λ023 + λ23 LV2 + e23
Para LV2
X24 = λ024 + λ24 LV2 + e24
X25 = λ025 + λ25 LV2 + e25
X26 = λ026 + λ26 LV2 + e26
39
X31 = λ031 + λ31 LV3 + e31
X32 = λ032 + λ32 LV3 + e32
X33 = λ033 + λ33 LV3 + e33
Para LV3 X34 = λ034 + λ34 LV3 + e34
X35 = λ035 + λ35 LV3 + e35
X
36
= λ036 + λ36 LV3 + e36
X37 = λ037 + λ37 LV3 + e37
X41 = λ041 + λ41 LV4 + e41
Para LV4 X42 = λ042 + λ42 LV4 + e42
X43 = λ043 + λ43 LV4 + e43
X51 = λ051 + λ51 LV5 + e51
Para LV5 X52 = λ052 + λ52 LV5 + e52
X53 = λ053 + λ53 LV5 + e53
X61 = λ061 + λ61 LV6 + e61
Para LV6 X62 = λ062 + λ62 LV6 + e62
X63 = λ063 + λ63 LV6 + e63
X71 = λ071 + λ71 LV7 + e71
X
72
= λ072 + λ72 LV7 + e72
Para LV7 X73 = λ073 + λ73 LV7 + e73
X74
= λ074 + λ74 LV7 + e74
X75 = λ075 + λ75 LV7 + e75
Sat = ω1 S1 + ω2 S2 + ω3 S3
donde S̄1 , S̄2 , S̄3 , . . . , S̄n son los promedios de las variables indicadoras de satisfacción y
ŵ1 , ŵ2 , ŵ3 , . . . , ŵn son los pesos estimados.
40
3.7. Resultados
Partimos por evaluar el modelo de medición mediante las alfas de Cronbach y Rho
de Dillon, resultando ser mayores a 0.7 el cual indica que existe unidimensionalidad, esto
significa que las variables manifiestas describen adecuadamente a su respectiva variable
latente, como se muestran en la cuadro 1.
Evaluando los resultados de las cargas exteriores que resultan ser mayores que las
cargas transversales para todas las variables latentes y las variables de medición. Además,
al recorrer las correlaciones de cada variable de medición con las variables latentes, las
variables de medición están más correlacionadas con su variable latente que con las otras
variables latentes, existiendo una validez discriminante a nivel de variable de medición,
como se muestran en la cuadro 3.2.
41
Cuadro 3.2: Cargas exteriores y Cargas transversales para el modelo de medición
INSPOCH
Finalmente, el ı́ndice GoF, en este caso resulta ser de 0.66, lo que nos describe la
calidad general del modelo de interior y exterior considerando la comunalidad y los valores
de R2 satisfactoriamente.
42
Se puede identificar al Valor Percibido como el principal motor de la Satisfacción. La
calidad percibida de los elementos humanos y no-humanos son los conductores más débiles
con efecto similar en la Satisfacción.
3.8. Conclusiones
Los Modelos de Ecuaciones Estructurales resultan ser de gran utilidad puesto que
permiten proponer el tipo y dirección de las relaciones que se espera encontrar entre
las diversas variables contenidas en él, permitiendo estimar los parámetros que vienen
especificados por las relaciones propuestas teóricamente. Denominados también modelos
confirmatorios, ya que el interés fundamental es çonfirmar”mediante el análisis de la
muestra las relaciones propuestas entre las variables en estudio.
El campo de aplicación de los MEE ajustados con MCP se evidencian en el
ámbito social y educativo. Existen varios estudios a nivel mundial se han utilizado esta
metodologı́a. En este estudio se presentó la metodologı́a explicada que permitió estimar el
modelo de satisfacción, reflejando un bajo porcentaje de percepción de la satisfacción de
los estudiantes, con un ı́ndice compuesto llamado INSPOCH del 72.94.
Referencias
1. Bollen K. A., Structural equations with latent variables, Wiley, New York, 1989.
2. Cepeda, G.; y Roldán, J.L., Aplicando la Técnica PLS en la Administración
de Empresas. Conocimiento y Competitividad. Congreso ACEDE (14). Núm. 14.
Murcia, 2004.
3. Cepeda, G.; y Roldán, J.L., Aplicando en la practica la técnica PLS en la
administración de empresas. Libro Actas XIV, Congreso de ACEDE, Murcia, 2006.
4. Campeau, D.R., and Higgins, C.A., Computer Self-Efficacy: Development of a
Measure and Initial Test, MIS Quarterly, Vol. 19, No. 2, pp. 189-211, 1995.
5. Chin, W.W., The partial least squares approach for structural equation modeling. In:
Marcoulides, G.A. (Ed.), Modern Methods for Business Research. Lawrence Erlbaum
Associates, London, 1998.
6. Wold, H., Soft Modeling: Intermediate between Traditional Model Building and Data
Analysis?, Mathematical Statistics, 6, pp. 33-346, 1980.
43
44
Modelación con Estadı́stica y Probabilidad
ISBN: 978-607-525-442-5
CAPÍTULO 4
4.1. Introducción
En el pasado, el análisis de datos, de manera cualitativa buscaba encontrar patrones
que le ayudarán a tomar decisiones acertadas en los negocios y/o actividades humanas,
45
sin usar planteamientos rigurosos. En la actualidad no se concibe el buen juicio, ni crı́tica
en el pronóstico de negocios, actividades comerciales e industria, sin Matemáticas.
En el estudio de datos econométricos con frecuencia se usan modelos matemáticos como
instrumentos de análisis [1], algunos de ellos, son los modelos de crecimiento exponencial,
logı́sticos y/o Gompertz. Sin embargo, el uso de modelos alternativos enriquece las
posibilidades de los analistas económicos.
En este sentido, el presente inicia con la exposición de modelos de crecimiento
ampliamente conocidos en la literatura de la especialidad, que permitieron comparar los
resultados obtenidos con éstos y el modelo logı́stico de base secante hiperbólica al cuadrado,
que es el modelo objetivo de este trabajo.
En muchas aplicaciones, la velocidad de cambio de una variable es proporcional al valor
de P (t). Cuando es una función de tiempo, la proporción se escribe [2]:
dP (t)
= −kP (t). (4.1)
dt
Aplicando el método de separación de variables:
Z P (t) dP (t)
Z t
=k dt
P (t)0 P (t) 0
.
Integrando, resulta el modelo exponencial:
!
dP (t) P (t)
= kP (t) 1 − , (4.3)
dt P (t)∞
en donde k y P son constantes positivas, pero la segunda no crece indefinidamente, sino
que se aproxima a P∞ (valor asintótico) que se determina por progresión geométrica.
Al aplicar el método de separación de variables y, fracciones parciales:
dP (t) dP (t)
Z Z Z
− =k dt
dt P (t)∞ − P (t)
.
Integrando
P (t)∞
P (t) = , (4.5)
1 + C1 e−kt
en donde C1 y k son constantes.
Modificando el modelo anterior para incrementar la bondad de ajuste numérico sobre
datos económicos, se puede escribir el modelo logı́stico de base cuadrática [4] como:
46
P (t)∞
P (t) = , (4.6)
1 + ea2 t2 +a1 t+a0
en donde a1 , a2 y a3 son constantes y P (t)∞ es el valor máximo asintótico de la variable
P (t).
Como se indicó al principio del presente, el objetivo fue usar un modelo logı́stico
fundamentado en la secante hiperbólica [6], ya que su gráfica corresponde a una campana
envolvente y, ésta es más sensible al usar el cuadrado de la misma. Resulta interesante el uso
de la mitad del modelo citado para ajustar datos que describan una evolución sigmoidal,
como es el caso que nos ocupa.
Entonces, la función secante hiperbólica al cuadrado se escribe:
P = secht. (4.7)
Adicionando los respectivos parámetros de cambio de desplazamiento y escala, el
modelo resulta:
Z t P (t)m
Z t
P (t)dt = sech2 k1 (t − tm ) dt
−∞ k1 −∞
2P (t)m
P (t)C∞ = , (4.9)
k1 ∆t
en donde ∆t es el intervalo usado para en la distribución de peso estadı́stico y 0.5 es
su valor numérico.
Entonces, la ecuación funcional cumulativa es:
P (t)C∞
P (t)C = [1 + tanh (t − tm )] , (4.10)
2
en donde P (t)C es el número cumulativo de individuos.
En base a lo anterior, el modelo logı́stico corresponde a la mitad de la función
cumulativa, es decir:
" #
P (t)C∞ k
P (t)C = 1 + tanh (t − tm ) . (4.11)
2 2
47
4.2. Datos del Producto Interno Bruto de Brasil,
México y China
De acuerdo con estudios económicos, se espera que para el año 2020 haya un cambio
importante en el equilibrio global del poder económico mundial en comparación con el
actual. Las economı́as emergentes crecerán con gran importancia y la República Popular
de China habrá superado a los Estados Unidos de Norteamérica para liderar la lista de las
diez economı́as más grandes del mundo con relación al producto Interno Bruto PIB [6], el
cual expresa el valor monetario de la producción de bienes y servicios de demanda final de
un paı́s o región durante un periodo de tiempo determinado.
Para el desarrollo del presente fueron considerados los datos del PIB per cápita de
tres paı́ses, un paı́s emergente como Brasil, la República Popular de China que en el
futuro próximo se espera encabece la lista de las economı́as más importantes del orbe,
y desde luego México. Los datos de PIB per cápita corresponden al periodo de 1960 al
año 2013, obtenidos de una fuente económica [7]. En la Figura 1 se ilustran los datos
señalados para los tres paı́ses en estudio, el tiempo fue codificado para simplificar los
cálculos t = fecha − 1960 .
Figura 1: Datos de producto Interno Bruto (PIB) per cápita de Brasil, México y
China del periodo de 1960 al año 2013.
48
4.2.1. Ajuste Numérico de los datos del PIB de Brasil,
México y China
El ajuste numérico del modelo exponencial (2), indicado en antecedentes, para los
datos del PIB de Brasil, condujo al modelo numérico-funcional siguiente:
PIB(t)Brasil = 275.3106e0.0711t ,
(4.12)
r = 0.99998.
PIB(t)México = 410.0176e0.0661t ,
(4.13)
r = 0.949370.
Dicho ajuste se ilustra en la Figura 3, en ella se observa una bondad de ajuste numérico
significativa la 95 % de confianza estadı́stica, de acuerdo al coeficiente de correlación r , y
k = 0.0661 que indica un crecimiento del PIB per cápita.
49
Figura 3: Ajuste numérico del modelo exponencial sobre el PIB de México
correspondiente al periodo de 1960 al año 2013.
Para el PIB per cápita de la República Popular de China, el ajuste exponencial condujo
al modelo numérico-funcional siguiente:
PIB(t)China = 45.9843e0.0817t ,
(4.14)
r = 0.9182071.
Se observa en la Figura 4, la bondad de ajuste significativa al 90 % de confianza
estadı́stica, de acuerdo al coeficiente de correlación r, en cuanto al crecimiento del PIB per
cápita, se observa que China muestra un mayor crecimiento que Brasil y México.
Continuando con el estudio, se procedió a ajustar el modelo logı́stico (4) a los datos
que dan pie al documento. Lo anterior, aplicando mı́nimos cuadrados a la correspondiente
transformación lineal, determinando previamente el valor numérico de la ası́ntota P =
12600 mediante progresión geométrica.
50
La ecuación siguiente corresponde al modelo numérico- funcional logı́stico base
exponencial para los datos de Brasil:
12600
PIB(t)Brasil = ,
1 + 88.3929e−0.1201t (4.15)
r = 0.8413829.
Figura 5: Ajuste numérico del modelo logı́stico base exponencial sobre el PIB de
Brasil correspondiente al periodo de 1960 al año 2013.
El resultado correspondiente para el Producto Interno Bruto per cápita de México fue:
10350
PIB(t)México = ,
1 + 54.861e−0.12878t (4.16)
r = 0.9424026.
51
Figura 6: Ajuste numérico del modelo logı́stico base exponencial sobre el PIB de
México correspondiente al periodo de 1960 al año 2013.
6850
PIB(t)China = ,
1 + 269.4873e−0.12026t (4.17)
r = 0.926456.
El nivel de ajuste del modelo logı́stico base exponencial para los datos del PIB per
cápita de China se muestran en la Figura 7, se observó una significancia del 90 % de
confianza estadı́stica. Igual que en los casos de Brasil y México, se observa k = −0.12, es
decir un decrecimiento del PIB per cápita.
Figura 7: Ajuste numérico del modelo logı́stico base exponencial sobre el PIB de
China correspondiente al periodo de 1960 al año 2013.
52
modelo logı́stico fue modificado usando una base cuadrática. Los resultados a continuación
se presentan, el modelo numérico-funcional para los datos del PIB de Brasil fue:
12600
PIB(t)Brasil = ,
1 + e−00024t2 −0.0117t+3.5678 (4.18)
r = 0.86541514.
Figura 8: Ajuste numérico del modelo logı́stico base cuadrática sobre el PIB de
Brasil correspondiente al periodo de 1960 al año 2013.
El resultado del mismo modelo, pero con los datos del PIB de México para el periodo
en estudio, fue:
10350
PIB(t)México = ,
1+ e−00023t2 −0.0048t+2.9602 (4.19)
r = 0.9669989.
53
Figura 9: Ajuste numérico del modelo logı́stico base cuadrática sobre el PIB de
México correspondiente al periodo de 1960 al año 2013.
6850
PIB(t)México = ,
1 + e−00041t2 −0.1004t+3.7372 (4.20)
r = 0.95323176.
Figura 10: Ajuste numérico del modelo logı́stico base cuadrática sobre el PIB de
China correspondiente al periodo de 1960 al año 2013.
Finalmente, el ajuste del modelo logı́stico de base hiperbólica para los datos del PIB
per cápita de Brasil se indica en la ecuación siguiente:
54
" #
12600 0.1201
PIB(t)Brasil = 1 + tanh (t − 37.3151) ,
2 2 (4.21)
r = 0.841382905.
Figura 11: Ajuste numérico del modelo logı́stico base hiperbólica sobre el PIB de
Brasil correspondiente al periodo de 1960 al año 2013.
La ecuación numérico-funcional del PIB per cápita de México para el periodo de 1960
a 2013 fue:
" #
10350 0.1288
PIB(t)México = 1 + tanh (t − 31.097) ,
2 2 (4.22)
r = 0.9424026.
55
Figural 12: Ajuste numérico del modelo logı́stico base hiperbólica sobre el PIB de
México correspondiente al periodo de 1960 al año 2013.
" #
6850 0.1203
PIB(t)China = 1 + tanh (t − 46.539) ,
2 2 (4.23)
r = 0.905843.
Figura 13: Ajuste numérico del modelo logı́stico base hiperbólica sobre el PIB de
China correspondiente al periodo de 1960 al año 2013.
56
4.3. Conclusiones
Del presente trabajo se concluye que el modelo logı́stico de base hiperbólica ajustado
a los datos del Producto Interno Bruto per cápita de Brasil, México y la República
Popular de China presentó un nivel de ajuste numérico similar a los realizados con
modelos de crecimiento, como el modelo exponencial y/o los modelos logı́sticos de base
exponencial y cuadrática. Cabe destacar, que la evaluación numérica del modelo logı́stico
de base hiperbólica se realizó a través de aplicar mı́nimos cuadrados a la correspondiente
transformación lineal algebraica del modelo. Por ello, para realizar el estudio se requiere
de una calculadora escolar que disponga de regresión lineal simple. En cuanto a la
interpretación de las constantes numéricas de los modelos usados en el estudio, se puede
decir que en el caso del modelo exponencial para el PIB per cápita de Brasil y México el
crecimiento fue del orden de 0.07, aunque para China fue del orden de 0.08; en cuanto al
modelo logı́stico, en los tres casos se presenta un decrecimiento similar, que es del orden
de 0.12, cada uno con sus respectivos cambios de escala. En cuanto al modelo logı́stico
de base hiperbólica, se presentan constantes de crecimiento similar, al igual que el caso
anterior respetando los cambios ya señalados, propios de cada economı́a.
Referencias
1. beta.inegi.org.mx
2. Guillén, G., et al. (2005). Ajuste a modelos no lineales sin el uso de computadoras,
Revista Contactos, UAMI, No. 58, pp. 11-20.
3. Guillén, G., Islas, A. M.; (2004), El modelo de campana de Phillips como función
densidad de muestra en ingenierı́a textil, ContactoS, No. 52, p. 53.
4. https://megaricos.com/.../las-10-economias-mas-grandes-del-mundo-2013.
5. Islas, A. M., et al., (2016), El ingreso per cápita de los mexicanos, Revista electrónica
Humanidades, Tecnologı́a y Ciencia del IPN, ISSN 2007-1957, Julio-diciembre.
6. Larson, R., (2014), Cálculo Tomo I. Décima Edición, CENGAGE Learning, ISBN
978-1-285-05709-5, p. 408.
7. Lorı́a Dı́az de Guzmán, E. G., (2007), Econometrı́a con aplicaciones. Primera edición,
Pearson Prentice Hall, ISBN 13: 978-970-26-1023-6, pp. 35-36.
8. Lorı́a Dı́az de Guzmán, E. G., Econometrı́a con aplicaciones. Primera edición,
Pearson Prentice Hall, ISBN 13:978-970-26-1023-6, 2007.
57
58
Modelación con Estadı́stica y Probabilidad
ISBN: 978-607-525-442-5
CAPÍTULO 5
Itzel A. Sosa-Sánchez
Centro Regional de Investigaciones Multidisciplinarias,
Universidad Autónoma de México,
Av. universidad s/n, Circuito 2, Col. Chamilpa
Ciudad Univesitaria de la UAEM, Cuernavaca Morelos
C.P. 62210, México.
[email protected]
59
trends among indigenous female adolescents in Mexico. The results show that exist
significant differences in the socioeconomic conditions and the reproductive health trends
among this population according to their ethnic (indigenous) condition. The results show
the specificities of the indigenous adolescent fertility and reproductive trends making
visible the effect of diverse structural inequalities on the reproductive behavior among
this population.
Palabras clave: desigualdad social, indı́genas, adolescentes, fecundidad, salud
reproductiva.
5.1. Introducción
México ocupa el octavo lugar en el mundo entre los paı́ses con mayor número de
pueblos indı́genas en su territorio [10]. Si bien la población indı́gena en este paı́s no es
un grupo homogéneo en general, la población indı́gena forma parte de los estratos más
pobres, discriminados y desfavorecidos, y tiene niveles de vida por debajo de los promedios
nacionales y regionales, tiene un acceso limitado a los mı́nimos de bienestar estipulados
internacionalmente [5], [6], [10]. Lo antes mencionado, impacta negativamente sus derechos
humanos fundamentales ası́ como su calidad de vida, su salud, su dinámica demográfica
y por ende su comportamiento reproductivo. La fecundidad de las mujeres indı́genas en
México continúa siendo elevada. Esta población presenta una mayor demanda insatisfecha
de métodos anticonceptivos, un menor conocimiento y acceso a métodos anticonceptivos,
un menor uso de los mismos, tienen una menor atención relativa a la salud materno-infantil
y patrones de fecundidad más tempranos que las mujeres no indı́genas [3], [9], [26]. Los
patrones de fecundidad temprana en esta población en México urgen a profundizar en el
conocimiento y estudio de los mismos visibilizando la persistencia de diversas problemáticas
en materia de salud sexual y reproductiva en esta población ası́ como su especificidad y
su heterogeneidad [4], [9].
60
Igualmente, con la finalidad de evitar el efecto de truncamiento el presente análisis
se basa en las mujeres de 20 a 24 años de edad, dado que un indicador para analizar el
embarazo adolescente, es la proporción de mujeres que se embarazaron en la adolescencia;
sin embargo, es importante tomar en cuenta que con este indicador no es correcto tomar
como unidad de análisis a las menores de 20 años, ya que no sabemos si la niña que
tenı́a 15 años al momento de la encuesta, se iba o no a embarazar en el transcurso de su
adolescencia.
5.2. Objetivos
A partir de los datos de la Encuesta Nacional de la Dinámica demográfica (ENADID,
2014) se compara el porcentaje de jóvenes adolescentes HLI, auto-adscritas y no indı́genas
que se embarazaron en la adolescencia según diferentes indicadores socio- demográficos
utilizando la prueba de ji-cuadrada.
Objetivos especı́ficos
Identificar las caracterı́sticas de las mujeres que se embarazaron en la adolescencia
según su condición de indigenismo
X = Z12 + · · · + Zn2
X → ξ2
y su función de densidad es de la forma [13]:
61
y además f (x) = 0 para x ≤ 0.
Propiedades de la función de densidad:
1. Es asimétrica.
62
vivienda seleccionada, sus hogares, residentes habituales, migrantes internacionales en los
últimos cinco años y las mujeres de 15 a 54 años de edad. El diseño de la muestra en esta
encuesta fue probabilı́stico, bietápico, estratificado y por conglomerados. Los instrumentos
de recolección de datos comprenden dos cuestionarios: uno del hogar y otro dirigido a
mujeres de 15 a 54 años de edad.
La ENADID incluyó dos preguntas con el objeto de captar a la población indı́gena:
aquella referida a los que se auto-reconocen como pertenecientes a una etnia y aquella que
se refiere a los hablantes de alguna lengua indı́gena. Si bien la condición de hablante de
lengua indı́gena (como un marcador étnico fundamental) es el criterio que ha prevalecido
tanto en los censos como en los análisis sobre fecundidad indı́gena, a efectos de este trabajo
consideramos importante incluir de manera separada a las Hablantes de lengua indı́gena y
a aquellas mujeres que se auto-reconocen como indı́genas (pertenencia étnica) asumiendo
que la pérdida de la lengua indı́gena no implica necesariamente perder la identidad étnica
[3], [7], [15]. Igualmente, consideramos que la auto-pertenencia étnica (auto adscripción)
puede aportar información pertinente sobre la dinámica demográfica de las poblaciones
indı́genas en México. Paralelamente, con la finalidad de evitar el efecto de truncamiento
el presente análisis se basa en las mujeres de 20 a 24 años de edad.
Es preciso señalar que el análisis de los estratos socioeconómicos de los hogares de las
mujeres de 20 a 24 años, se realizó a partir de la construcción de los mismos siguiendo los
estratos propuestos por Echarri [8] ya que se ha demostrado que el estrato socioeconómico
del hogar refleja tanto los condicionantes estructurales, económicos y sociales como las
condiciones socioculturales que configuran los comportamientos y prácticas en salud
reproductiva, lo que aportará información relevante sobre la fecundidad y la salud
reproductiva en esta población.
Finalmente, cabe agregar, que el análisis cuantitativo se realizó usando el software
SPSS.
5.4. Resultados
Los resultados muestran que existen diferencias significativas en las condiciones socio-
económicas de las jóvenes según su condición de indigenismo. Por ejemplo, mientras que
el 62.7 % de las jóvenes de 20 a 24 años hablantes de lengua indı́gena (HLI) pertenecen al
estrato muy bajo sólo el 18.8 % de las que no hablan una lengua indı́gena pertenecen a este
estrato. Asimismo, los contrastes en los niveles de escolaridad son muy importantes: 40.1 %
de las que hablan lengua indı́gena cuentan con un año de primaria o menos, mientras que
este porcentaje es de 8.5 % entre las no indı́genas. Las que declararon pertenecer a un
grupo indı́gena, se encuentran en una situación intermedia, ya que 32.4 % pertenece al
estrato muy bajo y el 16.5 % cuenta sólo con un grado de primaria o menos (Cuadro 1)1 .
La diferencia más importante en la edad media en los distintos eventos demográficos se
observa en la edad a la primera unión de las jóvenes HLI, ya que el promedio en la edad de la
primera unión es más de medio año respecto a las no indı́genas. Estos resultados confirman
que hay un mayor número de mujeres de hablantes no indı́genas que se inician sexualmente
estando solteras, mientras que en el caso de las hablantes indı́genas, la gran mayorı́a de
las relaciones sexuales se dan al interior de la unión. De hecho, en las no indı́genas la edad
media en la primera relación sexual es menor que la edad media en la primera unión, y
entre las jóvenes HLI sucede al revés. Es decir, en promedio, la primera unión precede la
primera relación sexual. Cabe resaltar también que las jóvenes que declararon pertenecer
a una etnia presentan promedios más cercanos a las jóvenes no hablantes de una lengua
indı́gena que a las sı́ hablantes (Cuadro 2).
1 Todos los cuadros de este documento son de elaboración propia a partir de datos obtenidos
de la ENADID, 2014.
63
La protección sexual es también muy deficiente, particularmente en las jóvenes de
habla indı́gena. Al analizar el uso del preservativo en la primera relación sexual, (único
método anticonceptivo que previene a la vez un embarazo no deseado y una infección de
transmisión sexual) se observa que únicamente el 19.7 % de las mujeres HLI se protegieron
con un preservativo en su primera relación sexual cuando esta sucedió en la adolescencia.
Cabe señalar que estos porcentajes son similares a los observados dos décadas atrás en las
adolescentes mexicanas, lo que muestra un rezago muy importante en la salud sexual
y reproductiva de las mujeres de habla indı́gena. Este porcentaje en las mujeres que
declararon pertenecer a una etnia es de 25 % y el 50.3 % de las no indı́genas respectivamente
(Cuadro 3).
64
Sobresale que estas diferencias se mantienen en este grupo (mujeres de 20 a 24 años)
según condición de indigenismo, nunca embarazadas como se aprecia en el cuadro 6, siendo
menores los porcentajes en el caso de las hablantes de lengua indı́gena y las auto-adscritas
(pertenencia étnica).
Ası́, el porcentaje de mujeres nunca embarazadas tiende a ser menor entre las mujeres
hablantes de lengua indı́gena en todos los estratos, comparados con las mujeres de
pertenencia indı́gena y no indı́genas del mismo estrato de referencia. Por el contrario,
los porcentajes de nunca embarazadas de las no hablantes de lengua indı́gena tienden a
ser superiores en todos los estratos, manteniéndose la tendencia a porcentajes intermedios
en todos los estratos según la pertenencia étnica.
65
refleja (como hemos venido viendo en este capı́tulo) situaciones de precariedad social que
condicionan el acceso a oportunidades vinculadas a otros proyectos de vida socialmente
valorados más allá del matrimonio y la maternidad en contextos sociales poco favorecidos.
Sin embargo, es también relevante que una buena proporción de estas jóvenes no
conocı́a métodos, no sabı́a donde obtenerlos y/o cómo usarlos, lo que es especialmente
cierto en el caso de las hablantes de lengua indı́gena en cuyo caso representa más del 50 %
de las mismas contra el 20.8 % de las no hablantes de lengua indı́gena.
Esto visibiliza el recrudecimiento de la desigualdad social en el caso de la población
indı́gena y el importante papel que juega en el embarazo adolescente el oportuno y eficaz
acceso a información y a métodos anticonceptivos modernos. Adicionalmente, estos datos
ponen de relieve, la necesidad de redoblar esfuerzos para lograr una educación sexual
de calidad y mayor acceso a los servicios de planificación familiar, entre la población
adolescente en México.
Por su parte, sobresale que los porcentajes sugieren una relación a la inversa de lo
antes mencionado, en lo que se refiere a los motivos relativos al no uso de método: no
creyó quedar embarazada y no planeaba tener relaciones sexuales, donde los porcentajes
mayores se concentran en las jóvenes no hablantes de lengua indı́gena y decrecen entre las
hablantes de lengua indı́gena.
Al respecto, sobresale que entre las no hablantes de lengua indı́gena casi una de cada
cinco no creyó quedar embarazada y por eso no usó protección lo que evidencia los pocos
conocimientos en materia de biologı́a de la reproducción entre esta población.
También sobresale que entre las no hablantes y las de pertenencia étnica los porcentajes
relativos a la no planeación de las relaciones sexuales constituyan el 30.8 % para las
primeras y el 19.8 % para las segundas, lo cual evidencia el importante peso de la falta de
lógica de planeación entre esta población.
66
Sin embargo, sobresale que entre estas últimas el porcentaje de jóvenes que dejaron
la escuela a causa del embarazo es menor al 3 % mientras que entre las no hablantes de
lengua indı́gena este porcentaje es del 11.6 % (una de cada diez) y para las de pertenencia
étnica es de 7.7 %.
67
entre las de pertenencia étnica este porcentaje se eleva a 13.5 % y entre las no hablantes
de lengua indı́gena esta causa representa el 20.7 %, causa sólo superada en este último
grupo por la unión conyugal con 22.7 % y por la falta de recursos económicos con 23.2 %.
Es también relevante entre las jóvenes con experiencia de embarazo en la adolescencia que
una de las causas de deserción principales lo constituye el no haber querido estudiar/no
le gustaba estudiar representando el 16.8 %, 16.6 % y 17.5 % para las hablantes de lengua
indı́gena, las de pertenencia étnica y las no hablantes de lengua indı́gena respectivamente
(Cuadro 10).
En cuanto a las causas de deserción escolar en las mujeres de 20 a 24 años (con y sin
experiencias de embarazo en la adolescencia) como se aprecia en el cuadro 11, el embarazo
sólo representa el 2.5 % de las deserciones de la escuela entre las HLI y constituye el 9.3 %
entre las no hablantes de lengua indı́gena.
Como en el grupo anterior (Cuadro 10) la principal causa de deserción lo constituye
la falta de recursos económicos cobre todo entre las hablantes de lengua indı́gena donde
representan más de la mitad de las deserciones escolares, siendo la segunda causa el que
no les gustó estudiar donde el mayor porcentaje se concentra entre las HLI con 19.5 %,
segundo por las de pertenencia étnica con 18.1 % y las no hablantes de lengua indı́gena
con 16.6 %.
Ası́, los datos antes presentados visibilizan cómo el embarazo adolescente está
estrechamente vinculado con las condiciones objetivas de vida y con la falta de alternativas
reales que tienen las jóvenes para acceder a proyectos de vida alternativos a la maternidad
y/o la unión conyugal.
5.5. Conclusiones
Los resultados muestran las particularidades en el comportamiento de la fecundidad
adolescente indı́gena y el importante rezago en materia de salud sexual y reproductiva
de esta población. Estos resultados deben ser leı́dos no sólo a partir del impacto de los
factores de ı́ndole cultural sobre el comportamiento reproductivo sino también y sobre
todo a partir del efecto de diversas desigualdades sociales de carácter estructural sobre el
comportamiento reproductivo.
Esto implica visibilizar las condiciones estructurales de pobreza y aislamiento que
afectan sobre todo (pero no exclusivamente) a las jóvenes hablantes de lengua indı́gena
restringiendo sus posibilidades de acceso a la educación formal, dificultando su inserción
en el mercado de trabajo (o su inserción y acceso a trabajos bien remunerados) y limitando
sus proyectos de vida significativamente.
Esto significa reconocer que no sólo las dimensiones culturales de la identidad étnica
(vinculadas con la condición de indigenismo) sino las condiciones de exclusión y de miseria
68
estructural dificultan proyectos de vida alternativos a la maternidad y al matrimonio/unión
en México [11], [12], [21], [22], [24].
En este sentido, las condiciones objetivas de vida de las adolescentes restringen
significativamente la posibilidad real (dejando de lado discursos meritocráticos) de acceso
a otros proyectos de vida vinculados con el desarrollo personal a través de los estudios con
el fin de mejorar las condiciones de vida. Esto, repercute significativamente en la deserción
escolar y en la incidencia de uniones tempranas que en muchas ocasiones como vimos,
preceden y dotan de sentido al embarazo en la adolescencia.
Igualmente, los resultados evidencian que, frecuentemente el embarazo en la
adolescencia en contextos marginales, es parte y continuidad de un proyecto de vida
centrado en la conyugalidad (unión o matrimonio) y la maternidad lo que torna necesario
problematizar el “deseo de embarazo”(que reportan algunas jóvenes con experiencias de
embarazo en la adolescencia) lo que sugiere que éste no es necesariamente accidental en
muchos contextos sino que es un acto potencialmente estratégico de identidad que sólo es
sociológicamente comprensible a partir de analizar el contexto social, económico y cultural
que lo torna posible.
También los resultados urgen a redoblar esfuerzos en materia de educación sexual
y biologı́a de la reproducción entre la población indı́gena en particular (dado que como
vimos anteriormente más de la mitad de las jóvenes que experimentaron un embarazo en la
adolescencia (hablantes de lengua indı́gena) no usó un método de protección en su primera
relación sexual porque no los conocı́a, no sabı́a donde obtenerlos o no sabı́a cómo usarlos)
y entre las población joven en general, con la finalidad de garantizar que toda aquella joven
que quiere prevenir un embarazo no deseado, tenga la posibilidad real de hacerlo.
Lo antes mencionado, implica cuestionar y desmantelar la visión adultocrática de la
sexualidad adolescente ya que, en términos generales, puede afirmarse que en amplios
sectores de la población mexicana, todavı́a tiende a prevalecer cierto rechazo (cuando no,
negación) frente a la actividad sexual de los y las adolescentes.
Esto impacta de manera directa e indirecta en la existencia de mensajes sociales sobre
anticoncepción y prácticas de sexo seguro que van desde la ambigüedad hasta el franco
rechazo [2] y condicionando la información que se considera pertinente y relevante de
ser socializada a los y las adolescentes a través de campañas, talleres, etc. dirigidos a
esta población, y repercute en las decisiones y representaciones en torno al cómo deben
de ser o bajo qué circunstancias ocurren los primeros encuentros sexuales. Si bien los
hallazgos de este análisis evidencian que el embarazo en la adolescencia no puede reducirse
a un único modelo de comprensión debido a su complejidad y al hecho de que resulta de
la combinación, interacción e intersección de diversos factores (y desigualdades sociales
muchas de ellas estructurales), es innegable el peso de las desigualdades sociales sobre este
evento en la población adolescente en general y en la población indı́gena en particular.
Referencias
1. Adaszko, A. Perspectivas socio-antropológicas sobre la adolescencia en ((Embarazo y
maternidad en la adolescencia)). Estereotipos, evidencias y propuestas para polı́ticas
públicas. UNICEF-CEDES: Buenos Aires, 2006.
2. Atkin, Lucille, et al. Sexualidad y fecundidad adolescente, ((Mujer: sexualidad y
salud reproductiva en México)), The Population Council, pp. 39-84, México, 1999.
3. Bertely, M., G. Saravı́ y G. Abrantes, Adolescentes Indı́genas en México: Derechos
e Identidades Emergentes. FNUI-UNICEF, México, 2013.
4. Bonfil, P. Introducción, ((Derechos y salud sexual y reproductiva entre jóvenes
indı́genas: hacia la construcción de una agenda necesaria)). GIMTRAP, México, 2014.
69
5. CONAPRED. Dı́a internacional de los pueblos indı́genas, CONAPRED, México,
2012.
6. CONEVAL. La pobreza en la población indı́gena de México 2012. CONEVAL,
México, 2014.
7. Del Popolo, F., M. López y M. Acuna. ((Juventud indı́gena y afrodescendiente en
América Latina: inequidades sociodemográficas y desafı́os de polı́ticas)), CELADE,
UNFPA, 2009.
8. Echarri, C. Desigualdad socioeconómica y salud reproductiva: una propuesta de
estratificación social aplicable a las encuestas, ((Salud reproductiva y condiciones de
vida en México, tomo I)). Colmex: México, 2008.
9. Hernández, M., M. Hernández y M. Sánchez. La salud sexual y reproductiva de
las mujeres hablantes de lengua indı́gena, 1997-2009, La situación demográfica de
México, pp. 21-41, México, 2013.
10. INEGI, Mujeres hombres en México. INEGI, México, 2011.
11. Menkes C. y L. Suárez. Sexualidad y embarazo adolescente en México, Papeles de
Población, vol. 9, núm. 35, pp.1-31, 2006.
12. Menkes C., Velázquez, M. e I. Sosa-Sánchez. Embarazo adolescente, desigualdad
social y derechos sexuales y reproductivos. Resultados de un estudio en el estado de
Morelos, México, e-book de las Memorias de las XIII jornadas nacionales de debate
interdisciplinario en salud y población: salud, sexualidades y derechos: cruces entre
investigación, polı́ticas y prácticas, Mesa 2.3: Sexualidades, derechos y cuidados,
sostenida del 3 al 5 de agosto del 2016, Universidad de Buenos Aires, 2016.
13. Montero-Alonso M. Apuntes de Estadı́stica II. Ed. Vicerrectorado de Planificación,
Calidad y Evaluación Docente. Universidad de Granada. Melilla. España, 2007.
[14.] auar, A. Ser alguém na vida: uma análise sócio-antropológica
da gravidez/maternidade na adolescencia, em Belém do Pará, Brasil, Cad. Saúde
Pública, Rio de Janeiro, 19 (Sup. 2): S335-S343, 2003.
15. Pla, D. Más desindianización que mestizaje. Una relectura de los censos generales
de población, Dimensión Antropológica, 18(53): 70-94., 2011.
16. Rodrı́guez, L., J. Sánchez. Esfuerzos para el avance en la investigación demográfica
sobre la población afro-descendiente e indı́gena en América Latina: rezagados entre
los rezagados - Una introducción, en Laura L. Rodriguez Wong y Jhon Antń
Sánchez (organizadores). Situación de la población afro-descendiente e indı́gena en
América Latina puntos de reflexión para el debate sobre Cairo + 20, Asociación
Latinoamericana de Población (ALAP-ebook). Serie e-investigaciones-ALAP, Belo
Horizonte, pp. 161-176, 2015.
17. Sosa-Sánchez, I. Significados del cuerpo y del riesgo en el marco de la sexualidad y
de la reproducción: un estudio de caso con jóvenes en Cuernavaca, Tesis de Maestrı́a,
FLACSO-CLACSO: Buenos Aires, 2010.
18. Serrano, F. y P. Sánchez. Análisis cuantitativo de datos en Ciencias sociales con el
SPSS. Tablas de contingencia y pruebas de asociación, Universidad de Murcia, 2017
Acceso en lı́nea el 17 de septiembre del 2017:
https://digitum.um.es/jspui/bitstream/10201/27921/3/SPSST CON T IN GEN CIA.pdf
19. Sosa-Sánchez, I. Los Significados de la Salud y la Sexualidad en Jóvenes. Un Estudio
de Caso en Escuelas Públicas en Cuernavaca. México, DF: INMUJERES, 2005.
20. Sosa-Sánchez, I. A. y Catherine Menkes. Algunas reflexiones acerca de los obstáculos
en el uso del condón. Un estudio en Morelos, ponencia presentada en la VII Reunión
de Investigación Demográfica en México, 2-5 de diciembre, 2003.
70
21. Stern, C. y C. Menkes. Embarazo adolescente y estratificación social, ((Salud
Reproductiva y condiciones de vida en México)). México: El Colegio de México,
2008.
22. Stern, C. Reflexiones finales, ((Adolescentes en México . Investigación, experiencia y
estrategias para mejorar su salud sexual y reproductiva)), Colmex, México, 2008.
23. Stern C. El embarazo en la adolescencia como problema público: una visión crı́tica.
Salud Publica México, (39):137-143, 1997.
24. Stern, C. Estereotipos de género, relaciones sexuales y embarazo adolescente en
las vidas de jóvenes de diferentes contextos socio culturales en México. Estudios
Sociológicos, vol. XXV, núm. 73, pp. 105-129, México, 2007.
25. UNICEF. Panorama de la Adolescencia Indı́gena en México desde una Perspectiva
de Derechos. UNICEF-CIESAS, México, 2012.
26. Vázquez, G. Demografı́a étnica un balance del perı́odo 1986-2011. Coyuntura
demográfica, vol. 3, pp. 97-101, 2013.
27. Velázquez, Menkes, Sosa-Sánchez et al. Embarazo adolescente en el estado de
Morelos: un análisis de corte interseccional, Informe técnico de proyecto presentado
a la Dirección General de Información Estratégica, al Consejo estatal de población
(COESPO, Morelos) y a la Subsecretarı́a de Planeación (Secretarı́a de Hacienda),
2016.
71
72
Modelación con Estadı́stica y Probabilidad
ISBN: 978-607-525-442-5
CAPÍTULO 6
Resumen. En este trabajo se hace una revisión del punto de cambio, en general se
presenta la formulación del problema del punto de cambio, los problemas que surgieron
desde sus inicios en tamaños de muestras pequeñas y grandes, y como se llego a la
forma asintótica para obtener el estadı́stico de prueba en series temporales para variables
independientes, posteriormente se analizan los puntos de cambio en espacio tiempo, todo
esto tratado sobre el enfoque de máxima verosimilitud.
Abstract. In this work, a review of the change point is made, in general presents itself
the formulation of the problem of the change point, the problems that have arisen from
its beginnings in small and large sample sizes, and how the asymptotic form was obtained
to obtain the test statistic in time series for independent variables, we later analyze the
points of change in space-time, all of this dealt with the maximum likelihood approach.
6.1. Introducción
El punto de cambio es considerado como uno de los problemas centrales de inferencia
estadı́stica, pues relaciona a la teorı́a de control estadı́stico, a las pruebas de hipótesis
(al detectar si existe algún cambio en la sucesión de variables aleatorias observadas)
y a la teorı́a de estimación (al estimar el número de cambios y sus correspondientes
localizaciones). Los problemas de puntos de cambio originalmente surgieron en control
de calidad y en general pueden encontrarse en diversas disciplinas experimentales y
73
matemáticas tales como medio ambiente, epidemiologı́a, procesos de señal sı́smica,
economı́a, finanzas, geologı́a, medicina, biologı́a, fı́sica, etc. (Chen and Gupta, 4). Los
puntos de cambio se presentan en forma abrupta y gradual (Brodsky y Darkhovsky, ([2],
[3]), su análisis es realizado sobre variables aleatorias independientes y dependientes sobre
el tiempo y el espacio.
donde 1 < k1 < k2 < · · · < kq < n, q es el número desconocido de puntos de cambio y
k1 , k2 , · · · , kq son las posiciones desconocidas respectivas que tienen que ser estimadas. Si
las distribuciones F1 , F2 , . . . , Fn llegan a ser una familia paramétrica común F (θ), donde
θ ∈ Rp , entonces el problema de puntos de cambio consiste en probar la hipótesis nula H0
sobre la no existencia de cambio en los parámetros θi , i = 1, . . . , n de la población contra
la alternativa Ha de que existe al menos un punto de cambio:
H0 : θ1 = θ2 = · · · = θn = θ (desconocidos), vs
donde q y k1 , k2 , . . . , kq tienen que ser estimados. Estas hipótesis juntas revelan los aspectos
de inferencia de puntos de cambio para determinar si cualquier punto de cambio existe en
el proceso, estimar el número de ellos y sus respectivas posiciones.
74
En diversos casos se asume que las observaciones son independientes e idénticamente
distribuidas (i.i.d.), pero el análisis resulta más complejo si se presenta dependencia entre
las observaciones. En el caso de series de tiempo la dependencia está presente entre las
observaciones dentro de cada segmento de tiempo; en el caso de datos espacio-temporales,
la dependencia sucede sobre el espacio y el tiempo.
De acuerdo con Brodsky and Darkhovsky ([2], [3]), los problemas y métodos de diagnóstico
de puntos de cambio se pueden clasificar de la manera siguiente:
Por otra parte, Hinkley ([11]) mediante el uso de caminatas aleatorias, obtuvo las
estadı́sticas de prueba bajo diferentes suposiciones respecto a los parámetros, los cuales
consideró correspondian a una distribución normal. Obtuvo las distribuciones asintóticas de
las estadı́sticas de prueba y la del estimador de máxima verosimilitud del punto de cambio.
Su método lo condujo a distribuciones asintóticas basadas en integrales extremadamente
complejas, y al comparar las varianzas del estimador empı́rico de punto de cambio con los
resultados de sus aproximaciones, determinó que sus resultados fueron pobres, ya que los
75
valores no fueron parecidos uno del otro, principalmente en muestras de tamaño pequeñas.
Los tamaños de muestra que tomó fueron T = 50, 100, 200. Por su parte Hawkins ([10]) por
medio de un proceso de Markov obtuvo la distribución nula de la estadı́stica de prueba de
la razón de log verosimilitud de un solo punto de cambio sobre la media de una sucesión de
variables aleatorias independientes e idénticamente distribuidas con distribución normal,
supuso a la varianza σ conocida e igual a 1. Ası́ mismo, proporcionó la distribución nula
del punto de cambio, sus resultados de simulación mostraron que la aproximación es buena
cuando el tamaño de muestra n y el nivel de significancia α son pequeños pero con errores
moderados.
Más tarde Yao and Davis ([24]) mostraron que la estadı́stica de prueba cuando cambia la
media de una distribución normal y la varianza es igual a uno, es igual en distribución al
máximo de un puente Browniano normalizado. Derivaron también la convergencia débil
de la distribución nula de la estadı́stica de prueba de razón de verosimilitud del punto
de cambio sobre la media de una distribución normal cuando la varianza es conocida y
desconocida; por su parte Horvárth ([13]) obtuvo la distribución nula asintótica de la
estadı́stica de prueba de la razón de verosimilitud en el caso de una normal univariada
cuando ambas media y varianza pueden cambiar, en éstos tres casos la convergencia fue
hacia la distribución doble exponencial. Yao and Davis ([24]), determinaron que dicha
distribución para n pequeña no provee una buena aproximación a la distribución nula,
para esto ellos se basaron en resultados de la teorı́a de valores extremos expuesta en Hall
([9]), la cual dice que si se tiene una sucesión de variables aleatorias provenientes de una
distribución normal estándar, entonces el máximo de tal sucesión de variables aleatorias
estandarizado por funciones an y bn converge en distribución a la distribución de valores
extremos Gumbel, y la tasa de convergencia es aproximadamente de 1/ log n la cual indica
convergencia muy lenta principalmente en muestras pequeñas. Horvárth ([13]) determinó
también por medio de simulación que la convergencia es lenta para muestras pequeñas, el
tomó muestras de tamaños n = 20, 50 y 100.
√ √ Xk
U= Vk∗ = max |Tk | donde n
Vk = Tk == ( k(n−k) )1/2 (Xi − X̄).
1≤k≤n−1
i=1
Wk − kµ D k
√ ;1 ≤ k ≤ n = B ;1 ≤ k ≤ n ,
n n
76
D
= significa igualdad en distribución. Además,
1/2
Wk k Wn k k
U = max √ − √ / (1 − )
1≤k≤n−1 n n n n n
Wk
√ − tW n
√ /[(t(1 − t)]1/2
= max
nt=1,...,n−1 n n
Wk ku Wn nu
= max √ − √ − t( √ − √ ) /[t(1 − t)]1/2
nt=1,...,n−1 n n n n
D
= max |B(t) − tB(1)| /[t(1 − t)]1/2
nt=1,...,n−1
k
donde t = n
, B0 (t) = B(t) − tB(1) es un puente Browniano.
lim P [a−1
n (U − bn ) ≥ x] = exp{−2π
1/2 −x
e },
n→∞
77
6.4. Distribución Nula Asintótica de la Estadı́stica
de Prueba usando Puentes Brownianos
Gombay and Horvárth ([7]) establecieron el siguiente contraste de hipótesis para un solo
punto de cambio con observaciones provenientes de cualquier distribución considerando
vectores aleatorios:
H0 : θ1 = · · · = θn ; η1 = · · · = ηn
vs
Ha : existe un entero k∗ , 1 ≤ k∗ ≤ n tal que θ1 = · · · = θk∗ 6= θk∗ +1 = · · · = θn ;
η1 = · · · = ηn
donde los η 0 s no cambian, son parámetros de ruido, mientras que θ cambia bajo la
alternativa en un tiempo desconocido, todos los parámetros se consideran desconocidos.
Asumiendo que el tiempo de cambio k∗ es conocido se aplica la prueba de razón
de verosimilitud, se asume que: X1 , X2 , X3 , ..., Xn tienen densidades de probabilidad
f (x; θ1 , η1 ), ..., f (x; θn , ηn ) con respecto a v, donde v es una medida de probabilidad
σ-finita en Rn , se establece una condición de consistencia sobre la distribución acumulada.
Gombay and Horvárth ([7]) establecieron condiciones de regularidad las cuales permiten
mostrar las convergencias en probabilidad y en distribución de algunos estadı́sticos de
prueba para puntos de cambio, tales condiciones indican: la existencia de la derivada en
un cierto intervalo; acotamientos para las funciones a derivar. Para la matriz de Fisher
compuesta de las esperanzas de las funciones usadas en la derivación debe existir su inversa
y ser continua para todo parámetro ζ ∈ Θ0 donde Θ0 es el espacio paramétrico: la varianza
de las funciones utilizadas en la derivación debe ser finita y los u-ésimos momentos para
las funciones en la derivación deben ser finitos.
El objetivo principal de Gombay and Horvárth ([7]) fue obtener aproximaciones para
la distribución de Zn y probar información sobre la tasa de convergencia de estas
aproximaciones. Ellos observaron que −2 log Λk puede ser aproximado con formas
78
cuadráticas de sumas parciales Rk de sumas de vectores aleatorios independientes. Dado
que Rk esta basado en sumas parciales de vectores aleatorios i.i.d. puede ser reemplazado
por formas cuadráticas de vectores aleatorios Gaussianos para aproximar −2 log Λk .
Para ello se definió el proceso de razón de verosimilitud Vn (t) = −2 log Λ[(n+1)t] si
1 n 1 n
n+1
≤ t < n+1 y Vn (t) = 0 si, 0 ≤ t < n+1 y Vn (t) = 0 si n+1 ≤ t ≤ 1. La aproximación
Gaussiana para Vn (t) implica condiciones necesarias y suficientes para la convergencia débil
de funcionales ponderados, para ello se hace uso de puentes Brownianos independientes
{Bi (t), 0 ≤ t ≤ 1}, 1 ≤ i ≤ d, donde B es unX proceso Gaussiano continuo con E(B(t)) = 0 y
E[B(t)B(s)] = min(t, s) − ts y B (d) (t) = Bi2 (t). Lo siguiente implica la convergencia
1≤i≤d
débil en distribución de t(1 − t)Vn (t) y la convergencia de funcionales ponderados en
distribución de Vn (t).
D
{Bn(d) (t), 0 ≤ t ≤ 1} = {B (d) (t), 0 ≤ t ≤ 1}
para cada n,
(d)
Bn (t)
α α
n sup (t(1 − t)) Vn (t) − = Op(1)
λ ≤t≤1− λ t(1 − t)
n n
1 1
para todo λ > 0 y 0 ≤ λ < 2
− µ
y
Si
H0 y las condiciones de regularidad se cumplen, entonces se tiene
1/2 (d)
Z n − sup (Bn (t)/(t(1 − t))1/2 = Op (exp(−(log n)1− )),
1 ≤t≤1− 1
n n
(d)
para 0 < < 1 y {Bn (t), 0 ≤ t ≤ 1} una sucesión de procesos Gausianos.
1 1
También si h(n) ≥ n
, l(n) ≥ n
y
∗
lim sup n(h(n) + l(n))exp(−(log n)1− ) < ∞,
n→∞
para
algún 0 < ∗ ≤ 1, entonces se tiene
(d)
1/2
Z n − sup ( Bt(1−t)
n (t) 1/2
) = Op (exp(−(log n)1− ))
h(n)≤t≤1−l(n)
para todo 0 < < ∗ .
Gombay and Horvárth ([7]) obtuvieron para 0 < α < 1 valores crı́ticos y regiones de
1/2
rechazo para Zn . Los valores crı́ticos fueron obtenidos con:
79
!1/2
(d)
Bn (t)
u(h, l) = sup(x : P ( sup ≤ x) = 1 − α),
h≤t≤1−l t(1 − t)
la cual es una aproximación asintótica de tamaño α al valor crı́tico
para todo
R ∞ t,t−1donde A(x) = (2 log x)1/2 y Dd (x) = 2 log x + d
2
log log x − log Γ(d/2),
−y
Γ(t) = 0 y e dy, t > 0.
80
Tabla 2. Comparación de valores crı́ticos para la prueba de razón de
verosimilitud (dos parámetros de cambio bajo la alternativa), Csörgö and
Horváth ([5]).
k̂ D 1
= ξ0 , y P {ξ0 = 0} = P {ξ0 = 1} = .
n 2
Gombay and Horvárth ([8]) obtuvieron también algunas otras aproximaciones asintóticas
para la estadı́stica de prueba bajo la alternativa Ha y mediante simulación Monte Carlo
ellos determinaron la exactitud de sus aproximaciones, para observaciones provenientes
de una distribución normal cuando cambia la media y la varianza permanece constante;
observaciones exponenciales, Poisson y vectores aleatorios normales cuando cambia
el vector de medias y la covarianza permanece constante y conocida. Hicieron 2000
repeticiones para n=50, 100 y 500 y cambios en k∗ = nλ con λ = 0.1, 0.2, . . . , 0.5 para varios
valores de los parámetros antes y después del cambio, los resultados fueron muy exactos lo
cual pudó observarse al comparar los valores de la función potencia asintóticos y simulados.
Cuando la media µ∗ de la distribución normal fue bastante grande las proposiciones de
lı́mites dieron valores muy cercanos a los simulados. Se presentaron diferencias entre las
81
potencias verdaderas y asintóticas cuando la media µ∗ fue pequeña.
Lo cual dice que bajo la hipótesis nula los coeficientes de regresión permanecen estables
sobre el tiempo y bajo la alternativa existe un cambio en al menos uno de los d parámetros
especificados del vector β en un tiempo desconocido. La varianza de las observaciones
permanece constante pero desconocida sobre el tiempo.
En general el análisis de puntos de cambio en regresión lineal cubre varios casos desde
probar hipótesis sobre cambios en los coeficientes de la regresión, el intercepto, la pendiente,
la tendencia, los residuales. En un principio el análisis se enfocó en los cambios de los
coeficientes de la regresión lineal simple para muestras pequeñas, en cuyo caso se llegó a
que la distribución de la estadı́stica de prueba es una distribución F ([18], [19]); también
se analizaron cambios por medio del intercepto, el resultado fue una distribución χ2
para la estadı́stica de prueba (Hinkley, [12]); en lo que respecta al estudio de puntos de
cambio en regresión multiple Worsley ([23]) aportó lı́mites conservativos para la función
de distribución nula de la estadı́stica de prueba, él se basó en la desigualdad Bonferroni,
se consideraron los casos para cuando la varianza es conocida y desconocida. En general
la teorı́a asintótica para obtener la distribución de la estadı́stica de prueba de puntos de
cambio en regresión es tratada en Csörgö y Horvart ([5]).
82
6.6. Problemas de Puntos de Cambio en Espacio
Tiempo
En general el problema de puntos de cambio en espacio-tiempo analiza diferentes tipos de
cambios según Zhou et al. ([25]) los cambios espacio temporales se clasifican de diferentes
formas: cambio en parámetros estadı́sticos; cambio en el valor, es decir la diferencia entre
un valor de un dato y sus vecinos en localización o tiempo; cambio en el modelo ajustado a
los datos, el cual se refleja en el cambio del comportamiento de la tendencia la cual puede
ser lineal y polinomial; y cambio en los atributos de la derivada, es decir la diferencia entre
la predicción y el valor actual es considerada un cambio.
Según Zhou et al. ([25]) los tipos de modelado en estadı́stica espacial son de tres clases:
modelado Geoestadı́stico; modelado lattice (o modelo areal), en éste tipo de modelado se
utilizan procesos de los datos tales como el autorregresivo espacial y los campos aleatorios
de Markov; y finalmente procesos puntuales.
Tipos de cambios espaciales basado en imágenes: estos cambios incluyen una sola imagen,
un conjunto de imágenes (mas de 2 imágenes). Basado en raster: cambio en el patrón de
escala la cual puede ser local, focal o zonal. Basado en vectores, los cambios pueden ser
entre: puntos, lı́neas, polı́gonos y redes.
Otho y Wolfgang ([16]) consideran que para el análisis en el espacio hay tres diferentes
normas la de Manhattan, la Euclidiana, y la norma del máximo, estas son:
q
X
DM (s) = ||s||1 = |s(i) |,
i=1
q
X 2
DE (s) = ||s||2 = ( |s(i) |)1/2 ,
i=1
83
DQ (s) = ||s||∞ = maxi=1,...,q |s(i) |.
Se considera que puede ocurrir un cambio en los parámetros del modelo a una distancia
desconocida δ desde el origen s0 = 0. Se asume que δ ∈ Dn = {D(s1 ), . . . , D(sn ), ∞}, y
Dn tiene dos elementos si todas las estaciones tienen la misma distancia positiva desde
el origen (i.e. 0 = D(s0 ) < D(s1 ) = · · · = D(sn ) < ∞) y tiene n + 1 elementos
si todas las estaciones tienen una distancia positiva diferente desde el origen ( i.e.
0 = D(s0 ) < D(s1 ) < · · · < D(sn ) < ∞) donde δ = ∞ se refiere al caso en que no
existe un cambio estructural. En particular el enfoque es sobre cambios en la media y los
parámetros autoregresivos ρ = (ρ1 , . . . , ρp )T .
Los datos lattice y los datos espaciales son caracterizados por dependencia (autocorrelación
espacial) y heterogeneidad (estructura espacial). La dependencia espacial es propiamente
determinada en pesos y la heterogeneidad espacial es tomada en cuenta para la
especificación del modelo (Anselin, [1]). La estructura de covarianza se sigue indirectamente
de la especificación de la matriz de pesos espaciales. Para el proceso estocástico SAR se
define la estructura de la matriz B de pesos, para ello se supone que el proceso tiene algúna
localización inicial s0 desde la cual el proceso evoluciona en toda dirección. Inicialmente
se define una matriz binaria W = (wηl )η,l=1,...,n de pesos espaciales,
1, si D(sη − sl ) ∈ (o, c] y D(sη ) > D(sl ),
wηl =
0, d.o.f. ,
84
n
wηl
X
wηl 6= 0,
n , si
X
w l=1
ηl
bηl = l=1
n
X
0, si wηl = 0.
l=1
u, si D(s) < δ,
E(X(s)) =
u + a, si D(s) ≥ δ,
donde D(sn ) son todas las posibles distancias medidas a partir del origen a cualesquiera
localizaciones de la región de estudio. La decisión de si existe un cambio se basa en la
razón de verosimilitud entre el modelo con δ = ∞ y el modelo mejor ajustado con δ > 0.
85
6.6.1. Estimación
Los parámetros del modelo autorregresivo sin cambios estructurales pueden ser estimados
vı́a el enfoque de máxima verosimilitud. Esto puede especificarse como
(0)
(ρ̂, σ̂ ε , µ̂) = argmax(ρ,µ∈Rp )(σ∈Rp ) (fY 1 ,...,Y p (X 1 , . . . , X p ; ρ, σ , µ)),
+
(0)
donde fY 1 ,...,Y p es la función de distribución conjunta y X 1 , . . . , X p son las realizaciones
de Y .
El vector σε = (σε1 , . . . , σεp ) consiste de la desviación estándar residual para todos los
componentes de Y (s).
Asumiendo que los ξi son distribuidos normalmente, las log verosimilitudes son:
p p
X X 1 (0)T (0) (0)
Bajo H0 : L(0) (ρ, σ ξ , u; X 1 , . . . , X p ) = − n2 ln(2πσξ2i ) − ξ ξi donde ξi =
2σξ2i i
l=1 l=1
(I n − ρi B)(X i − ui 1n ).
(0)
donde θ̂ denota el punto donde el máximo de la log verosimilitud L(0) es alcanzado y
(1)
θ̂δ denota el máximo de la log verosimilitud del modelo de punto de cambio para algún
punto de cambio dado δ.
an (maxi ξi − bn ) → λ, P (λ ≤ x) = exp(−exp(−x))
86
La distribución estimada de −2λn es comparada con una distribución de valor extremo
generalizada. Una variable aleatoria M sigue este tipo de distribución si su función de
distribución es dada por
( 1
−γ
exp(−(1 + γ m−v ) , 1 + γ m−v > 0, γ 6= 0,
P (M ≤ m) = Gγ,v,ζ = ζ ζ
exp(− m−v
ζ
), m∈R γ = 0.
√
Sm 6
v̂ = m̄ − ζ̂γ ∗ y ζ̂ = ,
φ
87
Se calculó con la distribución Gumbel la potencia de la prueba de la razón de log
verosimilitud para d ∈ {10, 20, 50}, p = 3. ρ =0.8 para cambio en la media figura izquierda
y ρ = 0 para cambio en el parámetro ρ a la derecha. La probabilidad de rechazar la
hipótesis nula es dada para cambios en la media y el parámetro autorregresivo que ocurren
en δ =[0.05d], la potencia de la prueba se muestra en la figura 1 tomada de Otto y Wolfgang
([16]).
El error tipo I es menor que o igual a α =0.05 para todas las especificaciones, en
consecuencia se concluye que los cuantiles Gumbel son valores crı́ticos adecuados del
esquema de prueba. Debido a las diferentes magnitudes de los cambios, no es posible
juzgar cuál prueba tiene más potencia estadı́stica.
Sus resultados fueron aplicados para analizar los cambios en un tumor de cáncer de pulmón,
para medir las distancias utilizaron la norma euclidiana, consideraron adecuada a tal
norma debido a la forma del crecimiento del tumor. Según Otto y Wolfgang ([16]) su
metodologı́a puede ser aplicada a diferentes problemas que suceden en el espacio tal que
su comportamiento muestre un inicio al que se considerará como centro y a partir del cual
se expanda en todas las diferentes direcciones.
88
6.6.2. Aplicación
En esta aplicación se consideran escaneos de tomografı́as computarizadas que muestran un
tumor en el pulmón izquierdo, los escaneos son de alta relevancia clı́nica para diagnostico
médico. En sus figuras grafican dos rebanadas de un escaneo de tomografı́a de pulmón (el
plano transverso y el coronal) el color del carcinoma se detecta en color rojo. La tomografı́a
fue usada para diagnóstico clı́nico y diagnóstico radiológico de cáncer, en particular el
cáncer se clasifica en estados y los parámetros son: el tamaño del tumor primario (son
cuatro mediciones T1, T2, T3, y T4 dependiendo del tipo de cáncer), la extensión de los
nodos regionales de la linfa y la presencia de distintas metástasis. Los estados del cáncer
son una herramienta importante para dar un pronóstico y dar un tratamiento o evaluar
los resultados del tratamiento. Se analizan seis imágenes de tomografı́a computarizada
toráxicas paralelas del pulmón izquierdo. En la figura 2 tomada de Otto y Wolfgang ([16])
muestra una rebanada de la tomografı́a computarizada completa en el plano transverso y
coronal es graficada, además el análisis detallado de las seis rebanadas muestra el carcinoma
pulmonar. Los registros son disponibles en una escala de grises de un formato de 8 bits,
ası́ los valores de los voxeles de la tomografı́a pueden ser vistos como un proceso aleatorio
univariado en un espacio tres dimensional de enteros, esto es el parámetro p es igual a uno
y el dominio espacial Ds es un subconjunto de Z3 , los voxeles de tal proceso en el área del
hueso tienen una media diferente que los voxeles en el tejido suave, el proceso tendrá una
media tres dimensional especı́fica debida a la estructura anatómica.
89
inciso a) tomada de Otto y Wolfgang (2016)).
El carcinoma tiene una forma circular, ası́ que la norma fue seleccionada a que sea la
norma Euclidiana. El centro del proceso (Figura 3 inciso b)) fue estimado por maximizar
la función de verosimilitud con respecto a todos los parámetros, el punto de cambio, y el
centro de origen. Se observa un cambio abrupto con un lı́mite claro del cáncer tal que el
punto de cambio estimado δ̂ = 9.75 coincide con la forma obvia del tumor.
Figuar 3
6.7. Conclusiones
Como resultado del análisis realizado se concluye que debido al problema presentado con
la distribución de la estadı́stica de prueba obtenida por máxima verosimilitud cuando se
analizan puntos de cambio para muestras pequeñas y grandes, y debido a que se presenta
algunas veces un comportamiento conservativo, se creó una herramienta para obtener la
distribución asintótica de la estadı́stica de prueba con Puentes Brownianos para analizar
puntos de cambio en series de tiempo para variables independientes.
Referencias
1. Anselin, L., Spatial econometrics: Methods and Models, Volume 1. Kluwer Academic
Publishers, Dordrecht, NL, 1988.
2. Brodsky B. E. and Darkhovsky B. S., Mathematics and its Applications,
Noparametric Methods in Change-Point Problems. Kluer Academic Publishers.
Volume 243. ISBN:0-7923-2122-7, 1993.
3. Brodsky B. E. and Darkhovsky B. S., Non-Parametric Statistical Diagnostic
Problems and Methods. Mathematics and Its Aplications 509. Kluwer Academic,
Dordrecht, 2000.
4. Chen, J. and A. K. Gupta, Parametric Statistical Changepoint Analysis. Second
Edition. Boston: Birkhauser, 2012.
5. Csörgo, M. and Horváth, L., Limit Theorems in Change-Point Analysis. Chichester,
N. Y.:John Wiley, 1997.
90
6. Davies, R. B., Hypothesis testing when a nuisance parameter is present only under
the alternative. Biometrika, 74, 33-43, 1987.
7. Gombay, E. and Horvárt, L., On the rate of approximations for maximum likelihood
test for the time and change and the power function in change-points models. J.
Multivariate Analysis, 56, 120-152, 1996.
8. Gombay, E. and Horvárt, L., Approximations for the time and change and the power
function in change point models. J. Statist. Pla, Inf., 52, 43-66, 1996.
9. Hall, P., On the rate of convergence of normal extremes. J. Appl. Probab., 16, 433-
439, 1979.
10. Hawkins, D. M., Testing a sequence of observations for a shift in location. Journal
of the American Statistical Association, 72, 180-186, 1977.
11. Hinkley, D. V., Inference about the point in a sequence of random variables,
Biometrika, 571, 1-17, 1970.
12. Hinkley, D. V., Inference about the intersection in two-phase regression. Biometrika,
56, 495-504, 1969.
13. Horvath, L., The maximum likelihood method for testing changes in the parameters
of normal observations. The Annals of Statistics, Vol. 21, No. 2, 671-680, 1993.
14. Yousef, Omar M. and Al-Subh, Sameer A., Estimation of Gumbel Parameters under
Ranked Set Sampling, Journal of Modern Applied Statistical Methods: Vol. 13, No.
2, 2014.
15. Otto, P., A note on efficiente simulation of multidimensional spatial autoregressive
processess. Comunicationns in Statistics-Simulation and Computation, 2015.
16. Otto, P. and Wolfgang, S., Detection of spatial change points in the mean and
covariances of multivariate simultaneous autoregressive models. J. Biometrical, 58,
1113-1137, 2016.
17. Page, E. S., On problem in which a change in a parameter ocurring at an unknown
point. Biometrika, 44, 248-252, 1957.
18. Quant, R. E., The estimation of parameters of a linear regression system obeying
two separate regimes. J. Amer. Statist. Assoc., 50, 853-880, 1958.
19. Quant, R. E., Test of the hypothesis that a linear regression system obeys two
separate regimes. J. Amer. Statist. Assoc., 55, 324-330, 1960.
20. Srivastava, M. S. and Worsley K. J., Likelihood ratio tests for a change in the
multivariate normal mean. Journal of the American Statistical Association, Vol. 81,
No. 393, 199-204, 1986.
21. Wall, M. M., A close look at the spatial structure implied by the CAR and SAR
models. Journal os Statistical Planning and Inference, 121, 311-324, 2004.
22. Whittle, P., On stationary processes in the plane. Biometrika, 41, 434-49, 1954.
23. Worsley, K. L., Testing for a two-phase multiple regression. Technometrics., 25, 35-
42, 1983.
24. Yao, Y. C. and Davis, R. A., The asymptotic behavior of the likelihood ratio statistics
for testing shift in mean in a sequence of independente normal variates. Sankhya,
A48, 339-353, 1986.
25. Zhou, X., Shekhar, S. and Reem Y. A., Spatio temporal change footprint pattern
discovery: an inter-disciplinary survey. WIREs Data Mining Knowl Discov, 4:1-23.
doi: 10.1002/widm. 1113, 2014.
91
92
Modelación con Estadı́stica y Probabilidad
ISBN: 978-607-525-442-5
CAPÍTULO 7
Catherine Menkes
Centro Regional de Investigaciones Multidisciplinarias,
Universidad Nacional Autónoma de México,
Av. universidad s/n, Circuito 2, Col. Chamilpa
Ciudad Univesitaria de la UAEM, Cuernavaca Morelos
C.P. 62210, México.
[email protected]
93
7.1. Introducción
7.1.1. Educación sexual
La educación sexual juega un papel muy importante en los comportamientos y
protección sexual de los adolescentes ya que contribuye a que la población joven pueda
ejercer sus derechos sexuales y reproductivos y favorezca una mejor calidad de vida actual y
futura [1]. Además de ser un derecho, la educación sexual es una herramienta fundamental
para que las personas puedan tomar decisiones autónomas, informadas, responsables y
saludables sobre su sexualidad.
A este respecto, en México se ha reconocido la importancia de la educación sexual
ya que se argumenta que si ésta se imparte de forma integral, la misma puede contribuir
a posponer el debut sexual, ası́ como a fortalecer la capacidad de prevenir embarazos no
planeados e ITS; incluido el VIH/SIDA, sobre todo en los numerosos adolescentes y jóvenes
mexicanos que inician su vida sexual a edades tempranas [2].
En el marco de la Conferencia Mundial de VIH/SIDA, realizada en la Ciudad de
México en 2008, ministros de salud y educación de Latinoamérica signaron la Declaración
Ministerial “Prevenir con Educación”[3], en donde se afirmó el compromiso de reconocer
el derecho al disfrute del más alto nivel posible de educación, salud, no discriminación y
bienestar de las generaciones actuales y futuras. Asimismo, se reconoció que la educación
y la salud se refuerzan mutuamente, permitiendo el desarrollo integral de las personas, y
donde la actuación conjunta de los sectores de salud y educación son sinérgicos para la
prevención del VIH y otras ITS.
En esta misma cumbre, también se señaló la necesidad de incorporar la educación
de calidad de la sexualidad en la niñez y adolescencia como derecho humano, y como
estrategia de calidad de vida actual y futura. Se argumentó que la evidencia cientı́fica ha
mostrado que la educación sexual integral incluye información sobre diferentes métodos
de prevención y fomenta el autocuidado, también promueve entre aquellos que aún no han
iniciado su debut sexual la autonomı́a individual y capacidad para decidir cuándo iniciar
su ejercicio sexual.
Posteriormente, en agosto de 2013 se llevó a cabo la Primera Conferencia Regional
de Población y Desarrollo para América Latina, en la cual México firmó el Consenso de
Montevideo, que es hoy en dı́a el marco de referencia más reciente que sirve de base para el
fortalecimiento de la educación integral de la sexualidad [4]. Algunas de las prioridades de
dicho Consenso, están enfocadas especı́ficamente a la educación de la sexualidad de niñas,
niños, adolescentes y jóvenes.
Una de las estrategias fundamentales para que haya una educación integral de la
sexualidad, es la actualización de conocimientos de los actores clave en materia de
educación sexual. Más allá de las declaradas insuficiencias o de los temores y tabúes para
hablar autorizadamente acerca de la sexualidad, existen limitaciones inherentes a la forma
imperante en cómo se mira y vive la sexualidad [5], misma que sigue determinando en
sectores importantes de profesionales, especialmente del magisterio, la forma en cómo se
imparte la educación sexual.
La educación sexual debe estar sustentada en teorı́as cientı́ficas y en investigaciones
permanentes, contar con principios éticos claros, favorecer el ejercicio libre, responsable y
placentero de la sexualidad como derecho constitucional y necesariamente tendrı́a que estar
ligada y comprometida con las demandas, necesidades y derechos de las y los adolescentes.
Sin embargo, para lograr una educación integral, uno de los primeros pasos
fundamentales es lograr que la educación sexual se traduzca en una información adecuada.
Forma parte esencial de esta información un efectivo conocimiento de los métodos
anticonceptivos, en particular el preservativo masculino que es el método más utilizado
por los adolescentes, y a su vez protege de las ITS y embarazos no planeados.
94
Objetivos del trabajo
El objetivo de este trabajo es conocer cuáles son las caracterı́sticas de la educación
sexual que se asocian con un buen conocimiento del preservativo masculino. El saber
cómo funciona el condón, constituye uno de los elementos fundamentales para lograr una
protección sexual efectiva.
7.2. Metodologı́a
Fuente de datos.
La Universidad Autónoma de Nuevo León junto con el Centro Regional de Investigaciones
Multidisciplinarias de la Universidad Nacional Autónoma de México (CRIM/UNAM) llevó
a cabo la “Encuesta de Salud Reproductiva de los Estudiantes de Educación Secundaria
y Media Superior de Nuevo León”durante 2012. La encuesta es representativa de todos
los estudiantes de las escuelas públicas de Nuevo León que cursaron dichos años escolares.
Para lograr dicha representatividad, se entrevistaron en total a 2,187 alumnos de 13 a 19
años de edad hombres y mujeres que cursaban de segundo de secundaria a tercer año de
bachillerato en escuelas públicas.
En la primera parte de los resultados se analiza el buen conocimiento del preservativo
masculino según distintas caracterı́sticas socio-económicas y demográficas a través de un
análisis bi-variado. En seguida se estiman los modelos de regresión logı́stica.
En los primeros tres modelos de regresión logı́stica, se utilizaron las mismas variables
dependientes e independientes en cada uno de los modelos. Sin embargo, la unidad de
análisis en el primer modelo la constituyen los hombres, en el segundo las mujeres, y por
último todos los estudiantes. La variable dependiente contempla el buen conocimiento del
condón.
1. Cuando se ha eyaculado.
2. Cuando el pene está erecto.
95
3. Desde que se inicia la relación sexual1
4. No sé.
En la tercera pregunta referente a la utilidad del condón masculino, las opciones de
respuesta donde podı́an marcar sólo una contestación eran:
1. Para prevenir un embarazo.
2. Para prevenir una infección de transmisión sexual.
3. Para ambas.
4. No sé.
Las respuestas de cada pregunta se recodificaron en: respuesta correcta, respuesta
incorrecta.
Las variables independientes contemplan si los alumnos recibieron clase de educación
sexual en la escuela, si recibieron información sobre el ciclo menstrual, sobre métodos
anticonceptivos, y sobre las infecciones de transmisión sexual. En lo que respecta a estas
variables, se les preguntó directamente a los alumnos si recibieron este tipo de información.
Otra de las variables independientes consideradas en los modelos es quien les proporcionó
la información sexual en la escuela. La respuesta de los alumnos se agrupó en profesor,
médico, orientador o psicólogo, trabajador social, enfermera, otros y nadie. Finalmente
también se tomó en consideración si recibieron información de educación sexual fuera de
la escuela.
7.3. Resultados
7.3.1. Algunas Caracterı́sticas de Educación Sexual que
Recibieron los Alumnos
La posibilidad de que los individuos ejerzan sus derechos reproductivos depende en gran
parte de su educación sexual. En los programas de salud reproductiva se establece que para
tener una sexualidad placentera y segura, ası́ como un embarazo deseado y sin problemas,
las personas tienen derecho a conocer los procesos reproductivos del cuerpo humano, la
gama existente de métodos anticonceptivos, los riesgos a la salud y la protección contra
las ITS.
En este sentido, se les preguntó a los alumnos si habı́an tenido en la escuela alguna
clase, curso o plática de educación sexual. Se encontró que cerca del 80 % habı́a recibido
en la escuela este tipo de información (cuadro 1). Principalmente, la recibieron de parte de
los maestros (52 %), seguido del orientador(a) o psicólogo(a) (23 %), del trabajador social
(10 %) y de los médicos (7.6 %) (cuadro 2).
Se indagó si en esta última clase, curso o plática de educación sexual habı́an
recibido información sobre tres temas primordiales: a) ciclo menstrual o regla; b) métodos
anticonceptivos, y c) infecciones de transmisión sexual (ITS). En promedio, 90 % de
los estudiantes habı́a recibido información de cada uno de estos temas y fue mayor la
proporción que declaró haber recibido información sobre ITS con 96.6 % (cuadro 3).
Como la educación sexual que pueden tener los jóvenes no depende únicamente de lo
que aprenden de la educación formal, se les preguntó si habı́an recibido un curso o plática
sobre educación sexual fuera de la escuela. El 33.9 % de los hombres y 44.5 % de las mujeres
declararon haberla tenido (cuadro 4).
En sus respuestas respecto a quiénes recibieron información de sexualidad fuera de la
escuela, resalta la figura materna como primordial para hablar de este tópico, sobre todo en
1 En esta pregunta se tomaron como opciones válidas las respuestas: cuando el pene está erecto,
96
el caso de las alumnas (61 %). El padre ocupa el segundo lugar en importancia. En tercer
lugar destaca que ambos padres hablaron con sus hijos acerca de sexualidad (13.3 %). Es
claro que la participación de ambos padres es muy baja, sobretodo en el caso de las mujeres,
ya que únicamente el 8.3 % de ellas platicaron de educación sexual con ambos padres. Sin
duda alguna, hay una tendencia muy clara a que las madres platiquen sólo con sus hijas
y los padres primordialmente con sus hijos varones, lo que muestra que se profundiza la
dificultad de hablar de ciertos temas sensibles según el género. Posterior a los padres, el
personal médico tiene también un lugar importante como transmisor de información ya
que el 10 % de los alumnos recibieron la plática por parte del médico (cuadro 5).
97
al padre o madre (73 %). Este porcentaje es elevado porque el 87 % de las mujeres
tienen un buen conocimiento del condón cuando este tipo de informante les proporcionó
dicho conocimiento. El segundo lugar ocurre cuando el padre proporcionó la información
(68.3 %). En este caso hay que señalar que el porcentaje se eleva por el buen conocimiento
del condón de los varones.
Por el contrario, el menor porcentaje de dicho conocimiento ocurre cuando son los
amigos los que proporcionan la información de cómo usar el preservativo masculino, lo que
prueba que no se le puede dejar dicha información a los pares, ya que más que informar
pueden llegar a desinformar sobre distintos aspectos de la educación sexual.
conocimiento del condón) entre la probabilidad de que no ocurra el evento (razón de momios).
98
proporcionó el médico en la escuela, la probabilidad de que tengan un buen conocimiento
del condón disminuye, esto último quizás porque los médicos en las escuelas de Nuevo León
no se toman el tiempo necesario para establecer confianza con los estudiantes y poder ası́,
comunicarles de manera empática una educación sexual de calidad.
Si analizamos los resultados por sexo, vemos que, al igual que sucede con todos los
estudiantes en su conjunto, nuevamente sólo se encontró una relación estadı́sticamente
significativa entre la persona que proporcionó la plática de educación sexual al interior
de la escuela y el buen conocimiento del condón. En el caso de los hombres, se duplica
la probabilidad de un buen conocimiento si es el trabajador social el que les proporcionó
información sobre educación sexual mientras que, quizás por el reducido número de casos,
la relación no fue estadı́sticamente significativa en el caso de las mujeres. Por el contrario,
cuando la información la proporcionó el psicólogo u orientador se observa que aumenta
en un 47 % la probabilidad de un buen conocimiento del preservativo en estas últimas,
mientras que en los varones esta relación no resulta significativa. También en ambos
casos disminuye la probabilidad de un buen conocimiento si los estudiantes obtuvieron
la información de un médico al interior de la escuela.
Cabe señalar que haber recibido una clase de educación sexual, información sobre
99
la regla menstrual, sobre métodos anticonceptivos o información sobre infecciones de
transmisión sexual, no se relaciona, según los tres modelos estimados, con un buen
conocimiento del condón. Tampoco encontramos una relación entre haber recibido
información sobre educación sexual fuera de la escuela y el bien conocimiento del condón.
7.4. Conclusiones
Podemos concluir que los resultados sobre el buen conocimiento del condón sugieren
que no basta con recibir una clase de educación sexual, ni solo recibir información sobre
el perı́odo menstrual, sobre métodos anticonceptivos o bien sobre infecciones de infección
sexual, sino también muestran que se vuelve de fundamental importancia aquella persona
que proporcionó dicha información. En el caso de Nuevo León los orientadores o psicólogos
y los trabajadores sociales son los que obtienen los más destacados resultados, incluso
mejores que los maestros quizás porque le dedican más tiempo a los alumnos para hablar de
estos temas y establecen relaciones más empáticas con los adolescentes y menos jerárquicas.
Ası́, los hallazgos apuntan a que, para lograr una educación de calidad se requiere
no sólo de diálogos mejor informados, sino también de la construcción de relaciones más
equitativas con los adolescentes . En la medida en que los maestros son en general los
principales informantes de los temas sobre educación sexual en las escuelas públicas, se
refuerza la necesidad de replantear la forma en cómo se da esta información y la necesidad
de revisar los contenidos de los libros escolares que tratan sobre estos temas. Asimismo,
se vuelve evidente la necesidad de reforzar los programas de capacitación sobre educación
sexual para el profesorado, y también impulsar a los maestros para que proporcionen
información actualizada sobre los temas sexuales sin temores o tabúes de distinta ı́ndole,
y que impartan la información de manera más equitativa y estableciendo relaciones más
horizontales con los alumnos.
100
Referencias
1. Fine Michelle. Sexualidad, educación y mujeres adolescentes, el discurso ausente
del deseo, ((Géneros prófugos, feminismo y educación)), PUEG/UNAM, México, pp.
291-321. 1999.
2. UNESCO . Declaración Ministerial Prevenir con Educación (Primera Reunión de
Ministros de Salud y Educación para detener el VIH e ITS en Latinoamérica y el
Caribe). Santiago: Oficina Regional de Educación para América Latina y el Caribe
(OREALC/UNESCO). 2010.
3. UNFPA México . Educación de la sexualidad: Prevenir con educación. Fondo
de Población de las Naciones Unidas, 2010. [En lı́nea], Disponible en: http :
//www.unf pa.org.mx/ssre sexualidad.php. 2010.
4. CEPAL-ONU. Consenso de Montevideo sobre poblaciń y desarrollo. Montevideo:
CELADE, 2013.
5. Rodrı́guez Gabriela. Disciplinar los cuerpos: Género y educación sexual en la escuela,
((15 años de polÃticas de igualdad. Los alcances, los dilemas y los retos)). Tijuana,
Baja California: El Colegio de la Frontera Norte/El Colegio de México/FLACSO-
México. 2014.
101
102
Modelación con Estadı́stica y Probabilidad
ISBN: 978-607-525-442-5
CAPÍTULO 8
8.1. Introducción
La situación de la vivienda en México en el Siglo XXI es, en términos generales,
comparativamente mejor que la existente a fines del Siglo XX, ya que se avanzó en la
103
reducción del déficit habitacional, ası́ como en aspectos relativos a la reducción del número
de personas por vivienda y de las viviendas de un solo cuarto, menor hacinamiento,
y mejoras del parque habitacional que ha ganado en mayores espacios, mejorı́a en los
materiales de construcción y mayor acceso a servicios [3].
Si se toman como referencia los años censales 1970, 2000 y 2010, por ejemplo, los
avances mencionados se muestran con toda claridad. En términos de la relación población-
espacio de la vivienda, el número de ocupantes promedio por vivienda disminuyó de 5.8
a 4.4 y 3.9 y el promedio de ocupantes por dormitorio de más de 2.6 a 2.2 y 2.0; como
consecuencia, el hacinamiento (más de 2.5 ocupantes por dormitorio) se redujo de 37.9 por
ciento en 2000 a 33.4 por ciento en 2010.
Respecto a los materiales de construcción, las viviendas ocupan materiales duraderos
o resistentes en una proporción cada vez mayor. Ası́, el uso de material resistente en las
paredes aumentó de 44.1 a 78.9 y 86.3 por ciento; en los techos de 34.2 a 63.9 y 71. 6 por
ciento; y en pisos de 58.9 a 86.2 y 93.2 por ciento.
Por lo que se refiere a disponibilidad de servicios, los cambios también han sido
notables. El porcentaje de viviendas con agua entubada pasó de 49.4 a 85.2 y 88.7; con
drenaje de 41.5 a 75.4 y 89.1; con energı́a eléctrica de 58.9 a 95.4 y 98.2; y con excusado
de 31.8 a 86.3 y 95.9.
Los avances alcanzados en la calidad de la vivienda, sin embargo, han sido insuficientes
y desiguales según el carácter rural o urbano de las localidades o el tamaño de las ciudades,
principalmente. Las localidades urbanas han logrado una mejor calidad de la vivienda, y
entre ellas, las grandes ciudades tienen las mejores condiciones [3].
Una de las razones por las que no se ha reducido a una mı́nima expresión el problema
de la mala calidad de la vivienda, es que la polı́tica nacional del sector impulsada en el
2001 se enfocó en el financiamiento de vivienda nueva para disminuir el rezago habitacional
cuantitativo en el paı́s, a pesar de que los diagnósticos de esa época ya ubicaban al rezago
cualitativo como el principal problema [2]. Después de la crisis económica de 2008-2009
se reorientaron los objetivos de la polı́tica de vivienda hacia soluciones de mejoramiento
o ampliación, aunque llevará muchos años aún cerrar la brecha existente en materia de
desigualdad en la calidad del parque habitacional del paı́s.
En relación a la forma de estimar la calidad de la vivienda, se parte comúnmente
del documento del Comité de Derechos Económicos Sociales y Culturales [6], en el cual se
establecen las caracterı́sticas que debe reunir la vivienda para considerarse adecuada. Entre
ellas, la seguridad jurı́dica de la tenencia, la disponibilidad de servicios indispensables,
infraestructura y acceso a recursos naturales comunes, que los gastos del hogar derivados
de la vivienda no impidan o comprometan el logro y la satisfacción de otras necesidades
básicas, que sea habitable, que sea asequible, que se ubique en un lugar que permita el
acceso al empleo y servicios básicos y que los materiales de construcción, la forma de
construir y la polı́tica en que se apoyan, faciliten la expresión de la identidad cultural y la
diversidad de la vivienda.
A raı́z de esos atributos de la vivienda, se ha procedido a la elaboración de ı́ndices
de calidad, y más recientemente también a ı́ndices de habitabilidad. En ambos casos las
variables utilizadas se agrupan en el tipo de materiales de construcción de la vivienda, la
infraestructura y servicios de que dispone, ası́ como las instalaciones en su interior y las
caracterı́sticas de tamaño y disposición de espacios a su interior [1],[3]. La medición de
la habitabilidad, no obstante, incluye las caracterı́sticas del entorno barrial y el medio
ambiente, que se traduce en determinado nivel de sensación de bienestar personal y
colectivo de los habitantes de determinado lugar [8]. Es decir, incluye una medición de
carácter subjetivo con base en la realización de entrevistas que complementen los datos
cuantitativos relativos al espacio exterior.
En este trabajo se procede a calcular un ı́ndice de calidad de vivienda, ya que sólo se
dispone del cuestionario de la Encuesta Intercensal 2015.
104
El estado de Morelos y sus municipios se tomaron como estudio de caso, ya que
es una entidad de alto dinamismo demográfico influenciada por la cercanı́a de la Zona
Metropolitana de la Ciudad de México, y en donde se desarrolló un boom inmobiliario
entre 2001 y 2012, que aumentó el parque habitacional en el estado en forma considerable.
Su análisis permitirá conocer diferencias en la calidad de la vivienda entre municipios y
hacer algunas inferencias sobre las causas de ello.
8.2. Especificaciones
8.2.1. Objetivos
El objetivo de este trabajo es construir un ı́ndice de calidad de vivienda para cada
uno de los 33 municipios del estado de Morelos, con base en diez indicadores relativos
a diversas caracterı́sticas de las viviendas como la durabilidad de los materiales con que
fueron construidas, el grado de acceso a servicios básicos, y las condiciones de salubridad
y hacinamiento. Para lograr este objetivo, se procedió a la elaboración de indicadores
compuestos mediante la técnica de ACP.
8.3. Metodologı́a
8.3.1. Unidad de Análisis
Se analizan las viviendas que cumplen con la caracterı́stica de ser particulares y estar
habitadas en el estado de Morelos.
8.3.2. Variables
Se utilizan diez variables que reflejan las caracterı́sticas de las viviendas relacionadas
con el tipo de materiales de construcción, el nivel de acceso a servicios, ası́ como condiciones
de salubridad y de hacinamiento en que se encuentran las casas-habitación. Las variables
que se utilizan son:
Proporción de viviendas con paredes o muros construidas con tabique, ladrillo, block,
piedra, cantera, cemento o concreto.
Proporción de viviendas con techo construidas con losa de concreto o viguetas con
bovedilla.
Proporción de viviendas con piso construido con cemento, firme, mosaico, madera u
otro recubrimiento.
105
Proporción de viviendas que tienen cuarto para cocinar.
Proporción de viviendas en hacinamiento (más de 2.5 personas por cuarto para
dormir).
Proporción de viviendas con luz eléctrica.
Proporción de viviendas que obtienen el agua de llaves o mangueras que están dentro
de la vivienda.
Proporción de viviendas que tienen servicio sanitario.
Proporción de viviendas con taza de baño exclusiva de la vivienda.
Proporción de viviendas con drenaje a la red pública, fosa séptica o tanque séptico
(biodigestor).
j = 1, 2, ..., p
La suma de cuadrados de los coeficientes aij , j = 1, 2, ..., p es igual a la unidad.
De todas las posibles combinaciones lineales de este tipo, Y1 tiene la mayor varianza.
De todas las combinaciones lineales de este tipo, no correlacionadas con Y1 , Y2
describe la máxima variación de las observaciones. Similarmente, Y3 es la
combinación lineal no correlacionada con Y1 y Y2 que describe la máxima variación
de las observaciones. Ası́ sucesivamente hasta que Y1 , Y2 , ..., Yp son determinadas.
Generalmente, en la práctica sólo se consideran las primeras combinaciones lineales
que son las que explican la mayor variabilidad de los datos y ası́ descartar los “sobrantes”
y reducir el número de variables a considerar. Esta reducción de variables es de gran
utilidad práctica, ya que, en primer lugar facilita el manejo matemático y presentación
gráfica de los datos. En segundo lugar, en el supuesto caso de que exista redundancia en
las observaciones originales, tal que las variables están linealmente relacionadas, se dificulta
el análisis numérico y esto se puede evitar reduciendo el número de variables. Por último,
dicha reducción no ocasiona obstáculo alguno en la interpretación de los resultados finales,
ya que las variables transformadas pueden conducir ellas mismas a esta interpretación en
términos de las variables originales.
Es importante mencionar que el método de componentes principales puede ser aplicado,
entre otros, para los siguientes propósitos:
Métodos gráficos y análisis de conglomerados. En análisis de conglomerados,
no es tan fácil definir criterios mediante los cuales decidir, usando métodos
numéricos, si hay una justificación para dividir conjuntos de observaciones en grupos.
106
Si se grafican las CP puede ayudar al análisis de conglomerados; por ejemplo, si
hay grupos bien definidos y separados, un método analı́tico no es necesario. En
situaciones en las que ninguna prueba de significancia fuera posible, el graficar las
CP puede al menos confirmar que un grupo sugerido se ve razonable y es realmente
indicado por las observaciones.
Redundancia. La mayorı́a de las técnicas del análisis multivariado consideran
matrices de orden igual al número de variables. Cuando éstas son demasiadas, y si
las correlaciones entre las observaciones son altas, tal que las matrices de dispersión
son casi singulares o singulares, las dificultades se incrementan. Para prevenir este
problema, se hace un ACP preliminar y se descartan las CP más grandes, ya que
en muchos casos éstas contienen más ruido que información y poco o nada se pierde
con eliminarlas. Entonces el análisis se puede llevar acabo con las CP restantes.
Detección de observaciones aberrantes. Un problema frecuente cuando los
datos se obtienen de muestras multivariadas, es el detectar las observaciones que se
encuentran “alejadas” del conjunto de datos. Un análisis de CP y métodos gráficos
puede ser de gran utilidad en la detección de observaciones aberrantes.
Cálculo de ı́ndices. El análisis de CP también se usa en la construcción de
indicadores o ı́ndices, para analizar las condiciones de ventajas o desventajas en que
se encuentra una población. Se usa la primera CP como el mejor indicador porque
es la que retiene la mayor variabilidad posible del conjunto de datos, y retiene la
máxima información como una combinación lineal de las variables originales.
8.4.2. Historia
Existe literatura del análisis de CP desde antes de 1904, pero Karl Pearson fue el
primero que dio las bases matemáticas, describiendo la lı́nea de mejor ajuste en un grupo
elipsoidal de puntos. En 1933, Harold Hotelling formuló la definición moderna de CP
como los ejes que describen una máxima variación en los datos. Las aplicaciones de ACP
han sido bastante amplias en las diferentes ramas de la ciencia. Uno de los primeros
artı́culos aparecidos fue publicado por Jolicoeur y Mossiman (1960), aplicando el análisis
de CP en morfométrica, en un estudio sobre variedad de tortugas, para evaluar la variación
de tamaño y forma en grupos de organismos vivientes. La primera CP fue interpretada
como una “tendencia” de crecimiento debido a que todos los coeficientes son positivos. La
segunda CP presentó algunos coeficientes positivos y otros negativos, motivo por el cual
la interpretaron como una tendencia de “variación de forma”. Mosser y Scott usaron el
análisis de CP para estudiar la intercorrelación entre 57 variables socioeconómicas medidas
en 57 pueblos británicos. Los resultados mostraron que las 4 primeras CP explicaron el
60 % de la variación total. Estas cuatro variables fueron identificadas como clase social,
cambio de población 1931-1951, cambio de población 1951-1958 y sobrepoblación.
107
La varianza estimada de Y1 se puede expresar como una forma cuadrática en términos
de las varianzas y covarianzas de las variables originales. Esto es:
p p
X X
Σ̂(Y1 ) = at1 Sa1 = ai1 aj1 Sij ,
i=1 j=1
en donde
N
1 X
S= (Xi − X)(Xi − X)t ,
N − 1 i=1
es la matriz de varianzas y covarianzas de la muestra, con elementos sij .
La varianza de Y1 es la más grande de todos los vectores normalizados tal que la suma
de cuadrados de ai1 sea igual a uno. Esto es: at1 a1 = 1 . Esta restricción se ha tomado
porque el valor de Σ̂(Y1 ) pudo incrementarse sin lı́mite con sólo multiplicar los coeficientes
por una constante. Ahora bien, el problema consiste en encontrar el vector a1 que maximice
at1 Sa1 sujeto a la restricción at1 a1 = 1. Para determinar los coeficientes, se introducen los
multiplicadores de Lagrange λ1 y derivamos con respecto a1 e igualando a cero se obtiene
el sistema de p ecuaciones simultáneas:
(S − λ1 I) = 0,
|S − λ1 I| = 0.
Por lo tanto λ1 es la raı́z caracterı́stica más grande, porque el vector a1 fue seleccionado
de tal manera que maximice la varianza de Y1 . El siguiente paso es encontrar una segunda
combinación lineal normalizada y ortogonal a la primera. Esto es:
cuya varianza Σ̂(Y2 ) = at2 Sa2 sea máxima, sujeta las restricciones at2 a2 = 1 y at1 a2 = 0.
Esta última restricción significa que los dos vectores son ortogonales, es decir, la correlación
entre Y1 y Y2 es cero y por consiguiente la covarianza es cero. Mediante el mismo
procedimiento que se siguió para encontrar los coeficientes de Y1 , se determinan los
coeficientes de Y2 , pero ahora introduciendo un nuevo multiplicador de Lagrange, y
diferenciando con respecto a2 , e igualando a cero se obtiene:
at2 Sa2 = λ2
108
8.4.4. Caracterı́sticas de las Componentes Principales
Todas las raı́ces caracterı́sticas son reales y positivas.
La matriz A que contiene los vectores caracterı́sticos es ortogonal, ya que ai y aj
son ortogonales.
Si λi = λj sus correspondientes CP no están definidas ya que hay una infinidad de
vectores ortogonales.
La existencia de una raı́z cero, implica que las variables originales son linealmente
dependientes; en este caso, una o más componentes valen cero.
Que At SA = Λ , donde Λ es la matriz diagonal que contiene las raı́ces caracterı́sticas,
indica independencia entre las p CP.
De la ecuación |S − λj I| = 0, se sigue que la suma de valores es igual a la suma de
la diagonal de S. Esto es:
λ1 + λ2 + ... + λp = tr(S)
109
Para probar si el cálculo de CP es necesario, Bartlett [?] demuestra que:
tr(S)p
χ2 = −N ln (S)( )
p
se distribuye aproximadamente como una chi cuadrada con 21 (p(p + 1)) grados de libertad.
Si esta prueba no es significativa, entonces no tiene caso el cálculo de CP.
Anderson [2] trabajó la prueba de hipótesis H0 : λq+1 = ... = λq+r , en la que r de las
raı́ces caracterı́sticas intermedias de la matriz de covarianza poblacional Σ, son iguales.
H1 , la hipótesis alternativa, es que algunas de las raı́ces intermedias son distintas. Por el
criterio de razón de verosimilitud, tenemos la estadı́stica
X X λj
χ2 = −(N − 1) lnλj (N − 1)rln , j = q + 1, ..., q + r.
j
r
se distribuye asintóticamente como una chi cuadrada con p − 1 grados de libertad cuando
H0 es verdadera.
8.5. Resultados
Se utilizó el ACP sobre los diez indicadores simples de calidad de la vivienda.
El procedimiento de CP genera diez indicadores compuestos que son las componentes
principales. El número de CP se podrá reducir dependiendo de la estructura de correlación
de los indicadores originales y los datos disponibles. Se consideró apropiado estandarizar
los indicadores originales, por considerar a cada indicador con igual importancia, y realizar
el análisis de CP con la matriz de correlaciones como “input”. Para elegir el número de
componentes resultantes, consideramos el criterio de la raı́z principal y el criterio del
porcentaje de variación, que a continuación se describen de manera breve.
En el criterio de la raı́z principal, sólo se consideran significativos los valores propios
o autovalores mayores que 1. Esto se basa al considerar el cálculo de CP con datos
estandarizados en base a la matriz de correlaciones [4], [5].
El criterio del porcentaje de variación, consiste en declarar como diferente de cero, a
tantas raı́ces caracterı́sticas como sea necesario, para que las nuevas variables expliquen
un porcentaje de la variación original considerado como satisfactorio. En este trabajo se
consideró que explicar al menos el 75 % de la variación total serı́a aceptable [5].
En el Cuadro 1 se observa la proporción de varianza explicada por las 10 CP. El número
apropiado de nuevos indicadores compuestos son dos. Esto se hace considerando que los
dos primeros valores principales resultaron ser mayores que uno. La primera CP explica el
57.8 % de la variabilidad de los datos, la segunda el 15.2 % y juntas explican casi tres cuartas
partes de la variabilidad total. La primera CP es la que retiene la mayor variabilidad de
los datos observados; por lo tanto, la primera componente es la que seleccionamos para el
cálculo del ı́ndice de calidad.
110
En el Cuadro 2, se presentan los vectores principales correspondientes a las dos
componentes principales o indicadores compuestos (IC1 e IC2). Con base en que sólo
las componentes con valor absoluto mayores que .30 intervienen significativamente en la
conformación del vector, se observa que IC1 está formado por todos los indicadores simples.
111
En la Gráfica 1, se representa el ı́ndice de calidad de vivienda de los municipios de
Morelos. Estos resultados muestran que existe un enorme contraste en el nivel de desarrollo
de la población. Ası́, los municipios de Cuernavaca (que ocupa el primer lugar en calidad
de vivienda), Jiutepec, Zacatepec, Emiliano Zapata, Jojutla, Cuautla, Temixco, muestran
gran ventaja sobre los municipios de Ocuituco, Totolapan, Tlalnepantla, Tetela del Volcán,
Temoac y Tepalcingo, ya que las condiciones en que se encuentran sus viviendas, son
sumamente precarias y afectan directamente a la salud de la población, debido a que los
indicadores simples que más aportan al IC1 son las variables relacionadas con variables
sanitarias, por ejemplo, si la vivienda cuenta con agua entubada, servicio sanitario, taza
de baño exclusiva y drenaje (Véase mapa 1).
112
Se pueden identificar patrones territoriales del ı́ndice de calidad, consistentes en que los
municipios de carácter metropolitano son los que en general presentan mejores condiciones
de vivienda, en tanto que con las peores condiciones sobresalen los municipios menos
urbanizados. Los resultados del ı́ndice de calidad que se obtuvieron, como lo mostraremos
en otros trabajos, se encuentra altamente relacionado con el ı́ndice de marginación, niveles
de escolaridad, analfabetismo, tasas de fecundidad y otras variables sociodemográficas.
8.6. Conclusiones
De acuerdo al análisis realizado, las variables que explican las variaciones en la calidad
de la vivienda entre los municipios del estado de Morelos, son aquellas referidas a los
servicios hidrosanitarios. Y salvo Zacatepec y Jojutla, las mejores condiciones de vivienda
se localizan en los municipios metropolitanos más poblados. Una de las implicaciones de
polı́tica que pudiera tener este hallazgo, es que los programas de mejoramiento y ampliación
de los organismos nacionales de vivienda y del gobierno federal, que otorgan créditos y
subsidios, pudieran dirigirse al mejoramiento de los servicios hidrosanitarios como una
forma de mejorar la calidad de la vivienda, ya que actualmente se enfocan en la ampliación
mediante la añadidura de un cuarto. Serı́a una medida complementaria y no sustitutiva, ya
que las dos son relevantes para combatir el rezago habitacional cualitativo prevaleciente.
Referencias
1. Ancer Alejandra, et. al. Indice de calidad de vivienda por entidad federativa
de México y particularidades en el caso de Nuevo León. Revista Estudiantil de
Economı́a, Vol IV, núm 1. 2012.
2. Anderson T.W. Asymptotic Theory for Principal Components Analysis. Annals of
Mathematical Statistics, 34. 1963.
3. Bartlett, M.S. A Note on Tests of Significance in Multivariate Analysis. Proceedings
of the Cambridge Philosophical Society, 35. 1939.
113
4. CONAFOVI. Rezago habitacional, México. Consejo Nacional de Fomento a la
Vivienda. 2002.
5. Esquivel Marı́a T. y Judith Villavicencio. Caracterı́sticas de la vivienda en México
al año 2000, ((Entre el estado y el mercado. La vivienda en el México de hoy)),
UAM-M.A. Porrúa, México, pp. 51 a 84. 2006.
6. Hair J.F., Anderson R.E. y Tatham R.L. Multivariate Data Analysis. With readings.
New York: MacMillian Publishing Co., 1987.
7. Jolicoeur P. y J.E. Mosimann. Size and Shape Variation in the Painted Turtle: A
Principal Component Analysis, Growth, 24. 1960.
8. Jolliffe I.T. Principal Component Analysis. New York: Springer-Verlag. 2002.
9. Organización de las Naciones Unidas. Comité de Derechos Económicos, Sociales y
Culturales. Observación general 4: El derecho a una vivienda adecuada, (párrafo 1
del artı́culo 11 del Pacto), (Sexto periodo de sesiones), ONU. Doc: E/23., 1991.
10. SPSS Advanced Models 9.0, Chicago IL, E.U., 1999.
11. Ziccardi Alicia. Cómo viven los mexicanos. Análisis regional de las condiciones de
habitabilidad de la vivienda. Serie Los grandes temas nacionales, los mexicanos
vistos por sı́ mismos. UNAM, 234 pp., 2015.
114
Modelación con Estadı́stica y Probabilidad
ISBN: 978-607-525-442-5
CAPÍTULO 9
Fernando Velasco Luna, Vı́ctor Hugo Vázquez Guevara, Fabiola Blanco Infanson
Facultad de Ciencias Fı́sico Matemáticas,
Benemérita Universidad Autónoma de Puebla,
Av. San Claudio, s/n. San manuel
Puebla, Puebla, Código Postal 72570, México,
[email protected], [email protected], [email protected]
9.1. Introducción
La Estadı́stica está relacionada con la variablidad que se encuentra en cualquier
conjunto de datos. Las técnicas estadı́sticas de análisis de datos persiguen, en general,
el objetivo de caracterizar dos aspectos del conjunto: la tendencia y la variación alrededor
115
de está tendencia. En un experimento se manipulan ciertos factores con el objetivo de
determinar las interacciones existentes entre ellos. El diseño de experimento se fundamenta
en la replicación y la aleatorización. La replicación se refiere a una repetición del
experimento básico la cual permite obtener una estimación del error experimental, que es la
variabilidad que hay de un resultado a otro debida a factores no controlados, y determinar si
las diferencias observadas en los datos son estadı́sticamente significativas. La aleatorización
es la asignación al azar tanto del material experimental como del orden en que se realizan
las pruebas individuales o ensayos. En el desarrollo de un experimento se desea obtener
resultados confiables, lo cual se logra si el experimento se planifica procediendo en forma
cientı́fica. Al estudiar la variabilidad que se encuentra en los datos el interés es atribuir
ésta a categorias de los datos, las cuales se denominan factores. Las clases individuales
de cada factor se denominan niveles del factor. Por ejemplo en un estudio donde se desea
estudiar nivel socio económico de personas un factor podrı́a ser el nivel de estudios, y los
niveles de este factor serı́an medio superior, superior y posgrado. Al clasificar los datos
en términos de factores y sus niveles, la caracterı́stica de interés es la medida en que
diferentes niveles de un factor afectan a la variable de interés. Lo anterior se conoce como
el efecto de un nivel de un factor sobre la variable de interés. Los efectos de un factor
pueden ser considerados fijos o aleatorios, esto depende como se considere el conjunto
de los niveles de un factor, puede ser considerado finito o infinito. Modelos en los cuales
los efectos son solo fijos se denomina modelo de efectos fijos, mientras que en el otro
caso se denominan modelos de efectos aleatorios. Por otra parte los datos con estructura
jerárquica surgen en diversas situaciones. Por ejemplo: las investigaciones educativas están
frecuentemente relacionadas con problemas de investigación de relaciones existentes entre
alumnos y el grupo de clase en el que éstos se desenvuelven. El concepto general es que el
alumno interactúa con el grupo de clase al cual éste pertenece. Generalmente los alumnos
y el grupo de clase se conceptualizan como un sistema con estructura jerárquica, donde
los alumnos y los grupos de clase son definidos en niveles separados de esta estructura
jerárquica. En general, supóngase que se tienen datos con estructura jerárquica; es decir,
se tienen J grupos con nj unidades en el j-ésimo grupo, j = 1, ..., J. A cada grupo se le
denomina unidad de nivel 2; se tienen J unidades de nivel de nivel 2, y a cada una de las nj
unidades en cada grupo se le denomina unidad de nivel 1; con lo que se tienen nj unidades
de nivel 1 en la j-ésima unidad de nivel 2. El número de unidades de nivel 1 no tiene que
ser necesariamente igual en cada unidad de nivel 2. Para analizar datos con estructura
jerárquica se emplea el modelo lineal general jerárquico, que es un caso especial del MLM
el cual está dado por Y = Xβ + Zu + e. El MLM se divide en dos partes; la parte fija, Xβ,
y la parte aleatoria, Zu + e. La parte fija está compuesta por los coeficientes de regresión
los cuales forman el parámetro β, mientras que la parte aleatoria está compuesta por los
efectos aleatorios u.
Los modelos de efectos fijos o aleatorios se pueden considerar como casos particulares
del MLM. En este trabajo se presenta la caracterización de los efectos aleatorios del
modelo de efectos fijos y aleatorios en términos de la parte aleatoria Zu + e del MLM, lo
que permitirá en trabajos posteriores dar caracterización de los predictores de los efectos
aleatorios y de la parte aleatoria u involucrados en el MLM en términos de operadores.
Yij = µ + αj + eij ,
(9.1)
i = 1, ..., n; j = 1, ..., a,
116
donde Yij denota la i-ésima observación del j-ésimo nivel del factor, µ denota la media
general de todos los niveles del factor, αj es el efecto del j-ésimo nivel del factor A, y eij
es el error aleatorio correspondiente a la i-ésima observación del j-ésimo nivel del factor
A, con los supuestos E (eij ) = 0, V ar (eij ) = σe2 , y Cov (eij , elk ) = 0 para (i, j) 6= (l, k).
Un experimento con estas caracterı́sticas se denomina de un criterio de clasificación, ya
que en este se estudia la variabilidad de la variable respuesta respecto a un sólo factor,
y el modelo se denomina modelo ANOVA de un criterio de clasificación. En este tipo de
estudio el interés es probar hipótesis acerca de los efectos de los niveles del fator, ası́ como
obtener estimaciones de tales efectos.
El diseño estadı́stico permite planear las condiciones en que se desarrollara un
experimento, de manera que los datos puedan analizarse mediante un modelo estadı́stico
particular. En este sentido es necesario determinar la cobertura que tendran las inferencias
y conclusiones que se obtengan a partir de dicho análisis. Por esta razón es importante
hacer una breve revisión de la forma como se determinan los niveles de los factores que
seran incluidos en el diseño experimental. En el modelo dado por (9.1) pueden presentarse
dos casos relacionadas con los a niveles del factor A. En el primer caso el interés del
experimentador es hacer inferencias acerca de los efectos de únicamente los a niveles bajo
estudio. En este caso el modelo (9.1) se conoce como modelo de efectos fijos. El otro caso
es cuando el experimentador desea realizar inferencias acerca de la población de niveles del
factor A y los a niveles bajo estudio representan una muestra de esta gran población. En
este caso el modelo (9.1) se conoce como modelo de efectos aleatorios. Para definir si los
efectos son fijos o aleatorios, se debe de tener presente si los objetivos de la investigación
se aplican únicamente a los a niveles del factor incluidos en el experimento, en tal caso se
consideran fijos. Ahora, si el objetivo está enfocado a la población de los niveles del factor,
estos niveles se consideran aleatorios. A continuación se describe con mayor detalle estas
dos situaciones.
Yij = µ + αj + eij ,
(9.3)
j = 1, ..., a; i = 1, ..., n,
donde µ denota la media general, αj es el efecto del j-ésimo nivel del factor A y eij es
el error aleatorio, con los supuestos E (eij ) = 0, V ar (eij ) = σe2 , y Cov (eij , elk ) = 0 para
(i, j) 6= (l, k).
Bajo los supuestos del modelo dado por (9.3), la varianza de la variable respuesta Yij ,
está dada por
V ar(Yij ) = σe2 . (9.4)
117
Basados en el modelo dado por la ecuación (9.2), el interés en este caso es probar la
igualdad de las a medias de los a niveles del factor A. La hipótesis está dada por
H 0 : µ1 = . . . = µa
vs (9.5)
6 µk para al menos un par (l, k)
H 1 : µl =
Mientras que bajo el modelo dado por la ecuación (9.3), el interés en este caso es probar
la igualdad de las a efectos de los a niveles del factor A. La hipótesis está dada por
H0 : α1 = . . . = αa = 0
vs (9.6)
H1 : µl 6= 0 para al menos un l
Yij = µ + αj + eij ,
(9.7)
i = 1, ..., n; j = 1, ..., a,
en este caso tanto αj y eij se consideran variables aleatorias, independientes, con media
2
cero, y varianzas σα y σe2 respectivamente, además del supuesto de normalidad.
Bajo los supuestos del modelo dado por (9.7), la varianza de la variable respuesta Yij ,
está dada por
2
V ar(Yij ) = σα + σe2 (9.8)
El interés está en la existencia de variabilidad entre los niveles del factor A, es decir,
2 2
si σα > 0, el caso de que σα = 0 implica que no existe variabilidad entre los niveles del
factor A. De lo anterior la hipótesis de interés está dada por
2
H 0 : σα =0
vs (9.9)
2
H 1 : σα > 0.
118
2008; Fujimoto and Koga 2009; Cervantes et al., 2009; Dallal et al., 2009; Zuur et al.,
2009). Los modelos lineales jerárquicos son también conocidos como modelos multinivel
(Goldstein, 1995; De Leeuw, 2008), modelos de coeficientes aleatorios (Longford, 1995),
modelos de componentes de la varianza y covarianza (Searle et al., 2006), o como modelos
de efectos mixtos (Jiang 2007; Laird y Ware, 1982; West et al., 2007; Zuur et al., 2009).
Un tratamiento y abundantes referencias acerca de estos modelos se puede encontrar en
Goldstein (1995), Longford, (1995), Raudenbush y Bryk, (2002), Hox, J. (2002), De Leeuw
y Meijer (2008). En la actualidad existe software estadı́stico el cual permite analizar datos
con estructura jerárquica de acuerdo al modelo apropiado, MLwiN, (Rasbash et al., 2009),
S-PLUS (Pinheiro y Bates, 2000).
Los parámetros en el modelo (9.10) son tres: El coeficiente β00 y los componentes de
la varianza σe2 y σu2 0 . En este modelo la varianza de la variable respuesta es descompuesta
como la suma de las varianzas nivel 1, σe2 y nivel 2, σu2 0 ,
El modelo (9.12) se denomina modelo intercepto aleatorio con una variable explicatoria.
Los parámetros en el modelo (9.12) son cuatro: Los coeficientes de regresión β00 y β1 , y los
119
componentes de la varianza σe2 y σu2 0 . En este modelo la varianza de la variable respuesta
es descompuesta como la suma de las varianzas nivel 1, σe2 y nivel 2, σu2 0 ,
el cual se denomina modelo de pendientes aleatorias con una variable explicatoria a nivel
1.
Los parámetros en el modelo (9.14) son seis: Los coeficientes de regresión β00 y β10 ,
y los componentes de la varianza σe2 , σu2 0 , σu2 1 y σu01 . En este modelo la varianza de la
variable respuesta es descompuesta como:
De la ecuación (9.15) se tiene que en el modelo de pendientes aleatorias con una variable
explicatoria a nivel 1 la varianza de la variable respuesta depende de la variable explicatoria
a nivel 1, Xij .
El modelo para el nivel 1 tiene la forma:
120
Modelo de Regresión Lineal Jerárquico de Dos Niveles con Variables
Explicatorias en Ambos Niveles
En el modelo de regresión lineal jerárquico de dos niveles con variables explicatorias
en cada nivel interviene la variable respuesta Yij , de la i-ésima unidad de nivel 1 en la
j-ésima unidad de nivel 2, m variables, , x1 , ..., xm a nivel 1, y q variables w1 , ..., wq a nivel
2. El modelo nivel 1 para la i-ésima unidad de nivel 1 en la j-ésima unidad de nivel 2, con
m variables explicatorias x1ij , ..., xmij a nivel 1, tiene la forma:
donde los coeficientes de regresión β0j , β1j , ..., βmj tienen la interpretación usual de un
modelo de regresión múltiple, estos coeficientes varı́an de unidad a unidad de nivel 2.
El modelo nivel 2, con q variables explicatorias a nivel 2 w1j , ..., wqj tiene la forma:
donde los coeficientes βk0 , βk1 , βk2 , ..., βkq son fijos. Los errores u0j , uij , ..., umj son los
efectos aleatorios de nivel 2.
El modelo combinado para la para la j-ésima unidad de nivel 2, del modelo nivel 1 con
m variables explicatorias a nivel 1:
βkj = βk0 + βk1 w1j + βk2 w2j · · · + βkq wqj + ukj , (9.19)
tiene la forma:
yij = (β00 + β01 w1j + · · · + β0q wqj + u0j ) + (β10 + · · · + β1q wqj + u1j ) x1ij +
···
y1j x1j 1 x11j x21j xm1j
y2j x2j 1 x12j x22j ··· xm2j
Yj = ; Xj =
.. .. .. .. .. .. ..
. . . . . . .
ynj j xnj j 1 x1nj j x2nj j ··· xmnj j
t
ej = e1j , ..., enj j ; β j = (β0j , ..., βmj )t
121
En forma matricial el modelo nivel 1 (9.16), está dado por:
Yj = Xj β j + ej ; j = 1, ..., J,
β j = Wj β + uj ; j = 1, ..., J
Y = XWβ + Xu + e,
Definiendo G = diag (Ω) y R = diag σe2 Inj la matriz de varianzas y covarianzas está
dada por:
V = V ar (Y) = XGXt + R.
122
9.3.2. Modelo Lineal Mixto
Los modelos anteriores son casos especiales del MLM el cual está dado por medio de:
Y = Xγ + Zu + e,
E (e) = 0, V ar (e) = R, (9.22)
E (u) = 0, V ar (u) = G y Cov e, ut = 0,
E (Y) = Xγ
y
V = V ar (Y) = ZGZt + R.
123
Sea un experimento de un criterio de clasificación en el que se tienen a niveles del
factor A, y n observaciones por nivel, cada una de las an observaciones pueden describirse
mediante el modelo lineal
Yik = µ + αi + eik ,
(9.25)
i = 1, ..., a; k = 1, ..., n.
Desarrollando el modelo para cada una de las observaciones, tomando, 4 niveles para
el factor A y 3 observaciones para cada nivel, se tiene
y11 1 1 0 0 0 e11
y12 1 1 0 0 0 e12
y13 1 1 0 0 0 e13
y21 1 0 1 0 0
e21
y22 1 0 1 0 0 α1 e
22
y23 1 0 1 0 0 α2 e23
y31 = 1 µ + 0 0 1 0 α3 + e31 (9.26)
y32 1 0 0 1 0 α4 e32
y33 1 0 0 1 0 e33
y41 1 0 0 0 1 e41
y42 1 0 0 0 1 e42
y43 1 0 0 0 1 e43
y = 112 µ + (I4 ⊗ 13 ) α + e
o en la forma
y = (14 ⊗ 13 ) µ + (I4 ⊗ 13 ) α + e
En general para un experimento de un criterio de clasificación en el que se tienen a niveles
del factor A, y n observaciones por nivel, el modelo está dado por:
y
Z = 0,
el modelo dado por (9.27), toma la forma
Y = Xγ + Zu + e
X = (1a ⊗ 1n )
y
Z = (Ia ⊗ 1n ) ,
124
el modelo dado por (9.27), está dado por
Y = Xγ + Zu + e
9.5. Conclusiones
En este trabajo se mostró que los efectos aleatorios involucrados en el modelo de efectos
fijos y aleatorios son componente en la parte aleatoria del MLM. Lo anterior con el objetivo
de posteriormente obtener la caracterización de los efectos aleatorios involucrados en el
modelo de efectos aleatorios en términos de operadores proyector construidos a partir de
las matrices de diseño presentes en el MLM.
Referencias
1. Cervantes, V.H., Santana, A.C., Guilera, G. y Gómez-Benito, J., Hierarchical linear
models in psychiatric: A bibliometric studty, Scientometrics, 80, 797-808. 2009.
2. Coutiño-Estrada, B. y Vidal-Martı́nez .V.A., Componentes de varianza de hı́bridos
de maı́z evaluados en la faja maicera de los Estados Unidos, Agrociencia, 40, 89-98,
2006.
3. Dallal, R.M., Quebbemann, B.B., Hunt, L.H. and Braitman, L.E. Analysis of weight
loss after bariatric surgery using mixed effects linear modeling, Obesity Surgery, 19,
732-737, 2009.
4. De Leeuw, J. and Meijer, E., Handbook of Multilevel Analysis, Springer, New York,
USA, 2008.
5. Fujimoto, T. and Koga, S., An application of mixed-effects model to evaluate the
effects of initial spancing on radial variation in wood density in Japanese larch (Larix
Kaempferi), Journal of Wood Science, 0, 1-8, 2009.
6. Gelman, A. and Hill, J., Data analysis using regression and multilevel/hierarchical
models, Cambridge University Press, 625 p., 2007.
7. Goldstein, H., Multilevel statistical models, Third Edition, Halsted Press, New York,
USA, 1995.
8. Henderson, C.R., Best linear unbiased estimation and prediction under a selection
model, Biometrics, 31, 423-447, 1975.
9. Henderson, C.R., Applications of Linear Models in Animal Breeding, University of
Guelph, Guelph, Ontario, 1984.
10. Henderson, C.R., Kempthorne, O., Searle, S.R. and von Krosigk, C.N., Estimation
of environmental and genetic trends from records subject to culling, Biometrics, 15,
192-218, 1959.
11. Hox, J., Multilevel analysis; techniques and applications, Lawrence Erlbaum
Associates, Publishers, London, 304 p., 2002.
12. Jiang, J., Linear and generalized linear mixed models and their applications,
Springer, New York, 257 p., 2007.
13. Laird, N. and Ware, J., Random effects models for longitudinal data, Biometrics,
38, 963-974., 1982.
125
14. Longford, N.T., (eds. Arminger, G., Clogg, C.C. and Sobel, M.E.), Random
coefficient models. In: Handbook of statistical models for the Social and behavioral
sciences, pp. 519-577, Plenum Press, New York, USA, 1995.
15. Pinheiro J.C. and Bates, D.M., Mixed effects models in S and S-PLUS, Springer,
New York, USA, 2000.
16. Rasbash, J., Steele, F., Browne, W.J., and Goldstein, H., A user’s guide to MLwiN
version 2.10. Center for multilevel modeling. University of Bristol. London. England,
2009.
17. Raudenbush, S.W. and Bryk, A.S, Hierarchical linear models applications and data
analysis methods, 2nd. Ed. Sage Publications, Thousand Oaks, USA, 2002.
18. Searle, S.R., Casella, G. and McCulloch, C.E., Variance component, 2nd Ed., John
Wiley, New York, USA, 2006.
19. West, B.T., Welch, K.B., and Galecki, A.T., Linear mixed models. A practical guide
using statistical software, Chapman Hall/CRC, Boca Raton, Florida, USA, 2007.
20. Zuur, A.F., Ieno, A.N., Walker, N.J., Saveliev, A.A. and Smith, G.M., Mixed effects
models and extensions in ecology with R. Springer, New York, 574 p., 2009.
126
Modelación con Estadı́stica y Probabilidad
ISBN: 978-607-525-442-5
CAPÍTULO 10
Abstract. The Item Response Theory is a family of statistical procedures to analyze and
describe the behavior of a measuring instrument (test, questionnaire, scale or construct).
These procedures have three distinct features: (a) focus on the behavior of individual
items (b) describe the behavior of the item at different levels, and (c) model-based. In
this work the analysis of a questionnaire of Family Wellbeing is performed through Item
Response Theory, with the purpose of achieving a simplification of the same and with
this to facilitate the knowledge about the perception that have Chiefs, Officers and Troop,
belonging the Secretary of National Defense, and their families, about their well-being as
users of Housing Units in the city of Puebla.
Palabras clave: curvas caracterı́sticas del ı́tem, modelos logı́sticos, modelos factoriales.
127
10.1. Introducción
En las Ciencias Ambientales, y también en otras muchas áreas de la ciencia y la
tecnologı́a, algunas caracterı́sticas del fenómeno bajo estudio, no pueden ser observadas de
forma directa, porque se trata de un concepto abstracto o de una caracterı́stica subyacente
(la actitud hacia el medio ambiente, la percepción, la inteligencia, el aprendizaje, la calidad
de vida, etc.). Estos conceptos requieren ser analizados mediante técnicas estadı́sticas
que definen una variable latente a partir de un conjunto de variables (ı́tems, reactivos o
preguntas de un cuestionario). Entre estas técnicas estadı́sticas, se encuentra la Teorı́a de
Respuesta al Ítem (TRI).
La TRI, también conocida como Teorı́a de Rasgo Latente, asume que entre la respuesta
que una persona ofrece a una pregunta de un cuestionario y el rasgo o habilidad (puede
entenderse también la actitud, la aptitud, la preferencia, el prejuicio, la percepción, etc.) de
la persona, existe una relación no lineal que se puede expresar en términos probabilı́sticos
[7] . El conjunto de los cálculos que se aplican para ello determina los distintos modelos y
resultados de la TRI.
La TRI afirma que si una persona tiene un cierto nivel n de habilidad o percepción, por
128
ejemplo, tendrá asociado a dicho valor una probabilidad de que conteste positivamente a
una pregunta sobre acciones que lo mejoren. Expresado de otra manera, si una persona
responde favorablemente a un ı́tem, es posible suponer que esta persona posee un
determinado nivel de actitud favorable hacia el medio ambiente o una percepción hacia
algún aspecto de interés.
La CCI muestra probabilidades cercanas a cero para valores pequeños del nivel y
probabilidades cercanas a 1 para valores elevados de la misma, produciéndose un
incremento gradual de la probabilidad a medida que aumentan los valores del rasgo latente.
i = 1, . . . , n
En algunas investigaciones, debido a que en la mayor parte de los tests o cuestionarios, los
ı́tems presentan respuestas categóricas, es un hecho que un Ítem puede ser contestado por
azar, por lo que se debe tener en cuenta otro parámetro, el parámetro de adivinación ci
que se define como el valor P (θ) si θ tiende a menos infinito. Gráficamente se corresponde
con la ası́ntota inferior de la curva caracterı́stica.
129
Figura 10.1: Ejemplo de CCI con sus parámetros.
El análisis factorial suele ser la metodologı́a más utilizada para estudiar la dimensionalidad.
Dado que empı́ricamente raras veces se encuentra una unidimensionalidad perfecta, esto
es, que un solo factor dé cuenta de un 100 % de la varianza, la unidimensionalidad se
convierte en una cuestión de grado: cuanta más varianza explique el primer factor, más
unidimensionalidad existe.
130
10.2.2. Modelos de la TRI
Los modelos de la Teorı́a de Respuesta al Ítem (TRI) muestran la relación entre la
habilidad o el rasgo (simbolizado por θ) medido por el instrumento y la respuesta a un ı́tem.
La respuesta del ı́tem puede ser dicotómica (dos categorı́as), como correcta o incorrecta,
sı́ o no, de acuerdo o en desacuerdo, o bien, puede ser politómica (más de dos categorı́as),
como una escala de respuesta tipo Likert en una encuesta.
Para ı́tems o reactivos donde la respuesta es dicotómica, esto es, se admite sólo la
posibilidad de éxito o fracaso, la probabilidad de éxito será:
exp(f (θ))
p = P i(θ) = P (X = 1)) = . (10.1)
(1 + exp(f (θ)))
El sı́mbolo X es una variable aleatoria que indica que la respuesta muestra una actitud
positiva (éxito: X = 1) o negativa (fracaso: X = 0).
Según la expresión que tome la función f (θ) se tienen diferentes modelos [2] .
exp(θ − bi )
p= . (10.2)
(1 + exp(θ − bi ))
El sı́mbolo bi es el parámetro de dificultad del Ítem i. Tanto él como se refieren a la
misma escala de medición.
exp(a(θ − bi ))
p= . (10.3)
(1 + exp(a(θ − bi ))
El modelo de Rasch es un caso particular del modelo 1PLM, donde el parámetro de
discriminación a = 1.
Además de los dos modelos anteriores, en la TRI se utilizan los modelos logı́sticos de
dos parámetros (2PLM) y de tres parámetros (3PLM). En el modelo 2PLM la función de
probabilidad tiene en cuenta los parámetros de dificultad (bi ) y de discriminación (ai ) de
cada ı́tem.
131
10.2.3. Estimación de los Parámetros de los Modelos de la
TRI
Seleccionado uno de los modelos, el paso siguiente es la estimación de los parámetros
y de las puntuaciones de cada sujeto, a partir de las puntuaciones empı́ricas en el test o
cuestionario. Lo único conocido son las respuestas de los sujetos a los ı́tems del cuestionario
y a partir de ellas debe realizarse la estimación de los parámetros.
Los métodos condicionales son aquellos que usan la función de distribución de las
puntuaciones dado un valor de la habilidad θ, o lo que es lo mismo, si se da el nivel
de habilidad de cada uno de los individuos en la población, la función de verosimilitud
está condicionada a los valores de θj . A través de estos métodos se obtienen estimadores
condicionales de los parámetros [1] .
Con bastante frecuencia se utiliza el estadı́stico de Razón de Verosimilitudes, que sigue una
Chi-cuadrado como una medida de ajuste para cada ı́tem, y la suma de éstos proporciona
el estadı́stico Chi-cuadrado para el test entero.
132
a) Unidimensionalidad
b) Igualdad de discriminación
133
10.2.6. Posibles Softwares: el Paquete ltm
En la actualidad se dispone de varios programas de ordenador entre los que se destacan:
BICAL, RASCAL, BILOG, MULTILOG. Todos estos programas ofrecen como salida
fundamental los valores estimados de los parámetros de cada ı́tem y el valor de tetha
para cada sujeto.
En este trabajo se utilizó el paquete ltm en lenguaje R [5], distribuido en forma gratuita
bajo licencia GPL (General Public License) del proyecto de software libre GNU.
El ltm permite estimar los parámetros de los modelos estadı́sticos, descritos anteriormente,
por el método de estimación de Máxima Verosimilitud Marginal. Las técnicas de estimación
asumen que los individuos son independientes entre sı́ y que los reactivos funcionan de la
misma manera para todos los individuos, es decir, no existen factores de diferenciación en
la capacidad de respuesta de los participantes en una investigación.
Los parámetros de los modelos 1PLM, 2PLM y 3PLM se obtienen con las funciones rasch(
), ltm( ) y tpm( ), respectivamente.
Para cualquiera de los cuatro modelos, con la función factor.scores( ) se accede al parámetro
de habilidad (actitud) de los individuos.
El paquete también dispone de la función plot( ) que permite graficar las curvas
caracterı́sticas de los ı́tems, las curvas de información del ı́tem y del test.
La función anova( ) permite decidir, entre dos modelos, cuál ajusta mejor los datos
experimentales, realizando el test de razón de verosimilitud (LRT). La misma función
anova( ) devuelve los valores BIC y AIC, correspondientes al Criterio de Información
Bayesiano y al Criterio de Información de Akaike, respectivamente, para seleccionar el
modelo que mejor se ajusta a los datos. En ambos casos, cuanto menor es el valor obtenido,
mejor resulta el modelo.
Debe destacarse, finalmente, que el paquete ltm es muy potente, versátil y fácil
de utilizar, brindando la posibilidad de acceder a toda la información necesaria para
determinar los niveles de habilidad (actitudes hacia el medio ambiente, percepción de
bienestar) de los individuos (usuarios).
134
La población de esta Unidad Habitacional Militar está integrada de 384 departamentos
ocupados por Jefes, Oficiales y Tropa pertenecientes a la Secretarı́a de la Defensa Nacional,
agrupados en dos áreas: la tipo “A” con 156 departamentos y la tipo “B” con 228
departamentos.
Sólo las subescalas de Educación Ambiental y Bienestar por Salud se ajustan mejor por el
modelo 1PLM; las restantes subescalas se ajuntan mejor por el modelo Rasch. Los gráficos
CCI se obtienen a partir del mejor modelo en cada caso.
En el Anexo se muestran las diferentes preguntas agrupadas por subescalas y una propuesta
de las preguntas que debieran mantenerse en el cuestionario según resultados de la TRI.
A. Unidimensionalidad
135
Cuadro 10.1: Valores y vectores propios de la matriz de correlaciones.
B. Igualdad de discriminación
Como se explicó anteriormente, la igualdad de discriminación puede ser verificada a través
del examen de la correlación entre el ı́tem i y el puntaje total del instrumento, es decir,
con la correlación biserial puntual (rpbi), que se muestra en el Cuadro 10.2. El puntaje
total ha sido medido en escala de intervalos y el ı́tem es una variable dicotómica. Puede
observarse que los coeficientes de correlación biserial puntual de cada ı́tem con el puntaje
total no son iguales. Cuanto más alto es el valor de rpbi , mayor será la discriminación
del ı́tem. Ası́, en este caso, los ı́tems P1 y P3 son los que más discriminan, le sigue en
importancia el P2 y, por último, el P4. El supuesto de considerar todos los reactivos con
igual nivel de discriminación en los modelos de Rasch y 1PLM, es dudoso en este caso.
Cuadro 10.2: Coeficiente de correlación biserial puntual de cada ı́tem con el puntaje
total.
Incluı́do Excluı́do
P1 0.7630 0.4186
P2 0.6079 0.3219
P3 0.7369 0.4419
P4 0.5038 0.2750
En el Cuadro 10.4 se presenta el parámetro estimado para cada ı́tem según el modelo
1PLM, mostrando de manera similar al caso anterior, la salida del programa ltm.
136
Cuadro 10.3: Parámetro b en el modelo Rasch.
Dscrmn 1.0000 NA NA
dificultad el P1. Los dos criterios de selección de modelos, el AIC y el BIC, son menores
en el modelo 1PLM que en el modelo de Rasch, lo que apunta a que el modelo 1PLM se
ajusta mejor a los datos.
En el Cuadro 10.6 muestra las estimaciones del parámetro θ (Factor-Scores) para los
patrones de la respuesta observada en el modelo 1PLM.
137
Cuadro 10.5: Comparación del modelo Rasch vs 1PLM.
La figura 10.2, que representa la Curva Caracterı́stica del Ítem (ICC), muestra que el
ı́tem P1 está situado más a la derecha del gráfico, señalando que es de mayor grado de
dificultad y, por tanto, puede considerarse la pregunta más importante de la Subescala.
En orden de importancia quedarı́an las preguntas P3, P2 y P4.
138
Subescala de Bienestar por Salud
La figura 10.3 muestra la CCI de la Subescala Bienestar por Salud, que resume la
aplicación de la TRI a esa subescala.
Figura 10.3: Curva Caracterı́stica del Ítem (CCI) de la Subescala Bienestar por
Salud.
Los resultados obtenidos señalan que la Subescala de Bienestar por Salud del
Cuestionario sobre el Grado de Bienestar Familiar de usuarios de una Unidad Habitacional
Militar del estado de Puebla, es capaz de medir la percepción de esos usuarios hacia el
bienestar por salud, aunque se recomienda profundizar en la información que brinda el
ı́tem P10 y si es posible simplificar la subescala eliminando esa pregunta.
Los resultados obtenidos señalan que la Subescala de Bienestar Espacial del Cuestionario
sobre el Grado de Bienestar Familiar de usuarios de una Unidad Habitacional Militar del
estado de Puebla, es capaz de medir la percepción de esos usuarios hacia el bienestar
espacial, aunque se recomienda profundizar en la información que brindan las preguntas
P18 y P20 y si es posible simplificar la subescala eliminándolas.
Los resultados obtenidos señalan que la Subescala de Bienestar Lumı́nico del Cuestionario
sobre el Grado de Bienestar Familiar de usuarios de una Unidad Habitacional Militar del
estado de Puebla, es capaz de medir la percepción de esos usuarios hacia el bienestar
lumı́nico. En este caso es necesario profundizar en otros aspectos de la TRI, dado que es
posible que no deba eliminarse ninguna de la preguntas.
139
Figura 10.4: Curva Caracterı́stica del Ítem (ICC) de la Subescala Bienestar Espacial.
140
Figura 10.6: Curva Caracterı́stica del Ítem (ICC) de la Subescala Bienestar
Acústico.
Figura 10.7: Curva Caracterı́stica del Ítem (ICC) de la Subescala Bienestar Térmico.
10.4. Conclusiones
El bienestar familiar es un constructo multidimensional y dinámico, para el cual no
existe, en la actualidad, una definición universalmente aceptada. Sin embargo, puede
141
Figura 10.8: Curva Caracterı́stica del Ítem (ICC) de la Subescala Bienestar Visual.
aceptarse que se trata de un constructo cuya medida requiere de una evaluación subjetiva
de los miembros de las familias.
Se han dado los primeros pasos para una versión abreviada del Cuestionario de Bienestar
Familiar, que se elaboró inicialmente con 45 ı́tems y que puede ser reducido a la mitad o
la tercera parte de los mismos. Estudios posteriores permitirán evaluar la validez factorial
y la fiabilidad de la versión reducida del cuestionario, lo cual supondrá un importante
ahorro en el tiempo, tanto para los arquitectos y constructores de viviendas como para los
usuarios de esas Unidades Habitacionales.
Referencias
1. Andersen, E.B. A goodness of fit test for the Rasch model. Psychometrika.38. pp:
123-140, 1973.
2. Berejnoi, C. y Barros, M. A. Comparación de diferentes modelos de la Teorı́a
de Respuesta al Ítem en: Cuadernos de la Facultad de Ingenierı́a. EDITORIAL
EUCASA. Año 8 / número 8 / noviembre. Salta Argentina, 2014.
3. Goldstein, H. Dimensionality, bias, independence and measurement scale problems
in latent trait test score models. British Journal of Mathematical and Statistical
Psychology. 33. pp: 234-246, 1980.
4. R. Core Team, R: A language and environment for statistical computing. R
Foundation for Statistical Computing, Austria, 2013.
142
5. Rizopoulos, D., ltm: An R package for Latent Variable Modelling and Item Response
Theory Analyses, Journal of Statistical Software, 17 (5), pp:1-25, 2006.
6. Rizopoulos, D., Latent Trait Models under IRT ltm Package, Versión 1.0-0, 2013.
7. Thorpe, Geoffrey L. and Favia, Andrej, ”Data Analysis Using Item Response Theory
Methodology: An Introduction to Selected Programs and Applications.”Psychology
Faculty Scholarship. Paper 20, 2012.
8. Wiberg, M. Classical Test Theory vs. Item Response Theory An evaluation of the
theory test in the Swedish driving-license test. EM No 50, UMEA UNIVERSITET,
2004.
143
10.5. Anexo: Cuestionario de Bienestar Familiar
(Se sugiere mantener las preguntas marcadas con asterı́sticos)
Pregunta Ítem Descripción (Subescala Disposición de Agua Potable ) Valoración (según TRI)
P5 1 Disponibilidad por Servicio Municipal
P6 2 Fuente de consumo humano Servicio Municipal
P7 3 Consumo Humano Garrafón
P8 4 Lavado de Tinacos frecuente
P9 5 Calidad del agua
144
Modelación con Estadı́stica y Probabilidad
ISBN: 978-607-525-442-5
CAPÍTULO 11
145
The indicator proposed to measure students satisfaction considers cause-effect
relationship between a set of variables considered as “background” and another set
of variables considered as a “consequences” of satisfaction. In the first set we find
studentséxpectations, their image of the FCEA, the quality of teaching and services, and
their perceived value, while within satisfaction “consequences” we find students’loyalty to
the institution and the impact on the word-of-mouth.
The data used in this application come from a survey conducted on a random sample
of students of the FCEA in 2009. The questionnaire applied, has 9 sets of questions; the
first contains the variables that allow us to make a profile of the students according to their
sociodemographic environment. On the other hand, the ECSI model variables (European
Customer Satisfaction Index) which will be used as inputs for the student’s satisfaction
characterization.
The results, presented for a model with 22 observable variables and 7 unobservable
constructs were obtained by Partial Least Squares estimation.
11.1. Introducción
Conocer el nivel de satisfacción de los clientes, con un determinado servicio que se está
brindando, resulta fundamental al tomar decisiones orientadas a mantener o mejorar, en
caso de que sea necesario, aquellos aspectos que se entiende determinan la construcción
de la satisfacción. Resulta necesario, por lo tanto, contar con un mecanismo que mida de
forma objetiva, y sin ambiguedades, este concepto.
Vinculando esta idea con la educación universitaria, en este trabajo se considera a los
estudiantes universitarios de los cursos superiores de la Facultad de Ciencias Económicas
y Administración, Universidad de la República, Uruguay (FCEA) como “clientes” y se
entiende que el “servicio” que se les brinda es el de la educación a nivel terciario.
La información necesaria para poder evaluar y entender por un lado, qué conceptos
se asocian a la satisfacción y por otro, cómo se establecen la interrelaciones entre estos
conceptos, se obtiene a través de la aplicación de un cuestionario que presenta la estructura
del modelo ECSI (European Customer Satisfaction Index); sobre este instrumento y a
partir de la utilización de los Modelos de Ecuaciones Estructurales se logra caracterizar la
construcción de la satisfacción.
146
11.2. Metodologı́a
11.2.1. Modelos de Ecuaciones Estructurales
Este tipo de modelos pueden ser vistos, fundamentalmente, de dos maneras. Por
un lado, pueden ser enmarcados en el ámbito de los modelos de regresión, con ciertas
particularidades que los diferencian de los modelos de regresión clásicos y, por otro, pueden
ser vistos como una técnica de análisis factorial que permite establecer relaciones entre los
factores.
Especificación
Modelo Estructural
El modelo estructural es el submodelo, dentro de los Modelos de Ecuaciones
Estructurales (MES), que captura las relaciones existentes entre las variables no
observables, también denominadas variables latentes, constructos o factores.1
βη = Γξ + ζ ⇒ η = Bη + Γξ + ζ (11.1)
Modelo de Medida
En el modelo de medida se establecen las relaciones que existen entre los factores y
las variables observables. Se presentan, por separado, las relaciones entre las variables
exógenas y las endógenas, lo que determina dos submodelos. La expresión matricial para
el modelo de medida, para las variables exógenas, queda determinado por:
X = Λx ξ + δ (11.2)
1 De aquı́ en adelante, utilizaremos cualquiera de estos términos indistintamente
147
donde, considerando un modelo con k variables latentes y q variables observables, se
tiene:
X vector, de dimensión (q, 1), de variables observables.
Λx (lambda) matriz, de dimensión (q, k), de pesos λ que determinan la relación entre
cada x y cada ξ.
ξ (xi) vector, de dimensión (k, 1), de variables latentes exógenas.
δ (delta) vector, de dimensión (q, 1), de términos de error/perturbación.
La matriz Θδ también forma parte de este submodelo. Ésta es la matriz de covarianzas
entre los errores de las variables exógenas observadas (δ). Los errores δ se suponen
incorrelacionados, por lo que la matriz Θδ resulta una matriz diagonal.
Para las variables endógenas, la expresión matricial resulta análoga.
Identificación y Estimación
Una vez especificado el modelo, y previo a realizar las estimaciones de los parámetros,
es necesario determinar si dichas estimaciones serán únicas, es decir, si el modelo está
identificado.
Para esto, en este trabajo, se utilizará la denominada “regla de conteo”, que establece
que para que el modelo esté identificado es necesario que la cantidad de parámetros a
estimar sea menor que la cantidad de elementos no redundantes de la matriz de varianzas
y covarianzas de las variables involucradas en el modelo (grados de libertad del modelo
positivos) [3].
Una vez confirmado que el modelo está identificado, se procede a la estimación del
modelo que implica obtener una estimación puntual para cada uno de los parámetros
involucrados en los submodelos de medida y estructural. Existen varios métodos de
estimación, entre los que se destacan: Máxima verosimilitud (MV), Mı́nimos cuadrados
generalizados (MCG) y Mı́nimos cuadrados parciales (MCP).
148
a explicar o explicadas tanto en el modelo de medida como en el modelo estructural. Es
para esto que se introduce la idea de score y outer weights que determinan que las variables
latentes son estimadas a través de una combinación lineal de las variables observadas con
las que se vincula, tal como se presenta en las siguientes ecuaciones:
X
ηˆj = wjk Yjk (11.3)
k
X
ξˆl = wlm Xlm (11.4)
m
donde las denominaciones score y outer weights hacen referencia a ηˆj y ξˆl , y w
respectivamente.
Siguiendo lo propuesto por Sanchez [6], una vez definidos todos estos elementos, se puede
decir que el procedimiento de estimar un modelo por mı́nimos cuadrados parciales consiste
fundamentalmente en:
Obtener los pesos que permitan determinar ηˆj y ξˆl .
Estimar todos los elementos de β y Γ.
Obtener los λ del los dos submodelos que determinan el modelo de medida.
El primer paso consiste en determinar los w, lo cual se logra implementando el siguiente
proceso iterativo:
1. Se determinan valores arbitrarios para w, por lo general se inicia con w = 1.
2. Se realiza una aproximación “externa” para las variables latentes.
3. Se obtienen nuevos pesos.
4. Se realiza una aproximación “interna” para las variables latentes.
5. Se calculan nuevos valores para w.
Se repiten los pasos 2 a 5, hasta lograr convergencia.
V
d Lk = V Ok w˜k
.
En el paso siguiente se consideran las relaciones entre las variables latentes (por ejemplo
V Li y V Lj ) y en función de éstas se generan nuevos pesos, por ejemplo, eij . Esta nueva
estimación quedará determinada de la siguiente manera:
∗ X
V
d Lj = eij V
d Li (11.5)
i
donde V Li son todas las variables latentes con las que se relaciona la variable latente
V Lj .
Tal como establece Sanchez [6] existen tres posibles esquemas para determinar los pesos
eij :
149
Centroide: Considera únicamente el sentido de la correlación entre las variables
latentes, es decir: eij = signo(cor(V
d Li , V
d Lj )) si V Li y V Lj se comunican, y 0 en
otro caso.
Factorial: Considera, además del signo, la magnitud de la correlación. En función de
esto, los pesos eij se definen como: eij = cor(V
d Li , V
d Lj ) si V Li y V Lj se comunican,
y 0 en otro caso.
De senderos: Considerar la relación que existe entre las variables latentes,
diferenciando a las variables en dependientes e independientes, según corresponda.
Si la variable V Li causa a la variable V Lj , entonces los pesos eij se corresponderán
con los coeficientes de regresión que se obtienen al regresar V Lj sobre las V Li que
la causan. Si la relación de causalidad es la opuesta, es decir, V Lj causa a V Li , este
esquema coincide con el esquema factorial.
Una vez que se obtienen los pesos eij , se procede a obtener la estimación “interna” de
las variables latentes, que consiste en sustituir los pesos obtenidos, en el paso anterior, en
la ecuación (5).
Por último se calculan los pesos w, considerando que la variable latente V Lj satura en las
variables observadas Xj1 , Xj2 ...Xjk , siguiendo el siguiente criterio:
∗ ∗ ∗
w̃jk = ((V
d Lj 0 )(V
d Lj ))−1 (V
d Lj )0 Xjk
.
Estos pasos se repiten hasta lograr convergencia la cual, por lo general, se determina en
función de la diferencia que existe en el valor de w en el paso S en relación al paso S − 1.
Sanchez propone establecer como criterio de convergencia |wjk S−1 S
− wjk | < 10−5 .
Al finalizar este proceso iterativo, se pasa a las siguientes etapas que consisten en estimar
los β 0 s, γ 0 s y λ0 s que forman parte tanto del modelo estructural, como del de medida.
Las estimaciones de β se obtienen por mı́nimos cuadrados ordinarios (MCO), tal como
se establece a continuación:
0
β̂ji = ((V
d Li )(V
d Li ))−1 (V
d L i )0 (V
d Lj )
λ̂jk = cor(Xjk , V
d Lj )
11.3. Resultados
Previa presentación de los principales resultados obtenidos, se exponen en forma
resumida, los datos utilizados para la aplicación (diseño muestral empleado y cuestionario
utilizado).
150
11.3.1. Diseño Muestral
La aplicación que se presentará en este trabajo fue realizada sobre los datos obtenidos
mediante la aplicación de un cuestionario sobre una muestra probabilı́stica a estudiantes
de los cursos superiores de la FCEA, en el año 2009.
Estrato 1 2 3 4 5 6 Total
# grupos prácticos 21 15 9 9 4 2 60
Con la muestra seleccionada, se realiza el relevamiento de los datos el cual culminó con
647 encuestas realizada, que determina una tasa de cobertura de la muestra de 90 % (647
en 720).
151
H) presentan todos la misma estructura, se plantea una pregunta general que determina
la esencia del bloque y a partir de ella, se establecen una serie de afirmaciones sobre las
cuales el estudiante deberá expresar su posición, utilizando una escala Likert que toma
valores en el intervalo [1 - 10], donde 1 indicará la mayor discrepancia con lo planteado en
la pregunta y 10 el mayor acuerdo.
Por último, para la estimación de los modelos en este trabajo solamente se presentan
en detalle los resultados al estimar por MCP.
152
A partir del valor percibido se construye la satisfacción y el boca a boca.
La satisfacción influye únicamente sobre la lealtad y ésta a su vez, determina el boca
a boca.
Este modelo es estimado por mı́nimos cuadrados parciales. En el cuadro 2 se exponen
las estimaciones puntuales (Original) para cada uno de los β 0 s y γ 0 s presentes en el mo-
delo. Para ser validadas, estas estimaciones serán comparadas contra las obtenidas para
100 muestras bootstrap, reportando la media muestral, el error estándar, y los cuantiles
empı́ricos para cada parámetro.
Variable R2
E 0.38
C 0.69
S 0.67
VP 0.56
L 0.55
BB 0.63
153
A partir del cuadro 3 puede concluirse que calidad (C) es el constructo que mejor
queda explicado por las variables que lo preceden, las que logran explicar un 69 % de la
variabilidad total del constructo. En segundo lugar se encuentra aquella variable que refleja
el grado de satisfacción (S) de los estudiantes, el 67 % de la varianza total de este constructo
queda explicado por las variables expectativas, calidad, valor percibido e imagen (E, C, VP,
I). En el otro extremo, se encuentran las expectativas (E), las cuales se entiende quedan
determinadas por la imagen (I) que tienen los estudiantes sobre la facultad, sin embargo
ésta parece no resultar suficiente, ya que sólo logra captar un 38 % de la variabilidad total.
Además del análisis de los efectos directos que tiene una variable latente sobre otra
u otras, se pueden analizar las relaciones indirectas que se generan dentro del modelo
estructural (ver figura 1).
En lo que refiere, al modelo de medida estimado por mı́nimos cuadrados parciales, éste
puede verse gráfica y numéricamente en la figura 2 y cuadro 4, respectivamente.
154
Figura 2. Modelo de medida - Estimado.
155
V.Obs V.Lat. λ Comunalidad
eexp2 bprep E 0.88 0.77
eexp3 ccdoc E 0.83 0.69
eexp6 ccur E 0.87 0.76
eim1 bpest I 0.88 0.77
eim2 innov I 0.84 0.71
eim4 buprep I 0.87 0.76
ely1 veleg L 0.91 0.83
ely2 pgele L 0.89 0.80
ely4 orgu BB 0.90 0.82
ely5 suge BB 0.93 0.87
epa1 help V 0.85 0.72
epa2 AAA V 0.86 0.75
epa3 pubnv V 0.85 0.73
epa5 empl V 0.83 0.69
eqt1 calgl C 0.87 0.76
eqt2 ccdoc C 0.82 0.67
eqt4 aacad C 0.80 0.63
eqt5 ccur C 0.87 0.75
es1 sat S 0.92 0.86
es2 ajexp S 0.91 0.83
es3 atiend S 0.88 0.78
es6 happy S 0.86 0.73
Al observar las estimaciones obtenidas para cada uno los λ0 s presentes en el submodelo
de medida, lo primero que cabe destacar es que, tal como puede verse en el cuadro 4, los
parámetros estimados resultan todos mayores a 0.7 (valor mı́nimo aceptado para validar
estas estimaciones).
Por otra parte, se debe recordar que este modelo se encuentra en el ámbito del análisis
factorial donde el concepto de comunalidad resulta fundamental. Este concepto refiere a
la proporción de varianza original de cada variable observada, que queda explicada por el
factor que satura sobre ella.
En el cuadro 4 se observa que para el bloque que contiene las variables referentes a las
expectativas (E) que tienen los estudiantes sobre la facultad, se tiene que el factor común
logra explicar más del 69 % de la varianza original de cada una de las 3 variables.
En cuanto a las variables que determinan la imagen (I) que tienen los estudiantes de
la FCEA sobre ésta, puede verse que las comunalidades toman valores entre 0.71 y 0.77.
La variable que mejor queda explicada por el constructo imagen es aquella que refiere a la
visión general que tienen los estudiantes sobre la Universidad, como lugar donde estudiar
(eim1 bpest).
Al considerar las variables que conforman el bloque referente a la evaluación que hacen
los estudiantes sobre la calidad (C) del servicio brindado por la facultad se muestra que
la variable observada que mejor queda explicada por la variable latente calidad es la que
refiere a la calidad global de enseñanza (eqt1 calgl), ya que el 76 % de su varianza original
156
es captada por el constructo. En el otro extremo, se encuentra la afirmación que hace
referencia al ambiente académico (eqt4 aacad), donde el factor logra explicar el 63 % de la
varianza original.
En lo que refiere al bloque de preguntas especı́ficas sobre satisfacción (S), puede verse
que este constructo logra captar una cantidad importante (entre un 73 % y un 86 %) de la
varianza original de las variables observadas que lo conforman.
Por último, puede verse que la varianza de aquellas variables que forman el constructo
boca a boca (BB) resulta captada en gran proporción por este factor, sobre todo para la
variable “Recomendarı́a esta facultad a un amigo” (ely5 suge).
11.4. Conclusiones
En cuanto al objetivo principal de este trabajo, éste apuntaba fundamentalmente
al estudio de la construcción de la satisfacción estudiantil para los cursos de educación
superior de la FCEA, a partir de la modelización de ésta a través de la aplicación de
modelos de ecuaciones estructurales.
En cuanto a las relaciones que sı́ se confirman y que por lo tanto determinan la
construcción de la satisfacción para el caso particular de la FCEA se concluye que:
La imagen que tienen los estudiantes sobre la FCEA, repercute directamente sobre
las expectativas, la percepción de la calidad del servicio educativo que reciben y el
valor percibido sobre éste.
La percepción de la calidad del servicio recibido queda determinado directamente
por las expectativas.
La satisfacción queda determinada directamente en función de la percepción de la
calidad del servicio educativo y por el valor percibido sobre éste.
El grado de satisfacción repercute directamente sobre la lealtad de los estudiantes
con la FCEA.
157
Referencias
2. Fox, J.; Nie, Z., Byrnes, J., sem: Structural Equation Models, R package versión
3.1-1, 2013.
3. Kline, R., Principles and Practice of Structural Equation Modeling, The Guilford
Press, 2011.
6. Sanchez, G., PLS Path Modeling with R. Trowchez Editions. Berkeley. http :
//www.gastonsanchez.com/P LSP athM odelingwithR.pdf , 2013.
Bloque Pregunta
Bloque 1 Datos del estudiante
1 Área de estudio
2 Edad
3.1 Año de ingreso a facultad
3.2 Año en curso
4 Cantidad de materias en curso
5 Cantidad de materias en que se inscribió en 2009
6 Abandonó en algún momento la carrera?
7 Sexo
8 Trabaja actualmente?
Bloque A Intente recordar el momento en que decidió ingresar a esta Facultad y en base a las informaciones
que tenı́a a esa altura, clasifique sus expectativas acerca de esta Facultad, respecto a:
Responda en la escala 1: Muy reducidas a 10: Muy elevadas
1 La calidad global de enseñanza (eexp1 calgl).
2 La capacidad de esta Facultad para darle una buena preparación para la carrera (eexp2 bprep).
3 La capacidad y el conocimiento de los docentes (eexp3 ccdoc).
4 El respeto e interés por los problemas de los estudiantes (eexp4 riest).
5 El ambiente académico (eexp5 aacad).
6 El contenido del curso (eexp6 ccur).
7 El relacionamiento con los docentes (eexp7 reldc).
8 La infraestrutura de la Facultad (eexp8 inffac).
9 La organización y funcionamiento de la Facultad (eexp9 offac).
10 La probabilidad de que la Universidad se encuadre en sus necesidades personales (eexp10 necpers).
11 La probabilidad de que las cosas pudieran ser diferentes de lo esperado (eexp11 dife).
12 La comparación con otras Facultades (eexp12 otfac).
158
Bloque Pregunta
Bloque B Clasifique la imagen que tiene de esta Facultad, expresando su grado de acuerdo o desacuerdo
con las siguientes afirmaciones
Responda en la escala 1: Totalmente en desacuerdo a 10: Totalmente de acuerdo
1 En general pienso que esta es una buena Universidad para estudiar (eim1 bpest).
2 Es una Facultad innovadora y con visión al futuro (eim2 innov).
3 Es una Facultad con buena reputación académica (eim3 burep).
4 Es una Facultad que da una buena preparación a sus estudiantes (eim4 buprep).
5 Es una Facultad muy comprometida con la comunidad (eim5 comp).
6 Es una Facultad que los empleadores valoran (eim6 empval).
Bloque C Clasifique la calidad del servicio prestado por esta Facultad respecto a:
Responda en la escala 1: Muy mala a 10: Muy buena
1 La calidad global de enseñanza (eqt1 calgl).
2 El nivel de conocimiento de los docentes (eqt2 ccdoc).
3 El respeto e interés por los problemas de los estudiantes (eqt3 riest).
4 El ambiente académico (eqt4 aacad).
5 El contenido del curso (eqt5 ccur).
6 El relacionamiento con los docentes (eqt6 reldc).
7 La infraestrutura y capacidad locativa de la Facultad (eqt7 inffac).
8 La organización y funcionamiento (eqt8 offac).
9 La comparación con otras Facultades (eqt9 otfac).
Bloque D Clasifique la calidad del servicio prestado por esta Facultad respecto a:
Responda en la escala 1: Muy mala a 10: Muy buena
1 Biblioteca (eqf1 bibl).
2 Bedelia (eqf2 bede).
3 Cursos Prácticos (eqf3 curpra)
4 Oficina de apuntes y fotocopiadora (eqf4 ofap).
5 Informes (eqf5 infor).
6 Cantina y Café (eqf6 ccafe).
7 PIL (Programa de Inserción Laboral) (eqf7 pil).
8 Sistema de Becas (eqf8 beca).
9 Mantenimiento e higiene de la infraestrutura (eqf9 higie).
159
Bloque Pregunta
Bloque 1 Datos del estudiante
1 Área de estudio
2 Edad
3.1 Año de ingreso a facultad
3.2 Año en curso
4 Cantidad de materias en curso
5 Cantidad de materias en que se inscribió en 2009
6 Abandonó en algún momento la carrera?
7 Sexo
8 Trabaja actualmente?
Bloque A Intente recordar el momento en que decidió ingresar a esta Facultad y en base a las informaciones
que tenı́a a esa altura, clasifique sus expectativas acerca de esta Facultad, respecto a:
Responda en la escala 1: Muy reducidas a 10: Muy elevadas
1 La calidad global de enseñanza (eexp1 calgl).
2 La capacidad de esta Facultad para darle una buena preparación para la carrera (eexp2 bprep).
3 La capacidad y el conocimiento de los docentes (eexp3 ccdoc).
4 El respeto e interés por los problemas de los estudiantes (eexp4 riest).
5 El ambiente académico (eexp5 aacad).
6 El contenido del curso (eexp6 ccur).
7 El relacionamiento con los docentes (eexp7 reldc).
8 La infraestrutura de la Facultad (eexp8 inffac).
9 La organización y funcionamiento de la Facultad (eexp9 offac).
10 La probabilidad de que la Universidad se encuadre en sus necesidades personales (eexp10 necpers).
11 La probabilidad de que las cosas pudieran ser diferentes de lo esperado (eexp11 dife).
12 La comparación con otras Facultades (eexp12 otfac).
Bloque Pregunta
Bloque B Clasifique la imagen que tiene de esta Facultad, expresando su grado de acuerdo o desacuerdo
con las siguientes afirmaciones
Responda en la escala 1: Totalmente en desacuerdo a 10: Totalmente de acuerdo
1 En general pienso que esta es una buena Universidad para estudiar (eim1 bpest).
2 Es una Facultad innovadora y con visión al futuro (eim2 innov).
3 Es una Facultad con buena reputación académica (eim3 burep).
4 Es una Facultad que da una buena preparación a sus estudiantes (eim4 buprep).
5 Es una Facultad muy comprometida con la comunidad (eim5 comp).
6 Es una Facultad que los empleadores valoran (eim6 empval).
Bloque C Clasifique la calidad del servicio prestado por esta Facultad respecto a:
Responda en la escala 1: Muy mala a 10: Muy buena
1 La calidad global de enseñanza (eqt1 calgl).
2 El nivel de conocimiento de los docentes (eqt2 ccdoc).
3 El respeto e interés por los problemas de los estudiantes (eqt3 riest).
4 El ambiente académico (eqt4 aacad).
5 El contenido del curso (eqt5 ccur).
6 El relacionamiento con los docentes (eqt6 reldc).
7 La infraestrutura y capacidad locativa de la Facultad (eqt7 inffac).
8 La organización y funcionamiento (eqt8 offac).
9 La comparación con otras Facultades (eqt9 otfac).
Bloque D Clasifique la calidad del servicio prestado por esta Facultad respecto a:
Responda en la escala 1: Muy mala a 10: Muy buena
1 Biblioteca (eqf1 bibl).
2 Bedelia (eqf2 bede).
3 Cursos Prácticos (eqf3 curpra)
4 Oficina de apuntes y fotocopiadora (eqf4 ofap).
5 Informes (eqf5 infor).
6 Cantina y Café (eqf6 ccafe).
7 PIL (Programa de Inserción Laboral) (eqf7 pil).
8 Sistema de Becas (eqf8 beca).
9 Mantenimiento e higiene de la infraestrutura (eqf9 higie).
160
161
162
Modelación con Estadı́stica y Probabilidad
ISBN: 978-607-525-442-5
CAPÍTULO 12
163
type is used if Bernoulli and Multinomial are used respectively. In the paper the study
distributions are applied to the estimation of the proportion of successes of each possible
candidate to win the presidency of Mexico in 2018. Finally we approach the study of the
predictive distribution to the two types of a priori functions that are presented in the work.
12.1. Introducción
En la literatura se pueden encontrar diversos trabajos que hablan acerca de la
estadı́stica bayesiana,(ver [1] y [5]). También ha sido aplicada a problemas sociales y
polı́ticos como se pueden consultar en [6] y [10]. El objetivo de este trabajo es estudiar
el enfoque bayesiano y mostrar algunos métodos para calcular proporciones de votantes y
éxito de candidatos a ganar la próxima elección presidencial del 2018.
El nombre bayesiana proviene del uso frecuente que se hace del teorema de Bayes,
este teorema se deriva de un trabajo realizado por el matemático Thomas Bayes, donde
introduce el concepto de probabilidad inversa y además permitió entender cómo las
personas cambian su juicio sobre la ocurrencia de algún evento debido a información
adicional. Pero fue Pierre-Simon Laplace quien aplica el Teorema de Bayes de manera
sistemática al análisis de datos, esto a finales del siglo XVIII (ver [4]).
P (B|Ai )P (Ai )
P (Ai |B) = ,
P (B)
donde
1. P (Ai ) son las probabilidades a priori,
2. P (B|Ai ) es la probabilidad de B dado Ai ,
3. P (Ai |B) son las probabilidades a posteriori.
Dada una nueva evidencia, el teorema de Bayes ajusta las probabilidades de la siguiente
manera:
P (E|H0 )P (H0 )
P (H0 |E) = ,
P (E)
donde
1. H0 representa una hipótesis, llamada hipótesis nula, que ha sido inferida antes de
que la nueva evidencia, E, resultara disponible.
164
2. P(H0 ) se llama probabilidad a priori de H0 .
3. P (E|H0 ) se llama la probabilidad condicional de que se cumpla la evidencia E si la
hipótesis H0 es verdadera. Se llama también la función de verosimilitud cuando se
expresa como una función de E dado H0 .
4. P (E) se llama la probabilidad marginal de E.
5. P (H0 |E) se llama probabilidad a posteriori de H0 dado E.
La diferencia con la inferencia clásica es que esta toma a los parámetros fijos y en la
Bayesiana suponemos que los parámetros son variables aleatorias con una distibución de
probabilidad.
Se supone que se tiene una base de datos sobre el parámetro que se desea estimar,
luego la densidad marginal de los datos es un número ya conocido, de esta forma puede
ser tomado como una constante fija. Ası́ se deduce que la distribución a posteriori es
proporcional al producto de la función de verosimilitud por la función a priori como se
observa en la siguiente ecuación:
En resumen los pasos para realizar una estimación bayesiana son los siguientes:
Establecer un modelo probabilı́stico completo: una distribución de probabilidad
conjunta para todas las cantidades del problema, observables y no observables.
• Función de verosimilitud: f (datos|θ).
• Distribución a priori: f (θ).
Condicionar los datos: obtener la distribución a posteriori, es decir, la distribución
condicionda a los parámetros del modelo, dados los datos.
165
• Teorema de Bayes: f (θ|datos) ∝ f (datos|θ)f (θ).
En este trabajo se utiliza una distribución a priori informativa con estudios empı́ricos
previos.
Γ(α + β) α−1
f (p) = p (1 − p)β−1 ,
Γ(α)Γ(β)
α
donde 0 ≤ p ≤ 1 y α, β positivas, con esperanza α+β
.
Sea una muestra aleatoria X = (X1 , · · · , Xn ) que tienen una distribución Bernoulli(p).
Ası́ la función de verosimilitud es la siguiente:
n n
!
X X
Por lo tanto f (p|X) ∼ beta xk + α, n − xk + β . En conclusión la distribución
k=1 k=1
a posteriori es de la misma familia parámetrica que la a priori. Cuando lo anterior ocurre
decimos que las distribuciones Bernoulli y beta son conjugadas.
Veamos que sucede con nuestras funciones a priori y posteriori para distintos valores
de α y β.
Como se puede observar en las gráficas Figura 1, Figura 2 y Figura 3 para valores grandes
de α y β la función a priori y posteriori son muy semejantes, lo que confirma que ambas
pertenecen a la misma familia.
166
Figura 1: Gráfica de f (p), f (X|p), f (p|X), donde f (p) tiene parámetros α = 5 y
β = 2.
12.3.1. Ejemplo 1
Pensemos en la población que consiste de todas las personas en México que pueden
votar en la próxima elección presidencial del 2018, sea p que representa la proporción de esa
población que va ejercer su voto. La creencia de una persona acerca de la incertidumbre en
esta proporción se representa por una distribución de probabilidad sobre el parámetro. Esta
distribución refleja la opinión subjetiva previa de la persona sobre los valores plausibles de
p.
Según información que publicó el Instituto Nacional Electoral (INE), solo el 65.44 %
de las personas que podı́an votar en el año 2012 asistieron a las urnas. Basándose en esta
información se cree que la proporción p debe tener un valor mayor que 0.5, o siendo más
especı́ficos decimos que el valor de p pertenece al intervalo de 0.5 a 1.
Para obtener la verosimilitud, se considera que si una persona vota el resultado será
X = 1 y X = 0 de lo contrario. De esta manera podemos considerar a X del tipo Bernoulli.
Si consideramos una sola observación tenemos que la función de verosimilitud es la función
de densidad de una distribución Bernoulli con parámetro p.
167
Figura 3: Gráfica de f (p), f (X|p), f (p|X), donde f (p) tiene parámetros α = 503 y
β = 291.
Por lo tanto la función a posteriori para la proporción p es del tipo Beta con nuevos
parámetros β0 = 50, 323, 154 y α0 = 2, 913, 648.
k Qk
1 Y αj −1 Γ(αi )
P (Θ) = θ , donde B(α) = i=1
B(α) j=1 j Γ( ki=1 αi )
P
(12.2)
k
Γ( ki=1 αi ) Y αj −1
P
= Qk θj .
i=1 Γ(αi ) j=1
Pk
donde xi ∈ {0, . . . , n} y i=1 xi = n.
168
Utilizando las ecuaciones (12.1), (12.2) y (12.3) se tiene que la función a posteriori es
12.4.1. Ejemplo 2
De acuerdo a una encuesta nacional en vivienda de El Financiero (Ver [9]) que se
realizó del 19 al 25 de enero del 2017 en todas las entidades federativas, a 1008 personas,
se obtuvieron los resultados siguientes.
Porcentaje
Candidato Mar 16 Jun Sep Nov Feb 17
A. M. L. O. 28 31 29 29 33
Margarita Z. 24 26 28 29 27
M. A. O. C. 24 26 27 26 20
M. Ángel M. 14 10 10 9 10
El Bronco 9 7 7 7 10
Según el periódico La Jornada (Ver [2]), Jueves 23 de Marzo de 2017 p.6, Andrés Manuel
López Obrador se coloca a la cabeza en todos los escenarios. Se realizó una encuesta, con
fecha de 3 de marzo del 2017, a 5275 personas de todo el paı́s. Los resultados son los
siguientes:
Marzo 2017
Candidato Porcentaje
Andrés Manuel López Obrador 32.694
Margarita Zavala 27.974
Miguel Ángel Osorio Chong 19.214
Miguel Ángel Mancera 12.264
Jaime Rodrı́guez, El Bronco 7.854
169
acuerdo a las encuestas presentadas anteriormente. Considerando que las proporciones
no son fijas y se comportan de manera aleatoria, esto debido a distitos factores como
pueden ser: qué partido ocupa la presidencia actualmente, campañas polı́ticas, puestos
que han ocupado los candidatos durante su carrera polı́tica, entre otras.
Mientras que para nuestra verosimilitud usaremos los datos de la segunda tabla y
(12.2), ası́ n = 5275, x1 = 1725, x2 = 1476, x3 = 1013, x4 = 647 y x5 = 414.
k
n! Y x
P (X|Θ) = Qk θj j
j=1 xj1 ! j=1
= 1725!1476!1013!647!414!
5275! 1725 1476 1013 647 414
θ1 θ2 θ3 θ4 θ5
170
Si XF ut representa los nuevos datos observados y X los datos observados anteriormente,
entonces se define la distribución preditiva de XF ut dado X mediante la siguiente ecuación
Z
P (XF ut |X) = P (XF ut |θ, X)P (θ|X, α)dθ, (12.5)
Θ
que es el valor esperado del modelo especificado ponderando los posibles valores del
parámetro por su densidad a posteriori.
Por lo tanto,
α+ n
P
k=1 xk
P (XF ut = 1) = ,
β+n− n
P
k=1 xk
y
α+ n
P
k=1 xk
P (XF ut = 0) = 1 − .
β+n− n
P
k=1 xk
P (XF ut = 1) = 0.945270022.
P (XF ut = 0) = 0.054759978.
Utilizando una muestra de una persona que respondió que sı́ votarı́a, entonces si se
vuelve a realizar la misma pregunta se tiene una mayor probabilidad de obtener una
respuesta positiva. Lamentablemente aún no tenemos encuestas sobre si las personas
ejerceran su voto en el 2018.
171
Es decir, se calcula marginando la distribución de XF ut dado Θ sobre la distribución
posterior de Θ dado X.
Hay que recordar que la función de densidad de probabilidad sobre las variables θ al
integrarse sobre todos los valores posibles de θ da como resultado el valor 1, esto es:
Z P
Γ( t αt ) Y αt −1
Q θt dθ = 1.
t Γ(αt ) t
12.6. Conclusiones
En este trabajo mostramos el enfoque bayesiano donde a diferencia de la estadı́stica
clásica el parámetro a estimar se toma variable, más aún, se dice que tiene alguna
distribución de probabilidad. Mediante el uso de este enfoque vemos la necesidad de utilizar
distribuciones las cuales se le llaman posteriori, a priori y versomilitud. La primera resulta
importante ya que se puede realizar predecciones para muestras aleatorias posteriores.
Aunque en el enfoque bayesiano se puede pensar que si tenemos dos opiniones iniciales
diferentes posiblemente se obtendrán conclusiones que difieren, sin embargo, en un sentido
estricto esto puede ser cierto, mediante la acumulación de datos estas conclusiones deben
coincidir mediante la distribución predictiva.
172
En base a esto, utilizando la distribución predictiva se puede decir algo sobre el posible
ganador de las elecciones 2018 como tambı́en la proporción de personas que ejerceran su
voto. Otro punto importante, es que se usó información adicional o previa que sirvió para
nuestros parámetros, se asignaron probabilidades subjetivas y se consideró el valor del
parámetro aleatorio.
Referencias
1. Bernardo M., Bayesian Statistics. Departamento de Estadı́stica de la Facultad de
Matemáticas, Valencia Spain, 2002.
2. Cano A., Humillante derrota del PRI en 2018: encuesta de Presidencia.
La Jornada. Jueves 23 de marzo de 2017, p.6. Recuperado desde: http :
//www.jornada.unam.mx/2017/03/23/politica/006n1pol
3. Eulacio N.R., La familia de distribuciones de Pólya truncada. Tesis de Maestrı́a.
Instituto de Enseñanza e Investigaciones de Ciencias Agrı́colas. México: Chapingo.
4. Gutiérrez E., El
desarrollo de la estadı́stica bayesiana. Revista Digital Universitaria, Vol. 14 No. 11,
2013. Recuperado desde: http : //www.revista.unam.mx/vol.14/num11/art42/
5. Jim Albert, Bayesian Computation with R. Springer Second Edition, USA, 2001.
6. Lawrence J., Theresa W., Lois C., Bayesian Estimatin of Disease Prevalence and the
Parameters of Diagnstic Test in the Absence of a Gold Standard. American Journal
of Epidemiology, Vol. 141 No.3, 1995.
7. Mendoza R. Manuel, Regueiro M. Pedro, Estadı́stica Bayesiana. Departamento de
Estadı́stica, Instituto Tecnológico Autónomo de México, 2011.
8. Michael H., Leonard H., Bayesian Estimation of the Size of a Population.
Department of Statistics Biostatistics Unit, University Zurizh and University of
Munich, Sonderforschungsbereich 386, Paper 499, 2006.
9. Moreno A., Toma AMLO ventaja. El Financiero. 2017. Recuperado desde: http :
//graf icos.elf inanciero.com.mx/2017/encuestas/enc − 01f ebrero17/index.html
10. Scott M. Lynch, Introduction to Applied Bayesian Statistics and Estimation for
Social Scientists. Springer, New York, 1995.
173
174
Modelación con Estadı́stica y Probabilidad
ISBN: 978-607-525-442-5
CAPÍTULO 13
Estefania Meza Saldaña , Hortensia Reyes Cervantes, Blanca Pérez Salvador, Francisco Tajonar Sanabria
Facultad de Ciencias Fı́sico Matemáticas,
Benemérita Universidad Autónoma de Puebla,
18 sur y Av. San Claudio, Col. San Manuel, Ciudad Universitaria
Puebla, Puebla C.P. 72570, México
Departamento de Matemáticas, Iztapalapa,
Universidad Autónoma Metropolitana, México
Prolon. Canal de Miramontes 3855, Ex-Hacienda de San Juan de Dios
C.P. 14387, Deleg. Tlalpan Cdad. de México
e-mail fany [email protected], [email protected],
[email protected], [email protected]
Palabras clave: Regresión logı́stica, Credit Scoring, Base de datos financieros alemana.
175
13.1. Introducción
En finanzas, riesgo está relacionado con la posibilidad de que suceda un evento que
se convierta en pérdidas para los participantes involucrados. Existen diferentes tipos de
riesgo en los mercados financieros, entre ellos se encuentran, el riesgo de mercado, riesgo
de operación, riesgo de contraparte y riesgo de crédito, este último es el que se maneja
en este trabajo, definiéndolo como caso particular del riesgo de contraparte, cuando el
contrato es uno de crédito, y el deudor no puede pagar su deuda por diferentes factores
[3]. En la actualidad, los avances tecnológicos han permitido un desarrollo importante en
la automatización de la decisión sobre la aceptación o rechazo de una solicitud de crédito
a través de modelos analı́ticos, evitando el otorgamiento bajo criterios ambiguos, estos
modelos requieren de información cuantitativa potencialmente útil para su construcción.
La oportunidad de obtener esta información es cada vez más simple, gracias al importante
aumento de la capacidad de almacenaje y la disponibilidad de mejores herramientas
para el manejo de datos, el proceso de extracción de información relevante a partir de
datos disponibles sigue siendo complejo y costoso. La modelación de la falla financiera,
tanto en personas como en empresas, ha sido un problema altamente estudiado en la
literatura. Se han desarrollado modelos matemáticos y estadı́sticos que buscan predecir el
desempeño que tendrı́a una persona si se le otorgase un crédito mediante la asignación de
un puntaje estimado a partir de la información del cliente. La utilización de modelos de
Credit Scoring para la evaluación del riesgo de crédito sirven para estimar probabilidades
de incumplimiento y ordenar a los deudores y solicitantes de financiamiento en función de
su riesgo de incumplimiento. En las últimas cuatro décadas [2], se han desarrollo mejores
recursos estadı́sticos y computacionales para tener más rapidez y eficiencia en la generación
de préstamos, y una mejor evaluación del riesgo de su cartera de clientes que cada vez es
mayor. Los métodos estadı́sticos más comunes para el desarrollo de Credit Scorings se
encuentran: Análisis discriminante, Modelo de probabilidad lineal, Modelo Logit, Modelos
de Programación lineal, Redes Neuronales, Árboles de decisión, entre otros [7],[11],[14] y
[15]. Los modelos posibles a usar en el trabajo deben de tener una variable de respuesta
binaria, y pueden ser: el modelo de probabilidad lineal, el modelo probit y el modelo
logı́stico.
La Regresión Logı́stica se basa en la función logı́stica, que expresa una relación entre dos
o más variables de forma que a cada elemento de x del conjunto independiente X, le
corresponde un único elemento π(x) y está representada por:
1 ex
π(x) = −x
= . (13.1)
1+e 1 + ex
176
13.2. Estimación
Considerando la ecuación
exp(β0 + β1 x)
π(xi ) = (13.2)
1 + exp(β0 + β1 x)
n
Y
l(β0 , β1 ) = f1 (y1 ) × f2 (y2 ) × · · · × fn (yn ) = π(xi )yi (1 − π(xi ))1−yi
i=1
n yi 1−yi
Y eβ0 +β1 x1 eβ0 +β1 x1
= 1− . (13.4)
i=1
1 + eβ0 +β1 x1 1 + eβ0 +β1 x1
Para encontrar el valor del vector β que maximiza L(β), se deriva L(β) con respecto a β0
y β1 , se igualan las derivadas a 0. Obteniendo las ecuaciones:
n
X n
X
[yi − π(xi )] = 0 y [yi − π(xi )]xi = 0. (13.6)
i=1 i=1
Estas expresiones no son lineales en los parámetros β0 y β1 , por lo que se requieren métodos
especiales para su solución [5], utilizando en la actualidad rutinas de programación o
paquetes estadı́sticos, por lo que en este trabajo se utiliza el paquete estadı́stico SPSS
versión 22 [13] para la obtención de los resultados, los valores obtenidos con la solución de
las ecuaciones anteriores, se llaman de máxima verosimilitud y son denotados por β̂.
177
significativas.
La valoración se desarrolla mediante el contraste del siguiente juego de hipótesis:
Existen varios criterios que se pueden aplicar para evaluar los modelos de regresión
de subconjuntos. En general, se desea seleccionar los regresores de tal modo que el error
cuadrático medio de la predicción se reduzca al mı́nimo, esto suele implicar que se deben
eliminar del modelo los regresores con efectos pequeños.
n
X p̂ 1 − p̂
D = −2 yi ln + (1 − yi ) ln . (13.7)
i=1
yi 1 − yi
178
Las hipótesis a contrastar son:
exp(β0 +β1 x)
H0 : π̂j = ∀j = 1, . . . , J.
1 + exp(β0 +β1 x)
vs.
exp(β0 +β1 x)
H1 : π̂j 6= para algún j.
1 + exp(β0 +β1 x)
Se define como:
g
X (Ok − n0k π̄k )2
Ĉ = . (13.8)
n0k π̄k (1 − π̄k )
k=1
Donde:
g es el número de grupos,
n0k es el número total de observaciones en el k-ésimo grupo,
Ok es la suma de las Y en el k-ésimo grupo y
π̄k es el promedio de las πk en el k-ésimo grupo.
eĝ(xj )
ŷj = mj π̂j = mj . (13.9)
1 + eĝ(xj )
1. Residuales de Pearson: Definidos como:
yj − mj π̂j
rj = r(yj , π̂j ) = p . (13.10)
mj π̂j (1 − π̂j )
179
La exactitud de una prueba puede definirse en función de su sensibilidad y especificidad
diagnósticadas. Se selecciona un punto de corte o valor lı́mite adecuado que permita resumir
los resultados en dos grupos. La sensibilidad de una prueba, es la probabilidad de obtener
un resultado positivo. Y la especificidad de una prueba indica la probabilidad de obtener
un resultado negativo.
1. Clasificación.
Realidad y0
1 0
1 VP FP
Modelo ye
0 FN VN
Donde:
VP=Valores Verdaderos Positivos. FP=Falsos Positivos.
FN=Falsos Negativos. VN=Verdaderos Negativos.
VP VN
Sensibilidad = V P +F N
. • Especificidad = V N +F P
.
Área bajo la curva ROC (Receiver Operating Characteristic) es construida
para todos los posibles puntos de corte de π para la clasificación de los
individuos. La curva ROC es un gráfico en el que se observan todos los pares
sensibilidad/especificidad resultantes de la variación continua de los puntos de
corte en todo el rango de resultados observados. En el eje y de coordenadas
se sitúa la sensibilidad o fracción de verdaderos positivos, en el eje x se sitúa
la fracción de falsos positivos o (1-especificidad). El área bajo la curva está
dentro de un rango de 0 a 1, otorga una medida de la capacidad del modelo
para discriminar entre los sujetos que experimentan el resultado de interés
contra los que no lo hacen.
180
13.5. Credit Score
El Scoring es un método que ha venido evolucionando a lo largo de los años y el interés
en su aplicación se basa en calificar a individuos de cualquier población con información
propia de cada entidad, posibilitando la aplicación en cualquier mercado. Esta es una
técnica de la minerı́a de datos donde el objetivo es hallar patrones y relaciones con el
fin de clasificar; siendo este caso una evaluación crediticia para diferenciar entre clientes
cumplidos o incumplidos en cuanto a sus obligaciones de pago. Los Credit Scoring son
sistemas que ayudan a determinar si se otorga un crédito o no a nuevos solicitantes dentro
de una empresa financiera, de acuerdo a Hand and Henley, son procedimientos estadı́sticos
que se utilizan para clasificar a las personas que gestionan y solicitan un crédito, incluyendo
a las que ya son clientes de la institución crediticia en cuestión, en los tipos de riesgo
“Bueno” y “Malo”. Scoring se refiere al empleo del conocimiento sobre el desempeño
y caracterı́sticas de pagos en el pasado para poder ası́ pronosticar el cumplimiento de
préstamos en el futuro.
181
En general el scoring estadı́stico corrobora la orientación general del juicio subjetivo, por
ejemplo, los atrasos en préstamos pasados indican un riesgo mayor de futuros atrasos.
182
Caracterı́sticas de los prestatarios, préstamos y prestamistas. La capacidad
de pronóstico aumenta con el número de caracterı́sticas disponibles. Sin duda, existen
rendimientos decrecientes entre mayor sea la cantidad de información, y aún más, el costo
marginal de recopilar caracterı́sticas adicionales puede ser muy alto.
1. Duración de crédito:
Esta variable se refiere a los meses que hasta el momento de la conformación
de la base ha estado activo el crédito. Es de caracter cuantitativo.
2. Monto de crédito:
Variable numérica que expresa el monto total del crédito otorgado.
3. Tasa de crédito:
Variable numérica que expresa la tasa del cŕedito.
183
4. Balance de cuenta:
Variable categórica que expresa el estado de la cuenta corriente de cada cliente,
tiene cuatro categorı́as, donde DM significa millones de dólares:
1 = Menor a cero DM. • 2 = Entre 0 y 200 DM.
3 = Mayor o igual a 200 DM. • 4 = No exista cuenta.
5. Historia Crediticia: Cuenta con 5 categorı́as en donde se muestra si el cliente
ha tenido otros créditos.
0 = No tiene créditos tomados/Todos los créditos pagados debidamente.
1 = Todos los créditos de este banco pagados debidamente.
2 = Créditos existentes debidamente pagados hasta ahora.
3 = Retraso en el pago en el pasado.
4 = Cuenta crı́tica/Otros créditos existentes (No en este banco)
6. Propósito: Tiene 11 categorı́as en las cuales se clasificó el propósito por el cual
el cliente solicitó un crédito.
0 = Carro (Nuevo). • 6 = Educación.
1 = Carro (Usado). • 7 = Vacaciones.
2 = Muebles/Equipo. • 8 = Capacitación.
3 = Radio/Televisión. • 9 = Negocios.
4 = Aparatos domésticos. • 10 = Otros.
5 = Reparaciones.
7. Cuenta de ahorros: Cuenta con 5 categorı́as:
1 = Menor a 100 DM. • 3 = Entre 500 y 1000 DM.
2 = Entre 100 y 500 DM. • 4 = Mayor a 1000 DM.
5 = Monto Desconocido /No tiene cuenta de ahorro.
8. Duración en el trabajo:
1 = Desempleado. • 3 = Entre 1 y 4 años.
2 = Menos de 1 año. • 4 = Entre 4 y 7 años.
5 = Mayor o igual a 7 años.
9. Género -EdoCivil:
1 = Hombre: Divorciado/Separado. • 3 = Hombre: Soltero.
2 = Mujer: Divorciada/Separada/Casada. • 5 = Mujer: Soltera.
4 = Hombre: Casado/ Viudo.
10. Otros planes de pago: Tipo de crédito simultáneo.
1 = Bancario. • 3 = Ninguno.
2 = Tiendas departamentales.
184
Escalón Chi-cuadrado gl Sig.
1 2.772 8 .948
2 4.046 8 .853
3 5.75 8 .675
185
Escalón −2 Logverosi− R2 R2
militud de Cox Nagelkerke
1 641.44 .263 .373
2 642.17 .262 .372
3 648.95 .255 .362
13.8.3. Clasificación
La tabla de clasificación indica paso a paso la clasificación de clientes cumplidos
(Buenos) e incumplidos (Malos).
186
Figura 1: Gráfica de curva ROC.
de malos y otro elegido al azar del grupo de buenos, el préstamo malo presentará
un riesgo mayor al bueno el 81.7 % de las veces.
13.8.5. Interpretación
Por último, ya es posible realizar el cálculo de la probabilidad de incumplimiento
a través de la ecuación de Regresión Logı́stica y los valores estimados de sus
coeficientes junto con los valores de OR:
187
Monto Crédito 0.000 1 0.000
Tasa Crédito 0.371 1.45 0.371
Propósito
Propósito(1) 2.002 7.40 2.002
Propósito(2) 0.209 1.23 0.209
Propósito(3) 0.953 2.59 0.953
Propósito(4) 1.024 2.78 1.024
Propósito(5) 2.055 7.81 2.055
Propósito(6) 0.774 2.17 0.774
Propósito(7) 1.721 5.59 1.721
Propósito(8) -0.05 0.95 -0.05
Propósito(9) 1.141 3.13 1.141
Cuenta Ahorros
Cuenta Ahorros(1) 1.012 2.75 1.012
Cuenta Ahorros(2) 0.458 1.58 0.458
Cuenta Ahorros(3) 0.832 2.30 0.832
Cuenta Ahorros(4) -0.503 0.60 -0.503
Género EdoCivil
Género EdoCivil(1) 0.548 1.73 0.548
Género EdoCivil(2) 0.278 1.32 0.278
Género EdoCivil(3) -0.438 0.65 -0.438
Duración Crédito Meses 0.032 1.03 0.032
Constante -6.608 0.00135 -6.608
Con el Cuadro 13.4 se puede indicar que la Variable Propósito (Variable que se
evalúa con variables dummies para indicar el propósito por el cual fue la solicitud
del préstamo de cada cliente) es aquella que tiene más poder al momento de la
evaluación, sobre todo al tratarse de clientes cuyo propósito son ‘Reparaciones’,
el cual tiene un aumento de 7.81 veces en la probabilidad de incumplimiento. A
esta variable le sigue en términos de relevancia la variable Historia Crediticia en la
categorı́a ‘Créditos existentes debidamente pagados hasta ahora’, que aumenta la
probabilidad de incumplimiento 5.24 veces.
13.8.6. Validación
El scoring estadı́stico tiene la capacidad de ser probado antes de usarse. Este
procedimiento expone como funciona el scoring si se aplicara en el presente. La
validación se realiza con una muestra no utilizada para construir el modelo. Para
validar el modelo se usó una muestra denominada Muestra de validación que se
extrajo de la muestra original, siendo el 30 % del total de datos, la muestra es
aleatoria y se asegura que el 30 % de los datos contiene una proporción similar de
buenos y malos como la muestra del 70 %. Cuando se estimaron los coeficientes
se aplica el modelo a esta muestra con el mismo punto de corte. Los resultados
revelaron una sensibilidad del 92.86 % y una especificidad del 42.22 %, con una
clasificación total correcta del 77.7 %
188
13.9. Conclusiones
En la actualidad es importante contar con un basto conocimiento de los riesgos
y las diferentes metodologı́as que existen para su medición, teniendo como fin la
mejora en la operación crediticia. Este análisis se realiza usando el Modelo de
Regresión Logı́stica de credit scoring, la manera en que se plantea y realiza el
modelo, tomando en cuenta sus ventajas al no requerir el supuesto de normalidad
y por calcular directamente las probabilidades de incumplimiento. Se usa una base
de datos alemana que consta de 1000 observaciones de clientes, con 20 variables.
Se encontró que únicamente 10 eran las más significativas mediante el criterio de
selección Backward, las variables resultaron: Balance de cuenta, Historia crediticia,
Monto de crédito, Tasa de crédito, Propósito, Cuenta de ahorros, Género-Estado
Civil y Duración del crédito. El criterio de Hosmer-Lemeshov presenta un p-valor de
0.675, concluyendo un buen ajuste. No obstante se obtuvo un bajo poder predictivo,
evaluado por una R2 igual a 0.362. El área bajo la curva fue de 0.817, y por
regla general del poder discriminatorio. El punto de corte fue buscando tener una
clasificación correcta de clientes malos mayor al 90 %. La sensibilidad declara que
de los 210 préstamos malos en la muestra, el modelo detectó el 92.86 % de ellos.
El modelo de credit scoring depende únicamente de los datos con los que cuenta
la entidad en cuestión, las variables que se incluyen en el modelo son propias para
la institución por lo que no serán las mismas por completo si se aplica a otra
institución.
Referencias
1. Agresti A., Categorical Data Analysis, John Wiley Sons, Inc, 1990.
2. Altman, E. I., Saunders A., Credit Risk Measurement: Developments over the
Last 20 Years, Journal of Banking and Finance, 1998.
5. Hosmer D. & Lemeshow S., Applied Logistic Regression, John Wiley & Sons,
2000.
189
9. Quirós G., Mercados financieros alemanes, Banco de España,
https : //www.bde.es/f /webbde/SES/Secciones/P ublicaciones/
P ublicacionesSeriadas/DocumentosT rabajo/95/F ich/dt9528.pdf , 1995.
190
Modelación con Estadı́stica y Probabilidad
ISBN: 978-607-525-442-5
CAPÍTULO 14
Instituto de Estadı́stica,
Facultad de Ciencias Económicas y de Administración,
Universidad de la República, Uruguay,
Instituto de Fundamentos y Métodos en Psicologı́a,
Facultad de Psicologı́a,
Universidad de la República, Uruguay,
[email protected], [email protected]
191
due to taking into account the different regions and the fact that does not exist
correlation between the variables of sustainability and the economic ones.
14.1. Introducción
El término sostenibilidad puede ser utilizado en diversos contextos. Existe la
sostenibilidad ambiental, económica, alimentaria, empresarial, etc., cada una refiere
a lo mismo pero aplicada a distintos ámbitos.
192
En este trabajo se presentan los principales resultados obtenidos al realizar
un análisis multivariante de estos indicadores medidos sobre las 56 empresas más
grandes (del continente americano) en términos económicos1 . Se incorporan también
al análisis, algunas variables de identificación, ası́ como otras que caracterizan la
estructura económica propia de cada una de las empresas.
El objetivo general de este trabajo es comparar las 56 empresas más grandes (en
términos económicos) del continente americano teniendo en cuenta tanto indicadores
de sostenibilidad como datos económicos propios de cada una. A partir de este
objetivo general, surgen los siguientes objetivos especı́ficos:
14.2. Metodologı́a
Los métodos Biplot fueron desarrollados por Gabriel en 1971 [2] quien plantea
que éstos son una representación gráfica (en baja dimensión) de la información
proporcionada por una matriz de datos multivariantes y destaca la idea de que, tal
como un diagrama de dispersión es una representación gráfica de la distribución
conjunta (en particular, de la correlación) de dos variables, con los métodos Biplot
se representan las relaciones que existen entre más de dos variables [3].
193
(≥ 0) de los valores propios de X t X.
En lo que refiere a las caracterı́sticas propias de cada uno de los métodos Biplot
clásicos, a continuación se detallarán las principales caracterı́sticas del GH Biplot,
que será el utilizado en la aplicación presentada en este trabajo.
194
Propiedades de los Marcadores
Para lograr una representación única, a excepción de posibles rotaciones, se
impone la restricción: At A = I, lo que implica:
Lo que implica que la longitud al cuadrado de los vectores que representan a los
marcadores columna, aproximan la covarianza entre las variables correspondientes.
Además:
p
|| bj ||=|| xj ||= var(xj ). Es decir, la longitud al cuadrado del vector
que representa un marcador columna aproxima la varianza de la variable
correspondiente, por lo que la longitud aproxima el desvı́o estándar.
X(X t X)−1 X t = AAt . El producto interno entre las filas de X, con la métrica
inversa de (X t X) es aproximadamente igual al producto interno entre los
marcadores fila.
Calidad de Representación
Si se realiza una aproximación de la matriz original X de rango r, con una de
rango menor q, la calidad de representación global se calcula como el cociente entre
la suma de cuadrados (SC) de Xq y de X.
r r
Recordando que SC(X) = tr(X t X) y que tr(X t X) = αi2 , donde:
P P
λi =
i=1 i=1
αi2 es el valor propio (de X t X) asociado al vector propio λi , se tiene:
q
P
αi2
i=1
CRG = × 100
P r
αi2
i=1
195
q
P
αi4
i=1
CRC = × 100
P r
αi4
i=1
q
P
αi0
× 100 = q × 100
i=1
CRF = r
P
0
r
αi
i=1
14.3. Resultados
Variables de Identificación
Por otra parte, en el Cuadro 14.2, se observa la distribución de las empresas por
paı́s según tamaño, donde se puede ver que no hay empresas pequeñas en estudio y
que de las analizadas, poco más del 50 % son multinacionales.
196
Cuadro 14.1: Cantidad de empresas por paı́s según continente.
197
sector Logı́stico: Transporte, almacenamiento y comunicaciones; sector Educación
y Servicios Sociales: Enseñanza, salud y otros servicios sociales y personales; y sector
Otros: Otros servicios.
Del total de 56 empresas en estudio, se observa que un 46 % se dedica a la Industria,
Agua y Energı́a, seguidas de aquellas que se dedican a brindar otro tipo de servicios
(20 %).
Por otra parte, cabe resaltar que hay solo una empresa del sector Primario, una
del sector Reparaciones, y una del sector Educación y que las tres corresponden a
empresas de Estados Unidos.
En cuanto al tipo de empresa (estatal, cooperativa, pública ó privada) sólo una de
las 56 empresas es estatal. Ésta se encuentra en Brasil, pertenece al sector otros
servicios y es una empresa de tamaño grande. Las restantes corresponden todas al
sector privado.
198
ganancias es de más de 180 puntos porcentuales, mientras que el máximo cambio
es de un 170 %. Es de resaltar además, la asimetrı́a de esta variable ya que el 75 %
de las empresas tienen un cambio de 19 % o menos.
Por último, al realizar un estudio bivariante de las variables del Global 500 se
observa que todas las correlaciones son bajas excepto Ganancias y Beneficios de
Ingresos (0.7), Ganancias y Retorno de Activos (.69), y esta última con Beneficios
de Ingresos (0.67).
Tal como se observa en el Cuadro 14.6, todas las empresas reportan al menos
un indicador de las dimensiones Ambiental y Prácticas Laborales. Al considerar
el resto de las dimensiones se observa que en todas existe alguna empresa que no
reporta ningún indicador.
199
En el otro extremo, se aprecia que el máximo de cada una de las dimensiones
coincide con la cantidad de indicadores de cada una, es decir, que en todas las
dimensiones existe al menos una empresa que reporta todos los indicadores.
Resulta destacable además que tal como se aprecia en el cuadro, todas las
variables excepto Derechos H. presentan una distribución simétrica, ya que media
y mediana prácticamente coinciden.
Por último, en la Figura 1 se observa como todas las categorı́as son más
reportadas por las empresas latinoamericanas y destacan sobre las otras para
Latinoamérica las categorı́as de prácticas laborales (75 %) y sociedad (75 %), y para
Norteamérica la economı́a (60 %) y la ambiental (60 %).
200
Figura 1 Índices generales/acumulados GRI G4 - Por Región.
14.3.2. HJ-Biplot
201
Cuadro 14.9: Contribución acumulada - HJ - Biplot.
202
Figura 2. HJ Biplot - General.
Por lo tanto, se entiende que las empresas con una cantidad más alta de
empleados tienen mayor número de ingresos. Se destaca el hecho de que éstas son en
su totalidad estadounidenses. Resalta, en el lado contrario, una empresa canadiense
como la empresa con ingresos más bajos y menor número de empleados (dentro de
las empresas con calidad de representación superior a 400).
203
Figura 3. HJ Biplot - Ejes 1 y 2.
Por último, se analiza el plano determinado por los ejes 2 y 3, el cual está
representado en la Figura 5. Lo destacable en este plano es la presencia de la variable
PatrimonioAccionistas (ausente en los anteriores), en la cual se observa como las
empresas que presentan menos valor son latinoamericanas.
204
Figura 5. HJ Biplot - Ejes 2 y 3.
14.4. Conclusiones
Como conclusión principal de los análisis presentados en este trabajo, se
destaca la diferencia en el reporte de los indicadores, de las 56 empresas más
importantes del continente americano, si se realiza una comparación por región,
ya que Latinoamérica presenta mayores reportes en todos los indicadores. En este
sentido, y teniendo en consideración, por ejemplo, que Brasil y México han firmado
(en 1997 y 1998) y ratificado (en 2002 y 2000) el protocolo de Kyoto (acuerdo
internacional que tiene como principal objetivo reducir las emisiones de seis gases de
efecto invernadero que causan el calentamiento global) y que, por otra parte, EEUU
lo ha firmado en el mismo año pero sin ratificación y que Canadá lo ha abandonado
en 2011, se entiende que los resultados obtenidos en esta investigación podrı́an ser
un inidcador del compromiso de Latinoamérica, frente a EEUU y Canadá, con la
sostenibilidad a nivel paı́s, con repercusiones en las polı́ticas empresariales.
Cabe resaltar, además, que los indicadores más reportados para Latinoamérica
son Prácticas Laborales y Sociedad, y para Norteamérica Económica y Ambiental.
Para finalizar, resulta destacable que no existe ninguna correlación entre las
variables de sostenibilidad y las económicas, por lo que se puede concluir que el
hecho de que una empresa sea sostenible no repercute en beneficios, ni pérdidas,
económicas en ella.
Este resultado podrı́a deberse, o bien al poco conocimiento, por parte de los
consumidores, de estos ı́ndices y su poca publicidad, lo que no hace decisiva la
elección de una empresa u otra en base a la sostenibilidad que reportan, o a
la sensación, por parte del consumidor, de que estas iniciativas solo sirven a las
empresas para deducir la carga fiscal o limpiar su imagen.
205
Como consideración a futuro, se propone realizar este mismo estudio con
empresas no tan potentes, económicamente hablando, para ası́ analizar sı́, en
un contexto más “familiar”, los consumidores eligen consumir en las empresas
dependiendo su grado de sostenibilidad.
Referencias
1. Eckart, J. y Young, G., Approximation of One Matriz by Another of Lower
Rank, Psychometrika, 1(3), 211 - 218, 1936.
206
Modelación con Estadı́stica y Probabilidad
ISBN: 978-607-525-442-5
CAPÍTULO 15
207
15.1. Introducción
A través de la historia, la probabilidad y la estadı́stica han sido ramas de
la matemática aplicada que han ayudado a crecer a diversas áreas, tales como
biologı́a, medicina, ingenierı́a, fı́sica, etc. En particular el análisis de supervivencia
ha desarrollado tópicos de gran ayuda para dichas áreas, con el interés general de
estudiar el tiempo de vida de un elemento particular dentro de un sistema definido.
15.2. Teorı́a
El análisis de supervivencia es una técnica inferencial que tiene como objetivo
esencial modelar el tiempo que tarda en que ocurra un determinado suceso, es
decir, se encarga del estudio de eventos-tiempo. Entre los modelos que se han
propuesto para describir dichos eventos se encuentran los modelos: Exponencial,
Gamma, Weibull, y Lognormal, no obstante, como se mencionó anteriormente no
todos los datos se ajustan a tales modelos, por lo cual es necesario proponer modelos
más generales, para ası́ explicar el comportamiento de los datos aun cuando no se
208
ajusten a cierto modelo. El tiempo de vida de un objeto, en general depende de otras
variables, las cuales son explicables y que denominaremos covariables del fenómeno.
Sea T una variable aleatoria (v.a.), que denota el tiempo hasta que ocurre un
evento de interés; como puede ser el fallo de un electrodoméstico, el desarrollo de una
enfermedad, muerte, recurrencia en algún fallo, etc. En particular para este trabajo
T es una v.a. continua, no negativa que representa a una población homogénea.
Haremos uso de tres funciones que caracterizan de manera única a T :
Función de supervivencia.
Función de riesgo.
Función de densidad de probabilidad.
Todas las funciones, a menos que se indique lo contrario, están definidas sobre
el intervalo [0, ∞]. Donde f(t) denota la función de densidad de probabilidad de T
y F(t) su función de distribución acumulada, definida como:
F (t) = P [T ≤ t]
Z t (15.1)
= f (x)dx.
0
S(t) = P [T > t]
Z ∞
(15.2)
= f (x)dx.
t
Propiedades:
Teorema 15.2.2 Sea T una variable aleatoria continua, con función de densidad
de probabilidad f(t), entonces:
dS(t)
f (t) = − (15.3)
dt
209
Definición 15.2.3 La función de riesgo se define como:
Corolario 15.2.4 Rt
S(t) = exp− 0
h(u)du
Demostración. Dado que S(t) = 1−F (t), tenemos que S 0 (t) = −F (t) = −f (t).
Luego
f (t) −S 0 (t)
h(t) = = (15.5)
S(t) S(t)
Integrando ambos miembros de 0 a t:
t t
S 0 (t)
Z Z
h(t)dt = − dt
0 0 S(t)
= −lnS(s)|t0 (15.6)
= −lnS(t) + lnS(0)
= −lnS(t).
Dado que lnS(0) = 0, lo cual es válido si y sólo si S(0) = 1 (esta última condición se
satisface si F (0) = 0, condición que expresa que la probabilidad de una falla inicial
es igual a 0), por lo tanto:
Rt
S(t) = exp− 0
h(u)du
. (15.7)
210
15.3. Modelo Weibull
Propuesto por Berry (1975), Dyer (1975), Meier (1980) y Wilks (1990) como
modelo para datos de tiempo de vida a partir de la distribución Weibull, la cual fue
introducida por el fı́sico sueco Waloddi Weibull.
Lee y O´Neil (1971) y Doll (1971), afirman que este modelo ajusta muy bien
a datos que involucran tiempos de aparición de tumores en humanos y animales.
La distribución Weibull presenta un punto de partida para la estimación de sus
parámetros, haciendo uso de su función de supervivencia; abarcando varios tipos de
riesgo, para diferentes valores del parámetro β.
β > 1, creciente
β = 1, constante Riesgo
β < 1, decreciente
Propiedades:
β t β−1
h(t) = · (15.11)
α β
211
15.3.1. Parte Experimental
Se ensamblaron diez unidades con cada uno de los dos diseños: diseño A y diseño
B. Estas 20 unidades fueron probadas hasta que fallaron. La Tabla 1 muestra la
cantidad de ciclos hasta antes del fallo para cada artı́culo probado.
Diseño A Diseño B
Muestra Ciclos Muestra Ciclos
1 729,044 11 529,082
2 614,432 12 729,957
3 508,077 13 650,570
4 807,683 14 445,834
5 755,223 15 343,280
6 848,953 16 959,903
7 384,558 17 730,049
8 666,686 18 730,640
9 515,201 19 973,224
10 483,331 20 258,006
Tabla 15.1
212
1 1
Ciclos DA Rango Media de Rango ln(ln( )) ln(Ciclos DA)
1 − M.R 1 − M.R
384558 1 0.06730769 1.07216495 -2.66384309 12.8598499
483331 2 0.16346154 1.1954023 -1.72326315 13.088457
508077 3 0.25961538 1.35064935 -1.20202312 13.1383883
515201 4 0.35576923 1.55223881 -0.82166652 13.1523124
615432 5 0.45192308 1.8245614 -0.50859539 13.3300797
666686 6 0.54807692 2.21276596 -0.23036544 13.4100744
726044 7 0.64423077 2.81081081 0.03292496 13.4953659
755223 8 0.74038462 3.85185185 0.29903293 13.5347683
807683 9 0.83653846 6.11764706 0.59397722 13.6019249
848953 10 0.93269231 14.8571429 0.99268893 13.6517591
Tabla 15.2
1 1
Ciclos DB Rango Media de Rango ln(ln( )) ln(Ciclos DB)
1 − M.R 1 − M.R
258006 1 0.06730769 1.07216495 -2.66384309 12.4607381
343280 2 0.16346154 1.1954023 -1.72326315 12.7463017
445834 3 0.25961538 1.35064935 -1.20202312 13.007702
529082 4 0.35576923 1.55223881 -0.82166652 13.1788987
650570 5 0.45192308 1.8245614 -0.50859539 13.3856042
729957 6 0.54807692 2.21276596 -0.23036544 13.5007409
730049 7 0.64423077 2.81081081 0.03292496 13.5008669
730640 8 0.74038462 3.85185185 0.29903293 13.5016761
959903 9 0.83653846 6.11764706 0.59397722 13.7745875
973224 10 0.93269231 14.8571429 0.99268893 13.7883696
Tabla 15.3
Ajustando una lı́nea a los datos. Se realiza una modelación tipo Weibull,
empezando por estimar los parámetros haciendo una transformación logarı́tmica
a S(t), para llegar a una forma lineal.
x β
−
F (x) = 1 − exp α .
Equivalentemente,
1
ln ln = β · ln(x) − β · ln(α).
1 − F (x)
Enseguida se procede a realizar una regresión lineal, el cuál fue hecha con
Analysis ToolPack de Excel, obteniendo los siguientes valores: β = 4.25, llamado
parámetro de forma y α = 693, 380, conocido como vida caracterı́stica. La cual
despejado del valor obtenido de la regresión con ToolPack y el hecho de que el
intercepto de la ecuación b = 4.2524 = −βln(α).
De ahı́ que:
4.2524
ln(α) = ,
−β
213
α = 693,335.73.
214
15.4. Resultados
El parámetro de forma de Weibull, denominado β, indica si la tasa de fallos
es creciente, constante o decreciente. Un β < 1.0 indica que el producto tiene una
tasa de fracaso decreciente. Este escenario es tı́pico de la “mortalidad infantil” e
indica que el producto está fallando durante su perı́odo de “burn-in”. Un β = 1.0
indica una tasa de fracaso constante. Frecuentemente, los componentes que han
sobrevivido a quemado posteriormente exhibirán una tasa de fracaso constante. Un
β¿1.0 indica una tasa de fallos creciente. Esto es tı́pico de los productos que se están
agotando. Tal es el caso de nuestros artı́culos, tanto los diseños A como B tienen
valores β mucho más altos que 1,0. Los artı́culos fallan debido a la fatiga, es decir,
se desgastan.
Vale la pena decir que la información obtenida del análisis explaya una tabla de
datos obtenidos a partir de la experimentación a un grupo de datos que proveen
215
información más completa sobre el proceso y por lo tanto, ayuda a resolver la
pregunta inicial, como a plantear nuevas interrogantes.
15.5. Conclusiones
La fortaleza de la distribución Weibull es su versatilidad. Dependiendo de
los valores de los parámetros, la distribución de Weibull puede aproximar una
distribución exponencial, normal o sesgada.
Un análisis profundo del modelo Weibull abre puertas a un trabajo más detallado
y respaldado, a la solución a preguntas aún no planteadas, pero explotables gracias
a la basta cantidad de información que se obtiene.
Referencias
1. Cox, D. R., Oaks, D., Analysis of Survival Data, Chapman and Hall, 1984.
2. Klein, P.J., Techniques for Censored and Truncated Data, Springer, 2003.
216
MODELACIÓN CON ESTADÍSTICA Y PROBABILIDAD
Editores
Fomento Editorial
Lugar de impresión: Facultad de Ciencias Físico Matemáticas, con domicilio en Av. San
Claudio y 18 sur, Col. San Manuel, Ciudad Universitaria, Puebla, Pue., C.P. 72570, Tel.
2295500, ext. 7550, fax 2295636