Probabilidad, Estadística y Sus Aplicaciones

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 283

|

Probabilidad, Estadística y sus


Aplicaciones
Probabilidad, Estadística y sus
Aplicaciones

Editores:
Hugo Adán Cruz Suárez
Bulmaro Juárez Hernández
Francisco Solano Tajonar Sanabria
Hortensia Josefina Reyes Cervantes
Fernando Velasco Luna
José Dionicio Zacarías Flores
Víctor Hugo Vázquez Guevara (responsable)

Benemérita Universidad Autónoma de Puebla


2019
Primera edición: 2019

ISBN: 978-607-525-589-7

DR © Benemérita Universidad Autónoma de Puebla

4 sur 104, Col. Centro Histórico, Puebla, Pue. CP 72000

Teléfono: 01 (222) 229 55 00

www.buap.mx

Dirección General de Publicaciones

2 norte 1404, Col. Centro Histórico, Puebla, Pue. CP 72000

Teléfonos: 01 (222) 246 85 59 y 01 (222) 229 55 00 Ext. 5768 y 5764

www.dgp.buap.mx

[email protected]

Facultad de Ciencias Físico Matemáticas

Av. San Claudio y 18 sur, Colonia San Manuel, Puebla, Pue. CP 72570

Teléfonos: 01 (222) 229 55 00 Ext. 7552

www.fcfm.buap.mx

BENEMÉRITA UNIVERSIDAD AUTÓNOMA DE PUEBLA • Rector: José Alfonso Esparza Ortiz

• Secretario General: José Jaime Vázquez López • Vicerrector de Extensión y Difusión de la


Cultura: Fernando Santiesteban Llaguno • Director General de Publicaciones: Hugo Vargas
Comsille • Director de la Facultad de Ciencias Físico Matemáticas: Martha Alicia Palomino Ovando

Impreso y hecho en México

Printed and made in Mexico


Índice General

Capítulo 1 ……………………….………………………………………………………………………………………………..1
Índice de la calidad de la Vivienda en México
G. Olivera y O.V. Serrano

Capítulo 2 ……………………….………………………………………………………………………………………………13
Uso del condón de los adolescentes según las
características de la pareja sexual
C. Menkes, I.A. Sosa y L. Núñez

Capítulo 3 ……………………….…………………………………………………………………………………………….25
Una caracterización de la satisfacción estudiantil
mediante análisis de clases latentes
R. Álvarez-Vaz y E. Vernazza

Capítulo 4 ……………………….…………………………………………………………………………………………….40
Modelación espacial de la plaga Sigatoka Negra
(Mycosphaerella fijiensis) en cultivos de plátano
del estado de Guerrero
J.E. Solís, M. Guzmán, R. Reyes y D. Briones

Capítulo 5……………………….……………………………………………………………………………………………….53
Aplicación del análisis de supervivencia en datos
de pacientes sometidos a transplante renal
J.A. Gil, B. Juárez y V.H. Vázquez

Capítulo 6………………………………………………………………………………………………………………………64
Modelación espacial de la infestación del ácaro rojo
De las palmas (Raoiella Indica) en el estado de
Guerrero con un proceso espacial Poisson
D.A. Ozuna, M. Guzmán, F. Godínez y R. Reyes

Capítulo 7………………………………………………………………………………………………………………………..76
Una aplicación de la metodología Biplot Logístico:
Análisis de la sostenibilidad empresarial
A. Urruticoechea y E. Vernazza
Capítulo 8………………………………………………………………………………………………………………………..92
Análisis de la deserción en las licenciaturas
de la FCFM-BUAP mediante el modelo de
riesgo proporcional semiparamétrico
B.X. Muñoz, B. Juárez, L. Cervantes y H. Reyes

Capítulo 9………………………………………………………………………………………………………………………108
Modelación estadística con imágenes
Satelitales en Ciencias Ambientales
A.A. Oroza, G. Linares, H. Reyes y
M. L. Sandoval

Capítulo 10…………………………………………………………………………………………………………………….124
Riesgo de Crédito usando Redes Neuronales
A. Herrera, H. Reyes, G. Linares y B. Juárez

Capítulo 11…………………………………………………………………………………………………………………….136
Embarazo adolescente, desigualdad social
y salud sexual y reproductiva según
condición de indigenismo en México
I.A. Sosa e I. A. Quallenberg

Capítulo 12…………………………………………………………………………………………………………………….150
Uso de la distribución Bernoulli Multivariada
en salud bucal
R. Álvarez-Vaz y F. Massa

Capítulo 13…………………………………………………………………………………………………………………….166
Determinación de la distribución de
Probabilidad de la demanda en un
modelo de control de inventarios
E. Hernández y R. Ilhuicatzi

Capítulo 14…………………………………………………………………………………………………………………….179
El Conteo en la Probabilidad
F. Tajonar, E. Morales, F. Velasco,
H. Cruz y J. Zacarìas

Capítulo 15…………………………………………………………………………………………………………………….191
Optimalidad de políticas (s,S) para un modelo
de inventarios vía la teoría de los procesos
de decisión de Markov
R. Blancas, H. Cruz, F. Velasco y F. Tajonar
Capítulo 16…………………………………………………………………………………………………………………….208
Reemplazo óptimo de un equipo y
algoritmo creciente de inducción
hacia atrás
R.M. Flores, R. Ilhuicatzi y R. Rosales

Capítulo 17…………………………………………………………………………………………………………………….225
Juegos Estocásticos y criterios de
rendimiento
C. Briones, V.H. Vázquez y D. Zacarías

Capítulo 18…………………………………………………………………………………………………………………….238
Probabilidad de localización de una
Partícula en un potencial isotónico
cuántico
M. Castillo y M.A. Maya

Capítulo 19…………………………………………………………………………………………………………………….252
Análisis preliminar de la satisfacción
laboral de un hospital del estado
de Puebla
J.D. Velázquez, J.M. Hernández,
C. Solís y J. Cuéllar

Capítulo 20…………………………………………………………………………………………………………………….265
Aplicación del modelo exponencial
en hilados textiles
A.M. Islas, G. Buendía y
Y. Montoya
Probabilidad, Estadı́stica y sus Aplicaciones

Capı́tulo 1
1
Índice de Calidad de la Vivienda en México

Guillermo Olivera Lozano y Olga Victoria Serrano Sánchez

Centro Regional de Investigaciones Multidisciplinarias,


Universidad Nacional Autónoma de México,
Cuernavaca, Morelos 62210, México,
[email protected], [email protected]
Resumen. En este trabajo se analizan los datos de la Encuesta Intercensal
2015 (EIC-2015) para estimar un ı́ndice de calidad de la vivienda (ICV) en México,
por entidad federativa, con base en el método de Componentes Principales. Este
ejercicio se complementa con un análisis de cúmulos, el cual permite clasificar a
las entidades federativas en cinco grupos que presentan ı́ndices de calidad similares
dentro de ellos. El ICV se calcula a partir de diez variables incluidas en la EIC- 2015
del INEGI. Lo más evidente en los resultados es la enorme desigualdad que existe
en los estados del sur-sureste, frente a los del centro y norte del paı́s. Ası́, Chiapas,
Guerrero y Oaxaca en un grado extremo, junto con Campeche, Veracruz y Tabasco
padecen rezagos importantes. En contraste, Nuevo León, Aguascalientes, Distrito
Federal, Coahuila y Jalisco resultaron con las mejores condiciones en calidad de las
viviendas.

Abstract. In this paper, we estimate a house quality index (HQI) based on


data from Encuesta Intercensal (EIC) 2015, in each one of the federative entities,
using principal components method. We also apply cluster analysis methodology to
complement the results obtained by HQI. This methodology clasisfies the federative
entities in 5 groups with similar quality index in them. HQI is calculated using 10
variables included in EIC-2015 from INEGI. The most evident results is the ample
inequity that exists in the south and southeastern estates compared to the northern
and center estates of the country. Thus, Chiapas, Guerrero and Oaxaca are the
most unequal, followed by Campeche, Veracruz and Tabasco. In comparison Nuevo
Leon, Aguascalientes, Distrito Federal, Coahuila and Jalisco show the best housing
conditions.

Palabras clave: Calidad de la vivienda, componentes principales, estadı́stica


multivariada.
1 Este trabajo es un avance de resultados del proyecto PAPITT IN302718, financiado por la

DGAPA-UNAM, ”La polı́tica de vivienda en propiedad ¿Dónde estamos veinte años después?
Una mirada global y desde Morelos”, coordinado por los autores.

1
Probabilidad, Estadı́stica y sus Aplicaciones

1.1. Introducción
La vivienda en México ha sido uno de los sectores privilegiados en los programas
de desarrollo de los gobiernos federales desde fines del siglo XX, pero sobre todo en
lo que va del tercer milenio. La centralidad que ha tenido este sector se cimienta en
su importante aportación al Producto Interno Bruto, ası́ como en su contribución
para resolver una de las necesidades primordiales de la población [3]. Del año 2000
a la fecha, sin embargo, cabe distinguir dos etapas en la polı́tica federal de vivien-
da, pero sobre todo, en las acciones ejecutadas por organismos públicos como el
Instituto del Fondo Nacional de la Vivienda para los Trabajadores (INFONAVIT)
y el Fondo de la Vivienda del Instituto de Seguridad y Servicios Sociales de los
Trabajadores del Estado (FOVISSSTE), ası́ como la Comisión Nacional de Vivien-
da (CONAVI). La primera etapa (2000-2008) se constituyó en un periodo dorado
para el otorgamiento de créditos hipotecarios, favorecido, entre otras razones, por
la existencia de un mercado o ´demanda efectiva´ conformado por trabajadores
formales con ingresos a partir de 2.6 veces el salario mı́nimo, pero sobre todo por
arriba de 4 veces el salario mı́nimo. A ese auge contribuyó la estabilidad económica,
la reducción progresiva de las tasas de interés y el fortalecimiento del sector finan-
ciero [1]. La evolución positiva del sector vivienda se tradujo en la asignación de 5.2
millones de créditos y subsidios, de los cuales dos terceras partes (66 por ciento)
sirvieron para financiar la venta de vivienda nueva. Estas acciones, sin embargo,
aunque debı́an centrarse en la disminución del déficit cuantitativo de vivienda (ca-
sas que debı́an reemplazarse por término de la vida útil de sus materiales y 756
mil hogares sin vivienda en 2001) [2], se orientaron más a atender las necesidades
de vivienda de los hogares de nueva formación (750 mil por año, misma cantidad
que los créditos programados a otorgarse). Parte importante de la demanda provino,
además, de propietarios patrimonialistas que compraron casas nuevas sin ocuparlas,
en tanto que otros que sı́ las requerı́an dejaron de pagarlas y las abandonaron por
su lejanı́a. Como resultado del creciente stock de vivienda nueva desocupada a cau-
sa de la ubicación de las unidades habitacionales construidas lejos de las cuencas
de empleo, con insuficiente acceso a equipamiento urbano e inadecuada conexión
con los sistemas de transporte, ası́ como debido a la crisis financiera de dos de las
principales empresas constructoras, coincidente con la recesión económica de 2008,
el modelo de desarrollo habitacional también entró en crisis. Diversos análisis sobre
los resultados de la polı́tica habitacional resaltaron el inconveniente de privilegiar
la atención del déficit cuantitativo cuando sólo representaba el 42.3 del rezago habi-
tacional al inicio de siglo. De ahı́ que en el periodo 2009 a la fecha (2018), el énfasis
de la polı́tica de vivienda se reorientó hacia la atención del rezago cualitativo, sin
desatender las necesidades de vivienda nueva ni el déficit cuantitativo. ¿Qué mide
el rezago cualitativo? De acuerdo con la metodologı́a de la Sociedad Hipotecaria
Federal (SHF)[6], la calidad de los materiales con que están construidas las vivien-
das -ya sea materiales en deterioro o materiales de calidad regular- , y aquellas que
están en situación de hacinamiento cuando tienen más de 2.5 personas por recáma-
ra. Los datos resultantes del análisis de la Encuesta Intercensal 2015 del INEGI,
con base en la metodologı́a de la SHF arrojaron que 67.8 % del parque habitacional
del paı́s estaba en situación de rezago habitacional cualitativo, correspondiente a
8.9 millones de viviendas. Desglosado en sus tres componentes la mayor parte del
rezago (67.8 %) estaba en las viviendas con hacinamiento (6 millones); le seguı́a la

2
Probabilidad, Estadı́stica y sus Aplicaciones

vivienda construida con materiales regulares (30.9 %) (2.7 millones), en tanto que
la vivienda construida con materiales en deterioro (110 mil) apenas representaba
1.2 por ciento. Ahora bien, aunque la medición del rezago cualitativo permite to-
mar medidas para su atención, estas se constriñen a soluciones como ampliación o
mejoramiento de vivienda en función de los materiales con que están construidas.
Dicho ejercicio omite otros aspectos relacionados con el tipo de servicios básicos a
que tienen acceso las viviendas, relacionadas con condiciones de salubridad, y que
son indicadores también importantes. Esto es posible medirlo con otro tipo de técni-
cas y métodos, como puede ser un ı́ndice de Calidad de Vivienda, del cual derivan
resultados que permitirı́an tomar medidas complementarias a las que considera la
polı́tica de vivienda vigente. De acuerdo a los resultados principales, la atención a la
condición de los servicios hidrosanitarios de las viviendas, contribuirı́a a mejorar de
forma notable la calidad de las viviendas a nivel nacional, y su incidencia principal
ocurrirı́a en los estados más desfavorecidos social y económicamente, que son los del
sur del paı́s.

1.2. Fuente de información


El ı́ndice de calidad se obtuvo utilizando como fuente de información la Encues-
ta Intercensal EIC-2015 realizada por el INEGI. Esta consideró una muestra de 6.1
millones de viviendas con cobertura de información a nivel nacional, entidad fede-
rativa, municipio y localidades mayores de 50,000 habitantes. Su población objetivo
son los residentes habituales del territorio nacional y las viviendas particulares habi-
tadas; su objetivo es generar información estadı́stica actualizada de estimaciones de
calidad sobre el volumen, composición y distribución de los habitantes y viviendas
del territorio nacional, que sean comparables con censos e indicadores internaciona-
les. Se propone, asimismo, obtener estimadores de proporciones, tasas y promedios
para cada una de las variables estudiadas. Para el procesamiento y análisis de la
información se utilizó el paquete estadı́stico Statistical Package for Social Science
(SPSS) v 24 [7].

1.3. Metodologı́a
1.3.1. Unidad de análisis
Se analizan las viviendas que cumplen con la caracterı́stica de ser particulares y
estar habitadas en cada una de las entidades federativas del paı́s.

1.3.2. Variables
Se utilizan diez variables que reflejan las caracterı́sticas de las viviendas relacio-
nadas con el tipo de materiales de construcción, el nivel de acceso a servicios, ası́
como condiciones de salubridad y de hacinamiento en que se encuentran las casas-
habitación.

Las variables que se utilizan son:

3
Probabilidad, Estadı́stica y sus Aplicaciones

a) Proporción de viviendas con paredes o muros construidas con tabique, ladrillo,


block, piedra, cantera, cemento o concreto.
b) Proporción de viviendas con techo construidas con losa de concreto o viguetas
con bovedilla.
c) Proporción de viviendas con piso construido con cemento, firme, mosaico,
madera u otro recubrimiento.

d) Proporción de viviendas que tienen cuarto para cocinar.


e) Proporción de viviendas en hacinamiento (más de 2.5 personas por cuarto
para dormir).
f) Proporción de viviendas con luz eléctrica.

g) Proporción de viviendas que obtienen el agua de llaves o mangueras que están


dentro de la vivienda.
h) Proporción de viviendas que tienen servicio sanitario.

i) Proporción de viviendas con taza de baño exclusiva de la vivienda.


j) Proporción de viviendas con drenaje a la red pública, fosa séptica o tanque
séptico (biodigestor).

1.3.3. Análisis de Componentes Principales (CP)


Descripción de la metodologı́a de componentes principales2

Mediante el análisis de componentes principales, se transforma al conjunto de


variables originales (X), que están correlacionadas en otro conjunto nuevo de va-
riables o factores no correlacionados (Y ) [4].

El procedimiento de componentes principales genera un número reducido de va-


riables que son combinaciones lineales de las variables originales, dependiendo de la
estructura de correlación entre las variables X.

Generalmente, en la práctica sólo se consideran las primeras combinaciones li-


neales que son las que explican la mayor variabilidad de los datos y ası́ descartar
los “sobrantes” y reducir el número de variables a considerar. Esta reducción de
variables es de gran utilidad práctica, ya que, en primer lugar facilita el manejo
matemático y presentación gráfica de los datos. En segundo lugar, en el supuesto
caso de que exista redundancia en las observaciones originales, tal que las varia-
bles están linealmente relacionadas, se dificulta el análisis numérico y esto se puede
evitar reduciendo el número de variables. Por último, dicha reducción no ocasiona
obstáculo alguno en la interpretación de los resultados finales, ya que las variables
2 A los lectores interesados sobre el desarrollo matemático de la metodologı́a de ACP, se les

invita a consultar “Componentes Principales. Análisis de Datos sobre calidad de la vivienda en el


estado de Morelos”, Serrano y Olivera, publicado en Modelación con estadı́stica y probabilidad,
BUAP 2018.

4
Probabilidad, Estadı́stica y sus Aplicaciones

transformadas pueden conducir ellas mismas a esta interpretación en términos de


las variables originales.

Es importante mencionar que el método de componentes principales puede ser


aplicado, entre otros, para los siguientes propósitos:
a) Métodos gráficos y análisis de conglomerados. En análisis de conglome-
rados, no es tan fácil definir criterios mediante los cuales decidir, usando méto-
dos numéricos, si hay una justificación para dividir conjuntos de observaciones
en grupos. Si se grafican las CP puede ayudar al análisis de conglomerados;
por ejemplo, si hay grupos bien definidos y separados, un método analı́tico no
es necesario. En situaciones en las que ninguna prueba de significancia fuera
posible, el graficar las CP puede al menos confirmar que un grupo sugerido se
ve razonable y es realmente indicado por las observaciones.
b) Redundancia. La mayorı́a de las técnicas del análisis multivariado consideran
matrices de orden igual al número de variables. Cuando estas son demasiadas,
y si las correlaciones entre las observaciones son altas, tal que las matrices
de dispersión son casi singulares o singulares, las dificultades se incrementan.
Para prevenir este problema, se hace un CP preliminar y se descartan las CP
más grandes, ya que en muchos casos éstas contienen más ruido que informa-
ción y poco o nada se pierde con eliminarlas. Entonces el análisis se puede
llevar acabo con las CP restantes.
c) Detección de observaciones aberrantes. Un problema frecuente cuando
los datos se obtienen de muestras multivariadas, es el detectar las observacio-
nes que se encuentran “alejadas” del conjunto de datos. Un análisis de CP y
métodos gráficos puede ser de gran utilidad en la detección de observaciones
aberrantes.
d) Cálculo de ı́ndices. El análisis de CP también se usa en la construcción de
indicadores o ı́ndices, para analizar las condiciones de ventajas o desventajas
en que se encuentra una población. Se usa la primera CP como el mejor
indicador porque es la que retiene la mayor variabilidad posible del conjunto
de datos, y retiene la máxima información como una combinación lineal de
las variables originales.

1.4. Resultados
Utilizando la matriz de correlaciones se obtuvieron los eigenvalores o valores
propios y eigenvectores o vectores principales. Se estandarizaron las variables ori-
ginales para que cada una de ellas sea de igual importancia en el cálculo de las
CP o factores. En el cuadro 1.1, se presentan los valores propios y sus porcentajes
de variación correspondientes. Se observa que las dos primeras componentes prin-
cipales representan el 78.5 % de la variabilidad de los datos y la disminución del
segundo al tercer valor principal es del 30.7 %. Por lo tanto, según el criterio de la
raı́z principal y del porcentaje de variación3 el número apropiado de nuevos factores
3 En el criterio de la raı́z principal, sólo se consideran significativos los valores propios o auto-

valores mayores que 1. Esto se basa al considerar el cálculo de CP con datos estandarizados en

5
Probabilidad, Estadı́stica y sus Aplicaciones

es dos4 . El primer factor, que es el que explica la mayor variabilidad de los datos, es
el que se utilizó para calcular las proyecciones de los datos originales en los nuevos
ejes componentes principales, y de esta manera, obtener el ı́ndice de calidad de las
viviendas para cada una de las entidades federativas.

Componente Valores propios % de variación % de variación de acumulados


1 6.600 65.998 65.998
2 1.255 12.545 78.543
3 0.844 8.742 87.286
4 0.486 4.856 92.142
5 0.254 2.544 94.686
6 0.236 2.363 97.049
7 0.119 1.191 98.240
8 0.083 0.834 99.074
9 0.077 0.770 99.844
10 0.016 0.156 100.000

Cuadro 1.1: Valores propios de la matriz de correlaciones.

En el cuadro 1.2, se presentan los vectores principales correspondientes a las tres


indicadores compuestos (IC1, IC2, IC3). Con base en que sólo las componentes con
valor absoluto mayores que .30 [5] intervienen significativamente en la conformación
del vector, se observa que IC1 está formado por todos los indicadores simples, lo
que confirma que las variables originales, están representadas de manera clara (IC1
se rota en dirección de la máxima variabilidad) y la interpretación del ı́ndice de
calidad de la vivienda mediante IC1, es fiable. Se observa también, que los valores
más altos de la primera componente corresponden a las variables relacionadas con
servicios hidrosanitarios y el material del piso de la vivienda.

El ı́ndice de calidad representado por la primera componente principal, se presen-


ta en la Figura 1.1 para las 32 entidades federativas. En la medida que se incrementa
el ı́ndice, mejores son las condiciones de la vivienda. Se aprecia en esta gráfica, una
polarización muy marcada en el nivel de calidad de las viviendas entre las entida-
des federativas, en las que el menor ı́ndice corresponde a los estados de Guerrero,
Oaxaca, Chiapas, por un lado, y las mejores condiciones de vivienda a Nuevo León,
Aguascalientes y Distrito Federal por el otro.

El rango de variabilidad del ı́ndice es muy amplio, lo cual sugiere que podrı́an
formarse grupos de entidades federativas similares entre sı́ y disı́miles entre los
grupos. Mediante un análisis de clúster o de cúmulos, es posible identificar objetos
con caracterı́sticas similares. Aplicando esta metodologı́a5 , se obtienen los siguientes
base a la matriz de correlaciones. El criterio del porcentaje de variación, consiste en declarar como
diferente de cero, a tantas raı́ces caracterı́sticas como sea necesario, para que las nuevas variables
expliquen un porcentaje de la variación original considerado como satisfactorio.
4 En el caso del cálculo del ı́ndice de calidad, se utilizó la primera CP, por ser, por definición,

la que mejor explica la variabilidad del conjunto de variables originales.


5 Los detalles de la regionalización de México según caracterı́sticas de la vivienda serán desa-

rrollados en un trabajo posterior.

6
Probabilidad, Estadı́stica y sus Aplicaciones

Componente
IC1 IC2 IC3
Con paredes de tabique, ladri- 0.638 0.662 0.125
llo,cantera, etc
Con techos que son de losa de 0.756 0.380 -0.175
concreto o viguetas con bovedi-
llo.
Con pisos de cemento, firme, mo- 0.945 0.052 0.025
saico, madera u otro.
Con cuarto para cocinar. 0.697 -0.226 -0.631
Con luz eléctrica. 0.791 0.384 0.128
Con agua entubada que obtienen 0.928 -0.230 0.167
de llaves o mangueras que están
dentro de la vivienda.
Con servicio sanitario. 0.948 -0.219 -0.058
Con taza de baño exclusiva de la 0.608 -0.544 0.503
vivienda.
Con drenaje a la red pública o 0.886 0.074 0.221
fosa séptica o biodigestor.
Sin hacinamiento. 0.837 -0.262 -0.282

Cuadro 1.2: Vectores propios de la matriz de correlaciones.

grupos:
Región 1: Aguascalientes, Jalisco, Nuevo León, Distrito Federal, Coahuila de
Zaragoza, Tamaulipas, Sonora, Baja California Sur, México, Tlaxcala, Guana-
juato, Querétaro, Sinaloa, Quintana Roo, Nayarit, Hidalgo, Morelos, San Luis
Potosı́, Yucatán, Puebla, Michoacán, Colima, Baja California y Chihuahua.
Región 2: Campeche, Veracruz y Tabasco.
Región 4: Guerrero y Oaxaca.
Región 5: Chiapas.
En la Figura 1.2, se representan las 32 entidades federativas, utilizando las dos
primeras componentes principales. Lo grupos que se forman corresponden a las re-
giones descritas anteriormente. Lo más evidente en esta representación, es la enorme
desigualdad que existe en los estados del sur-sureste, ya que los estados de Chiapas,
Guerrero y Oaxaca en un grado extremo, junto con Campeche, Veracruz y Tabasco
padecen rezagos importantes en términos de calidad de la vivienda; en contraste
con Nuevo León, Aguascalientes, Distrito Federal, Coahuila y Jalisco que cuentan
con los valores más altos del ı́ndice de calidad.

En la Figura 1.3, se observa la regionalización de las entidades federativas, ba-


sada en las 10 variables que describen la calidad de las viviendas. Se identifican las
entidades con caracterı́sticas similares en una misma región, y se distinguen entida-
des con caracterı́sticas distintas entre sı́, según el valor del ı́ndice.

7
Probabilidad, Estadı́stica y sus Aplicaciones

Figura 1.1: Índice de calidad de la vivienda en México.

Los resultados del ı́ndice de calidad que se obtuvieron, como lo mostraremos


en otros trabajos, se encuentra altamente relacionado con el ı́ndice de margina-
ción, niveles de escolaridad, analfabetismo, tasas de fecundidad y otras variables
sociodemográficas.

8
Probabilidad, Estadı́stica y sus Aplicaciones

1 Aguascalientes
2 Baja California
3 Baja California Sur
4 Campeche
5 Chiapas
6 Chihuahua
7 Coahuila de Zaragoza
8 Colima
9 Distrito Federal
10 Durango
11 Guanajuato
12 Guerrero
13 Hidalgo
14 Jalisco
15 México
16 Michoacán de Ocampo
17 Morelos
18 Nayarit
19 Nuevo León
20 Oaxaca
21 Puebla
22 Querétaro
23 Quintana Roo
24 San Luis Potosı́
25 Sinaloa
26 Sonora
27 Tabasco
28 Tamaulipas
29 Tlaxcala
30 Veracruz de Ignacio de la Llave
31 Yucatán
32 Zacatecas

Cuadro 1.3: Identificación de Entidad Federativa.

9
Probabilidad, Estadı́stica y sus Aplicaciones

Figura 1.2: Indicadores compuestos de las 32 entidades federativas.

Figura 1.3: Índice de calidad de las viviendas en México.

10
Probabilidad, Estadı́stica y sus Aplicaciones

1.5. Conclusión
Según los resultados obtenidos con la aplicación de la metodologı́a de CP, por
medio de la primera componente principal es posible describir la calidad de las vi-
viendas con un indicador que es combinación lineal de 10 variables. Las variables
originales que conforman este indicador, son las relacionadas con servicios hidrosa-
nitarios y material del suelo en la vivienda.

Con la regionalización del paı́s por medio del análisis de cúmulos, se identifican
desigualdades importantes en la calidad de las viviendas por regiones. La región más
desfavorecida es el sur (Oaxaca, Guerrero y Chiapas), seguida de otros tres estados
del sureste (Campeche, Tabasco y Veracruz). La primera de ellas con fuerte presen-
cia de población rural y tradicionalmente asociada con pobreza y atraso económico;
los otros tres estados, relacionados con el declive de la industria petrolera. En el caso
opuesto, las mejores condiciones de vivienda corresponden a las entidades donde se
localizan las tres principales zonas metropolitanas del paı́s, que son la Ciudad de
México, Guadalajara (Jalisco) y Monterrey (Nuevo León), ası́ como otras entidades
con dinámicos procesos de urbanización reciente y fuerte concentración económica
en la ciudad principal (Aguascalientes y Querétaro), ası́ como Coahuila.

Para disminuir la brecha entre las regiones más desarrolladas y las más desfavo-
recidas, es necesario tomar medidas para aumentar la calidad de las viviendas.
Es importante mencionar, que las 10 variables utilizadas en la regionalización y en
el análisis de componentes principales no son suficientes para describir la calidad
de la vivienda, ya que no reflejan la situación exacta del paı́s. Consideramos que
es necesario ampliar el número de variables que se relacionen con la calidad de la
vivienda, para hacer una evaluación más precisa del desarrollo regional, dadas las
implicaciones que pudo tener el sismo de 2017 en las entidades afectadas.

Por otra parte, sin embargo, una posible implicación de polı́tica que pudieran
tener los resultados del ejercicio de componentes principales aplicado, es que los
programas de mejoramiento y ampliación de vivienda que tienen a cargo los orga-
nismos nacionales de vivienda y el gobierno federal, que otorgan créditos y subsidios,
respectivamente, pudieran dirigirse al mejoramiento de los servicios hidrosanitarios
como una forma de mejorar la calidad de la vivienda, ya que actualmente los prime-
ros dan prioridad a la ampliación de las viviendas mediante la construcción de un
cuarto adicional. Con esta acción se complementarı́an las medidas que actualmente
se llevan a cabo para reducir el rezago habitacional prevaleciente, que es de carácter
cualitativo, más que cuantitativo.

11
Probabilidad, Estadı́stica y sus Aplicaciones

Bibliografı́a

[1] BBVA, México. Situación inmobiliaria, BBVA Research, julio, México, 2010.
[2] CONAFOVI, Rezago Habitacional, México, Consejo Nacional de Fomento a la
Vivienda, 2002.

[3] Diario Oficial de la Federación, Programa Nacional de Vivienda, 204-


2018, 30 de abril de 2014.
[4] Hair, J.F.; Anderson, R.E. y Tatham, R.L., Multivariate Data Analysis.
With Readings. New York: Mac Millan Publishing Co. 1987.

[5] Jolliffe, I.T., Principal Component Analysis, New York: Springer-Verlag,


2002.
[6] Sociedad Hipotecaria Federal, Rezago habitacional en México 2012, 2013.
[7] SPSS Advanced Models 9.0, Chicago IL, E.U., 1999.

12
Probabilidad, Estadı́stica y sus Aplicaciones

Capı́tulo 2
Uso del condón de los adolescentes según las caracterı́sticas de la pareja sexual

Catherine Menkes Bancet, Itzel A. Sosa Sánchez y Leopoldo Núñez

Centro Regional de Investigaciones Multidisciplinarias,


Universidad Nacional Autónoma de México,
Av. universidad s/n, Circuito 2, Col. Chamilpa,
Ciudad Universitaria de la UAEM, Cuernavaca Morelos,
C.P. 62210, México.
[email protected]

Resumen. El objetivo principal del presente trabajo consiste en identificar


en las/los estudiantes de 14 a 19 años de edad con inicio de vida sexual, las carac-
terı́sticas de la pareja sexual que se asocian con un mayor uso del condón masculino.
Se analizan las caracterı́sticas socio-demográficas de los estudiantes y se establecen
comparaciones entre sexos y entre las distintas entidades federativas a través de
análisis bivariados. Para conocer los factores que se asocian con una mejor protec-
ción sexual se estiman modelos de regresión logı́stica. La variable dependiente es el
uso del condón masculino en la última relación sexual y las variables independientes
las constituyen las distintas caracterı́sticas de la pareja sexual. Los hallazgos mues-
tran claramente que para disminuir el riesgo de una relación sexual sin protección,
es de fundamental importancia lograr una mayor equidad de género, tanto en lo que
se refiere a la edad de ambos adolescentes que se encuentran en pareja, como en el
balance del poder en distintos temas relacionados con la sexualidad.

Abstract. The main objective of the present study is to identify which characte-
ristics of sexual partners increase the likelihoods of condom use in the case of 14 to
19 year old students who have begun their sexual life.
We analyze the relevant sociodemographic characteristics of the students and we
establish several comparisons between the genders and between the different fede-
ral entities where they live through bivariate analysis. In order to understand the
factors which tend to increase sexual protection among the mentioned group, we
use models of logistic regression. The dependent variable is male condom use during
their last sexual relation and the independent variables are the different characte-
ristics of sexual partners.
Results show that more gender equity tends to decrease the likelihood of condomless
sexual relations occurring in the case of the studied group. This applies to dispa-
rities between their respective ages as much as to power imbalances associated to
different sexual-related topics.

13
Probabilidad, Estadı́stica y sus Aplicaciones

Palabras clave: Adolescentes, pareja sexual, protección sexual, regresión logı́sti-


ca.

2.1. Introducción
El embarazo adolescente en México es un problema importante no sólo de salud
sexual y reproductiva sino de derechos sexuales, reproductivos y humanos y ha ad-
quirido mayor visibilidad en las últimas décadas.
Al respecto, diversos estudios han señalado que el embarazo en edades tempranas
puede limitar las opciones de desarrollo personal de los adolescentes en determina-
dos contextos socioculturales [1]. Para el caso mexicano las estimaciones sugieren
que las gestaciones de las adolescentes de 15 a 19 años, constituyeron 17.5 % de la
tasa de embarazo del total de mujeres de 15 a 49 años en 2013, además, a partir
de las encuestas nacionales, se ha observado un ligero aumento en los últimos años,
ya que la tasa especı́fica de 15 a 19 años pasó de 68 a 85 embarazos por cada mil
mujeres, entre 2005 y 2013 [2].

La sexualidad adolescente también ha adquirido mayor visibilidad en la agenda


académica y polı́tica, debido al reciente incremento de las infecciones de trans-
misión sexual (ITS) en esta población. Por ejemplo, en la población adolescente
mexicana de 10 a 19 años de edad se reportaron 3,622 casos acumulados de SIDA
entre 1983-2013 (66.8 % corresponden a los varones y 33.2 % a mujeres) de un total
de 167,933 casos, obteniendo una prevalencia de 2.2 % en este grupo etario [3].

Si bien la prevalencia del preservativo masculino en los adolescentes y jóvenes en


general, ha aumentado de manera muy importante en las últimas décadas, los estu-
dios demográficos y sociológicos han enfatizado en el uso reducido de anticonceptivos
entre los adolescentes si se compara con otros grupos de edad, al tiempo que la de-
manda insatisfecha de anticonceptivos en esta población continúa siendo elevada,
en particular en lo que concierne al sexo femenino [4].

Cabe mencionar, que diversos estudios en el tema, han dado origen a una reflexión
en torno a los vı́nculos entre las relaciones y desigualdades de género y los compor-
tamientos y actitudes frente a la salud y a la sexualidad. Desde esta perspectiva,
se han propuesto algunas dimensiones analı́ticas para profundizar en el estudio de
la forma en que la construcción de las identidades y relaciones de género y las de-
sigualdades de acceso al poder se constituyen como un factor de riesgo en torno a
la salud y a la sexualidad tanto para las mujeres como para los hombres a partir de
distintos mecanismos: la construcción simbólica del cuerpo, la asignación genérica
del concepto de cuidado, la relación entre la afirmación de la identidad de género,
el comportamiento sexual y las decisiones sobre reproducción [5].

Ası́, más allá de la inestabilidad en las parejas sexuales de los adolescentes, las
evidencias empı́ricas han enfatizado en el importante rol que juegan las desigual-
dades de género y poder (que se intersectan e interactúan con otras desigualdades
sociales como la clase social, la edad, la etnia, etc.). Estas desigualdades dificultan
las negociaciones en torno al uso de métodos anticonceptivos y condón en esta po-

14
Probabilidad, Estadı́stica y sus Aplicaciones

blación, e incrementan los riesgos de contraer enfermedades de transmisión sexual


ası́ como la ocurrencia de embarazos no planeados [6].

Paralelamente, la información reciente en relación al uso del condón sugiere que


a pesar de un significativo incremento en su uso, es también evidente que no se ha
logrado erradicar los significados que lo asocian con la falta de amor y la desconfian-
za y la incomodidad [7]. Bajo esta lı́nea estudios algunos autores han estudiado [8]
cómo los significados (sociales y simbólicos) en torno al condón entran en conflicto
con los discursos del amor, en los cuales se enfatiza la confianza y el compromiso
mutuos. Lo que es más, el uso del mismo, tiende a limitarse cuando en la ‘definición
de la situación se considera pertinente su uso, lo que generalmente tiende a vin-
cularse con relaciones sexuales ocasionales, “no estables”, cuando se conoce poco
(o no se conoce) al compañero/a sexual [9]. También se ha sugerido el importante
rol de los condicionantes de género tanto en las definiciones sociales sobre el riesgo
como en las negociaciones en torno a bajo qué circunstancias ocurren los encuentros
sexuales. A diferencia de otros métodos anticonceptivos, el uso de condón implica la
necesidad de establecer negociaciones entre las personas involucradas, donde éstas
puedan expresar bajo qué circunstancias desean que se den los encuentros sexuales.
Esto se torna problemático en el ámbito de la sexualidad, en contextos donde la
maternidad, la ausencia de deseo y de experiencia erótico-sexual en las mujeres son
altamente valorados y se convierten en atributo del ser mujer [10].

Respecto a los hombres, se ha sugerido que los varones se enfrentan a presiones


para tener múltiples parejas, a tener éxito con las mujeres para afirmar su virilidad
y a no ser pasivos en las relaciones sexuales [11]. Estos estereotipos de sexualidad
masculina y femenina repercuten en la valoración social diferenciada otorgada a la
actividad sexual premarital y en un doble estándar sexual donde la sexualidad feme-
nina continua estando dirigida hacia fines esencialmente reproductivos y en donde
moral judeocristiana (y la religión católica) juegan un rol central.

Por lo dicho anteriormente, uno de los ejes fundamentales para tratar de en-
tender las prácticas sexuales y reproductivas de los adolescentes, lo constituye la
perspectiva de género, y las desigualdades en particular con la pareja sexual.

Al respecto, varios estudios han señalado que no basta con estudiar los com-
portamientos individuales, sino que la protección sexual de los adolescentes puede
estar en función de la pareja, en particular si existe un balance de poder desigual [12].

El objetivo principal del presente trabajo consiste en identificar qué caracterı́sti-


cas de la pareja sexual se asocian con un mayor uso del condón masculino en los
adolescentes.

15
Probabilidad, Estadı́stica y sus Aplicaciones

2.2. Metodologı́a
Todos los datos que presentamos provienen de la Encuesta sobre Noviazgo, Em-
poderamiento y Salud Sexual y Reproductiva en Adolescentes Estudiantes de Pre-
paratoria en México (ENESSAEP) efectuada en el año 2014 por el Centro Regional
de Investigaciones Multidisciplinarias de la UNAM. La encuesta es representativa
de los estudiantes que acuden a escuelas públicas y privadas de Puebla, Jalisco y
Morelos. Nuestra unidad de análisis lo constituyen los estudiantes de 14 a 19 años
que declararon haber tenido novia/o, free, amiga/o con derechos o pareja en los
últimos 12 meses y que tuvieron relaciones sexuales con su pareja actual.

En primer lugar se presentan algunas caracterı́sticas socio-demográficas de la pare-


ja sexual según el sexo del estudiante y después según la entidad federativa. Para
ver si hay diferencias entre hombres y mujeres o según la entidad donde reside el
estudiante, se utiliza la prueba de Chi-cuadrado.

Posteriormente, para conocer la asociación de la protección sexual con las carac-


terı́sticas de la relación con la pareja sexual, estimamos modelos de regresión logı́sti-
ca múltiple tomando como variable dependiente el uso del condón masculino en la
última relación sexual y como variables independientes el ı́ndice de balance de poder
con la última pareja actual, el abuso sexual y la diferencia de edad con la pareja.
A continuación describimos como construimos las distintas variables e ı́ndices:
Uso del preservativo masculino con la pareja actual:
La construcción de la variable dependiente uso del condón en la última relación
sexual se hizo utilizando las siguientes preguntas:
1. ¿Utilizaste algún método anticonceptivo en tu última relación sexual?,
2. ¿Qué método anticonceptivo usaron en la última relación sexual?.
Se asignó el valor de 0 cuando respondieron que no habı́an utilizado algún méto-
do anticonceptivo o habı́an utilizado un método anticonceptivo diferente al condón
masculino. Se asignó el valor de 1 cuando respondieron haber usado el condón o
preservativo en su última relación sexual.

Índice sobre balance de poder en la sexualidad con la pareja actual:


Para tratar de evaluar el balance de poder con la pareja se incorporaron distintas
caracterı́sticas relacionadas con las relaciones sexuales que tuvieron los estudiantes
con su pareja actual y se construyó un ı́ndice aditivo. Las caracterı́sticas que se
consideraron fueron las siguientes:
1. ¿Esperas a que tu pareja inicie el acercamiento sexual, como por ejemplo
acariciar tu cuerpo?,
2. ¿Tiene relaciones sexuales siempre que tu pareja lo desea, incluso si tú no
quieres?,
3. ¿Tomas la iniciativa cuando desea tener relaciones sexuales con tu pareja?,
4. ¿Le has dicho tu pareja que no toque los genitales u otras partes ı́ntimas
cuando no lo deseas o te hace sentir incómodo/a?,

16
Probabilidad, Estadı́stica y sus Aplicaciones

5. ¿Tienes relaciones sexuales sin protección porque tu pareja prefiere no usar-


los?,
6. ¿Te aseguras de comprar los condones?
7. ¿Te sientes seguro/a y en control durante las relaciones sexuales?.
En el caso de las preguntas 1,2, y 5, cuando las respuestas de los estudiantes fueron
nunca, a veces o la mitad de las veces se consideraron como desbalance del poder
(en la sexualidad) y se le asignó el valor de 0. Cuando las respuestas fueron casi
siempre o casi nunca se consideró como balance del poder asignándole el valor de 1.

En el caso de las preguntas 3, 4, 6 y 7, cuando las respuestas de los estudiantes fue-


ron nunca, a veces o la mitad de las veces se consideraron como balance del poder
y se le asignó el valor de 1. Cuando las respuestas fueron casi siempre o casi nunca
se consideró como no desbalance del poder y se le asignó el valor de 0.

Para establecer el ı́ndice se sumaron todos los valores de las distintas preguntas, y
se dividió el ı́ndice en balance de poder y desbalance del poder. Para la recodifica-
ción de la variable se tomó como punto de corte a la mediana, ası́ el 57.9 % fueron
clasificados como balance del poder y el 42.1 % como desbalance del poder.

Abuso sexual del novio/de la novia o pareja:


Para construir esta variable se utilizaron las siguientes preguntas del cuestionario:
1. ¿Alguno se ha aprovechado (con alcohol o drogas) para tener relaciones se-
xuales con el otro?,
2. ¿Alguno ha forzado al otro a tener relaciones orales o anales?,
3. ¿Alguno ha hecho uso de la fuerza para tener relaciones sexuales con el otro?.
Si en cualquiera de las contestaciones el/la estudiante respondió que pocas veces o
muchas veces se consideró que sı́ hubo abuso sexual y si contestó en las tres pre-
guntas que nunca se clasificó como no hubo abuso sexual.

Diferencia de edad con la pareja:


Para construir esta variable restamos la edad del estudiante al momento de la en-
cuesta menos la edad de la pareja actual. Esta variable se clasificó en: 1) Misma
edad o menor edad que la pareja actual, 2) Mayor de dos años que la edad de la
pareja actual, y 3) Tres años y más que la pareja actual.

2.3. Resultados
2.3.1. Caracterı́sticas socio-demográficas de los estudiantes y
de la pareja actual según el sexo. Análisis bivariado
Al observar las caracterı́sticas socio-demográficas de los estudiantes iniciados
sexualmente y cuya última relación sexual fue con la pareja actual según el sexo
de los estudiantes de preparatoria, vemos que la mayorı́a tiene entre 16 y 17 años

17
Probabilidad, Estadı́stica y sus Aplicaciones

(56.7 %), 23.1 % tiene 18 0 19 años, y el resto se encuentra en el grupo de edad


de 14 a 15 años (Ver cuadro 2.1). Respecto a la edad se puede decir también, que
no se encontraron diferencias estadı́sticamente significativas entre varones y mujeres.

Por el contrario, al estudiar la edad a la primera relación sexual, sı́ se observan


variaciones muy importantes entre sexos. Ası́, el 37.5 % de los varones declaró ha-
berse iniciado sexualmente antes de cumplir los 15 años, mientras que el porcentaje
correspondiente de las mujeres es de 19.2 %.

Respecto a las diferencias de edad con la pareja sexual, se observa una enorme bre-
cha entre hombres y mujeres. Ası́, mientras que el 70.3 % de los estudiantes varones
reportó tener una diferencia de edad de 3 años o más con su pareja, únicamente el
28 % de las mujeres se encontraban en esta situación. Por el contrario, el 37 % del
sexo femenino y únicamente el 8.1 % de los varones reportaron tener la misma edad
o una edad menor a su pareja sexual.

Si analizamos el balance de poder en la pareja, vemos que no existen diferencias


estadı́sticamente significativas entre hombres y mujeres, ya que cerca del 40 % tuvo
un balance de poder desigual y el resto un balance de poder más equitativo.

En el abuso de poder sı́ se observan diferencias entre sexos, de hecho un mayor


número de varones (9 %) declaró haber sido abusados sexualmente respecto a las
mujeres (5.7 %).

Finalmente, también hay un uso diferenciado por sexo en el uso del condón en la
última relación sexual, ya que mientras que el 34.4 % de los varones NO uso un pre-
servativo, este porcentaje aumenta a 45.9 % en el caso de las mujeres(Ver Cuadro
2.1).

Ası́, los datos refuerzan los hallazgos encontrados tradicionalmente, en que se mues-
tra que los varones tienden a iniciarse sexualmente antes que las mujeres, por los
mandatos de género que presionan a los varones a probar su virilidad teniendo
relaciones sexuales siempre que sea posible, mientras que el ideal femenino tradi-
cional justifica las relaciones sexuales de las mujeres, únicamente a través del amor
romántico o bien al interior de la unión o matrimonio.

Un dato que llama la atención, es que los varones reportan mayor abuso sexual que
las mujeres. Habrı́a que seguir investigando en futuros estudios, qué está sucediendo
con esta población.

18
Probabilidad, Estadı́stica y sus Aplicaciones

Caracterı́sticas sociodemográficas de los estudiantes que tuvieron su última relación sexual los
últimos 12 meses con la pareja actual según sexo
Sexo Total Grado de significancia según
Hombre Mujer (N=2557) pruebas χ2 de Pearson
Grupos de edad 18-19 24.1 % 22.2 % 23.1 %
16-17 55.4 % 57.7 % 56.7 %
14-15 20.5 % 20.1 % 20.3 % p = 0.180
Grupos de edad a la 17-19 10.5 % 16.9 % 14.0 %
primera rel. sexual 15-16 52.0 % 63.9 % 58.4 %
≤14 37.5 % 19.2 % 27.7 % p = 0.000
Diferencia de edad menor o igual 8.1 % 37.0 % 23.6 %
con la pareja 1-2 años 21.6 % 34.9 % 28.7 %
mayor o igual a 3 70.3 % 28.0 % 47.6 % p = 0.000
Índice balance de más equitativo 59.5 % 61.1 % 60.4 %
poder desigual 40.5 % 38.9 % 39.6 % p = 0.393
Abuso sexual Sı́ 9.0 % 5.7 % 7.3 %
No 91.0 % 94.3 % 92.7 % p = 0.000
Usó condón en Sı́ 65.6 % 54.1 % 59.4 %
la última rel. No 34.4 % 45.9 % 40.6 % p = 0.000

Cuadro 2.1: Caracterı́sticas socio-demográficas de los estudiantes que tuvieron su


última relación sexual los últimos 12 meses con la pareja actual.

2.3.2. Caracterı́sticas socio-demográficas de los estudiantes y


de la pareja actual según la entidad federativa. Análisis
bivariado
Las caracterı́sticas socio-demográficas también varı́an por entidad federativa.
Por ejemplo, si analizamos el grupo de edad al que pertenecen los estudiantes ini-
ciados sexualmente que tuvieron una última relación sexual con su pareja actual,
vemos que en Morelos los estudiantes son de mayor edad en general, en segundo
lugar Jalisco y en último lugar Puebla.

Respecto a la edad a la primera relación sexual, se observa la misma tendencia que


en los grupos de edad, ya que en Jalisco (29.5 %) y Puebla (29.6 %) un porcentaje
mayor que en Morelos se inició a los 14 años o menos (19.5 %).

Respecto a la diferencia de edad con la pareja actual, también encontramos diferen-


cias estadı́sticamente significativas. Resalta el caso de Puebla, en que un porcentaje
muy significativo de estudiantes declaró que su pareja tenı́a 3 o más años de dife-
rencia en la edad con su pareja.

Por el contrario, ni en el abuso sexual, ni en el balance de poder, ni en el uso del


preservativo encontramos diferencias significativas entre las tres entidades federati-
vas consideradas (ver Cuadro 2.2).

Ası́, se puede concluir al comparar las caracterı́sticas socio-demográficas según las


entidades federativas, que las brechas se observan particularmente en lo que se refiere
a la edad en que tuvieron su primera relación sexual y a la diferencia de edad con
la pareja actual.

19
Probabilidad, Estadı́stica y sus Aplicaciones

Caracterı́sticas sociodemográficas de los estudiantes que tuvieron su última relación sexual los
últimos 12 meses con la pareja actual según entidad federativa
Entidad federativa Grado de significancia según
Morelos Jalisco Puebla pruebas χ2 de Pearson
Grupos de edad 18-19 40.4 % 22.2 % 14.6 %
16-17 53.3 % 56.9 % 58.2 %
14-15 6.3 % 20.9 % 27.2 % p = 0.000
Grupos de edad a la 17-19 27.3 % 11.1 % 10.7 %
primera rel. sexual 15-16 53.2 % 59.4 % 59.8 %
≤14 19.5 % 29.5 % 29.6 % p = 0.000
Diferencia de edad menor o igual 24.3 % 25.8 % 19.8 %
con la pareja 1-2 años 30.5 % 29.6 % 26.5 %
mayor o igual a 3 45.1 % 44.6 % 53.7 % p = 0.002
Índice balance de más equitativo 58.5 % 63.3 % 56.8 %
poder desigual 41.5 % 36.7 % 43.2 % p = 0.483
Abuso sexual Sı́ 6.2 % 7.1 % 8.1 %
No 93.8 % 92.9 % 91.9 % p = 0.097
Usó condón en Sı́ 57.2 % 62.6 % 55.7 %
la última rel. No 42.8 % 37.4 % 44.3 % p = 0.079

Cuadro 2.2: Caracterı́sticas socio-demográficas de los estudiantes que tuvieron su


última relación sexual los últimos 12 meses con la pareja actual según entidades
federativas.

2.3.3. Uso del condón según distintas caracterı́sticas de la


pareja por sexo del estudiante. Análisis bi-variado
La protección sexual a través del preservativo masculino es diferencial según el
sexo del estudiante y las distintas caracterı́sticas que se relacionan con la esfera de
la pareja.

Ası́, se puede ver que la prevalencia del preservativo masculino disminuye consi-
derablemente si hubo abuso sexual. En el caso de los varones se reduce el uso de
66.8 % a 56.2 %, y en el caso de las mujeres de 54.9 % a 43.1 %. Cabe mencionar
que mientras que en caso de los varones se observa una relación estadı́sticamente
significativa (p=.000), en el caso del sexo femenino hay una relación marginalmente
significativa (p=.083).

Paralelamente, el uso aumenta de manera muy importante cuando hay un balance


de poder más equitativo en la pareja si se compara con un balance de poder de-
sigual; sube de 48.1 % a 78.6 % en los varones (p=000), y de 41.7 % a 62.8 % en las
mujeres (p=.000).

En el caso de la diferencia de edad con la pareja, las diferencias no son estadı́stica-


mente significativas si se analizan ambos sexos por separado (Ver Cuadro 2.3).

20
Probabilidad, Estadı́stica y sus Aplicaciones

Porcentaje de estudiantes que SÍ usaron condón en la última relación sexual con la pareja
actual según sexo
Esfera de la pareja Hombres Grado de significancia según Mujeres Grado de significancia según
pruebas χ2 Pearson pruebas χ2 Pearson
Abuso de la pareja sexual
Sı́ 56.2 % 0.001 43.1 % 0.083
No 66.8 % 54.9 %
Diferencia de edad con la pareja
Misma edad o menor 57.8 % 0.904 52 % 0.144
1-2 años 65.0 % 51.9 %
3 o mayor 67.4 % 59.7 %
Balance de poder entre los sexos
Equitativo 78.6 % 0.000 62.8 % 0.000
Desigual 48.1 % 41.7 %

Cuadro 2.3: Porcentaje de estudiantes que sı́ usaron el condón en la última relación
con la pareja actual por sexo.

2.3.4. Factores asociados al uso del condón según las carac-


terı́sticas de la pareja actual. Modelos de regresión
logı́stica
Los factores asociados al uso del condón en la última relación sexual tomando
en cuenta las caracterı́sticas de la pareja actual, son la diferencia de edad con la
pareja y en particular el balance de poder entre los sexos en el terreno sexual. Ası́,
según el modelo de regresión logı́stica multivariado, se muestra que, en el caso de
todos los estudiantes hombres y mujeres en su conjunto, si la pareja es de la misma
edad o es menor, aumenta en 84 % la posibilidad de la prevalencia del preservativo
masculino si se compara con las parejas con diferencias de edad de tres años o más
(p=0.004).

Asimismo, se multiplica 2.8 veces la posibilidad de que los estudiantes utilicen un


condón masculino si existe un balance equitativo de poder en la pareja en la se-
xualidad (p=0.000). La única caracterı́stica de la esfera de la pareja que no mostró
una relación estadı́sticamente significativa con el uso del condón, fue el haber sido
abusado sexualmente por el/la novio/a o el/la ex-novio/a; es posible que esto se
deba al limitado número de casos de los que declararon ser abusados sexualmente
(Ver Cuadro 2.4).

Si observamos los condicionantes asociadas al uso del condón diferenciando según el


sexo del estudiante, vemos que se eleva aún más la probabilidad de uso cuando hay
una relación más equitativa en el balance de poder en el terreno de la sexualidad
en los varones, ya que la razón de momios se eleva a 3.49 (p=.000). La influencia de
un balance de poder más equitativo en la pareja, aunque menor que en los varones,
sigue siendo muy importante en el caso de las mujeres, ya que se multiplica en 2.3
veces la posibilidad de la protección sexual cuando la relación en el terreno de la
sexualidad es más equitativa en la pareja.

De hecho, en el caso de los varones, la única variable que resultó ser estadı́sticamen-
te significativa según el modelo de regresión logı́stico fue el balance de poder con
la pareja; en cuanto al sexo femenino, además del balance de poder, también hay

21
Probabilidad, Estadı́stica y sus Aplicaciones

mayor uso cuando la pareja tiene la misma edad o es menor ya que la probabilidad
de uso del condón aumenta en 32 % (p=.049).

Ası́, los datos muestran claramente que las caracterı́sticas de la pareja son determi-
nantes para lograr una mejor protección sexual, en particular en lo que se refiere a
un poder más equitativo en la pareja (Ver Cuadro 2.4).

Factores asociados al uso del condón según las caracterı́sticas de la pareja sexual por sexo
Uso de condon el la última relación sexual
Hombres Mujeres Total
Razones de Razones de Razones de
Caracterı́sticas momios P >t momios P >t momios P >t
Balance de Poder (en la sexualidad)
No 1.00 1.00 1
Sı́ 3.49 0.000 2.35 0.000 2.81 0.000
Abuso sexual del novio o ex-novio
Sı́ 1 1 1
No 1.47 0.062 1.25 0.317 1.25 0.415
Diferencia de edad con la pareja
Tres años y más 1.00 1
Mayor hasta 2 años 0.92 0.773 1.23 0.112 1.17 0.495
Misma edad o menor 0.98 0.950 1.32 0.049 1.84 0.004

Cuadro 2.4: Factores asociados al uso del condón según las caracterı́sticas de la
pareja sexual por sexo.

2.4. Conclusiones
Ası́, los hallazgos relacionados con la pareja sexual de los adolescentes muestran
claramente que es de fundamental importancia lograr una mayor equidad de género
en las prácticas sexuales, tanto en lo que se refiere a la edad de ambos adolescentes
que se encuentran en pareja, como en el balance del poder en distintos temas re-
lacionados con la sexualidad para disminuir las prácticas de riesgo en esta población.

Esto significa reconocer que el sexo protegido involucra complejos procesos de ne-
gociación sexual, que requieren un grado de comunicación abierta sobre el propio
deseo, lo cual no es fácilmente accesible en sociedades como la mexicana donde las
relaciones heterosexuales están frecuentemente marcadas por las desigualdades de
género y poder.

Igualmente, es importante tener en cuenta que las prácticas de sexo protegido y la


prevención de embarazos dependen no sólo de elecciones individuales, sino también
de sistemas más amplios, que involucran además de las caracterı́sticas individuales,
las relaciones con la pareja como también significados morales y coacciones sociales.

22
Probabilidad, Estadı́stica y sus Aplicaciones

Bibliografı́a

[1] Juárez, F.; Singh, S.; Maddow-Zimet, I; Wulf, D. Embarazo no planeado


y aborto Inducido en México: causas y consecuencias. Nueva York: Guttmacher
Institute, 45 pp. 2013.
[2] Menkes, Catherine: “Opciones de vida de la juventud y reproducción tempra-
na en México”. Ponencia presentada en la plenaria: La reproducción temprana
y las opciones de vida de la juventud en la XIII Reunión Nacional de Investiga-
ción Demográfica en México. Dinámicas de población y desigualdad, Sociedad
Mexicana de Demografı́a, 2016.
[3] SSA/CENSIDA. Vigilancia Epidemiológica de casos de VIH/SIDA en
México. Registro Nacional de casos de SIDA. Actualización al cierre de
2013. México: Dirección General de Epidemiologı́a/Secretarı́a de Salud y
Centro Nacional para la prevención y el Control VIH/SIDA. Recupera-
do desde: http://www.censida.salud.gob.mx/descargas/epidemiologia/
RN_CIERRE_2013.pdf
[4] Juárez, F.; Palma, JL; Singh, S.; Bankole, A.: Las necesidades de sa-
lud sexual y reproductiva de las adolescentes en México: Retos y oportunidades.
Nueva York: Guttmacher Institute, 35pp. 2010.
[5] Sosa-Sánchez, Itzel. Los Significados de la Salud y la Sexualidad en Jóve-
nes. Un Estudio de Caso en Escuelas Públicas en Cuernavaca. México, DF:
INMUJERES, 2010.
[6] Gayet, Cecilia; Juárez, Fátima; Pedrosa, Laura A. y Magis, Carlos:
Uso del condón entre adolescentes mexicanos para la prevención de las infeccio-
nes de transmisión sexual. Salud Pública de México, Vol. 45(sup. 5): 632-640,
2003.
[7] Sosa-Sánchez, Itzel: Significados del cuerpo y del riesgo en el marco de la
sexualidad y de la reproducción: un estudio de caso con jóvenes en Cuernavaca,
Tesis de Maestrı́a. FLACSO-CLACSO: Buenos Aires, 2010.
[8] Warr, Deborah: The Importance of Love and Understanding Speculation on
Romance in Safe Sex Health. Women's Studies International Forum, vol. 24, No.
2, pp.241 - 252, 2001.
[9] Szasz, Ivonne: Sexualidad y género: algunas experiencias de investigación en
México. Debate feminista, Año 9, vol. 18, Octubre, México pp. 77-104, 1998.

23
Probabilidad, Estadı́stica y sus Aplicaciones

[10] Lamas, Marta: Maternidad y violencia simbólica. URIBER y BILLINGS D.


Violencia sobre la salud de las mujeres. México FEMEGO,-IPAS, pp. 114-121,
2003.
[11] Amuchástegui, Ana: Ética deseo y masculinidad: la difı́cil relación entre lo
sexual y lo reproductivo. En A. Amuchástegui e I. Szasz: Sucede que me canso
de ser hombre. Relatos y reflexiones sobre hombres y masculinidades en México.
Colmex: México, 2007.
[12] Casique, I: Dimensiones entrelazadas: empoderamiento y actitudes de los ado-
lescentes mexicanos respecto al uso del condón masculino. Revista Latinoameri-
cana de Población, 10(19): 149-168, 2016.

24
Probabilidad, Estadı́stica y sus Aplicaciones

Capı́tulo 3
Una caracterización de la satisfacción estudiantil mediante análisis de clases
latentes.

Ramón Álvarez-Vaz y Elena Vernazza

Universidad de la República,
Facultad de Ciencias Económicas y de Administración,
Departamento de Métodos Cantitativos,
Instituto de Estadı́stica,
Eduardo Acevedo 1139, Cordón,
C.P. 11200, Montevideo, Uruguay,
[email protected], [email protected]
Resumen. En este trabajo se estudian las principales caracterı́sticas de la cons-
trucción de la Satisfacción Estudiantil en los cursos de grado de la Facultad de
Ciencias Económicas y de Administración, Universidad de la República, Uruguay,
mediante Análisis de Clases Latentes (ACL). Los datos utilizados para la aplicación
presentada en este trabajo provienen de una encuesta aplicada sobre una muestra de
estudiantes de grado de la Facultad, en el año 2009. Dicho cuestionario presenta una
estructura de bloques: por un lado (primer bloque) se encuentran las variables que
permitirán realizar una caracterización sociodemográfica de los estudiantes y por
otro se presentan las variables del modelo ECSI (European Customer Satisfaction
Index) que serán las utilizadas para la caracterización de la Satisfacción Estudiantil.
Las variables manifiestas consideradas como insumo para la construcción y carac-
terización de la Satisfacción Estudiantil son las siguientes 6: expectativas (E) de
los estudiantes al ingresar al centro de estudios, la imagen (I) que tienen de éste,
la calidad de la enseñanza recibida (CSA) y de los servicios brindados (CSF), las
necesidades y deseos personales con respecto a la facultad (ND) y el valor percibido
(VP). Los resultados presentados surgen de considerar que efectivamente existe una
variable que refiere a la Satisfacción Estudiantil y que ésta queda definida, a partir
de la interacción de las 6 variables manifiestas, por 4 clases latentes.

Palabras clave: Caracterización, Clases Latentes, Estudiantes Universitarios,


Satisfacción.

25
Probabilidad, Estadı́stica y sus Aplicaciones

Abstract. This paper studies the main characteristics of the construction of Stu-
dent Satisfaction in the undergraduate courses of the Facultad de Ciencias Económi-
cas y de Administración, Universidad de la República, Uruguay, through Analysis
of Latent Classes (LCA). The data used for the application presented in this paper
comes from a survey applied to a sample of undergraduate students of the Facul-
tad, in 2009. This questionnaire presents a structure with several blocks: on the
one hand (first block) are the variables that will allow a sociodemographic charac-
terization of the students and, on the other hand, the variables of the ECSI model
(European Customer Satisfaction Index) that will be used for the characterization
of the Student Satisfaction. The variables used are the next 6: expectations of the
incoming students (E), the image that students have about courses (I), the received
teaching quality (CSA) and services provided (CSF), the needs and personal desires
about the Facultad (ND), and the perceived value (VP).The results presented arise
from considering that there is indeed an unobserved variable that refers to Student
Satisfaction, defined from the interaction of the 6 manifest variables, by four latent
classes.

Keywords: Characterization, Latent Class, Undergraduate Students, Satisfac-


tion.

3.1. Introducción
Conocer el nivel de satisfacción de los clientes, con un determinado servicio que
se les brinda resulta fundamental como insumo en la toma de decisiones que tengan
como objetivo primordial mantener o mejorar, en caso de que sea necesario, aquellos
aspectos que se entiende determinan la Satisfacción.
Vinculando esta idea con la educación universitaria, se toma lo propuesto por
Alves y Raposo [6], quienes plantean: “Sólo con la satisfacción de los alumnos se
podrá alcanzar el éxito escolar, la permanencia de los estudiantes en la institución
y, sobre todo, la formación de una valoración positiva boca a boca. En este sentido,
es extremamente importante encontrar formas fiables de medir la satisfacción del
alumno en la enseñanza universitaria, permitiendo ası́ a las instituciones de enseñan-
za conocer su realidad, compararla con la de los otros competidores y analizarla a
lo largo del tiempo”.
En este trabajo se considera a los estudiantes universitarios que concurren a la
Facultad de Ciencias Económicas y Administración (FCEA) de la Universidad de
la República, como “clientes” y se determina que el “servicio” que se les brinda es
el de la educación de nivel terciario.
La información necesaria para poder establecer cómo se construye el concepto
de Satisfacción, se obtiene a través de la aplicación de un cuestionario formado por
apartados de preguntas que conforman el modelo ECSI (European Customer Satis-
faction Index). Sobre este instrumento, y a través del Análisis de Clases Latentes,
se analiza cómo se construye la Satisfacción Estudiantil [5],[21].
La estructura de este documento es la siguiente: en primera instancia se ha-
ce referencia a las caracterı́sticas generales de las técnica estadı́stica empleada. A
continuación se presenta una descripción de los datos, seguida de los principales
resultados obtenidos y por último, se plantean las principales conclusiones y pro-

26
Probabilidad, Estadı́stica y sus Aplicaciones

puestas de lı́neas de trabajo e investigaciones a futuro.

3.2. Metodologı́a
Generalmente, al trabajar con datos categóricos multivariados, resulta de interés
investigar eventuales fuentes de confusión entre las variables observadas, identifi-
car/caracterizar grupos de individuos y aproximar la distribución de las observacio-
nes a través de las variables en estudio [15]. Existe una técnica que contempla todas
estas situaciones: Análisis de Clases Latentes (ACL) o Modelos de Clases Latentes
(MCL) [1], [7], [11],[12], [14].

El ACL busca segmentar la tabla/hipercubo de contingencia creado a partir de


las variables observadas/manifiestas, por una variable no observada/latente, con la
siguiente caracterı́stica: se supone que las respuestas a todas las variables manifies-
tas son estadı́sticamente independientes con respecto a los valores de la variable
de clases latentes (independencia local o condicional ). De este manera el modelo
asocia, en términos de probabilidad, a cada individuo a una clase latente. Se puede
predeterminar, por lo tanto, el valor esperado con el que una observación responde
a cada variable manifiesta. Si bien el modelo estimado no estipula el número de
clases latentes, pueden usarse varios estadı́sticos de bondad de ajuste para evaluar
de forma tanto teórica como empı́rica la cantidad de clases a considerar.

Este método puede verse como un modelo de regresión y, por lo tanto, serı́a
posible incluir variables predictivas para la membresı́a de cada observación a una
clase latente [7].

Existen antecedentes de estudios con este tipo de variables en disciplinas como la


economı́a y la psicologı́a. En particular, en el trabajo “Segmentación de la población
española según su grado de concienciación ecológica mediante modelos de variables
latentes”, los autores presentan una segmentación de los hábitos de consumo en
función de su grado de concienciación ecológica mediante técnicas estadı́sticas de
ACL [19].

Por otra parte, en el trabajo “Modelos De Clases Latentes Para Definir Perfiles
Conductuales en Niños De 4 y 5 Años” [9] sus autores elaboran perfiles conductuales
en niños de 4 o 5 años de México aplicando ACL sobre los resultados del test de
screening “Child Behavior Check List” (CBCL).
En otras áreas de la salud como la epidemiologı́a, se presenta el trabajo “Análisis de
clases latentes en tablas poco ocupadas: consumo de alcohol, tabaco y otras drogas
en adolescentes” [8], en el que sus autores presentan una segmentación del tipo de
consumo de drogas en jóvenes de Costa Rica.

3.2.1. Definición del Modelo


Se considera un modelo en el que se observan J variables categóricas politómicas
(variables manifiestas) tal que cada una tiene Kj (j = 1 : J) posibles respuestas,
para los i = 1, 2....N individuos.

27
Probabilidad, Estadı́stica y sus Aplicaciones

El modelo de clases latentes aproxima la distribución conjunta observada de las


variables manifiestas como la suma ponderada (por un número finito R) de las ta-
blas de clasificación cruzada.

Yijk será el valor observado de las J variables manifiestas para el individuo i, tal
que Yijk = 1 si el individuo i da la respuesta k de la variable j y Yijk = 0 en otro
caso, con j = 1....J y k = 1....Kj y πjrk representará la probabilidad condicional
de que una observación en la clase r = 1, ..., R produzca el k-ésimo resultado de la
variable j-ésima.
Dentro de cada clase, para cada variable manifiesta, se cumple:
Kj
X
πjrk = 1.
k

Por otra parte, pr corresponderı́a a las proporciones a partir de las cuales


serán
Pmaxgenerados los pesos para la suma ponderada de las tablas de clasificación
( r pr = 1). En este sentido, considerando que estos pr representan la probabi-
lidad incondicional de que un individuo pertenezca a una clase (antes de tomar en
cuenta el valor de Yijk ), pr será denominado probabilidad a priori de la membresı́a
a cada clase latente.

La probabilidad de que un individuo i en la clase r genere un conjunto J de


resultados en las variables manifiestas, asumiendo independencia condicional de los
resultados Y dado la pertenencia a una clase dada, es:
Kj
J Y
Y
f (Yi ; πr ) = (πjrk )Yijk . (3.1)
j=1 k=1

Además, la función de densidad es:


R Kj
J Y
X Y
P (Yi | π, p) = pr (πjrk )Yijk . (3.2)
r=1 j=1 k=1

De esta manera se tienen dos clases de parámetros a estimar por el modelo:


pr y πjrk . Dadas p̂r y π̂jrk , las probabilidades a posteriori de que cada individuo
pertenezca a una clase latente, condicionada a los valores observados de las variables
manifiestas, queda determinada:

p̂r f (Yi ; π̂r )


P̂ (ri | Yi ) = PR (3.3)
q=1 p̂q f (Yi ; π̂q )

con ri = 1, ..., R.

Se debe tener en cuenta que las π̂jrk son estimaciones de las probabilidades de
los resultados condicionales en la clase r. También es importante observar que el
número de parámetros independientes estimados aumenta rápidamente
P con R, J y
Kj . Dados estos valores, el número de parámetros a estimar es R j (Kj − 1) + (R −
1). Este último resultado puede producir una situación no deseada, ya que cuando

28
Probabilidad, Estadı́stica y sus Aplicaciones

este número excede el número total de observaciones, o una menos que el número
total de celdas en la tabla de clasificación cruzada de las variables manifiestas, el
modelo no puede ser identificado.

3.2.2. Estimación de parámetros


Los modelos de clase latente pueden estimarse mediante máxima verosimilitud,
donde la log-verosimilitud es:
N R Kj
J Y
X X Y
lnL = ln pr (πjrk )Yijk . (3.4)
1 1 j=1 k=1

Dicha verosimilitud será maximizada con respecto a pr y πjrk a través del al-
goritmo EM [10], [16]. Como con cualquier modelo de mezcla finita, el algoritmo
EM se puede aplicar en virtud de que la membresı́a a la clase de cada individuo es
desconocida, por lo que se trata como un problema de datos faltantes. El algoritmo
trabaja en forma iterativa en dos fases a partir de valores iniciales arbitrarios de p̂r
y π̂jrk , los que se etiquetan como p̂anterior
r
anterior
y π̂jrk .

1. En la fase de esperanza (E), se calcula la probabilidad de membresı́a a la


clase latente usando la ecuación (3.3), sustituyendo en los valores p̂anterior
r y
anterior
π̂jrk .
2. En la fase de maximización (M) los parámetros estimados se actualizan ma-
ximizando la log-verosimilitud dada la probabilidad a posteriori (P̂ (ri | Yi )).

La nueva probabilidad a priori, será:


N
1 X
p̂nueva
r = P̂ (ri | Yi ) (3.5)
N i=1

y la nueva probabilidad condicional será:


PN
nueva i=1 Yij P̂ (ri | Yi )
π̂jr = PN . (3.6)
i=1 P̂ (ri | Yi )
nueva
En la ecuación (3.6), π̂jr es el vector de longitud Kj de las probabilidades
condicionales para la j-ésima variable manifiesta; y por otra parte Yij es la matriz
N × Kj de resultados para Yijk para esa variable. Como todo proceso iterativo este
algoritmo repite las dos fases sustituyendo el valor viejo por el nuevo, hasta alcanzar
un máximo o hasta que el incremento que tiene la log-verosimilitud sea menor a un
cierto umbral previamente establecido.

Por último, cabe destacar que la aplicación de este método de estimación de-
pende de: los valores iniciales elegidos para p̂anterior
r
anterior
y π̂jrk y de la complejidad
del modelo que se estima, por lo que el algoritmo EM puede encontrar un máximo
local de la función log-verosimilitud, en lugar del máximo global deseado, con lo
cual es recomendable estimar más de una vez.

29
Probabilidad, Estadı́stica y sus Aplicaciones

3.2.3. Criterios de selección y validación del modelo


Tal como fuera mencionado previamente, la estimación a través de ACL no es-
tipula una cantidad de clases latentes, sin embargo una de las ventajas de esta
técnica, a diferencia de varias de las técnicas de clusterización más comúnmente
utilizadas, es la variedad de herramientas existentes para determinar dicha canti-
dad.
En algunos de los casos, el número de clases latentes a utilizar viene dado por la
teorı́a y en otros, por experiencias empı́ricas previas. Sin embargo, en la mayorı́a de
los casos será necesario realizar un análisis exploratorio que permita decidir la can-
tidad de clases latentes presentes en el problema en estudio. Este proceso comienza
presentando el modelo más general posible, es decir, un modelo con independencia
completa que determina una sola clase. Una vez estimado dicho modelo, el número
de clases se va incrementando de una en una hasta encontrar el modelo que resulte
el “modelo adecuado”.

Agregar una clase al modelo mejorará el ajuste, pero incorporará ruido y paráme-
tros a estimar, por lo que será necesario tener en consideración un criterio de par-
simonia que establezca un equilibrio entre la mejora del ajuste y la cantidad de
parámetros que se incorporan al aumentar una clase en el modelo. El criterio de
parsimonia utilizado en este trabajo será el del mı́nimo BIC (Bayesian information
criterion).

3.3. Resultados
En esta sección se presentan, en forma resumida, los datos con los que se trabajó,
describiendo el diseño muestral empleado y el cuestionario utilizado. Por último se
exponen los principales resultados del Análisis de Clases Latentes.

3.3.1. Diseño muestral


La aplicación que se presentará en este trabajo fue realizada sobre los datos ob-
tenidos mediante la aplicación de un cuestionario sobre una muestra de estudiantes
universitarios de la FCEA, en el año 2009.

La muestra fue seleccionada en base a un marco muestral que se construyó


a partir de las inscripciones a cursos de FCEA en dicho año. El diseño muestral
usado fue estratificado por conglomerados en dos etapas y la muestra finalmente
quedó conformada por estudiantes de 60 grupos prácticos (repartidos en forma
proporcional en 6 estratos, uno por cada año y otro especı́fico con asignaturas de la
Licenciatura en Administración).
Con la muestra seleccionada, se realizó el relevamiento de datos que culminó con
647 encuestas realizadas (tasa de cobertura de la muestra de 90 %).

3.3.2. Cuestionario utilizado


El cuestionario, aplicado sobre la muestra seleccionada, resulta de una adap-
tación del cuestionario utilizado por los investigadores Alves y Raposo de la Uni-

30
Probabilidad, Estadı́stica y sus Aplicaciones

versidad de Beira Interior (Portugal) [6]. Éste presenta la siguiente estructura: un


primer bloque, claramente diferenciado de los demás, que contiene una serie de va-
riables de carácter sociodemográfico, como sexo, edad y algunas otras variables que
caracterizan al estudiante dentro del ámbito de la facultad, como año de ingreso,
año y cantidad de materias en curso, entre otras. Los restantes ocho bloques de
preguntas (presentados como bloque A - H) presentan todos la misma estructura,
se plantea una pregunta general que determina la esencia del bloque y a partir de
ella, se establecen una serie de afirmaciones sobre las cuales el estudiante deberá
expresar su posición, utilizando una escala Likert que toma valores en el intervalo
[1 - 10], donde 1 indicará la mayor discrepancia con lo planteado en la pregunta y
10 el mayor acuerdo.

Los bloques A a H presentan las siguientes caracterı́sticas:

Bloque A - 12 afirmaciones referentes a las expectativas de los estudiantes,


previo ingreso a facultad.
Bloque B - 6 afirmaciones vinculadas a la imagen que tienen los estudiantes
sobre la facultad.

Bloque C - 9 afirmaciones asociadas a la calidad del servicio que brinda la


facultad.
Bloque D - 9 afirmaciones asociadas a la calidad de los servicios que brinda
la facultad con respecto a la biblioteca, bedelı́a y cafeterı́a, entre otros.

Bloque E - 9 afirmaciones (las mismas que el bloque C) asociadas a necesida-


des/deseos actuales.
Bloque F - 7 afirmaciones que indagan sobre el valor percibido.
Bloque G - 6 afirmaciones que refieren a la satisfacción de los estudiantes con
la facultad.

Bloque H - 5 afirmaciones que pueden dividirse en 2 subgrupos, las 3 prime-


ras referentes a la lealtad de los estudiantes con la facultad, y las 2 últimas
asociadas al boca a boca que se genera entre los estudiantes.
Las variables consideradas en este trabajo resultan de la agregación de los ı́tems
por Bloques: Expectativas (ER ), Imagen (IR ), Calidad de Servicios Académicos
(CSAR ), Calidad de Servicios Funcionales (CSFR ), Necesidades/Deseos (N DR ) y
Valor Percibido (V PR ).

3.3.3. Aplicación
La aplicación presentada en este trabajo, toma como insumo las puntuaciones
(categorizadas) de las seis variables del ECSI. éstas, y sus respectivas categorı́as,
son:
ER : Expectativas
Altas (> 90), Medias (81 : 90), Bajas (< 81)

31
Probabilidad, Estadı́stica y sus Aplicaciones

IR : Imagen
Alta (> 50), Media (41 : 50), Baja (< 41)
CSAR : Calidad de los Servicios Académicos
Alta (> 70), Media (61 : 70), Baja (< 61)
CSFR : Calidad de los Servicios Funcionales
Alta (> 65), Media (56 : 65), Baja (< 56)
N DR : Necesidades/Deseos
Alta (> 70), Media (61 : 70), Baja (< 61)
V PR : Valor Percibido
Alta (> 60), Media (51 : 60), Baja (< 51).
Simplificando la notación, la codificación utilizada será (para i = 1:6):

 3 Alto
Yi = 2 M edio
1 Bajo

Y = (ER , IR , CSAR , CSFR , N DR , V PR ).

En resumen, se tiene:
Tamaño de muestra: n = 470 (luego de depurar los datos y descartar obser-
vaciones con datos faltantes).
Una variable de clases latentes: Satisfacción estudiantil.
Seis variables (Yi ) manifiestas: p = 6.
Cada una de las variables manifiestas posee 3 categorı́as de respuestas posibles:
ki = 3 (para i = 1:6).
En el Cuadro 3.1 se presentan los seis patrones de respuesta más frecuentes (de
las 163 secuencias observadas), y sus respectivas frecuencias, para el caso de los 470
estudiantes en estudio. En dicha tabla se puede observar que los dos patrones más
frecuentes son los que representan los extremos: niveles altos de todas las variables
manifiestas y valores bajos en todas ellas, respectivamente.

Cuadro 3.1: Patrones de respuesta - Frecuencias observadas.


ER IR CSAR CSFR N DR V PR Frecuencia
3 3 3 3 3 3 48
1 1 1 1 1 1 45
2 2 2 3 2 2 17
1 2 1 1 1 1 11
3 3 3 3 3 2 11
3 2 3 3 3 2 10

32
Probabilidad, Estadı́stica y sus Aplicaciones

3.3.4. Estimación del modelo


Los modelos estimados, presentados en esta sección, fueron estimados con el
paquete poLCA [15] del Software libre R-project [17].

En el contexto del análisis de variables de clases latentes estimar un modelo


consiste, en primera instancia, en determinar cuántas clases latentes existen en el
problema en estudio.

Por lo tanto, la hipótesis de partida en la estimación de cada uno de los posibles


modelos será:
H0 : El modelo ajustado es el adecuado, vs.
H1 : El modelo ajustado NO es el adecuado.
Por adecuado se entenderá que la cantidad de clases especificadas es la correcta.

En este trabajo se han estimado 4 modelos (M = 1, 2, 3, 4) y a partir de los


resultados obtenidos se determina que, siguiendo el criterio de mı́nimo BIC, el me-
jor modelo serı́a aquel que presenta una variable con 3 clases latentes. Sin embargo,
tanto en este modelo como en aquellos que proponen una variable con una y dos
clases latentes los resultados obtenidos ponen de manifiesto que la hipótesis nula es
rechazada1 , por lo que serı́a necesario un ajuste con más clases.

Para el caso del modelo con una variable con cuatro clases latentes la hipótesis
nula no puede ser rechazada, por lo que podrı́a considerarse que ajustar un modelo
con cuatro clases latentes es adecuado. Además, se verifica que al estimar este modelo
no existen problemas de identificabilidad y que en el proceso de maximización se
alcanza, al menos, un máximo local (que puede coincidir con el máximo global).

3.3.5. Caracterización de las clases


En función de lo expuesto se decide estimar un modelo de una variable con cua-
tro clases latentes, cuyas probabilidades a priori son:
P(1) = 0.32, P(2) = 0.29; P(3) = 0.24 ; P(4) = 0.15.

La caracterización de cada una de las clases se realiza en función de la probabi-


lidad condicional, de cada una de las categorı́as de cada variable manifiesta, dada la
clase. Tomando como referencia los resultados presentados en el Cuadro 3.2, la ca-
racterización de las clases en las que se agrupan a los 470 estudiantes es la siguiente:

Clase Latente 1
Los estudiantes que se encuentran en esta clase presentan un nivel de expectativas
y una percepción de la calidad de los servicios funcionales medio-bajo y niveles
medios de imagen, percepción de la calidad de los servicios académicos, necesidades
y deseos y valor percibido.
En función de la descripción hecha se entiende que los patrones caracterı́sticos de
esta clase son:
1 Se considera un α = 0.05.

33
Probabilidad, Estadı́stica y sus Aplicaciones

(ER , IR , CSAR , CSFR , N DR , V PR ) = (1,2,2,1,2,2),


(ER , IR , CSAR , CSFR , N DR , V PR ) = (2,2,2,2,2,2).

Clase Latente 2
Los estudiantes que se encuentran en la clase latente 2, presentan un nivel alto de
todas las variables manifiestas. Cabe destacar, además, el hecho de que la proba-
bilidad de que un estudiante que pertenece a esta clase, tenga niveles bajos en su
percepción de la calidad de los servicios académicos, es 0.
El patrón especı́fico de esta clase es:
(ER , IR , CSAR , CSFR , N DR , V PR ) = (3,3,3,3,3,3).

Clase Latente 3
En el extremo opuesto a los estudiantes cuya Satisfacción se define a partir de la
clase latente 2, se encuentran los estudiantes de esta clase. éstos presentan un nivel
bajo de todas las variables manifiestas. Cabe destacar, además, el hecho de que la
probabilidad de que un estudiante que pertenece a esta clase, tenga niveles altos en
imagen y necesidades/deseos, es 0.
El patrón especı́fico de esta clase es:
(ER , IR , CSAR , CSFR , N DR , V PR ) = (1,1,1,1,1,1).

Clase Latente 4
Por último, los estudiantes que pertenecen a la clase latente 4 se caracterizan por
tener nivel medio-alto de expectativas, nivel medio de imagen, percepción de la ca-
lidad de los servicios académicos, necesidades/deseos y valor percibido. En lo que
refiere a la percepción de la calidad de los servicios funcionales, los estudiantes que
se encuentran en esta clase presentan valores altos.
Además, se destaca que la probabilidad de que un estudiante que pertenece a esta
clase, tenga niveles bajos en imagen, percepción de la calidad los servicios académi-
cos y necesidades/deseos, es 0.

Los patrones caracterı́sticos de esta clase son:


(ER , IR , CSAR , CSFR , N DR , V PR ) = (2,2,2,3,2,2),
(ER , IR , CSAR , CSFR , N DR , V PR ) = (3,2,2,3,2,2).

34
Probabilidad, Estadı́stica y sus Aplicaciones

Cuadro 3.2: Probabilidades condicionales P (Yi /m).


ER 1 2 3
m=1 0.42 0.43 0.15
m=2 0.04 0.15 0.81
m=3 0.81 0.17 0.02
m=4 0.09 0.48 0.43
IR 1 2 3
m=1 0.19 0.62 0.19
m=2 0.01 0.26 0.73
m=3 0.70 0.30 0.00
m=4 0.00 0.91 0.09
CSAR 1 2 3
m=1 0.30 0.69 0.01
m=2 0.00 0.05 0.95
m=3 0.99 0.00 0.01
m=4 0.00 0.68 0.32
CSFR 1 2 3
m=1 0.38 0.40 0.22
m=2 0.04 0.16 0.80
m=3 0.77 0.19 0.04
m=4 0.03 0.29 0.68
N DR 1 2 3
m=1 0.28 0.63 0.09
m=2 0.01 0.07 0.92
m=3 0.97 0.03 0.00
m=4 0.00 0.74 0.26
V PR 1 2 3
m=1 0.13 0.57 0.30
m=2 0.03 0.24 0.73
m=3 0.75 0.24 0.01
m=4 0.05 0.95 0.00

Por lo tanto, en lo que refiere a la Satisfacción Estudiantil, las clases latentes se


podrı́an categorizar como:

m = 1: Estudiantes con Satisfacción Estudiantil medio-baja.


m = 2: Estudiantes con Satisfacción Estudiantil alta.
m = 3: Estudiantes con Satisfacción Estudiantil baja.
m = 4: Estudiantes con Satisfacción Estudiantil media-alta.

35
Probabilidad, Estadı́stica y sus Aplicaciones

Figura 3.1: Perfil de las 4 clases latentes en función de las 6 variables manifiestas.

3.3.6. Probabilidades a posteriori


Los resultados presentados en el Cuadro 3.3 hacen referencia, a modo de ejemplo,
a las probabilidades a posteriori, para cada uno de los patrones posibles de respuesta
(para los 6 patrones más frecuentes, presentados en el Cuadro 3.1), y la asignación
a cada una de las clases (en función de la máxima probabilidad a posteriori).
Cuadro 3.3: Probs. a posteriori según patrones y asignaciones.
ER IR CSAR CSFR N DR V PR P (1) P (2) P (3) P (4) Asignación
3 3 3 3 3 3 0.00 1.00 0.00 0.00 2
1 1 1 1 1 1 0.00 0.00 1.00 0.00 3
2 2 2 3 2 2 0.18 0.00 0.00 0.81 4
1 2 1 1 1 1 0.01 0.00 0.99 0.00 3
3 3 3 3 3 2 0.00 0.99 0.00 0.01 2
3 2 3 3 3 2 0.00 0.76 0.00 0.24 2

En función de las probabilidades a posteriori, de cada una de las clases, el total


de estudiantes queda distribuido en cada una de ellas en un 30 % (145), 29 % (137),
25 % (118) y 16 % (77) respectivamente.

36
Probabilidad, Estadı́stica y sus Aplicaciones

3.4. Conclusiones y Consideraciones finales


Los resultados obtenidos y presentados en este trabajo, nos permiten concluir:

Efectivamente existe una variable de clases latentes que refiere a la Satisfacción


Estudiantil de los estudiantes de nivel universitario de la Facultad de Ciencias
Económicas y Administración (FCEA, UDELAR, Uruguay).

Dicha variable tiene 4 clases que quedan definidas a partir de la interacción


de las 6 variables manifiestas.
En función de la pertenencia a cada una de las clases, se detectan estudian-
tes universitarios cuya satisfacción con la FCEA es extrema en 2 sentidos
opuestos: Satisfacción Estudiantil alta y Satisfacción Estudiantil baja. En un
término medio, existen estudiantes cuya Satisfacción Estudiantil se define co-
mo media. Para estos, existen dos clases: media-alta y media-baja.

Como consideraciones finales y propuestas a futuro se plantea:


Evaluar la robustez de la variable de clases latentes, iterando varias veces para
evaluar el grado de dependencia de los valores iniciales.
Plantear el uso de las clases latentes detectadas para, a través de una partición
de la tabla de datos, volver a estimar un Modelo de Ecuaciones Estructurales y
realizar un estudio comparativo con los modelos ya estimados con estos datos
[2], [3], [4], [21].
Realizar un estudio similar con los datos obtenidos en una investigación rea-
lizada en 2017 en FCEA (réplica del estudio 2009).

37
Probabilidad, Estadı́stica y sus Aplicaciones

Bibliografı́a

[1] Agresti, A. Categorical data analysis. Wiley-Interscience, Hoboken, N.J.,


2013.
[2] Álvarez-Vaz, R. y Vernazza, E. Aplicación de los modelos de ecuaciones
estructurales para el estudio de la satisfacción estudiantil en en los cursos su-
periores de FCCEEyA. Documentos de Trabajo - IESTA. Serie DT (13 / 02),
2013.
[3] Álvarez-Vaz, R. y Vernazza, E. Aplicación de modelos de ecuaciones
estructurales en la medición del nivel de satisfacción estudiantil: comparación
de tres métodos de estimación. Documentos de Trabajo - IESTA. Serie DT (14
/ 03), 2014.
[4] Álvarez-Vaz, R. y Vernazza, E. Evaluación de un instrumento de medición
del nivel de satisfacción estudiantil a través de la aplicación de modelos de
ecuaciones estructurales. Cuadernos del CIMBAGE, (19):1–25, 2017.

[5] Álvarez-Vaz, R., Freira, D., Vernazza, E., y Alves, H. Can students’
satisfaction indexes be applied the same way in different countries? Int Rev
Public Nonprofit Marketing, 13(101), 2016.
[6] Alves, H. y Raposo, M. La medición de la satisfacción en la enseñanza
universitaria: El ejemplo de la universidade da beira interior. Int Rev Public
Nonprofit Marketing, 1(1):73–88, 2014.
[7] Bandeen-Roche, K., Miglioretti, D. L., Zeger, S. L., y Rathouz,
P. J. Latent variable regression for multiple discrete outcomes. Journal of the
American Statistical Association, 92(440):1375–1386, 1997.

[8] Carlomagno, A. A. y Sepúlveda, R. Análisis de clases latentes en tablas


poco ocupadas: consumo de alcohol, tabaco y otras drogas en adolescentes.
Revista de Matemática: Teorı́a y Aplicaciones, 17(1):25–40, 2010.
[9] Castro López, C. R., Montano Rivas, A., y Oliva Zarate, L. Modelos
de clases latentes para definir perfiles conductuales en niños de 4 y 5 años.
Revista Electrónica de Psicologı́a Iztacala., 14(1), 2011.
[10] Dempster, A. P., Laird, N. M., y Rubin, D. B. Maximum likelihood from
incomplete data via the em algorithm. Journal of the Royal Statistical Society,
39:1–38, 1977.

38
Probabilidad, Estadı́stica y sus Aplicaciones

[11] Everitt, B. S. An Introduction to Latent Variable Models. Springer Nether-


lands, Dordrecht, 1984.
[12] Hagenaars, J. Applied latent class analysis. Cambridge University Press,
Cambridge New York, 2002.
[13] Højsgaard, S. Graphical models with R. Springer, New York, 2012.

[14] Lazarsfeld, P. The logical and mathematical foundations of latent structure


analysis. ISA Stouffer (ed.), Measurement and Prediction, pp. 362-412., 1950
[15] Linzer, D. A. y Lewis, J. B. poLCA: An R package for polytomous variable
latent class analysis. Journal of Statistical Software, 42(10):1–29, 2011.

[16] McLachlan, G. Finite mixture models. Wiley, New York, 2000.


[17] R Core Team. R: A Language and Environment for Statistical Computing. R
Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0,
2017.
[18] Robertson, J. Modern statistical methods for HCI. Springer, Switzerland.,
2016
[19] Sánchez Rivero, M. Segmentación de la población española según su grado
de concienciación ecológica mediante modelos de variables latentes l. Investiga-
ciones Europeas de Dirección y Economı́a de la Empresa, 7(3):173–196, 2001.

[20] Scrucca, L. y Raftery, A. E. Improved initialisation of model-based clus-


tering using Gaussian hierarchical partitions. ArXiv e-prints, 2015.
[21] Vernazza, E. Evaluación de un instrumento de medición del nivel de satis-
facción estudiantil en los cursos de formación superior de la FCCEEyA de la
UDELAR a través de la aplicación de Structural Equation Modelling (SEM).
Informe de pasantı́a, Fac. de CCEEyA - UdelaR, 2013.

39
Probabilidad, Estadı́stica y sus Aplicaciones

Capı́tulo 4
Modelación espacial de la plaga Sigatoka Negra (Mycosphaerella fijiensis) en
cultivos de plátano del estado de Guerrero

Juan Elı́as Solı́s Alonso1 , Marı́a Guzmán Martı́nez1 , Ramón Reyes Carreto1 y
Dolores Briones Reyes2

1
Universidad Autónoma de Guerrero,
Facultad de Matemáticas,
Av. Lázaro Cárdenas S/N, Ciudad Universitaria,
C.P. 39087, Chilpancingo, Guerrero,
2
INIFAP, Campo Experimental Pabellon
Km 32.5 Carretera Aguascalientes a Zacatecas,
C.P. 20660, Pabellón de Arteaga, Aguascalientes,
[email protected], [email protected],
[email protected], briones [email protected]
Resumen. El plátano (Musa spp.) se cultiva en más de 120 paı́ses alrededor
del mundo, es una importante fuente de carbohidratos en la dieta de millones de
personas, sobre todo en paı́ses tropicales, además representan a nivel mundial el
cuarto cultivo de mayor importancia, después del maı́z (Zea mays), trigo (Triticum
aestivum) y arroz (Oryza sativa). La variedad de plátanos que se cultivan en México
es amplia, entre ellas destacan el Plátano Tabasco o Roatán, Enano Gigante, Crio-
llo, Valery, Dominico, Manzano, Macho, Morado y Pera. Guerrero ocupa el octavo
lugar con una producción anual de 50 a 60 toneladas por hectárea. Este cultivo
como cualquier otro presenta problemas de plagas, una de ellas es la Sigatoka negra
(Mycosphaerella fijiensis) que es una de las principales enfermedades del cultivo,
provoca una considerable reducción en el área foliar de la planta y en consecuencia
los racimos y los frutos tienen un menor peso en comparación con las plantas sanas.
Este problema finalmente se ve reflejado en la producción total. El objetivo de este
trabajo fue modelar la distribución espacial de la enfermedad en el municipio de
Tecpán de Galeana, ubicado en Costa Grande, Guerrero, a través de un proceso
espacial gaussiano estacionario. Para la modelación de la estructura de dependencia
espacial de los datos se utilizó la función del semivariograma; y para la interpolación
el método de kriging ordinario y universal. Esta investigación permitió identificar
los puntos de mayor gravedad de la enfermedad en la zona de estudio, lo cual es
muy importante a la hora de implementar las medidas de control para la Sigatoka
negra. La base de datos comprende los monitoreos de julio a diciembre del año 2017,
6 meses en total. La información fue proporcionada por SAGARPA.

Abstract. The banana (Musa spp.) is grown in more than 120 countries around the

40
Probabilidad, Estadı́stica y sus Aplicaciones

world, is an important source of carbohydrates in the diet of millions of people, es-


pecially in tropical countries, also represent the fourth world level most important
crop, after corn (Zea mays), wheat (Triticum aestivum) and rice (Oryza sativa).
The variety of plantains grown in Mexico is wide, among them the banana Tabasco
or Roatán, Enano Gigante, Criollo, Valery, Dominico, Manzano, Macho, Morado
and Pera. Guerrero occupies the eighth place with an annual production of 50 to 60
tons per hectare. This crop, like any other, presents problems of pests, one of them
is black Sigatoka (Mycosphaerella fijiensis) which is one of the main diseases of the
crop, causes a considerable reduction in the leaf area of the plant and consequently
bunches and fruits have a lower weight compared to healthy plants. This problem
is finally reflected in the total production. The objective of this work was to model
the spatial distribution of the disease in the municipality of Tecpán de Galeana,
located in Costa Grande, Guerrero, through a stationary Gaussian spatial process.
For the modeling of the spatial dependence structure of the data, the function of the
semivariogram was used; and for interpolation the ordinary and universal kriging
method. This investigation allowed identifying the most serious points of the disease
in the study area, which is very important when implementing the control measures
for black Sigatoka. Data base includes the monitoring from july to december of the
year 2017, 6 months in total. The information was provided by SAGARPA.

Palabras clave: Interpolación espacial, Proceso espacial gaussiano, Semivario-


grama.

4.1. Introducción
El plátano es un cultivo muy importante, aunque poco estudiado en todo el
mundo. Mucha gente que hoy disfruta de los plátanos no se da cuenta de la amplia
gama de esfuerzos humanos que implica su cultivo [11] ni de los problemas fitosani-
tarios a los cuales el cultivo se enfrenta como la Sigatoka negra, Sigatoka amarilla,
Moko del plátano, entre otras.
Aunque la Sigatoka negra se describió por primera vez en 1964 [15], una descrip-
ción detallada de los sı́ntomas fue publicada por primera vez en 1969 por Meredith
y Lawrence [13]. Con base en estas observaciones, Fouré [8] redefinió los sı́ntomas
mostrados durante el desarrollo de la enfermedad en seis etapas. En cuanto a la sin-
tomatologı́a de la enfermedad, el primer sı́ntoma que se presenta son las manchas
cloróticas que aparecen entre los 14 a 20 dı́as después de la infección. El perı́odo
entre la aparición de manchas y el desarrollo de rayas y, posteriormente, puntos
necróticos varı́a en longitud de acuerdo con el cultivar y la gravedad de la infección.
Otros autores mencionan que en algunas áreas de cultivo, la primera aparición de
sı́ntomas se correlaciona con la susceptibilidad del cultivar [4]. Sin embargo, la du-
ración del perı́odo de incubación no parece correlacionarse con la resistencia general
[8].

De las investigaciones relacionadas con la Sigatoka está la de Chillet et al. [5]


que descubrieron que además de los efectos de la Sigatoka sobre el rendimiento del
plátano, ésta tiene un impacto en la calidad de la fruta, especialmente porque los
plátanos maduran prematuramente. Ellos llevaron a cabo una encuesta de planta-

41
Probabilidad, Estadı́stica y sus Aplicaciones

ción y experimentos para evaluar el efecto de la enfermedad en la vida verde de los


plátanos recolectados a una edad fisiológica constante, medida en grados-dı́a (dd).
Sus resultados revelaron que los plátanos cosechados a 900 dd de plantas con alta
severidad de la Sigatoka tenı́an crecimiento de diámetro normal, pero una vida ver-
de más corta que los plátanos cosechados de plantas no infectadas. Estos resultados
indican que la Sigatoka es directamente responsable de la reducción de la vida verde
del banano, ya que la reducción de vida verde no podrı́a atribuirse a la cosecha de
frutos en una edad fisiológica más avanzada [5].
En cuanto a daño económico, Cook et al., en 2001 proporcionaron evidencia
cuantitativa que sugiere que en el caso de las importaciones de banano, el nivel
apropiado de protección corresponde a un daño esperado de 60 millones de dóla-
res australianos por año. Esto sugiere que, si bien las reglamentaciones actuales de
cuarentena restringen el comercio, el nivel adecuado de protección corresponde a
un nivel de daño relativamente grave [6].

Por otro lado, Alves et al. [2], aplicaron técnicas de geoinformación para desa-
rrollar modelos predictivos para estudiar las áreas de riesgo en la Sigatoka negra
(Mycosphaerella fijiensis var. difformis) en banano, considerando el clima carac-
terı́stico de Brasil y la distribución de cultivos de banano. Considerando datos de
temperatura y precipitación para el periodo comprendido entre 1950 y 2000, para
los cuales se disponı́a de datos de observación, y de simulaciones para 2020, 2050
y 2080; utilizando los escenarios de emisiones (SRESA2, por sus siglas en inglés),
de cambio climático, a partir del análisis de componentes principales, se generó una
sola variable en base a 57 variables, para determinar un ı́ndice que explica el 90 %
de la variabilidad de cultivos de banano, en distritos municipales de todo Brasil.
El modelo climático se utilizó para generar la zonificación de la enfermedad de la
planta, utilizando la temperatura y la humedad de la hoja como insumo. Se trazaron
áreas de favorabilidad para la enfermedad contra las principales áreas productoras
de banano en Brasil. Esta metodologı́a permitió la visualización de los cambios en
áreas favorables para epidemias bajo posibles escenarios futuros de cambio climático
[2].

Por otra parte Freitas et al. [9], analizaron la distribución espacial de la Mancha
de Sigatoka amarilla en relación con la fertilidad del suelo y el estado nutricional de
la planta mediante geoestadı́stica. El área experimental comprendió 1.2 hectáreas,
donde 27 puntos fueron georeferenciados y espaciados en una cuadrı́cula regular
de 18m × 18m. La severidad de la Sigatoka amarilla, la fertilidad del suelo y el
estado nutricional de la planta se evaluaron en cada punto. Para estas variables se
ajustó el modelo esférico cuyos parámetros se estimaron por máxima verosimilitud
restringida. Los mapas de interpolación mostraron que la mayor tasa de infección
de Sigatoka ocurrió en áreas altas del campo que tenı́an la mayor concentración de
arena, mientras que la tasa más baja se encontró en áreas bajas con limo inferior,
materia orgánica, bases intercambiables totales, capacidad efectiva de intercambio
catiónico, Ca y Mg en el suelo, y azufre foliar [9].

El objetivo de este trabajo fue modelar la distribución espacial del ı́ndice de in-
festación de la Sigatoka negra (Mycosphaerella fijiensis) en plátanos del municipio
de Tecpán de Galeana, ubicado en Costa Grande, Guerrero, a través de un proceso

42
Probabilidad, Estadı́stica y sus Aplicaciones

espacial gaussiano estacionario. Cabe señalar que para esta enfermedad en el estado
de Guerrero no se tienen identificados trabajos de este tipo.

Este trabajo esta organizado de la siguiente manera. En la Sección 4.2 se discute


la teorı́a básica para la geoestadı́stica y el proceso gaussiano espacial y los métodos
de interpolación. En la Sección 4.3 se muestra una aplicación de la metodologı́a
anterior en el ı́ndice de infestación en plátanos y en la Sección 4.4 se da una breve
discusión y los resultados.

4.2. Marco Teórico


La forma básica para datos geoestadı́sticos es:
(xi , yi ), i = 1, ..., n
donde xi denota una ubicación espacial (normalmente en un espacio de dos dimen-
siones) y yi es un valor asociado a la ubicación xi . Se denota con Y a la variable
medible o respuesta, que debe estar definida en una región D ⊂ R2 . De esta manera,
cada yi es una realización de la variable aleatoria Yi , cuya distribución depende del
valor de la ubicación xi , Yi = Y (xi ), adyacente a un proceso estocástico espacial
continuo, S(x), el cual no es directamente observable.
Un modelo geoestadı́stico incorpora al menos dos elementos: un proceso estocástico
{S(x) : x ∈ D ⊂ R2 } y una variable aleatoria Y= (Y (x1 ), ..., Y (xn )) cuya distribu-
ción multivariada está condicionada a S(·).
La siguiente definición permite identificar cuando un proceso estocástico es gaus-
siano y estacionario.
Definición 4.2.1 Un proceso estocástico S(x) es un Modelo Gaussiano si la distri-
bución conjunta de S(x1 ), ..., S(xn ) es Gaussiana multivariada para cualquier entero
n y un conjunto de ubicaciones xi . El proceso es estacionario si la esperanza y la
varianza de S(x) es la misma para todo x, y la correlación entre S(xi ) y S(xj )
dependa solo de h = ||xi − xj ||, la distancia euclideana entre xi y xj .
Los supuestos subyacentes al modelo gaussiano estacionario son:
1. {S(x) : x ∈ R2 } es un proceso gaussiano con media µ y varianza σ 2 =
V ar{S(x)} y función de correlación ρ(h) = Corr{S(xi ), S(xj )} donde h =
||xi − xj ||.
2. Condicionadas en {S(x) : x ∈ R2 }, las realizaciones yi de la variable aleatoria
Yi son mutuamente independientes y normalmente distribuidas con media
condicional E[Yi |S(·)] = S(xi ) y varianza condicional τ 2 .
El modelo para el proceso estocástico S(x) puede definirse como:
Y (xi ) = S(xi ) + Z(xi ), i = 1, ..., n (4.1)
donde S(xi ) con xi ∈ D ⊂ R2 cumple con el supuesto 1 y los Z(xi ) son variables
aleatorias mutuamente independientes con distribución N (0, τ 2 ). Obsérvese que este
modelo asume que la media es constante en D. Si no fuera ası́ entonces
Y (xi ) = µ(xi ) + S(xi ) + Z(xi ), i = 1, ..., n (4.2)

43
Probabilidad, Estadı́stica y sus Aplicaciones

donde ahora µ(xi ) es una función que depende de las ubicaciones xi . El Modelo
(4.2) es de alguna manera una generalización del Modelo (4.1).

Si la media del proceso observado en la superficie tiene tendencia lineal entonces


µ(x) esta dada por:
µ(x) = β0 + β1 d1 + β2 d2 (4.3)
donde d1 y d2 son la latitud y longitud de la ubicación, es decir xi = (d1 , d2 ) (ver
[14]). Si la media del proceso observado tiene una tendencia cuadrática entonces
µ(x) está dada por:

µ(x) = β0 + β1 d1 + β2 d2 + β3 d21 + β4 d22 + β5 d1 d2 .

Para modelar la estructura de dependencia del proceso estocástico gaussiano


estacionario, S(x), se puede utilizar la función del semivariograma. La cual se define
como
1
V (h) := V ar{S(xi ) − S(xj )}
2
donde h = ||xi − xj ||.
El estimador natural de V (h) es el estimador de momentos de Matheron (ver [12])
dado por:
1 X 2
V̂ (h) = [Y (xi ) − Y (xj )]
2|N (h)|
N (h)

donde N (h) = {(xi , xj ) : h − ∆ ≤ h ≤ h + ∆, i, j = 1, ..., n} con ∆ que es una cierta


tolerancia y |N (h)| es el número de pares contenidos en el conjunto N (h).

Algunos de los modelos teóricos para la función del semivariograma son el Ex-
ponencial, Esférico, Gaussiano y Wave (Cuadro 4.1), entre otros (ver [3]).

Cuadro 4.1: Modelos teóricos para el semivariograma.

Modelos Función del semivariograma


 h
τ 2 + σ 2 (1−− a ) h>0
Exponencial V (h) =
0 en otro caso
τ + σ 2 (1.5( ha ) − 0.5( ha )3 si h ≤ a
 2
Esférico V (h) =
τ 2 + σ2 si h > a
−( h )2

2 2
τ + σ (1− a ) h>0
Gaussiano V (h) =
0 en otro caso
τ + σ 2 (1 − ha sen( ha ))
 2
h>0
Wave V (h) =
0 en otro caso

Los modelos que se ajustaron para el semivariograma en esta investigación fueron


los del Cuadro 4.1, para validar cual de los modelos se ajusta mejor al semivariogra-
ma empı́rico se utilizó validación cruzada, la idea de esta técnica es dejar de lado
cada observación por turno y usar kriging para predecir su valor usando las otras
observaciones sin volver a estimar el modelo del semivariograma.

44
Probabilidad, Estadı́stica y sus Aplicaciones

Para cada ubicación xi se tiene entonces, un valor observado Y (xi ) y valor predi-
cho Ŷ (xi ), la validación es a través del criterio del error cuadrado medio normalizado
que se define por:
n
1 X (Y (xi ) − Ŷ (xi ))2
M SN E = (4.4)
n i=1 σ̂x2i

donde σ̂x2i es la varianza del kriging. Si el modelo del semivariograma esta correcta-
mente identificado y bien estimado, entonces el MSNE deberı́a ser muy cercano a 1
[10].

Nuestro objetivo es crear un mapa de predicción para Y (xi ) sobre todo D cuan-
do Y (xi ) solo se observa en un número finito de puntos de D. La palabra “kriging”
es sinónimo de “predicción óptima”, en otras palabras, se refiere a hacer inferen-
cias sobre valores no observados del proceso aleatorio Y (xi ), a partir de ubicaciones
xi ∈ D.

El kriging ordinario se define como


n
X
Kok (Y (x0 )) = λi Y (xi ) (4.5)
i=1

que es la predicción espacial del proceso Y (x0 ) bajo los siguientes dos supuestos,

En el Modelo (4.1), xi ∈ D, µ ∈ R, y µ es una constante desconocida.


n
X
λi = 1.
i=1

Esta última condición, que los coeficientes del predictor lineal (4.5) suman 1, ga-
rantiza uniformidad insesgada, es decir, E(Kok (Y (x0 ))) = µ, para toda µ ∈ R.

El kriging universal se define como


n
X
Kuk (Y (x0 )) = λi Y (xi ), λ1 , ..., λn ∈ R (4.6)
i=1

el cual será insesgado si E(Kuk (Y (x0 ))) = µ(x0 ) [7], donde µ(x0 ) es la función de
la media, entonces la ecuación (4.6) queda como,
n
X
E [Kuk (Y (x0 ))] = λi µ(xi ) = µ(x0 ). (4.7)
i=1

4.3. Aplicación
4.3.1. Descripción de los datos
La base de datos comprende los monitoreos de julio a diciembre del año 2017,
la cual fue proporcionada por SAGARPA. En cada mes se muestreo 2 veces cada

45
Probabilidad, Estadı́stica y sus Aplicaciones

punto georeferenciado dejando pasar un lapso de 15 dı́as para el siguiente muestreo,


de esa manera fue en que se abordó el análisis geoestadı́stico, en el Cuadro 4.2 se
muestra la estructura de cuantos puntos georeferenciados hay en cada mes.

Cuadro 4.2: Puntos georeferenciados por mes.

Mes 1ra quincena 2da quincena Total


Julio 130 107 237
Agosto 143 146 289
Septiembre 149 133 282
Octubre 122 148 270
Noviembre 139 138 277
Diciembre 150 141 291

Para la modelación de la estructura de dependencia espacial de los datos se


utilizó la función del semivariograma (ver [7]); y para la interpolación del proceso
el método de kriging ordinario (4.5) y universal (4.7).

4.3.2. Análisis de tendencia y estacionariedad


En la Figura 4.1 se observa la ubicación de los puntos georeferenciados en estudio
sobre en un mapa de Google para observar el área en la que se llevó a cabo el
muestreo.

●●●

● ●

●● ●●
● ●
● ● ●
● ●



●●
● ● ●

●● ● ●

● ● ● ●
● ●

● ●

● ●
●● ●

●● ●




● ● ● ●
●●●●
●●●
●● ●




● ●

●● ●



● ●
● ●
● ●●
●●

● ●●
●● ● ● ● ●
● ●

●●
● ●● ●

●● ●
●●●
● ● ●●

● ●


●●●
● ●


●●●●

●●

●●

Figura 4.1: Mapa de los puntos georeferenciados en estudio.

En la Figura 4.2 se analiza si se presenta tendencia en los datos, como se pue-


de apreciar, hay efecto de tendencia en los sentidos norte a sur y de este a oeste,
dependiendo del comportamiento de los puntos es que se sabe si los datos tienen
media constante, lo normal es una lı́nea horizontal [14], en este caso la media no es
constante sobre el área de estudio.

En la Figura 4.3 se muestra el ı́ndice de infestación en cada uno de los puntos


georeferenciados de muestreo, donde lo negro indica mayor ı́ndice de infestación
siendo el sur de la zona de estudio quien tiene mayor infestación.

46
Probabilidad, Estadı́stica y sus Aplicaciones

50

50
● ● ● ● ● ● ● ● ● ● ● ●● ● ● ●

● ●
● ● ● ●
● ●

● ●
● ●
● ● ● ● ● ● ● ●

● ● ● ● ●

45

45
● ●
● ●
● ●
● ● ● ● ● ●
● ● ● ●
● ● ● ● ● ● ● ●

● ● ● ● ● ● ●
● ● ● ● ●● ● ● ●
● ● ● ●
● ● ● ●
● ●
● ● ● ● ● ● ● ● ● ●● ●
● ●

● ●

40

40
● ● ● ● ● ● ●●

● ●
● ●
● ●
● ●
● ● ● ●

Infestacion

Infestacion
● ●
● ● ● ● ● ●
● ● ● ● ● ● ● ● ●● ● ● ● ●
● ● ● ● ● ● ● ●
● ● ● ● ● ● ● ●
● ● ● ●

35

35
● ●
● ●
● ●● ● ● ● ● ● ● ● ● ●

● ● ● ● ● ● ●● ● ● ● ● ● ● ●

● ● ● ● ● ●
● ●
● ● ● ●
● ●
● ●
● ● ● ●
● ●

30

30

● ●
● ● ● ●
● ●
● ● ● ● ● ●
● ●
● ● ● ●
● ● ● ● ● ● ● ●

● ●
● ●

25

25
● ● ● ● ● ●

● ●

● ●
● ● ● ●
● ●
● ●

● ●

20

20
● ● ● ●
● ● ● ●

−100.675 −100.665 −100.655 −100.645 17.16 17.17 17.18 17.19 17.20 17.21

W−E S−N

Figura 4.2: Dispersión del ı́ndice de infestación vs las coordenadas.


17.21

●●●
● ●
● ●

●●
● ●
●● ●
● ● ●
17.20



●●
● ●●

●●

● ●●●
● ● ● ●

●●
● ●
● ●
17.19

●●
● ●●●
● ●
●● ●
Latitud

● ●●●●●
●●●



17.18

● ●



● ●

●●


● ●
●● ●


17.17

●●
●●
●●
● ●●
●● ●

●● ●●●
●●

●●
● ●●



●●●●



●●●
●●
17.16


●●

−100.68 −100.67 −100.66 −100.65 −100.64

Longitud

Figura 4.3: Índice de infestación por punto georeferenciado.

La Figura 4.4 tiene el ajuste de los modelos del Cuadro 4.1 al semivariograma
empı́rico, el modelo Wave es el que más aproxima la forma del semivariograma. Se
usa el criterio (4.4) para validar el ajuste de los modelos al semivariograma empı́rico.
120

Exp
Spherical
Gauss
100

Wave


80
semivariance

● ●



60


● ●



● ●
40
20

0.00 0.01 0.02 0.03 0.04 0.05 0.06

distance

Figura 4.4: Ajuste de modelos para el semivariograma empı́rico.

47
Probabilidad, Estadı́stica y sus Aplicaciones

Se observa que los meses de julio-agosto y noviembre-diciembre son similares en


cuestión al comportamiento del ı́ndice de infestación, por tal motivo se produce el
mapa de interpolación de los meses que son aydacentes al resto, es decir, agosto y
noviembre. El procedimiento se realizó 8 veces, uno por quincena en los 4 meses, se
muestran los resultados a continuación.

4.3.3. Resultados
Para el mes de agosto en la primera quincena se tiene un mayor ı́ndice de infesta-
ción hacia el suroeste del mapa de interpolación alcanzando un 46 %, en la segunda
quincena el ı́ndice de infestación es mayor en la parte sur del mapa de interpolación
alcanzando un 46 %, en todo el mes el rango del ı́ndice de infestación está entre
30 % y 46 % (Figura 4.5).

Infestación 1ra quincena Infestación 2da quincena


17.21

17.21
30
30
17.20

17.20
32
30
17.19

17.19
32
Latitud

Latitud
30

38
17.18

17.18
34
34

40 36
36

38 42
46

40
17.17

42 17.17
44

44
44
17.16

17.16

30 35 40 45 30 35 40 45

−100.68 −100.67 −100.66 −100.65 −100.64 −100.63 −100.68 −100.67 −100.66 −100.65 −100.64 −100.63

Longitud Longitud

Figura 4.5: Mapa de interpolación para el mes de agosto.

Para el mes de septiembre en la primera quincena se tiene un mayor ı́ndice de


infestación hacia el suroeste del mapa de interpolación alcanzando un 52 %, en la
segunda quincena el ı́ndice de infestación es mayor en la parte sur del mapa de
interpolación alcanzando un 52 % después de hacer un tipo de elipse en el norte, en
todo el mes el rango del ı́ndice de infestación está entre 30 % y 52 % (Figura 4.6).

Infestación 1ra quincena Infestación 2da quincena


17.21

17.21
30
32

34
17.20

17.20

32 30

30
17.19

17.19
Latitud

Latitud

32

34
17.18

17.18

50 36
34
38

38
36

40
42

48
42
40

44
44

46 46
17.17

17.17

48 48
52

50
50
52
17.16

17.16

30 35 40 45 50 30 35 40 45 50

−100.68 −100.67 −100.66 −100.65 −100.64 −100.63 −100.68 −100.67 −100.66 −100.65 −100.64 −100.63

Longitud Longitud

Figura 4.6: Mapa de interpolación para el mes de septiembre.

48
Probabilidad, Estadı́stica y sus Aplicaciones

Para el mes de octubre en la primera quincena se tiene un mayor ı́ndice de


infestación hacia el sur del mapa de interpolación alcanzando un 50 % con compor-
tamientos de elipses en los centros del mapa, en la segunda quincena el ı́ndice de
infestación es mayor en la parte sur del mapa de interpolación alcanzando un 50 %,
en todo el mes el rango del ı́ndice de infestación está entre 26 % y 50 % (Figura 4.7).

Infestación 1ra quincena Infestación 2da quincena

17.21

17.21

30
17.20

17.20

34
28 30

28
17.19

17.19
26
Latitud

Latitud
26 30

34
32
17.18

17.18
30

38
32

46

42

36
34
38 36

40
50

44
48
40
42
48 44
46
17.17

17.17
48
50
50

48
17.16

17.16
25 30 35 40 45 50 30 35 40 45 50

−100.68 −100.67 −100.66 −100.65 −100.64 −100.68 −100.67 −100.66 −100.65 −100.64

Longitud Longitud

Figura 4.7: Mapa de interpolación para el mes de octubre.

Para el mes de noviembre en la primera quincena se tiene un mayor ı́ndice de


infestación hacia el sur del mapa de interpolación alcanzando un 43 %, en la segunda
quincena el ı́ndice de infestación no tiene una distribución uniforme, hay brotes de
infestación altos y bajos en varios puntos de la zona de estudio oscilando entre 30 %
y 44 % (Figura 4.8).

Infestación 1ra quincena Infestación 2da quincena


17.21

17.21

35
30
40

38
36
36
36

34
36 38
17.20

17.20

36 38
40

36 34
36
38

36
35 32
17.19

17.19

34 40
38 34

38
40
Latitud

Latitud

38 34
36
36
32
34 36
17.18

17.18

38
38 40
37

36
39
38

34
38 38
38 38
36 34
40
37

34 36
41 32
17.17

17.17

32
42 36 34 40
34
38

43
38 38
34
36
32
43
17.16

17.16

36
34
36 38 40 42 30 35 40 45

−100.68 −100.67 −100.66 −100.65 −100.64 −100.63 −100.68 −100.67 −100.66 −100.65 −100.64 −100.63

Longitud Longitud

Figura 4.8: Mapa de interpolación para el mes de noviembre.

4.4. Conclusiones
Esta investigación permitió identificar las zonas de mayor infestación en el área
de estudio, esto porque el modelo toma en cuenta la estructura de dependencia es-

49
Probabilidad, Estadı́stica y sus Aplicaciones

pacial que presenta la enfermedad, lo cual es muy importante para los agricultores y
campesinos que cultivan el plátano a la hora de implementar las medidas de control
para la Sigatoka negra, ya que saber con precisión sobre que áreas aplicar medidas
de control disminuye la reproducción de la enfermedad y por ende baja el ı́ndice de
infestación.

Debido al comportamiento de los semivariogramas fue el modelo Wave el que


mejor ajustó, ya que la forma de los semivariogramas tendı́a a subir y bajar a lo
largo del rango.

Se puede resaltar en base a los resultados obtenidos que el ı́ndice de infestación


es un poco menor en los últimos meses del año y su rango de variación es más
pequeño, ya que en el mes de julio-agosto se encuentra entre 30 % y 46 %, mientras
que en la primera quincena de noviembre esta entre 36 % y 43 %, además de inferir
ligeramente con los resultados de la segunda quincena de noviembre que para esa
etapa del año el ı́ndice de infestación presenta un comportamiento diferente al resto
de los meses. Esto se podrı́a deber a cambios en la temperatura o disminución en
la precipitación pluvial, pero eso quedará como un trabajo posterior.

50
Probabilidad, Estadı́stica y sus Aplicaciones

Bibliografı́a

[1] Alvarez E., Pantoja A., Gañan L., & Ceballos G.. Estado del arte
y opciones de manejo del Moko y la Sigatoka negra en América Latina y el
Caribe, 2013.
[2] Alves M. D. C., de Carvalho L. G., Pozza E. A., Sanches L., &
Maia J. D. S.. Ecological zoning of soybean rust, coffee rust and banana black
sigatoka based on Brazilian climate changes. Procedia Environmental Sciences,
6, 35-49, 2011.
[3] Banerjee S., Carlin B. P., & Gelfand A. E.. Hierarchical modeling and
analysis for spatial data. Crc Press, 2014.
[4] Carlier J., Fouré E., Gauhl F., Jones D. R., Lepoivre P., Mourichon
X., Pasber-Gauhl C. & Romero R. A.. Black Leaf Streak, Diseases of
Banana, Abaca and Enset. D. R. Jones, ed. CAB International, Wallingford,
UK, 1985.
[5] Chillet M., Abadie C., Hubert O., Chilin-Charles Y. & de Bellaire
L. D. L.. Sigatoka disease reduces the greenlife of bananas. Crop Protection,
28(1), 41-45, 2009.
[6] Cook D. C., Liu S., Edwards J., Villalta O. N., Aurambout J. P.,
Kriticos D. J., ... & De Barro, P. J.. Predicted economic impact of black
Sigatoka on the Australian banana industry. Crop protection, 51, 48-56, 2013.
[7] Cressie N.. Statistics for spatial data. John Wiley & Sons, 2015.
[8] Fouré E. Black Leaf Streak Disease of Bananas and Plantains (Mycosphae-
rella fijiensis Morelet). Study of the symptoms and stages of the disease in
Gabon. IRFACIRAD, Parı́s, 1985.
[9] Freitas A. S., Pozza E. A., Alves M. C., Coelho G., Rocha H. S., &
Pozza, A. A. A.. Spatial distribution of Yellow Sigatoka Leaf Spot correlated
with soil fertility and plant nutrition. Precision agriculture, 17(1), 93-107, 2016.
[10] Gaetan C. & Guyon X.. Spatial statistics and modeling. New York: Springer,
2010.
[11] Marin D. H., Romero R. A., Guzmán M. & Sutton T. B.. Black Siga-
toka: an increasing threat to banana cultivation.. Plant disease, 87(3), 208-222,
2003.

51
Probabilidad, Estadı́stica y sus Aplicaciones

[12] Matheron G.. Traitó de géostatistique appliquée, tome i: Mémoires du bureau


de recherches géologiques et miniéres. Editions Technip, Paris, 14, 1962.
[13] Meredith D. S. & Lawrence J. S.. Black leaf streak disease of bananas
(Mycosphaerella fijiensis): Symptoms of disease in Hawaii, and notes on the
conidial state of causal fungus. Trans. Br. Mycol. Soc. 52:459-476, 1969.
[14] Ribeiro Jr P. J. & Diggle P. J.. Model Based Geostatistics. Springer Series
in Statistics, 2007.
[15] Rhodes P. L.. A new banana disease in Fiji. Comm. Phytopathol. News
10:38-40, 1964.

52
Probabilidad, Estadı́stica y sus Aplicaciones

Capı́tulo 5
Aplicación del análisis de superviviencia en datos de pacientes sometidos a trans-
plante renal.

Jorge Antonio Gil Mota, Bulmaro Juárez Hernández y Vı́ctor Hugo Vázquez
Guevara

Benemérita Universidad Autónoma de Puebla,


Facultad de Ciencias Fı́sico Matemáticas,
Av San Claudio y 18 sur, Col. San Manuel,
C.P. 72570, Puebla, Puebla,
[email protected], [email protected],
[email protected]
Resumen. En este trabajo se modelizó el rechazo del injerto renal, identifi-
cando las caracterı́sticas clı́nicas y los factores de riesgo que influyen en la pérdida
del injerto, para esto se realizó un análisis con el enfoque de supervivencia en los
pacientes con injerto renal cuya cirugı́a se realizó en el Hospital General Regional,
número 36 del Instituto Mexicano del Seguro Social (IMSS), de la ciudad de Puebla,
Pue., México, entre los años 2006 y 2014.

Abstract. In this work, kidney transplant rejection was modeled, identifying the
clinical characteristics and risk factors that influence graft loss, for which an analysis
was made with the survival approach in patients with renal graft whose surgery was
performed in the Regional General Hospital, number 36 of the Mexican Institute of
Social Security (IMSS), of the city of Puebla, Pue., Mexico, between 2006 and 2014.

Palabras clave: Análisis de supervivencia, modelación estadı́stica, modelo de


riesgo relativo, rechazo en injertos renales.

5.1. Introducción
El análisis de supervivencia se puede definir como el conjunto de métodos es-
tadı́sticos destinados al análisis de datos que provienen de observar la ocurrencia
de un evento, llamado falla, el cual sólo puede suceder a lo más una vez. Algunos
ejemplos de falla son la muerte de un paciente en un ensayo clı́nico, encontrar la
primera filtración de agua en una tuberı́a, el divorcio en una pareja, la primera
contratación de un recién egresado en ciencias, etc.

Al observar el fenómeno de interés desde un punto inicial, llamado origen, se ob-


tiene el registro del momento en que se presenta la falla, como la forma más intuitiva

53
Probabilidad, Estadı́stica y sus Aplicaciones

de medir el momento de falla es el tiempo, frecuentemente es llamado tiempo de


falla o tiempo de vida, sin embargo, este momento puede estar dado en términos
más variados, como son: longitud, volumen, ingreso, etc., al igual que la defini-
ción del evento falla, las unidades de medición varı́an de acuerdo al fenómeno de
estudio, pero conservan el hecho de ser medidas en términos de cantidades positivas.

En la práctica, existen factores que impiden registrar cada tiempo de falla, ge-
neralmente debido a la conclusión del periodo de observación, en este caso se dice
que el individuo cuyo momento no se registra presenta censura. A diferencia de los
modelos usuales de regresión, los métodos y modelos del análisis de supervivencia
incorporan de forma correcta información tanto de observaciones censuradas como
no censuradas.

5.2. Conceptos básicos del análisis de superviven-


cia
En el análisis estadı́stico los tiempos de falla se modelizan a través de varia-
bles aleatorias estrictamente positivas. En lo siguiente se considera una población
homogénea de individuos cuyos tiempos de falla son idénticamente distribuidos y
están representados por la variable aleatoria (v. a.) T . La distribución de la v. a.
T , denotada por F (·), es caracterizada principalmente por las funciones de super-
vivencia, riesgo y riesgo acumulado, cuya interpretación permite obtener diferentes
puntos de vista acerca del fenómeno de estudio.

Definición 5.2.1 La función de supervivencia de la v. a. T es la función S :


R → [0, 1] cuya regla de correspondencia es

S(t) := P {T > t} (5.1)

y denota la probabilidad de que un individuo sobreviva más allá del instante t, [5].

Definición 5.2.2 La función de riesgo o tasa de fallo instantánea, se define


como la función h : R → R+ dada por

 lim P {t ≤ T < t + ∆|T ≥ t}
h(t) := ∆→0+ ∆ (5.2)
P {T = t|T ≥ t}

si T es una v. a. continua en el primer caso y si T es una v. a. discreta en el segun-


do caso. En el primer caso, la función de riesgo representa la razón instantánea de
cambio de la probabilidad condicionada a no haber presentado la falla aún, mientras
que en el segundo caso, denota la probabilidad condicional, [8].

Si a es un elemento en R tal que P {T = a } > 0, entonces a se denomina átomo


de probabilidad de la v. a. T . Para trabajar con v. a. discretas y mixtas (discretas y
continuas) por cada átomo de probabilidad aj , con j = 1, 2, . . ., se asigna a la den-
sidad de probabilidad una componente fj δ(t − aj ), t ∈ R, donde fj := P {T = aj }

54
Probabilidad, Estadı́stica y sus Aplicaciones

y δ(·) denota a la función Delta de Dirac en cero. En base a la notación previa,


tenemos los siguientes resultados:

Proposición 5.2.3 Si T es una v. a. continua, con función de densidad f entonces


para cada t ≥ 0 se cumple que
Z ∞
1. S(t) = f (u)du,
t

f (t)
2. h(t) = ,
S(t)
Z t
3. S(t) = exp(−H(t)), donde H(t) := h(u)du es llamada la función de
0
riesgo acumulado,

4. f (t) = h(t) exp(−H(t)).

Proposición 5.2.4 Si T es una v. a. puramente discreta entonces para cada t ≥ 0


se cumple que

P fj
1. h(t) = hj δ(t−aj ), con hj = , donde S(aj −) denota al lı́mite lateral
j=1 S(aj −)
izquierdo de S en el punto aj ,
Q
2. S(t) = (1 − hj ),
j:aj ≤t

3. f (t) = h(t)S(t−).

5.3. Covariables en modelos de supervivencia


Frecuentemente, en estudios de supervivencia se registran datos de variables que
podrı́an estar relacionadas con el tiempo de vida, el uso de estos datos en el análisis
puede ayudar a representar la heterogeneidad de la población, por lo que se deno-
minan variables explicativas o covariables. Por ejemplo, al estudiar el proceso
de rechazo en injertos renales, variables demográficas como la edad, sexo, lugar de
procedencia, variables médicas como el esquema de medicamentos pretransplante,
la presencia de diabetes, la existencia o no de diálisis previa, la presencia de bacte-
rias e infecciones especı́ficas y variables fisiológicas como el ı́ndice de masa corporal
(IMC) y el tipo de sangre pueden influir en la supervivencia del injerto, [6] y [7]. En
algunos estudios la heterogeneidad de la población se debe a la aplicación de cierto
tratamiento y esto se representa a través de covariables categóricas, por ejemplo,
en [13], Xuan Chen y Michael Baron estudian cómo la aplicación de un tratamiento
farmacológico influye en la función de riesgo en pacientes adictos a la metanfeta-
mina en un ensayo clı́nico realizado por Research Across America en la ciudad de
Dallas, Texas.

55
Probabilidad, Estadı́stica y sus Aplicaciones

En lo siguiente, se considera que cada tiempo de falla T tiene asociado un vec-


tor de covariables Z = (Z1 , . . . , Zp )0 , donde estas son medidas antes del tiempo
0, el vector Z puede incluir variables cuantitativas (como presión sanguı́nea, edad,
temperatura y peso) y variables cualitativas (como género, tratamiento y nivel so-
cieconómico).

En algunos casos, el interés es comparar la supervivencia de la población con


respecto a un conjunto de condiciones estándar, por ejemplo, un grupo al que no se
le aplica tratamiento, por lo que es conveniente definir Z = 0 para los individuos
que poseen estas condiciones.

Principalmente, existen dos formas de incluir covariables en el análisis de super-


vivencia, la primera se basa en utilizar transformaciones del tiempo, asumiendo que
el efecto de las covariables consiste en alterar la tasa en la cual el tiempo transcurre,
si el efecto es multiplicativo se denomina modelo de vida acelerada o modelo
de falla acelerada. La segunda forma consiste en especificar la forma en que las
covariables afectan a la función de riesgo de la v. a. T , siendo el caso más popular
el modelo de riesgo relativo o modelo de Cox, propuesto por David Cox en
1972, [4].

Definición 5.3.1 En el modelo de vida acelerado existe una función φ : Rp → R+


que depende de un vector fijo de parámetros desconocidos β ∈ Rp , que satisface que
φ(00; β ) = 1 (caso estándar) y
T0
T1 = , (5.3)
φ(ZZ; β)
donde T1 denota el tiempo de vida del individuo con vector de covariables Z y T0
es el tiempo de falla en el caso estándar.

Definición 5.3.2 En el modelo de riesgo relativo la función de riesgo de un indi-


viduo con vector de covariables Z esta dada por

β 0Z )h0 (t), para cada t ≥ 0,


h(t; Z ) = ϕ(β (5.4)

en donde h0 es una función de riesgo arbitraria correspondiente al caso Z = 0 , lla-


mada función de riesgo base, β ∈ Rp es un vector de parámetros desconocidos y
ϕ : R → R+ es una función positiva que satisface que ϕ(0) = 1, llamada función
de riesgo relativo, [9].

En el modelo (5.4), la componente lineal, β 0Z , no incluye término constante, ya


que un posible término constante β0 puede ser fácilmente incluido como factor en h0 .

5.4. Caso de estudio: Rechazo de injerto renal


El trasplante renal es aceptado universalmente como la mejor terapia para el en-
fermo renal crónico; sin embargo, a pesar de que los avances en las últimas décadas

56
Probabilidad, Estadı́stica y sus Aplicaciones

han mejorado el éxito del trasplante, el rechazo continúa siendo uno de los princi-
pales problemas, [6].

El rechazo del injerto renal es una respuesta inmunológica compleja del huésped,
cuando se expone a antı́genos no compatibles del donante.

Son múltiples los factores que han contribuido a mejorar la supervivencia del in-
jerto y del paciente; entre los más importantes se mencionan el uso de nuevas drogas
inmunosupresoras, las transfusiones especı́ficas pre trasplante, una mayor compati-
bilidad entre el donante y el receptor, un seguimiento organizado del paciente y un
óptimo manejo de las múltiples complicaciones pos trasplante. Sin embargo, aún el
20 % de pacientes padecen el rechazo durante el primer año pos trasplante, [7].

5.4.1. Materiales y procedimiento


En este trabajo se realizó un estudio retrospectivo de pacientes sometidos a tras-
plante renal en el Hospital General Regional, número 36 del Instituto Mexicano del
Seguro Social (IMSS), San Alejandro de la ciudad de Puebla, Pue., México, durante
el periodo comprendido entre los años 2006 y 2014. Para tal efecto se cuenta con el
registro de los pacientes que recibieron el trasplante ası́ como sus datos de acuerdo
a la Tabla 1.

Variable (Nomenclatura)
Lugar de Procedencia (LP)
Sexo (S)
Tipo de trasplante (TT)
Constante (C)
Hemotipo del paciente (HP)
Hemotipo del donador (HD)
Tipo de diálisis pre trasplante (TDP)
Causa de la insuficiencia renal (CIR)
Edad al momento del trasplante (EMT)
Talla (T)
Índice de masa corporal (IMC)
Edad del diágnostico de insuficiencia (EDIR)
Filtración glomerular (FGMT)
Creatinina Sérica (CSMT)
Tiempo de rechazo (TR)
Indicador de censura (EST)

Tabla 5.1: Variables medidas en pacientes que recibieron el transplante renal. Fuente:
Elaboración propia a partir de la base de datos proporcionada por el IMSS.

Se definió como rechazo del injerto a la presencia de deterioro agudo de la fun-


ción renal asociado a cambios patológicos especı́ficos como: elevación del valor basal

57
Probabilidad, Estadı́stica y sus Aplicaciones

de la creatinina, disminución notable de los volúmenes urinarios y daño severo re-


portado en la escala de Banff, [6].

Los criterios de inclusión fueron: pacientes sometidos a trasplante cuyo proce-


dimiento resultó exitoso. Se excluyó a los pacientes cuyó trasplante no se logró y
aquellos para los cuáles no hubo seguimiento pos operatorio, además se excluyó
a los pacientes que no tenı́an información sobre todas las variables, por lo que se
incluyeron en el análisis 77 pacientes de los 89 registrados durante el periodo de
estudio.

5.4.2. Análisis no paramétrico


Para el análisis de los datos se utilizó el software estadı́stico R en su versión
3.4.4 para Windows y las librerı́as flexsurv [2], ggplot2 [12], survminer [1] y survival
[11].

Por la naturaleza del estudio, cada paciente tiene un tiempo origen y tiempo de
censura diferente, esto se debe a que la fecha de trasplante y el seguimiento para
cada paciente no es el mismo, por lo que se asumió que el esquema de censura es
censura aleatoria independiente.

En cuanto a las caracterı́sticas de la población, se tiene un promedio de edad


15.05 años (con una desviación estándar de 4.2), 46 (59.7 %) pacientes del sexo mas-
culino, 31 (40.3 %) del sexo femenino, 1. Con respecto al lugar de procedencia, 53
pacientes son originarios del estado de Puebla y los restantes 24 de los estados de
Oaxaca y Tlaxcala. 27 (35 %) pacientes presentaron episodios de rechazo del injerto,
mientras que la población restante tuvo tiempos de seguimiento que van desde 1
semana hasta 8 años.
25

Masculino
Femenino
20
Frecuencia

15
10
5
0

5 10 15 20 25 30 35

Edad

Figura 5.1: Histograma de edad asociados por género.

Como un primer paso en el análisis se estudió el comportamiento del proceso


sin considerar el efecto de covariables, es decir, considerando a la población como
homogénea, este análisis se hizo con el comando survifit, [11], con lo que se obtuvo

58
Probabilidad, Estadı́stica y sus Aplicaciones

el estimador de Kaplan-Meier para la supervivencia, en la Figura 5.2a se muestra


la función de supervivencia estimada para el tiempo de rechazo del injerto renal en
azul, también se muestra en color claro el intervalo de confianza al 95 % para estas
estimaciones, dado que hacia el final del periodo de observación se tiene registro
de menos individuos (y por tanto menos información), estos intervalos tienden a
ser más amplios conforme el tiempo aumenta. A partir de estas estimaciones y la
proposición 5.2.3, se calculó la estimación de Kaplan-Meier para función de riesgo
acumulado, Figura 5.3.

Podemos observar que la supervivencia disminuye gradualmente durante el pri-


mer año, teniendo una disminución abrupta entre este y el segundo año para despúes
continuar disminuyendo gradualmente, esto también se observa en la Figura 5.3 don-
de el riesgo acumulado aumenta significativamente en el mismo periodo de tiempo.
Mediante el comando quantile se obtuvo una estimación para el valor correspon-
diente al 80 % de la función de supervivencia, el cual se sitúa en t = 12 meses,
lo cual desde el punto de vista frecuentista es consistente con la afirmación hecha
por Cortés, [6], acerca de que el 20 % de los pacientes padecen rechazo del injerto
durante el primer año pos trasplante.

(a)

Estimación + Kaplan−Meier

1.00 +
++
+ +
0.75 +
+ +
+ +
S(t)

0.50

0.25

0.00
0 25 50 75
t: tiempo en meses
Estimación

(b)

− 77
0
34
25
26
50
t: tiempo en meses
6
75

Figura 5.2: (a) Estimación de la función de supervivencia y (b) número de individuos


en riesgo.

5.4.3. Análisis paramétrico


En presencia de datos censurados por la derecha es posible derivar una expresión
para la verosimilitud bajo esquemas suficientemente amplios, mediante el comando
flexsurvreg, [2], se usó esta expresión para calcular los estimadores de máxima verosi-
militud (EMV) basados en los tiempos de rechazo para los modelos “Exponencial”,
“Gamma Generalizado”, “Gompertz”, “Log Logı́stico”, “Log Normal” y “Weibull”.
En la Figura 5.4a se muestran los ajustes para la función de supervivencia y en la
Figura 5.4b para la función de riesgo acumulado, en ambas gráficas se marcó en
negro el ajuste no paramétrico de Kaplan-Meier. De manera gráfica el modelo que
parece ajustarse mejor es el modelo Gompertz, para validar esta afirmación se usó

59
Probabilidad, Estadı́stica y sus Aplicaciones

Estimación + Kaplan−Meier

0.6
+ +

+ +
0.4

H(t)
0.2
+ +
+
+
0.0 +
0 25 50 75
t: tiempo en meses

Figura 5.3: Estimación de la función de riesgo acumulado.

䔀砀瀀漀渀攀渀挀椀
愀氀 䔀砀瀀漀渀攀渀挀椀
愀氀

䜀愀洀洀愀 
䜀攀渀攀爀
愀氀 䜀愀洀洀愀 
䜀攀渀攀爀
愀氀

䜀漀洀瀀攀爀
琀稀 䜀漀洀瀀攀爀
琀稀

䰀漀最 
䰀漀最
猀琀椀
挀愀 䰀漀最 
䰀漀最
猀琀椀
挀愀

䰀漀最 
一漀爀
洀愀氀 䰀漀最 
一漀爀
洀愀氀

䬀愀瀀氀
愀渀ⴀ
䴀攀椀
攀爀 䬀愀瀀氀
愀渀ⴀ
䴀攀椀
攀爀

圀攀椀
戀甀氀
氀 圀攀椀
戀甀氀

(a) Función de supervivencia (b) Función de riesgo acumulado

Figura 5.4: Ajustes paramétricos mediante la función de verosimilitud.

el criterio de información de Akaike (AIC).

gompertz lnorm gammagen llogis weibull exp


AIC 290.882 291.911 292.008 293.976 296.033 299.877

Tabla 5.2: Valores de AIC := 2p − 2l(θ̂), donde p es el número de parámetros en el


modelo y l(θ̂) denota a la función de log verosimilitud evaluada en el EMV.

En la tabla 5.2, se puede observar que el modelo “Gompertz” es el que presentó


menor AIC, por lo que se seleccionó y se verificó su validez mediante el gráfico
de bondad de ajuste, el cual consiste en un gráfico de dispersión de 1 − Ŝ(ti ) vs
F̂Gompertz (ti ; θ̂), donde Ŝ(ti ) es la estimación no paramétrica de la curva de super-
vivencia y F̂Gompertz (ti ; θ̂) es la estimación de máxima verosimilitud suponiendo el
modelo “Gompertz”, Figura 5.5.

Los puntos en el diagrama se localizan alrededor de la recta identidad, lo cual es


evidencia a favor del buen ajuste del modelo Gompertz, aunque también se destaca
la existencia de un patrón en el orden de los puntos.

60
Probabilidad, Estadı́stica y sus Aplicaciones

0.5

0.4

Estimación Kaplan−Meier
0.3

0.2

0.1

0.0

0.0 0.1 0.2 0.3 0.4 0.5


Estimación paramétrica

Figura 5.5: Gráfico de bondad de ajuste, estimación no paramétrica vs estimación


con el modelo Gompertz.

5.4.4. Análisis semiparamétrico: Modelo de riesgo relativo


Uno de los objetivos al estudiar un fenómeno es encontrar un modelo parsimo-
nioso que se ajuste de forma adecuada a los datos observados, con este objetivo
en mente, se empleó un método de selección hacia delante y de eliminación hacia
atrás, para reducir el número de covariables a tratar, lo cual arrojó como variables
significativas a EMT, C y LP, donde EMT y C son variables continuas mientras que
LP es una variable categórica cuyos niveles son Puebla (caso base), Oaxaca y Tlax-
cala. Al ajustar este modelo mediante la función coxph, [11], introduciendo variables
dummies para la variable categórica LP, se obtuvieron los siguientes resultados:

Call:
coxph(formula=Surv(TR, EST)~EMT+C+LP, data=dat)

coef exp(coef) p
EMT -0.1530 0.8582 0.015
C 6.7556 858.8700 0.055
LPOaxaca -0.4835 0.6166 0.655
LPTlaxcala -0.9159 0.4002 0.055

Likelihood ratio test=10.3 on 4 df, p=0.0359


n= 77, number of events= 27

en donde se destaca que al usar la prueba de razón de verosimilitud con un valor de


significancia de 0.05 (mayor al p-valor 0.0359) se rechaza que los coeficientes sean
iguales a cero, esto brinda evidencia a favor de la posibilidad de modelizar el tiempo
de rechazo a tráves de un modelo de riesgo relativo.

5.5. Conclusiones
En este trabajo se utilizó el criterio de Aikake para eligir el modelo Gompertz
como el modelo paramétrico que mejor representa el comportamiento del tiempo
de rechazo en injertos renales. El modelo Gompertz es usado para modelizar pro-
cesos que tienen un crecimiento lento al inicio y al final, usando el estimador de

61
Probabilidad, Estadı́stica y sus Aplicaciones

Kaplan-Meier, Figura 5.3, se ha mostrado que la función de riesgo acumulado para


los pacientes de este estudio tiene este comportamiento.

Al realizar el análisis semiparámetrico se encontró que el modelo de riesgo rela-


tivo representa una opción viable para estudiar la forma en que las caracterı́sticas
individuales de cada paciente como la constante médica (C), la edad al momento del
transplante (EMT) y el lugar de procedencia (LP) influyen en el tiempo de rechazo
del injerto renal.

62
Probabilidad, Estadı́stica y sus Aplicaciones

Bibliografı́a

[1] A. Kassambara, M. Kosinski, B. Przemyslaw & F. Scheipl. Paquete


“survminer” versión 0.4.2, CRAN, Enero 2018.
[2] C. Jackson, P. Metcalfe & J. Amdahl. Paquete “flexsurv” versión 1.1,
CRAN, Marzo 2017.
[3] D. Collet. Modelling survival data in medical research. Springer-
Science+Business Media, B.V., 1994.
[4] D. R. Cox. Regression models and life-tables. Journal of the Royal Statistical
Society, serie B (Methodological), 1972.
[5] D. R. Cox & D. Oakes. Analysis of survival data. Chapman and Hall, 1984.
[6] E. Cortés Paz, M. Hernández Domı́nguez et. al. Terapia inmunosupre-
sora en el trasplante renal. Guı́a de Práctica Clı́nica IMSS, 2008.

[7] G. Gamarra & J. Gómez. Rechazo en pacientes con trasplante renal. Acta
Médica Colombiana Vol. 16 No. 5, Septiembre 1991.
[8] J. D. Kalbfleisch & R. L. Prentice. The statistical analysis of failure
time data. John Wiley & Sons, 2002.
[9] J. F. Lawless. Statistical models and methods for lifetime data. Wiley Inters-
cience, 2003.
[10] J. P. Klein & M. L. Moeschberger. Survival analysis techniques for
censored and truncated data. Springer-Verlag, 2003.
[11] T. Therneau & T. Lumley. Paquete “survival” versión 2.42 − 3, CRAN,
Abril 2018.
[12] W. Hadley & W. Chang. Paquete “ggplot2” versión 2.2.1., CRAN, Diciem-
bre 2016.
[13] X. Chen & M. Baron. Change-point analysis of survival data with application
in clinical trials. Scientific Research Publishing Inc., volumen 4, páginas 663 −
677, Octubre 2014.

63
Probabilidad, Estadı́stica y sus Aplicaciones

Capı́tulo 6
Modelación espacial de la infestación del ácaro rojo de las palmas (Raoiella In-
dica) en el estado de Guerrero con un proceso espacial Poisson

David Alejandro Ozuna Santiago, Marı́a Guzmán Martı́nez,


Flaviano Godı́nez Jaimes y Ramón Reyes Carreto

Universidad Autónoma de Guerrero,


Unidad Académica Matemáticas,
Av. Lázaro Cárdenas S/N, Ciudad Universitaria,
C.P. 39087, Chilpancingo, Guerrero,
David [email protected], [email protected],
[email protected], [email protected]

Resumen. El estado de Guerrero es el primer productor de palma de cocotero,


actualmente tiene entre 40,000 a 50,000 hectáreas dedicadas a dicho cultivo. Este
contribuye en gran medida a la economı́a de Guerrero. Dado que la palma de co-
cotero tiene un impacto económico importante en varios sectores de la sociedad, es
necesario entonces no descuidar aspectos fitosanitarios para asegurar la producción
y calidad. Una manera de hacerlo es con acciones que controlen las plagas que lo
afectan; una de ellas es el ácaro rojo, que ocupa el cuarto lugar en pérdidas de
producción, de ahı́ la importancia de su control. Este trabajo tuvo por objetivo
modelar y estudiar la distribución espacial de la infestación del ácaro rojo a través
de un proceso espacial Poisson en toda la zona costera de Guerrero que comprende
Costa Grande, Costa Chica y Acapulco durante el año 2017. Con el estudio se logró
determinar las zonas de mayor infestación, esto porque el modelo toma en cuenta la
estructura de variabilidad espacial que presenta la plaga, lo cual es muy importante
en la agricultura de precisión.
El conocimiento de las zonas de mayor infestación permite una mejor dirección de
los controles quı́micos, logrando con ello una reducción de los costos por el manejo
del cultivo. La dirección de las medidas de control sobre zonas especı́ficas disminuye
la resistencia de la plaga, trae beneficios a la salud de las personas y no se conta-
mina más al medio ambiente por el uso excesivo de los quı́micos. Los datos fueron
proporcionados por SENASICA. Tomando en cuenta la metodologı́a y la base de
datos, este estudio es el primer análisis realizado hasta el momento para el ácaro
rojo de la palma de cocotero, lo cual es innovador en el área de fitosanidad del
estado de Guerrero.

Abstract.The state of Guerrero is the first producer of coconut palm, currently has
between 40,000 to 50,000 hectares dedicated to that crop. This contributes greatly
to Guerrero’s economy. Given that the coconut palm has a significant economic im-
pact in several sectors of society, it is necessary not to neglect phytosanitary aspects

64
Probabilidad, Estadı́stica y sus Aplicaciones

to ensure production and quality. One way to do this is with actions that control
the pests that affect it; one of them is the red acarus, which occupies the fourth
place in losses of production, hence the importance of its control. The objective
of this work was to model and study the spatial distribution of the red acarus in-
festation through a Poisson spatial process in the entire coastal area of Guerrero
that includes Costa Grande, Costa Chica and Acapulco during the year 2017. With
the study was achieved determine the areas of greatest infestation, this because the
model takes into account the structure of spatial variability that the pest presents,
which is very important in precision agriculture.

The knowledge of the zones of greater infestation allows a better direction of the
chemical controls, achieving with it a reduction of the costs by the handle of the
crop. The direction of the control measures on specific zones decreases the resistance
of the pest, brings benefits to the health of people and is not contaminated more
to the environment by the excessive use of chemicals. The data was provided by
SENASICA. Taking into account the methodology and the database, this study is
the first analysis carried out so far for the red acarus of the coconut palm, which is
innovative in the area of phytosanitation in the state of Guerrero.

Palabras clave: Cadenas de Markov Monte Carlo (MCMC), Dependencia espa-


cial, Modelos Lineales Generalizados Mixtos.

6.1. Introducción
Raoiella Indica es una plaga originaria de la India, encontrada en hojas del cocotero
(Cocos nucifera L.). Su primera notificación en América se produjo en el año 2004,
en Martinica, región que invadió rápidamente. Hoy la plaga se encuentra en muchos
paı́ses del continente americano, en los que destacan los de las regiones tropicales
[8]. Raoiella Indica ha sido considerada como una plaga severa en el cocotero (Co-
cos nucifera L.), en la palma Areca (Areca catechu L.) en India y en la palma Dátil
(Phoenix dactylifera L.) en Egipto. En el 2004 fue considerada como severa en la
región del Caribe, y se ha distribuido ampliamente en la mayorı́a de las islas. Poste-
riormente, esta plaga fue registrada en Florida, Venezuela y más recientemente en
México, Brasil y Colombia [16]. Cabe destacar que su alimentación provoca amari-
llamiento de la zona afectada y, cuando aumenta la densidad poblacional del ácaro,
se produce una clorosis generalizada. De acuerdo a muestreos realizados en tres es-
pecies de palmas en Quintana Roo en el 2015, se observó que el mayor número de
individuos de Raoiella Indica se encuentran en cocotero, donde a altas densidades
de la plaga los porcentajes de daños pueden estar entre el 60 y 90 por ciento [8].

Considerando que el estado de Guerrero es el primer productor de palma de co-


cotero, con una superficie sembrada de 40,000 a 50,000 hectáreas, aproximadamente
[9]; es importante entonces cuidar los porcentajes de la infestación de Raoiella Indi-
ca. Dado que la palma de cocotero tiene un impacto económico importante en varios
sectores de la sociedad, es necesario entonces no descuidar aspectos fitosanitarios
para asegurar la producción y calidad. Una manera de hacerlo es con acciones que
controlen las plagas que lo afectan. A estas acciones las denominamos agricultura

65
Probabilidad, Estadı́stica y sus Aplicaciones

de precisión (también conocida como agricultura especı́fica del sitio).

La agricultura de precisión tiene como objetivo usar la tecnologı́a de la informa-


ción para adecuar el manejo de suelos y cultivos a la variabilidad presente dentro de
un lote. La agricultura de precisión involucra el uso de sistemas de posicionamiento
global (GPS, por sus siglas en inglés) y de otros medios electrónicos para obtener
datos del cultivo. Las tecnologı́as de la agricultura de precisión permiten satisfacer
una de las exigencias de la agricultura moderna: el manejo óptimo de grandes ex-
tensiones [7]. En relación con la infestación de una plaga en el campo, es importante
mapear la intensidad de una plaga. En un proyecto brasileño sobre la predicción
espacial del ácaro rojo de las palmas (Raoiella Indica), un objetivo fue investigar el
impacto potencial del ácaro rojo invasivo en la mayorı́a de las regiones brasileñas;
se observó que en las principales áreas de producción de coco (Cocos nucifera L.) y
en las regiones donde el cultivo está en expansión la plaga empeora en escenarios de
cambio climático en comparación con el perı́odo de referencia [11]. En la práctica,
el agricultor (o su asesor) debe establecer una relación entre las propiedades del cli-
ma y la presencia del ácaro a partir de observaciones extensivas recolectadas en los
años subsiguientes, donde solo se recolecta un número limitado de conteos del ácaro.

En la actualidad diversos autores han estudiado esta plaga. Los dos siguien-
tes autores realizaron un estudio mediante componentes principales: Vásquez et al.
[15], descubrieron que el cambio de la planta hospedera influye en la alimentación
de Raoiella Indica y en consecuencia afecta su tamaño [16]; Flores-Galano et al. [8]
concluyen que existe poca información sobre el efecto de los factores abióticos en la
fluctuación poblacional de Raoiella Indica. Sin embargo, la información disponible
sugiere que este ácaro está bien adaptado a las condiciones de clima tropical y que
en los periodos prolongados de sequı́a pueden favorecer el incremento poblacional
[8]. Vásquez et al. [15], discuten las medidas morfometricas y barreras de alimenta-
ción de Raoiella Indica en la cual se basan en la distribución espacial del ácaro rojo
de las palmas [15]. Por su parte Roda et al. [14], estudian la distribución espacial
del ácaro rojo de las palmas donde interpretan la variabilidad total y la densidad de
la varianza total que se modela mediante la ley de poder de Taylor, en su estudio
enfatizan el tipo de muestreo que debe llevarse para la presencia-ausencia de conteos
del ácaro rojo de las palmas [14]. Notemos que existen aspectos importantes confor-
me a la distribución del ácaro, como Pielou [12] argumenta que su distribución es
de manera no aleatoria en Europa, donde determina algunas distribuciones, entre
las que destaca doble Poisson, Binomial Negativa y Neyman [12]. Esto es de vital
importancia para tener conocimientos previos conforme a la modelación espacial de
la infestación del ácaro rojo de la palmas.

La geoestadı́stica es una de las ramas principales de la estadı́stica espacial Cres-


sie [4]. Utiliza la modelación e inferencia para fenómenos espaciales continuos. Navia
et al.[11] predijeron la distribución espacial del ácaro rojo de las palmas (Raoiella
Indica) usando escenarios actuales y futuros del cambio climático [11]. Los métodos
geoestadı́sticos tradicionales para la predicción de variables espaciales Cressie [4] se
basa en el supuesto de normalidad, que no es válido para los datos de conteo. Este
trabajo tuvo como objetivo modelar y estudiar la distribución espacial de la infes-
tación del ácaro rojo a través de un proceso espacial Poisson, en el cual se utilizó

66
Probabilidad, Estadı́stica y sus Aplicaciones

el enfoque en Diggle et al. [6], donde los datos espaciales se analizaron utilizando
modelos lineales mixtos generalizados (GLMM por sus siglas en inglés). Para la pre-
dicción espacial del proceso se utilizó Cadenas de Markov Monte Carlo (MCMC)
con un algoritmo MCMC más eficiente, el cual está basado en las actualizaciones
de Langevin-Hastings.

Este trabajo esta organizado de la siguiente manera. En la Sección 6.2 se discute


el modelo para los datos de conteo y los GLMM espaciales. Los algoritmos para la
simulación y predicción se describen en la Sección 6.3. Finalmente, en la Sección
6.4 se da una aplicación de la metodologı́a y se presenta la predicción del ácaro en
los sitios no muestreados.

6.2. Marco Teórico


El término geoestadı́stica identifica la parte de la estadı́stica espacial que se refiere
a la variación espacial continua de un fenómeno, S(x), a lo largo de una región espa-
cial continua A ⊂ R2 y puede tratarse como si fuera una realización de un proceso
estocástico S(·) = {S(x) : x ∈ A}. En general, S(·) no es directamente observable.
Los datos disponibles consisten en mediciones Y1 , . . . , Yn tomadas en ubicaciones
x1 , . . . , xn contenidas en A. Ası́ Yi es una versión ruidosa de S(xi ). Se asume que el
diseño de muestreo para x1 , . . . , xn es determinista o estocástico pero independien-
te del proceso S(·), además todos los análisis se llevan a cabo condicionados en las
ubicaciones x1 , . . . , xn .

Los modelos lineales mixtos generalizados [1] son extensiones de modelos li-
neales generalizados [10], los GLMM incorporaran efectos aleatorios no observables
en el modelo, permitiendo de esta forma agregar fuentes adicionales de variabilidad.

A continuación se explican los GLMM para los datos de conteo, donde los efectos
aleatorios se modelan mediante un campo Gaussiano correlacionado espacialmente
[6].

6.2.1. Modelos Lineales Mixtos Generalizados Espaciales


El modelo clásico lineal generalizado (GLM) se define para un conjunto de varia-
bles respuestas mutuamente independientes Y1 , . . . , Yn . Las esperanzas µi = E[Yi ]
Pk
se especifican mediante un predictor lineal h(µi ) = j=1 fij βj , en el que h(·) es
una función conocida, llamada función enlace, fij , i = 1, . . . , k son las variables
explicativas y βj los parámetros de regresión [10]. Una extensión importante de es-
ta clase básica de modelos son los modelos lineales mixtos generalizados, en el que
Y1 , . . . , Yn son mutuamente independientes condicionadas a los valores realizados de
un conjunto de variables aleatorias latentes P U1 , . . . , Un , en este caso las esperanzas
k
condicionales están dadas por h(µi ) = Ui + j=1 fij βj .

67
Probabilidad, Estadı́stica y sus Aplicaciones

Un modelo lineal generalizado espacial (GLSM por sus siglas en inglés) es un


GLMM en el cual U1 , . . . , Un se derivan de un proceso espacial S(·) = {S(x) :
P∈
x A}, con A ⊂ R2 , el cual es un proceso estocástico Gaussiano con E[S(x)] =
p
j=1 fj (x)βj , donde f1 (x), . . . , fp (x) son funciones observadas en la ubicación x,
0 0 0
V ar[S(x)] = σ 2 y ρ(u) = Corr[S(x), S(x )] donde u = ||x − x ||, tal que x y x son
ubicaciones observadas en A. Asumiendo que las mediciones Y1 , . . . , Yn son condicio-
nalmente independientes de S(·), con esperanzas condicionales µi y h(µi ) = S(xi ),
i = 1, . . . , n para una función de enlace conocida h(·). En este modelo la señal del
proceso es {h−1 (S(x)) : x ∈ A}.
T
Sea Y = (Y1 , . . . , Yn ) el vector de las variables respuestas observadas en las
T
ubicaciones x1 , . . . , xn ; S = (S(x1 ), . . . , S(xn )) los valores no observados del pro-

ceso subyacente y S para los valores de S(·) en todas las demás ubicaciones de
interés, A.
La función verosimilitud para el GLSM generalmente no se puede expresar en
forma cerrada, si no sólo como una integral de alta dimensión, es decir
n
Z Y
g yi ; h−1 (si ) p(s; β, θ)ds1 , . . . , sn ,

L(β, θ) = (6.1)
i=1

donde β es un vector p × 1 de parámetros de regresión, θ es una matriz p × p de


los parámetros de covarianza en el modelo, con p < n, g(y; µ) denota la densidad
de la distribución de error parametrizada por la media µ y p(s; β, θ) es la densidad
Gaussiana multivariada para el vector S. La integral anterior es también la constante
de normalización en la distribución condicional de [S|y, β, θ]:
n
Y
g yi ; h−1 (si ) p(s; β, θ).

p(s|y, β, θ) ∝ (6.2)
i=1

En la practica, la alta dimensionalidad de la integral evita el cálculo directo de la


distribución predictiva [S ∗ |y, β, θ].

Los métodos estándar de aproximación de la integral (6,1) y por lo tanto de la


evaluación (6,2) tiene una precisión desconocida en el entorno geoestadı́stico, pero
los métodos Monte Carlo Cadenas de Markov proporcionan una posible solución.

6.2.2. Modelo para Datos de Conteo


Si se consideran las posiciones no observadas de la infestación del ácaro rojo de las
palmas como la realización de un proceso de conteo espacial, entonces un objetivo
clave de la ocurrencia de infestación es la intensidad del ácaro dado por la función
λ(·). Para una ubicación dada x ∈ A y un área A alrededor de x, λ(x)A es aproxi-
madamente el número esperado de ácaros en esa área. Para cada x ∈ A se modela
λ(x) como [3]

λ(x) = exp (S(x)) .

68
Probabilidad, Estadı́stica y sus Aplicaciones

Un GLSM para modelar datos de conteo espacial es el modelo espacial Poisson-


log-linear, en el cual [Yi |S(xi )] sigue una distribución Poisson con media ti exp (s(xi )),
i = 1, . . . , n. El término ti representa un intervalo de tiempo sobre el que se acumula
el conteo correspondiente Yi [6].

Una vez ajustado el modelo se puede predecir la intensidad λ(x0 ) = exp(S(x0 ))


en una ubicación x0 , en la cual no se observó el proceso.

6.3. Predicción para los GLSM


La predicción es parte de un análisis geoestadı́stico. Sea T = T (S(·)) la función de
predicción. Entonces para Y = (Y1 , . . . , Yn )T se tiene la función T = T (Y ).

6.3.1. Algoritmo en un GLSM


Este algoritmo permite predecir el proceso en una ubicación donde no se obser-
vo. Asumiendo que los parámetros en el modelo son conocidos (o en su defecto
estimados), se tiene que la predicción T = T (S ∗ ) se realiza en 3 pasos [5]:
Simular s(1), . . . , s(m) de [S|y] usando MCMC ([6], [3]).
Simular s∗ (j) de [S ∗ |s(j)], j = 1, . . . , m, donde [S ∗ |s(j)] sigue una distribución
Gaussiana multivariada.
Se aproxima el predictor mı́nimo del cuadrado medio del error por medio de1
m
1 X
E[T (S ∗ )|y] ≈ T (s∗ (j)).
m j=1

6.3.2. Predicción de la Intensidad


Para predecir la intensidad en un punto no muestreado de un modelo de datos de
conteo se procede de la siguiente manera. Dada una muestra s(1), . . . , s(m) de [S|y],
obtenida mediante el algoritmo MCMC; y asumiendo que [S(x0 )|s(j)], j = 1, . . . , m
sigue una distribución gaussiana multivariada, lo cual es indispensable para predecir
λ(x0 ) = exp(S(x0 )), entonces:
Calcular E[S(x0 )|s(j)] y V ar[S(x0 )|s(j)], j = 1, . . . , m, usando kriging [5].
Calcular para cada j = 1, . . . , m,

E[λ(x0 )|s(j)] = exp(E[S(x0 )|s(j)] + 0.5V ar[S(x0 )|s(j)])

Aproximar
m
1 X
E[λ(x0 )|y] ≈ E[λ(x0 )|s(j)].
m j=0

Como E[exp(αS)|y] es finita para cualquier α ∈ Rn y además E[S(x0 )|S] es una


función lineal de S y V ar[S(x0 )|S] no depende de S, entonces E[λ(x0 )|y] ≤ ∞, es
decir, la cantidad que se desea aproximar utilizando MCMC existe [5].

69
Probabilidad, Estadı́stica y sus Aplicaciones

6.4. Aplicación
6.4.1. Descripción de los Datos
Los datos proporcionados por SENASICA fueron conteos del ácaro rojo (Raoiella
Indica) de las palmas del cocotero para el año 2017. Dichos muestreos fueron reali-
zados parcialmente en la zona de Acapulco, Costa Chica y Costa Grande del estado
de Guerrero (Figura 6.1).

Figura 6.1: Distribución del ácaro rojo en la zona costera del estado de Guerrero.

Para el análisis de la infestación del ácaro rojo, la base de datos se dividió men-
sualmente. En la Figura 6.2 se observa la intensidad de infestación del ácaro rojo
de las palmas para los meses de Enero, Mayo, Septiembre y Diciembre. La intensi-
dad del color de los puntos está relacionado con el número de ácaros encontrados
en la zona de muestreo. Observe que hay una tendencia decreciente de Oeste-Este
(Costa grande-Costa Chica) en el número de ácaros rojos. Los valores del ı́ndice de
infestación se encuentran entre un rango de valores de 1.4 y 22.

Los datos de conteo se modelaron utilizando el modelo Poisson-log-linear espe-


cificado en la Sección 6.2.2, con función de correlación exponencial ρ(u) = exp(−u)
para el campo aleatorio gaussiano. En el estudio no existe mucha información dis-
ponible sobre el tipo de función de correlación del conjunto de datos dado, ya que
no se producen observaciones muy cercanas y el campo aleatorio gaussiano no se
observa directamente. Es por ello que por principios de parsimonia, no se incluye
la incertidumbre con respeto a la elección del modelo de correlación en la inferencia.

Con la ayuda de los paquetes geoR [13] y geoRglm [2] del software R se llevó a
cabo el análisis espacial de la infestación del ácaro rojo.

70
Probabilidad, Estadı́stica y sus Aplicaciones

Enero Mayo

Septiembre Diciembre

Figura 6.2: Número de ácaros observados en la zona de estudio por meses.

6.4.2. Predicción de la Intensidad del ácaro Rojo


El objeto principal del estudio es la estimación de la intensidad de la plaga λ(x0 ),
x0 es una ubicación de la zona de estudio donde no se contó el número de ácaros
rojos. La Figura 6.3 muestra las predicciones del logaritmo natural del número de
ácaros rojos (Sección 6.3) en la zona de estudio. Dividiendo los datos mensualmente
se tienen aproximadamente 130 observaciones, que al implementar la metodologı́a
antes descrita (Sección 6.3) se realizan 2100 estimaciones.

71
Probabilidad, Estadı́stica y sus Aplicaciones

Enero Febrero Marzo

19.0
19.0

18.5
1.8

18.5
18.5

1.8
1.8

18.0
1.7

18.0
18.0

1.7
** **
** 1.6
5

17.5
1.7 * 1.6

17.5
17.5

1.6 1.8 *

65
* *
7

7
* *

5
1.
1.

1.
**
1.5

**

1.5
**

6
5

1.
1.4

5
******** ** *** 1.3 ********* *****

1.3
******* *******

4
1.3
1.5
3

17.0

1.
1.5 * **
17.0

1.3

17.0
1.

* *** * *
1.3 ** *** ** ********

1.2
***** *
* * * * *** 1.4

1.25
* *
* **** ** * * ** ** ********

1.2
*

1.25
1.4

1.1
1.2

* * *** ***
1.2

16.5
**** **
16.5

*** 1.4 ** ***


16.5
** *** ***

1.3

16.0
16.0

1.3 1.2
16.0

1.2

15.5
15.5

1.2
15.5

−101.5 −100.5 −99.5 −99.0 −98.5 −101.5 −101.0 −100.5 −100.0 −99.5 −99.0 −101.5 −100.5 −99.5 −99.0 −98.5

Abril Mayo Junio


19.0

19.0
19.0
18.5

18.5
18.5

1.8 1.8
2.0
18.0

18.0
18.0

** ** **
1.7
1.8

** *
17.5

17.5
** *
17.5

2
* 1.8 1.7

1.7
5

* *
1.7

*
1.6

** ** **

1.5
1.8
5
1.5

********* ***** 1.4


5

********* *******

1.5
********* *******
1.4
17.0

17.0
17.0

* ** 1.4 1.6 1.55 *** ***

1.7
** ***** **
1.4 * ***** * ****** **
* *** *** 7
1.45* ** ******** **
*1.5 ** ***** 1. * ** ******1.

1.5

1.5
1.4

1.6 ***4
1.5

*** **
16.5

16.5
*** ***
16.5

** ** ** *** **** **** ***


1.5 1.6
16.0

16.0
16.0

1.4 1.5
1.4
15.5
15.5

15.5

−101.5 −100.5 −99.5 −99.0 −98.5 −101.5 −100.5 −99.5 −99.0 −98.5 −101.5 −100.5 −99.5 −99.0 −98.5

Julio Agosto Septiembre


19.0

19.0
19.0

2.35 2.8
18.5

18.5
18.5

1.8
2.30 2.6
18.0
18.0
18.0

** ** **
** 2.25 ** * 2.4
17.5
17.5

** *
17.5

1.8 1.7 *
1.7

*
2.2

** 2.2 **
1.9

2.25
********* ******** ********* *******
2

********* ******* 2.2


17.0
17.0
17.0

1.55 *** *** 2.20 *** 9


1.
******** ******** ******* 2
*** *** ***
*2.2
1.7

**
*1.5 ** ***** ** *******
1.9

*2.2 ** ***
1.7

1.6 *
1.5

***** ** ****** *
16.5
16.5

** * **
16.5

** *** * ** 2.15 ** *** 2.0


16.0
16.0
16.0

2.10 1.8
1.5
15.5
15.5
15.5

−101.5 −100.5 −99.5 −99.0 −98.5 −101.5 −100.5 −99.5 −99.0 −98.5 −101.5 −100.5 −99.5 −99.0 −98.5

Octubre Noviembre Diciembre

Figura 6.3: Valores pronosticados de la infestación del ácaro para el año 2017.

72
Probabilidad, Estadı́stica y sus Aplicaciones

De este estudio se observa que el comportamiento de la plaga varı́a respecto al


año, notándose una tendencia decreciente de oeste-este para los valores que se pre-
dicen en los meses de Marzo a Octubre y Diciembre, se observa que la infestación
del ácaro rojo de las palmas es más intensa en la zona alta de la Costa Grande
de Guerrero. Particularmente en los meses de Septiembre y Diciembre el ı́ndice de
infestación es mayor a 1.8. Por otra parte para los meses de Enero, Febrero y No-
viembre, existe una mayor variabilidad en el comportamiento de la distribución de
la infestación del ácaro rojo en la zona de estudio. Para Enero y Noviembre se pre-
senta mayor infestación del ácaro en Acapulco y la parte baja de la Costa Grande,
pero para el mes de Febrero la infestación de la plaga predomina en la Costa Chica
y Grande.

De todos los meses analizados, Noviembre y Diciembre presentan una mayor


intensidad del ácaro rojo, esto se debe posiblemente a los factores ambientales que
se presentan en esa temporada del año.

6.5. Discusión y Conclusiones


Aunque la metodologı́a de predicción en los GLSM es muy similar a los métodos de
interpolación clásicos en geoestadı́stica, la estimación de los parámetros del GLSM,
es un poco diferente. En un GLSM se puede utilizar la función de verosimilitud para
la estimación de los parámetros del modelo sin recurrir a la función del semivario-
grama. Por otra parte determinar la forma paramétrica del semivariograma en un
GLMM espacial es un problema más complicado que merece más estudio.

Con este estudio se logró determinar la zonas de mayor infestación del ácaro rojo
en la zona costera del estado de Guerrero. Esto gracias a que el modelo Poisson-log-
lineal toma en cuenta la estructura de variabilidad espacial que presenta la plaga.
Este tipo de estudios es muy importante en la agricultura de precisión ya que per-
mite una mejor dirección de los controles quı́micos logrando con ello: una reducción
de los costos del manejo del cultivo, una disminución en la resistencia de la plaga a
los quı́micos y beneficios a la salud de las personas, además de disminuir la conta-
minación del medio ambiente.

Este estudio es importante porque implementa los modelos lineales mixtos gene-
ralizados para la predicción espacial de una plaga, ya que al usarlo permite predecir
la intensidad de la plaga en ubicaciones no muestreadas. Esto es importante porque
ayuda en la elaboración de un plan de alerta para la utilización de herbicidas en
sitios especı́ficos.

Tomando en cuenta la metodologı́a y la base de datos, este es el primero estudio


realizado hasta el momento para el ácaro rojo de la palma del cocotero, en este
sentido es innovador en el área de fitosanidad del estado de Guerrero.

73
Probabilidad, Estadı́stica y sus Aplicaciones

Bibliografı́a

[1] Breslow, N. E., & Clayton, D. G.Approximate inference in generalized


linear mixed models. Journal of the American statistical Association, 88(421),
9-25, 1993.

[2] Christensen, O. F., & Ribeiro Jr, P. J. geoRglm-a package for generalized
linear spatial models. R News, 2(2), 26-28, 2002.
[3] Christensen, O. F., & Waagepetersen, R. Bayesian prediction of spatial
count data using generalized linear mixed models. Biometrics, 58(2), 280-286,
2002.

[4] Cressie, N. A. Statistics for spatial data. Wiley series in probability and mat-
hematical statistics, 1993.
[5] Diggle, P. J., Ribeiro, P. J., & Christensen, O. F.An introduction to
model-based geostatistics. In Spatial statistics and computational methods, 43-
86. Springer, New York, NY, 2003.
[6] Diggle, P. J., Tawn, J. A., & Moyeed, R. A.Model based geostatistics
(with discussion). Journal of the Royal Statistical Society: Series C (Applied
Statistics), 47(3), 299-350, 1998.
[7] Emilio G., Fernando F. Agricultura de Precisión. Tecnologı́a Agropecuaria.

[8] Flores-Galano, G., Rodrı́guez-Morell, H., Hernández-Turcas, R.,


Miranda-Cabrera, I., & Montoya-Ramos, A. Dinámica poblacional de
Raoiella Indica Hirst (Acari: Tenuipalpidae) en cocotero (Cocos nucifera L.)
en Guantánamo, Cuba. Revista de Protección Vegetal, 32(1), 23-32, enero-abril
2017.

[9] INIFAP Agenda Técnica Agrı́cola Guerrero. Instituto Nacional de Investigacio-


nes Forestales, agrı́colas y Pecuarias, México, 2017.
[10] McCullagh, P., & Nelder, J. A.Generalized linear models. (Vol. 37). CRC
press, 1989.

[11] Navia, D., Hamada, E., Gondim Jr, M. G. C., & Benito, N. P. Spatial
forecasting of red palm mite in Brazil under current and future climate change
scenarios. Pesquisa Agropecuaria Brasileira, v.51(5), n.5, 586-598, maio 2016.

74
Probabilidad, Estadı́stica y sus Aplicaciones

[12] Pielou, D. P. Contagious distribution in the European red mite, Panonychus


ulmi (Koch), and a method of grading population densities from a count of mite-
free leaves. Regional Research Station, Canadian Journal of Zoology, 38(3), 645-
653, 1960.
[13] Ribeiro Jr, P. J., Christensen, O. F., & Diggle, P. J. geoR and geoRglm:
software for model-based geostatistics. In Proceedings of DSC (Vol. 2), 2003

[14] Roda, A., Nachman, G., Hosein, F., Rodrigues, J. C. V., & Peña, J. E.
Spatial distributions of the red palm mite, Raoiella Indica (Acari: Tenuipalpidae)
on coconut and their implications for development of efficient sampling plans.
Experimental and applied acarology, 57(3-4), 291-308, 2012.
[15] Vásquez, C., Egurrola, Z., Valera, R., Sanabria, M. E., & Col-
menárez, Y. Anatomı́a y quı́mica foliar en especies ornamentales de Arecaceae:
posibles barreras a la alimentación de Raoiella Indica Hirst (Acari: Tenuipalpi-
dae). Gayana. Botánica, 72(2), 296-304, 2015.
[16] Vásquez, C. L., Rodrı́guez, G., Hernández, A., Mendez, N., Dávila,
M., Valera, N., & Morales, J. Variabilidad de poblaciones de Raoiella In-
dica (Acari: Tenuipalpidae) evaluada mediante análisis morfológico y molecular
en Venezuela. Sociedad Venezolana de Entomologı́a Vol. 29(2): 105-120, agosto
2014.

75
Probabilidad, Estadı́stica y sus Aplicaciones

Capı́tulo 7
Una aplicación de la metodologı́a Biplot Logı́stico: Análisis de la sostenibilidad
empresarial

Alar Urruticoechea1 y Elena Vernazza2

Universidad de la República,
1
Facultad de Psicologı́a,
Instituto de Fundamentos y Métodos en Psicologı́a,
Dr Tristón Narvaja 1674, C.P. 11200, Montevideo, Uruguay,
2
Facultad de Ciencias Económicas y de Administración,
Eduardo Acevedo 1139, C.P. 11200, Montevideo, Uruguay
[email protected], [email protected]
Resumen. Esta investigación es una continuación del trabajo “Sostenibilidad
Empresarial: Análisis desde una perspectiva multivariante a través de la metodo-
logı́a HJ-Biplot”[9]. Los resultados aquı́ presentados refieren a las mismas empresas
que el mencionado trabajo, pero en esta oportunidad se tiene en consideración
únicamente los ı́ndices reportados por el Global Reporting Initiative (GRI, en su
versión G4), en su calidad de variables binarias (reporta/no reporta).
Se presenta, en primera instancia, un análisis descriptivo de las variables a utilizar
y se da paso a una comparación multivariante, a través de la implementación de
la metodologı́a Biplot (en particular Biplot Logı́stico). Por último, se presentan los
principales resultados obtenidos al realizar un análisis de cluster que permite encon-
trar y caracterizar grupos de empresas similares en función de los indicadores de
sostenibilidad que reportan. En cada uno de estos análisis se hace especial énfasis
en la distinción existente por región (América Latina y América del Norte).
Entre los principales resultados obtenidos se destaca: a) la diferencia en el reporte
de los indicadores al considerar las distintas regiones y b) la existencia de 3 grupos
de empresas con las siguientes caracterı́sticas: empresas que presentan ausencias y
presencias en igual proporción en los indicadores de sostenibilidad, empresas que
presentan ausencias en la mayorı́a de los indicadores y, por último, empresas que
muestran presencia de reporte de la mayorı́a de indicadores.

76
Probabilidad, Estadı́stica y sus Aplicaciones

Abstract. This research is a continuation of the paper “Sostenibilidad Em-


presarial: Análisis desde una perspectiva multivariante a través de la metodologı́a
HJ-Biplot”[9].
The results here presented are related to the same companies of the mentioned
paper. In this opportunity, it has into consideration only indexes reported by the
Global Reporting Initiative (GRI, in its version, G4) as binary variables (report/
not report).
First of all, it is shown a descriptive analysis of the using variables, to make space
for a multivariate comparison, through the use of the Biplot methodology (particu-
larly Logistic Biplot). Finally, it is shown the obtained results of a cluster analysis,
which allows to find and define similar companies’groups, according the sustainabi-
lity indexes they report. In each of this analysis, it is made emphasis on the existing
distinction by region (Latin America and North America).
Between the core of the obtained results, it emphasizes: a) The difference in the
report of the indexes, having into consideration the different regions, and b) The
existence of 3 groups of companies, with the following characteristics: companies
that present absences and presences in equal proportion on the sustainability in-
dexes, companies that present absences on the majority of the indexes and finally,
companies who show presences of the majority of indexes.

Palabras clave: Biplot Logı́stico, Clusters, Global Reporting Initiative (GRI),


Sostenibilidad Empresarial.

7.1. Introducción
La sostenibilidad es un concepto tan amplio que puede ser aplicado a los más
diversos ámbitos. Es posible hablar de economı́a sostenible, de sociedad, de empresa,
de medio ambiente y hasta de polı́tica sostenible, entre otros. Se entiende que en
todos los casos se refiere al mismo concepto pero aplicado a distintos contextos.
Este concepto, tal como se percibe en la actualidad, surge a fines de la década
del 80 a partir de la necesidad de estudiar (y tratar de delimitar) el impacto que
tienen las acciones humanas sobre el medio ambiente.
Desde entonces, los gobiernos de diferentes paı́ses han trabajado para concienciar
a las empresas sobre la necesidad de poseer polı́ticas empresariales sostenibles. Gra-
cias a la presión llevada a cabo por diversos sectores económicos y sociales en 2002
se redactó el Código de Buen Gobierno de la Empresa Sostenible, donde se define
la empresa sostenible y se le vincula a la idea de responsabilidad social corporativa
(RSC) [8].
La RSC se entiende como la promoción e implementación de buenas prácticas
de negocio, asumiendo la responsabilidad del impacto que genera la actividad de la
empresa. La RSC consta de cinco dimensiones: polı́tica filantrópica de la empresa
(concepto alejado de la RSC en el marco del desarrollo sostenible), ética en los ne-
gocios (principios y valores compartidos con todos aquellos miembros de la sociedad
que tengan relación con la empresa), polı́tica de la empresa (gobernabilidad basada
en rendición de cuentas con monitoreo y validación externa, transparencia y cumpli-
miento de las normativas), preocupación y atención a todo el ciclo productivo (desde
el proveedor de materia prima hasta el consumidor final) y, por último, normativa

77
Probabilidad, Estadı́stica y sus Aplicaciones

y regulación (referente a que la información proporcionada por la empresa resulte


veraz y transparente) [6]. Para la medición de estas dimensiones surge la Iniciativa
del Reporte Global (GRI), el cual estudia el comportamiento de las empresas en las
siguientes áreas: economı́a, medio ambiente, desempeño social, prácticas laborales,
derechos humanos, sociedad y responsabilidad sobre el producto [4],[5].
Esta investigación presenta un estudio sobre la caracterización de las empresas
más fuertes (económicamente hablando1 ), del continente americano, con respecto a
los indicadores de sostenibilidad reportados.
La estructura del presente trabajo es la siguiente: en primer lugar una breve
exposición de la metodologı́a utilizada para el análisis de los datos, seguida de una
descripción de dichos datos. A continuación se presentan los principales resulta-
dos obtenidos (Biplot Logı́stico y Análisis de Cluster) y por último las principales
conclusiones obtenidas.

7.2. Metodologı́a
Los métodos Biplot son una representación gráfica (en baja dimensión) de la
información proporcionada por una matriz de datos multivariantes [1], al igual que
un diagrama de dispersión representa gráficamente una relación (correlación lineal)
entre dos variables, los métodos Biplot representan relaciones existentes entre más
de dos variables [2].
Siendo X una matriz de datos con información referente a n individuos y p varia-
bles, por lo general continuas, una representación Biplot de ésta se logra a partir de
la determinación de a1 , a2 , ..., an marcadores fila y b1 , b2 , ..., bp marcadores columna
de forma tal que el producto interno ati bj logre reproducir el elemento xij original.
En formato matricial, si se considera A una matriz cuyas filas sean los marcado-
res a1 , a2 , ..., an y otra matriz B tal que sus filas sean los marcadores b1 , b2 , ..., bp
entonces, la matriz X podrá ser aproximada como X ∼ = AB t .
La factorización de la matriz X siempre es posible, pero ésta no es única. Por lo
tanto, para que la representación Biplot sea válida es necesario imponer restricciones
que garanticen que la descomposición, y por lo tanto la representación Biplot, sea
única.
Al igual que en la mayorı́a de las técnicas clásicas de análisis de datos multi-
variantes basada en la reducción de dimensionalidad, la factorización propuesta es
la que se obtiene al realizar una descomposición de la matriz X en valores singu-
lares. Por lo tanto, el punto de partida de un análisis a través de la metodologı́a
Biplot, será: X = U DV t , donde U es una matriz cuyas columnas coinciden con los
vectores propios de XX t , V otra matriz cuyas columnas coinciden con los vectores
propios de X t X y D la matriz diagonal que contiene los valores singulares de X,
equivalentes a las raı́ces cuadradas (≥ 0) de los valores propios de X t X.
Ası́, dependiendo de como se decida realizar la factorización de la matriz X se
obtendrá un tipo de representación Biplot diferente [9].
Por otra parte, si X es una matriz de datos con información referente a n in-
dividuos y p variables binarias, se tiene una formulación del problema diferente,
denominada Biplot Logı́stico [10], [12]. Siendo Πij la probabilidad esperada de que
1 Estas empresas se seleccionaron tomando en cuenta el ranking FORTUNE 500.

http://fortune.com/global500/

78
Probabilidad, Estadı́stica y sus Aplicaciones

la variable j está presente en el individuo i, entonces Πij = E(xij ). La formulación


del Biplot Logı́stico establece:
P
ebj0 + k bjk aik
Πij = P
1 + ebj0 + k bjk aik
con aik y bjk los marcadores fila y columna, respectivamente. Ası́, la función link
que permitirá linealizar este modelo será:
Πij X
logit(Πij ) = log( ) = bj0 + bjk aik = bj0 + ati bj
1 − Πij
k

Lo que equivale, en formato matricial, a logit(Π) = 1n bt0 +AB t (con A y B las matrices
de marcadores ya definidas y 1n vector de unos).

7.3. Resultados
Los datos utilizados en este trabajo corresponden a las 56 empresas más grandes de
América Latina, el Caribe y América del Norte. Se cuenta con información referente a
variables divididas en 2 grupos: caracterı́sticas propias de las empresas (Paı́s, Región,
Tamaño, Sector) e indicadores de sustentabilidad reportados en el GRI (en su versión
G4). Estas variables son de naturaleza binaria: reporta/no reporta.

7.3.1. Análisis descriptivo


Variables de identificación
A continuación se presentan las principales caracterı́sticas de las empresas en relación
al grupo de variables de identificación.
En el Cuadro 7.1 se presenta la distribución de las empresas según su ubicación geográfi-
ca. En ella puede verse que del total de empresas, un 10 % (7 de 56) son empresas de origen
latinoamericano, un 82 % estadounidense y el 8 % restante, canadiense.

Cuadro 7.1: Cantidad de empresas por paı́s según continente


Paı́s / Continente A.L. y Caribe A.N. Total
Brasil 5 0 5
Canadá 0 3 3
Colombia 1 0 1
México 1 0 1
EE.UU 0 46 46
Total 7 49 56

Por otra parte, en el Cuadro 7.2 se observa la distribución de las empresas por paı́s
según tamaño, donde se puede ver que ninguna pertenece a pequeñas empresas y poco
más del 50 % son multinacionales.

79
Probabilidad, Estadı́stica y sus Aplicaciones

Cuadro 7.2: Cantidad de empresas por paı́s según tamaño


Paı́s / Tamaño Grande MNE Total
Brasil 5 0 5
Canadá 2 1 3
Colombia 0 1 1
México 1 0 1
EE.UU 17 29 46
Total 25 31 56

En lo que refiere al sector de actividad económica de las empresas (ver Cuadro 7.3), un
46 % se dedica a la Industria, Agua y Energı́a, seguidas de aquellas que se dedican a brindar
otro tipo de servicios (20 %). Cabe resaltar que hay solo una empresa del sector Primario,
una del sector Reparaciones, y una del sector Educación y que las tres corresponden
a empresas de Estados Unidos. Sólo una de las 56 empresas es estatal, se encuentra en
Brasil, pertenece al sector otros servicios y es una empresa de tamaño grande. Las restantes
empresas corresponden todas al sector privado.

Cuadro 7.3: Cantidad de empresas por sector según paı́s


Sector / Paı́s Brasil Canadá Colombia México EE.UU Total
Primario 0 0 0 0 1 1
Industria, Agua y Energı́a 1 2 1 1 21 26
Comercio 1 0 0 0 7 8
Reparaciones 0 0 0 0 1 1
Servicios 0 0 0 0 2 2
Logı́stico 0 0 0 0 6 6
Educación y Servicios Sociales 0 0 0 0 1 1
Otros 3 1 0 0 7 11
Total 5 3 1 1 46 56

Variables reportadas en el GRI G4


En primer lugar se presentan los resultados del análisis de los ı́ndices de sostenibilidad
reportados en el GRI (versión G4), agregados en dimensiones.
En cuanto al valor mı́nimo de indicadores reportados, en las dimensiones Ambiental
y Prácticas Laborales todas las empresas reportan algún indicador (mı́nimo ≥ 1), en las
demás dimensiones, en cambio, hay empresas que no reportan indicadores (ver Cuadro 7.4).
En el otro extremo, se aprecia que el máximo de cada una de las dimensiones coincide con
la cantidad de indicadores de cada una, es decir que, en todas las dimensiones, existe al
menos una empresa que reporta todos los indicadores.
Resulta destacable, además, que todas las variables (excepto Derechos Humanos), pre-
sentan una distribución simétrica, ya que media y mediana prácticamente coinciden.

80
Probabilidad, Estadı́stica y sus Aplicaciones

Cuadro 7.4: Descriptivos univariados - ı́ndices GRI (agregados)


Mı́n. Q1 Q2 Media Desvı́o Q3 Máx.
Ec. 0 4 5 5.42 2.51 7 9
Amb. 5 11 19 19.38 9.38 28 34
Pra.L. 1 4 8 8.67 5.14 13 16
Der.H. 0 1 4 5.22 4.32 9 12
Soc. 0 2 5 5.76 3.62 9 11
Resp. 0 1 3 3.84 3.11 6.5 9

En la Figura 7.5 se presentan la matriz de correlaciones 2 a 2 de las dimensiones. En ella


se observa que existe correlación lineal positiva entre todas las dimensiones y se destaca,
en particular, la correlación que existe entre Prácticas Laborales, Derechos Humanos y
Sociedad (r > 0.8).

Cuadro 7.5: Matriz de correlaciones - ı́ndices GRI (agregados)


Ec. Amb. Pra.L. Der.H. Soc. Resp.
Ec. 1.00 0.73 0.74 0.71 0.75 0.54
Amb. 1.00 0.72 0.74 0.83 0.64
Pra.L. 1.00 0.84 0.86 0.64
Der.H. 1.00 0.83 0.71
Soc. 1.00 0.69
Resp. 1.00

Para finalizar, se presentan los porcentajes de los reportes de cada ı́ndice separado por
región, Latinoamérica y Norteamérica (ver Figura 7.1 y Figura 7.2).
Para los indicadores EN (Medio Ambiente), se destaca que en las dos regiones el com-
portamiento es muy parecido. Resalta EN15 (20 %), emisiones directas de gases de efecto
invernadero y los picos altos de EN18 (85 %) y EN27 (70 %) que atienden, respectivamente,
a la intensidad de las emisiones de gases de efecto invernadero y la mitigación del impacto
ambiental de los productos y servicios.
En lo que refiere a los indicadores HR (Derechos Humanos), se observa que latinoaméri-
ca presenta mayor porcentaje de reporte en todos, excepto en el indicador HR10 porcentaje
de nuevos proveedores que se examinaron en función de criterios relativos a los derechos
humanos.
Los indicadores LA (Prácticas Laborales) se comportan de manera similar al HR,
siempre con valores más altos para latinoamérica excepto en los indicadores LA10 (85 %),
programas de gestión de habilidades y formación continua que fomentan la empleabilidad
de los trabajadores y le ayudan a gestionar el final de sus carreras profesionales, y LA12
(85 %), composición de los órganos de gobierno y desglose de la plantilla por categorı́a
profesional y sexo, edad, pertenencia a minorı́as y otros indicadores de diversidad. Tam-
bién se destaca la bajada de reporte que se da en latinoamérica en los indicadores LA3
(60 %), ı́ndices de reincorporación al trabajo y de retención tras el permiso por maternidad
o paternidad, desglosado por sexo, y LA4 (60 %), plazos mı́nimos de preaviso de cambios
operativos y posible inclusión de estos en los convenios colectivos.

81
Probabilidad, Estadı́stica y sus Aplicaciones

Figura 7.1: Indicadores EN, HR y LA - Por región.

En la categorı́a EC (Económica), se destacan los valores altos de norteamérica en EC1


(95 %), valor económico directo generado y distribuido, EC3 (70 %), lı́mite de las obliga-
ciones de la organización debidas a programas de presentaciones sociales y EC7 (70 %),
desarrollo e impacto de la inversión en infraestructuras y los tipos de servicios, ası́ como el
valor alto de EC2 (100 %), consecuencias financieras y otros riesgos y oportunidades para
las actividades de la organización debido al cambio climático y el bajo de EC3 (40 %) que
presenta latinoamérica.
Por último, se destaca que en la categorı́a PR (Salud y Seguridad de los clientes), lati-
noamérica tiene valores superiores en todos los ı́ndices (destacando PR5 (85 %), resultados
de las encuestas para medir la satisfacción de los clientes), excepto en el PR6 (25 %), venta
de productos prohibidos o en litigio.

82
Probabilidad, Estadı́stica y sus Aplicaciones

Figura 7.2: Indicadores EC, PR, SO y Global - Por región.

Los indicadores de la escala SO (Sociedad), muestran picos altos para SO1 (70 %),
porcentaje de operaciones donde se han implantado programas de desarrollo, evaluación de
impactos y participación de la comunidad local, SO4 (75 %), polı́tica y procedimientos de
comunicación y capacitación sobre la lucha contra la corrupción y SO6 (70 %), valor de las
contribuciones polı́ticas, por paı́s y destinatario, para norteamérica, y SO4 (85 %) y SO6
(100 %) para latinoamérica. Mientras que muestran picos bajos en SO11 (30 %), número de
reclamaciones sobre impactos sociales que se han presentado, abordado y resuelto mediante
mecanismos formales de reclamación, para norteamérica y para latinoamérica en SO2
(60 %), centros de operaciones con efectos negativos significativos, reales o potenciales,
sobre las comunidades locales, SO7 (60 %), número de procedimientos legales por causas
reclamadas con prácticas monopolı́sticas y contra la libre competencia, y sus resultados,
y SO8 (60 %), valor monetario de las multas significativas y número de sanciones no
monetarias por incumplimiento de la legislación y la normativa, aunque todos los ı́ndices
son más reportados por las empresas de latinoamérica.
Por último, al considerar el reporte de los ı́ndices de manera general, se aprecia que
todas las categorı́as son más reportadas por las empresas latinoamericanas.

7.3.2. Biplot Logı́stico


Para analizar la sostenibilidad de las 552 empresas en estudio, utilizando únicamente
los indicadores reportados en la versión G4 del GRI y considerando que éstos son binarios,
se realiza un análisis Biplot Logı́stico (descrito en la sección 7.2).
Los primeros resultados obtenidos, a partir de los cuales se determina la dimensión de
la solución presentada, se reportan en el Cuadro 7.6. En función de esta información, se
decide trabajar únicamente con los dos primeros ejes. Esta decisión se respalda, además,
en el hecho de que el primer valor propio sea tres veces mayor que el siguiente.
2 No es considerada en el análisis una empresa de EEUU, considerada un outlier.

83
Probabilidad, Estadı́stica y sus Aplicaciones

Cuadro 7.6: Variabilidad explicada - Biplot Logı́stico


Ejes Val. Prop. Var. Exp. Acumulada
Eje 1 2.89 23.07 23.07
Eje 2 0.89 7.09 30.18
Eje 3 0.74 5.94 36.12

De esta forma se obtiene una solución que resulta fácilmente interpretable y que logra
explicar más del 30 % de la variabilidad total (porcentaje que se entiende razonable, si se
considera que están en estudio 91 variables).
Los resultados generales, sin imponer ninguna restricción sobre la calidad de represen-
tación, se presentan en la Figura 7.3.

Figura 7.3: Biplot Logı́stico - General

En el cuadro que se presenta a continuación (Cuadro 7.7) se reportan algunas medidas


que surgen del ajuste logı́stico. Se reportan únicamente los indicadores que presentan un
R2 ≥ 0.60 (de aquı́ en adelante éstas serán las únicas variables consideradas).
Tal como se observa en el Cuadro 7.7, todas las variables resultan significativas y todas
poseen un porcentaje de empresas bien clasificadas superior al 80 %. Esta última medida
se obtiene a partir de las probabilidades estimadas (tomando 0.5 como probabilidad de
corte para estimar presencia o ausencia).

7.3.3. Clusters Biplot Logı́stico


Uno de los objetivos planteados en este trabajo era describir el comportamiento de
grupos de empresas. Para eso se decide realizar un análisis de cluster jerárquico, utilizando
las coordenadas (scores de ordenación) del Biplot Logı́stico y aplicando el algoritmo de
Ward.
Se detecta una estructura de 3 clusters con la siguiente caracterización, en función de:
ubicación, sector de actividad y tamaño (ver Cuadro 7.8).
La estimación se realiza de forma conjunta considerando todos los indicadores (con
R2 ≥ 0.60) pero a modo de simplificar la interpretación, se presentan los resultados por
dimensión.

84
Probabilidad, Estadı́stica y sus Aplicaciones

Cuadro 7.7: Bondad de ajuste - Biplot Logı́stico.


Indicador Deviance p valor R2 % Correctas
EC5 11.20 0.00 0.70 87.27
EC6 9.44 0.00 0.60 81.82
EN1 12.71 0.00 0.75 85.46
EN2 9.77 0.00 0.60 81.82
EN4 10.47 0.00 0.61 81.82
EN9 14.94 0.00 0.69 87.27
EN10 12.22 0.00 0.66 81.82
EN11 25.00 0.00 0.91 92.73
EN12 14.12 0.00 0.66 81.82
EN14 26.84 0.00 0.96 94.55
EN16 20.18 0.00 0.71 98.18
EN20 13.17 0.00 0.68 83.64
EN21 12.43 0.00 0.62 80.00
EN22 29.22 0.00 0.89 96.36
EN23 15.27 0.00 0.71 83.64
EN24 15.09 0.00 0.68 85.46
EN25 14.41 0.00 0.75 87.27
EN26 14.40 0.00 0.78 90.91
EN32 14.33 0.00 0.68 85.46
EN34 11.39 0.00 0.72 83.64
LA1 11.03 0.00 0.64 80.00
LA3 24.57 0.00 0.95 94.55
LA4 9.52 0.00 0.60 85.46
LA6 12.33 0.00 0.67 85.46
LA7 10.74 0.00 0.62 83.64
LA8 13.48 0.00 0.70 85.46
LA9 19.26 0.00 0.69 81.82
LA10 17.67 0.00 0.64 89.09
LA11 14.80 0.00 0.70 83.64
LA14 12.31 0.00 0.68 83.64
LA15 14.57 0.00 0.72 87.27
LA16 11.16 0.00 0.67 80.00
HR2 10.56 0.00 0.66 90.91
HR8 22.83 0.00 0.92 85.46
HR11 11.82 0.00 0.65 89.09
HR12 19.38 0.00 0.90 89.09
SO3 10.49 0.00 0.62 83.64
SO5 12.97 0.00 0.75 87.27
SO8 11.08 0.00 0.66 85.46
SO9 11.56 0.00 0.69 81.82
SO10 10.66 0.00 0.66 83.64
SO11 12.42 0.00 0.75 83.64
PR2 10.95 0.00 0.66 81.82
PR8 23.42 0.00 0.67 87.27

85
Probabilidad, Estadı́stica y sus Aplicaciones

Cuadro 7.8: Descripción % por Clusters.


Paı́s Cluster 1 Cluster 2 Cluster 3
Brasil 16.67 5.56 8
EE.UU 83.33 88.88 76
México 0 0 4
Canadá 0 5.56 8
Colombia 0 0 4
Sector Cluster 1 Cluster 2 Cluster 3
Primario 0 5.56 0
Industria 75 5.56 64
Comercio 16.67 27.77 0
Reparaciones 0 0.00 4
Servicios 0 11.11 0
Logı́stico 8.33 11.11 12
Educación y Ss.Ss 0 5.56 0
Otros 0 33.33 20
Tamaño Cluster 1 Cluster 2 Cluster 3
Multinacional 66.67 44.44 56
Grande 33.33 55.56 44

Dimensión Económica
Tal como se observa en la Figura 7.4, en esta dimensión quedan bien representadas las
variables EC5 (Relación entre el salario inicial desglosado por sexo y el salario mı́nimo
local en lugares donde se desarrollan operaciones significativas) y EC6 (Porcentaje de altos
directivos procedentes de la comunidad local en lugares donde se desarrollan operaciones
significativas).
La caracterización de los clusters, en función de la dimensión económica, es:
Cluster 1 y 2 ausencia en ambas variables.
Cluster 3 presencia en ambas variables.

86
Probabilidad, Estadı́stica y sus Aplicaciones

Figura 7.4: Biplot Logı́stico - Económica.

Dimensión Ambiental
En cuanto a la dimensión ambiental, como puede verse en la Figura 7.5, en esta di-
mensión quedan bien representadas los ı́ndices EN1, EN2, EN4, EN9, EN10, EN11, EN12,
EN14, EN16, EN20, EN21, EN22, EN23, EN24, EN25, EN26, EN32, EN34.

Figura 7.5: Biplot Logı́stico - Ambiental.

87
Probabilidad, Estadı́stica y sus Aplicaciones

La caracterización de los 3 clusters, en esta dimensión es la siguiente: los 3 clusters


predicen presencia en los indicadores EN16 y EN23, y ausencia del EN14. Además:
Cluster 1 ausencia en EN1, EN25, EN26, EN32 y EN34.
Cluster 2 ausencia en todos menos en EN23 y EN16.
Cluster 3 presencia en todas menos EN14.

Prácticas Laborales
En esta dimensión, y considerando el mismo R2 de las dimensiones anteriores quedan
representadas todas las indicadoras menos LA2, LA4, LA5, LA12 y LA13 (ver Figura 7.6).
Los culsters se caracterizan por:
Cluster 1 ausencia en todas menos LA6.
Cluster 2 ausencia en todas menos LA9 y LA10.
Cluster 3 presencia en todas.

Figura 7.6: Biplot Logı́stico - Prácticas laborales.

Recursos Humanos, Sociedad y Responsabilidad


Por último, en la Figura 7.7, se presentan las dimensiones de Recursos Humanos,
Sociedad y Responsabilidad. En lo que refiere a la primera, quedan bien representadas
HR2, HR8, HR11 y HR12. En cuanto a la segunda, se tiene que las indicadoras SO3, SO5,
SO8, SO9, SO10, SO11 son las que quedan bien representadas y, al considerar la última
dimensión, PR2 y PR8.
El comportamiento de los clusters en estas 3 dimensiones se puede resumir de la si-
guiente manera:
Cluster 1 ausencia de todas las HR, SO y PR.
Cluster 2 ausencia de todas las HR, SO y PR (menos PR8).
Cluster 3 presencia de todas las HR (menos HR8), todas las SO y todas las PR.

88
Probabilidad, Estadı́stica y sus Aplicaciones

Figura 7.7: Biplot Logı́stico - Recursos Humanos, Sociedad y Responsabilidad.

7.4. Conclusiones
Las principales conclusiones obtenidas del análisis presentado en este trabajo se expo-
nen a continuación:
Teniendo en consideración la comparación por región, se destaca que América Latina
presenta mayores reportes en todos los indicadores.
Los indicadores más reportados por las empresas de América Latina son: Prácticas
Laborales y Sociedad, y para las empresas de norteamérica: Económica y Ambiental.
Existen 3 grupos de empresas con las siguientes caracterı́sticas:
• Cluster I: se detecta ausencia y presencia en igual proporción en el reporte de
los indicadores de sostenibilidad.
• Cluster II: ausencia de reporte en la mayorı́a de los indicadores.
• Cluster III: presencia de reporte de la mayorı́a de indicadores.

89
Probabilidad, Estadı́stica y sus Aplicaciones

Bibliografı́a

[1] Gabriel, K., The biplot graphic display of matrices with application to principal
component analysis., Biometrika 58(3), 453 - 467, 1971.

[2] Gabriel, K. y ODORFF, CH., Biplot un biomedical research., Statistics in Medicine


9, 469 - 485, 1990.

[3] Galindo, M.P., Una alternativa de representación simultánea: HJ-Biplot., Questı́o


10, 1, 13 - 23, 1986.

[4] GRI, G4 - Guı́a para la elaboracion de Memorias de Sostenibilidad - Parte 1,


https://goo.gl/q66f9K, 2013.

[5] GRI, Memorias de Sostenibilidad, https://www.globalreporting.org/languages/spanish/Pa-


ges/Memorias-de-Sostenibilidad.aspx, 2015.

[6] Nuñez, G., División de Desarrollo Sostenible y Asentamientos Humanos


(CEPAL), La responsabilidad social corporativa en un marco de desarrollo sostenible.,
Series de la CEPAL: Medio Ambiente y Desarrollo 72, 70pg. CEPAL, Chile, 2003.

[7] R Core Team, R: A Language and Environment for Statistical Computing., R


Foundation for Statistical Computing, Vienna, Austria. http://www.R-project.org/,
2015.

[8] Ricart, J.E. y Rodrı́guez, M.A., Código de Gobierno para la empresa Sostenible:
Guı́a para su implementación. Center for Business in Society, IESE, 2002.

[9] Vernazza, E., Urruticoechea, A., Sostenibilidad Empresarial: Análisis desde una
perspectiva multivariante a través de la metodologı́a HJ-Biplot, 2017. Disponible en:
https : //www.f cf m.buap.mx/SIEP 2017/M emorias/Extensos/Carteles/8.pdf .

[10] Vicente Villardán, J.L., Biplot for binary data based on logistic response surfaces.,
Salamanca Statistics Seminar IV. Advances in Multivariate Analysis. Salamanca,
December, 2001.

[11] Vicente Villardán, J.L., MULTBIPLOT: A package for Multivariate Analy-


sis using Biplots., Departamento de Estadı́stica. Universidad de Salamanca.
http://biplot.usal.es/ClassicalBiplot/index.html, 2015.

90
Probabilidad, Estadı́stica y sus Aplicaciones

[12] Vicente Villardán, J.L., Galindo, M.P., y Blazquez, A., Logistic Biplots.,
Múltiple Correspondence Análisis And Related Methods, 491 - 509, 2006.

91
Probabilidad, Estadı́stica y sus Aplicaciones

Capı́tulo 8
Análisis de la deserción en las licenciaturas de la FCFM-BUAP mediante el
modelo de riesgo proporcional semiparamétrico

Blanca Xochilt Muñoz Vargas, Bulmaro Júarez Hernández


Lucı́a Cervantes Gómez, Hortensia J. Reyes Cervantes

Benemérita Universidad Autónoma de Puebla,


Facultad de Ciencias Fı́sico Matemáticas,
Av. San Claudio y 18 Sur, Col. San Manuel,
C.P. 72570, Puebla, Puebla,
[email protected], [email protected],
[email protected], [email protected]
Resumen. El Análisis de Supervivencia modeliza el tiempo que se tarda en
ocurrir un evento especı́fico. En este trabajo se presentan las principales definicio-
nes del Análisis de Supervivencia, se describen diferentes modelos de supervivencia
y se aplica el modelo de riesgo proporcional semiparamétrico al problema de la
deserción en las licenciaturas en Actuaria, Matemáticas y Matemáticas Aplicadas
impartidas en la Facultad de Ciencias Fı́sico Matemáticas de la Benemérita Uni-
versidad Autónoma de Puebla (FCFM-BUAP).

Abstract. The Survival Analysis models the time it takes to occur a specific
event. This paper presents the main definitions of the Survival Analysis and diffe-
rent survival models, in addition the semi-parametric proportional hazard model
is applied to the problem of dropout in the Actuarial, Mathematics and Applied
Mathematics degrees taught in the Facultad de Ciencias Fı́sico Matemáticas of the
Benemérita Universidad Autónoma de Puebla (FCFM-BUAP).

Palabras clave: Análisis de Supervivencia, modelo de riesgo proporcional semi-


paramétrico, deserción en las licenciaturas.

8.1. Introducción
El Análisis de Supervivencia es un conjunto de técnicas que tienen como obje-
tivo modelizar el tiempo que se tarda en ocurrir un evento especı́fico. Este evento
frecuentemente se llama fracaso, falla o muerte, y ocurre después de un periodo
llamado el tiempo de falla, tiempo de supervivencia o tiempo de vida.
Las aplicaciones del Análisis de Supervivencia van desde investigaciones de la
durabilidad de artı́culos manufacturados hasta estudios de enfermedades humanas
y sus tratamientos [3].

92
Probabilidad, Estadı́stica y sus Aplicaciones

Algunas veces, solamente se tiene interés en la distribución del tiempo de falla


de un sólo grupo de individuos. Más a menudo, se desea comparar los tiempos
de falla de dos o más grupos para ver, por ejemplo, si el tiempo de falla de los
individuos son sistemáticamente más largos en el segundo grupo que en el primero.
Alternativamente, pueden estar disponibles para cada individuo valores de variables
explicativas, las cuales se consideran relacionadas a la supervivencia [1].

8.2. Definiciones
A continuación se presentan algunas definiciones utilizadas en el Análisis de Su-
pervivencia. Se considera una población homogénea de individuos, teniendo cada
uno un tiempo de falla, es decir, se trata con una variable aleatoria no negativa, T .
Supóngase que T es continua, con función de densidad de probabilidad (f.d.p.) f (·) y

F (t) = P r(T 6 t), para t > 0,


la función de distribución acumulada (f.d.a.) de T .
La probabilidad de que un individuo sobreviva al tiempo t está dada por la
función de supervivencia, definida por
Z ∞
S(t) = P r(T > t) = f (x)dx = 1 − F (t), para t > 0. (8.1)
t

Las funciones S(·), f (·) y F (·) proporcionan tres formas matemáticas equivalen-
tes para especificar la distribución de una variable aleatoria continua no negativa, y
por supuesto hay otras funciones equivalentes. Una con valor especial en el contexto
presente es la función de riesgo, definida por,
P r(t 6 T < t + ∆|t 6 T )
h(t) = lim+ , para t > 0. (8.2)
∆→0 ∆
La función de riesgo especı́fica la tasa instantánea de muerte o falla en el tiem-
po t, dado que el individuo sobrevive hasta el tiempo t; h(t)∆ es la probabilidad
aproximada de falla en [t, t + ∆), dado que sobrevivió hasta el tiempo t.

8.3. Censura y truncamiento


En los estudios de tiempo de falla puede haber limitaciones en la información
recolectada, éstas pueden ser impuestas por el tiempo, costo y otras restricciones.
Dos caracterı́sticas que usualmente presentan los datos de tiempo de falla son la
censura y el truncamiento.
La censura ocurre cuando se conoce que algunos tiempos de falla han ocurrido
en cierto intervalo de tiempo y el resto de los tiempos de falla son conocidos exac-
tamente. Algunas categorı́as de censura son: por la derecha, por la izquierda, por
intervalo y doble.
Una segunda caracterı́stica de muchos estudios de supervivencia, a veces con-
fundida con la censura, es el truncamiento. El truncamiento de los datos de su-
pervivencia se produce cuando sólo se observan aquellos individuos cuyo tiempo
de falla se encuentra dentro de un determinado intervalo de observación (YL , YR ),

93
Probabilidad, Estadı́stica y sus Aplicaciones

Figura 8.1: Modelos en el Análisis de Supervivencia.

donde YL < YR y YL , YR > 0. No se observa a un individuo cuyo tiempo de falla no


está en este intervalo y no hay información disponible sobre este individuo para el
investigador. Esto contrasta con la censura donde hay al menos información parcial
sobre cada individuo. Debido a que sólo se tiene información de los individuos con
tiempos de falla en el intervalo de observación, la inferencia de los datos truncados
se limita a la estimación condicional.

8.4. Modelos de supervivencia


En el análisis de datos de tiempo de falla se utilizan diferentes tipos de modelos:
paramétricos, no paramétricos y semiparamétricos (Figura 8.1). En los modelos pa-
ramétricos se especı́fica la forma funcional de la distribución que los tiempos de falla
tendrı́an en ausencia de censura y la inferencia estadı́stica se basa en la metodologı́a
de máxima verosimilitud. Para obtener la función de verosimilitud o las propiedades
de los procedimientos estadı́sticos basados en datos censurados es necesario consi-
derar el proceso por el que surgen los tiempos de falla y tiempos censurados. Para
hacer esto, se necesita un modelo de probabilidad para el mecanismo de censura.
De manera interesante, resulta que la función de verosimilitud observada para los
parámetros del tiempo de falla toma la misma forma bajo una gran variedad de
mecanismos.
Ahora, suponga que se ha elegido una familia especı́fica, ası́ que se sabe que
la distribución del tiempo de falla depende de un vector paramétrico φ y que está
disponible para la inferencia sobre φ una sola muestra aleatoria de tiempos de
falla, posiblemente sujeta a censura por la derecha. En este caso se tiene que la
verosimilitud completa de n individuos independientes, indexados por i es
Y Y
L(φ; t) = f (ti ; φ) S(ti ; φ), (8.3)
i∈U i∈C

en donde U y C son los conjuntos de los individuos no censurados y censurados,


respectivamente.

94
Probabilidad, Estadı́stica y sus Aplicaciones

Varias familias paramétricas se usan como modelos en el análisis de datos de


tiempo de fallas. Entre los modelos univariados, algunas distribuciones ocupan una
posición central ya que se ha demostrado su utilidad en una amplia gama de situacio-
nes. Principalmente en esta categorı́a están la distribuciones exponencial, Weibull,
log normal, log logı́stica y gamma [3].
Las técnicas no paramétricas no requieren especificaciones de la forma funcional
de la distribución que los tiempos de falla tendrı́an en la ausencia de censura. Un
estimador no paramétrico de la función de supervivencia, S(·), es
Y  dj

S(t) =
b 1− , para t > 0, (8.4)
rj
j:tj 6t

en donde rj es el número de individuos en riesgo en tj y dj es el número de tiempos


de falla observados en tj . Usualmente, S(·)
b es llamado el estimador de Kaplan-Meier
o producto-Lı́mite.
Cuando se usa el estimador Producto-Lı́mite es deseable tener un estimador de
la varianza de S(t),
b el cual esta dado por

b 2
X dj
Vd
ar(S(t))
b = S(t) , (8.5)
rj (rj − dj )
j:tj 6t

que a menudo se conoce como fórmula de Greenwood. El estimador del error


estándar para S(t)
b está dado por la raı́z cuadrada de (8.5) [3].

8.4.1. Modelos de regresión de supervivencia


Frecuentemente se desea comparar dos o más conjuntos de datos, algunas veces
es mejor hacer la estimación de la función de supervivencia para cada conjunto de
datos por separado y luego hacer una comparación cualitativa, ya sea directamente
o mediante un resumen estadı́stico. También se pueden hacer comparaciones más
sensibles o más complejas mediante modelos completos en los que el efecto de las
covariables o variables explicativas se representa por medio de parámetros desco-
nocidos [1]. Por otra parte, en muchos estudios el principal objetivo es entender y
aprovechar la relación entre el tiempo de falla y las covariables [3].
Ahora supóngase que para cada individuo está definido un vector x de variables
explicativas. Las componentes de x pueden representar varias caracterı́sticas, que
se piensa afectan el tiempo de falla, tales como tratamientos, indicadores de grupo,
caracterı́sticas individuales o condiciones ambientales.
Las variables explicativas se pueden clasificar como constantes (fijas), x, o de-
pendientes del tiempo, x(t). Un proceso de las covariables X = {x(t)|t > 0}, que
se desarrolla independientemente del proceso de tiempo de falla, se denomina ex-
terno, mientras que un proceso de las covariables, que se desarrolla dependiente del
proceso de tiempo de falla, se denomina interno y su tratamiento requiere cuidado.
Notar que las covariables constantes son externas [3].

Modelos de regresión paramétricos


Los modelos de regresión para tiempos de falla se pueden formular de diferentes
formas. Cualquier modelo paramétrico se puede convertir en un modelo de regresión

95
Probabilidad, Estadı́stica y sus Aplicaciones

paramétrico especificando una relación entre los parámetros del modelo y las cova-
riables. Sin embargo, frecuentemente sólo ciertos parámetros en una distribución de
tiempo de falla se asumen dependientes de las covariables [3].
Otra forma frecuente de formular modelos es definir al vector x de variables ex-
plicativas de modo que x = 0 corresponde a algún conjunto de condiciones estándar
significativas, por ejemplo un tratamiento control. Luego, se pueden desarrollar los
modelos convenientemente en dos partes:

1. un modelo para la distribución del tiempo de falla cuando x = 0;


2. una representación del cambio inducido por un x 6= 0, frecuentemente en
términos de alguna forma paramétrica [1].
Tres modelos que se pueden desarrollar de esta forma son el modelo de vida
acelerada, el modelo de riesgo proporcional y el modelo de riesgo aditivo.

Modelo de vida acelerada

Supóngase ahora que el vector de variables explicativas depende del tiempo, x(t).
La esencia del modelo de vida acelerada es que el tiempo es contraı́do o ampliado
relativamente a éste en x = 0. Esto sugiere que para un individuo caracterizado
por x(t), el tiempo t(x) , evoluciona con respecto al tiempo t(0) para tal individuo
estando en x = 0 de acuerdo con

dt(x) 1
(0)
= ,
dt ψ(x(t(x) ))

i.e.
Z t(x)
(0)
t = ψ(x(u))du = Ψ(t(x) ),
0

donde ψ(·) es una función positiva y ψ(0) = 1, ası́ que el tiempo de falla está
relacionado por T = Ψ−1 (T0 ) [1].
Por lo tanto, en el modelo de vida acelerada la función de supervivencia, la f.d.p.
y la función de riesgo son

S(t|X) = S0 [Ψ(t)],
f (t|X) = ψ[x(t)]f0 [Ψ(t)], (8.6)
h(t|X) = ψ[x(t)]h0 [Ψ(t)],

en donde X = {x(t)|t > 0} y ψ(·) es una función positiva. Si x(·) es constante


sobre el tiempo, i.e. x(t) = x para todo t > 0, entonces se tiene el modelo de vida
acelerada simple.
Se puede considerar a S0 (·) igual a la función de supervivencia de alguna familia
paramétrica y una forma paramétrica para ψ(·), que se denotará por ψ(·; β), con el
propósito de tener
0
un modelo paramétrico. Un procedimiento común es especificar
a ψ[x(u)] = eβ x(u) para todo u > 0, en tal caso
hR 0
i
t
S(t|X) = S0 0 eβ x(u) du .

96
Probabilidad, Estadı́stica y sus Aplicaciones

Modelo de riesgo proporcional

Una segunda familia de modelos que ha sido ampliamente usada en el análisis


de datos de supervivencia, es conocida como el modelo de riesgo proporcional.
En el modelo de riesgo proporcional se supone que para un vector x(t) de varia-
bles explicativas la función de riesgo es

h(t|x(t)) = ψ(x(t))h0 (t) para t > 0, (8.7)

por lo que la función de supervivencia y la f.d.p. son

S(t|x(t)) = exp[−H(t|x(t))]
h R i
t
= exp − 0 h(u|x(u))du
h R i
t
= exp − 0 ψ(x(u))h0 (u)du

y
f (t|x(t)) = h(t|x(t))S(t|x(t))h i
Rt
= ψ(x(t))h0 (t) exp − 0
ψ(x(u))h0 (u)du .

Si x(·) es constante sobre el tiempo, i.e. x(t) = x para todo t > 0, entonces se
tiene el modelo de riesgo proporcional simple.
Se puede considerar a h0 (·) igual a la función de riesgo de alguna familia pa-
ramétrica y a una forma paramétrica para ψ(·), que se denotará por ψ(·; β), para
tener un modelo paramétrico. 0
Tres parametrizaciones para ψ(·) son: la forma log lineal ψ(x; β) = eβ x , que por
buenas razones ha llegado a ser la más popular, la forma lineal ψ(x; β) = 1 + β 0 x,
0
y el logı́stico, ψ(x; β) = log(1 + eβ x ).

Modelo de riesgo aditivo

En el modelo de vida acelerada y en el modelo de riesgo proporcional las dis-


tribuciones de T para diferentes valores en las covariables, x1 y x2 , que cum-
plen que ψ(x1 ) < ψ(x2 ) son ordenadas en el sentido de que S(t|x1 ) 6 S(t|x2 ) o
S(t|x1 ) > S(t|x2 ) para t > 0. Existen otros modelos que también cumplen esta
propiedad, uno es el modelo de riesgo aditivo en el cual

h(t|x) = ψ(x) + h0 (t) para t > 0,

en donde ψ(·) está restringida para que ψ(0) = 0 y ψ(x) + h0 (t) > 0 para todo x
y t > 0, además h0 (·) es la función de riesgo para un individuo bajo la condición
estándar (x = 0). La función de supervivencia y la f.d.p. cumplen que

S(t|x) = exp[−H(t|x)]
h R i
t
= exp − 0 (ψ(x) + h0 (u))du
= exp [−ψ(x)t − H0 (t)]
= exp [−ψ(x)t] exp [−H0 (t)] ,

i.e.
S(t|x) = exp [−ψ(x)t] S0 (t) (8.8)

97
Probabilidad, Estadı́stica y sus Aplicaciones

y
f (t|x) = h(t|x)S(t|x)
= (ψ(x) + h0 (t)) exp [−ψ(x)t] S0 (t).
Los modelos completamente paramétricos se obtienen considerando a h0 (·) igual
a la función de riesgo de alguna de las familias de distribuciones y una forma pa-
ramétrica para ψ(·).
El análisis de los modelos de regresión paramétricos se concentra en los métodos
basados en la función de verosimilitud. Para una variedad de mecanismos de censura
por la derecha, la función de verosimilitud de las observaciones (ti , δi , Xi (ti )), i =
1, . . . , n, cumple que
n
Y
L∝ f (ti |Xi (ti ))δi S(ti |Xi (ti ))1−δi ,
i=1

en donde δi es el indicador de censura para ti y Xi (ti ) = {xi (s)|0 6 s 6 ti }, denota


la historia de las covariables hasta el tiempo ti para el individuo i.

Modelos de regresión semiparamétricos


Los modelos semiparamétricos también son ampliamente usados, estos especi-
fican la dependencia de T en x paramétricamente, pero consideran arbitraria a la
distribución real. El modelo de regresión de tiempo de falla semiparamétrico más
conocido es el modelo de riesgo proporcional semiparamétrico, que toma a la función
de riesgo de T dado x de la forma

h(t|x) = h0 (t) exp{β 0 x},

donde h0 (·) es una función de riesgo basal arbitraria [3].


De manera más general, considérese al modelo de riesgo proporcional simple, es
decir,
h(t|x) = ψ(x; β)h0 (t), para t > 0,
en donde el vector de variables explicativas, x, es constante para cualquier individuo.
La inferencia sobre β cuando la función de riesgo h0 (·) es completamente desco-
nocida se basa en la siguiente función de verosimilitud
Y ψ(xi , β)
L= X ,
i∈U ψ(xk , β)
k∈Ri

en donde U denota al conjunto de los individuos que fallan y Ri = R(ti ) = {j|tj >
ti } es el conjunto de individuos en riesgo justo antes de ti .

8.5. Caso de estudio: la deserción en las licencia-


turas de la FCFM-BUAP
La deserción se entiende como la interrupción o desvinculación del proceso
académico-institucional que lleva a cabo el estudiante. Este ha sido un tema estu-
diado por diferentes autores e Instituciones de Educación Superior (IES). El tema

98
Probabilidad, Estadı́stica y sus Aplicaciones

ha tomado un lugar importante dado que no tiene sentido realizar un esfuerzo sig-
nificativo por aumentar la cobertura, calidad y equidad en educación superior, sin
controlar la deserción y su problemática multicausal y compleja. De esta manera,
el emprendimiento de este tipo de estudios aporta a la comprensión del fenómeno
y permite generar estrategias de retención estudiantil al interior de las IES y por
parte del Estado [4].

8.5.1. La deserción en las licenciaturas de la FCFM-BUAP


La Benemérita Universidad Autónoma de Puebla (BUAP), cuyas raı́ces se re-
montan al siglo XVI, constituye un gran pilar de la educación superior y la inves-
tigación cientı́fica en la región, y ocupa un destacado sitio entre las universidades
públicas del paı́s, gracias al esfuerzo conjunto de todos los miembros de la institución
[2].
En la década de los 70, en la BUAP se impuso un modelo de Universidad Crı́tica,
Democrática y Popular que fortaleció la investigación cientı́fica y la vinculación con
los sectores más necesitados de la sociedad. Se creó el Instituto de Ciencias, se
consolidó la Escuela de Fı́sico Matemáticas y nacieron los primeros estudios de
posgrado: maestrı́a y doctorado en Fı́sica [2]. Actualmente, la oferta educativa de
la Facultad de Ciencias Fı́sico Matemáticas (FCFM) consta de:
Licenciatura en Actuarı́a (LA)
Licenciatura en Fı́sica (LF)

Licenciatura en Fı́sica Aplicada (LFA)


Licenciatura en Matemáticas (LM)
Licenciatura en Matemáticas Aplicadas (LMA)
Maestrı́a en Ciencias Fı́sica Aplicada

Maestrı́a en Ciencias Matemáticas


Maestrı́a en Educación Matemática
Doctorado en Ciencias Fı́sica Aplicada

Doctorado en Ciencias Matemáticas.


Las licenciaturas de la FCFM-BUAP no están excentas del problema de la de-
serción escolar, hay alumnos desertores en los diferentes semestres impartidos. El
periodo en el que se presenta la mayor deserción es el primer año escolar. Desde el
2006 hasta el 2013 el porcentaje de deserción en el primer año de la LM ha variado
entre el 27 % y el 57 % y en la LMA entre el 26 % y el 44 %, mientras que en el caso
de la LA la deserción varı́a entre el 13 % y el 25 % como se muestra en la Tabla
8.5.1. La primera generación de la LA ingresó en 2010 por lo que sólo se muestran
las generaciones 2010 a la 2013.

99
Probabilidad, Estadı́stica y sus Aplicaciones

Tabla 8.5.1 Porcentaje de deserción en el primer año de la LA, la LM y la LMA.


Fuente: Elaboración propia a partir de información proporcionada por la FCFM-
BUAP.
Lic. 2006 2007 2008 2009 2010 2011 2012 2013
LA 25 % 22 % 13 % 20 %
LM 39 % 27 % 36 % 28 % 57 % 32 % 33 % 43 %
LMA 34 % 35 % 42 % 26 % 30 % 37 % 44 % 43 %

8.5.2. Descripción del análisis de deserción para las licencia-


turas de la FCFM-BUAP
En el análisis de deserción en las licenciaturas de la FCFM-BUAP se considera
a la deserción como el abandono de la licenciatura de la FCFM. Por lo tanto,
el seguimiento que se le hace al estudiante comienza desde que se matricula en
una licenciatura de la FCFM hasta que sale de ésta. No se considera el hecho de
que el estudiante continúe sus estudios en otra licenciatura de la FCFM, de la
BUAP, de otra institución o si deja de estudiar por completo. Se supone que la
deserción del estudiante es una decisión voluntaria y se reconoce que un estudiante
ha desertado cuando permanece un semestre sin matricularse en la licenciatura que
estaba cursando.
El tiempo de observación considerado es del segundo semestre de 2009 al primer
semestre de 2015, por lo que se consideran a las generaciones que ingresaron en
2009, 2010, 2011, 2012, 2013 y 2014.
El objetivo del análisis es determinar factores causales o indicadores de mayor
deserción; para esto se ajusta un modelo interaccionista, es decir, se consideran
covariables sin dar preferencia a ninguna en especial. Las covariables consideradas
son: puntaje de ingreso (Puntaje), autoestima (Autoestima), hábitos de estudio
(HabEstudio), razonamiento cientı́fico (Lawson), comprensión lectora (THLB), es-
tilos de aprendizaje (Activo, Reflexivo, Teórico y Pragmático), género (Género), con
quien vive (Vive), financiamiento del bachillerato de procedencia (FinBach), tipo
de bachillerato de procedencia (TipoBach), materias reprobadas (MatRep), opción
de carrera (OpCarrera), sostén de estudios (SosEst), trabajo (Trabajo) y recursos
semanales (RecSem). Algunas covariables son categóricas por lo que se les asignó
un valor a cada categorı́a como se muestra en la Tabla 8.5.2.

Tabla 8.5.2 Covariables con sus categorı́as y valores asignados.


Covariable Categorı́as
Género Femenino (0) y Masculino (1)
Vive Padre/Madre (0), Solo (1), Amigos (2), Esposo/Hijos (4) y Otros (3)
FinBach Público (0) y Privado (1)
TipoBach General (0) y Especializado (1)
MatRep Ninguna (0), Menos de 3 (1), De 3 a 6 (2) y Más de 6 (3)
OpCarrera Primera opción (0) y Segunda opción (1)
SosEst Recursos familiares (0), Recursos propios (1), Ambos (2) y Otros (3)
Trabajo No (0) y Si (1)
RecSem Insuficientes (0), Suficientes (1) y Excelentes (2)

Las covariables consideradas son caracterı́sticas del alumno obtenidas mediante


las siguientes pruebas aplicadas a los estudiantes de nuevo ingreso de la FCFM:
Exámenes de admisión de la BUAP.

100
Probabilidad, Estadı́stica y sus Aplicaciones

Inventario de Autoestima de Coopersmith.

Cuestionario de Hábitos de Estudio.


Prueba de Lawson.
Test de habilidades Lecto-Comprensivas Básicas.

Cuestionario Honey-Alonso de Estilos de Aprendizaje.


Cuestionario para alumnos de nuevo ingreso.
Estas pruebas se describen en [5].
Un limitante de este análisis es el hecho de que algunas covariables que varı́an
en el tiempo son consideradas constantes.
Se aplica la metodologı́a del Análisis de Supervivencia al problema de deserción
escolar universitaria en las licenciaturas en Actuarı́a, Matemáticas y Matemáticas
Aplicadas impartidas en la FCFM-BUAP. Se analiza la deserción de los alumnos
de las licenciaturas mencionadas utilizando el modelo de riesgo proporcional semi-
paramétrico. El objetivo es identificar las variables indicadoras de mayor riesgo que
permitan tomar medidas de prevención adecuadas que disminuyan la deserción en
las licenciaturas estudiadas.
En el caso bajo estudio la población objetivo consta de los alumnos que ingresa-
ron a la FCFM entre los años 2009 y 2014. Para medir el tiempo de deserción para
cada alumno se considera como tiempo origen la fecha de su ingreso a la FCFM, la
escala para medir el paso del tiempo es el semestre y el significado de fracaso es la
deserción.
El análisis estadı́stico se realiza con el paquete survival del software R. Este
paquete permite calcular el estimador de Kaplan-Meier y estimar los parámetros
del modelo de riesgo proporcional semiparamétrico.

8.5.3. Análisis con el Modelo de riesgo proporcional semipa-


ramétrico
El análisis con covariables del tiempo de deserción de los alumnos de las licen-
ciaturas de la FCFM se realiza mediante el modelo de riesgo proporcional semipa-
ramétrico, debido a que este modelo está enfocado en evaluar la relación con los
factores o covariables.
En las licenciaturas estudiadas (LA, LM y LMA), modelizar el tiempo de deser-
ción mediante el modelo de riesgo proporcional semiparamétrico con todas las cova-
riables de escala mı́nima de intervalo (Puntaje, Autoestima, HabEstudio, Lawson,
THLB, Activo, Reflexivo, Teórico y Pragmático) proporciona modelos en los que la
mayorı́a de covariables son estadı́sticamente no significativas. Para obtener modelos
con covariables estadı́sticamente significativas se propone realizar el procedimiento
de regresión paso a paso, que es una técnica de selección de modelo ampliamente
utilizada en Regresión Lineal Múltiple [6]. Esta técnica proporciona un modelo cu-
yas variables explicativas son estadı́sticamente significativas. El procedimiento que
se realiza es el mismo que el que se lleva a cabo en Regresión Lineal Múltiple sólo
que en este caso se estiman los coeficientes del modelo de riesgo proporcional en
lugar de los de la regresión lineal múltiple, i.e. se consideran los p-valores de los

101
Probabilidad, Estadı́stica y sus Aplicaciones

estadı́sticos de las pruebas para la hipótesis H0 : βk = 0 correspondientes al modelo


de riesgo proporcional en lugar de los p-valores correspondientes a la regresión lineal
múltiple. En este análisis se considera αdentro = 0.10 = αf uera , donde αdentro es el
p-valor umbral para introducir covariables al modelo y αf uera es el p-valor umbral
para eliminar covariables del modelo (αdentro 6 αf uera ).
Para cada licenciatura (LA, LM y LMA), se obtiene un modelo de riesgo propor-
cional semiparamétrico mediante el procedimiento de regresión paso a paso. Estos
modelos cumplen que todas sus covariables son estadı́sticamente significativas. Po-
siblemente se podrı́a disminuir el número de covariables significativas en el modelo
si se disminuye el valor del nivel de significancia de entrada y salida. Los modelos
se presentan a continuación.
En Actuarı́a:

h(t|x) = h0 (t) exp{(−0.118, −0.006, −0.034)x},


b

en donde x = (Teórico, Puntaje, Autoestima)0 y h0 (·) es la función de riesgo basal


arbitraria.
En Matemáticas:
h(t|x) = h0 (t) exp{−0.006x},
b

en donde x = (Puntaje) y h0 (·) es la función de riesgo basal arbitraria.


En Matemáticas Aplicadas:

h(t|x) = h0 (t) exp{(−0.008, 0.097)x},


b

en donde x = (Puntaje, Lawson)0 y h0 (·) es la función de riesgo basal arbitraria.


Estos modelos indican que la covariable Puntaje es estadı́sticamente significativa
en las licenciaturas analizadas y que a mayor Puntaje es menor el riesgo de deser-
ción. En el caso de Actuarı́a, otras covariables que con mayor puntuación indican
menor riesgo de deserción son Teórico y Autoestima. Mientras que en Matemáticas
Aplicadas parece que mayor puntuación en Lawson indica mayor riesgo de deser-
ción, quizá esto se debe a la correlación positiva moderada existente entre Puntaje
y Lawson. Estas interpretaciones se resumen en la Tabla 8.5.3.
En la siguiente parte del análisis, para cada licenciatura estudiada se obtiene un
modelo de riesgo proporcional semiparamétrico mediante el procedimiento de regre-
sión paso a paso considerando a las covariables: Puntaje, Autoestima, HabEstudio,
Lawson, THLB, Activo, Reflexivo, Teórico, Pragmático, Género, Vive, FinBach,
TipoBach, MatRep, OpCarrera, SosEst, Trabajo y RecSem. En el análisis de Ac-
tuarı́a no se considera a la covariable OpCarrera ya que en esta licenciatura se llena
el cupo, lo cual no permite que ingresen alumnos que tenı́an como primera opción
otra licenciatura de la BUAP. Los modelos obtenidos se presentan a continuación.

En Actuarı́a:
h(t|x) = h0 (t) exp{(0.535, −0.093, −0.164, −1.071)x},
b

en donde x = (MatRep, Teórico, Lawson, TipoBach)0 y h0 (·) es la función de riesgo


basal arbitraria.

102
Probabilidad, Estadı́stica y sus Aplicaciones

En Matemáticas:
h(t|x) = h0 (t) exp{(−0.006, 0.846, 0.717, −0.589)x},
b

en donde x = (Puntaje, Trabajo, OpCarrera, TipoBach)0 y h0 (·) es la función de


riesgo basal arbitraria.

En Matemáticas Aplicadas:
h(t|x) = h0 (t) exp{(−0.007, −0.560, 0.603, 0.095)x},
b

en donde x = (Puntaje, RecSem, FinBach, Lawson)0 y h0 (·) es la función de riesgo


basal arbitraria.

El modelo obtenido para Actuarı́a muestra que mayor puntuación en Teórico in-
dica menor riesgo de deserción, lo cual también ocurre con la puntuación de Lawson.
Se nota que los alumnos que proceden de un bachillerato general (TipoBach=0) tie-
nen mayor riesgo de desertar que los que proceden de un bachillerato especializado
(TipoBach=1). También se observa que a mayor número de materias reprobadas
durante el bachillerato (MatRep) mayor es el riesgo de desertar.
El modelo para la Licenciatura en Matemáticas muestra que mayor Puntaje
indica menor riesgo de deserción. También, los alumnos que proceden de un bachi-
llerato general (TipoBach=0) tienen mayor riesgo de desertar que los que proceden
de un bachillerato especializado (TipoBach=1). En esta licenciatura, los alumnos
que trabajan (Trabajo=1) tienen mayor riesgo de desertar que los alumnos que no
trabajan (Trabajo=0). Además, los alumnos que eligieron estudiar Matemáticas co-
mo primera opción (OpCarrera=0) tienen menor riesgo de desertar que los que la
estudian como segunda opción (OpCarrera=1).
El modelo para Matemáticas Aplicadas señala que mayor Puntaje indica menor
riesgo de deserción y que mayor puntuación en Lawson indica mayor riesgo de
deserción, esto posiblemente se debe a la correlación positiva moderada existente
entre Puntaje y Lawson. Este modelo también revela que los alumnos con más
recursos semanales (RecSem) tienen menor riesgo de desertar y que los alumnos que
proceden de un bachillerato público (FinBach=0) tienen menor riesgo de deserción
que los que proceden de un bachillerato privado (FinBach=1). Estas interpretaciones
se resumen en la Tabla 8.5.4.
Dado que en las licenciaturas en matemáticas (Matemáticas y Matemáticas Apli-
cadas) la covariable Puntaje es indicadora de mayor riesgo de deserción, se realiza
una comparación de las estimaciones de la función de supervivencia y de la fun-
ción de riesgo acumulado para los alumnos con Puntaje mayor o igual a 750 con los
alumnos con Puntaje menor a 750. La Figura 8.2 muestra que los alumnos con Pun-
taje mayor o igual a 750 tienen mayor supervivencia estimada que los alumnos con
Puntaje menor a 750. Además, la Figura 8.3 muestra que los alumnos con Puntaje
mayor o igual a 750 ya no están en riesgo de desertar a partir del quinto semestre
y medio en la LM y a partir del séptimo semestre y medio en la LMA.

103
Probabilidad, Estadı́stica y sus Aplicaciones

Tabla 8.5.3 Interpretación del modelo de riesgo proporcional semiparamétrico con


todas las covariables de escala mı́nima de intervalo para cada licenciatura. El Efecto
en h(·) se indica como sigue: del lado izquierdo el efecto en el riesgo de una baja
puntuación de la covariable, mientras que del lado derecho se indica el efecto de
una puntuación alta. El simbolo + significa que el riesgo aumenta mientras que el
simbolo - significa que el riesgo disminuye.
Licenciatura Variables significativas exp(βbi ) Efecto en h(·)
Estilo de aprendizaje Teórico (Teórico) 0.888 + -
Actuarı́a Puntaje de ingreso (Puntaje) 0.994 + -
Autoestima (Autoestima) 0.967 + -
Matemáticas Puntaje de ingreso (Puntaje) 0.994 + -
Matemáticas Puntaje de ingreso (Puntaje) 0.993 + -
Aplicadas Razonamiento cientı́fico (Lawson) 1.102 - +

Tabla 8.5.4 Interpretación del modelo de riesgo proporcional semiparamétrico con


todas las covariables para cada licenciatura. El Efecto en h(·) se indica como sigue:
del lado izquierdo el efecto en el riesgo de una baja puntuación de la covariable,
mientras que del lado derecho se indica el efecto de una puntuación alta. El simbolo
+ significa que el riesgo aumenta mientras que el simbolo - significa que el riesgo
disminuye.
Licenciatura Variables significativas exp(βbi ) Efecto en h(·)
Materias reprobadas (MatRep) 1.707 - +
Estilo de aprendizaje Teórico (Teórico) 0.912 + -
Actuarı́a
Razonamiento cientı́fico (Lawson) 0.849 + -
Tipo de bachillerato (TipoBach) 0.343 + -
Puntaje de ingreso (Puntaje) 0.994 + -
Trabajo (Trabajo) 2.331 - +
Matemáticas
Opción de carrera (OpCarrera) 2.048 - +
Tipo de bachillerato (TipoBach) 0.555 + -
Puntaje de ingreso (Puntaje) 0.993 + -
Matemáticas Recursos semanales (RecSem) 0.571 + -
Aplicadas Financiamiento del bachillerato (FinBach) 1.827 - +
Razonamiento cientı́fico (Lawson) 1.100 - +

8.5.4. Resultados del análisis


Para cada licenciatura estudiada se obtienen dos modelos de riesgo proporcional
semiparamétricos, uno considerando sólo covariables de escala mı́nima de intervalo y

Figura 8.2: Comparación de las estimaciones de la función de supervivencia por Pun-


taje (con banda de confianza de 95 %) de la LM y la LMA, utilizando el estimador
de Kaplan-Meier.

104
Probabilidad, Estadı́stica y sus Aplicaciones

el otro considerando a todas las covariables. Estos modelos sólo contienen covariables
estadı́sticamente significativas y muestran que valores en las covariables indican
mayor riesgo de deserción.
Los modelos obtenidos cuando sólo se consideran a las covariables de escala
mı́nima de intervalo muestran que el Puntaje es una covariable significativa en las
licenciaturas estudiadas y que mayor Puntaje indica menor riesgo de deserción. En
la Licenciatura en Actuarı́a otras covariables que tienen la misma interpretación
son Teórico y Autoestima.
Los modelos resultantes cuando se consideran a todas las covariables incluyen
al menos una covariable académica (Teórico, Lawson o Puntaje) y una covariable
que tiene que ver con las caracterı́sticas del bachillerato de procedencia (TipoBach
o FinBach). Esto significa que el bachillerato de procedencia influye en el riesgo de
deserción de los alumnos de las licenciaturas estudiadas.
Sólo en las licenciaturas de matemáticas (Matemáticas y Matemáticas Apli-
cadas), los modelos contienen una covariable que tiene que ver con la economı́a
(Trabajo o RecSem). Lo cual se puede deber a la diferencia económica existente
entre los alumnos de estas carreras y los de Actuarı́a.
Los modelos muestran que el número de materias reprobadas en el bachillerato
(MatRep) sólo aumenta el riesgo de deserción de los estudiantes de Actuarı́a. Mien-
tras que el hecho de estar estudiando la carrera como segunda opción (OpCarrera)
sólo aumenta el riesgo de los estudiantes de Matemáticas.
La comparación por Puntaje muestra que en las licenciaturas en matemáticas
(Matemáticas y Matemáticas Aplicadas) los alumnos con Puntaje mayor o igual a
750 tienen mayor supervivencia estimada que los alumnos con Puntaje menor a 750.
A pesar de que los modelos obtenidos varı́an, se puede decir que en las licen-
ciaturas estudiadas el Puntaje de ingreso a la universidad es un factor que tiene
gran influencia en la deserción. Además, el bachillerato de procedencia también in-
fluye en la deserción. También, caracterı́sticas respecto a la economı́a sólo afectan
a los estudiantes de las licenciaturas de matemáticas (Matemáticas y Matemáticas
Aplicadas).

Figura 8.3: Comparación de las estimaciones de la función de riesgo acumulado


por Puntaje (con banda de confianza de 95 %) de la LM y la LMA, utilizando el
estimador de Kaplan-Meier.

105
Probabilidad, Estadı́stica y sus Aplicaciones

8.6. Conclusiones
El Análisis de Supervivencia consiste en un conjunto de técnicas que estudian
el tiempo hasta que ocurre un evento especı́fico. Su metodologı́a es muy extensa
ya que incluye una gran variedad de modelos (paramétricos, no paramétricos y se-
miparamétricos), además algunos modelos permiten incluir variables explicativas o
covariables para evaluar la relación existente entre el tiempo de falla y las covaria-
bles. Los diferentes modelos de supervivencia, con o sin covariables, se pueden usar
para estudiar diferentes datos, incluso cuando se tienen individuos de los que no se
conoce el tiempo de falla exacto (censurados).
La flexibilidad del Análisis de Supervivencia permite aplicarlo en una gran va-
riedad de estudios. En este trabajo se aplica esta metodologı́a en un estudio de la
deserción de las licenciaturas de la Facultad de Ciencias Fı́sico Matemáticas (FCFM)
de la Benemérita Universidad Autónoma de Puebla (BUAP).
Para las licenciaturas en Actuarı́a, Matemáticas y Matemáticas Aplicadas el
análisis de deserción con covariables proporciona modelos de riesgo proporcional
semiparamétricos. Estos modelos muestran que mayor puntaje de ingreso a la uni-
versidad (Puntaje) indica menor riesgo de desertar. Además, al considerar todas
las covariables estudiadas los modelos resultantes muestran que la puntuación alta
de una covariable académica (en Actuarı́a: Teórico o Lawson; en Matemáticas y
Matemáticas Aplicadas: Puntaje) indica menor riesgo de desertar, que las carac-
terı́sticas del bachillerato de procedencia influyen en el riesgo de deserción y que
sólo los modelos correspondientes a las licenciaturas de matemáticas (Matemáti-
cas y Matemáticas Aplicadas) indican que una covariable de economı́a (Trabajo o
RecSem) esta relacionada con el riesgo de deserción.

106
Probabilidad, Estadı́stica y sus Aplicaciones

Bibliografı́a

[1] Cox, D. R.; Oakes, D. Analysis of Survival Data. 1a ed., Gran Bretaña,
Chapman & Hall, 1984.
[2] “Historia Universitaria”. BUAP. http://www. buap. mx/. Consultado: 14 de
abril de 2017.
[3] Lawless, J. F. Statistical Models and Methods for Lifetime Data. 2a ed., Nueva
Jersey, Wiley-Interscience, 2003.
[4] Montes Gutiérrez, I. C.; Almonacid Hurtado, P. Ma.; Gómez Car-
dona, S.; Zuluaga Dı́az, Fco. I.; Tamayo Zea, E. Análisis de la deserción
estudiantil en los programa de pregrado de la Universidad EAFIT. Grupo de
investigación estudios en economı́a y empresa, Departamento de Economı́a, Es-
cuela de Administración, Universidad EAFIT. Medellı́n. ISSN 1692-0694, 2010.
[5] Muñoz Vargas, B. X. Análisis de la deserción en las licenciaturas de la
FCFM-BUAP mediante modelos de supervivencia. Tesis de maestrı́a. Facultad
de Ciencias Fı́sico Matemáticas, Benemérita Universidad Autónoma de Puebla,
2017.
[6] Navidi, W.Estadı́stica para ingenieros y cientı́ficos. Mc Graw Hill, 556-599,
2006.

107
Probabilidad, Estadı́stica y sus Aplicaciones

Capı́tulo 9
Modelación estadı́stica con imágenes satelitales en Ciencias Ambientales

Ana Aleyda Oroza Hernández1 , Gladys Linares Fleites2


Hortensia Josefina Reyes Cervantes1 , Marı́a de L. Sandoval Solı́s3

1
Facultad de Ciencias Fı́sico Matemáticas,
2
Departamento de Investigación en Ciencias Agrı́colas,
3
Facultad de Ciencias de la Computación,
Benemérita Universidad Autónoma de Puebla,
Av. San Claudio y 18 Sur, Col. San Manuel,
C.P. 72570, Puebla, Puebla,
[email protected], [email protected]
[email protected], [email protected]
Resumen. Actualmente la modelación medio ambiental puede considerarse un
campo maduro con muchos artı́culos presentados en un amplio espectro de pro-
blemas ambientales y distintos estudios de caso que cubren diferentes modelos. El
desarrollo de la teledetección o percepción remota ha incrementado aún más las
posibilidades de la modelación estadı́stica en este campo. En el presente capı́tulo se
describe brevemente, a través de dos estudios de caso, la manera en que los modelos
de regresión lineales de efectos- fijos y mixtos son construidos y aplicados a los pro-
blemas del medio ambiente. Un caso se refiere a la modelación de escenarios de las
coberturas y usos de suelo a través de imágenes satelitales en el sureste de la Presa
de Valsequillo, Puebla. El otro caso enfoca la modelación del secuestro de carbono
por suelos forestales en la Región Terrestre Prioritaria 105, Puebla, para mostrar
cómo integrar las herramientas estadı́sticas con otros enfoques y estrategias, como
son las imágenes satelitales y los modelos mixtos, que combinados contribuyen a
una mejor explicación del fenómeno que se estudia, debido a que se pueden incluir
efectos fijos y efectos aleatorios. El software R es utilizado para la estimación, ajuste
y selección de los modelos elaborados.
Palabras claves: Regresión Lineal y polinomial, Modelos mixtos, ı́ndices de vegeta-
ción.

Abstract.The development of remote sensing has further increased the possibilities


of statistical modeling in this field. In this chapter we briefly describe, through two
case studies, the way in which models are constructed and applied to environmen-
tal problems. One case refers to the modeling of land cover and land use scenarios
through satellite images in the southeast of the Valsequillo Dam, Puebla. The other
case focuses on the modeling of carbon sequestration by forest land in the Priority
Land Area 105, Puebla, to show how to integrate statistical tools with other ap-
proaches and strategies, such as satellite images and mixed models, which combined
contribute to a better explanation of the said phenomenon. The software R is used

108
Probabilidad, Estadı́stica y sus Aplicaciones

for the estimation, adjustment and selection of the elaborated models.

Keywords: Linear and polynomial regression, mixed models, vegetation indexes.

9.1. Introducción
El uso de los modelos se ha incrementado en el manejo medioambiental, debido
a que ellos son la única herramienta que permite relacionar cuantitativamente el
impacto en un ecosistema con las consecuencias para el estado del ecosistema [13].
El campo de la modelación medio ambiental se ha desarrollado enormemente desde
que emergieron los primeros modelos en 1970, no sólo debido al desarrollo de la tec-
nologı́a computacional sino también al desarrollo de la teledetección o percepción
remota.

En dependencia del nivel de complejidad, los modelos estadı́sticos de imágenes


pueden tratar con modelos lineales o con modelos lineales generalizados de efectos
mixtos o con modelos no lineales de efectos mixtos. El objetivo que se persigue en el
presente capı́tulo es describir la manera en la que los esfuerzos de la modelación me-
dioambiental han contribuido a esclarecer complejos problemas. Se presentan dos
aplicaciones de la modelación medioambiental. La primera aplicación tiene como
objetivo modelar tres Factores de cobertura de suelo, para conocer cuánto protege
la vegetación la erosión del suelo en la presa de Valsequillo, Puebla. La segunda apli-
cación modela la cantidad de carbono orgánico para una zona terrestre prioritaria
en Puebla.

9.2. Teledetección
La teledetección es una técnica que nos permite obtener información a distancia
de objetos que se encuentran situados sobre la superficie terrestre. El fenómeno de
la Teledetección es posible gracias a la interacción de la energı́a electromagnéti-
ca con las cubiertas terrestres. Estas tienen un comportamiento reactivo variable,
condicionado tanto por los factores externos (ambientales) como por sus propias
caracterı́sticas fisicoquı́micas en el momento de la toma de la imagen.
La primera experiencia de teledetección se retoma en 1859, donde Gaspar Félix de
Tournachon obtuvo las primeras fotografı́as aéreas desde un globo, después se hizo
uso del avión hasta llegar en 1960 al uso de los satélites. Actualmente son numerosos
los centros de producción, enseñanza e investigación que trabajan activamente en
este campo con el uso de satélites (Teledetección espacial).
Para obtener información mediante teledetección espacial es importante que los
objetos y el sensor tengan algún tipo de interacción. Para que la observación sea
posible, se necesitan los siguientes elementos:
Sensor: Instrumentos de grabación, instrumentos de escaneo, aviones, satélites,
boyas o barcos.
Objeto observado: arboles, suelos, etc.
Flujo energético que permite poner a ambos en relación.

109
Probabilidad, Estadı́stica y sus Aplicaciones

Dentro de la teledetección, se destacan las siguientes bandas espectrales, donde


su unidad de medida es el Amgstroms(µm);
1. Espectro visible (.4 a .7 µm): Es la radiación que puede percibir nuestros
ojos, coincide con las longitudes de onda en donde es máxima la radiación
solar.
2. Infrarrojo cercano (.7 a 1.3 µm): Resulta importante por su capacidad para
discriminar masas vegetales y concentraciones de humedad.
3. Infrarrojo medio (1.3 a 8 µm): En esta banda se mezclan los procesos de
reflexión de la luz solar y de emisión de la superficie terrestre.
4. Infrarrojo lejano o térmico (8 a 14 µm).

5. Micro-ondas (a partir de 1 metro): Tipo de energı́a bastante transparente


a la cubierta nubosa.
La constelación de satélites LANDSAT (LAND=tierra y SAT=satélite), que
inicialmente se llamaron ERTS (por sus siglas en inglés, Earth Resources Technology
Satellites), fue la primera misión de los Estados Unidos para el monitoreo de los
recursos terrestres, el primer satélite se puso en órbita el 23 de julio de 1972.

9.2.1. Índices de Vegetación


Se han desarrollado muchos ı́ndices de vegetación basados en el hecho de que
las plantas reflejan menos en luz roja visible, pero más en la radiación infrarroja
cercana en comparación con la superficie sin vegetación [3] y [9].
Por lo tanto, los ı́ndices de vegetación pueden mejorar o extraer algunas carac-
terı́sticas especı́ficas que las bandas espectrales individuales no pueden. Los ı́ndices
de vegetación que más se utilizan son: el ı́ndice de vegetación de diferencia nor-
malizada (NDVI), el ı́ndice de vegetación ajustado al suelo (SAVI), el ı́ndice de
vegetación de diferencia renormalizado (RDVI), el NDVI transformado (TNDVI),
ı́ndice de vegetación simple (SVI) y la proporción simple (RVI).
El NDVI mide la cantidad de vegetación verde, tomando un cociente de las dife-
rencias de reflectancia espectral entre infrarrojo cercano (NIR) y rojo (RED) para
calcularlo, se ha utilizado ampliamente en estudios de teledetección cuyo rango de
valores es de −1.0 a 1.0, donde los valores más altos son para vegetación verde y
los valores bajos para otro tipo de superficie. Ası́, el suelo desnudo o rocas se repre-
sentan con valores de NDVI más cercanos a 0 y los valores negativos corresponden
principalmente a las nubes, el agua y la nieve.
La fórmula para calcular el NDVI queda de la siguiente forma:

(N IR − RED)
N DV I = . (9.1)
(N IR + RED)

9.2.2. Índice de Vegetación Relativo (FVC)


El Índice de Vegetación Relativo (en inglés “Fractional Vegetation Cover”) es la
estimación del porcentaje de vegetación [2]; se basa en el supuesto de que el NDVI

110
Probabilidad, Estadı́stica y sus Aplicaciones

de la vegetación se distribuye gradualmente entre el NDVI del suelo desnudo y el


NDVI de la vegetación totalmente verde. Para calcular el FVC se utiliza la ecuación:
N DV I − N DV Isd
FV C = ∗ 100. (9.2)
(N DV IV V − N DV Isd )2

donde N DV Isd es el NDVI del suelo desnudo y N DV IV V es el NDVI del pixel con
la mayor cobertura de vegetación verde en el área.

9.3. Modelos estadı́sticos


El modelo de regresión para estos métodos puede escribirse como:

y = Xβ + . (9.3)
donde:
y es un vector n × 1 de observaciones de la variable dependiente.
X es una matriz n × p que consiste de n observaciones de las p variables,
β es un vector p × 1 de coeficientes de la regresión (parámetros desconocidos), y
 es un vector n×1 de errores independientes e idénticamente distribuidos con media
cero y varianza σ 2 .
El modelo lineal de efectos mixtos (LMM) es una poderosa herramienta de mo-
delado que permite el análisis de conjuntos de datos correlacionados (clúster) [6]. El
LMM fue presentado originalmente por Laird y Ware, donde presentaron diferentes
aplicaciones en el estudio epidemiológico con datos longitudinales [15], la denomi-
nación de “efectos mixtos” se asigna para tener efectos tanto fijos como aleatorios.
Actualmente se usan para modelar datos de muchos campos en diferentes áreas,
como biologı́a, bioestadı́stica, ciencias sociales, salud y medicina [4, 6] y, particular-
mente, en el medio ambiente.

La formulación corresponde a la propuesta en el artı́culo clásico de Laird y Ware


en [15], en forma matricial el modelo queda expresado como:

yi = Xi β + Zi bi + εi (9.4)

bi ∼ Nq (0, ψ)

εi ∼ Nni (0, σ 2 Λi )
donde
yi es el vector de respuesta ni × 1 para observaciones en el grupo i-ésimo.
Xi es la matriz del modelo ni × p para los efectos fijos y las observaciones en el
grupo i.
β es el vector p × 1 de los coeficientes de efectos fijos.
Zi es la matriz del modelo ni × q para los efectos aleatorios para las observaciones
en el grupo i.
bi es el vector q × 1 de los coeficientes de efecto aleatorio para el grupo i.
εi es el vector de errores ni × 1 para las observaciones en el grupo i.

111
Probabilidad, Estadı́stica y sus Aplicaciones

ψ es la matriz de covarianza q × q para los efectos aleatorios.


σ 2 Λi es la matriz de covarianza ni × ni para los errores en el grupo i.

Los errores residuales εi para el mismo grupo son independientes de los efectos
aleatorios bi .

9.4. Dos Casos de Estudio


9.4.1. Análisis de la cobertura edáfica en el sureste de la
Presa Valsequillo, Puebla.
El uso y manejo no sostenible de la tierra está llevando a una mayor degradación
del suelo y la pérdida de un recurso clave que es fundamental para la vida en el
planeta [12]. En el Plan Estratégico Decenal 2008-2018 aprobado en 2007 por la 8va
Conferencia de las Partes de la Convención de las Naciones Unidas de Lucha contra
la Desertificación, se estableció el objetivo de proteger los suelos contra la erosión
y la contaminación. En México, en el Programa Nacional Manejo Sustentable de
Tierras a favor de un manejo y uso sostenible, publicado en 2008, se señaló que la
erosión y el declive de la fertilidad del suelo afectan a la viabilidad de los terrenos
agrı́colas.
Desde hace décadas, en la región sur de la presa de Valsequillo, el manejo de los re-
cursos naturales se ha llevado de manera inadecuada provocando la degradación del
suelo y la pérdida de la vegetación. La escasa investigación en los diferentes ecosiste-
mas, el empleo de las tecnologı́as de explotación sin tener en cuenta las condiciones
del entorno y el desconocimiento de los principios fı́sicos, quı́micos y biológicos que
determinan la continuidad de los sistemas de producción, son los principales factores
que han afectado gravemente la estabilidad de los sistemas naturales en la Región
Sur de la Presa de Valsequillo. La Figura 9.1 muestra la localización de esta zona.
La zona de estudio corresponde a la parte norte del municipio de Tzicatlacoyan
donde se sitúan las localidades San Miguel Acuexcomac, San Bernardino Tepenene,
San José Texaluca y San Martı́n los Teteles (para más detalles ver [16]).
Identificar mediante imágenes de satélite las afectaciones de la cobertura edáfica de
esta zona es importante para la posterior toma de decisiones en el manejo de estos
suelos y es el objetivo que se persigue en este estudio.

Factores de manejo de cobertura de suelo.


A continuación, se resumen algunos de los indicadores que se utilizan para estos
estudios y que constituyen factores a tener en cuenta en el manejo de la cobertura
del suelo.

Los valores de este factor se calculan tomando el logaritmo del porcentaje de


FVC usando la función de regresión

C F V C = 0.6508 − 0.343 log(F V C). (9.5)

Es uno de los factores de la Ecuación Universal de Pérdida de Suelo, (USLE,


por sus siglas en inglés). Este factor refleja el efecto de las prácticas de cultivo

112
Probabilidad, Estadı́stica y sus Aplicaciones

Figura 9.1: Localización de la zona de estudio. Fuente: Pacheco Rı́os, A., 2018.

y manejo sobre las tasas de erosión. Sus valores indican cuánto protege la
vegetación la erosión del suelo [19]. El factor C USLE corresponde a la pérdida
de suelo bajo condiciones especı́ficas de cultivo, en relación con la que ocurre
en un suelo desnudo. Toma valores de 0 (cubierta vegetal alto) a 1 (suelo
desnudo). Esto puede ser representado como
Acrop
C U SLE = ∗ 100. (9.6)
Af allow

Este factor refleja el efecto de las prácticas de cultivo y manejo sobre las tasas
de erosión. Los valores de C USLE indican cuánto protege de la erosión la
vegetación del suelo.
El factor C exp puede estimarse aplicando la relación utilizada por Van der
Knijff en [14]:
N DV I)
C exp = exp(−α ∗ ). (9.7)
(β − N DV I)
Se considera como un factor de gestión de cobertura de cultivo calculado. En
[14] se sugiere que al aplicar esta relación, se obtienen mejores resultados que
usando una relación lineal.

Obtención de la imagen satelital y análisis exploratorio de la tabla de


datos
La imagen de satélite fue obtenida del Servicio Geológico de los Estados Unidos
(USGS, por sus siglas en inglés) y corresponde al año 2015. Dicha imagen se obtuvo
sin cobertura de nubes en la temporada de sequı́a, lo que permitió reducir el efecto
espectral de la vegetación y de los cultivos en el procesamiento de la imagen. El

113
Probabilidad, Estadı́stica y sus Aplicaciones

análisis e integración de la información se realizó con el Sistema de Información


Geográfica de uso libre Quantum GIS[18]. Con la información obtenida se elaboró
una tabla de 34552 filas (puntos georeferenciados) y 5 columnas con las variables
cuantitativas NDVI, FVC, C FVC, C USLE y C exp, realizándose el análisis ex-
ploratorio de los datos. Se detectaron 5 puntos aberrantes o “outliers” que fueron
eliminados, dado que el análisis gráfico realizado y la gran cantidad de datos dispo-
nibles indicaron que no se afectarı́a la modelación estadı́stica posterior. La matriz
de correlaciones, que se muestra en la Tabla 9.1, indica que las variables NDVI,
FVC, C FVC y C exp se encuentra altamente correlacionadas entre ellas, por lo
cual es importante considerar su relación para la construcción de modelos.

Tabla 9.1: Correlación entre las variables.


FVC C FVC C USLE C exp
NDVI 0.98 -0.97 -0.32 -0.96
FVC -0.93 -0.32 -0.90
C FVC 0.30 0.99
C USLE 0.29
C exp

Modelos de regresión
Se ajustaron tres modelos lineales, uno para cada variable FVC, C FVC y C exp,
tomadas como variables dependientes y como variable independiente el NDVI. Sus
estimaciones fueron ajustadas usando la función lm() del software R. Las estima-
ciones de intercepto y pendientes de cada modelo se muestran en la Tabla 9.2.

Tabla 9.2: Estimaciones de los parámetros en cada modelo lineal.


MODELO Estimate Pr(>|t|)
Modelo 1 (Intercept) -20.2621 0.0000
FVC NDVI 95.7324 0.0000
Modelo 2 (Intercept) 0.5324 0.0000
C FVC NDVI -0.6875 0.0000
Modelo 3 (Intercept) 0.7403 0.0000
C exp NDVI -1.1064 0.0000

A pesar de que las estimaciones para cada modelo, tanto del intercepto como de
la pendiente, son significativas, una parte importante dentro de la modelación que
no debe ser olvidado, es la validez de los supuestos del modelo, para ello hicimos uso
de los gráficos de residuales que proporciona el comando plot() en el software R. Los
gráficos de valores ajustados y residuales mostraron un comportamiento particular
que sugirieron el uso de otro tipo de modelo, por ejemplo, un modelo polinomial
para ajustar los datos.
Las estimaciones de cada modelo usando modelos polinomiales se muestran en
la Tabla 9.3. Estas estimaciones son de igual forma significativas, con excepción de
la pendiente del modelo 1 no lineal, por lo cual sólo se realiza el ajuste del modelo
sin intercepto para el primer modelo polinomial. El ajuste y las predicciones dentro

114
Probabilidad, Estadı́stica y sus Aplicaciones

de cada modelo se muestran en los gráficos correspondientes en las Figuras 9.5, 9.6
y 9.7.
Las estimaciones de los parámetros de los modelos no lineales son significativas y
también poseen un buen ajuste ya que el coeficiente de determinación R2 es igual
0.98.
La Figuras de los residuos que se muestran en 9.2, 9.3 y 9.4 son usados para el
ajuste de modelos lineales, para verificar los supuestos de linealidad, normalidad y
homogeneidad de varianzas, que no todos se consideran dentro de los modelos no
lineales. Un modelo lineal adecuado muestra gráficas de residuos con valores ajusta-
dos distribuidos de manera homogénea sobre un intervalo, mientras que el supuesto
de normalidad y linealidad se verifica con el gráfico de residuales estandarizados
y cuantiles teóricos, en caso de cumplir el supuesto de normalidad los datos estos
deben estar muy cercanos a la recta de dicho gráfico. Finalmente, estas ecuaciones
que se estimaron se puede calcular la cantidad de cobertura vegetal, en función
del ı́ndice de vegetación NDVI que es obtenido por medio de la imagen de satélite
considerada.

Tabla 9.3: Estimaciones de los parámetros en cada modelo no lineal.


MODELOS Estimate Pr(>|t|)
Modelo 1. (Intercept) 0.0000 0.5800
FVC NDVI -0.0000 0.2917
I(NDVI^2) 100.0000 0.0000
Modelo 2. (Intercept) 0.8272616 0.0000
C FVC NDVI -2.4437965 0.0000
I(NDVI^2) 3.0196644 0.0000
I(NDVI^3) -1.5291057 0.0000
Modelo 3. (Intercept) 1.1108 0.0000
C exp NDVI -2.8568 0.0000
I(NDVI^2) 1.8285 0.0000

Finalmente los modelos estimados quedan de la siguiente forma:

F CV = 100 ∗ N DV I 2 + ε (9.8)

C F CV = .82 − 2.44 ∗ N DV I + 3.01 ∗ N DV I 2 − 1.52 ∗ N DV I 3 + ε (9.9)

C exp = 1.1 − 2.8 ∗ N DV I + 1.8 ∗ N DV I 2 + ε (9.10)

115
Probabilidad, Estadı́stica y sus Aplicaciones

Figura 9.2: Gráfico del modelo ajustado: Modelo 1.

Figura 9.3: Gráfico del modelo ajustado: Modelo 2.

Figura 9.4: Gráfico del modelo ajustado: Modelo 3.

9.4.2. Secuestro de carbono en la RTP 105


Se presenta la localización de la Región Terrestre Prioritaria 105 (RPT 105)
que se ubica en las coordenadas extremas: 190 460 2300 y 200 110 5500 de latitud norte
y 970 090 1700 a 970 380 3600 de longitud oeste y está conformada por 28 municipios de
los que 4 pertenecen al estado de Veracruz y 24 en la Sierra Norte de Puebla. La
Figura 9.6 muestra en color rojo la localización de la zona de estudio.

116
Probabilidad, Estadı́stica y sus Aplicaciones

Figura 9.5: Localización de la Región Terrestre Prioritaria 105.

Figura 9.6: Imagen satelital de la zona de estudio.

Para el estudio del secuestro de carbono en suelos en la RTP-105, se buscaron


imágenes con sensor ETM+ y TM. Las muestras de suelo (propiedades fı́sico y
quı́micas del suelo) habı́an sido tomadas en el año 2005, por lo que era de interés
tomar imágenes de ese año y el satélite que se encontraba en órbita correspondı́a
al satélite Landsat 7. Se descargaron las imágenes del satélite Landsat 7 (2 de
noviembre de 2005), que se obtuvo a través de USGS (Earth Resource Observation
Systems Data Center). Se consideraron también las condiciones atmosféricas para
que la información no se viera afectada por las condiciones climáticas.
Ya obtenidas las imágenes de satélite que corresponden a la banda 3 y 4 del satélite
Landsat 7, se hizo uso del software GIS (Geographic Information System), para
poder obtener el ı́ndice de vegetación NDVI.
Se utilizó la metodologı́a de Zuur que está enfocada a obtener el mejor modelo
mixto, basado en los criterios de selección de modelos AIC y BIC. El procedimiento
fue el siguiente:

PASO 1 Ajustar un modelo donde la componente fija contenga todas las variables
explicativas e interacciones posibles. Dentro de las variables de la zona RTP-
105, se realizó una selección de variables que aportan más información al
modelo. Los distintos modelos de regresión se realizaron usando la función

117
Probabilidad, Estadı́stica y sus Aplicaciones

lm() del software R, llegando a que el mejor modelo de efectos fijos es el que
se muestra en la tabla 9.4.

Tabla 9.4: Estimaciones del modelo modelo1.lm.


Estimate Std. Error t value Pr( > | t|)
Ntot 3.9109 0.3168 12.35 1.25e-11 ***

Tomando como base el modelo anterior, se introduce la variable NDVI mos-


trando sus estimaciones en la Tabla 9.5.

Tabla 9.5: Estimaciones del modelo modelo2.lm.


Estimate Std. Error t value Pr( >| t|)
Ntot 9.545 1.950 4.894 6.81e-05 ***
NDVI 5.382 2.204 2.442 0.0231 *

PASO 2 Teniendo como base el mejor modelo con las componentes fijas, ahora
continuamos con el segundo paso de la metodologı́a de Zuur, sin embargo, en
este estudio sólo se requiere ver las variaciones en F V (formación vegetal),
como variable aleatoria que queremos introducir dentro del modelo, por lo
cual el modelo en este paso de la metodologı́a de de Zuur, para el caso de la
Zona RTP-105 queda como: parte fija las variables del modelo modelo2.lm y
parte aleatoria F V.
PASO 3 Se busca la estructura óptima de la componente fija del modelo. Para
ello podemos utilizar el estadı́stico F o el estadı́stico t obtenido mediante el
estimador REML con la función lme() o comparar modelos anidados. Para
comparar modelos que tienen la misma estructura en la componente aleato-
ria, pero difieren en la componente fija se debe de utilizar un estimador LM
y no un estimador de REML.
Se construyen distintos modelos, donde se varı́a la componente aleatoria, intro-
duciéndola como una intercepto, pendiente, que afecta a los distintos modelos,
para buscar la mejor estructura de modelo con componente fija y componente
aleatoria.
Para realizar los distintos modelos mixtos, en este trabajo se usan la librerı́a
library(lme4), library(Matrix), library(Rcpp)y library(nlme). Estas librerı́as,
contienen distintas funciones que nos ayudan a poder estimar los efectos de las
variables fijas y aleatorias en modelos mixtos. Los siguientes modelos mixtos
contienen la misma componente aleatoria, pero buscando la mejor componen-
te fija. Para seleccionar el mejor modelo en esta parte, usamos los criterios de
selección de modelos AIC y BIC.

En la Tabla 9.6, se observan los criterios de selección de modelos para selec-


cionar el mejor modelo. El modelo mixed.model1 es seleccionado por tener
los valores más pequeños de los criterios, con un valor de AIC = 38.34 y
BIC = 42.70463.

118
Probabilidad, Estadı́stica y sus Aplicaciones

Tabla 9.6: Criterios de selección de modelos.


df AIC BIC
mixed.model1 4.00 38.34 42.70463
mixed.model2 3.00 50.49 53.89353
mixed.model3 2.00 55.51 57.86206

PASO 4 Finalmente el último paso consiste en presentar el modelo final utilizando


un estimador REML y analizar las suposiciones establecidas en el mismo.

Modelo lineal Mixto seleccionado


mixed.model1<- lme(log(Corg)~-1+Ntot+NDVI, random = ~1| F_V)

Como parte final de la metodologı́a de Zuur se muestra la salida completa de


las estimaciones del modelo, usando el metodo REML.

Linear mixed model fit by REML t-tests use Satterthwaite


approximations to degrees of
freedom [lmerMod]
Formula: log(Corg) ~ -1 + Ntot + NDVI + (1 | F_V)
Random effects:
Groups Name Variance Std.Dev.
F_V (Intercept) 0.1654 0.4067
Residual 0.1528 0.3909
Number of obs: 24, groups: F_V, 6

Fixed effects:
Estimate Std. Error df t value Pr(>|t|)
Ntot 1.9082 0.4780 21.7410 3.992 0.000627 ***
NDVI 2.2151 0.5194 21.9890 4.264 0.000317 ***

Correlation of Fixed Effects:


Ntot
NDVI -0.569

Con los siguientes comandos en R, realizamos los gráficos, para analizar las
suposiciones del modelo mixed.model1.

Res <- residuals(mixed.model1, type="normalized")


Fit <- fitted(mixed.model1)
par(mfrow=c(2,2))
plot(Res ~ Fit, xlab="Fitted values", ylab="Residuals",
main="Residuals vs. fitted")
abline(h=0)
plot(Res ~ datos\$F_V, xlab="FORMACI\’ON VEGETAL", ylab="Residuals",
main = "FORMACI\’ON VEGETAL")
abline(h=0)

119
Probabilidad, Estadı́stica y sus Aplicaciones

hist(Res, main="Histogram of residuals", xlab="Residuals")


qqnorm(Res)
qqline(Res)

Figura 9.7: Suposiciones del modelo mixed.model1.

La forma del modelo mixto ajustado, se muestra a continuación:


log(Corgij ) = β1 ∗ N totij + β2 ∗ N DV Iij + aj + ij . (9.11)
El ı́ndice j(representa a las distintas Formaciones vegetales F V ) toma valores
de 1 a 6, e i (representa las muestras dentro de cada formación vegetal).

La parte de los resultados que se refiere a los efectos aleatorios nos muestra que
la varianza residual es σ 2 = .392 y la varianza de la constante σa2 = .402 . Para la
parte de los efectos fijos del modelo, β1 ∗ N tot + β2 ∗ N DV Iij , la constante se
estima con el valor β1 = 1.90 y la segunda en β2 = 2.21. Ambos parámetros son
significativamente distintos de 0. Un observación importante es sobre la correlación
entre las constantes es de −.50.

El Ntot y NDVI tienen efecto significativo sobre el logaritmo del carbono orgáni-
co, obervando en la salida del software R que hay en promedio más cantidad de
Carbono orgánico por el ı́ndice de vegetación, mientras que el Ntot hay ligeramente
menos. El modelo es bastante adecuado y se cumplen los supuestos (Figura 9.7).

9.5. Conclusiones
En los dos casos de estudios, donde el NDVI que se obtiene por medio de imáge-
nes de satélite resultó ser significativo en ambos modelos, es decir permite predecir

120
Probabilidad, Estadı́stica y sus Aplicaciones

los ı́ndicadores de suelo y/o la cantidad de carbono orgánico dependiendo el caso de


estudio. En el primer caso se determinaron los modelos 9.8, 9.9, 9.10 de regresión
polinómicos que mejoraron ajuste de los modelos, debido a que los datos tienen
comportamientos curvilı́neos. En el segundo caso los modelos lineales mixtos resul-
taron ser mejores para ajustar y estimar la cantidad de carbono orgánico dentro de
la zona RTP-105, el modelo final de este caso corresponde a la fórmula 9.11.
Existe reconocimiento internacional del papel de la modelación estadı́stica en la
investigación medioambiental, la cuantificación de la incertidumbre presente en los
problemas ambientales es uno de los retos actuales de la Ciencia Estadı́stica, que
junto al desarrollo de la Teledetección y la Ciencia de la Computación, se enfocan
a brindar mejores explicaciones a tan complejos problemas, no viéndolos como un
fin meramente técnico, sino como un medio necesario para mejorar las condiciones
de vida de millones de personas.

121
Probabilidad, Estadı́stica y sus Aplicaciones

Bibliografı́a

[1] Arriaga, L., J.M. Espinoza, C. Aguilar, E. Martı́nez, L. Gómez y


E. Loa (coordinadores). Regiones terrestres prioritarias de México. Escala
de trabajo 1:1 000 000. Comisión Nacional para el Conocimiento y uso de la
Biodiversidad. México, 2000.

[2] Boettinger, J. L., Ramsey, R.D. , Bodily, J.M., Cole, N.J., Kienast-
Brown, S., Nield, S.J., Saunders, A.M., and Stum, A.K. Landsat
Spectral Data for Digital Soil Mapping. In Digital Soil Mapping with Limited
Data, A.E. 2008.
[3] A. Bannari and D. Morin F. Bonn A. R. Huete . A review of vegetation
indices, Remote Sensing Reviews. Vol.(13), p. (95-120), Taylor & Francis,
1995.
[4] Demidenko, E.. Mixed models. Theory and applications with R. 2nd edition.
Wiley, New York, USA, 2013
[5] Dı́az G. y Cervigón, J. J. Estudio de ı́ndices de vegetación a partir de
imágenes aéreas tomadas desde UASRPAS y aplicaciones de estos a la agri-
cultura de precisión , 2015.
[6] Galecki A. and Burzykowski T.Linear mixed-effects models using R. A
step by step approach. 1st edition. Springer, New York, p.(542), 2013.

[7] Ieno N. E., Saveliev A. A., Smith M. G., Walker J. N. and Zuur
F. A Mixed Effects Models and Extensions in Ecology with R. Springer, 2009.
[8] Instituto Nacional de Estadı́stica y Geografı́a (INEGI),
Marco Geoestadı́stico Nacional, México. Disponible.
http://www.beta.inegi.org.mx/app/biblioteca/ficha, 2017.

[9] Jensen, J.R. Remote Sensing of the Environment: An Earth Resource Pers-
pective. Pearson Prentice Hall, New Jersey, 2000.
[10] Jensen, J.R. Introductory Digital Image Processing: A Remote Sensing
Perspective. Pearson Prentice Hall, New Jersey, 2005.

[11] John, R., Jensen y Dr. Kalmesh Lulla, Introductory digital ima-
ge processing: A remote sensing perspective, Geocarto International. Vol.(2),
p.(65-65), 1987.

122
Probabilidad, Estadı́stica y sus Aplicaciones

[12] Jones, A. P., Panagos, S.,Barcelo, F., Bouraoui, C.,Bosco, O. De-


witte, C., Gardi, The State of Soil in Europe. Joint Research Centre Refe-
rence Report. Publications Office of the European Union Luxembourg, p.(45),
2012.
[13] Jorgensen, S.E. . Environmental Models and Simulations. In Environmen-
tal Systems. [Ed. Achim Sydow], in Encylopedia of Life Support Systems
(EOLSS), Developed under the Auspices of the UNESCO, Eolss Publishers,
Oxford, UK, http://www.eolss.net, 2004.
[14] van der Knijff J. M. , Jones R. J. A., Montanarella L., Soil Erosion
Risk Assessment in Europe, 2000.
[15] Nan M. Laird and James H. Ware, Random-Effects Models for Longitu-
dinal Data, Biometrics , p.(963–974), Wiley, International Biometric Society,
Vol.(38), 1982.
[16] Pacheco R. A. . Cambio espacio temporal de la cobertura edáfica en el sur-
este de la Presa Valsequillo, Puebla. Causas y efectos. Tesis de Maestrı́a en
Ciencias Ambientales. Posgrado en Ciencias Ambientales. Instituto de Cien-
cias. Benemérita Universidad Autónoma de Puebla, 2018.
[17] R Core Team. R: A language and environment for statistical com-
puting. R Foundation for Statistical Computing, Vienna, Austria.
https://www.r-project.org, 2017.

[18] Quantum GIS Development Team., Quantum GIS Geographic In-


formation System. Open Source Geospatial Foundation Project.
http://qgis.osgeo.org, 2017.
[19] Wischmeier W. H., Smith D. D.. Predicting rainfall erosion losses R,
USDA Agricultural Handbook 537, 1978.

123
Probabilidad, Estadı́stica y sus Aplicaciones

Capı́tulo 10
Riesgo de Crédito usando Redes Neuronales

Adriana Herrera Martı́nez1 , Hortensia J. Reyes Cervantes1


Gladys Linares Fleites2 , Bulmaro Juárez Hernández1

1
Facultad de Ciencias Fı́sico Matemáticas,
2
Departamento de Investigación en Ciencias Agrı́colas
Facultad de Ciencias Fı́sico Matemáticas,
Av. San Claudio y 18 Sur, Col. San Manuel,
C.P. 72570, Puebla, Puebla,
[email protected], [email protected]
[email protected], [email protected]
Resumen. Los modelos de Credit scoring estiman las probabilidades de in-
cumplimiento y determinan criterios a los deudores y solicitantes de financiamiento
en función de su riesgo de incumplimiento. Estos procedimientos se han venido
desarrollando dentro de las últimas cuatro décadas, debido al perfeccionamiento de
mejores recursos estadı́sticos y computacionales. La modelación de la base de datos
es importante adecuarla a los tipos de clientes y la información con la que se cuenta
de los solicitantes. La información de estudio contenı́a 30,000 datos de un banco
de Taiwán, se usó una técnica de minerı́a de datos (redes neuronales), debido a
la ventaja de ser un método flexible y de fácil aplicación. Las variables de mayor
importancia que se obtienen en la modelación están relacionadas con información
financiera y no con las variables demográficas.

Abstract. Credit scoring models estimate the probabilities of default and determine
criteria for debtors and loan applicants based on their default risk. These procedures
have been developed within the last four decades, due to the improvement of better
statistical and computational resources. The modeling of the database is important
to adapt it to the types of clients and the knowledge with which the applicants
are counted. The study information contained 30,000 data from a Taiwan bank, a
data mining technique (neural networks) was used, due to the advantage of being
a flexible and easy to apply method. The most important variables obtained in the
modeling are related to financial information and not to the demographic variables.

Palabras clave: Regresión Logı́stica, Credit scoring, redes neuronales, base de


datos de Taiwán.

10.1. Introducción
A lo largo de los años el aumento en el uso de créditos ha llevado a la industria
a desarrollar métodos para determinar a qué personas fı́sicas o morales se les otórga

124
Probabilidad, Estadı́stica y sus Aplicaciones

uno. Para una institución financiera es esencial poder reducir los riesgos que pue-
dan producir pérdidas debido a una mala selección de clientes, ya que si los créditos
otorgados no son pagados estos se traducen en pérdidas económicas para estas ins-
tituciones. Los modelos de Credit scoring son herramientas estadı́sticas que se han
desarrollado en el tiempo para poder realizar la clasificación de clientes buenos o
malos [4]. Antiguamente un gerente de créditos o alguna persona representante de
una institución mediante su criterio decidı́a si aceptaba o no el préstamo o crédito
a un cliente, hoy en dı́a es más frecuente usar en las instituciones los modelos de
Credit scoring, el cual es más objetivo pues cuentan con un respaldo matemático y
con mucha información relevante sobre el comportamiento de solicitantes con cuen-
tas en la institución, aunque estas no son tan precisas en general para cada cliente
que solicita un crédito. Cada institución tiene sus propias caracterı́sticas en sus so-
licitantes, clientes y sus instituciones. Es común encontrar en las bases de datos de
los Credit scoring que se incluyan datos demográficos y caracterı́sticas financieras
de los clientes, como: edad, género, historial crediticio, ingreso económico, tipo de
trabajo, morosidad en los pagos, etc. ([2], [3]). Para determinar a los clientes buenos
las instituciones financieras cuentan con una fórmula con parámetro desconocido,
que estiman usando la información de los solicitantes, la experiencia anterior con
el solicitante y si es posible la información que ha tenido con otras instituciones. A
partir de este parámetro se podrá determinar las probabilidades de incumplimiento.

Los métodos estadı́sticos más frecuentes que se utilizan son: análisis discriminan-
te, modelo de probabilidad lineal, modelo Logit, modelos de programación lineal,
redes neuronales, árboles de decisión y otras más ([1], [3], [8], [11]). La metodologı́a
usada fue con redes neuronales, una técnica de la minerı́a de datos, que tiene su
origen en las neurociencias, matemáticas, fı́sica y ciencias computacionales, entre
otras. Uno de los problemas para desarrollar estos sistemas de Credit scoring es la
escasez de información pública, disponible, actual y completa. Esto es debido a la
confidenciabilidad que las instituciones financieras que tienen con sus solicitantes y
clientes. Los datos de este trabajo se obtuvieron de un sitio de internet de la Uni-
versidad de California, que cuenta con 30,000 clientes de un banco de Taiwán en un
periodo de Abril a Septiembre del 2005 y contenı́a cerca de 23 variables explicativas
socioeconómicas.

10.2. Marco teórico


10.2.1. Modelo de Credit scoring
Los modelos de Credit scoring buscan encontrar una regla general que determine
la probabilidad default de una determinada solicitud, para generar ésta regla se
debe de analizar la relación que existe entre las caracterı́sticas disponibles de los
solicitantes. Realizando dicho análisis y con el uso de un sistema de score se puede
determinar la clasificación de un solicitante [6]. Se puede plantear la ecuación

P = f (x1 , ..., xk ) + ε (10.1)

donde xi son las variables explicativas, ε es la perturbación aleatoria, f (.) la función


que determina la relación entre las variables utilizadas y P la probabilidad de que

125
Probabilidad, Estadı́stica y sus Aplicaciones

el crédito resulte en no pago. El objetivo principal de estos métodos se centra en


calcular una función que permita ajustar con la mayor exactitus las observaciones
de la muestra y que los errores de predicción sean los menores posibles. Depen-
diendo si la función f (.) es conocida o no, se trata de un modelo paramétrico o no
paramétrico. Los modelos paramétricos se basan en una función de distribución o
clasificación conocida f (.) que se establece a priori, el interés consiste en estimar los
parámetros que mejor ajustan las observaciones en la muestra. Estos modelos son
muy efectivos cuando el procesador generador de datos sigue la distribución pro-
puesta, pero es sensible a las violaciones de las hipótesis de inicio cuando se utilizan
muestras pequeñas.

Construcción del Modelo


En este trabajo se toma la construcción de un modelo de Credit scoring dado
por Nieto et al. [9]:
1. Conformación de la base de datos. Obtener la base de datos en formato
electrónico a partir de la información de las solicitudes de crédito y el resto
de la fuentes disponibles.
2. Depuración de la base de datos. Buscar los datos nulos inconsistentes,
fuera de rango o erróneos que tenga la base para corregirlo o eliminarlos.
Evaluar cada variable y elemento de la muestra que tengan muchos valores
con errores.
3. Agrupar la base de datos. Se conforman los intervalos de clase para los
atributos de cada variable. Separar la muestra, generalmente tomando el 75 %
para el modelo y el 25 % para la validación.

4. Seleccionar las caracterı́sticas. Mediante herramientas estadı́sticas se ana-


liza cada variable para saber cuáles presentan mayores diferencias en las pro-
porciones de los clientes buenos y malos, es un punto decisivo para determinar
que variables se deben de agregar al modelo.
5. Determinar la función clasificación. La clasificación de los clientes se
puede realizar con cualquiera de los métodos que se mencionan en este trabajo.

6. Validar el modelo. Una vez elaborada la función de clasificación se valida


tomando la parte restante del 25 %, corroborando que los resultado se apeguen
al modelo original (backtesting).
7. Elaborar el scordcard. En caso de que el modelo lo permita, se puede formar
un scorecard con cada variable, calculando los valores con una translación o
cambios de escala. Aquı́ se tendrá el peso de cada atributo de cada variable.
8. Establecer el puntaje de corte o cut-off. Se establece un puntaje mı́nimo
que debe tener el solicitante para ser aceptado en un crédito.

126
Probabilidad, Estadı́stica y sus Aplicaciones

10.2.2. Estimación
Sea i = 1, ..., n una muestra de n observaciones (yi , xi ) donde Y es una variable
dependiente dicotómica y las variables independientes (xi ), son las caracterı́sticas
del i-ésimo individuo en la muestra con una distribución asociada Bernoulli. Se
presenta la ecuación

exp(β0 +β1 x1 +...+βn xn )


π(xi ) = . (10.2)
1 + exp(β0 +β1 x1 +...+βn xn )
donde se estiman a las βi , aplicando el logaritmo neperiano se busca encontrar la
maximización de
n
X
L(β) = ln(l(β0 , ..., βn )) = [yi ln(π(xi )) + (1 − yi ) ln(1 − π(xi ))] . (10.3)
i=1

El próximo paso a seguir es comprobar la significancia estadı́stica de cada uno de


los coeficientes de la regresión del modelo, para esto existen dos métodos principales:
el estadı́stico de Wald y el estadı́stico G de razón de verosimilitud.

El estadı́stico de Wald: Aquı́ se contrasta la hipótesis de que un coeficiente ais-


lado es distinto de 0, y sigue una distribución ( Normal Estándar) [4]. Su valor
para un coeficiente en especı́fico viene dado por el cociente entre el valor del
coeficiente (β̂i ) y su correspondiente error estándar σ̂(βi ).

H0 : βi = 0 vs H1 : βi 6= 0
β̂i
W ald = . (10.4)
σ̂(βi )

La obtención de significación indica que dicho coeficiente es diferente de 0 y


merece la pena su conservación en el modelo.
El estadı́stico G de razón de verosimilitud: En este método se trata de ir
contrastando cada modelo que surge de eliminar cierta cantidad h de varia-
bles frente al modelo completo (que incluye las k variables de la muestra). La
valoración se desarrolla mediante el contraste del siguiente juego de hipótesis,
para toda i = 1, ..., h:

H0 : Las variables no influyen en el modelo, βi = 0.


vs.
H1 : Las variables influyen en el modelo, βi 6= 0.

La ausencia de significación implica que el modelo sin la covariable no empeora


respecto al modelo completo (es decir, da igual su presencia o su ausencia),
por lo que según la estrategia de obtención del modelo más reducido, dicha
covariable debe ser eliminada del modelo ya que no aporta nada al mismo.

127
Probabilidad, Estadı́stica y sus Aplicaciones

10.2.3. Medidas de confiabilidad del Modelo


1. Devianza: Se define como D = −2Σni=1 [yi ln( yp̂i ) + (1 − yi ) ln( 1−y
1−p̂
i
)]. Dado
2
un α fijo, Si D > χ(n−p),α el modelo es confiable.
2. Prueba de Bondad de ajuste de Hosmer-Lemeshov. Se construyen
tablas para comparar los resultados de la estimación con los datos reales de
la muestra, clasificando éxitos y fracasos. Con j = 1, ..., J, la hipótesis a
contrastar es
exp{β0 + β1 x1 + ... + βn xn }
H0 : ω̂j = vs H1 : no H0 .
1 + exp{β0 + β1 x1 + ... + βn xn }

Tomando g el número de grupos, π ek el número total de observaciones en el


késimo grupo, Ok la suma de las Y en el késimo grupo y π ek el promedio de
las πk en el k-ésimo grupo, se define
0
g (Ok − nk π ek )2
Ĉ = Σk=1 0 .
ek (1 − π
nk π ek )

Dado un α, si el modelo es correcto, la distribución del estadı́stico Ĉ es


χ2(g−2),α.

10.2.4. Capacidad predictiva del Modelo


Hay que clasificar a los individuos dependiendo del valor de la probabilidad que
tomen si supera un valor de corte o no, si su valor estimado excede a π entonces se
le asignará el valor de 1, y de otra forma se le asigna 0; el valor más frecuente es
0.5 [6].
La exactitud de una prueba estadı́stica puede definirse en función de la sen-
sibilidad y especificidad diagnósticada. Tomando un punto de corte que permita
clasificar los dos grupos. Se define por sensibilidad de una prueba a la proba-
bilidad de obtener un resultado positivo y por especificidad la probabilidad de
obtener un resultado negativo. A continuación se presenta ([4], [5]).
1. Clasificación. Se clasifican las cuatro situaciones de la realidad (y0 ) y los va-
lores posibles en el modelo: valores verdaderos positivos (VP), valores verda-
deros negativos (VN), falsos negativos (FN) y falsos positivos (FP). Donde se
definen los conceptos de

VP
Sensibilidad= V P +F N , Especificidad = V NV+F
N
P y el

Área bajo la curva ROC (Receiver Operating Characteristic).


La curva ROC es un gráfico en que se observan todos los pares en el cociente
de sensibilidad/especif icidad que es resultado de la variación continua de
los puntos de corte de π en todo el rango de resultados observados. El eje
perpendicular y es la sensibilidad, en el eje x los falsos positivos. El área bajo
la curva es una medida de la capacidad del modelo para discriminar entre los
sujetos que cumplen y los que no.

128
Probabilidad, Estadı́stica y sus Aplicaciones

2. Cálculo del área del ROC. El procedimiento consiste: a) Guarda los valores
estimados del modelo. b) Calcula el estadı́stico de Mann-Whitney para los
valores esperados.
3. Elección del punto de corte óptimo. a) Hay que optimizar la sensibilidad y
especificidad. b) Buscar el punto de corte para encontrar diferentes modelos
logı́sticos. c) Buscar la constante estimada para maximizar la sensibilidad y
especificidad. d) Hay reglas generales para ROC en la discriminación: total,
aceptable, excelente y extraordinaria.

10.2.5. Redes neuronales


Este modelo tiene su importancia debido a su potencia predictiva, flexibilidad
y facilidad en el uso. Una red neuronal es una máquina disenãda para modelar la
forma en que trabaja el cerebro cuando realiza una actividad especı́fica o una fun-
ción de interés, esta red está compuesta por un conjunto de neuronas artificiales
interconectadas. El entrenamiento de una red neuronal se hace mediante la repeti-
ción de pruebas con varias sub-muestras de la muestra hasta que la red alcanza una
mı́nima diferencia entre el resultado deseado y el obtenido. Las redes neuronales
tienen ventajas ya que no presentan relaciones no lineales, se adaptan a pequeños
cambios en los medios que se desarrollan y es un modelo no paramétrico. La forma
en que las variables se relacionan se determina en el proceso de aprendizaje. Si una
relación lineal entre las variables independientes o dependientes es adecuada, los
resultados de la red neuronal deben de aproximarse automáticamente a la estruc-
tura correcta del modelo. Las ponderaciones sinápticas de una red neuronal no son
fáciles de interpretar, por lo cual se usa un modelo estadı́stico [1].

Estructura MLP. La red de perceptrones multicapa (MLP) es una función


de predictores (llamadas entradas o v.i.) que minimizan el error de predicción de
las variables destino (las variables salidas). La arquitectura del Perceptrón Multi-
capa es llamada arquitectura feedforward porque las conexiones de la red fluyen
unidimensionalmente desde la capa de entrada hasta la capa de salida sin ciclos de
retroalimentación.

Error de entropı́a cruzada. Las redes neuronales se entrenan con el objetivo


de minimizar una función de error, para el caso binario se usa el error de entropı́a
cruzada 0 0
E = −Σni=1 yi log yi + (1 + log yi ) log(1 − yi )
0
donde yi es el resultado de la neurona de salida, yi el resultado esperado u objetivo.
El error de entropı́a cruzada es la suma de la relación de las diferencias entre lo real
y lo esperado de todas las salidas de la red. En la propagación hacia atrás (Back
propagation) este error se minimiza mediante la actualización iterativa de los pesos
de las neuronas de entrenamiento [8].

Perceptrón Multicapa (MLP) El procedimiento genera un modelo predic-


tivo para una o más variables dependientes (destino) basada en los valores de las
variables predictorias. Una de sus caracterı́sticas principales es tener una funcı́on de
activación no lineal, la cual relaciona la suma podenderada de unidades de capa con

129
Probabilidad, Estadı́stica y sus Aplicaciones

los valores de unidad en la capa correcta, una función común es yi = 1/[1 + exp(vi )]
donde vj es la suma ponderada de todas las entradas sinápticas más el sesgo de
la neurona de todas las entradas sinápticas más el sesgo de la neurona j con yj la
salida de la neurona. Otra es que la red puede contener una o más capas ocultas,
distintas a la capa de entrada y de salida, son las capas que ayudan a que la red
“aprender”, y finalmente la red muestra un alto grado de conectividad determinada
por la sinápsis de la red.

Hay dos formas para entrenar una red neuronal, con respecto a la presentación
de los datos a la red y los ajustes en los pesos, son: 1) Entrenamiento de patrón
por patrón, a la red se le presenta un patrón e inmediatamente después se realiza la
propagación hacia atrás ajustando los pesos y 2)Entrenamiento conjunto o Batch,
los datos se presentan en la red y el cálculo de la modificación de los pesos es
almacenado hasta que todas las muestran sean presentadas a la red y luego se
modifican los pesos con la suma de las modificaciones almacenadas.

10.3. Caso de estudio


En 1987 Taiwán experimenta una democratización polı́tica y económica, se con-
vierte en un paı́s competitivo en el sector mundial de tecnologı́as de la información
y comunicación. En 1990 el gobierno taiwanes permitió la formación de nuevos ban-
cos, éstos se dedicaron a prestar grandes cantidades de dinero a las compañı́as de
Bienes y Raı́ces y después de unos años el mercado se saturó y las ganancias co-
menzaron a disminuir.
Descripción de la base. La base de datos contiene información del segundo y ter-
cer trimestre de 2005, de un banco de Taiwán. Se cuenta con 30,000 observaciones
de las cuales 6,636 (22.1 %) son “clientes morosos”, la variable respuesta es binaria
(No moroso=0, Moroso=1) y hay 23 variables explicativas [7]:
X1: Monto del crédito dado, esto incluye ambos, el crédito individual con-
sumido y el crédito de su familia.
X2: Género (Hombre=1; Mujer=2).
X3: Educación (1= Posgrado; 2=Universidad; 3=Preparatoria; 0,4,5,6=Otro).
X4: Estado civil (1=Casado; 2=Soltero; 3=Divorciado; 0=Otros).
X5: Edad (en años).
X6-X11: Historial de pagos pasados. Se tiene el record mensual de los
pagos pasados (de Abril a Septiembre, 2005) de la siguiente manera: X6=
status de pago de Septiembre de 2005; ...; X11= status de pago de Abril de
2005. La medida de la escala para el status de pago es:
• -2= No hubo consumo; -1= Pago completo; 0= Uso de crédito revolvente;
1= Pago retrasado por un mes; 2= Pago retrasado por dos meses; ...; 8=
Pago retrasado por 8 meses; 9= Pago retrasado por 9 meses o más.
X12-X17: Monto del estado de cuenta. X12= Monto del estado de cuenta
en Septiembre 2005; ...; X17= Monto del estado de cuenta en Abril de 2005.

130
Probabilidad, Estadı́stica y sus Aplicaciones

Cuadro 10.1: Comparación de resultados.


Porcentaje global correcto
Error de entropı́a
Entrena-
cruzada Pruebas Reserva
miento
En el orden en que aparecen 7,375.824 81.2 % 81.4 % 80.6 %
Quitando (4) variables 7,245.680 82.0 % 82.0 % 81.2 %
De mayor a menor importancia 7,233.872 81.7 % 81.7 % 81.4 %
Quitando (4) variables 7,239.881 81.8 % 81.8 % 81.4 %
De menor a mayor importancia 7,380.174 81.8 % 81.5 % 81.4 %
Quitando (4) variables 7,236.68 82.1 % 81.8 % 81.4 %

Cuadro 10.2: Información de la red.


Capa de entrada Factores 9
Covariables 14
Número de unidadesa 88
Método de cambio de escala
Estandarizado
para las covariables
Capas ocultas Número de capas ocultas 1
Número de unidades en la
10
capa oculta 1a
Tangente
Función de activación
Hiperbólica
Capa de salida Variables dependientes 1 Tipo de cliente
Número de unidades 2
Función de activación Softmax
Entropı́a
Función de error
cruzada
a. Se excluye la unidad de sesgo.

X18-X23: Monto de pago previo. X18= Monto pagado en Septiembre 2005;


X19= Monto pagado en Agosto 2005; ...; X23= Monto pagado en Abril 2005.

Se usa la paqueterı́a de SPSS [10] en la base de datos, para crear una red neuronal
MLP, para clasificar a los clientes. Se realizaron diversas pruebas para elegir una red
neuronal, cambiando el orden de las variables, eliminando variables y se probaron
diversas tipos de entrenamiento.

En la Cuadro 10.1 se muestran algunos de los resultados que se obtuvieron, ya


que varias redes tuvieron el mismo porcentaje global correcto, se elegió la red que
presentó el menor error de entropı́a cruzada.
En el Cuadro 10.2, de información sobre la red, es útil para asegurar que las es-
pecificaciones de la red son correctas, aquı́ se detallan las especificaciones de la red
neuronal, el número de unidades en la capa de entrada es el número de covariables
más el número de factores de nivel; se crea una unidad adicional por cada categorı́a
de las variables. Se utilizaron 10 unidades en la capa oculta de la red.

En el Cuadro 10.3, se tienen los porcentajes de clasificación correcta con las


tres muestras de la base, para cada tipo de cliente (moroso o no moroso), donde el
porcentaje correcto global es similar para las tres muestras. En la muestra reserva
para la clasificación de clientes no morosos tiene un porcentaje correcto del 95.6 %,
para los clientes moroso un 32.9 % y el porcentaje correcto global es del 81.4 %. Por
lo que se puede decir que en general la red tiene un buen porcentaje correcto de
pronósticos.

131
Probabilidad, Estadı́stica y sus Aplicaciones

Cuadro 10.3: Clasificación.


Pronosticado
Porcentaje
Muestra Observado No moroso Moroso
correcto
Entrenamiento No moroso 12,423 613 95.3 %
Moroso 2,428 1,199 33.1 %
Porcentaje global 89.1 % 10.9 % 81.7 %
Pruebas No moroso 3,145 148 95.5 %
Moroso 627 313 33.3 %
Porcentaje global 89.1 % 10.9 % 81.7 %
Reserva No moroso 6,725 308 95.6 %
Moroso 1,386 679 32.9 %
Porcentaje global 89.2 % 10.8 % 81.4 %
Variable dependiente: Tipo de cliente.

A continuación se muestra la curva ROC, que representa la capacidad discri-


minatoria de la red para clasificar morosos como morosos y no morosos como no
morosos. Un parámetro para evaluar la bondad de una prueba diagnóstica que pro-
duce resultados continuos es el área bajo la curva (AUC, por sus siglas en inglés) la
cual se muestra en la Figura 10.1, esto es, que si se elige un cliente no moroso hay
un 77 % de probabilidad de se clasifique correctamente como no moroso.

Figura 10.1: Área bajo la curva.

Se muestra el gráfico de la importancia normalizada en Figura 10.3, de cada


variable utilizada en la red neuronal, es decir cuánto cambia el valor predictivo de
la red para diferentes valores de la variable independiente. Se puede observar que las
variables predictivas más importantes son las relacionadas con los comportamientos
financieros de los clientes, como pagos previos, monto del estado de cuenta,historial
de pagos pasados y lı́mites de crédito. Siendo el status de pago del mes de Julio
la variable más notables. Por otro lado, las variables con menor poder predictivo
resultaron el género, nivel de estudios y estado civil.

10.4. Conclusiones
En los modelos de Credit scoring las bases de datos se deben de adecuar según
el tipo de cliente y la información con la que cuente el solicitante, se definen a
los clientes buenos y malos, ya sea con base a la experiencia previa o tomando
en cuenta la experiencia de las fuentes externas y ası́ limitar los parámetros para
definir a los clientes buenos. Para realizar el Credit scoring se separó la muestra
en un backtesting y se comprueba si la clasificación obtenida es adecuada, esto es
importante realizarlo en forma recurrente para actualizar correctamente los ajustes
de las variables que se utilizan.
En este trabajo se usa una base de datos de Taiwán y se aplica una técnica de

132
Probabilidad, Estadı́stica y sus Aplicaciones

Figura 10.2: Curva ROC.

Figura 10.3: Importancia normalizada.

minerı́a de datos llamada redes neuronales que muestra su poder predictivo, su


flexibilidad y fácil aplicación al desarrollar estos sistemas. En particular, se utiliza
el modelo de redes neuronales MLP debido su eficacia en el desarrollo de Credit
scoring y apoyados por el software de SPSS, se elige la red neuronal con menor

133
Probabilidad, Estadı́stica y sus Aplicaciones

error de entropı́a y mayor pocentaje de pronósticos correctos. La red neuronal MLP


final tiene un porcentaje global correcto de 81.4 %, a pesar de que el porcentaje
correcto de clientes no morosos es menor al 50 %. La red neuronal que se obtuvo
tiene un punto de corte de 0.5, el cual es dado por default en el programa, para
considerar un cliente moroso o no moroso. Las variables de mayor importancia son
aquellos que dan información financiera del solicitante, las más importantes fueron
el monto previo pagado en Julio de 2005 y el monto del estado en Julio, las variables
con menor importancia son las que se refieren a la información demográfica de los
solicitantes, como: estado civil, nivel de educación, edad y género.

134
Probabilidad, Estadı́stica y sus Aplicaciones

Bibliografı́a

[1] Cuadras C. Nuevos Métodos de Análisis Multivariante. CMC Editions, 2014.


[2] Encino V. El sistema de las instituciones financieras no comerciales en Taiwán.
Taiwan Studies, Faculty Research Award Program for Paraguayans, 2005.
[3] Hand D. y Henley W.. Statistical Classification Methods in Costumer Credit
Scoring: A review. Journal Royal Statistical Society A., 1997.
[4] Hosmer D. & Lemeshow S.. Applied Logistic Regression. John Wiley & Sons,
2000.
[5] Infante S. y Zarate G.. Métodos Estadı́sticos: un enfoque interdisciplinario.
Trillas, 1990.
[6] Meza E., Reyes H. y Pérez B., Tajonar F. Modelación del Riesgo Crediti-
cio, a través de Credit Scoring mediante Regresión Logı́stica: Un caso de Estudio.
Modelación con Estadı́stica y Probabilidad, Dirección General de Fomento Edi-
torial, 175-190, 2017.
[7] Lichman M. UCI Machine Learning Reposity [http://archive.ics.uci.edu/ml],
University of California, School of Information and Computer Science, 2013.
[8] Nasr G. y Badr E. Cross Entropy Error Function in Neural Networks: Fores-
casting Gasoline Demand. Conference Paper, 2002.
[9] Nieto S., Pérez B. y Soriano J. Crédito al consumo: La estadı́stica aplicada
a un problema de Riesgo Crediticio. Revista Mexicana de Investigación Actuarial
Aplicada, Colegio Nacional de Actuarios, 2010.
[10] SPSS (2016) IBM SPSS Statistics 24 para Windows.
[11] Pozo M., Carrasco G. Aplicación del Análisis Discriminante a un conjunto
de datos vinı́colas mediante el paquete estadı́stico SPSS v10. Tecnociencia Vol.7.
2005.
[12] Yeh C., Lien C. The comparisons of data mining techniques for the predictive
accuracy of probability of default of credit card clients. in Expert Systems with
Applications, 2009.

135
Probabilidad, Estadı́stica y sus Aplicaciones

Capı́tulo 11
Embarazo adolescente, desigualdad social y salud sexual y reproductiva según
condición de indigenismo en México

Itzel A. Sosa-Sánchez e Ian Ariel Quallenberg

Centro Regional de Investigaciones Multidisciplinarias,


Universidad Nacional Autónoma de México,
Av. universidad s/n, Circuito 2, Col. Chamilpa,
Ciudad Universitaria de la UAEM, Cuernavaca Morelos,
C.P. 62210, México,
[email protected]
Resumen. La población indı́gena en México es heterogénea, sin embargo, en
general ésta tiende a enfrentar diversos grados de marginación, inequidad y pobre-
za, lo cual incrementa su vulnerabilidad en términos de salud sexual y reproduc-
tiva acrecentando su rezago en este ámbito. A su vez, el embarazo adolescente en
México es un problema que va en ascenso y que refleja en diverso grado las es-
tructuras de desigualdad social que impactan con diferentes grados de intensidad
el comportamiento reproductivo de la población adolescente en general y de la po-
blación adolescente indı́gena en particular. A partir de los datos de la Encuesta
Nacional de la Dinámica Demográfica (2014) se documenta el embarazo y la salud
sexual y reproductiva en adolescentes según condición de indigenismo en México.
Los resultados evidencian la particular vulnerabilidad y rezago de la salud sexual
y reproductiva en la población adolescente, lo que es particularmente acrecentado
por la condición de indigenismo. De tal suerte, 35.1 % de las mujeres de 20 a 29
años sexualmente iniciadas reportan haberse embarazado en la adolescencia. Este
porcentaje continúa siendo significativamente más alto en las mujeres hablantes de
lengua indı́gena (48.8 %) y en las mujeres con pertenencia étnica (auto-adscritas)
(39.9 %) que entre las mujeres adolescentes no indı́genas. Los resultados evidencian
el peso de las desigualdades sociales y de contextos sociales que restringen las opor-
tunidades de las mujeres adolescentes en general y en las indı́genas en particular
restringiendo proyectos alternativos a la conyugalidad y a la maternidad a edades
tempranas en la población estudiada.

Abstract. The heterogeneity of the indigenous population in Mexico is indubita-


ble. In spite of that, this population shares different degrees of marginalization,
inequity and poverty, which increases their vulnerability in the reproductive health
realm. At the same time, teenage pregnancy in Mexico is increasing its prevalence
in this country and it can be seen as an indicator of the social inequality structures

136
Probabilidad, Estadı́stica y sus Aplicaciones

which play a central role over the reproductive behavior of the adolescent popu-
lation (including indigenous population). Using data from the national survey of
the demographic dynamic (ENADID, 2014) we document the teenage pregnancy
and sexual and reproductive health among adolescents according to their indige-
nous status in Mexico. Results show the particular vulnerability and backwardness
of the sexual and reproductive health among the adolescent indigenous population.
This situation is particularly exacerbated by their status as indigenous people. The
results show the specificities of the indigenous teenage pregnancy and reproduc-
tive trends, revealing the effects that diverse structural inequalities have on the
reproductive behaviour among this population. In this way, 35.1 % of women aged
between 20 and 29 years old (sexually initiated) report having been pregnant during
their adolescence. This percentage continues to be significantly higher among the
indigenous language-speaking women (48.8 %) and among the women with ethnic
affiliation (39.9 %) than among the non-indigenous teenage women. These findings
highlight the important role played by social inequalities and social contexts over
the reproductive behaviour and over alternative life projects (other than conjugality
and early maternity) among the studied population.

Palabras clave: embarazo adolescente, desigualdad, indı́genas, salud reproducti-


va.

11.1. Introducción
Desde la demografı́a mexicana se han aportado conocimientos importantes res-
pecto a la salud reproductiva y la dinámica de la población en general. Sin embargo,
no ha sucedido lo mismo respecto a los conocimientos referidos a la población indı́ge-
na en general y a la población indı́gena adolescente en particular [11]. En América
Latina en general y en México en particular existen colectivos de jóvenes muy hete-
rogéneos1 en términos demográficos y socio culturales que expresan la persistencia
de fuertes desigualdades (de diversa ı́ndole) en la región y que se manifiestan en
forma particular entre la población indı́gena adolescente2 [8, 12].
Según los resultados de la encuesta intercensal en México 6.1 % de la población en
México habla alguna lengua indı́gena y 21.2 % se considera indı́gena (auto adscri-
tas) [6]. Paralelamente, las estimaciones de esta misma encuesta sugieren que en
2015, 45.3 % de la población que habla lengua indı́gena tiene menos de 30 años [13]
señalándose que una significativa proporción de la población indı́gena en México la
constituyen los adolescentes [12].

A su vez, se ha señalado que la población indı́gena en México enfrenta condicio-


nes particulares de vulnerabilidad, exclusión social y pobreza [7]. Ası́, se ha sugerido
que el 89.7 % de la población indı́gena viven por debajo de la lı́nea de pobreza; la
1 Al respecto se ha señalado que, el que se considere a la población indı́gena como un todo

homogéneo es, en parte una muestra más del racismo hacia estas poblaciones [18].
2 Es necesario precisar que reconocemos la plasticidad de los conceptos de adolescencia y juven-

tud y su carácter problemático, dinámico y discontinuo. Reconocemos pues, que la adolescencia y


la juventud no son nunca categorı́as universales ni biológicas. Por el contrario, son categorı́as occi-
dentales de estatus [14] que implican una construcción social de los grupos de edad y las divisiones
entre las edades son siempre arbitrarias, históricas y contextuales [1].

137
Probabilidad, Estadı́stica y sus Aplicaciones

mayorı́a habita en municipios de alta o muy alta marginación y cuenta con los ı́ndi-
ces más bajos de desarrollo humano [18], lo que se ve reflejado de manera especı́fica
en su salud sexual y reproductiva y en su comportamiento reproductivo [8, 10]. Al
respecto, estudios recientes han sugerido que en la última década, los indicadores
de salud sexual y reproductiva en la población indı́gena en general y en la población
indı́gena adolescente en particular han experimentado cambios importantes (sobre
todo en lo que se refiere al acceso a información y uso de anticoncepción moderna)
[6, 10]. Estos cambios en el comportamiento reproductivo se ven reflejados de ma-
nera diferencial según la etapa de la vida en la que las mujeres se encuentran [22].
Por ejemplo, estudios en el tema han sugerido que esta población tiene una mayor
demanda insatisfecha de métodos anticonceptivos, un menor conocimiento y acceso
a métodos anticonceptivos, un menor uso de los mismos, tienen una menor atención
relativa a la salud materno-infantil, niveles más bajos de escolaridad y patrones de
fecundidad más temprana que las mujeres no indı́genas [2, 12, 23].
Adicionalmente, se ha señalado (sobre todo desde la última década un incremento en
la ocurrencia de embarazo adolescente en México [19, 20])). Al respecto las eviden-
cias son consistentes y sugieren que el embarazo adolescente tiene lugar mayorita-
riamente en estratos socioeconómicos bajos y en mujeres con niveles de escolaridad
bajos. Si bien en trabajos anteriores hemos analizado la fecundidad adolescente,
en este trabajo el análisis se centra en el embarazo adolescente dado que asumimos
que el análisis del comportamiento del mismo puede impactar de diferentes maneras
las trayectorias de las mujeres que lo experimentan (independientemente de que el
resultado final sea o no un nacimiento).

Paralelamente, un problema central para enfrentar los desafı́os que implica la


elaboración de polı́ticas tendientes a garantizar y a cubrir las necesidades de salud
sexual y reproductiva entre la población adolescente indı́gena lo constituye la falta
de información relevante y actualizada en la materia, lo que nos lleva a recono-
cer la imperiosa necesidad de generar información empı́rica sobre las necesidades y
problemáticas particulares de las mujeres indı́genas durante la adolescencia y que
reflejen la heterogeneidad de esta población ası́ como el efecto de diversas desigual-
dades sociales sobre su comportamiento reproductivo [11].

11.2. Objetivos
A partir de los datos de la Encuesta Nacional de la Dinámica Demográfica
(ENADID, 2014) se compara el porcentaje de mujeres de 20 a 29 años (sexualmente
iniciadas) hablantes de lengua indı́gena (HLI), auto-adscritas (pertenencia étnica)
y no indı́genas que se embarazaron durante la adolescencia según diferentes indica-
dores socio-demográficos utilizando la prueba de ji-cuadrada.
Objetivos especı́ficos
Identificar y caracterizar a las mujeres de 20 a 29 años que experimentaron un
embarazo durante la adolescencia.

138
Probabilidad, Estadı́stica y sus Aplicaciones

11.3. Metodologı́a del trabajo y fuente de datos


Se analiza el comportamiento sexual y reproductivo de mujeres de 20 a 29 años.
Se realizó un análisis bi-variado de datos utilizando la prueba de la ji-cuadrada de
indicadores de salud sexual y reproductiva de la población de estudio de acuerdo
con diversas caracterı́sticas socio-demográficas y su condición de indigenismo. Pa-
ralelamente, se realizó un análisis de la relación entre el embarazo adolescente y la
deserción escolar según la condición de indigenismo.

11.3.1. Significancia estadı́stica: la ji-cuadrada (χ2 )


Con el objeto de saber, si las diferencias encontradas durante el análisis bi-
variado (tablas  de contingencia) son estadı́sticamente significativas, calculamos la ji
cuadrada χ2 . Esta prueba estadı́stica no paramétrica (ji-cuadrada) proporciona
un estadı́stico (también conocido como χ2 o chi-cuadrado el cual fue (propuesto por
Pearson en 1911) y que permite el contraste de hipótesis de que los dos criterios de
clasificación usados (las dos variables categóricas) son independientes (la significan-
cia estadı́stica se relaciona con la necesidad de probar hipótesis) [3, 9]. 
La distribución de Pearson llamada también ji cuadrada chi cuadrado(a) χ2 , es
una distribución de probabilidad continua con un parámetro que representa los gra-
dos de libertad de la variable aleatoria [16].
Sean Z1 , . . . , Zn variables aleatorias que se distribuyen como normales N (0, 1) y se
define una nueva variable X = Z12 + . . . + Zn2 . Se dice que X se distribuye como
una Chi-Cuadrado o Ji-cuadrado con n grados de libertad, donde n es el número
de variables aleatorias normales independientes elevadas al cuadrado que se han
sumado. Esta se representa como [16]:

X ∼ χ2n
y su función de densidad es de la forma:
( −n/2
2 −x/2 n/2−1
f (x) = Γ(n/2) e x si x > 0
0 si x ≤ 0

Propiedades:
Es una función asimétrica.
La esperanza es igual a E (X) = n.
La varianza es igual a V (X) = 2n.

Sean dos variables aleatorias ji-cuadrado se distribuyen X1 ∼ χ2n y X2 ∼ χ2m


se define una nueva variable de la forma Y = X1 + X2 entonces esta nueva
variable se distribuye como:

Y ∼ χ2n+m

Cuando el número de variables aleatorias es muy grande, es decir, cuando


n → ∞ la variable se puede aproximar a una normal.

139
Probabilidad, Estadı́stica y sus Aplicaciones

La prueba estadı́stica X 2 sigue el modelo de distribución de probabilidad χ2 con


los grados de libertad resultantes de multiplicar el número de filas menos uno por
el número de columnas menos uno:
gl = [Jn − 1] [Kn − 1]
En consecuencia se puede usar la distribución χ2 para establecer el grado de compa-
tibilidad que existe entre el valor del estadı́stico X 2 y la hipótesis de independencia.
De tal suerte, si los datos son compatibles con la hipótesis de independencia, la pro-
babilidad asociada a la ji-cuadrada será alta (mayor de 0,05). Si esa probabilidad
es muy pequeña, menor que 0,05, se considera que los datos son incompatibles con
la hipótesis de independencia y se concluye por tanto, que las variables estudiadas
están relacionadas.
Paralelamente, la distribución ji-cuadrada, es una distribución de probabilidad y
tiene un sesgo positivo como se aprecia en la siguiente figura:

Figura 11.1: sesgo positivo de la distribución χ2

Igualmente, la distribución de la ji-cuadrada tiende a la normalidad, en la medida


que aumentan los grados de libertad.
Esta prueba estadı́stica se emplea ası́ en el análisis de dos o más grupos y de dos
o más variables. Con esta finalidad, el procedimiento compara las frecuencias ob-
servadas (las frecuencias de hecho obtenidas) con las frecuencias esperadas (las
frecuencias que teóricamente deberı́amos haber encontrado en cada casilla si los dos
criterios de clasificación fueran independientes). De tal suerte, cuando dos criterios
de clasificación son independientes, las frecuencias esperadas son estimadas de la
siguiente manera:
(total de la fila i)×(total de la columna j)
(frecuencia esperada)ij = número total de casos

Donde i se refiere a una fila cualquiera; j a una columna cualquiera; ij a una casilla
cualquiera. En otras palabras, bajo la condición de independencia, la frecuencia
esperada de una casilla concreta resulta de dividir el producto de las frecuencias
marginales correspondientes a esta casilla (su total de fila y su total de columna)

140
Probabilidad, Estadı́stica y sus Aplicaciones

por el número total de casos. Una vez obtenidas las frecuencias esperadas para cada
casilla, el estadı́stico X 2 o ji-cuadrado es obtenido de la siguiente manera:
X X (nij − mij )2
X2 =
i j
mij

Donde nij se refiere a las frecuencias observadas y mij a las esperadas y donde de
la ecuación se desprende que la X 2 valdrá cero cuando las variables sean totalmente
independientes (dado que las frecuencias observadas y las esperadas serán iguales),
y que el valor del estadı́stico X 2 será tanto mayor cuanto mayor sea la diferencia
entre las frecuencias observadas y las esperadas (diferencia que será tanto mayor
cuanto mayor sea la relación entre las variables) [3, 9].
Es preciso
 señalar que para que las probabilidades de la distribución ji-cuadrada
χ2 constituyan una buena aproximación a la distribución de este estadı́stico es
conviene que se cumplan algunas condiciones. Por ejemplo, que las frecuencias espe-
radas no sean demasiado pequeñas, es decir que todas las frecuencias esperadas sean
iguales o mayores a 5, asumiéndose que, si existen frecuencias esperadas menores
que 5, éstas no deben superar el 20 por ciento del total de frecuencias esperadas.
Se supone que el valor del estadı́stico X 2 se podrá aproximar por una distribución
ji-cuadrado cuando el tamaño muestral n sea grande (n > 30).
La distribución χ2 tiene muchas aplicaciones en inferencia estadı́stica. La más co-
nocida es la de la denominada prueba χ2 utilizada:
1. Como prueba de independencia entre dos variables categóricas,
2. Como prueba de bondad de ajuste para evaluar la credibilidad de que los
datos muestrales, que vienen de una población cuyos elementos se ajustan a
un tipo especı́fico de distribución de probabilidad,

3. En la estimación de varianzas.
En resumen, esta prueba contrasta frecuencias observadas con frecuencias esperadas
de acuerdo a la hipótesis nula. En el análisis llevado a cabo, se contrasta la hipótesis
de que hay asociación entre variables frente a la hipótesis alternativa de que no
existe asociación. Si existe concordancia perfecta entre las frecuencias observadas y
las esperadas el estadı́stico toma un valor igual a 0; por el contrario, si existe una
gran discrepancia entre estas frecuencias el estadı́stico tomará un valor grande y, en
consecuencia, se rechazará la hipótesis nula [3, 9].
Es preciso señalar que en ciencias sociales, el nivel de significación (riesgo de error
que se está dispuesto a asumir en caso de rechazar la hipótesis nula), suele ser del
0.05; es decir, con un 5 % de errores posibles (como máximo) en el momento de
rechazar la hipótesis nula (intervalo o margen de confianza del 95 %, e intervalo o
margen de error del 5 %). A menor sea el nivel de significación, mayor es el nivel de
confianza y por tanto menor será la probabilidad de cometer un error en la prueba
de hipótesis [9, 3]. En otras palabras, esto representa una seguridad del 95 % que la
asociación que estamos estudiando no se deba al azar. Este es el criterio que se asume
en este documento cuando se afirma que las diferencias encontradas en las tablas
de contingencia presentadas en este análisis son estadı́sticamente significativas.

141
Probabilidad, Estadı́stica y sus Aplicaciones

11.3.2. Fuente de datos


Se realizó un análisis estadı́stico a partir de la Encuesta Nacional de la Dinámica
Demográfica (ENADID, 2014). Esta encuesta, fue realizada por el INEGI (Instituto
Nacional de Estadı́stica y Geografı́a) en 2014 y cuenta con representatividad a nivel
nacional. El tamaño de la muestra fue de 101 mil 389 viviendas a nivel nacional
y la unidad de observación fue la vivienda seleccionada, sus hogares, residentes
habituales, migrantes internacionales en los últimos cinco años y las mujeres de
15 a 54 años de edad. El diseño de la muestra en esta encuesta fue probabilı́stico,
bietápico, estratificado y por conglomerados. Los instrumentos de recolección de
datos comprenden dos cuestionarios: uno del hogar y otro dirigido a mujeres de 15
a 54 años de edad.
El análisis bivariado realizado tomó como base el cuestionario individual dirigido a
mujeres de 15 a 54 años de edad, de donde se seleccionaron a las mujeres que en el
momento de la encuesta tenı́an entre 20 y 29 años de edad con la finalidad de evitar
el efecto de truncamiento asociado al análisis de la fecundidad cuando el objeto de
estudio es la fecundidad y el embarazo adolescente (dado que no es posible saber si
la niña que tenı́a 15 años al momento de la encuesta, se iba o no a embarazar en el
transcurso de su adolescencia). Igualmente, la selección de esta población responde
a la necesidad de incrementar el número de casos en el análisis (respecto al grupo
de mujeres de 20 a 24 años).
Ası́, la población central de este análisis lo constituyen las mujeres de 20 a 29
años de edad (n = 21, 497) que reportaron en la encuesta haberse embarazado en la
adolescencia (n = 7005). Paralelamente, esta encuesta incluyó dos preguntas con el
objeto de captar la población indı́gena: aquella referida a las mujeres que se auto-
reconocen como pertenecientes a una etnia (auto-adscritas) y aquella que se refiere
a las hablantes de alguna lengua indı́gena (HLI).

11.4. Resultados
Con la finalidad de caracterizar a la población de estudio en el cuadro 1 se pre-
sentan las caracterı́sticas socio demográficas de todas las mujeres de 20 a 29 años de
edad (sexualmente iniciadas y no sexualmente iniciadas), resultante del análisis de
la ENADID 2014. De estas el 37.1 % de las mujeres de 20 a 29 años se unieron en la
adolescencia. También sobresale que la mayorı́a de estas mujeres se concentran en
el estrato bajo (39.4 %) y muy bajo (21.9 %) lo que evidencia condiciones objetivas
de vida poco favorables al desarrollo de proyectos de vida alternativos a la mater-
nidad y a la conyugalidad tempranos. A su vez, 5.2 % (n = 1521) son Hablantes de
Lengua Indı́gena, y 29.6 % se auto-perciben como indı́genas (n = 8120). Sobresale
que poco más de la mitad de las mujeres encuestadas de 20 a 29 años contaban con
preparatoria o más. De las mujeres de 20 a 29 años que participaron en la encuesta
el 79.9 % son sexualmente iniciadas (han tenido relaciones sexuales alguna vez en
su vida (cuadro 11.1).

142
Probabilidad, Estadı́stica y sus Aplicaciones

Caracterı́sticas sociodemográficas de las mujeres: 20-29 años (n=26824)


Porcentajes
Estrato socio- Muy bajo Bajo Medio Alto
económico
21.9 % 39.4 % 19.4 % 19.4 %
Nivel de escolari- Un grado en Un grado en Un grado en
dad primaria o secundaria o preparatoria
más más o más
12.8 % 31.1 % 56.1 %
Hablantes de len- Sı́ No
gua indı́gena
5.2 % 94.8 %
Condición de acti- Activa Inactiva
vidad
44.0 % 56.0 %
Situación conyugal Unida No unida
en adolescencia
37.1 % 62.9 %
Zona de residencia Rural Urbano
21.8 % 78.4 %
Ha tenido relacio- Sı́ No
nes sexuales
79.9 % 20.1 %

Cuadro 11.1: Estimaciones propias a partir de la Encuesta Nacional de Dinámica


Demográfica 2014

Como el objeto central de análisis de este trabajo, lo constituye la existencia


de embarazo en la adolescencia, a partir de este momento, el análisis se focalizará
exclusivamente en las mujeres sexualmente iniciadas de 20 a 29 años que participa-
ron en la encuesta. De tal suerte, como se observa en el siguiente cuadro (cuadro
11.2), resalta que, poco más de la mitad (52.8 %) de las mujeres de 20 a 29 años
(sexualmente iniciadas) hablantes de lengua indı́gena se unieron en la adolescencia,
porcentaje que decrece a 43.2 % y a 36.2 % respectivamente en las mujeres con per-
tenencia étnica y en las no hablantes de lengua indı́gena.
Sobresale también, que no existen diferencias significativas en los porcentajes relati-
vos a la iniciación sexual en la adolescencia según condición de indigenismo, aunque
el porcentaje es ligeramente mayor entre las no hablantes (74.5 %) y decrece a 74.4 %
y a 73.9 % en las mujeres con pertenencia étnica y en las mujeres HLI.

143
Probabilidad, Estadı́stica y sus Aplicaciones

% de mujeres 20-29 años sexualmente iniciadas que tuvieron su primera relación sexual
o se unieron conyugalmente en la adolescencia según condición de indigenismo.
Habla una lengua Pertenece a una No habla lengua Significancia
Porcentajes indı́gena(n=1202) etnia(n=6749) indı́gena (n=20295) estadı́stica
Situación conyugal en la adolescencia ∗∗∗
Se unió en la adol. 64.9 % 53.1 % 45.0 %
No se unió en la adol. 35.1 % 46.9 % 55.0 %
Tuvo primera rel. sexual en la adol. NS
Sı́ 76.3 % 76.6 % 76.7 %
No 23.7 % 23.4 % 23.3 %
p = 0,0000 N S = sin significancia estadı́stica

Cuadro 11.2: Estimaciones propias a partir de la Encuesta Nacional de la Dinámica


Demográfica

Lo que es más, la diferencia más importante en la edad media en los distintos


eventos demográficos, se observa en la edad a la primera unión de las mujeres
hablantes de lengua indı́gena, ya que el promedio en la edad de la primera unión
es de casi un año respecto a las mujeres no indı́genas sugiriendo un patrón de
nupcialidad más temprano entre las primeras.

Edad media en distintos eventos demográficos según condición de indigenismo de las mujeres
de 20-29 años
Habla lengua indı́gena Pertenece a una etnia No habla lengua indı́gena
Edad a la primera rel. sexual 17.7 % 17.8 % 17.94 %
Edad a la primera unión 17.8 % 17.9 % 18.7 %
Edad al primer matrimonio 19.1 % 19.2 % 19.6 %

Cuadro 11.3: Estimaciones propias a partir de la Encuesta Nacional de la Dinámica


Demográfica 2014

Ası́, a partir de lo que se observa en el cuadro 11.3 los resultados sugieren que
hay un mayor número de mujeres hablantes no indı́genas que se inician sexualmente
estando solteras, mientras que en el caso de las hablantes indı́genas, en gran parte,
la primera relación sexual ocurrió en el caso de las mujeres de 20 a 29 años muy
poco tiempo antes de establecerse la primera unión (patrón al que se asemeja lo que
ocurre con las mujeres con pertenencia étnica).
De hecho, en las no indı́genas la edad media en la primera relación sexual es sig-
nificativamente menor que la edad media en la primera unión, y entre las jóvenes
hablantes de lengua indı́gena la edad media de ambos eventos es casi la misma.
Cabe señalar, que el inicio sexual y la unión temprana no se ven acompañadas con
una mayor protección en la primera relación sexual, lo que es particularmente cierto
en el caso de las mujeres hablantes de lengua indı́gena. Por ejemplo, como se obser-
va en el cuadro 11.4 sólo dos de cada diez mujeres hablantes de lengua indı́gena se
protegieron en su primera relación sexual. Este porcentaje asciende a 42 % en las
mujeres con pertenencia étnica y a 51 % en las mujeres no indı́genas.

144
Probabilidad, Estadı́stica y sus Aplicaciones

Condición de protección y principales razones de no protección en la primera rel.


sexual de mujeres de 20-29 años sexualmente iniciadas, según condición de indigenismo
% Habla una lengua Pertenece a una No habla lengua Significancia
– indı́gena etnia indı́gena estadı́stica
Usó protección en la rel. sexual ∗∗∗
Sı́ se protegió 20.2 % 42.0 % 51.0 %
No se protegió 79.8 % 58.0 % 49.0 %
Principales razones de no protección o uso
de anticonceptivos en la rel. sexual ∗∗∗
Querı́a embarazarse 23.2 % 24.8 % 23.1 %
No conocı́a anticon. 45.7 % 26.5 % 19.0 %
Creı́a no quedar emb. 10.3 % 13.3 % 16.4 %
No planeaba tener rel. 9.9 % 24.2 % 32.5 %
Usó condón masc. en la rel. sexual ∗∗∗
Sı́ 17.0 % 37.7 % 46.3 %
No 83.0 % 62.3 % 53.7 %
p = 0,0000 N S = Sin significancia estadı́stica

Cuadro 11.4: Estimaciones propias a partir de la Encuesta Nacional de la Dinámica


Demográfica 2014

Paralelamente, conocer las razones por las cuales las mujeres no se protegie-
ron en la primera relación sexual posibilita tener un panorama más amplio de las
condiciones y obstáculos que tienen las mujeres para protegerse durante la primera
relación sexual.
Ası́, sobresale que sin importar la condición de indigenismo, poco más de dos de ca-
da diez mujeres de 20 a 29 años sexualmente iniciadas no usó ninguna protección en
su primera relación sexual porque querı́a embarazarse, lo que puede estar sugiriendo
en estas mujeres la existencia de un proyecto de vida vinculado a la maternidad y a
la unión conyugal tempranas. Pese a esto, es preciso subrayar que entre las mujeres
hablantes de lengua indı́gena (HLI) el 45.7 % no se protegió en las primera relación
sexual porque no conocı́a los métodos anticonceptivos, porcentaje que desciende a
26.5 % entre las mujeres con pertenencia y a 19.0 % entre las no hablantes de lengua
indı́gena.

Esto, como otros estudios sugieren [11, 12] evidencia la particular falta de acceso
de las mujeres indı́genas a información relativa a la salud reproductiva y a servicios
de salud de calidad elementos centrales que condicionan el acceso de las mujeres a
información y al uso de métodos anticonceptivos.

Al analizar el uso del preservativo en la primera relación sexual (único método


anticonceptivo que previene a la vez un embarazo no deseado y una infección de
transmisión sexual) se observa que únicamente el 17 % de las mujeres hablantes de
lengua indı́gena usó preservativo masculino en su primera relación sexual mientras
que este porcentaje es de 37.7 % y 46.3 % en las mujeres con pertenencia étnica
y no hablantes de lengua indı́gena respectivamente. Estos datos ponen de relieve
el particular rezago en materia de salud sexual y reproductiva que impera en esta
población en general y en las mujeres indı́genas en particular.

En lo que respecta al embarazo en la adolescencia, 35.1 % de las mujeres de 20 a


29 años sexualmente iniciadas reportan haberse embarazado en la adolescencia. Este
porcentaje continúa siendo significativamente más alto en las mujeres hablantes de

145
Probabilidad, Estadı́stica y sus Aplicaciones

lengua indı́gena donde alcanza el 48.8 % y en las mujeres con pertenencia étnica
(auto-adscritas) donde asciende a 39.9 % mientras que este porcentaje es de 35.1 %
entre las mujeres adolescentes no indı́genas.

% de mujeres de 20-29 años que se embarazaron en la adolescencia sexualmente


iniciadas, según condición de indigenismo
Habla una lengua Pertenece a una No habla lengua
indı́gena etnia indı́gena
48.8 % 39.9 % 35.1 %

Cuadro 11.5: Estimaciones propias a partir de la Encuesta Nacional de la Dinámica


Demográfica 2014

Adicionalmente, dado el importante peso acordado al nivel de escolaridad en


general y a la asistencia escolar como factor de protección ante los embarazos en la
adolescencia [21], [4, 15], en el cuadro 6 se presenta un breve análisis de estas dos
variables.

Relación entre el embarazo y la deserción escolar de las mujeres de 20-29 años sexualmente
iniciadas (con experiencias de embarazo en la adolescencia) según condicón de indigenismo
CUANDO SE EMBARAZÓ: Habla lengua Pertenece a una No habla lengua Significancia
indı́gena etnia indigéna estadı́stica
ANTES de la deserción escolar 2.6 % 6.8 % 11 % ∗∗∗
MISMO año que desertó 1.3 % 0.8 % 1.1 % ∗∗∗
DESPUÉS de la deserción 96.1 % 92.3 % 87.9 % ∗∗∗
p = 0,0000 N S = sin significancia estadı́stica

Cuadro 11.6: Estimaciones propias a partir de la Encuesta Nacional de la Dinámica


Demográfica 2014

En el cuadro 6 se observa que, contrario a lo que generalmente puede pensarse


en términos de la relación embarazo adolescente-escuela, la gran mayorı́a de emba-
razos en la adolescencia tienen lugar una vez que las mujeres ya se encuentran fuera
del sistema escolar (lo que se acentúa aún más en el caso de las mujeres hablantes
de lengua indı́gena y las pertenecientes a una etnia) pero que no deja ser cierto
también para las mujeres no hablantes de lengua indı́gena cuyo porcentaje asciende
a 87.9 %.
De tal suerte, poco más de una de cada diez mujeres no hablantes de lengua indı́gena
se embarazó cuando aún se encontraba estudiando, porcentaje que decrece a 2.6 %
y a 6.9 % entre las hablantes de lengua indı́gena y las mujeres con pertenencia étnica.

11.5. Conclusiones
Los resultados son consistentes con lo que ya han sugerido algunos estudios
realizados con la población indı́gena [11, 12] y con población adolescente. Ası́ los
resultados ponen de manifiesto, la particular vulnerabilidad y rezago de la salud
sexual y reproductiva en la población adolescente, lo que es particularmente acre-
centado por la condición de indigenismo.

146
Probabilidad, Estadı́stica y sus Aplicaciones

De tal suerte, los resultados sugieren que tanto el embarazo en la adolescencia, la


ocurrencia del mismo una vez fuera del sistema escolar, ası́ como el menor uso de
anticonceptivos y de protección en la primera relación sexual continúa siendo sig-
nificativamente más alto en las mujeres hablantes de lengua indı́gena (39 %) y en
las mujeres con pertenencia étnica (31.1 %) que entre las mujeres adolescentes no
indı́genas, lo cual pone en evidencia no sólo especificidades culturales sino la exis-
tencia de condiciones objetivas de vida y de desigualdad social que contribuyen a
la prevalencia del embarazo adolescente y del rezago en materia de salud sexual y
reproductiva en esta población.

Estos resultados obligan a visibilizar que la población indı́gena en México ha


sido históricamente excluida del desarrollo económico y social del paı́s [12], no sólo
debido a que en general esta población tiende a ubicarse geográficamente en locali-
dades rurales alejadas de los centros urbanos o en territorios de difı́cil acceso, sino
a la particular situación de precariedad, discriminación y exclusión social que la
población indı́gena en general y los adolescentes indı́genas en particular enfrentan
en una sociedad como la mexicana marcada por prácticas y discursos racistas.

Ası́, sin dejar de lado el componente cultural asociado a los patrones de fecun-
didad temprana entre la población indı́gena en general [4, 5] los resultados de este
análisis son consistentes con otros estudios [19, 20]) ya que permiten subrayar el
peso de las desigualdades sociales y de los contextos sociales sobre la ocurrencia
del embarazo adolescente y sobre la deserción escolar temprana, lo que sin lugar
a dudas restringe las oportunidades de las mujeres adolescentes en general, y de
las adolescentes indı́genas en particular y que dificultan proyectos alternativos a la
conyugalidad y a la maternidad. Estas desigualdades se reflejan por ejemplo, como
vimos precedentemente en el alto reporte de desconocimiento de métodos anticon-
ceptivos particularmente entre la población hablante de lengua indı́gena cuando
inician su vida sexual y que condiciona el bajo uso de protección sexual durante la
primera relación sexual.

Es también necesario enfatizar el contexto social en el que ocurre la deserción


escolar en la población adolescente y en la población indı́gena dado que cuando se
analizan las razones de esta deserción, los motivos relacionados con la pobreza (falta
de dinero) ocupan un lugar central en la misma.

Lo antes mencionado, se articula y potencia en un contexto como el mexicano


donde el reconocimiento y ejercicio de los derechos sexuales y reproductivos de las
mujeres en general y de las adolescentes en particular continúa siendo un desafı́o
importante para combatir la desigualdad de género y las desigualdades sociales en
el ámbito de la reproducción y la sexualidad en la población en general y en la
población indı́gena en particular.

147
Probabilidad, Estadı́stica y sus Aplicaciones

Bibliografı́a

[1] Bourdieu P. La “Jeunesse”N 'est Qu'un Mot. Questions de sociologie, les pages
Bourdieu. Minuit, Paris, 1992.
[2] Bonfil, Paloma “Introducción”, en Bonfil, P: Derechos y salud sexual y repro-
ductiva entre jóvenes indı́genas: hacia la construcción de una agenda necesaria.
GIMTRAP, México; 2014.
[3] Castañeda, B., Cabrera, A., Navarro, Y., y de Vries, W. Procesa-
miento de datos y análisis estadı́sticos utilizando SPSS. Un libro práctico para
investigadores y administradores educativos. EDIPUCRs: Porto Alegre, 2010.
[4] Chávez, A.; Hernández, H.; Menkes, C.; Ruiz, A. y Flores, R. “La
salud reproductiva de la población indı́gena”, en Los indios de México en el
siglo XXI. CRIM-UNAM, México, 2007.
[5] Chávez, A.; Hernández, H.; Menkes, C. y González, E. “Tendencias de
la fecundidad indı́gena en México, 1997, 2003”, en Los indios de México en el
siglo XXI. Cuernavaca: CRIM-UNAM, 2007a.
[6] CONAPO. Infografı́a población indı́gena. CONAPO, México, 2015.
[7] CONEVAL La pobreza en la población indı́gena de México 2012. CONEVAL,
México, 2014.
[8] Del Popolo, F.; López, M y Acuna, M. Juventud indı́gena y afrodescen-
diente en América Latina: inequidades sociodemográficas y desafı́os de polı́ticas.
CELADE, UNFPA, Chile, 2009.
[9] Fierro, J. Métodos Cuantitativos en Ciencias Sociales: Apuntes de Apoyo a la
Docencia. Santiago de Chile. Departamento de Sociologı́a, Universidad de Chile.
Formato digital. 115 págs, Chile: 2013.
[10] Hernández, M.; Muradás, M. y Sánchez, M. “Panorama de la salud se-
xual y reproductiva, 2014”, en La situación demográfica de México 2015. CO-
NAPO, México, 2015.
[11] Hernández, Héctor. “Introducción”, en Los indios de México en el S. XXI.
UNAM-CRIM-México.
[12] Hernández, Marı́a, Hernández, Mario y Sánchez, M. “La salud sexual
y reproductiva de las mujeres hablantes de lengua indı́gena, 1997-2009”, en La
situación demográfica de México 2013, pp. 21-41, México, 2013.

148
Probabilidad, Estadı́stica y sus Aplicaciones

[13] INEGI. Encuesta nacional de la dinámica demográfica 2014. Principales re-


sultados. INEGI-CONAPO: México, 2015.
[14] Martin, Enrique. Producir la juventud. Editorial ISTMO, España, 1998.
[15] Mier y Terán, Martha. “Maternidad temprana y escolaridad de las jóvenes
en México”, en Ávila, J.; Bringas, H. y López, M. (coords). Retos del cambio
demográfico de México, colección población, salud y sociedad. Capı́tulo 6, pp.
157-177. UNAM, México, CDMX, 2016.
[16] Montero, Roberto, Contraste de Hipótesis. Documentos de Trabajo en Eco-
nomı́a Aplicada. Universidad de Granada. Espana, 2007.
[17] UNFPA. Early unintended pregnancy. Recommendations for the education sec-
tor. UNFPA, Paris, 2017.
[18] Schmelkes, Sylvia. “Educación y pueblos indı́genas: Problemas de medi-
ción”Revista Internacional de Estadı́stica y Geografı́a. Vol. 4 Núm. 1 enero-abril
2013 págs. 5-13, 2013.
[19] Stern, C. y Menkes, C. “Embarazo adolescente y estratificación social”, en
Lerner, Susana y Szasz, Ivonne (coords.) Salud reproductiva y condiciones de
vida en México, tomo I, Colmex: México, 2008.
[20] Stern, Claudio. “Reflexiones finales”, en Adolescentes en México. Investi-
gación, experiencia y estrategias para mejorar su salud sexual y reproductiva.
Colmex, México, 2008.

[21] UNESCO. Embarazo precoz y no planificado y el sector de la educación. Re-


visión de la evidencia y recomendaciones. Organización de las Naciones Unidas
para la Educación, la Ciencia y la Cultura, Francia, 2017.
[22] Valdés, Luz. “El perfil sociodemográfico y económico de los hablantes de
lengua indı́gena”, en Hernández, H. Los indios de México en el S. XXI. UNAM-
CRIM-México.
[23] Vázquez, Germán. “Demografı́a étnica un balance del perı́odo 1986-2011”,
Coyuntura demográfica. 3(97-101), 2013.

149
Probabilidad, Estadı́stica y sus Aplicaciones

Capı́tulo 12
Uso de la Distribución Bernoulli Multivariada en salud bucal

Ramón Álvarez-Vaz y Fernando Massa

Universidad de la República,
Facultad de Ciencias Económicas y de Administración,
Departamento de Métodos Cuantitativos,
Instituto de Estadı́stica,
Eduardo Acevedo 1139,
C.P. 11200, Montevideo, Uruguay,
[email protected],[email protected],
[email protected]
Resumen. En general, en muy variadas disciplinas como la Economı́a, el Mar-
keting, la Epidemiologı́a, se dan situaciones donde la matriz de datos de la que se
dispone está formada por datos binarios (unos y ceros) que surgen de trabajar con
varias variables aleatorias resultantes de un experimento con 2 resultados posibles
en cada caso. El interés se centra entonces, generalmente, en analizar y dar cuenta
de las relaciones que se dan entre variables a través de la distribución Bernoulli
Multivariada (BM). Esta distribución puede ser caracterizada por un vector de in-
tensidades y una matriz de asociaciones entre las variables binarias, que se pueden
interpretar y asimilar como los parámetros de un modelo de regresión, por lo cual
es importante entonces ver como queda parametrizado este modelo probabilı́stico y
como puede ser estimado.

Se presenta luego a modo de ejemplo una aplicación en salud bucal para evaluar
la enfermedad periodontal en la población adulta uruguaya. Los datos surgen del
primer relevamiento nacional de salud bucal, llevado a cabo durante los años 2011
y 2012 en diversos departamentos de Uruguay, donde fueron encuestadas personas
de 3 grupos etarios (jóvenes, adultos y adultos mayores), a los que se les evalúa pre-
sencia de enfermedad periodontal, evaluada como atributos binarios en 6 sextantes
de la boca, por lo cual se tienen 6 variables binarias.

Abstract. In general in very varied disciplines such as Economics, Marketing,


and Epidemiology there are situations where the available data matrix is formed by
binary data (ones and zeros) that arise from working with several random variables
resulting from an experiment with 2 possible results in each case. The interest is
then generally focused on analyzing and accounting for the relationships that occur
between variables through the Multivariate Bernoulli (MB) distribution presented

150
Probabilidad, Estadı́stica y sus Aplicaciones

in this work. This distribution can be characterized by a vector of intensities and


a matrix of associations between binary variables, which can be interpreted and
assimilated as the parameters of a regression model, so it is important to see how
it is parameterized this probabilistic model and how it can be estimated. An oral
health application is then presented as an example to evaluate periodontal disease
in the Uruguayan adult population measured as binary attributes in 6 sextants of
the mouth, for which there are 6 binary variables.

Palabras clave: asociación, distribución Bernoulli Multivariada, enfermedad pe-


riodontal, intensidad, variable latente.

12.1. Introducción
En este documento se presenta y caracteriza una distribución de probabilidad
multivariada que solo puede adoptar los valores cero o uno y que se denomina Ber-
noulli Multivariada (BM). Esta distribución equivale a considerar los vértices de
un hipercubo en Rk , cuyas coordenadas son los valores 0 y 1. Una de las primeras
aproximaciones a la temática se puede encontrar en [9] donde se plantea la distri-
bución de Bernoulli bivariada.

En primera instancia, la distribución BM podrı́a definirse como el producto de


k distribuciones marginales cada una acorde al modelo Bernoulli [12], sin embargo
dicha parametrización solo contempla el caso en el que las variables en cuestión son
independientes. Es por esto que aquı́ se opta por una formulación donde se incluye
la opción de modelar las asociaciones entre las variables. Para ello, se siguen las
ideas expuestas en [4]. Pese a que la naturaleza categórica de las variables permite
pensar en asociaciones entre dos, tres o mas de éllas simultáneamente, se toma la
decisión de contemplar solamente las asociaciones “dos a dos” a modo de construir
modelos mas parsimoniosos.
Sin embargo, la metodologı́a aquı́ propuesta puede extenderse para tener en
cuenta asociaciones de orden superior. El método empleado en este trabajo difie-
re de la parametrización basada en la dicotomización de la distribución Gaussiana
multivariada [3] [12] debido a que, a diferencia de esta, no asume la existencia de
variables latentes, lo cual supone una ventaja en cuanto a la simplicidad del modelo
probabilı́stico.

El documento se estructura de la siguiente manera. En la sección 12.2 se conside-


ra la construcción de la distribución, comenzando desde el caso univariado, pasando
por el bivariado y llegando finalmente al modelo general, presentando las principales
propiedades de cada caso. En la sección 12.3 se presenta una aplicación en salud
oral de esta metodologı́a. Se plantean algunos estadı́sticos para explorar la indepen-
dencia o asociación entre las variables. En la sección 12.4 se plantea un resumen de
los resultados encontrados y posibles caminos por donde seguir.

151
Probabilidad, Estadı́stica y sus Aplicaciones

12.2. Modelo probabilı́stico


A continuación se plantea la distribución BM comenzando como una reparame-
trización de la distribución de Bernoulli, para luego extenderla al caso bivariado y
finalmente al caso general. En cada etapa se exploran las principales caracterı́sticas
de la función de masa de probabilidad.

12.2.1. Caso univariado


La distribución Bernoulli es utilizada para modelar las variables aleatorias re-
sultantes de un experimento binario (considerando Rec(X) = {0, 1}) mediante un
único parámetro, el cual se interpreta como la probabilidad de obtener un éxito en
dicho experimento. La función de cuantı́a es la siguiente:

P (X = x) = px (1 − p)1−x , x ∈ {0, 1}. (12.1)

La variable aleatoria definida de esta manera tiene esperanza p y varianza p(1 −


p). También, es sencillo apreciar que esta función de cuantı́a puede expresarse como
un miembro de la familia exponencial.

p
P (X = x) = exlog( (1−p) )+log(1−p)) , x ∈ {0, 1}. (12.2)

De esta manera surge que el “parámetro natural” de esta distribución es el


p
logaritmo del odd. Tras llevar a cabo el cambio de variable φ1 = (1−p) , se llega a la
siguiente parametrización:

P (X = x) = φ0 φx1 , x ∈ {0, 1}, (12.3)

donde φ1 representa el odd de éxito y φ0 es una constante que normaliza la dis-


tribución y que se interpreta como la probabilidad de obtener un fracaso. En el
1
caso univariado, esta constante es φ0 = 1+φ 1
. Las nuevas expresiones para la espe-
φ1 φ1
ranza y varianza de la distribución son E(X) = 1+φ 1
y V ar(X) = (1+φ 1)
2 . Pese a

que, en un principio, esta reparametrización solo parece complicar la caracterización


de la distribución, en dimensiones superiores probará ser de gran utilidad ya que
proporcionará gran flexibilidad para incluir las asociaciones entre variables.

12.2.2. Caso bivariado


En el caso bivariado, si las variables X1 y X2 son independientes, su cuantı́a
conjunta podrı́a definirse de la siguiente manera:

2
P (X1 = x1 , X2 = x2 ) = p1x1 (1 − p1 )1−x1 px2 2 (1 − p2 )1−x2 , X1 , X2 ∈ {0, 1} (12.4)

152
Probabilidad, Estadı́stica y sus Aplicaciones

Luego de realizar el mismo cambio de variable sugerido en el apartado anterior,


la cuantı́a conjunta se expresa de la siguiente manera:

2
P (X1 = x1 , X2 = x2 ) = φ0 φx1 1 φx2 2 , X1 , X2 ∈ {0, 1} (12.5)

En este caso, la constante de normalización φ0 equivale a 1+φ1 +φ12 +φ1 φ2 y se


interpreta como la probabilidad de obtener un fracaso en ambas variables. El si-
guiente paso en la construcción de la distribución BM es el de incluir en la ecuación
(12.5) la asociación entre X1 y X2 . Para ello se introducirá un nuevo parámetro α12
de la siguiente manera:

2
P (X1 = x1 , X2 = x2 ) = φ0 φx1 1 φx2 2 α12
x1 x2
, X1 , X2 ∈ {0, 1}
1 (12.6)
φ0 = 1+φ1 +φ2 +φ1 φ2 α12

Tras la modificación propuesta, φ0 continúa siendo la probabilidad de obtener


dos fracasos.

En cuanto al parámetro α12 , es sencillo demostrar que equivale al odds ratio en-
tre X1 y X2 . Sin embargo, la interpretación de φ1 y φ2 cambia ligeramente, ya que
en este caso pasan a ser los odds de éxito de cada variable condicional a que la otra
variable valga cero. Ya en presencia de ambos tipos de parámetros, nos referiremos
al conjunto de valores φi como intensidades o fuerzas y al conjunto de valores αij
como asociaciones.

El siguiente paso es definir las distribuciones marginales y condicionales de cada


variable. En cuanto a las marginales, se puede demostrar que son Bernoulli con la
siguiente función de cuantı́a:

P (X1 = x) = φ∗0 φ∗1 x , X1 , X2 ∈ {0, 1}


φ∗1 = φ1 (1 + φ2 α12 ), (12.7)
φ∗0 = 1+φ
1

1

La distribución marginal de X2 es análoga. En cuanto a las distribuciones con-


dicionales, se puede demostrar que éstas también son Bernoulli:

P (X1 =i,X2 =j) φ0 φi1 φj2 αij


P (X1 = i|X2 = j) = P (X2 =j) = 12
φ0 φj2 (1+φ1 αj12 )
φi1 αij 2
= 12
(1+φ1 αj12 )
= φ0|j φi1|j , (i, j) ∈ {0, 1} , (12.8)
j
φ1|j = φ1 α12 ,
1
φ0|j = 1+φ αj .
1 12

Vale la pena mencionar que al fijar j = 0 se obtiene el caso particular de donde


surge la interpretación de φ1 como odd condicional. La cuantı́a condicional de X2
se obtiene de la misma manera.

153
Probabilidad, Estadı́stica y sus Aplicaciones

12.2.3. Caso general


La función de cuantı́a del vector X = (X1 , X2 , . . . , Xk ) en el caso de k variables
binarias posiblemente asociadas entre sı́ es la siguiente:

k k
x x
Y Y k
P (X1 = x1 , X2 = x2 , . . . , Xk = xk ) = φ0 φxi i αiji j , x1 , x2 , ..., xk ∈ {0, 1}
i=1 j=i+1
(12.9)

En este caso, la especificación de φ0 se vuelve un poco mas compleja y para


ello se define la matriz de configuraciones H. Esta matriz, que consta de k(k+1) 2
columnas y 2k filas, contiene cada una de las posibles configuraciones del vector
aleatorio X en las primeras k columnas y los productos de estas coordenadas en las
siguientes k(k−1)
2 . Adicionalmente se define el vector γ, el cual contiene los k(k+1)
2
parámetros del modelo. Se trabaja entonces con Γ = (logφ1 , logφ2 , . . . , logαk−1,k ).
De esta manera, se reescribe la cuantı́a en función de los elementos de Γ.

k k
x x
Y Y k
P (X = x) = φ0 φxi i αiji j , X ∈ {0, 1}
i=1 j=i+1
k k (12.10)
x x
Y Y
= exp(log(φ0 φxi i αiji j ))
P i=1 j=i+1
P
= φ0 exp( xi logφi + xi xj logαij ).

Y, al sumar todos los elementos de la cuantı́a:

X X X X
1= P (X = x) = φ0 exp( xi logφi + xi xj logαij )
x∈H x∈H
1
⇒ φ0 = X X X (12.11)
exp( xi logφi + xi xj logαij )
x∈H
1
⇒ φ0 = 1eHφ

A modo de ejemplo se presenta el caso particular k = 2. En dicho caso Γ y H


adoptan la siguiente forma:

0 0 0
logφ1
1 0 0
Γ = logφ2
H= 0 1 0
logα12
1 1 1

De esta manera:

154
Probabilidad, Estadı́stica y sus Aplicaciones

1
φ0 = 1eHΓ
1
= e<(0,0,0)Γ> +e<(1,0,0)Γ> +e<(0,1,0)Γ> +e<(1,1,1)Γ>
1
= e0 +elogφ1 +elogφ2 +elogφ1 +logφ2 +logα12
1
= 1+φ1 +φ2 +φ1 φ2 α12 ,

tal como se vio en la ecuación (12.6).

En cuanto a la interpretación de los parámetros, φ0 continúa interpretándose


como la probabilidad de obtener el valor cero en todas las variables. En cuanto a los
parámetros φi y αij , éstos se interpretan como los odds y odds ratio condicionales a
que el resto de las variables sean cero. Pese a que serı́a deseable que la interpretación
de dichos coeficientes no fuese parcial, es fácil construir estimadores incondicionales
a partir de los elementos del vector Γ.

El siguiente paso es definir las distribuciones condicionales y marginales de sub-


conjuntos del vector X. Sin pérdida de generalidad se asumirá que se quiere obtener
la distribución marginal del vector X M = (X1 , X2 , . . . , XM ), la cual se obtendrá
sumando sobre los 2k−M valores posibles del vector X m = (XM +1 , . . . , Xk ), donde
m = k − M.
XM +1 =1 XX
k =1 p p
x xj
X Y Y
P (X M
= x) = ... φ0 φxi i αiji
XM +1 =0 Xk =0 i=1 j=i+1
M M
x x
Y Y M
= φ∗0 φxi i αiji j F (x, φm , φM m ), x ∈ {0, 1}
i=1 j=i+1
YM YM
= φ∗0 φ∗i xi ∗ xi xj
αij .
i=1 j=i+1

De aquı́ se puede concluir que todas las distribuciones marginales también per-
tenecen a la familia de distribuciones BM. En cuanto a F (x, φm ), es una función
que involucra a los elementos de x, a las intensidades (γ (m) ) correspondientes a las
variables sobre las cuales se suma y a las intensidades (φM ) que “vinculan” los ele-
mentos de X M y X m . Para la construcción de los parámetros marginales se utiliza el
resultado anterior conjuntamente con la definiciones de odd y odds ratio marginales.
La definición de las intensidades marginales φ∗i en (12.13) es la siguiente:

(k−M )
φ∗i = φi γ
ei , (12.14)

(m) Hφ(m)
donde φei = e1eHφm φM (m) . La interpretación de estas intensidades marginales co-
rresponde a una corrección de las intensidades originales, donde dicha corrección
se construye como un promedio ponderado de las asociaciones (αM (m) ) entre Xi
y las variables contenidas en X k , con ponderadores dados por las intensidades y
asociaciones (αm ) de las variables sobre las cuales se sumó.

El caso de las asociaciones marginales en la ecuación (12.13) es similar:

155
Probabilidad, Estadı́stica y sus Aplicaciones

(m)

γ
eij
αij = αij φi φj (m) (m)
. (12.15)
γ
ei γ
ej
Las distribuciones condicionales son mas sencillas y se construyen a partir de la
siguiente relación:

P (X M = xM , X m = xm ) M M
P (X M = xM |X (m) = xm ) = , X ∈ {0, 1} (12.16)
P (X m = xm )
donde el numerador no es otra cosa que la cuantı́a que ya se definió en (12.9) y el
denominador corresponde a la marginal del vector Xk que se acaba de presentar.
Finalmente la cuantı́a condicional es la siguiente:

M M
x x
Y Y M k−M
P (X M = xM |X m = xm ) = φ0|j φxi|m
i
αiji j , X M ∈ {0, 1} , X m ∈ {0, 1}
i=1 j=i+1
1
φ0|j = HφM |m ,
1e
x
Y
φi|m = φi αijj .
xj ∈m
(12.17)
Hay que tener en cuenta cómo el proceso de condicionar en los valores de las
variables contenidas en X m solo afecta las intensidades y no las asociaciones.

12.2.4. Estimación
Dado que la función de verosimilitud es no lineal en los parámetros, se opta
por realizar la estimación de los parámetros del modelo BM mediante técnicas de
optimización numérica. Para ello, se define la función de log-verosimilitud de una
muestra de n observaciones como:

k
X k
X k
`(x|φ) = n log(φ0 ) + Sj log φi + Sjk log αik , x ∈ {0, 1} , (12.18)
j=1 j=1

n
X n
X
donde Sj = xij y Sjk = xij xik .
i=1 i=1

La maximización de esta función se lleva a cabo por algunos de los métodos


iterativos comunmente utilizados. La mayorı́a de los mismos requiere del gradiente
(o score) y la matriz Hessiana de la ecuación (12.18). Los elementos del primero (al
que denotamos como U (φ)) tienen la siguiente forma:

156
Probabilidad, Estadı́stica y sus Aplicaciones

∂`(x|φ) H Γ
Sj 1e (j)
Uj (γ) = ∂φj = φj − n 1eHΓ ,
∂`(x|φ) Sjk H
1e (jk)
Γ (12.19)
Ujk (γ) = ∂αjk = αjk − n 1eHΓ ,

donde H(j) es la matriz compuesta por las filas de H que contienen unos en la
j-ésima columna (correspondiente a φj ), luego esta columna es reemplazada por un
vector de ceros. El caso de H(jk) es análogo al anterior pero con la columna corres-
pondiente a αjk reemplazada por un vector de ceros.

12.3. Una aplicación a la salud oral


Una posible aplicación de esta distribución es en al análisis de la enfermedad pe-
riodontal. La enfermedad periodontal, es una de las enfermedades más prevalentes
en Odontologı́a, teniendo un peso muy importante en la carga mundial de enferme-
dades no trasmisibles (ENT), que afectan al 40 % de la población mundial [8]. Desde
el punto de vista de la salud colectiva el estudio de su distribución, explicación, pre-
vención y tratamiento debe abordarse integralmente y considerase en el contexto
de la salud general de los colectivos humanos. Desde el punto de vista biológico, la
enfermedad periodontal está asociada al biofilm, matriz de microorganismos (inclui-
dos los patógenos en una baja proporción) adheridos a la superficie del diente que
en condiciones normales, se encuentran en armonı́a con el huésped sano. Los signos
asociados con esta patologı́a son sangrado gingival, sarro, bolsa patolı́gica, pérdida
de inserción de los tejidos periodontales, pérdida ósea y movilidad dentaria. Los
ı́ndices que pretenden dar cuenta de la enfermedad periodontal tienen limitaciones
derivadas del número de signos involucrados ası́ como de los instrumentos utiliza-
dos y la subjetividad del observador. A nivel internacional se habla de enfermedad
periodontal cuando existen bolsas periodontales iguales o mayores a 4 mm, la que
se mide a través del ı́ndice CPI.

12.3.1. Datos de sangrado


A continuación se presenta la aplicación de la distribución BM para el análisis del
sangrado peridontal que es uno de los componentes de la enfermedad periodontal.
Se trabaja con los datos provenientes del estudio sobre personas que demandan
atención en la Facultad de Odontologı́a de la Universidad de la República, Uruguay
y que son evaluados por los odontólogos del Servicio de registros de la Facultad. Se
aplica una muestra de 602 personas que consultan en el perı́odo que corresponde
a mayo 2015-junio 2016, los que se seleccionan mediante muestreo sistemático, a
los que se les aplica un cuestionario sociodemográfico y un examen completo de la
boca, en donde se evalúa el estado de las piezas dentales y de la mucosa.
Vemos como ejemplo 6 registros de la tabla de datos que muestran el estado en
términos de sangrado para las diferentes piezas que componen cada sextante, tal
como aparece en el Cuadro 12.1
En la Figura 12.1 puede verse que hay sextantes vinculados al maxilar superior
(sextantes 1, 2 y 3) e inferior (sextantes 4, 5 y 6) y a su vez si están en la parte
derecha (sextantes 1 y 6) o izquierda (sextantes 3 y 4) de la boca.

157
Probabilidad, Estadı́stica y sus Aplicaciones

paciente s11 s31 s1617 s2627 s3637 s4647


1 1 0 1 1 0 0
3 1 1 0 1 0 1
8 0 0 0 0 0 0
50 0 0 0 0 0 0
100 0 0 0 0 0 0
550 0 0 1 1 0 0

Cuadro 12.1: Ejemplo de Presencia de sangrado en 6 personas

Figura 12.1: Distribución de los sextantes en la boca

piezas sextante presencia ausencia %


piezas 16 y 17 S1 167 435 27,7
pieza 11 S2 129 473 21,4
piezas 26 y 27 S3 174 428 28,9
pieza 31 S4 161 441 26,7
piezas 36 y 37 S5 119 483 19,8
piezas 46 7 47 S6 134 468 22,2

Cuadro 12.2: Presencia de sangrado por sextantes

158
Probabilidad, Estadı́stica y sus Aplicaciones

En un análisis preliminar de estos datos se observó que gran parte de la muestra


tiene esta patologı́a. Se consideró “sano” a un individuo con sus 6 sextantes sanos.
Estos constituyen apenas el 43.8 % de los datos, por lo tanto conformaron un perfil
claro de individuos los cuales se dejaron de lado para trabajar sobre el resto, de
modo de poder determinar distintos perfiles de carga de enfermedad.

Cantidad de sextantes con sangrado Frecuencia


0 264
1 121
2 61
3 68
5 33
5 25
6 30
Total 602

Cuadro 12.3: Distribución de Cantidad de sextantes con sangrado

A partir de estos datos se van a ajustar modelos donde se supone que no hay
restricciones entre las relaciones de las 6 variables y luego modelos donde hay inde-
pendencia local y homogeneidad local de las asociaciones.

12.3.2. Modelo ajustado


Las subrutinas de cálculos fueron desarrolladas en el sistema R [11] usando,
para la optimización los algoritmos de optimización no lineal implementados en la
librerı́a nloptr [5] y que aparecen comentados por Ypma en el reporte técnico [14].

A continuación se muestran las subrutinas de estimación creadas en R especial-


mente con los resultados de las estimaciones puntuales y por intervalo, por ejemplo
para el modelo simple (sin restricciones).

y<-datos[,c(15:20)]
modelo1<-estim(y)
L0<-c(modelo1$intensidades,modelo1$asociaciones)
int.conf(modelo1,0.05)
repar(modelo1$intensidades,modelo1$asociaciones)

Vemos entonces los valores estimados φ̂i y α̂ij que devuelve la función estim.
Por otra parte, para una mejor interpretación de lo resultados, se reparametrizan
los φ̂i y los α̂ij para ser presentados como proporciones,odds y OR

> modelo1[1:2]

$intensidades
[1] 0.097 0.066 0.124 0.076 0.130 0.045

$asociaciones

159
Probabilidad, Estadı́stica y sus Aplicaciones

[1] 2.678 4.675 1.585 2.423 1.871 1.880 1.777 2.859


2.513 2.140 1.271 2.665 2.182 4.970 1.916

repar(modelo1$intensidades,modelo1$asociaciones)
$proporciones
[1] 0.214 0.268 0.277 0.289 0.198 0.223

$odds
[1] 0.273 0.365 0.384 0.407 0.2464 0.286

$OR
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] Inf 6.535 7.237 5.7414 7.875 5.949
[2,] 6.535 Inf 5.532 3.9374 5.864 5.396
[3,] 7.237 5.532 Inf 9.0184 6.901 5.426
[4,] 5.741 3.937 9.018 Inf 7.662 5.906
[5,] 7.875 5.864 6.901 7.6617 Inf 11.56
[6,] 5.949 5.396 5.426 5.9057 11.56 Inf

intensidades
S1 S2 S3 S4 S5 S6
0.097 0.066 0.124 0.076 0.130 0.045
asociaciones
- 2.67 4.67 1.58 2.42 1.87
- 1.88 1.77 2.85 2.51
- 2.14 1.27 2.66
- 2.18 4.97
- 1.91
-

Cuadro 12.4: (a) Parámetros estimados

proporciones
S1 S2 S3 S4 S5 S6
0.277 0.214 0.289 0.223 0..268 0.198
OR
- 7.23 9.1 5.42 5.53 6.90
- 5.74 5.95 6.53 7.87
- 5.90 3.93 7.66
- 5.40 11.56
- 5.86
-

Cuadro 12.5: (b) Reparametrización a proporciones y OR

160
Probabilidad, Estadı́stica y sus Aplicaciones

Los intervalos de confianza para los parámetros que surgen del modelo (intensi-
dades y asociaciones) se calculan utilizando la normalidad asintótica de los estima-
dores máximo verosı́miles con la siguiente formulación:

[φ − Z(1−α/2) ∗ s.e; φ + Z(1−α/2) ∗ s.e] (12.20)


donde s.e. es la raı́z cuadrada de la varianza de cada parámetro del modelo, la que
se estima para cada caso, a través de la descomposición QR de la hessiana asociada
al modelo.

intervalos de confianza al 95 % para las intensidades


intensidades Ext. Inf. Estimación puntual Ext. Sup.
1 0.065 0.097 0.129
2 0.041 0.066 0.091
3 0.086 0.124 0.161
4 0.048 0.076 0.103
5 0.091 0.130 0.169
6 0.026 0.045 0.065

Cuadro 12.6: intervalos de confianza al 95 % para las intensidades

intervalos de confianza al 95 % para las asociaciones


asociaciones Ext. Inf. Estimación puntual Ext. Sup.
1-2 1.284 2.678 4.072
1-3 2.517 4.675 6.833
1-4 0.720 1.585 2.450
1-5 1.247 2.423 3.598
1-6 0.802 1.871 2.939
2-3 0.886 1.880 2.874
2-4 0.794 1.777 2.761
2-5 1.447 2.859 4.270
2-6 1.095 2.513 3.931
3-4 1.017 2.140 3.262
3-5 0.634 1.271 1.908
3-6 1.202 2.665 4.128
4-5 1.071 2.182 3.293
4-6 2.358 4.970 7.581
5-6 0.871 1.916 2.961

Cuadro 12.7: intervalos de confianza al 95 % para las asociaciones

12.3.3. Discusión
Puede verse en este caso que según el modelo ajustado, el sextante con mayor
intensidad (parcial) es el S5 con un valor de φ̂5 = 0.13 mientras que los sextantes
que presentan mayor asociación (parcial) son el S4, S6 y el S1, S3 que son los sex-
tantes posteriores inferiores y superiores respectivamente, con valores de α̂4,6 =4.97

161
Probabilidad, Estadı́stica y sus Aplicaciones

y α̂1,3 =4.67.

Si se opta por reducir el número de parámetros del modelo mediante restric-


ciones de igualdad, surgen diferentes alternativas. Una posibilidad es el modelo de
“independencia”, en dicho caso se impone αij = 1 ∀ i, j, logrando ası́ que solo se
estimen las k intensidades del modelo. Otro caso donde se simplifica la dimensio-
nalidad del modelo es el caso de “homogeneidad”, en este caso se asume αij = αkl
de modo que se estimen k intensidades y una sola asociación, común a todos los
pares de sextantes. Utilizando una prueba de cociente de verosimilitud, se pudieron
contrastar las hipótesis de estos modelos. A continuación se presentan las lı́neas de
código:
# para testear la hipotesis de asociaciones=1 (independencia)
modelo1.indep<-estim(x,restr=c(rep(NA,6),rep(1,15)))
1-pchisq(-2*(modelo1.indep$Logv-modelo1$Logv),df=p*(p-1)/2)
# para testear la hipotesis de asociaciones iguales (homogeneidad?)
modelo1.homog<-estim(x,restr=c(rep(NA,6),rep(-1,15)))
1-pchisq(-2*(modelo1.homog$Logv-modelo1$Logv),df=p*(p-1)/2-1)
Para el caso de la independencia entre los sextantes, se pudo rechazar la inde-
pendencia ya que el valor del estadı́stico (cuya distribución era χ215 ) arrojó un valor
p ≤0.00. Para el caso del modelo de homogeneidad de asociaciones, el estadı́stico
de prueba tiene un grado de libertad menos debido a que se estima un parámetro
de asociación. En este caso el p-valor fue de 0.043, rechazando ası́, que todas las
asociaciones fuesen iguales a un único valor desconodico. Por lo tanto en ambos
casos se rechazan la independencia y la homogeneidad de asociaciones.

En última instancia, retomando que en el modelo sin restricciones se observó que


las estimaciones de las asociaciones posteriores (sextantes S1-S3 y sextantes S4-S6)
eran mucho mayores al resto, se decidió poner a prueba la siguiente hipótesis:

α13 = α46
Para esto, se ajustó un nuevo modelo bajo esta restricción. Al comparar las
verosimilitudes, el p-valor encontrado fue de 0.942, lo que sugirió que las asociaciones
posteriores eran efectivamente, de la misma magnitud.
\# para testear la hipotesis alfa13 = alfa46
restriccion<-rep(NA,15)
restriccion[c(2,14)]<- -1
restriccion<-c(rep(NA,6),restriccion)
modelo1.restr<-estim(x,restr=restriccion)
modelo1.indep<-estim(x,restr=c(rep(NA,6),rep(1,15)))
1-pchisq(-2*(modelo1.indep\$Logv-modelo1\$Logv),df=p*(p-1)/2)

12.4. Conclusiones y futuros pasos


En este trabajo se presenta una metodologı́a de análisis para varias variables
binarias diferente a la que habitualmente se usa y que está basada en una des-
composición de una distribución Bernouilli Multivariada en términos que reflejan

162
Probabilidad, Estadı́stica y sus Aplicaciones

intensidades de cada variable y asociaciones entre estas, que ya se habı́a presenta-


do por primera vez con resultados también en forma preliminar sobre enfermedad
periodontal en el documento de trabajo [2] .

Para el caso de una aplicación en salud oral se analizan las asociaciones entre
sextantes en el sangrado.

1. Se descartó la hipótesis de que la presencia de sangrado es independiente entre


algunos sextantes.

2. Se constató que la asociación de presencia de sangrado entre los sextantes


posteriores no difiere entre mandı́bula y maxilar.

A futuro se intentará establecer diferentes tipologı́as que den cuenta del gra-
diente de infección usando diferentes técnicas a ser combinadas con la distribución
Bernoulli Multivariada .

1. Creación de tipologı́as de sangrado gengival a través de variables latentes que


indican la pertenencia a diferentes grupos usando el algoritmo (EM).
2. Clustering a partir de particiones difusas mediante medidas de entropı́a:
[1],[10],[13]

Por otra parte, resta estudiar cómo hacer el proceso de ajuste de los modelos
al trabajar con valores faltantes. Esto problema de datos faltates es frecuente en la
evaluación de la enfermedad periodontal, cuando existen sextantes que no pueden
ser evaluados por no tener las personas las piezas que componen cada sextante.
Resta a su vez poder implementar el cálculo de los intervalos de confianza para
las reparametrizaciones de los componentes del modelo (odds, y OR), en donde la
varianza debe ser estimada mediante simulación Monte Carlo.

163
Probabilidad, Estadı́stica y sus Aplicaciones

Bibliografı́a

[1] Álvarez, F., Álvarez-Vaz, R. y Massa, F. , Determinación de tipologı́as


de infecciones parasitarias intestinales, en escolares mediante, técnicas de clus-
tering sobre datos binarios. En CLATSE 2012. Congreso Latinoamericano de
Sociedades de Estadı́stica,2012.

[2] Álvarez-Vaz, R. y Massa, F. Distribución bernoulli multivariada. una apli-


cación a la salud oral. Documento de Trabajo Serie DT (14/03) - ISSN :
1688-6453, IESTA,2014.
[3] Cox, D. R. and Wermuth, N.. On some models for multivariate binary
variables parallel in complexity with the multivariate gaussian distribution.
Biometrika, 89:462–469,2002.
[4] Dai, B.. Multivariate Bernoulli Distribution Models. Technical Report 1171,
Department of Statistics, University of Wisconsin, Madison WI, 1300 Univer-
sity Ave, 2012.

[5] Johnson, S. G.. The NLopt nonlinear-optimization package. Rpackage version


1.0.4, 2014.
[6] Jurasinski, G. and Retzer, V.. simba: A Collection of functions for simi-
larity analysis of vegetation data. R package version 0.3-4, 2012.
[7] Lorenzo, S., Alvarez Vaz, R., Blanco, S., y Peres, M., Primer Re-
levamiento Nacional de Salud Bucal en población joven y adulta uruguaya:
Aspectos metodológicos. Odontoestomatologı́a, 15:8 – 25, 2013.
[8] Lorenzo, S., Piccardo, V., Álvarez, F., Massa, F., y Álvarez Vaz, R.,
Enfermedad Periodontal en la población joven y adulta uruguaya del Interior
del Pais: Relevamiento Nacional 2010-2011. Odontoestomatologı́a, 15:35 – 46,
2013.
[9] Marshall, A. and Olkin, I.. A family of bivariate distribution generated
by the bivariate bernoulli distribution. Journal of the American Statistical
Association, 80:332–338, 1985.

[10] Moustaki, I. y Papageorgiou, I., 2004. Latent class models for mixed
variables with applications in archaeometry. Elsevier Computational Statistics
& Data Analysis, p. 17, 2004.

164
Probabilidad, Estadı́stica y sus Aplicaciones

[11] R Core Team. R: A Language and Environment for Statistical Computing.


R Foundation for Statistical Computing, Vienna, Austria, 2014.
[12] Tamhane, A. C., Qiu, D., y Ankenman, B. E.. A parametric mixture
model for clustering multivariate binary data. Wiley InterScience, pp. 3–19,
2009.
[13] Tsekouras, G., Papageorgiou, D., Kotsiantis, S., Kalloniatis, C., y
Pintelas, P.. Fuzzy clustering of categorical attributes and its use in analy-
zing cultural data. World Academy of Science, Engineering and Technology,
1:87–91, 2005.
[14] Ypma, J. Introduction to nloptr: an r interface to nlopt. Technical report,
2014.

165
Probabilidad, Estadı́stica y sus Aplicaciones

Capı́tulo 13
Determinación de la distribución de probabilidad de la demanda en un modelo
de control de inventarios

Erika Hernández-Vargas y Rocı́o Ilhuicatzi-Roldán

Universidad Politécnica de Tulancingo,


Calle Ingenierı́as No 100, Col. Huapalcalco,
C.P. 43629, Tulancingo, Hidalgo,
Universidad Autónoma de Tlaxcala,
Facultad de Ciencias Básicas, Ingenierı́a y Tecnologı́a,
Calz. Apizaquito s/n. km. 1.5,
C.P. 90300, Apizaco, Tlaxcala,
kik [email protected], [email protected]
Resumen. Se presenta un modelo de control de inventarios mediante la teorı́a
de procesos de decisión de Markov. Los conjuntos de estados y acciones se suponen
finitos. Para este modelo, la ley de transición queda determinada por una ecuación
en diferencias, la cual involucra la distribución de probabilidad de la demanda. En
un caso real, se propone estimar dicha distribución a partir de observaciones de la
demanda, por medio de la función de distribución empı́rica. Ası́ mismo, se sugiere
implementar un procedimiento de horizonte rodante para la obtención de la acción
de control en cada época de decisión, dicho horizonte permitirá mejorar la estima-
ción de la distribución de la demanda agregando el dato observado de la demanda
en la época anterior. Se muestra un ejemplo numérico a través de un programa
elaborado en Matlab, que calcula la distribución de la demanda y resuelve median-
te programación dinámica los problemas de control de inventarios indicados por el
procedimiento de horizonte rodante.

Abstract. A model inventory control through the theory of Markov decision


processes is presented. The sets of the states and the actions are considered finites.
For this model, the transition law is determined by an equation in differences, which
involves the probability distribution of the demand. In a real case, it is proposed to
estimate this distribution from observations of the demand, through the empirical
distribution function. Also, it is suggested implement a rolling horizon procedure to
obtain the control action of control in each decision period, such horizon will allow
to improve the estimate of the distribution of demand by adding the observed data
of the demand in the previous period. A numerical example is shown by means of
a program elaborate in Matlab, which calculates the distribution of demand and
solves through dynamic programming the inventory control problems indicated by
the rolling horizon procedure.

166
Probabilidad, Estadı́stica y sus Aplicaciones

Palabras clave: Procesos de decisión de Markov, Programación dinámica, Fun-


ción de distribución empı́rica, Horizonte rodante.

13.1. Introducción
El presente trabajo está relacionado con un modelo de control de inventarios.
En todo sistema de inventarios, se pueden identificar las siguientes componentes:
demandas, costos y reabastecimientos. Por lo general, las demandas son estocásticas
y de ahı́ surge el problema de control de inventarios. Al considerar un inventario
de mercancı́a se incurre en diferentes costos, los tres más significativos son: cos-
to por mantener un inventario, costo por reabastecimiento y costo por escasez de
mercancia. Dos decisiones que se pueden tomar en cuenta al tratar de controlar
un inventario son: cuándo reabastecer el inventario y qué cantidad de mercancia
ordenar para el reabastecimiento. El problema de control de un inventario consiste
en establecer una polı́tica de reabastecimiento que minimize el costo total asociado
a su manejo.

La teorı́a de procesos de decisión o control de Markov permite modelar a los


sistemas de inventarios. Un proceso de decisión de Markov requiere de un modelo
conocido como modelo de control de Markov, cuyas componentes permiten carac-
terizar su desarrollo en el transcurso del tiempo. La dinámica del proceso puede ser
influenciada por medio de la aplicación de acciones o controles en cada periodo de
tiempo. A la sucesión de acciones se le conoce como polı́tica, una forma de evaluar
su calidad es mediante una función objetivo o criterio de rendimiento. Entonces,
el problema de control óptimo consiste en determinar una polı́tica que optimice el
criterio de rendimiento.

En este trabajo se considera un modelo de control de inventarios propuesto en


[2], dentro de la teorı́a de procesos de decisión de Markov. Los conjuntos de estados
y acciones se consideran finitos. Para este modelo la ley de transición queda deter-
minada mediante una ecuación en diferencias la cual involucra la distribución de
probabilidad de la demanda y la función de costo por periodo se plantea en termi-
nos de los costos ya mencionados (reabastecimiento, mantenimiento de inventario
y escasez). En el problema de control de inventarios se considera como función de
rendimiento el costo total esperado con horizonte finito.

En la aplicación real del modelo mencionado, se requiere de la distribución de


probabilidad de la demanda, la cual difı́cilmente es proporcionada al momento de
iniciar el control y tendrı́a que ser estimada. La misma complicación ocurre con los
costos, pero, en este trabajo no se hace investigación sobre la determinación de los
costos.

El principal objetivo de este trabajo es proponer, con bases teóricas, una me-
todologı́a que permita estimar la distribución de probabilidad de la demanda. Se
propone estimar dicha distribución a partir de observaciones de la demanda, me-
diante la función de distribución empı́rica. Ası́ mismo, se considera el caso en donde
incluso se desconoce el horizonte de planeación. Para tal caso, se sugiere implemen-

167
Probabilidad, Estadı́stica y sus Aplicaciones

tar un procedimiento de horizonte rodante para la obtención de la acción de control


en cada época de decisión, teniendo como ventaja el poder mejorar la estimación de
la distribución de probabilidad de la demanda al agregar cada vez el dato observado
de la demanda en la etapa anterior.

Para mostrar ejemplos numéricos, se ha elaborado un programa en Matlab, que


calcula la distribución de probabilidad de la demanda y resuelve mediante progra-
mación dinámica el problema de control de inventario con horizonte de planeación
finito (cuando se conoce el horizonte de planeación con certeza) o los problemas de
control de inventarios que requiere el procedimiento de horizonte rodante (cuando
no se tenga conocimiento sobre el horizonte de planeación).

Este trabajo se encuentra organizado de la siguiente manera: en la segunda sec-


ción, se proporcionan los conceptos básicos sobre la teorı́a de procesos de decisión
de Markov, en la tercera sección, se describe el modelo de control de inventarios
como un modelo de decisión de Markov, en la cuarta sección, se proporciona el
procedimiento para estimar la función de distribución de probabilidad de la deman-
da, en la quinta sección, se muestra un ejemplo numérico. Finalmente, se dan las
conclusiones.

13.2. Preliminares
En esta sección, se introducen los conceptos básicos de la teorı́a de procesos de
decisión de Markov, los cuales han sido retomados de [5].

13.2.1. Modelo de control de Markov


Un modelo de control o decisión de Markov puede representarse de la siguiente
manera:
{T, S, As , pt (·|s, a), ct (s, a)}
donde T representa el conjunto de épocas de decisión, S denota un conjunto de
estados del sistema, As representa al conjunto de acciones o controles admisibles
cuando el sistema se encuentra en el estado s ∈ S, pt (·|s, a) es una ley de transición
condicionada al estado s ∈ S y la acción elegida a ∈ As y ct (s, a) es una función de
costo por periodo que depende del estado s y la acción a.

Observación 13.2.1 En este trabajo se considera T = {0, 1, . . . , N } donde N <


∞ representa el horizonte de planeación y se consideran conjuntos de estados y
acciones finitos.

La dinámica del sistema es la siguiente: en una época de decisión t, un contro-


lador observa un estado st ∈ S del sistema y elige una acción at ∈ Ast incurriendo
en un costo ct (st , at ) por periodo, simultaneamente el sistema transita a un nuevo
estado st+1 con probabilidad de transición pt (st+1 |st , at ).

168
Probabilidad, Estadı́stica y sus Aplicaciones

Observación 13.2.2 En muchos casos, la transición de estados puede ser especi-


ficada mediante una ecuación en diferencias, dada de la siguiente forma:

st+1 = ft (st , at , ωt ),

t = 0, 1, . . ., donde s0 es el estado inicial y {ωt } es una sucesión de variables alea-


torias independientes e idénticamente distribuidas que toman valores en un espacio
arbritario W y tienen distibución de probabilidad conocida, independiente del estado
inicial.
Se puede tener el caso en donde la función de costo dependa también de ωt .

13.2.2. Polı́tica de control


Las acciones pueden elegirse mediante reglas de decisión d aleatorias o deter-
ministas. Sea P(As ) la colección de todas las distribuciones de probabilidad sobre
subconjuntos de Borel de As . Elegir acciones aleatoriamente significa elegir una
distribución de probabilidad q(·) ∈ P(As ), de tal manera que la acción a es se-
leccionada con probabilidad q(a). Las distribuciones de probabilidad degeneradas
(q(a) = 1) corresponden a elección determinista de acciones. A su vez, las reglas de
decisión pueden ser markovianas o dependientes de la historia.

Las reglas de decisión necesarias para el desarrollo de este trabajo son determi-
nistas markovianas, las cuales se definen como funciones dt : S → As que especifican
la elección de la acción con certeza cuando el sistema se encuentra en el estado s
en la época de decisión t. Para cada s ∈ S, dt (s) ∈ As . Se dicen ser markovianas
porque dependen únicamente del estado actual del sistema y no de previos estados
y acciones. El conjunto de dichas reglas de decisión será denotado por DM D

Una polı́tica de decisión o control π especifica en cada una de las épocas de deci-
sión la regla de decisión que debe ser usada, esto es, π = (d0 , d1 , . . . , dN −1 ) (cuando
el horizonte de planeación es finito, se adopta la convención de que ninguna acción
será tomada en la época de decisión N ).

Una polı́tica determinista markoviana es una polı́tica π = (d0 , d1 , . . . , dN −1 ) tal


que dt ∈ DM D para t = 0, 1, . . . , N − 1. El conjunto de todas las polı́ticas determi-
nistas markovianas será denotado por ΠM D .

13.2.3. Problema de control óptimo


Considere un sistema dinámico en tiempo discreto con ley de transición

st+1 = ft (st , at , ωt ), t = 0, 1, . . . , N − 1.

Dado un estado inicial s0 , el problema de control óptimo consiste en encontrar una


polı́tica π = {d0 , d1 , ..., dN −1 } que minimice la función de costo
"N −1 #
X
Jπ (s0 ) = Eω0 ,ω1 ,...,ωN −1 ct (st , dt (st ), ωt ) + cN (sN ) (13.1)
t=0

169
Probabilidad, Estadı́stica y sus Aplicaciones

sujeta a la ley de transición

st+1 = ft (st , dt (st ), ωt ), t = 0, 1, . . . , N − 1,

donde cN es una función de costo terminal.

Observación 13.2.3 La función objetivo (13.1) es referida como costo total espe-
rado con horizonte finito N . Dentro de la teorı́a de procesos de decisión de Markov,
existen otras funciones objetivo o de rendimiento, tales como son el costo total es-
perado descontado y el costo esperado promedio.

Una polı́tica óptima de control π ∗ es tal que

Jπ∗ (s0 ) = min Jπ (s0 ),


π∈Π

donde Π es el conjunto de todas las polı́ticas de control. El costo óptimo correspon-


diente puede ser denotado por J ∗ (s0 ); esto es,

J ∗ (s0 ) = Jπ∗ (s0 ).

J ∗ es una función que asigna a cada estado inicial s0 el costo óptimo J ∗ (s0 ), es
llamada función de valor óptimo.

13.2.4. Programación dinámica


La técnica de programación dinámica es la más usada para resolver el problema
de control descrito anteriormente. La siguiente proposición establece de manera
precisa el algoritmo de programación dinámica que da solución óptima al problema
de control.

Proposición 13.2.4 Sea J ∗ (s0 ) el costo óptimo. Entonces,

J ∗ (s0 ) = J0 (s0 ),

donde la función J0 esta dada por la última iteración del siguiente algoritmo, el
cual procede hacia atrás desde la época de decisión N − 1 a la época de decisión 0:

JN (sN ) = cN (sN )
Jt (st ) = min Eωt [ct (st , at , ωt ) + Jt+1 (ft (st , at , ωt ))], (13.2)
at ∈Ast

t = 0, 1, . . . , N − 1.

Además, si a∗t = d∗t (st ) minimiza el lado derecho de (13.2) para cada st y t, la ley
de control π ∗ = {d∗0 , d∗1 , . . . , d∗N −1 } es óptima.

La demostración de la Proposición 13.2.4 puede consultarse en [2], pag. 234.

170
Probabilidad, Estadı́stica y sus Aplicaciones

13.2.5. Procedimiento de horizonte rodante


El procedimiento de horizonte rodante es el método mas común aplicado en la
práctica para aproximar soluciones a problemas de control óptimos no homogeneos
con horizonte infinito (vease [1]). Primero se fija un horizonte H, luego se procede
a resolver el problema correspondiente de H periodos y se implementa la primera
acción óptima encontrada, se rueda hacia adelante un periodo y se repite el proce-
dimiento a partir del estado actual y ası́ sucesivamente. Enseguida, se presenta el
algoritmo de horizonte rodante.
Algoritmo 13.2.5 Procedimiento de horizonte rodante.
1. Hacer m = 0 y n = H.

2. Hallar la polı́tica π ∗ = (d∗m , d∗m+1 , ..., d∗n−1 ), la cual es óptima para los periodos
de m a n, y sea dˆm = d∗m .

3. Hacer m = m + 1 y n = n + 1.
4. Regresar al Paso 2.
La polı́tica π̂ = (dˆ0 , dˆ1 , dˆ2 , ...) es llamada una polı́tica de horizonte rodante.

13.3. Modelo de inventarios


En un sistema de inventarios, considere el problema de ordenar una cantidad
de cierta mercancı́a al principio de cada periodo de tiempo para satisfacer una de-
manda estocástica. La teorı́a de procesos de decisión de Markov es adecuada para
modelar y resolver dicho problema.

El modelo de inventarios que se presenta en este trabajo es retomado de [2], pag.


18, y se formula bajo el siguiente conjunto de suposiciones simples:
1. La decisión de ordenar una cantidad adicional de inventario se realiza al inicio
de cada periodo de revisión y la entrega ocurre inmediatamente.

2. Las demandas del producto llegan a través del periodo pero todas son satis-
fechas al finalizar el periodo.
3. Si la demanda excede el inventario, el exceso de la demanda se pierde.
4. Los costos y la distribución de probabilidad de la demanda no varı́an de un
periodo a otro.
5. El producto es vendido sólo en unidades enteras
6. El almacen tiene una capacidad máxima de M unidades.

Sea st el nivel de inventario o stock disponible al principio del periodo t, at la


cantidad ordenada al principio del periodo t y ωt la demanda durante el perio-
do t. Se supone que {ω0 , ω1 , . . .} es una sucesión de variables aleatorias indepen-
diente e idénticamente distribuidas con probabilidad conocida P (ωt = k) = pk ,

171
Probabilidad, Estadı́stica y sus Aplicaciones

k = 0, 1, . . . , D, donde D < ∞ es el valor máximo de la demanda. Observe que, de


acuerdo a los supuestos del modelo, el nivel de inventario st + at en el periodo t
debe cumplir que st + at ≤ M y como el exceso de demanda ωt − st − at se pierde,
el nivel de inventario se desarrolla de acuerdo a la siguiente ecuación en diferencias:
st+1 = max{0, st + at − ωt }.
Finalmente, el costo por periodo está dado por
c(st , at , ωt ) = dat + h max{0, st + at − ωt } + p max{0, ωt − st − at },
donde
d es el costo por unidad ordenada,
h es el costo por mantener en inventario una unidad de inventario
p es el costo por unidad no abastecida.
De esa manera, las componentes del modelo de decisión para el modelo de control
de inventarios, quedan especificadas de la siguiente manera:
épocas de decisión: T = {1, 2, . . . , N }, N ≤ ∞.
Conjunto de estados: S = {0, 1, . . . , M }.
Conjunto de acciones admisibles: As = {0, 1, 2, . . . , M − s}.
Ley de transición: st+1 = max{0, st + at − ωt }, donde P (ωt = k) = pk ,
k = 0, 1, . . . , D con D < ∞.
Costo por periodo: c(st , at , ωt ) = dat + h max{0, st + at − ωt } + p max{0, ωt −
st − at }.
La ecuación de programación dinámica para el problema de control de inventario,
de acuerdo con la Proposición 13.2.4, es dada como sigue:
JN (sN ) = cN (sN )
 
dat + h max{0, st + at − ωt }
Jt (st ) = min Eωt  +p max{0, ωt − st − at } 
at ∈{0,1,2,...,M −st }
+Jt+1 (max{0, st + at − ωt })
t = N − 1, N − 2, . . . , 0. (13.3)

13.4. Distribución de probabilidad de la demanda


en un sistema de inventarios
Para la aplicación del modelo de inventarios, presentado en la sección anterior,
a un sistema de inventarios real, se requiere contar con todas las componentes del
modelo de control de Markov. Principalmente se preveé la dificultad de contar con
la distribución de probabilidad de la demanda. El principal objetivo, como ya se
mencionó en la introducción, es proponer, con bases teóricas, una metodologı́a para
la determinación de la distribución de probabilidad de la demanda. Por ello, a
continuación se presenta una serie de resultados sobre la distribución empı́rica, los
cuales serán de utilidad.

172
Probabilidad, Estadı́stica y sus Aplicaciones

13.4.1. Función de distribución empı́rica


Los siguientes conceptos son retomados de [3].

Sea F (w) la función de distribución de una variable aleatoria ω y


w0 , w1 , ..., wn (13.4)
los resultados de una sucesión de ensayos independientes en circunstancias idénticas.

La sucesión ordenada de manera creciente de (13.4) se puede representar como


sigue:
∗ ∗ ∗
w0,k 0
< w1,k 1
< ... < wr,k r
Pr
donde ki es el número de observaciones iguales a wi∗ , y i=0 ki = n. Tal sucesión
ordenada es llamada sucesión de variación.

La función Fn (w) definida como


para w < w0∗ ,

 0,
 Pi
j=1 kj ∗ ∗
Fn (w) = , para wi,k ≤ w < wi+1,k , i = 0, 1, . . . , r − 1,
 1, n
 i
para w ≥ wr,k∗
.
i+1

es llamada función de distribución empı́rica.

Observe que la función de distribución empı́rica es monótona y tiene sus puntos


de discontinuidad en los valores que coinciden con los valores de la sucesión de va-
riación. El tamaño del salto para los valores diferentes de la sucesión de variación
es igual a kni .

En el caso particular más simple donde la variable aleatoria ω puede tomar solo
un número finito de valores a0 , a1 , ..., aD , los términos de la sucesión de variación
podrı́an ser solo estos valores. Si k0 , k1 , ..., kD (k0 + k1 + .. + kD = n) denotan el
número de ensayos donde ω = a0 , ω = a1 , ...ω = aD , entonces, por la Ley de los
Grandes Números, estas frecuencias (para un n suficientemente grande) representa-
ron valores aproximados de las probabilidades desconocidas p0 = P {ω = a0 } , p1 =
P {ω = a1 } , ..., pD = P {ω = aD }, esto es p0 ≈ k0 /n, p1 ≈ k1 /n, ..., pD ≈ kD /n. Lo
descrito en este párrafo queda formalmente establecido en el siguiente teorema.
Teorema 13.4.1 (El Teorema de Borel). Sea µ el número de ocurrencias de un
evento A en n independientes ensayos en cada uno de los cuales el evento A podrı́a
ocurrir con probabilidad p. Entonces, cuando n → ∞
µ
P { → p} = 1
n
La demostración del Teorema de Borel puede consultarse en [3], pag. 212.

Teorema 13.4.2 (Teorema de Glivenko) Sea F (w) la función de distribución


de una variable aleatoria ω, y Fn (w) la función de distribución empı́rica de n ob-
servaciones independientes de la variable aleatoria ω. Entonces, cuando n → ∞
 
P sup |Fn (w) − F (w)| → 0 = 1.
−∞<x<∞

173
Probabilidad, Estadı́stica y sus Aplicaciones

El Teorema de Glivenko permite estimar la función de distribución desconocida


de una variable aleatoria ω a partir de observaciones de la variable; es llamado Teo-
rema Principal de la Estadı́stica. Su demostración puede consultarse en [3], pag.215.

13.4.2. Estimación de la distribución de probabilidad de la


demanda
Recuerde que en el modelo de control de inventarios, la sucesión {ωt } es una
sucesión de variables aleatorias independientes e idénticamente distribuidas que
representan la demanda en el periodo t. Dichas variables, por ser idénticamente
distribuidas y por suponer que no varı́an de un periodo a otro, pueden ser repre-
sentadas por una variable genérica ω.

De acuerdo con el Teorema de Borel, para la estimación de la distibución de


probabilidad de ω, es necesario contar con observaciones de la demanda antes de
iniciar el control del inventario y entre mayor el número de observaciones, mejor
será la estimación de dicha distribución de probabilidad. El siguiente algoritmo,
indica el procedimiento para la estimación de la distribución de probabilidad de ω.

Algoritmo 13.4.3 Estimación de la distribución de probabilidad de la de-


manda.
1. Sea Cn el vector correspondiente a las n observaciones de la demanda.
2. Hacer D = max Cn .
3. Para i desde 0 hasta D, sea ki el número de observaciones iguales a i.
4. Hacer pˆi = ki /n,

pˆi es el valor estimado para pi = P (ω = i), i = 0, 1, . . . , D.

Otro inconveniente, al momento de aplicar el modelo de control de inventario, es


que también el horizonte de planeación N pudiera ser no especificado. En este caso,
se propone usar un procedimiento de horizonte rodante (véase el Algoritmo 13.2.5)
para la obtención de la acción de control en cada época de decisión, proporcionando
un valor adecuado para el horizonte H. De esa manera, se obtendrán las acciones
de control para los periodos necesarios.

Una ventaja que se podrı́a tener con la aplicación de un procedimiento de hori-


zonte rodante, es que los datos de la demanda observados en periodos ya controlados
podrı́an agregarse para mejorar la estimación de la distribución de la demanda, in-
cluso podrı́an modificarse costos en caso de ser necesario.

La Figura 13.1, muestra un diagrama de flujo que permite el control de un in-


ventario, en donde la acción de control obtenida es de horizonte rodante. En el
Algoritmo 13.2.5, la solución óptima de los problemas de control de tamaño H es
hallada mediante programación dinámica, de acuerdo con la Proposición 13.2.4 y
(13.3).

174
Probabilidad, Estadı́stica y sus Aplicaciones

Figura 13.1: Diagrama de flujo para el control del inventario.

175
Probabilidad, Estadı́stica y sus Aplicaciones

13.5. Ejemplo numérico


En esta sección se muestra un ejemplo numérico. Para la obtención de resulta-
dos se ha elaborado un programa en Matlab que incluye el Algoritmo 13.4.3 y el
algoritmo de programación dinámica indicado en la Proposición 13.2.4 y (13.3).
Considere el problema de control de inventarios presentado en este trabajo, con los
siguientes valores de los parámetros del modelo:
Vector de observaciones de la demanda:

C25 = [8, 3, 1, 7, 8, 1, 7, 8, 0, 6, 6, 8, 6, 5, 3, 2, 2, 1, 4, 6, 1, 8, 5, 4, 3].

Horizonte de planeación: N = 10 periodos.


Costo por unidad ordenada: d = 1.

Costo por mantener en inventario una unidad de inventario: h = 2.


Costo por unidad no abastecida: p = 4.
Costo terminal: cN (s) = s2 .
Máxima capacidad del inventario: M = 7.

La distribución de probabilidad de la demanda estimada se muestra en el si-


guiente vector:

p = [0.04, 0.16, 0.08, 0.12, 0.08, 0.08, 0.12, 0.08, 0.2]

La polı́tica óptima obtenida se presenta en el Cuadro 13.1.

t 0 1 2 3 4 5 6 7 8 9
s
0 3 2 1 0 0 0 0 0 0 0
1 5 4 3 2 1 0 0 0 0 0
2 6 5 4 3 2 1 0 0 0 0
3 6 5 4 3 2 1 0 0 0 0
4 6 5 4 3 2 1 0 0 0 0
5 6 5 4 3 2 1 0 0 0 0
6 6 5 4 3 2 1 0 0 0 0
7 6 5 4 3 2 1 0 0 0 0

Cuadro 13.1: Polı́tica óptima.

El costo total esperado mı́nimo para cada estado inicial s, se muestra en el


Cuadro 13.2.

176
Probabilidad, Estadı́stica y sus Aplicaciones

s 0 1 2 3 4 5 6 7
J0 (s)
102.67 101.67 100.67 99.67 98.67 97.67 96.67 96.29

Cuadro 13.2: Valor óptimo.

13.6. Conclusiones
En este trabajo se ha estudiado mediante la teorı́a de procesos de decisión de
Markov un modelo de control de inventarios, en donde, se destaca la problemática
de no contar con la distribución de probabilidad de la demanda estocástica en
una aplicación real. Entonces, se propone estimar dicha distribución mediante la
distribución empı́rica a partir de observaciones previas de la demanda. Además, se
sugiere utilizar un procedimiento de horizonte rodante, que permite el control de
un inventario, aún cuando se desconozca el horizonte planeación.

177
Probabilidad, Estadı́stica y sus Aplicaciones

Bibliografı́a

[1] Alden J. M. y Smith R. L. Rolling horizon procedures in nonhomogeneous


Markov decision process. Operations Research. Vol. 40, pp. 183-194, 1992.
[2] Bertsekas D. P. Dynamic Programming: Deterministic and Stochastic Models.
Prentice-Hall, New Jersey, 1987.
[3] Gnedenko B. V. Theory of Probability. Gordon and Breach Science Publishers,
Amsterdam, 1997.
[4] Hernández-Lerma O. y Lasserre J. B. Discrete-Time Markov Control Pro-
cesses: Basic Optimality Criteria. Springer, New York, 1996.
[5] Puterman M. L. Markov decision process: discrete stochastic dynamic pro-
gramming John Wiley & Sons, New Jersey, 1994.

178
Probabilidad, Estadı́stica y sus Aplicaciones

Capı́tulo 14
El Conteo en la Probabilidad

Francisco Tajonar Sanabria, Estela Morales Ruiz, Fernando Velasco Luna,


Hugo Cruz Suárez y Dionicio Zacarı́as Flores

Benemérita Universidad Autónoma de Puebla,


Facultad de Ciencias Fı́sico Matemáticas,
Av. San Claudio y 18 Sur, Col. San Manuel,
C.P. 72570, Puebla, Puebla,
[email protected], [email protected],
[email protected], [email protected], [email protected]
Resumen. En la actualidad la teorı́a de la probabilidad es una rama importante
de las matemáticas y las matemáticas aplicadas, con sus propios conceptos, méto-
dos y resultados. Tiene relaciones profundas con otros campos de las matemáticas
e innumerables usos teóricos y aplicaciones prácticas en otras ciencias. El problema
que presenta el lector que gusta de la Probabilidad es no saber contar. En este
trabajo se discutirán algunos problemas clásicos que pueden resolverse con técnicas
de conteo y ayudan al manejo de la Probabilidad.

Abstract. At present, the theory of probability is an important branch of applied


mathematics and mathematics, with its own concepts, methods and results. It has
deep relationships with other fields of mathematics and innumerable theoretical uses
and practical applications in other sciences. The problem presented by the reader
who likes Probability is not knowing how to count. In this paper we will discuss
some classic problems that can be solved with counting techniques and help the
handling of the Probability.

Palabras clave: Conteo, Probabilidad, Probabilidad Clásica.

14.1. Introducción
En el siglo XX la Teorı́a de la Probabilidad tuvo un desarrollo importante tanto
en la parte teórica como en sus aplicaciones. En los años treinta se transformá del
cálculo de probabilidades en teorı́a de la probabilidad. El cálculo de probabilidades
ya tenı́a algunos de los ingredientes básicos de la teorı́a, pero consistı́a principalmen-
te en una colección de problemas computacionales con ideas intuitivas y resultados
poco precisos. La noción misma de probabilidad era confusa. Henri Poincaré afirmá
en su libro Calcul des probabilitı́es (1900) que no se podı́a dar una definición sa-
tisfactoria de probabilidad. En la actualidad la teorı́a de la probabilidad es una

179
Probabilidad, Estadı́stica y sus Aplicaciones

rama importante de las matemáticas y las matemáticas aplicadas, con sus propios
conceptos, métodos y resultados. Tiene relaciones profundas con otros campos de
las matemáticas e innumerables usos teóricos y aplicaciones prácticas en otras cien-
cias y en la tecnologı́a, ası́ como implicaciones que nos afectan más de lo que nos
imaginamos.

Uno puede observar que muchos de los eventos que ocurren en la vida diaria
no se pueden predecir con exactitud, ni con anticipación por diversas razones, pues
la mayorı́a de los hechos están influenciados por factores externos. Además, exis-
ten aquellos sucesos que están directamente influenciados por el azar, es decir, por
procesos en los cuales no se esta completamente seguro de lo que va ocurrir. Sin
embargo, la probabilidad nos permite tratar a este tipo de sucesos y estudiarlos,
ponderando las posibilidades de su ocurrencia y proporcionando métodos para tales
ponderaciones.

La probabilidad nos permite descubrir que algunos sucesos tienen una mayor
o menor probabilidad de ocurrir que la ponderación asignada a través del sentido
común. Esto nos permite señalar que la información previa que podamos tener,
conocimiento o postura, son algunos de los factores que intervienen para no per-
mitirnos hacer ponderaciones reales y sistemáticas. La probabilidad de estudiar los
eventos de manera sistemática y más cercana a la realidad, retribuirnos con infor-
maciaón más precisa y confiable y, por tanto, de utilidad para algunas disciplinas
de investigación.

La necesidad de tratar con total incertidumbre nos lleva a estudiar y utilizar


la teorı́a de probabilidad. Al organizar la información y considerarla de manera
sistemática, seremos capaces de reconocer nuestras suposiciones, comunicar nuestros
razonamientos a otras personas y tomar una decisión más sólida.

14.2. Preguntas
La probabilidad y la estadı́stica son áreas de la matemática aplicada que han
tenido un gran crecimiento, tanto en su teorı́a como en sus aplicaciones. Sin embar-
go, son áreas diferentes; el primer reto del estudiante es diferenciar los conceptos y
herramientas que usa cada una de ellas. Para ello es necesario responder dos pre-
guntas: ¿Qué es la probabilidad?, ¿dónde se utiliza?

La noción de probabilidad viene de la necesidad de medir o determinar cuantita-


tivamente la certeza o duda de que un suceso dado ocurra o no. La probabilidad está
basada en el estudio de la combinatoria y es fundamento necesario de la estadı́stica,
con el fin de examinar las formas y medios para obtener esas medidas de certeza,
ası́ como encontrar los métodos de combinarlos cuando intervienen varios sucesos
en una prueba.

El problema esencial para el estudio de la probabilidad es romper con el pen-


samiento determinista y aceptar que existe el pensamiento aleatorio. Cada uno de
los resultados obtenidos al realizar un experimento recibe el nombre de suceso, has-

180
Probabilidad, Estadı́stica y sus Aplicaciones

ta este punto no podemos establecer con certeza la probabilidad de ocurrencia de


cierto evento, y es cuando una de las dificultades que con frecuencia se presenta en
el estudiante, el no saber contar.

Contar consiste en enumerar eventos difı́ciles de cuantificar, la enumeración de


los eventos que se pueden presentar, en ocasiones es difı́cil y laboriosa por la canti-
dad de puntos a contar o enumerar, propiciando que se puedan cometer errores al
emprender esa tarea.

Como propuesta para llegar a un entendimiento más completo de las técnicas de


conteo sin precisar los conceptos y resultados básicos de conteo se presentan varios
problemas que pueden ayudar al manejo correcto de las técnicas de conteo.

14.2.1. Algunos Problemas


Problema 14.2.1 (Suma de números)
Calcule la suma de los primeros 1000 enteros positivos, esto es:
1 + 2 + 3 + 4 + · · · + 1000 =?

Solution 14.2.2 Sume el primer número y el último, que es

1 + 1000 = 1001

Luego sume el segundo número y el penúltimo, que también es

2 + 999 = 1001

Continúe de esta forma y al terminar se dará cuenta que tiene 500 pares cuya suma
es igual a 1001, es decir:

1 + 2 + 3 + 4 + · · · + 999 + 1000 = 500(1001)


1000(1000 + 1)
=
2
n(n + 1)
= .
2
La última igualdad indica la expresión general para sumar cualquier cantidad de
enteros positivos.

Un problema similar es el siguiente.

Problema 14.2.3 (Dominó)


¿Cuantas fichas de dominó se pueden formar con los primeros 1000 enteros positi-
vos?

Solution 14.2.4 Forme parejas con los números 1, 2, ..., 1000, es decir,

(1, 1), (1, 2), (1, 3), (1, 4), · · · , (1, 1000)

181
Probabilidad, Estadı́stica y sus Aplicaciones

y como en una ficha de dominó el orden no es importante, se tendrán que descartar


las parejas
(2, 1), (3, 1), (3, 2), · · · ,
pues ya fueron tomadas en cuenta por lo que se tendrı́a

Parejas Num. Parejas


(1,1), (1,2), (1,3), ···, (1,1000) 1000
(2,1), (2,2), (2,3), ···, (2,1000) 999
(3,1), (3,2), (3,3), ···, (3,1000) 998
: : : : : :
(1000,1), (1000,2), (1000,3), ···, (1000,1000) 1

Finalmente se suman el número de parejas

1000 + 999 + 998 + · · · + 1

llegando a la siguiente expresión:

n(n + 1) 1000(1000 + 1)
= .
2 2
Es el número de fichas de dominó que se pueden formar con los primeros 1000
enteros positivos.

Problema 14.2.5 Examen


Un estudiante prepara 90 de 100 preguntas para su examen parcial.

El estudiante aprueba el examen si:


i) Responde correctamente a las dos preguntas que se le hace o,

ii) primero responde una de las dos y luego responde a una tercera.
¿Qué tiene que hacer el estudiante para saber si aprobará el examen o no?

Solution 14.2.6 Puede intentarlo haciendo cuentas y obtener todas sus posibilida-
des, ¿sabe contar?, o puede usar combinaciones y hacer uso de la lógica cuando usa
los conectivos: y, o., ¿su respuesta final tiene que ver con probabilidad?, ¿siempre
obtiene la misma respuesta?

Problema 14.2.7 Inversión


Suponga que cierta persona desea invertir $1000. 00 a un plazo de 5 años con una
tasa de interés del 6 %. Suponga que la tasa de interés se mantiene para cualquier
tipo de composición que elija:
a) Anual
b) Mensual
c) Diariamente

d) A cada instante

182
Probabilidad, Estadı́stica y sus Aplicaciones

¿Habrá cambios en los diferentes tipos de composición?, ¿Qué concepto está escon-
dido en este problema?

Solution 14.2.8 Para a) denote con A0 = 1000 el capital inicial, luego al


finalizar el primer año, el segundo año, se tiene

A1 = (1 + 0,06) ∗ A0
A2 = (1 + 0,06) ∗ A1 = (1 + 0,06)2 ∗ A0

Continuando de esta forma, tenemos:

A5 = (1 + 0,06)A4 = (1 + 0,06)5 A0
En general se tiene

Ak = (1 + 0,06)A(k−1)

Ak es llamada “Ecuación en Diferencias con un Lapso de Tiempo”. Al susti-


tuir A0 se puede obtener el capital de la inversión cuando la composición es
anual.

Para b) y c) se procede como antes, haciendo uso de una ecuación en diferen-


cias.
En d) se tienen dos caminos:
1. Usar cálculo diferencial.
2. Hacer uso de una ecuación diferencial lineal de primer orden.

En este tipo de composición ya no se puede utilizar una ecuación en diferencias.

Observación 14.2.9 Observe que aún cuando se trata de un problema determinı́sti-


co, el capital que se obtiene al concluir el periodo de inversión este cambia con el
tipo de composición que se utilice. Note también que en los tres tipos de composición
la ecuación en diferencias indica que si conocemos el presente se puede conocer el
futuro y que no depende del pasado.

Es imperativo presentar los conceptos básicos necesarios para lograr comprender


el concepto de probabilidad, entre ellos definiremos los siguientes:

Definición 14.2.10 Un experimento es el procedimiento mediante el cual se trata


de verificar una o varias hipótesis relacionadas con un determinado fenómeno.

Definición 14.2.11 Un experimento aleatorio, es aquel que se puede repetir inde-


finidamente, siempre en las mismas condiciones, y antes de realizar el experimento,
se pueden conocer todos los posibles resultados, pero no se tiene certeza de cuál será
el resultado de este cuando se lleva a cabo.

183
Probabilidad, Estadı́stica y sus Aplicaciones

Definición 14.2.12 El Espacio Muestral de un experimento aleatorio, es un con-


junto Ω con la propiedad de que cada resultado fı́sico del experimento corresponde
solamente a un elemento de Ω. Cada uno de estos elementos se llama punto mues-
tral.

El problema fundamental que se presenta en esta parte es el de asignar una medida


de probabilidad a cada uno de los puntos muestrales, a cada evento o suceso, para
esto se tiene la siguiente:

Definición 14.2.13 Un Evento se puede entender como cualquier subconjunto del


espacio muestra Ω, siempre que este conjunto sea finito.
Evento medible es un evento o suceso aleatorio que se le asigna una medida de
probabilidad, y el conjunto de todos los sucesos aleatorios constituye una σ-álgebra
de conjuntos o de eventos, la cual generalmente se le conoce como el espacio de
eventos.

Definición 14.2.14 Una variable aleatoria es una función con valores en los reales
que está definida sobre el espacio muestral Ω.

Definición 14.2.15 Función de probabilidad es una función que asocia a cada pun-
to de su espacio muestral Ω un número real p que denota la probabilidad de que
suceda.

14.3. Enfoques de la Probabilidad


La teorı́a de la probabilidad se ha desarrollado constantemente desde el siglo
XVII y ampliamente aplicada en diversos campos de estudio. A pesar de que el
concepto de probabilidad es una parte tan común y natural de nuestra experiencia,
no existe una única interpretación cientı́fica del término de “ probabilidad”. A través
de los años cada interpretación propuesta para la probabilidad por los expertos ha
sido criticada por otros, motivo por el cual en esta parte se presentan dos enfoques
de la probabilidad, cada uno de éstos puede ser útil en la aplicación de la teorı́a de
la probabilidad.

14.3.1. Enfoque Clásico


Tiene la caracterı́stica esencial, que basa la asignación de medida de ocurren-
cia para un resultado o suceso, sobre los antecedentes que aporta el experimento
realizado, en donde los posibles resultados del mismo son “igualmente probables”,
también conocido como experimento equiprobable, (ver[2]). La probabilidad de que
ocurra el resultado en cuestión es:

nA Número de casos favorables


P (A) = =
n Total de casos
Notemos que en el enfoque clásico (cuando es aplicable) se puede determinar la
probabilidad de un evento o suceso antes de observar los resultados experimentales,
por esta razón frecuentemente se le denomina probabilidad “apriori”.

184
Probabilidad, Estadı́stica y sus Aplicaciones

Dos dificultades básicas aparecen cuando se intenta desarrollar una definición


formal de probabilidad desde el enfoque clásico, las cuales son las siguientes
El concepto de “igualmente probables” es esencia que tienen las mismas pro-
babilidades lo cual depende del enfoque que se aplique.
No proporciona un método sistemático para asignar probabilidades a resulta-
dos que no son igualmente verosı́miles.
Este enfoque solo considera el hecho de que el espacio muestra es finito, pero
si es infinito numerable o infinito y no numerable este ya no proporciona la
medida de probabilidad.

14.3.2. Enfoque Frecuentista


Se determina la probabilidad con base en la proporción de veces que ocurre un
resultado favorable en un determinado número de observaciones o repetición de un
experimento aleatorio. No hay implı́cita ninguna suposición previa de igualdad de
probabilidades. En este caso es necesaria la observación y recopilación de datos para
determinar los valores de probabilidad, (ver [4]).

Para calcular la probabilidad utilizando el enfoque Frecuencial se asocia dire-


ctamente al concepto de frecuencia relativa, el cual es un concepto de la estadı́stica
descriptiva.

nA Número de veces que ocurre A


P (A) = = ,
n Número de veces que se repite 
donde A denota un evento y  denota al experimento aleatorio.

Un inconveniente del enfoque frecuencial de la probabilidad es que solo puede


utilizarse en los problemas en los cuales, al menos hay un número grande de repe-
ticiones similares a cierto proceso. Lo anterior se puede entender que para obtener
la probabilidad con el enfoque frecuentista primero debemos de realizar (bajo las
mismas condiciones) el experimento aleatorio, (ver [3]).

Con lo anterior se puede notar que el enfoque frecuencial y el enfoque clásico


sólo contemplan el caso finito, pero, ¿Qué pasa en el caso infinito numerable y no
numerable?.

Actualmente existen problemas o aplicaciones en matemáticas y en otras áreas


en los cuales el espacio muestral es numerable y no numerable, en estos casos el
enfoque clásico y de frecuencia resultan ser insuficientes para dar solución a di-
chos problemas, por tal motivo es necesario establecer conceptos y resultados que
permitan estudiar este tipo de problemas.

14.4. Desarrollo Axiomático de la Probabilidad


La medida de probabilidad P , está construida con argumentos de Teorı́a de la
Medida los cuales no se contemplan en este trabajo. Retomando las definiciones

185
Probabilidad, Estadı́stica y sus Aplicaciones

previas de experimento aleatorio, espacio muestra, σ-álgebra y evento, (ver [1]), se


establece lo siguiente:

P : F 7−→ [0, 1] es una función que asigna a cada uno de los eventos o sucesos
un valor numérico como medida de probabilidad y satisface los siguientes axiomas:

1. 0 ≤ P (A) ≤ 1.
2. P (Ω) = 1.
3. Si A y B son eventos disjuntos, es decir, A ∩ B = ∅ entonces

P (A ∪ B) = P (A) + P (B).

4. Sea A1 , A2 , · · · , An , · · · , una sucesión de eventos disjuntos dos a dos, es decir,


Ai ∩ Aj = ∅, si i 6= j,, entonces
"∞ # ∞
[ X
P Ak = P (Ak ).
k=1 k=1

Con esta función de probabilidad P se puede obtener la probabilidad de cual-


quier evento o suceso. Además, se pueden establecer algunos resultados básicos a
partir de los axiomas. También se pueden definir algunos conceptos que permitan
resolver otro tipo de problemas.

El concepto de probabilidad condicional, como su nombre lo indica, pretende


determinar la probabilidad de que ocurra el evento A, “Condicionado ” al supuesto
de que ha tenido lugar otro evento B, para poder identificar cuando se debe aplicar
probabilidad condicional deben buscarse las palabras claves “si” y “dado que”.

Definición 14.4.1 Probabilidad Condicional


Sean A y B eventos tales que P (A) 6= 0. La probabilidad condicional de B dado A,
se denota con P (B|A) y se define como sigue
P (A ∩ B)
P (B|A) = ,
P (A)
donde P (A) es la probabilidad de que ocurra el evento A y P (A ∩ B), es la proba-
bilidad de que ocurra tanto el evento A como el B.

Observación 14.4.2 Cuando el evento A no tiene efecto alguno sobre la ocurrencia


o probabilidad del evento B, se tiene que

P (B|A) = P (B)

Un concepto importante en probabilidad es el de “independencia”, el diccionario


Webster define a dos objetos independientes como aquellos que actúan uno sin tener
en cuenta al otro, es decir, dos eventos son independientes si uno puede ocurrir sin
importar qué pase con el otro.

186
Probabilidad, Estadı́stica y sus Aplicaciones

Definición 14.4.3 Eventos independientes


Los eventos A y B son independientes si y solo si

P (A ∩ B) = P (A)P (B).

Otra manera de determinar si dos eventos son independientes en mediante el


concepto de probabilidad condicional, la cual se muestra en el siguiente teorema.
Teorema 14.4.4 Sean A y B dos eventos tales que por lo menos P (A) o P (B)
difieren de cero. A y B son independientes si y solo sı́

P (B|A) = P (B)siP (A) 6= 0,


P (A|B) = P (A)siP (B) 6= 0.

Los siguientes ejemplos muestran los experimentos más comunes que se presentan
en la literatura existente.

Ejemplo 14.4.5 Básicos


1. Lanzamiento de un dado honesto.
2. Lanzamiento de una moneda equilibrada.
3. Lanzamiento de dos dados honestos y distinguibles.
4. Lanzamiento simultaneo de 10 monedas equilibradas distinguibles.
5. ¿Cuál es la Probabilidad de que al seleccionar dos fichas de dominó se puedan
empatar?
6. ¿Cuál es la Probabilidad de que gane el melate?

Con estos sencillos ejemplos y profundizando un poco más en los conceptos de la


probabilidad tales como, partición del espacio muestral, probabilidad condicional de
eventos e independencia de eventos se pueden plantear y resolver problemas como
el siguiente.

Problema 14.4.6 Centro Comercial


Suponga que en una ciudad de tamaño medio compiten dos centros comerciales por
el abasto de productos que requiere la población. Estos centros comerciales son Au-
rrera y Soriana, se sabe que 70 % de clientes los tiene Aurrera y el resto de los
clientes Soriana. Para aumentar su competitividad Soriana contrata a una empresa
de publicidad, quien al final de su estudio le reporta sus resultados obtenidos men-
sualmente:

1. El 80 % de los clientes que compran en Aurrera al mes siguiente siguen com-


prando en Aurrera y el 20 % se cambia a Soriana.
2. El 60 % de los clientes de Soriana al mes siguiente siguen comprando en So-
riana y el 40 % se cambia a Aurrera.
Obtenga lo siguiente:

187
Probabilidad, Estadı́stica y sus Aplicaciones

a) ¿Cómo se reparte el mercado al finalizar el primer mes?

b) ¿Cómo se reparte el mercado al finalizar el segundo mes?


c) ¿Qué pasa a la larga?

Solution 14.4.7 Considere lo siguiente


A0 : Porcentaje de clientes de Aurrera al mes cero.
S0 : Porcentaje de clientes de Soriana al mes cero.

Ω = A, S
que es una partición del espacio muestral. Entonces
A1 = (A0 ∩ A1 ) ∪ (S0 ∩ A0 )
S1 = (A0 ∩ S1 ) ∪ (S0 ∩ S1 )
Luego entonces

P (A1 ) = P (A0 ∩ A1 ) ∪ (S0 ∩ A0 ))


= P (A0 )P (A1 |A0 ) + P (S0 )P (A1 |S0 )

Análogamente para

P (S1 ) = P ((A0 ∩ S1 ) ∪ (S0 ∩ S1 )) = P (A0 )P (S1 |A0 ) + P (S0 )P (S1 |S0 )

Continuando de esta forma se obtiene: A2 , S2 , ....

Se puede notar que para la solución del problema se utiliza el concepto de


partición y probabilidad condicional. Tambión se puede observar que conti-
nuando con este procedimiento un némero finito de pasos las probabilidades
se comportan de manera similar, esto es, las probabilidades para Ak y Sk no
cambian, cuando ocurre esto en la teorı́a de procesos estocásticos se le llaman
probabilidades estacionarias debido a que ya no dependen del tiempo .

Un segundo camino para resolver el problema es usando álgebra lineal, en par-


ticular el empleo de valores y vectores propios, ası́ como también el concepto
de matriz diagonalizable que también se estudia en álgebra lineal.

Como tercera alternativa es utilizando la herramienta de procesos estocásticos


que nos permite obtener la misma solución, aunque el estudio de procesos se
requiere de más conceptos de probabilidad.

Estos son solo algunos ejemplos donde se aplica la probabilidad.

188
Probabilidad, Estadı́stica y sus Aplicaciones

14.5. Comentario
Se hace notar nuevamente que la probabilidad ha logrado involucrarse con áreas
en la solución de sus problemas y aplicaciones. Este trabajo su objetivo primordial
es mostrar a todo lector que gusta de la probabilidad que debe iniciar por saber
contar.

189
Probabilidad, Estadı́stica y sus Aplicaciones

Bibliografı́a

[1] Robert B. Ash, Basic Probability Theory. Dover Publications, Mineola, N.Y,
2008.
[2] Morris H. DeGroot, Probabilidad y estadı́stica. Addison-Wesley Iberoameri-
cana, Estados Unidos, 1988.
[3] Paul M. Meyer, Probabilidad y aplicaciones estadı́sticas. Fondo educativo in-
teramericano, México, 1973.
[4] Susan J. Milton, Probabilidad y estadı́stica con aplicaciones para ingenierı́a
y ciencias computacionales. Mc Graw Hill, Virginia, 2004.
[5] Alexander M. Mood, Introduction to the theory of statistics. McGraw-Hill,
1974.

190
Probabilidad, Estadı́stica y sus Aplicaciones

Capı́tulo 15
Optimalidad de polı́ticas (s, S) para un modelo de inventario vı́a la teorı́a de los
procesos de decisión de Markov

Rubén Blancas-Rivera, Hugo Cruz-Sáurez , Fernando Velasco-Luna y


Francisco Tajonar-Sanabria

Benemérita Universidad Autónoma de Puebla,


Facultad de Ciencias Fı́sico Matemáticas,
Av. San Claudio y 18 Sur, Col. San Manuel,
C.P. 72570, Puebla, Puebla,
[email protected], [email protected],
[email protected], [email protected]
Resumen. En este capı́tulo se propone un modelo de inventarios con demanda
estocástica y con la caracterı́stica de permitir mercancı́a no suplida. Con la finalidad
de analizar y determinar estrategias de producción se emplea la teorı́a de Procesos
de Decisión de Markov. En especı́fico, mediante la metodologı́a de programación
dinámica se logra caracterizar polı́ticas óptimas para el problema de estudio. Pos-
teriormente, usando resultados de análisis convexo se determina la forma funcional
de la polı́tica óptima, la cual, en el contexto de teorı́a de inventarios, se denomina
polı́tica con punto de reorden o politicas (s, S).

Abstract. In this chapter we propose a model of inventories with stochastic


demand and with the characteristic of allowing non-supplied merchandise. In or-
der to analyze and determine production strategies, the theory of Markov Decision
Processes is used. Specifically, through the methodology of dynamic programming
it was able to characterize optimal policies for the studied problem. Subsequently,
using convex analysis results, the functional form of the optimal policy is deter-
mined, which in the context of the theory of inventories, is called the policy with
reorder point or policies (s, S).

Palabras clave: Procesos de Decisión de Markov, Teoria de Inventarios, Progra-


mación Dinámica, Politicas de Reorden, Lindley.

15.1. Introducción
En este trabajo se plantea un sistema de inventarios con demanda estocástica,
el cual es observado de forma discreta en el tiempo y se busca controlar la can-
tidad ordenada o producida de artı́culos solicitados. En especı́fico suponemos que

191
Probabilidad, Estadı́stica y sus Aplicaciones

dicho sistema dinámico es modelado por una caminata aleatoria de tipo Lindley,
la cual recibe este nombre debido a que David Linley la propuso por primera vez
en la década de los 50’s para el estudio de sistemas de lı́neas de espera [12]. Con
la finalidad de generalizar dicho sistema se introduce una nueva variable, la cual
modela la posibilidad de que la mercancı́a solicitada no se encuentre disponible en
el periodo actual de observación. El objetivo es determinar una estrategia de ope-
ración, la cual minimice los costos descontados asociados al sistema de inventarios.
De acuerdo a las caracterı́sticas que presenta el problema de optimización planteado
las componentes del problema se pueden identificar en un modelo de decisión de
Markov. De esta manera la teorı́a de Procesos de Decisión de Markov (PDM) puede
ser aplicada.
Los PDMs son aplicados para modelar sistemas dinámicos cuyos estados son obser-
vados de manera periódica y es aplicado un control. El desarrollo de un PDM, a
través del tiempo está dado de acuerdo al siguiente procedimiento. En cada tiempo
t, t = 0, 1, ..., se elige un control que se aplicará dependiendo del estado del sistema,
entonces como consecuencia del estado actual y de haber aplicado un control se paga
un costo y el sistema se traslada a un nuevo estado en el instante de tiempo t + 1,
mediante una ley de transición. Al ocurrir un estado en t+1, el proceso se repite. De
esta manera se obtiene una sucesión de controles a la cual se le denomina polı́tica.
Con la finalidad de medir la calidad de una polı́tica, el PDM está dotado de una
función real llamada criterio de rendimiento. De este modo, el problema de control
óptimo consiste en encontrar una polı́tica que minimice el criterio de rendimiento,
a tal politica se le llama óptima, y al criterio de rendimiento evaluado en la polı́tica
óptima se le llama función de valor. Una metodologı́a comúnmente empleada para
caracterizar polı́ticas óptimas es programación dinámica.
Mediante la teorı́a de los Procesos de Decisión de Markov demostramos la existencia
de una polı́tica óptima estacionaria markoviana. Después, como resultado principal
de este trabajo se demuestra la optimalidad de una clase polı́ticas conocidas en el
contexto de sistemas de inventarios como (s, S). En general, una polı́tica del tipo
(s, S) consiste en un reordenamiento de hasta S productos si el nivel de almacenaje
se encuentra por debajo de s, en caso contrario no se ordena. En 1959, Scarf [16]
presenta el primer resultado de optimalidad de esta clase de polı́ticas para un mo-
delo de inventarios distinto al que estudiamos en este trabajo. Otras aportaciones
semejantes, se pueden consultar en [4], [10], [16], [17], [18], [19]. En [3], se demuestra
la optimalidad de esta clase de polı́icas para el modelo con demanda no suplida, pe-
ro utilizando espacio de estados compacto. En este trabajo extendemos el resultado
a espacios de estados no necesariamente compacto.
El trabajo está estructurado de la manera siguiente. Primero, presentamos los con-
ceptos preliminares de la teorı́a de los PDMs. En la siguiente sección presentamos
los elementos de un sistema de inventarios el cual se encuentra modelado por un
sistema dinámico llamado modelo con demanda no suplida. En la sección siguiente
se demuestra la existencia de una polı́tica óptima que resuelve el problema de con-
trol para el modelo en estudio. En la Sección 5 demostramos que la polı́tica óptima
resulta ser de la forma (s, S). Finalmente, presentamos nuestras conclusiones.

192
Probabilidad, Estadı́stica y sus Aplicaciones

15.2. Conceptos Preliminares


Un Proceso de Decisión de Markov (PDM) es utilizado para modelar un sis-
tema que es observado de forma discreta en el tiempo bajo incertidumbre en su
movimiento. Un PDM se encuentra caracterizado por las componentes siguientes:

(X, A, {A(x)|x ∈ X}, Q, C). (15.1)

A continuación se describen las componentes del modelo. Los conjuntos X y A son


llamados espacios de estados y acciones (o controles), respectivamente, ambos con-
juntos son subespacios de Borel pertenecientes a espacios polacos (espacios métricos
separables y completos). La siguiente componente es una colección de subconjuntos
no vacı́os {A(x)|x ∈ X} de A, donde A(x) es llamado espacio de controles (o accio-
nes) admisibles en el estado x ∈ X. El conjunto K de parejas de estados-acciones
admisibles, está definido por

K = {(x, a)|x ∈ X, a ∈ A(x)} (15.2)

Ası́ se define Q como un kérnel estocástico o una ley de transición definido en X


dado K. Finalmente C : K → R es una función medible denominada función de
costo en un paso.
La quı́ntupla en (15.1) es conocida como Modelo de Control de Markov (MCM)
estacionario a tiempo discreto. Un MCM estacionario a tiempo discreto es un sis-
tema estocástico controlado que se observa de manera periódica en los tiempos
t = 0, 1, 2, . . .. La dinámica que describe este sistema funciona de la siguiente ma-
nera: Si el sistema se encuentra al tiempo t en el estado xt = x ∈ X, y la acción
at = a ∈ A(x) ⊂ A es aplicada, entonces ocurren dos cosas:
se paga un costo C(x, a),
el sistema se traslada a un nuevo estado xt+1 mediante la ley de transición
Q(·|x, a) sobre X, es decir,

Q(B|x, a) = P r(xt+1 ∈ B|xt = x, at = a),

en donde B ∈ B(X), con B(X) la σ- álgebra de Borel en X y (x, a) ∈ K.


Una vez hecha esta transición a un nuevo estado, se elige una nueva acción y el
proceso anterior se repite.
Polı́ticas de control. Para introducir el concepto de estrategia o polı́tica, con-
sidérese un MCM y al espacio de las historias observadas del proceso hasta el tiempo
t, denotado por Ht , y definido como H0 = X y Ht = K × Ht−1 para cada t = 1, 2, ...
Un elemento de Ht , llamado t- historia, es un vector de la forma

ht = (x0 , a0 , x1 , a1 , . . . , xt−1 , at−1 , xt )

donde (xi , ai ) ∈ K para cada i = 0, ..., t − 1 y xt ∈ X.


Definición 15.2.1 Una polı́tica aleatorizada o simplemente polı́tica, es una suce-
sión π = {πt } de kérneles estocásticos, donde cada πt está definida sobre A dado
Ht y satisface que: πt (A(xt )|ht ) = 1 para cada ht ∈ Ht y t = 0, 1, 2, .... El conjunto
de todas las polı́ticas se denota por Π.

193
Probabilidad, Estadı́stica y sus Aplicaciones

De acuerdo con esta definición, una polı́tica π = {πt } puede interpretarse como una
sucesión {at } de variables aleatorias sobre A, tales que, para cada t−historia y t =
0, 1, 2, ..., la distribución de at es πt (·|ht ), la cual está concentrada en el conjunto de
acciones admisibles A(xt ). En otras palabras, cuando usamos una polı́tica arbitraria,
la acción en cualquier tiempo t es una variable aleatoria y depende de todas las
t−historias.
Definición 15.2.2 Una polı́tica π ∈ Π es Determinista Markoviana, si existe
una sucesión {ft } ⊂ F, donde

F = {f : X → A|f es medible y f (x) ∈ A(x) para cada x ∈ X},

con la caracterı́stica de π(·|ht ) está concentrada ft (xt ) para cada ht ∈ Ht y t =


0, 1, 2, . . ..
Si existe f ∈ F tal que para toda t = 0, 1, 2, . . ., ft = f , entonces a π se le conoce
como polı́tica Determinista Markoviana Estacionaria.
Dados π = {πt } y x0 = x ∈ X por el teorema de Ionescu-Tulcea existe una única
medida de probabilidad Pxπ definida en el espacio canónico (Ω, F), donde Ω := (X ×
A)∞ y F es su correspondiente σ−álgebra producto. Además para cada B ∈ B(X),
C ∈ B(A) y ht ∈ Ht se tiene que:

Pxπ (at ∈ C|ht ) = π(C|ht ),


Pxπ (xt+1 ∈ B|ht , at ) = Q(B|xt , at ).

El proceso estocástico (Ω, F, Pxπ , {xt }) es llamado Proceso de Decisión de Mar-


kov a tiempo discreto.
Criterio de Rendimiento. Cada PDM estará dotado de una función real, llama-
da función objetivo o criterio de rendimiento, la cual medirá en algún sentido la
calidad de cada polı́tica, a través de la sucesión de costos que genera.
Sea un MCM fijo y un conjuntos de polı́ticas Π. Se define el criterio de rendimiento
Costo total α- descontado para π ∈ Π y x ∈ X, de la siguiente forma
"N −1 #
X
vα,N (π, x) := Exπ αt C(xt , at ) , (15.3)
t=0

en donde α ∈ (0, 1) es llamado factor de descuento y N es un entero positivo


conocido, llamado horizonte del problema de optimización.
La función de valor óptimo α−descontado se define como:

Vα∗ (x) := inf vα,N (π, x), ∀x ∈ X.


π∈Π

El problema de control óptimo α−descontado consiste en encontrar una polı́tica


π ∗ ∈ Π tal que

Vα∗ (x) = vα,N (π ∗ , x), ∀x ∈ X.

Observación 15.2.3 Cuando N = ∞, se tiene el criterio de costo total α−descontado


con horizonte infinito y se denota el criterio total α descontado con horizonte infi-
nito como vα .

194
Probabilidad, Estadı́stica y sus Aplicaciones

15.3. Modelo de Inventario


Un inventario es un conjunto de mercancı́as o artı́culos acumulados en un al-
macén en espera de ser vendidos o utilizados mediante un proceso de producción.
En este caso estamos interesados en la modelación del flujo de mercancı́a en el in-
ventario, observándolo como un sistema dinámico. Las componentes a destacar en
un sistema de inventario son las siguientes:
Demanda: Cantidad de bienes o servicios que se ofrecen.
Tiempo de espera: El tiempo que transcurre desde que se hace el pedido hasta
que la empresa recibe el producto.
Tamaño del pedido: Número de artı́culos que conforman el orden del pedido.
Nivel de inventario: Número de artı́culos que se encuentran en el inventario.
Punto de reorden: Nivel de inventario en el que la empresa define en que
momento hacer un nuevo pedido.
El control y mantenimiento de los inventarios con bienes fı́sicos es un problema
común en todas las empresas. El mantenimiento de los inventarios es necesario para
cualquier empresa que se ocupe de productos fı́sicos, incluidos fabricantes, mayoris-
tas y minoristas. Por ejemplo, los fabricantes necesitan inventarios de los materiales
necesarios para fabricar sus productos, ellos administran el inventario de los produc-
tos terminados en espera de envı́o, del mismo modo, ambos mayoristas y minoristas
necesitan mantener los inventarios de los productos para que se encuentren dispo-
nibles a los clientes.
Los costos anuales asociados con el almacenamiento del inventario son muy grandes,
tal vez hasta una cuarta parte del valor del inventario. Por lo tanto, los costos que se
incurren para el almacenamiento de inventario en México se encuentran con los cien-
tos de miles de millones de pesos anualmente. Reducir los costos de almacenamiento
evitando inventarios innecesariamente grandes puede mejorar la competitividad de
cualquier empresa.
Los modelos matemáticos de inventarios se pueden dividir en dos amplias categorı́as:
modelos deterministas y modelos estocásticos, de acuerdo con la predictibilidad de
la demanda involucrada. La demanda de un producto en inventario es la cantidad
de unidades que deberán retirarse del inventario para algún uso durante un periodo
especı́fico. Si la demanda en periodos futuros puede pronosticarse con considerable
precisión, es razonable usar una polı́tica de inventario la cual asuma que todas las
ordenes siempre son exactas. Este es el caso de la demanda conocida donde un mo-
delo determinista serı́a el adecuado. Sin embargo, cuando la demanda no es conocida
es necesario utilizar un modelo de inventario estocástico, para el cual la demanda
en cualquier periodo es una variable aleatoria en lugar de una constante conocida.
En este trabajo estamos interesados en el estudio de modelos estocásticos.

15.3.1. Modelo Matemático


Consideremos las siguietes variables que describen a un sistema de inventarios
con demanda estocástica. En cada etapa t = 0, 1, ..., xt es el nivel en el almacén de
cierto producto, at la producción u orden, ξt+1 la demanda al finalizar el periodo y

195
Probabilidad, Estadı́stica y sus Aplicaciones

ηt es una variable del tipo Bernoulli, la cual modela el arribo de producto ordenado
o producido en el almacén. En este trabajo supondremos que la relación entre las
variables presentadas satisface la siguiente ecuación en diferencias:

xt+1 = (xt + ηt at − ξt+1 )+ . (15.4)

El modelo (15.4) se denomina sistema con demanda no suplida, dicha ecuación se


encuentra motivada por el trabajo hecho por David Lindley [12]. Además, en años
recientes se ha retomado (15.4) para ejemplificar resultados de interés en la teorı́a
de PDMs, ver por ejemplo: [3], [7], [8] y [21].
De acuerdo a este modelo, el espacio de estados del proceso es X = R+ y el espacio
de acciones o controles es A = R+ . Consideremos el espacio de acciones admisibles
como A(x) = A para cada x ∈ R+ . De acuerdo a la notación utilizada en la sección
anterior, el conjunto de parejas estado-acción está dado por K = R+ × R+ .
La ecuación en diferencias dada en (15.4), induce el kérnel estocástico Q o ley de
transición de la siguiente forma.
Para cada B ∈ B(R+ ) se tiene que

Q(B|x, a) = Pxπ (xt+1 ∈ B|xt = x, at = a)


= Pxπ ((x + ηt a − ξt )+ ∈ B).

Q((−∞, y]|x, a) = Pxπ ((x + ηt a − ξt )+ ≤ y)


= Pxπ (x + ηt a − ξt ≤ 0, y ≥ 0)
+ Pxπ (0 ≤ x + ηt a − ξt ≤ y).

Observe que si y < 0, entonces

Q((−∞, y]|x, a) = 0.

En consecuencia, si y ≥ 0

Q((∞, y]|x, a) = Pxπ (x + ηt a − ξt ≤ 0) + Pxπ (0 ≤ x + ηt a − ξt ≤ y)


= pPxπ (x + a ≤ ξt ) + pPxπ (y ≤ ξt ≤ x + a)
+ (1 − p)Pxπ (x ≤ ξt ) + (1 − p)Pxπ (y ≤ ξt ≤ x + a)
= p(1 − Ft (x + a)) + (1 − p)(1 − Ft (x))
+ p(Ft (x + a) − Ft (y)) + (1 − p)(Ft (x) − Ft (y)),

en donde la función Ft representa la función de distribución de probabilidad de la


variable aleatoria ξt .
Suposición 15.3.1 Supongamos lo siguiente:
La sucesión de demandas, {ξt }t∈N son variables aleatorias independientes e
idénticamente distribuidas (v.a.i.i.d.) con función de distribución de probabi-
lidad F y función de densidad continua ∆.
Si ξ representa un elemento génerico de la sucesión {ξt }t∈N , entonces µ :=
E[ξ] < ∞.

196
Probabilidad, Estadı́stica y sus Aplicaciones

La sucesión de variables {ηt }t∈N son independientes e idénticamente distri-


buidas con distribución Bernoulli con parámetro p ∈ (0, 1).
Como se mencionó anteriormente, en cada etapa se generan costos. En este trabajo
consideramos costos de almacenaje, producción y demanda no suplida. Dicho costo
se representa mediante la siguiente función definida sobre K,

C(x, a) = g(a) + H(x, a), (15.5)

en donde la función g : R → R+ , representa los costos de producción y la función


H : K → R+ los costos de almacenaje y demanda no suplida.
En [3] se presenta una propuesta de función de costo, definida de la siguiente manera:

g(a) := K1{a6=0} + ca,

H(x, a) := hE[x + ηa] + lE[(ξ − (x + ηa))+ ],

en donde
K > 0 es el costo fijo por producción, el cual también puede indicar un
impuesto,
c > 0 es el costo por unidad producida,
h > 0 es el costo por unidad almacenada,
l > 0 es el costo por unidad faltante.
Por lo tanto, para el modelo (15.4) se tiene la quı́ntupla (X, A, {A(x)|x ∈ X}, Q, C)
y ası́ podemos emplear resultados importantes de la teorı́a de los PDMs a tiempo
discreto.
En la sección anterior se mencioná el problema de control óptimo y las condiciones
que se requieren para encontrar una polı́tica óptima. Una clase de polı́ticas intere-
santes en el estudio de modelos de inventarios son frecuentemente conocidas como
punto de reorden, polı́tica con cantidad de orden s, o polı́ticas (s, S).
En la práctica ocurre lo siguiente con esta polı́tica: Cuando el inventario tiene un
nivel de productos por debajo de s, se ordena una cantidad de no más de S unidades
para estar por arriba de s.
En la Sección 4 se presenta la demostración de la optimalidad de esta clase de
polóticas. Cabe destacar que en la literatura se pueden encontrar resultados que de-
muestran la optimalidad de polı́ticas (s, S) para otros modelos de inventarios. Estos
resultados tienen sus inicios en el año 1966, con un resultado importante presentado
por Scarf [16]. Después podemos encontrar algunos resultados en [4], [10], [17], [18],
[19], [20].

15.4. Existencia
En esta sección, se demuestra la existencia de una polı́tica markoviana esta-
cionaria para el modelo (15.4) mediante la teorı́a de PDMs. El procedimiento de

197
Probabilidad, Estadı́stica y sus Aplicaciones

programación dinámica permite caracterizar la función de valor óptimo, ası́ como


la polı́tica óptima. Más aún, el procedimiento permite garantizar la existencia de
una polı́tica markoviana estacionaria. Bajo condiciones adecuadas sobre la función
de costo y la ley de transición inducida por la dinámica (15.4), la función de valor
óptimo Vα se caracteriza mediante una ecuación funcional. Más aún el procedimien-
to permite obtener una polı́tica óptima estacionaria.
Dicho lo anterior, definimos las siguientes funciones.
Definición 15.4.1 Las funciones de iteraciones de valores óptimos se definen de
la forma siguiente, para cada x ∈ X y n = 1, 2, . . .,
 Z 
Vn (x) = inf C(x, a) + α Vn−1 (y)Q(dy|x, a) , (15.6)
a∈A(x) X

con V0 (x) = 0.
A continuación demostramos los siguientes resultados sobre el modelo (15.4).
Lema 15.4.2 Sea Q el kérnel estocástico inducido por la dinámica (15.4) entonces
Q es fuertemente continuo, es decir, para cada función u acotada y medible se tiene
que la integral de medida siguiente,
Z
u(y)Q(dy|x, a)
X

es continua y acotada sobre el espacio de acciones A.


Demostración. Sea u ∈ B(X), entonces se define la siguiente función:
Z
w(x, a) := u(y)Q(dy|x, a), ∀(x, a) ∈ K. (15.7)
X

Para probar que el kérnel Q es fuertemente continuo, debemos demostrar que w es


continua en A.
Ahora bien, consideremos x ∈ X fijo y {an } una sucesión definida en A. Supongamos
que la sucesión converge a algún a ∈ A. De esta forma, procedemos a realizar el
siguiente cálculo
Z
lim w(x, an ) = lim u(y)Q(dy|x, an )
n→∞ n→∞ X
= lim E[u(x + an η − ξ)+ ]
n→∞
Z
= p lim u((x + an − s)+ )dF (s)
n→∞ X
Z
+ (1 − p) lim u((x − s)+ )dF (s)
n→∞ X
= p lim u(0)F (x + an )
n→∞
Z x+an
+ p lim u(x + an − s)dF (s)
n→∞ 0
Z
+ (1 − p) u((x − s)+ )dF (s).
X

198
Probabilidad, Estadı́stica y sus Aplicaciones

Utilizando la continuidad de la función de distribución F y que la función u es


acotada, por el Teorema de Convergencia Dominada [1], se tiene que
Z x+a
lim w(x, an ) = pu(0)F (x + a) + p u(x + a − s)dF (s)
n→∞ 0
Z
+ (1 − p) u((x − s)+ )dF (s)
X
= w(x, a).
Por lo tanto, w es una función continua en A y concluimos que el kérnel Q es
fuertemente continuo.
Lema 15.4.3 La función de costo definida en (15.5) es inf-compacta e inferior-
mente semicontinua (l.s.c.) sobre K.
Demostración. Para demostrar que es l.s.c., sólo basta con demostrar que la fun-
ción H(x, a) es una función l.s.c., debido a que
K1{a6=0} (a) + ca,
sı́ lo es, ya que es continua para a > 0 y l.s.c. para a = 0. Desarrollando la función H,
considerando que la variable aleatoria η tiene distribución Bernoulli con parámetro
p, entonces
Z ∞
H(x, a) = hp(x + a) + h(1 − p)x + lp (s − (x + a))dF (s)
x+a
Z ∞
+ l(1 − p) (s − x)dF (s).
x

Sean {xn } y {an } sucesiones convergentes con lı́mite x ∈ X y a ∈ A, respectiva-


mente, entonces
lim H(xn , an ) = lim (hp(xn + an ) + h(1 − p)xn )
n→∞ n→∞
Z ∞
+ lim lp (s − (xn + an ))dF (s)
n→∞ xn +an
Z ∞
+ lim l(1 − p) (s − xn )dF (s).
n→∞ xn

Luego,
lim (hp(xn + an ) + h(1 − p)xn ) = hp lim (x + a) + h(1 − p) lim xn
n→∞ n→∞ n→∞
= hp(x + a) + h(1 − p)x,
y
 Z ∞ Z ∞ 
lim lp (s − (xn + an ))dF (s) + l(1 − p) (s − xn )dF (s)
n→∞ x +a xn
Zn∞ n
= lp lim I[xn +an ,∞) (s − (xn + an ))dF (s)
n→∞ 0
Z ∞
+ l(1 − p) lim I[xn ,∞) (s − xn )dF (s),
n→∞ 0

199
Probabilidad, Estadı́stica y sus Aplicaciones

note que la función I[xn +an ,∞) (s − (xn + an )) ≤ s, y además se satisface la siguiente
propiedad

lim inf[0, xn ] ⊂ lim sup[0, xn ] ⊂ [0, x],

se tiene que I[0,xn ] converge a I[0,x] casi seguramente, análogamente I[0,xn +an ] con-
verge casi seguramente a I[0,x+a] , ası́ por el Teorema de Convergencia Dominada
[1],
 Z ∞ Z ∞ 
lim lp (s − (xn + an ))dF (s) + l(1 − p) (s − xn )dF (s)
n→∞ x +a xn
Z ∞ n n Z ∞
= lp (s − (x + a))dF (s) + l(1 − p) (s − x)dF (s).
x+a x

Por lo tanto, H es continua para a > 0 y l.s.c. para a = 0.


Para probar que la función C es inf-compacta sobre K, primero vamos a demostrar
que la función K1{a6=0} (a)+ca sea inf-compacta sobre A = R+ . En efecto, considere
λ ∈ R y el conjunto de nivel asociado a λ ≥ K
λ − K1{a6=0}
 
Df (λ, A) := {a ≥ 0|K1{a6=0} (a) + ca ≤ λ} = 0, ,
c

el cual es cerrado y acotado en R, por tanto compacto. Si λ < K se tiene que

Df (λ, A) = {0},

un conjunto cerrado y acotado, entonces el conjunto es compacto. Por tanto, los


conjuntos de nivel de la función K1a6=0 (a) + ca son compactos por lo que la función
es inf-compacta, luego se tiene que la función de costo C es inf-compacta sobre K
ya que cada término de la función de costo C es positivo y l.s.c..
Con la función de costo definida en (15.5) se tiene el siguiente resultado para la
función de valor óptimo Vα∗ .

Lema 15.4.4 Vα∗ (x) < ∞ para cada x ∈ X.


Demostración. Consideremos la polı́tica estacionaria de nunca ordenar:

g(x) = 0, ∀x ∈ X.

Luego Vα∗ (x) ≤ vα (g, x), si probamos que vα (g, x) < ∞ para cada x ∈ X, se tiene
el resultado buscado.
Denotemos a xgt al proceso inducido por la dinámica (15.4) utilizando la polı́tica g.
Sea xg0 = x ≥ 0, entonces

xgt+1 = (xgt − ξt+1 )+ .

Consideremos el siguiente proceso de renovación

N (x) := sup{t|St ≤ x}, (15.8)

200
Probabilidad, Estadı́stica y sus Aplicaciones

Pn
donde S0 = 0 y St = j=1 ξj . Observe que E[N (x)] < ∞ para cada x ≥ 0. Luego
"∞ #
X
vα (g, x) = Exg α t
C(xgt , 0)
t=0
= hx + lE[(ξ − x)+ ]
 
N (x)
X
f  t + 
+ Ex α (h(x − St ) + E[(ξt − (x − St )) ]
t=1
 

X
+ Exf  αt E[ξk ]
t=N (x)+1
∞ ∞
" #
X X
≤ hx + lµ + E αt (hx + µ) + αt µ
t=1 t=0
α 1
= hx + lµ + (hx + µ) + µ < ∞.
1−α 1−α
En la última igualdad se utilizá la Suposición 15.3.1. Ası́, Vα∗ es finita.
Con los resultados anteriores se demuestra el siguiente resultado.
Teorema 15.4.5 Existe una polı́tica óptima determinista estacionaria para el pro-
blema de control óptimo con horizonte finito e infinito bajo el modelo (15.4). Además
las funciones de iteración de valor óptimo Vn ↑ Vα∗ .
Demostración. Por los Lemas 15.4.2, 15.4.3, 15.4.4 y por el Teorema de existencia
de una polı́tica óptima determinista estacionaria en [9] se tiene el resultado del
teorema.

15.5. Optimalidad de polı́ticas (s,S)


En esta sección se busca caracterizar a la politica óptima markoviana estacio-
naria garantizada en el Teorema 15.4.5. Para poder lograrlo, es necesario analizar
el comportamiento de las funciones de iteración de valor óptimo (15.6), ya que es
una herramienta útil que proporciona el método de programación dinámica para ir
resolviendo el problema de control óptimo por etapas.
Sea n ∈ N y considerando la función de costo definida en (15.5), se tiene lo siguiente
para cada estado inicial x ≥ 0 y función de iteración Vn .

Vn+1 (x) = inf {K1{a6=0} (a) + ca + hE[x + ηa] + lE[(ξ − (x + ηa))+ ]


a≥0

+ αE[Vn ((x + ηa − ξ)+ )]}


= min{K + Gn (x) + Hn (x), inf {Gn (x + a) + Hn (x)}}
a>0
= min{K + Gn (x), inf Gn (x + a)} + Hn (x).
a>0

donde

Gn (x + a) := (c + hp)(x + a) + αpE[Vn ((x + a − ξ)+ )] + pE[(ξ − (x + a))+ ],

201
Probabilidad, Estadı́stica y sus Aplicaciones

Hn (x) := (h(1 − p) − c)x + α(1 − p)E[Vn ((x − ξ)+ )] + (1 − p)E[(ξ − x)+ ].

Realizando el cambio de variable y := x + a, el problema de optimización se rees-


tructura de la manera siguiente:

Vn+1 (x) = min{K + Gn (x), inf Gn (y)} + Hn (x), x ∈ X. (15.9)


y>x

A continuación presentamos el siguiente resultado sobre cada función Vn .


Lema 15.5.1 Para cada n = 1, 2, . . ., la función Vn cumple:
1. Vn es convexa sobre X,
2. limx→∞ Vn (x) = ∞.
Demostración. Primero, veamos que G0 es convexa. Por (15.5) y dado que V0 = 0
se tiene que
G0 (y) = (c + hp)y + pE[(ξ − y)+ ], y ≥ 0. (15.10)
Luego, (c + hp)y es convexa porque es una función lineal sobre la variable y, y
por Lema 15.5.2 la función E[(ξ − y)+ ] es convexa. Ası́ G0 es convexa, además
G0 (y) → ∞ cuando y → ∞, pues
Z ∞
0 ≤ E[(ξ − y)+ ] = sf (s)ds − y(1 − F (y)) ≤ E[ξI(y,∞) (ξ)],
y

entonces E[(ξ −y)+ ] → 0 cuando y → ∞. Análogamente se observa que H0 satisface


las mismas condiciones que G0 tomando en cuenta la hipótesis que c ≤ h(1 − p).
Ahora procedemos de manera inductiva sobre n, para n = 1,

V1 (x) = min{K + G0 (x), inf G0 (y)} + H0 (x),


y≥x

por el Lema 15.5.2 la función inf y≥x G0 (y) es convexa y la función min es también
convexa. Por otro lado,

lim V1 (x) = lim inf G0 (y) + lim H0 (x),


x→∞ x→∞ y≥x x→∞

para poder obtener el resultado, es necesario demostrar que

lim min{K + G0 (x), inf G0 (y)} = ∞,


x→∞ y≥x

para esto, tenemos que G0 es convexa y G0 (y) → ∞ cuando y → ∞, ası́ existe


y0∗ ≥ x para x ∈ X fijo, tal que

inf G0 (y) = G0 (y0∗ ),


y≥x

y por el cambio de variable tenemos que existe a∗0 ∈ A tal que

inf G0 (x + a) = G0 (x + a∗0 ),
a≥0

202
Probabilidad, Estadı́stica y sus Aplicaciones

de esta forma, cuando x → ∞

inf G0 (x + a) → ∞.
a≥0

Por lo tanto, se tiene lo buscado para V1 .


Supongamos que para n se cumple que Vn es convexa y además

lim Vn (x) = ∞,
x→∞

entonces Gn y Hn son convexas. Por tanto, por el Lema 15.5.2 se tiene que Vn+1 es
convexa. Por otro lado,

lim Gn (y) = lim(G0 (y) + αpE[Vn ((y − ξ)+ )]) = ∞,


x→∞
lim Hn (x) = lim (H0 (x) + α(1 − p)E[Vn ((x − ξ)+ )]) = ∞.
x→∞ x→∞

Lo anterior por la continuidad l.s.c. de la función Vn y por la hipótesis inductiva.


Ası́, existe yn∗ ≥ x tal que
inf Gn (y) = Gn (yn∗ ),
y≥x

luego por el cambio de variable propuesto a y se tiene que existe a∗n ∈ A tal que
inf y≥x Gn (x + a∗n ) = Gn (x + a∗n ). Por tanto,

lim Vn+1 (x) = ∞. (15.11)


x→∞

Se demostró en el Lema 15.5.1 que para cada t = 0, 1, ... la función Gt y Ht son


convexas y además, Gt (y) → ∞ y Ht (y) → ∞ cuando y → ∞.
El siguiente resultado es una herramienta útil para demostrar la optimalidad de las
polı́ticas (s, S), su demostración se puede encontrar en [5].
Lema 15.5.2 Si g : R+ → R es una función convexa y g(y) → ∞ cuando |y| → ∞,
entonces existen escalares s > 0 y s < S con s ≤ S tal que
1. g(S) ≤ g(y) para cada y ≥ 0,
2. g(S) + K = g(s) < g(y) para cada y ≥ 0,
3. g(y) es una función decreciente en (−∞, s),
4. g(y) ≤ g(z) + K para cada y, z con s ≤ y ≤ z.
Por lo tanto, se sigue con la siguiente proposición.
Proposición 15.5.3 Para cada función Gn , donde n = 0, 1, 2, ..., existe sn > 0 y
s < Sn tales que cumplen las siguientes condiciones:
1. Gn (Sn ) ≤ Gn (y) para cada y,
2. Gn (Sn ) + K = Gn (sn ) < Gn (y) para cada y,
3. Gn (y) es una función decreciente en (−∞, sn ),

203
Probabilidad, Estadı́stica y sus Aplicaciones

4. Gn (y) ≤ Gn (z) + K para cada y, z con sn ≤ y ≤ z.


Demostración. Por el Lema 15.5.1, cada función Gn es convexa y además Gn (x) →
∞ cuando x → ∞. Ası́ por el Lema 15.5.2, se tiene la existencia de sn y Sn que
cumplen las concluisiones 1 − 4.
Por las condiciones anteriores dadas en la Proposición 15.5.3 y por el cambio de
variable y = x + a, se tiene que la polı́tica (sn , Sn ) es óptima para el problema con
criterio de costo α-descontado con horizonte de tiempo n. Solo resta demostrar que
la polı́tica óptima para el criterio de costo α-descontado con horizonte infinito es
del tipo (s, S). Primero, considere la función de valor óptimo α-descontado, Vα . Por
el Teorema 15.4.5, se tiene que la función Vα es la única solución de la ecuación de
programación dinámica. Ası́, sustituyendo el costo definido en (15.5) en la ecuación
de programación dinámica se tiene que

Vα∗ (x) = min{K + G(x), inf G(x + a)} + H(x),


x>0

en donde

G(x + a) = (c + hp)(x + a) + pE[(ξ − (x + a))+ ] + αpE[Vα∗ ((x + a − ξ)+ )],

H(y) = (h(1 − p) − c)x + (1 − p)E[(ξ − x)+ ] + α(1 − p)E[Vα∗ ((x − ξ)+ )].

En el siguiente lema se tienen algunas consecuencias de la función Vα∗ .


Lema 15.5.4 La función de valor óptimo α-descontado, Vα∗ es convexa y Vα∗ (x) →
∞ cuando x → ∞.
Demostración. Por el Teorema 15.4.5 , se tiene que las funciones de iteración de
valor óptimo cumplen que Vn ≤ Vα∗ . Ası́

lim Vα∗ (x) = ∞.


x→∞

y por tanto Vn ↑ Vα∗ , ası́ Vα∗ es una función convexa.


Por último se tiene la optimalidad de la polı́tica (s, S) para el problema con horizonte
infinito, la cual se presenta en el siguiente resultado.
Proposición 15.5.5 Existen s > 0 y s < S que cumplen las siguientes condiciones:
1. G(S) ≤ G(y) para cada y,
2. G(S) + K = G(s) < G(y) para cada y,
3. G(y) es una función decreciente en (−∞, s),
4. G(y) ≤ G(z) + K para cada y, zaon s ≤ y ≤ z,
por lo tanto, la polı́tica (s, S) es óptima para el criterio de costo total α-descontado
con horizonte infinito.
Demostración. Por el Lema 15.5.4, la función G satisface las condiciones del Lema
15.5.2 entonces se tienen las conclusiones 1 − 4 de esta proposición. Luego por el
cambio de variable y = x + a y 1 a 4 se tiene que la polı́tica (s, S) es óptima.

204
Probabilidad, Estadı́stica y sus Aplicaciones

15.6. Conclusiones
En este capı́tulo se propone un modelo de inventarios con demanda estocástica
y con la caracterı́stica de permitir mercancia no abastecida al inventario. Para di-
cho sistema se caracterizan polı́ticas óptimas del tipo (s, S), mediante la técnica de
programación dinámica y algunos resultados de funciones convexas. Los resultados
obtenidos permiten la implementación numérica de polı́ticas estructurales al con-
texto de teorı́a de inventarios. Trabajos futuros en esta lı́nea de investigación son
los siguientes:

Aplicar estos nuevos resultados teóricos para optimizar la gestión de un in-


ventario en México.
El modelo presentado de Lindley generalizado, tiene como hipótesis que la
sucesión de variables aleatorias i.i.d., {ηt } tienen distribución Bernoulli con
parámetro p, entonces se busca generalizar la distribución de estas variables
con el fin de seguir garantizando la optimalidad de polı́ticas (s, S).
Estudiar la optimalidad de las polı́ticas (s, S) pero utilizando el criterio de
costo promedio. Existen ya avances al respecto para otros modelos de inven-
tarios [5], pero en la literatura no hemos encontrado estudios para el modelo
con demanda no suplida.

205
Probabilidad, Estadı́stica y sus Aplicaciones

Bibliografı́a

[1] Ash R. B. and Doleans-Dade C.A., Probability and Measure Theory Aca-
demic Press Elsevier, San Diego, 2005.
[2] Chen X. and Simchi-Levi D., Coordinating inventory control and pricing
strategies with random demand and fixed ordering cost: the infinite horizon
case. Operations Research Center,Vol 29, pp. 698-723, 2004.
[3] Daduna H., Knopov P. and Tur L., Optimal Strategies for an Inventory
System with Cost Functions of General Form. Cybernetic and Systems Analysis,
Springer, 1999.
[4] Ehrhardt R., The Power Approximation for Computing (s, S) Inventory Po-
licies. Management Science, pp. 777-786, 1979.
[5] Feinberg E., Optimality Conditions for Inventory Control, arxiv:1606.00957v1,
2016.
[6] Feinberg E. and Lewis M., On the Optimality of (s,S) Policies. ar-
xiv:1507.05125v1, 2015.
[7] Goldberg D., Dmitriy A., Yingdong L., Sharma M. and Squillante
M. Asymptotic Optimality of Constant-Order Policies for Lost Sales Inventory
Models with Large Lead Times. Septiembre 2014. arxiv:1211.4063v2.
[8] Guo X and Zhu Q., Average optimality for Markov decision processes in borel
spaces: a new conditions and approach. Journal of Applied Probability, Vol. 49,
2006.
[9] Hernández-Lerma O. and Lasserre J. B., Discrete-Time Markov Control.
Processes: Basic Optimality Criteria, Springer-Verlag, New York, 1996.
[10] Iglehart D., Optimality of (s,S) Policies in the Infinite Horizon Dynamic In-
ventory Problem. Institute for Operations Research and the Management Scien-
ces. pp. 259-267, 1963.
[11] Johansen G. and Shaler S., Control of Arrivals to a Stochastic Input-
Output System. Advances in Applied Probability, Vol. 12, No. 4, pp. 972-999,
1980.
[12] Lindley D., The Theory of Queues with Single Server, Proc. Cambridge Phi-
los. Soc. 48, pp. 277-289, 1952.

206
Probabilidad, Estadı́stica y sus Aplicaciones

[13] Margono S. and Dwi Y., Determine the Appropriate Inventory Model in
Tang Company. Journal of Business and Management. Vol.4, No. 4, 2015.
[14] Özekici S. y Parlar M., Inventory models with unreliable suppliersin a
random environment. Operations Research, pp.123-136, 1999.
[15] Porteus E., On the Optimality of Generalized (s,S) Policies. Management
Science, 1971.
[16] Scarf H., The Optimality of (S,s) Policies in the Dynamic Inventory Problem.
Applied Mathematics and Statistics Laboratory, Standford University, Califor-
nia, No. 11, 1959.
[17] Schal M., On The Optimality of (s,S)- Policies in Dynamic Inventory Models
with Finite Horizon. Siam J. Appl. Math., Vol. 30, No. 3, 1976.
[18] Suresh P. and Feng C., Optimality of (s,S) Policies in Inventory Models with
Markovian Demand. Operations Research. Vol. 4, No. 6, pp. 931-940, 1995.
[19] Veinott A., On the Optimality of (s,S) Inventory Policies: New Conditions
and New Proof. SIAM J. Appl. Math. No. 14, pp. 1067-1089, 1966.
[20] Veinott A. and Wagner H., Computing Optimal (s,S) policies. Manage-
ment Science. Vol. 11, No. 5, pp. 525-552, 1965.
[21] Zipkin P., Old and New Methods for Lost Sales Inventory Systems Operations
Research. Vol. 56, No. 5, pp. 1256-1263, 2008.

207
Probabilidad, Estadı́stica y sus Aplicaciones

Capı́tulo 16
Reemplazo óptimo de un equipo y algoritmo creciente de inducción hacia atrás.

Rosa M. Flores Hernández, Rocio Ilhuicatzi Roldán y Roberto Rosales Flores

Universidad Autónoma de Tlaxcala,


Facultad de Ciencias Básicas, Ingenierı́a y Tecnologı́a,
Calz. Apizaquito s/n, km. 1.5,
C.P. 90300, Apizaco, Tlaxcala,
[email protected], [email protected]
[email protected]

Resumen. En este trabajo se presentan diversos modelos estocásticos de reem-


plazo, considerados en la teorı́a de procesos de decisión de Markov, con la finalidad
de comparar tales modelos y las formas correspondientes de implementación del
Algoritmo de inducción hacia atrás, para la obtención de las polı́ticas de decisión
óptimas. También, se incluye una versión creciente de tal algoritmo, la cual facilita
la obtención de una polı́tica óptima creciente. La teorı́a se ilustra con un caso par-
ticular de reemplazo.

Abstract. In this paper, different stochastic replacement models are presented,


considered in the theory of Markov decision processes, in order to compare such
models and the corresponding forms of implementation of the Backward Induction
Algorithm, to obtain the optimal decision policies. As well, an increasing version
of such an algorithm is included, which facilitates obtaining an increasing optimal
policy. The theory is illustrated with a particular case of replacement.

Palabras clave: Procesos de decisión de Markov, Modelos de reemplazo, Algo-


ritmo de inducción hacia atrás, polı́ticas óptimas monótonas.

16.1. Introducción
Los modelos de reemplazo de máquinas tienen importancia principalmente den-
tro de los grandes sistemas productivos, en donde detener alguna lı́nea de producción
por causa de algún fallo en las máquinas genera grandes pérdidas monetarias. Por
otro lado, reparar máquinas constantemente también implica grandes costos. El
problema de reemplazo óptimo consiste, por ejemplo, en determinar los momentos
adecuados en que se debe reemplazar una máquina de tal manera que se minimicen

208
Probabilidad, Estadı́stica y sus Aplicaciones

los costos.

En este trabajo se hace una recopilación de algunos modelos de reemplazo mo-


delados con la teorı́a de Procesos de Decisión de Markov (PDMs). Dicha teorı́a
considera procesos estocásticos observados en tiempo discreto, en donde se permite
tomar una decisión o aplicar un control, que interviene en el desarrollo del proceso,
incurriendo en un costo o en una recompensa (véase [2] o [4]). En el caso del pro-
blema de reemplazo óptimo, el proceso que es controlado es el proceso estocástico
de deterioro de una máquina, la cual se supone transita por ciertos niveles de dete-
rioro, pudiendo estar cada vez en un nivel peor. Las decisiones que usualmente se
toman son la de reemplazar o no reemplazar la máquina, dependiendo del nivel de
deterioro en que se encuentre (véase [3], [4] y [5]).

Como podrá verse, algunas de las variantes que presentan estos modelos, son que el
conjunto de niveles de deterioro puede ser finito o infinito numerable, o en lugar de
considerar costos, se pueden considerar recompensas; incluso, en algunos modelos,
se plantea la reparación de la máquina en lugar del reemplazo (véase [1]). Cabe
señalar que un supuesto importante en el modelado del problema de reemplazo, co-
mo un problema de control óptimo dentro de la teorı́a de PDMs, es que el reemplazo
es inmediato.

La intención de presentar diversos modelos de reemplazo, es mostrar las distintas


formas del Algoritmo de Inducción Hacia Atrás (AIHA), que resuelve el problema
de reemplazo óptimo, considerando el costo (o recompensa) total esperado(a) con
horizonte finito, como función objetivo. De la misma manera, se pretende destacar
la monotonicidad de las polı́ticas óptimas como una caracterı́stica de los modelos
de reemplazo, lo cual facilita su obtención, a través de una versión modificada del
AIHA.

Este trabajo, se encuentra estructurado de la siguiente manera: en la Sección 2,


se presentan conceptos básicos de la teorı́a de PDMs. En la Sección 3, se incluyen
tres modelos de reemplazo distintos y se resuelve un caso particular de ellos. En
la Sección 4, se da una condición que garantiza la existencia de polı́ticas óptimas
crecientes y una versión modificada del AIHA, para PDMs con costo total esperado,
horizonte finito y espacios de estados y decisiones finitos; también se ilustra dicha
teorı́a. Finalmente, se consideran las conclusiones y la bibliografı́a utilizada.

16.2. Procesos de decisión de Markov


En esta sección se mencionan algunos conceptos básicos y resultados de la teorı́a
de procesos de decisión de Markov, tomados de [2], necesarios para la comprensión
del capı́tulo.

Un proceso de decisión de Markov (PDM), a tiempo discreto, es un modelo


matemático de un sistema dinámico, sujeto a perturbaciones aleatorias, el cual es
observado periódicamente y se puede influir en su comportamiento a través de la
toma de decisiones.

209
Probabilidad, Estadı́stica y sus Aplicaciones

Un PDM consta de 3 elementos:


1. Un modelo de decisión,
2. un conjunto de polı́ticas y
3. una función objetivo.

16.2.1. Modelo de decisión de Markov


Un modelo de decisión de Markov, estacionario a tiempo discreto, es una quı́ntu-
pla {X, A, {A(x) : x ∈ X}, Q, r)} (véase [2]), que consiste del espacio de estados
del sistema X, el conjunto de decisiones, controles o acciones A, los conjuntos de
decisiones admisibles A(x), cuando el sistema se encuentra en el estado x ∈ X, la
ley de transición Q y la recompensa por etapa r.

En este trabajo, los conjuntos X y A se consideran espacios discretos (finitos o infi-


nitos numerables), con σ− álgebras B(X) y B(A), respectivamente; si el espacio es
finito, la σ− álgebra correspondiente puede ser el conjunto potencia y, si el espacio es
numerable, podrı́a considerarse la σ− álgebra de Borel. Para cada x ∈ X, A(x) ⊂ A
es un conjunto no vacı́o, con la propiedad de que K := {(x, a) : x ∈ X, a ∈ A(x)},
el conjunto de parejas estado-decisión admisible, es un subconjunto de X × A. La
ley de transición Q(B|x, a), B ∈ B(X) y (x, a) ∈ K es un kérnel estocástico en X
dado K, i.e., Q(·|x, a) es una medida de probabilidad en X para cada (x, a) ∈ K fijo
y, Q(B|·, ·) es una función en K, para cada B ∈ B(X) fijo. Finalmente, r : K → R
es una función.

16.2.2. Polı́ticas
Una polı́tica estrategia es una colección de reglas de decisión

π = {f0 , f1 , . . .},

donde cada una de dichas reglas indica qué control aplicar, en cada instante de
tiempo.

Una polı́tica de decisión general π = {f¯0 , f¯1 , . . .} se define como una sucesión de
reglas (medibles, posiblemente aleatorias) para tomar decisiones y, en cada tiempo
t = 0, 1, ..., la decisión f¯t puede depender del estado actual y de todos los estados y
decisiones anteriores (véase [2]), es decir,

f¯t = f¯t (x0 , a0 , x1 , a1 , . . . , at−1 , xt ), t = 0, 1, . . . .

Denotaremos el conjunto de todas las polı́ticas por Π.

Sea F el conjunto de funciones de decisión o selectores, i.e., el conjunto de todas


las funciones f : X → A tal que f (x) ∈ A(x), para toda x ∈ X. Una sucesión
π = {ft } de funciones en F se denomina polı́tica de Markov ; ası́, la decisión tomada
en el tiempo t es at = ft (xt ).

210
Probabilidad, Estadı́stica y sus Aplicaciones

Dado el estado inicial x0 = x y cualquier polı́tica π ∈ Π existe una medida de


probabilidad Pxπ , inducida por la pareja (x, π) en el espacio (X × A)∞ , con F la
σ-álgebra producto en una forma canónica (véase [2]). Se denotará el operador de
esperanza correspondiente por Exπ . El proceso estocástico (Ω, F, Pxπ , {xt }) se deno-
mina proceso de decisión de Markov.

16.2.3. Función objetivo


La función objetivo sirve para medir la calidad de cada una de las polı́ticas.
También se conoce como criterio de funcionamiento o ı́ndice de rendimiento.

Si π ∈ Π y x0 = x ∈ X, la Recompensa total esperada se define como


"N −1 #
X
π
J(π, x) := Ex r(xt , at ) + rN (xN ) , (16.1)
t=0

donde rN : X → R es conocida; rN (xN ) es una variable aleatoria que representa la


recompensa terminal.

16.2.4. Problema de decisión óptimo


Al considerar la función objetivo (16.1), el problema de decisión óptimo consiste
en maximizar la función π → J(π, x) sobre Π, para toda x.

Una polı́tica π ∗ ∈ Π es llamada polı́tica óptima si

J(π ∗ , x) = sup J(π, x), para toda x ∈ X. (16.2)


π∈Π

y, la recompensa máxima:

J ∗ (x) := J(π ∗ , x), x ∈ X

se denomina función de valor.

Observación 16.2.1 En algunos casos, es conveniente considerar una función de


costo por etapa c : K → R, en lugar de una recompensa por etapa r y, un costo
terminal cN : X → R, en lugar de una recompensa terminal rN . Ası́, si la recom-
pensa por etapa r(x, a) y la recompensa terminal rN (XN ) son reemplazadas por una
función de costo c(x, a), (x, a) ∈ K y un costo terminal cN (XN ), respectivamente,
entonces el problema de decisón óptimo consiste en minimizar la función objetivo
resultante, sobre Π, para toda x ∈ X.

Los problemas fundamentales que se presentan, en esta teorı́a, son los siguientes:
existencia, caracterización y aproximación de polı́ticas óptimas.

aproximación y caracterización de la función de valor.

211
Probabilidad, Estadı́stica y sus Aplicaciones

16.2.5. Existencia de una polı́tica óptima


Existen diferentes condiciones para garantizar la existencia de una polı́tica mar-
koviana determinista, que es óptima para el problema de decisión, planteado en la
sección anterior. Por ejemplo, se tiene lo siguiente:
Suposición 16.2.2 (Proposición 4.4.3, [4])

Sea X un conjunto finito o numerable y,


a) A(x) es finito, para cada x ∈ X, o

b) A(x) es compacto, r(x, a) es continua en a, para cada x ∈ X, existe un M < ∞


para el cual |r(x, a)| ≤ M , para toda a ∈ A(x), x ∈ X y Q(y|x, a) es continua
en a, para cada x, y ∈ X, o

c) A(x) es compacto, r(x, a) es semicontinua superior en a (véase [2]), para cada


x ∈ X, existe un M < ∞ para el cual |r(x, a)| ≤ M , para toda a ∈ A(x),
x ∈ X y, para cada x, y ∈ X, Q(y|x, a) es semicontinua inferior en a (véase
[2]).

16.2.6. Obtención de una polı́tica óptima


El Algoritmo de Inducción Hacia Atrás (AIHA), proporciona un método para
resolver problemas de decisión de Markov a tiempo discreto y con horizonte finito.
éste consiste en lo siguiente (véase [4], p. 92):

Sean J0 , J1 , . . . , JN funciones en X definidas (hacia atrás) por

JN (x) := rN (x)

y, para t = N − 1, N − 2, . . . , 0,
 X 
Jt (x) := max r(x, a) + Jt+1 (y)Q(y|x, a) .
a∈A(x)
y∈X

Si para cada t = 0, . . . , N − 1, existe una regla de decisión ft ∈ F tal que para toda
x∈X X
Jt (x) := r(x, ft (x)) + Jt+1 (y)Q(y|x, ft (x)),
y∈X

entonces la polı́tica markoviana determinista π ∗ = {f0 , . . . , fN −1 } es óptima y, la


función de valor J ∗ , es igual a J0 .

16.3. Modelos de Reemplazo


En esta sección se presentan algunos modelos de reemplazo, representativos den-
tro de la teorı́a de procesos de decisión de Markov.

212
Probabilidad, Estadı́stica y sus Aplicaciones

16.3.1. Modelo de reemplazo con espacio de estados finito y


costos por etapa.
El modelo que a continuación se describe es propuesto en [1], p. 8.

Considérese el problema de hacer funcionar eficientemente, sobre N periodos de


tiempo, una máquina que puede estar en cualquiera de n estados, denotados por
1, 2, . . . , n. Sea g(x) el costo de funcionamiento, por periodo, cuando la máquina
está en el estado x y, supóngase que
g(1) ≤ g(2) ≤ . . . ≤ g(n),
lo cual significa que el estado x es mejor que el estado x + 1 y, el estado 1 corres-
ponde a una máquina en la mejor condición.

Durante un periodo de funcionamiento, el estado de la máquina puede empeorar o


puede permanecer sin cambio. Se supone que las probabilidades de transición pxy ,
de pasar al estado y dado que el estado actual es x, satisfacen pxy = 0 si y < x.

Se considera que al inicio de cada periodo se conoce el estado de la máquina y


puede elegirse una de las dos opciones siguientes:
a) Permitir que la máquina funcione un periodo más en el estado en que se
encuentra actualmente.
b) Reparar la máquina hasta llevarla al mejor estado, 1, con un costo R > 0.
Se supone que la máquina, una vez reparada, permanecerá en el estado 1 por un pe-
riodo y, en periodos subsecuentes, puede deteriorarse a los estados y > 1 de acuerdo
a las probabilidades de transición p1y .

Por lo tanto, el objetivo es decidir sobre el nivel de deterioro (estado), en el cual es


conveniente pagar el costo de reparación de la máquina, obteniendo ası́ el beneficio
de menor costo de operación futuro. Obsérvese que la decisión también podrı́a estar
afectada por el periodo en que ésta se encuentre; por ejemplo, se podrı́a estar menos
inclinado en reparar la máquina cuando hay pocos periodos por delante.

De acuerdo con lo descrito anteriormente, el problema de reemplazo puede plan-


tearse como un modelo de decisión de Markov con las siguientes componentes:
Espacio de estados: X = {1, 2, . . . , n}.
A = A(x) = {0, 1}, donde la decisión 0 corresponde a la opción a) y, la decisión
1, corresponde a la opción b), descritas anteriormente.
Ley de transición:

0, y<x
Q(y|x, a = 0) =
pxy , y ≥ x
y, por tener la garantı́a de que una vez reparada la máquina ésta permanecerá
en el estado 1, por al menos un periodo,

1, y = 1
Q(y|x, a = 1) = .
0, en otro caso

213
Probabilidad, Estadı́stica y sus Aplicaciones

Costo por etapa: 


g(x), si a = 0
c(x, a) = .
R + g(1), si a = 1

En este modelo se considera cN (x) = 0.

En este caso, la función objetivo es el costo total esperado:


"N −1 #
X
π
J(π, x) := Ex c(xt , at ) + cN (xN )
t=0

y, el AIHA, correspondiente, es como sigue:

JN (x) = 0,
 n
X 
Jt (x) = min c(x, a) + Jt+1 (y)Q(y|x, a)
a∈{0,1}
y=1
 n
X 
= min g(x) + Jt+1 (y)pxy , R + g(1) + Jt+1 (1) ,
y=x

t = N − 1, N − 2, . . . , 0.

16.3.2. Modelo de reemplazo con espacio de estados nume-


rable y recompensas por etapa.
La siguiente descripción del modelo de reemplazo se tomó de [4], pp. 109 y 248.

La condición de un equipo usado en un proceso de manufactura se deteriora con


el tiempo. El estado x ∈ X = {0, 1, . . .} representa la condición del equipo, en
cada época de decisión; entre mayor es el valor de x, peor es la condición del equi-
po. En cada época de decisión, puede tomarse una de dos decisiones del conjunto
A = A(x) = {0, 1}, para cada x ∈ X: la decisión 0 corresponde a hacer funcionar el
equipo como está por un periodo adicional y, la decisión 1, corresponde a desechar
el equipo y reemplazarlo inmediatamente por una pieza nueva e idéntica. Se supone
que, en cada periodo, el equipo se deteriora por z estados con probabilidad p(z),
independiente del estado al inicio del periodo. Las probabilidades de transición para
este modelo satisfacen:

0, y<x
Q(y|x, a = 0) =
p(y − x), y ≥ x
y,
Q(y|x, a = 1) = p(y), y ≥ 0.
La recompensa consiste de tres partes: un ingreso fijo de K unidades por periodo;
un costo de funcionamiento g(x), dependiente del estado, con g(x) creciente en x y,
un costo de reemplazo de R unidades. Ası́,

K − g(x), a=0
r(x, a) = .
K − R − g(0), a = 1

214
Probabilidad, Estadı́stica y sus Aplicaciones

El valor de desecho del equipo, al final del horizonte de planeación, es rN (x), el cual
se supone decreciente en x.

Para este modelo, la recompensa total esperada es la siguiente:


"N −1 #
X
J(π, x) := Exπ r(xt , at ) + rN (xN )
t=0

y, el AIHA, es como sigue:

JN (x) = rN (x),
 ∞
X 
Jt (x) = max r(x, a) + Jt+1 (y)Q(y|x, a)
a∈{0,1}
y=0
 X∞ ∞
X 
= max K − g(x) + Jt+1 (y)p(y − x), K − R − g(0) + Jt+1 (y)p(y) ,
y=x y=0

t = N − 1, N − 2, . . . , 0.

16.3.3. Modelo de reemplazo con espacio de estados nume-


rable y costos por etapa.
El siguiente modelo aparece en [5], p. 129.

Considérese una máquina que puede estar en cualquiera de los estados {0, 1, . . .} y
supóngase que al comienzo de cada dı́a, el estado de la máquina es observado y se
toma la decisión sobre reemplazarla o no. Si se toma la decisión de reemplazarla,
entonces se supondrá que la máquina es reemplazada instantáneamente por una
máquina nueva cuyo estado es 0.

El costo de reemplazar la máquina es denotado por R > 0 y, además, se supo-


ne que el costo de mantenimiento cada dı́a que la máquina está en el estado x es
g(x).

También, sea pxy la probabilidad de que una máquina en el estado x, al comienzo


de un dı́a, estará en el estado y, al comienzo del dı́a siguiente.

Se sigue que lo anterior es un modelo de decisión de Markov en el cual la deci-


sión 1 es la acción de reemplazar y, la decisión 0, corresponde a la acción de no
reemplazar. Las probabilidades de transición y el costo de una etapa están dados
por:

Q(y|x, a = 1) = p0y , Q(y|x, a = 0) = pxy , x≥0

c(x, 1) = R + g(0), c(x, 0) = g(x), x≥0

Además, se supone que la sucesión de costos

{g(x), x ≥ 0}

215
Probabilidad, Estadı́stica y sus Aplicaciones

es creciente y acotada, lo cual asegura que el costo de mantenimiento es una función


creciente del estado.

Al igual que en el modelo de la Subsección 16.3.1, la función objetivo es el costo


total esperado y, el AIHA es como sigue:

JN (x) = 0,
 ∞
X 
Jt (x) = min c(x, a) + Jt+1 (y)Q(y|x, a)
a∈{0,1}
y=0
 ∞
X 
= min g(x) + Jt+1 (y)pxy , R + C(0) + Jt+1 (0)p0y ,
y=x

t = N − 1, N − 2, . . . , 0.

La aplicación del AIHA es relativamente sencilla en los modelos de reemplazo


con espacio de estados finito, sin embargo, para modelos con espacio de estados
numerable podria ser más complicada, puesto que se pide calcular para cada estado
x ∈ X, en cada iteración t, la función Jt (x); lo que podrı́a disminuir tal esfuerzo
computacional son ciertas caracterı́sticas de las componentes del modelo de decisión
de Markov considerado, como se muestra en el ejemplo siguiente.

16.3.4. Ejemplo
Considérese que en el modelo de la Subsección 16.3.2, la probabilidad p(z), de te-
ner z niveles de deterioro, sigue una distribución geométrica con parámetro p = 0.4,
es decir, p(z) = (0.6)(0.4)z , z = 0, 1, . . .; dicha distribución es una de las principales
distribuciones discretas con soporte numerable, cuya estructura facilita los cálculos
en el AIHA, como podrá observarse a continuación. Además, sean N = 3 periodos,
K = 0, R = 5, g(x) = 2x y rN (x) = max{5 − x, 0}, x = 0, 1, . . ..

No es difı́cil observar que, en este caso, existe una polı́tica óptima, pues el mo-
delo considerado satisface la Hipótesis 16.2.2 a), pues X es un conjunto numerable
y A(x) = A = {0, 1}.

Luego, utilizando el AIHA para hallar la polı́tica óptima, se obtiene lo siguiente:

J3 (x) = max{5 − x, 0},


 ∞
X 
Jt (x) = max r(x, a) + Jt+1 (y)Q(y|x, a)
a∈{0,1}
y∈X
 ∞
X ∞
X 
= max − 2x + 0.6 Jt+1 (y)(0.4)y−x , −5 + 0.6 Jt+1 (y)(0.4)y ,
y=x y=0

para t = 2, 1, 0. Iterando se tiene lo siguiente:

216
Probabilidad, Estadı́stica y sus Aplicaciones

Para t = 2,
 ∞
X ∞
X 
y y
J2 (0) = max 0.6 J3 (y)(0.4) , −5 + 0.6 J3 (y)(0.4)
y=0 y=0

X 4
X
y
= 0.6 J3 (y)(0.4) = 0.6 (5 − y)(0.4)y = 4.34016,
y=0 y=0

con f2 (0) = 0.

 ∞
X ∞
X 
J2 (1) = max − 2 + 0.6 J3 (y)(0.4)y−1 , −5 + 0.6 J3 (y)(0.4)y
y=1 y=0
 4
X 
= max − 2 + 0.6 (5 − y)(0.4)y−1 , −5 + 4.34016
y=1
= max{1.3504, −0.65984} = 1.3504,

con f2 (1) = 0.

 ∞
X ∞
X 
J2 (2) = max − 4 + 0.6 J3 (y)(0.4)y−2 , −5 + 0.6 J3 (y)(0.4)y
y=2 y=0
 4
X 
= max − 4 + 0.6 (5 − y)(0.4)y−2 , −0.65984
y=2
= max{−1.624, −0.65984} = −0.65984,

con f2 (2) = 1.

 ∞
X ∞
X 
y−3 y
J2 (3) = max − 6 + 0.6 J3 (y)(0.4) , −5 + 0.6 J3 (y)(0.4)
y=3 y=0
 4
X 
y−3
= max − 6 + 0.6 (5 − y)(0.4) , −0.65984
y=3
= max{−4.56, −0.65984} = −0.65984,

con f2 (3) = 1.

 ∞
X ∞
X 
J2 (4) = max − 8 + 0.6 J3 (y)(0.4)y−4 , −5 + 0.6 J3 (y)(0.4)y
y=4 y=0
 4
X 
= max − 8 + 0.6 (5 − y)(0.4)y−4 , −0.65984
y=4
= max{−7.4, −0.65984} = −0.65984,

217
Probabilidad, Estadı́stica y sus Aplicaciones

con f2 (4) = 1.

Para x = 5, 6, . . .,
 ∞
X ∞
X 
y−5 y
J2 (x) = max − 2x + 0.6 J3 (y)(0.4) , −5 + 0.6 J3 (y)(0.4)
y=5 y=0
= max{−2x, −0.65984} = −0.65984,

con f2 (x) = 1.

Los resultados obtenidos en esta iteración aparecen resumidos en el Cuadro 16.1.

x J2 (x) f2 (x)
0 4.34016 0
1 1.3504 0
2 -0.65984 1
3 -0.65984 1
4 -0.65984 1
.. .. ..
. . .

Cuadro 16.1: Resultados obtenidos al usar el AIHA, para t = 2.

Para t = 1,
 ∞
X ∞
X 
y y
J1 (0) = max 0.6 J2 (y)(0.4) , −5 + 0.6 J2 (y)(0.4)
y=0 y=0

X
= 0.6 J2 (y)(0.4)y
y=0
 ∞
X 
= 0.6 4.34016 + 1.3504(0.4) − 0.65984 (0.4)y
y=2
= 2.8226176,

con f1 (0) = 0.

 ∞
X ∞
X 
y−1 y
J1 (1) = max − 2 + 0.6 J2 (y)(0.4) , −5 + 0.6 J2 (y)(0.4)
y=1 y=0
  ∞
X  
= max − 2 + 0.6 1.3504 − 0.65984 (0.4)y−1 , −5 + 2.8226176
y=2
= max{−1.453696, −2.1773824} = −1.453696,

con f1 (1) = 0.

218
Probabilidad, Estadı́stica y sus Aplicaciones

Para x = 2, 3, . . .,
 ∞
X ∞
X 
y−x y
J1 (x) = max − 2x + 0.6 J2 (y)(0.4) , −5 + 0.6 J2 (y)(0.4)
y=x y=0
 ∞
X 
= max − 2x + 0.6(−0.65984) (0.4)y−x , −2.1773824
y=x
= max{−2x − 0.65984, −2.1773824} = −2.1773824,

con f1 (x) = 1.

Los resultados obtenidos en esta iteración se muestran en el Cuadro 16.2.

x J1 (x) f1 (x)
0 2.8226176 0
1 -1.453696 0
2 -2.1773824 1
3 -2.1773824 1
.. .. ..
. . .

Cuadro 16.2: Resultados obtenidos al usar el AIHA, para t = 1.

Finalmente, para t = 0,
 ∞
X ∞
X 
y y
J0 (0) = max 0.6 J1 (y)(0.4) , −5 + 0.6 J1 (y)(0.4)
y=0 y=0

X
= 0.6 J1 (y)(0.4)y
y=0
 ∞
X 
y
= 0.6 2.8226176 − 1.453696(0.4) − 2.1773824 (0.4)
y=2
= 0.996302336,

con f1 (0) = 0.

 ∞
X ∞
X 
J0 (1) = max − 2 + 0.6 J1 (y)(0.4)y−1 , −5 + 0.6 J1 (y)(0.4)y
y=1 y=0
  ∞
X  
y−1
= max − 2 + 0.6 − 1.453696 − 2.1773824 (0.4) , −5 + 0.996302336
y=2
= max{−5.0496, −4.003697664} = −4.003697664,

con f0 (1) = 1.

219
Probabilidad, Estadı́stica y sus Aplicaciones

Para x = 2, 3, . . .,
 ∞
X ∞
X 
y−x y
J0 (x) = max − 2x + 0.6 J1 (y)(0.4) , −5 + 0.6 J1 (y)(0.4)
y=x y=0
 ∞
X 
= max − 2x + 0.6(−2.1773824) (0.4)y−x , −4.003697664
y=x
= max{−2x − 2.1773824, −4.003697664} = −4.003697664,

con f0 (x) = 1.

Los resultados obtenidos en esta última iteración se muestran en el Cuadro 16.3.

x J0 (x) f0 (x)
0 0.996302336 0
1 -4.003697664 1
2 -4.003697664 1
.. .. ..
. . .

Cuadro 16.3: Resultados obtenidos al usar el AIHA, para t = 0.

Como podrá observarse en los Cuadros 16.1-16.3, las reglas de decisión ft , para
t = 2, 1, 0, son reglas de decisión óptimas crecientes. Por lo tanto, la polı́tica óptima
π ∗ = {f0 (x), f1 (x), f2 (x)} es creciente en x.

16.4. Polı́ticas óptimas crecientes


A continuación se enuncia una de las condiciones, que aparecen en [4], pp. 107-
108, bajo las cuales existen polı́ticas crecientes que son óptimas. Cabe señalar que
pueden existir otras polı́ticas óptimas que no sean crecientes.

Para ello, considérese que X es finito o numerable, A = A(x), x ∈ X, es finito


y, la definición de q(k|x, a), de la siguiente forma:

X
q(k|x, a) := Q(y|x, a),
y=k

la cual representa la probabilidad de que el estado en la época de decisión t + 1


sea mayor que k − 1, cuando en la época de decisión t, se toma la decisión a, en el
estado x.

Además, una función G : K → R es superaditiva en K si

G(y, b) + G(x, a) ≥ G(y, a) + G(x, b),

siempre que x ≤ y en X y a ≤ b en A, con a, b ∈ A(x) ∩ A(y).

220
Probabilidad, Estadı́stica y sus Aplicaciones

16.4.1. Una condición para obtener reglas de decisión cre-


cientes
La Suposición 16.2.2 y la siguiente condición implican que existen reglas de
decisión óptimas, ft (x), que son crecientes en x, para t = 0, . . . , N .

Condición 16.4.1 ([4], p. 108)


a) r(x, a) es decreciente en x, para toda a ∈ A,
b) q(k|x, a) es creciente en x, para toda k ∈ X y a ∈ A,
c) r(x, a) es una función superaditiva en K,
P∞
d) y=0 Q(y|x, a)u(y) es una función superaditiva en K, para u decreciente, y

e) rN (x) es decreciente en x.

16.4.2. Una versión creciente del Algoritmo de inducción ha-


cia atrás
Enseguida se presenta una versión modificada del AIHA para hallar reglas de
decisión crecientes. Para ello, se supondrá lo siguiente:
para cada t, existe una regla de decisión óptima creciente,
X = {0, 1, . . . , M }, con M finito,
A(x) = A, para toda x ∈ X, y A un conjunto ordenado.

Algoritmo de inducción hacia atrás creciente:


1. Sea t = N y JN (x) = rN (x), para toda x ∈ X.
2. Sustituir t por t − 1, considerar x = 0 y A0 (0) = A.
 
P
a) Sea Jt (x) = max r(x, a) + J
y∈X t+1 (y)Q(y|x, a) .
a∈A0 (x)
 

P
b) Sea At (x) = argmax r(x, a) + y∈X Jt+1 (y)Q(y|x, a) .
a∈A0 (x)

c) Si x = M , ir al Paso 3, en otro caso, hacer

A0 (x + 1) = {a ∈ A : a ≥ max{a0 ∈ A∗t (x)}}.

d ) Sustituir x por x + 1 y regresar a 2a).


3. Si t = 0, parar, en otro caso, regresar al Paso 2.
A continuación, se presenta un ejemplo cuyo espacio de estados es numerable
(no es finito), pero su espacio de decisiones sı́ lo es; ello provoca que el algoritmo,
presentado anteriormente, después de cierto número de iteraciones, se detenga. Ésto,
abre la posibilidad de extender, en un futuro, dicho algoritmo.

221
Probabilidad, Estadı́stica y sus Aplicaciones

16.4.3. Un ejemplo
Finalmente, se mostrará que para el modelo del ejemplo de la Subsección 16.3.4,
existe una polı́tica óptima creciente y se obtendrá ésta usando el algoritmo creciente
de inducción hacia atrás.

No es difı́cil verificar que dicho modelo satisface la Condición 16.4.1, pues:

1. 
−2x, a=0
r(x, a) =
−5, a=1
es una función decreciente en x, para toda a ∈ {0, 1} y es una función super-
aditiva en K.
P∞ P∞
2. q(k|x, 0) = y=k 0.6(0.4)y−x y q(k|x, 1) = y=k 0.6(0.4)y son funciones cre-
cientes en x, para toda k ∈ X y a ∈ A.
P∞ y−x
P∞
3. y=0 0.6(0.4) u(y) y y=0 0.6(0.4)y u(y) son funciones superaditivas en K,
para cualquier función u decreciente.
4. rN (x) = max{5 − x, 0}, x = 0, 1, . . . es una función decreciente en x.

Por lo tanto, se puede concluir que existe una polı́tica óptima que es creciente.

Por otro lado, una ilustración de la versión creciente del AIHA, para este ejem-
plo, considerando los resultados obtenidos en la Subsección 16.3.4, es la siguiente:

Cuando t = 2 y x = 0, J2 (0) se calcula considerando A0 (0) = A = {0, 1}. Co-


mo f2 (0) = 0, entonces A∗2 (0) = {0} y, por lo tanto, A0 (1) = {0, 1}.

Luego, cuando x = 1, J2 (1) se calcula considerando A0 (1). Como f2 (1) = 0, en-


tonces A∗2 (1) = {0} y, por lo tanto, A0 (2) = {0, 1}.

Ahora, cuando x = 2, J2 (2) se calcula considerando A0 (2). Como f2 (2) = 1, en-


tonces A∗2 (2) = {1} y, por lo tanto, A0 (3) = {1}.

Lo anterior implica que A0 (4) = A0 (5) = . . . = {1} y, de ahı́ que la regla de decisión
óptima ft (x) = 1, para x = 2, 3, . . .. Obsérvese la reducción de cálculos que se tiene.

Observación 16.4.2 [4] p. 112.


Cualquier regla de decisión que seleccione acciones de A∗t (x), en el estado x,
en la época de decisión t, es creciente y óptima.
Este algoritmo difiere del AIHA en que la maximización se lleva a cabo sobre
los conjuntos A0 (x), donde se descartan decisiones cuando se incrementa x.
En el peor caso, A0 (x) = A, para toda x, y el esfuerzo computacional es igual
al de inducción hacia atrás; sin embargo, cuando una regla de decisión es
estrictamente creciente, los conjuntos A0 (x) disminuirán en tamaño, con el
aumento de x y de aquı́ se reduce el número de decisiones que necesitan ser
evaluadas en el Paso 2.

222
Probabilidad, Estadı́stica y sus Aplicaciones

Si en algún estado x0 , A0 (x0 ) sólo contiene un elemento, por decir a∗ , entonces


no es necesario alguna maximización dado que esa acción será óptima para
todo x ≥ x0 y
X
Jt (x) = r(x, a∗ ) + Jt+1 (y)Q(y|x, a∗ ), para toda x ≥ x0 .
y∈X

16.5. Conclusiones
La monotonicidad de las polı́ticas óptimas en los modelos de reemplazo, con espacios
finitos, simplifica el algoritmo de inducción hacia atrás y puede facilitar la obtención
de polı́ticas óptimas incluso en modelos con espacio de estados numerable, como se
pudo observar en el ejemplo mostrado en la SubsecciÃ3 n16.4.3.P araello, seránecesarioreestructurarlaversiónc

223
Probabilidad, Estadı́stica y sus Aplicaciones

Bibliografı́a

[1] Bertsekas D.P. Dynamic Programming and Optimal Control, Volume I. At-
hena Scientific, Third Edition, USA, 2005.
[2] Hernández-Lerma O. y Lasserre J.B. Discrete-Time Markov Control Pro-
cesses. Springer-Verlag, New York, 1996.
[3] Heyman D.P. y Sobel M.J. Stochastic Models in Operations Research, Vol.
II. Stochastic Optimization. McGraw-Hill, USA, 1984.
[4] Puterman M.L. Markov Decision Processes: Discrete Stochastic Dynamic Pro-
gramming. John Wiley & Sons, Inc., New Jersey, 2005.
[5] Ross S.M. Applied Probability Models with Optimization Applications. Dover
Publications, Inc., New York, 1970.

224
Probabilidad, Estadı́stica y sus Aplicaciones

Capı́tulo 17
Juegos Estocásticos y criterios de rendimiento

Ciria Briones Garcı́a, Vı́ctor Vázquez Guevara y


Dionicio Zacarı́as Flores

Benemérita Universidad Autónoma de Puebla,


Facultad de Ciencias Fı́sico Matemáticas,
Av. San Claudio y 18 Sur, Col. San Manuel,
C.P. 72570, Puebla, Puebla,
[email protected], [email protected],
[email protected]

Resumen. Se presentan de manera concisa los aspectos de la Teorı́a de Juegos


Estocásticos para el caso en que dos jugadores toman decisiones sucesivas cuyos
efectos son observados en el estado de algún sistema asociado con el juego, donde
cada jugador busca maximizar algún criterio de recompensa. Para esto, se discutirán
conceptos como: “el valor del juego”, “equilibrio de Nash”, “juegos de suma cero”,
entre otros. Finalmente, se plantea la inquietud de aplicar la teorı́a analizada.

Abstract.In a concise manner, topics on Stochastic Game Theory in the case in


which two players take successive decisions whose effects are observed in the state
of some associated system with the game, where each player tries to maximize so-
me reward criteria. For this, some concepts will be discussed: “value of the game”,
“Nash equilibrium”, among others. Finally, the restlessness for applying the theory
analyzed is presented.

Palabras clave: juegos estocásticos, valor del juego, equilibrio de Nash, criterio
de rendimiento.

17.1. Introducción
La Teorı́a de juegos se inicia formalmente en 1944 con la publicación del libro The
theory of games and economic behavior de John Von Neumann y Oskar Morgenstern,
quienes estudiaron dos planteamientos: primero el comportamiento no cooperativo y
segundo el cooperativo. John Forbes Nash escribió una tesis, dirijida por Albert W.
Tucker, donde expuso por primera vez una solución para juegos no cooperativos, a
la que llamó equilibrio de Nash, como consecuencia consguió un gran reconocimiento
entre los especialistas del área. Una situación en la que ninguno de los jugadores
siente la necesidad de cambiar de estrategia porque cualquier cambio implicarı́a una
disminución de las ganancias es un equilibrio de Nash.

225
Probabilidad, Estadı́stica y sus Aplicaciones

El concepto de juego estocástico fue introducido por Shapley en 1953. Los juegos
estocásticos, son juegos dinámicos a diferencia de los juegos en forma normal; pueden
ser vistos como una generalización de los procesos de decisión de Markov, en los que
se permite que varios agentes tomen decisiones persiguiendo objetivos diferentes.
En 1997, Filar y Vrieze publicaron el libro Competitive Markov decision processes
cuyo tópico son los juegos estocásticos y los procesos de decisión de Markov.

17.2. Preliminares
En esta sección se presentan las definiciones básicas y notación necesarias para
exponer el modelo del juego. De aquı́ en adelante se considerarán juegos con solo
dos jugadores, cuando se tienen N > 2 jugadores el planteamiento se realiza de
forma análoga.
Llamaremos espacio de Borel a un subconjunto de Borel X de un espacio métrico
completo y separable. Su σ-álgebra de Borel se denotada por B(X). Solo trabaja-
remos con espacios de Borel, en este trabajo medible indicará “Borel medible”.
Dado un espacio de Borel X, denotamos por P(X) a la familia de medidas de
probabilidad en X, dotada de la topologı́a débil σ(P(X), Cb (X)), donde Cb repre-
senta el espacio de funciones acotadas continuas en X. Hay que notar que P(X) es
un espacio de Borel, además si X es compacto P(X) también lo es.
Definición 17.2.1 Sean X y Y espacios de Borel, un kernel estocástico en X dado
Y , o también conocida como probabilidad de transición de Y a X, es una función
medible ν(·|·) tal que
ν(·|y) es una medida de probabilidad sobre X para cada y ∈ Y , y
ν(D|·) es una función medible sobre Y para cada D ∈ B(X).

El conjunto de todos los kérneles estocásticos sobre X dado Y es denotado por


P(X|Y ). Si ν esta en P(X|Y ), entonces escribimos sus valores como ν(B|y) para
todo y ∈ Y y B ∈ B(X). Finalmente, si X = Y entonces ν se llama probabilidad
de transición de Markov en X.

17.2.1. Modelo del juego estocástico


Se considerará el modelo del juego estocástico de suma no cero de dos personas

GM := (X, A, B, KA , KB , Q, r1 , r2 ), (17.1)

en donde
X es el espacio de estados, que supondremos de Borel,
A y B son los espacios de acciones para los jugadores 1 y 2, respectivamente,
ambos de Borel,
KA ∈ B(X × A) y KB ∈ B(X × B) son los cojuntos de restricciones. Para
cada x ∈ X definimos la x-sección no vacı́a de A como el siguiente conjunto

A(x) = {a ∈ A : (x, a) ∈ KA },

226
Probabilidad, Estadı́stica y sus Aplicaciones

que representa el conjunto de todas las aciones admisibles para el jugador 1


en el estado x. Análogamente, la x-sección no vacı́a de B, B(x), denota el
conjunto de todas las acciones admisibles para el jugador 2 en el estado x.
Ası́, podemos definir

K := {(x, a, b) : x ∈ X, a ∈ A(x), b ∈ B(x)}.

Q ∈ P(X|K) es un kernel estocástico, llamado la ley de transición. Si x es


el estado en alguna etapa del juego y los jugadores seleccionan las acciones
a ∈ A(x) y b ∈ B(x), entonces Q(·|x, a, b) es la distribución de probabilidad
del siguiente estado del juego,
ri : K → R es una función medible que representa la función de recompensa
para el jugador i = 1, 2.
En cada etapa t = 0, 1, . . ., los jugadores 1 y 2 observan el estado actual x ∈ X
del sistema, y eligen de manera independiente las acciones a ∈ A(x) y b ∈ B(x),
respectivamente. Como consecuencia, sucede que:
(1) el jugador i recibe una recompensa inmediata ri (x, a, b), i = 1, 2, y

(2) el sistema se mueve a un nuevo estado con distribución Q(·|x, a, b)


El objetivo de cada jugador es maximizar algún criterio de rendimiento.
Cuando el juego es de suma cero, en (17.1) consideramos a ri (·) = r(·) (i = 1, 2)
tal que r1 (·) = −r2 (·).

17.3. Estrategias
Sean H0 := X y Ht := K × Ht−1 para t = 1, 2, . . . Para cada t, un elemento

ht = (x0 , a0 , b0 , . . . , xt−1 , at−1 , bt−1 , xt )

de Ht representa una historia del juego hasta el tiempo t. Una estrategia aleatoria
π 1 para el jugador 1 es una sucesión π 1 = {πt1 , t = 0, 1, . . .} de kérneles estocásticos
πt1 en P(A|Ht ) tal que

πt1 (A(xt )|ht ) = 1 ∀ht ∈ Ht , t = 0, 1, . . . (17.2)

Denotamos por Π1 la familia de todas las estrategias para el jugador 1.


Definimos PA (x) := P(A(x)) para cada estado x ∈ X, y Φ1 como la clase de
todas las probabilidades de transición φ ∈ P(A|X) tal que φ(·|x) esta en PA (x) para
todo x ∈ X, es decir, Φ1 = {φ ∈ P(A|X) : φ(·|x) ∈ PA (x), ∀x ∈ X}.
Los conjuntos Π2 y Φ2 para el jugador 2 se definen de forma similar, escribiendo
B(x) en lugar de A(x) y PB (x) := P(B(x)).
Una estrategia π = {πt } se llama de Markov aleatorizada si πt ∈ P(A|X) para
cada t = 0, 1, . . ., esto es, cada πt depende solamente del estado actual xt del sistema.
El conjunto de todas las estrategias de Markov del jugador 1 será denotado por Π1M .
Una estrategia de Markov aleatorizada π = {πt } es estacionaria si existe f ∈ Φ1 tal
que πt = f para cada t = 0, 1, . . . En este caso la estrategia π se identificará con f .

227
Probabilidad, Estadı́stica y sus Aplicaciones

Denotamos por Π1S al conjunto de todas las estrategias markovianas aleatorizadas


estacionarias del jugador 1. Tenemos,
Π1S ⊂ Π1M ⊂ Π1 .
Los conjuntos Π2M , Π2S de todas las estrategias de Markov y todas las estrate-
gias estacionarias, respectivamente, para el jugador 2 se definen de manera similar.
Sea (Ω, F) el espacio canónico medible que consiste del espacio muestral Ω :=
(X × A × B)∞ y su σ-álgebra producto. Entonces para cada par de estrategias
(π 1 ,π 2 ) ∈ Π1 × Π2 y cada estado inicial x ∈ X, por el Teorema de C. Ionescu-
1 2
Tulcea, existe una única medida de probabilidad Pxπ π y un proceso estocástico
{(xt , at , bt ), t = 0, 1, . . .} definido en (Ω, F) de manera canónica, donde xt , at y bt
representan el estado y los acciones de los jugadores 1 y 2, respectivamente, en cada
1 2
etapa t = 0, 1, . . . El operador de esperanza con respecto a Pxπ π se denota por
1 2
Exπ π .
Es importante recordar que los jugadores toman decisiones de manera indepen-
diente , es decir, que para cualquier par de estrategias π i ∈ Πi (i = 1, 2) y cualquier
estado inicial x ∈ X, los procesos {at } y {bt } son condicionalmente independientes,
esto quiere decir que
1
,π 2
Pxπ (at ∈ C, bt ∈ D|ht ) = πt1 (C|ht )πt2 (D|ht )
para todo C ∈ B(A), D ∈ B(B), ht ∈ Ht y t = 0, 1, . . .

17.3.1. Criterios de rendimiento


Para cada n = 1, 2, . . ., y cada historia h∞ := (x0 , a0 , b0 , x1 , a1 , b1 , . . .), sea
n−1
X
Jni,0 (h∞ ) := ri (xt , at , bt ) (17.3)
t=0

es la trayectoria de la muestra de n etapas cuando el jugador i(i = 1, 2) usa la


estrategia π i ∈ Πi , dado el estado inicial x0 = x. La ganancia esperada en la n-
ésima etapa es "n−1 #
π 1 ,π 2
X
i 1 2
Jn (x, π , π ) := Ex ri (xt , at , bt ) . (17.4)
t=0
A continuación definimos la ganancia media del camino de la muestra a largo
plazo (SPAP)
J i,0 (h∞ )
J i,0 (h∞ ) := liminf n , (17.5)
n→∞ n
y similarmente, la rentabilidad media esperada a largo plazo (EAP)
Jni (x, π 1 , π 2 )
J i (x, π 1 , π 2 ) := liminf . (17.6)
n→∞ n
Para introducir los criterios de optimalidad que nos interesan utilizamos los
siguientes conceptos. Las funciones en X definidas como
L(x) := sup inf J i (x, π 1 , π 2 ),
π 1 ∈Π1 π 2 ∈Π2
(17.7)
U (x) := 2inf sup J i (x, π 1 , π 2 ),
π ∈Π2 π 1 ∈Π1

228
Probabilidad, Estadı́stica y sus Aplicaciones

se denominan el valor inferior y el valor superior (respectivamente). Es claro que


L(·) ≤ U (·) en general, pero si se sostiene la igualdad para todo x ∈ X, entonces la
función común se llama el valor del juego V (·).

17.4. Juegos de suma cero


Para iniciar con esta sección usaremos la ecuación (17.1) con ri (·) = r(·) (i =
1, 2), ası́ las ecuaciones (17.3), (17.4), (17.5) y (17.6) podemos reescribirlas como
Jn0 , Jn , J 0 y J, respectivamente.
Definición 17.4.1 Supongamos que el juego tiene un valor V (·). Entonces una
estrategia π 1∗ en Π1 es EAP óptima para el jugador 1 si

inf J(x, π 1∗ , π 2 ) = V (x) ∀x ∈ X. (17.8)


π 2 ∈Π2

Similarmente, π 2∗ ∈ Π2 es EAP óptima para el jugador 2 si

sup J(x, π 1 , π 2∗ ) = V (x) ∀x ∈ X. (17.9)


π 1 ∈Π1

Cuando se cumplen ambas igualdades, decimos que (π 1∗ , π 2∗ ) es un par EAP óptimo.

Para el caso SPAP introducimos la siguiente definición.


Definición 17.4.2 Supongamos que el juego tiene un valor V (·). Entonces un par
de estrategias (π 1∗ , π 2∗ ) ∈ Π1 × Π2 es SPAP óptimo es si satisface que para todo
x ∈ X y π i ∈ Πi (i = 1, 2),
1∗
,π 2∗
J 0 (h∞ ) = V (x), Pxπ c.s., (17.10)
1∗ 2∗
J 0 (h∞ ) ≥ V (x), Pxπ ,π
c.s., (17.11)
1∗
0 ,π 2∗
J (h∞ ) ≤ V (x), Pxπ c.s. (17.12)

Y para el criterio de par canónico utilizamos la siguiente notación. Para cualquier


función dada f : K → R y medidas de probabilidad ϕ ∈ PA (x) y ψ ∈ PB (x),
escribimos Z Z
f (x, ϕ, ψ) := f (x, a, b)ψ(db)ϕ(da), (17.13)
A(x) B(x)

siempre que las integrales esten bien definidas. En particular, para r y Q como en
la sección 2, Z Z
r(x, ϕ, ψ) := r(x, a, b)ψ(db)ϕ(da) (17.14)
A(x) B(x)
y Z Z
Q(·|x, ϕ, ψ) := Q(·|x, a, b)ψ(db)ϕ(da)
A(x) B(x)

229
Probabilidad, Estadı́stica y sus Aplicaciones

Definición 17.4.3 Una cuatro-tupla (ξ∗ , u∗ , ϕ∗ , ψ∗ ) que consiste en una constante


ξ∗ ∈ R, una función medible u∗ : X → R y un par (ϕ∗ , ψ∗ ) ∈ Φ1 × Φ2 de estrategias
estacionarias es una cuatro-tupla canónica si se cumple que , para todo x ∈ X

Z
ξ∗ + u∗ (x) = r(x, ϕ∗ (x), ψ∗ (x)) +u∗ (y)Q(dy|x, ϕ∗ (x), ψ∗ (x)) (17.15)
X
Z
= max [r(x, ϕ, ψ∗ (x)) + u∗ (y)Q(dy|x, ϕ, ψ∗ (x))] (17.16)
ϕ∈PA (x)
ZX
= min [r(x, ϕ∗ (x), ψ) + u∗ (y)Q(dy|x, ϕ∗ (x), ψ)] (17.17)
ψ∈PB (x) X

Se dice que (ϕ∗ , ψ∗ ) es un par canónico de estrategias estacionarias.


Denotamos por (Φ1 × Φ2 )ca la familia de pares canónicos, por (Φ1 × Φ2 )eap la
familia de pares EAP óptimos y por (Φ1 × Φ2 )spap a la familia de pares SPAP
óptimos de estrategias estacionarias.

17.4.1. Suposiciones
Las siguientes suposiciones son necesarias para los teoremas que se mencionan
más adelante.
Suposición 17.4.4 a) Para cada estado x ∈ X, los conjuntos (no vacı́os) A(x)
y B(x) de acciones admisibles son compactos.
b) Para cada (x, a, b) en K, r(x, ·, b) es semicontinua superior (u.s.c.) en A(x) y
r(x, a, ·) es semicontinua inferior (l.s.c.) en B(x).
c) Para cada (x, a, b) en K y cada función medible acotada v definida en X, las
funciones Z Z
v(y)Q(dy|x, ·, b) y v(y)Q(dy|x, a, ·)
X X

son continuas en A(x) y B(x), respectivamente.


d) Existe una constante r̄ y una función medible w(·) ≥ 1 definida en X tal que

|r(x, a, b)| ≤ r̄w(x) ∀(x, a, b) ∈ K, (17.18)

y, además, la parte c) se cumple cuando v se reemplaza con w.

Suposición 17.4.5 Existe una medida de probabilidad ν ∈ P(X), un número po-


sitivo α < 1, y una función medible β : K → [0, 1] que cumplen lo siguiente, para
todo (x, a, b) en K y D en B(X):
a) Q(D|x, a, b) ≥ β(x, a, b)ν(D).
R
b) X w(y)Q(dy|x, a, b) ≤ αw(x) + β(x,R a, b)||ν||w , donde w(·) ≥ 1 es la función
de la Supoción 2.1 d) y ||ν||w := wdν.
Z
c) inf β(x, ϕ(x)ψ(x))ν(dx) > 0.
(ϕ,ψ)∈Φ1 ×Φ2 X

230
Probabilidad, Estadı́stica y sus Aplicaciones

Suposición 17.4.6 Existe una medida σ- finita λ definida en X con respecto a


la cual, para cada par (ϕ, ψ) en Φ1 × Φ2 , la probabilidad de transición de Markov
Q(·|x, ϕ(x), ψ(x)) es λ-irreducible.

Definición 17.4.7 Bw (X) denota el espacio lineal de las funciones medibles reales
u definidas en X con una norma w finita que se define como

|u(x)|
||u||w := sup , (17.19)
x∈X w(x)

y Mw (X) representa el espacio lineal normado de las medidas finitas con signo µ
en X tales que Z
||µ||w := wd|µ| < ∞, (17.20)
X

donde |µ| := µ+ + µ− denota la variación total de µ.

Si las suposiciones 2.1, 2.2 y 2.3 se satisfacen, entonces el juego de recompensa


promedio (esperado) tiene un valor constante, digamos V (x) = V ∗ para todo x ∈ X,
y existe un par óptimo EAP de estrategias estacionarias.
Ver demostración en [7].

Suposición 17.4.8 Existe una medida σ-finita γ sobre X y una función de densi-
dad estrictamente positiva g(a, b, ·) tal que
Z
Q(D|x, a, b) = g(x, a, b, y)γ(dy)
D

para todo D ∈ B(X) y (x, a, b) ∈ K.x,

Teorema 17.4.9 Si las suposiciones 17.4.4, 17.4.5 y 17.4.8 se satisfacen, entonces


se tiene que
(Φ1 × Φ2 )ca = (Φ1 × Φ2 )eap . (17.21)
De hecho, existe una cuatro-tupla canónica (ξ∗ , u∗ , ϕ∗ , ψ∗ ) con u∗ en Bw (X) y (por
la Proposición 2.1) ξ∗ = V ∗ .

Ver demostración en [4].

Sea Fn la σ-álgebra generada por (xt , at , bt ) para t = 0, . . . , n, esto es

Fn := σ{x0 , a0 , b0 , . . . , xn , an , bn }. (17.22)

Además, sea Jn0 como en la ecuación (17.3) y ξ∗ , u∗ como en el Teorema 2.1, y


luego defina el proceso estocástico

Mn (h∞ ) := Jn0 (h∞ ) + u∗ (xn ) − nξ∗ , (17.23)

para n = 1, 2, . . ., con M0 (h∞ ) = u∗ (x0 ). Finalmente, sea ∆ : K → R la llamada


función de discrepancia dada por
Z
∆(x, a, b) := r(x, a, b) + u∗ (y)Q(dy|x, a, b) − u∗ (x) − ξ∗ . (17.24)
X

231
Probabilidad, Estadı́stica y sus Aplicaciones

Teorema 17.4.10 Bajo las hipótesis del Teorema 17.4.9, las siguientes expresiones
son equivalentes:
a) El par (ϕ∗ , ψ∗ ) ∈ Φ1 × Φ2 es EAP óptimo.
b) Para cada x ∈ X
∆(x, ϕ∗ (x), ψ∗ (x)) = max ∆(x, ϕ, ψ∗ (x))
ϕ∈PA (x)
(17.25)
= min ∆(x, ϕ∗ (x), ψ)) = 0.
ψ∈PB (x)

c) Para cada x ∈ X, π 1 ∈ Π1 , y π 2 ∈ Π2
c1) {Mn (h∞ ), Fn } es Pxϕ∗ ,ψ∗ -martingala,
2
c2) {Mn (h∞ ), Fn } es Pxϕ∗ ,π -submartingala,
1
c3) {Mn (h∞ ), Fn } es Pxπ ,ψ∗
-supermartingala.

Ver demostración en [4].

Teorema 17.4.11 Supongamos que las hipótesis del Teorema 17.4.9 se satisfacen
y, además, existe una constante r̂ ≥ 0 tal que

r2 (x, a, b) ≤ r̂w(x) ∀(x, a, b) ∈ K. (17.26)

Entonces un par de estrategias en Φ1 × Φ2 es EAP óptimo si y solo si es SPAP


óptimo; entonces, por el Teorema 17.4.9

(Φ1 × Φ2 )eap = (Φ1 × Φ2 )ca = (Φ1 × Φ2 )spap . (17.27)

Ver demostración en [4].

17.5. Juegos de suma no cero


En esta sección usaremos el criterio EAP y se dan condiciones para poder hallar
el equilibrio de Nash de un juego estocástico.
Definición 17.5.1 Un par de estrategias (π 1∗ , π 2∗ ) se llama equilibrio de Nash
(para el criterio EAP) si

J 1 (x, π 1∗ , π 2∗ ) ≥ J 1 (x, π 1 , π 2∗ ) ∀π 1 ∈ Π1 , x ∈ X,

y
J 2 (x, π 1∗ , π 2∗ ) ≥ J 2 (x, π 1∗ , π 2 ) ∀π 2 ∈ Π2 , x ∈ X.

232
Probabilidad, Estadı́stica y sus Aplicaciones

En este caso la ecuación (17.14) queda de la siguiente forma


Z Z
ri (x, ϕ, ψ) := ri (x, a, b)ψ(db)ϕ(da).
A(x) B(x)

Además de las suposiciones de la sección anterior necesitaremos otras más y


hacemos un cambio en la Suposición 17.4.4 (b) Para cada (x, a, b) ∈ K, r1 (x, a, ·) es
u.s.c. sobre A(x) y r2 (x, ·, b) es u.s.c. sobre B(x).
Suposición 17.5.2 La densidad de transición es tal que
Z
lim |g(x, an , bn , y) − g(x, a, b, y)|w(y)γ(dy) = 0, (17.28)
n→∞ X

para todo x ∈ X, si an → a en A(x) y bn → b en B(x), donde w(·) es la función


de la Suposición 17.4.4 (d).
Las suposiciones siguientes necesitan que la ecuación (17.14) tenga una estruc-
tura ARAT (recompensa aditiva, ley de transición aditiva).
Suposición 17.5.3 Existen kérneles subestocásticos Q1 ∈ P(X|KA ) y Q2 ∈ P(X|KB )
tal que
Q(·|x, a, b) = Q1 (·|x, a) + Q2 (·|x, b)
para todo x ∈ X, a ∈ A(x), b ∈ B(x). Más aún, Q1 (D|x, ·) y Q2 (D|x, ·) son
continuos sobre A(x) y B(x), respectivamente, para cada D ∈ B(X).

Suposición 17.5.4 Para i = 1, 2 existen funciones medibles ri1 : KA → R y ri2 :


KB → R, tales que
(a) ri (x, a, b) = ri1 (x, a) + ri2 (x, b) para todo x ∈ X, a ∈ A, b ∈ B.
(b) Más aún, para cada x ∈ X, las funciones ri1 (x, ·) y ri2 (x, ·) son continuas
sobre A(x) y B(x), respectivamente, y
(c) max |ri1 (x, a)| ≤ w(x), y max |ri2 (x, b)| ≤ w(x).
a∈A(x) b∈B(x)

Ası́ para los juegos de suma no cero tenemos el siguiente teorema.

Teorema 17.5.5 Bajo las Suposiciones 17.4.4, 17.4.5, 17.4.8 y 17.5.2 - 17.5.4,
existe un par (ϕ∗ , ψ∗ ) ∈ Φ1 × Φ2 que es un equilibrio de Nash.

Ver demostración en [1].

17.6. Ejemplo
Como ejemplo, usaremos el Dilema del Prisionero Iterado. La forma normal
estática del juego se representa en el Cuadro 17.1:
Consideremos las estrategias SC , SD , ST , SA , SG , SQ y SP , donde:
SC jugar siempre C,

233
Probabilidad, Estadı́stica y sus Aplicaciones

Cuadro 17.1: Forma normal del juego.

J2
C D
J1 C 3,3 0,5
D 5,0 1,1

SD jugar siempre D,

ST inicia cooperando; a continuación hace lo que el otro jugador hizo en la


etapa anterior,

SG inicia cooperando y sigue cooperando hasta que el otro no lo haga, y luego


no coopera para siempre,

SA inicia no cooperando, a continuación hace lo que el otro jugador hizo en


la etapa anterior,

SQ coopera con probabilidad q y no coopera con probabilidad 1 − q,

SP inicia cooperando y sigue cooperando con probabilidad p y no coopera con


probabilidad 1 − p.
El modelo del juego estocástico es como el dado en (17.1), en donde:
X = {0, 1, 3, 5},

A = B = {0, 1} = A(x) = B(x) para todo x ∈ X, con C = 1 y D = 0,

Q ∈ P(X|K), con K = {(x, a, b)|x ∈ X, a ∈ A(x), b ∈ B(x)}, se define como:


(
1, si at = 1, bt = 0
Q({0}|xt , at , bt ) =
0, c.o.c.
(
1, si at = bt = 0
Q({1}|xt , at , bt ) =
0, c.o.c.
(
1, si at = bt = 1
Q({3}|xt , at , bt ) =
0, c.o.c.
(
1, si at = 0, bt = 1
Q({5}|xt , at , bt ) =
0, c.o.c.

234
Probabilidad, Estadı́stica y sus Aplicaciones

Las estrategias para este juego quedan definidas de la siguiente forma:

SC = {πt1 |πt1 ({1}|ht ) = 1, t = 0, 1, . . .}.


SD = {πt1 |πt1 ({0}|ht ) = 1, t = 0, 1, . . .}.
ST es tal que π01 ({1}|ht ) = 1 y
(
1, si at = bt−1
πt1 ({at }|ht ) = , t = 1, 2, . . .
0, c.o.c.

SA es tal que π01 ({0}|ht ) = 1 y para t = 1, 2, . . . ,


(
1 1, si at = bt−1
πt ({at }|ht ) =
0, c.o.c.

SG es tal que π01 ({1}|ht ) = 1; para t = 1, 2 . . . ,


(
1 1, si at−1 = bt−1
πt ({1}|ht ) =
0, c.o.c.

y (
1, si at−1 = 0 o bt−1 = 0
πt1 ({0}|ht ) =
0, c.o.c.

(
q, si at = 1
SQ = {πt1 |πt1 ({at }|ht ) = t = 0, 1, . . .}
1 − q, si at = 0

SP es tal que π01 ({1}|ht ) = 1; para t = 1, 2, . . . ,


(
1 1, si bt−1 = 1
πt ({1}|ht ) =
p, si bt−1 = 0

y (
1 − p, si bt−1 = 0
πt1 ({0}|ht ) =
0, si bt−1 = 1

Nota: Todas las estrategias son estacionarias Markovianas. Por el Teorema 17.5.5
existe un par de estrategias que es un equilibrio de Nash.
De aquı́ observamos que los equilibrios de Nash son: (SD , SD ), (SG , SG ), (SG , ST ),
(ST , SG ), (ST , ST ) y (SQ , SQ ).

235
Probabilidad, Estadı́stica y sus Aplicaciones

Cuadro 17.2: EAP de los jugadores con f (x) = −x2 + 3x + 1, g(x) = 1 − x,


h(x) = −2x2 + x(q − 4) + 1 e i(x) = 1 + 4q − x(1 + q).

17.7. Conclusiones
En teorı́a de juegos el objetivo es encontrar estrategias que optimicen el ren-
dimiento para cada uno de los jugadores, pero esto no siempre es sencillo. Los
resultados de la sección 4 nos aseguran que los 3 criterios que se presentaron son
equivalentes. Esto resulta de mucha utilidad pues nos permite elegir el criterio que
sea más sencillo al buscar dichos equilibrios. Por ejemplo en el Dilema del Prisionero
Iterado utilizamos el criterio EAP para hallar los equilibrios de Nash, cuya existen-
cia esta asegurada por el teorema de la sección 5. Aunque la elección del criterio
dependerá del problema que se este abordando.

236
Probabilidad, Estadı́stica y sus Aplicaciones

Bibliografı́a

[1] Benı́tez, Medina, Existence of Nash equilibria in nonzero-sum ergodic stochas-


tic games in Borel spaces, MORFISMOS, 5(2), 19-35, 2001.
[2] Boros, Elbassioni, Gurvich, Makino, Markov decision processes and sto-
chastic games with total effective payoff, RUCTOR RESEARCH REPORT,
2014.
[3] Hernández, Lasserre, Further topics on discrete-time Markov control pro-
cesses, SPRINGER SCIENCE+BUSINESS MEDIA, 1999.
[4] Hernández, Lasserre, Zero-sum stochastic games in Borel spaces: average
payoff criteria, SIAM J. CONTROL OPTIM, 39(5), 1520-1539, 2001.

[5] Jassen, Stochastic games. (Tesis de maestı́a), UNIVERSITEIT LEIDEN, 2006.


[6] Luque, Vázquez, Zero-sum semi-Markov games in Borel spaces with discoun-
ted payoff, MORFISMOS, 6(1), 15-29, 2002.
[7] Nowak, Szajowski, Nonzero-sum stochastic games, MUNICH PERSONAL
REPEC, 1998.
[8] Ramı́rez, Existence of optimal strategies for zero-sum stochastic games with
discounted payoff, MORFISMOS, 5(1), 63-83, 2001.
[9] Soo Chang, Marcus, Two-person zero-sum Markov games: receding horizon
approach, in IEEE transactions on automatic control, vol. 48, 2003.

237
Probabilidad, Estadı́stica y sus Aplicaciones

Capı́tulo 18
Probabilidad de localización de una partı́cula en un potencial isotónico cuántico

Maricruz Castillo Garcı́a y Mario Alberto Maya Mendieta

Benemérita Universidad Autónoma de Puebla,


Facultad de Ciencias Fı́sico Matemáticas,
Av. San Claudio y 18 Sur, Col. San Manuel,
C.P. 72570, Puebla, Puebla,
[email protected], [email protected]

Resumen. El oscilador isotónico es uno de los pocos sistemas cuúnticos con


solución exacta. En este trabajo presentamos dos contribuciones sobre este proble-
ma. La primera consiste en proponer un método algebraico de solución más sencillo
que los que aparecen en la literatura. La segunda contribución se refiere al cálculo
de la probabilidad de localización de la partı́cula sujeta al potencial isotónico me-
diante fórmulas que determinan los lugares más probables en los que se encuentra
la partı́cula.

Abstract. The isotonic oscillator is one of the few quantum systems with exact
solution. In this work we present two contributions on this problem. The first is to
propose a algebraic method of solution easier than those that appear in the litera-
ture. The second contribution refers to the calculation of the probability of location
of the particle subject to the isotonic potential by using formulas that determine
the most likely places the particle.

Palabras clave: Operadores, potencial, funciones de onda, espetro de energı́a.

18.1. Introducción
El potencial isotónico es un oscilador armónico con una barrera infinita de po-
tencial en el centro. Este es uno de los pocos problemas resueltos de forma exacta en
la mecánica cuántica. Tiene aplicaciones en óptica cuántica, en moléculas poliatómi-
cas, en teorı́a de muchos cuerpos, cadenas de espines para la computación cuántica.
En la literatura aparecen diversos enfoques para resolver la ecuación de Schrodinger
con este potencial. El que trataremos en este trabajo es un método algebraico por
medio de operadores de ascenso y descenso, como en el oscilador armónico [1], pero
a diferencia de este caso, en el que esos operadores contienen derivadas de primer
orden, los operadores para el potencial de tipo isotónico que hemos encontrado en
la literatura son de segundo orden [2], [3].

238
Probabilidad, Estadı́stica y sus Aplicaciones

En este trabajo presentamos nuestra contribución al mejor conocimiento de este


sistema cuántico, en dos aspectos: el primero consiste en un método de solución,
tambien de tipo algebraico, en el que el orden de las derivadas en los operadores de
escalera se reducen de segundo orden a derivadas de primer orden, por medio de la
ecuación de Schrodinger. La simplificación en el cálculo de las funciones de onda es
considerable, como lo mostramos mas adelante
La segunda contribución que hacemos es sobre el comportamiento de la partı́cula
atrapada en el potencial isotónico. Para esto tomamos un modelo especı́fico de
oscilador isotónico [2] en el que las funciones de onda y el espectro de energı́a
dependen de un parámetro d, en principio abierto, que depende de la masa de la
partı́cula y de la intensidad de la barrera de potencial en x = 0. Este parámetro
nos permite modelar el potencial isotónico para localizar a la partı́cula en la zona
permitida por dicho potencial.
El plan de este trabajo es el siguiente: En la Sección 18.2 hacemos una revisión
breve del método de factorización de Dirac, el cual es un mecanismo de solución de
una ecuación diferencial de segundo orden, aplicado al oscilador armónico cuántico.
En la Sección 18.3 damos los resultados relevantes en [2] relevantes para nosotros.
En la Sección 18.4 presentamos nuestra propuesta para la simplificación en el orden
de las derivadas en los operadores de escalera y por lo tanto en la obtencion de
las funciones de onda y del espectro de energı́a. En la Sección 18.5 mostramos
como el parámetro d se puede utilizar para modelar la probabilidad de localización
de la partı́cula, y finalmente, en la Sección 18.6 comentamos brevemente nuestros
resultados y damos las conclusiones.

18.2. El método de factorización de Dirac


Esta manera de resolver la ecuación de Schrodinger consiste en proponer unos
operadores diferenciales llamados de escalera los cuales sirven para encontrar todas
las soluciones de dicha ecuación a partir de una sola de ellas. El hamiltoniano del
oscilador armónico es

2
b OA = − 1 d + 1 x2 .
H (18.1)
2 dx2 2
Debemos resolver la ecuación de Schrodinger

b OA Ψ = i ∂Ψ ,
H (18.2)
∂t
donde Ψ = Ψ (x, t) es la función de onda que describe el comportamiento de la
partı́cula sujeta al potencial
1 2
V (x) = x , x ∈ R. (18.3)
2
Debido a que el potencial (18.3) no depende del tiempo, es posible usar el me-
canismo de separación de las variables x y t para demostrar que la función de onda
tiene la forma

Ψ (x, t) = e−iEn t ψn (x) , x ∈ R, t ≥ 0. (18.4)

239
Probabilidad, Estadı́stica y sus Aplicaciones

donde ψn (x) satisface la ecuación estacionaria de Schrodinger

H
b OA ψn (x) = En ψn (x) . (18.5)

La ecuación (18.5) es una ecuación de valor propio o de eigenvalor. El valor propio


En es precisamente la energı́a. Entonces debemos abocarnos al problema de resolver
la ecuación (18.5), lo cual haremos por el método de factorización de Dirac. El
hamiltoniano (18.1) está factorizado por los operadores ba± definidos por

 
± 1 d
a =√
b ∓ +x (18.6)
2 dx

de manera que se cumplen las condiciones

1
H
b OA = b a− +
a+ b (18.7)
2
1
H
b OA a− b
= b a+ − . (18.8)
2
Con (7) y (8) se encuentra la relación de conmutación

 − +
a ,b
b a = 1. (18.9)

a± y el hamiltoniano H
Las relaciones más relevantes de los operadores b b OA son las
siguientes

h i
H a−
b OA , b a− ,
= b (18.10)
h i
H a+
b OA , b = a+ ,
−b (18.11)

pues de ellas se deduce que

 −   − 
H a ψn (x) = (En − 1) b
b OA b a ψn (x) , (18.12)
 +   + 
H a ψn (x) = (En + 1) b
b OA b a ψn (x) . (18.13)

De (18.12) y (18.13) se deducen dos consecuencias


a− ψn (x) y b
1) Las funciones b a+ ψn (x) son también soluciones de la ecuación de
Schrodinger.
a− y b
2) Los operadores b a+ tienen la propiedad de bajar y subir, respectivamente,
la energı́a En en una unidad.
Debido a la segunda propiedad, a b a− se le llama operador de descenso o de
+
bajada y a b a de ascenso o de subida. A ambos se le aplica la denominación de
operadores de escalera. Por otro lado, de las ecuaciones de valor propio (18.12) y
(18.13) deducimos que

240
Probabilidad, Estadı́stica y sus Aplicaciones

a− ψn (x) ,
ψn−1 (x) α b (18.14)
+
ψn+1 (x) α b
a ψn (x) . (18.15)

Por todo lo anterior se deduce que si de alguna manera encontramos una solución
ψn (x) de la ecuación de Schrodinger (18.5), podemos encontrar todas las demás.
En el caso del oscilador armónico, lo primero que debemos tomar en cuenta es que
la energı́a debe tener un valor mı́nimo E0 , ya que el potencial ası́ lo establece. Si
ψ0 (x) es la función de onda correspondiente a esta energı́a mı́nima, se debe cumplir
que

a− ψ0 (x) = 0.
b (18.16)

La ecuación (18.16) da lugar a la ecuación diferencial de primer orden

dψ0
+ xψ0 = 0 (18.17)
dx
cuya solución es

2
ψ0 (x) = e−x /2
, x ∈ R. (18.18)

Ahora ya tenemos una función de onda. Con el operador de ascenso podemos


encontrar todas las demás. De acuerdo con (18.12), la función correspondiente al
estado n = 1 es

a+ ψ0 (x)
ψ1 (x) ∼ b (18.19)

La correspondiente el estado n = 2 es

2
a+ ψ1 (x) ∼ b
ψ2 (x) ∼ b a+ ψ0 (x) (18.20)

y en general

n
a+
ψn (x) ∼ b ψ0 (x) (18.21)
2
Aplicando n veces a ψ0 (x) = e−x /2
se encuentra

2
ψn (x) ∼ Hn (x) ψ0 (x) = Hn (x) e−x /2
(18.22)

donde Hn es el polinomio de Hermite de grado n


Finalmente, utilizando la ecuación de Schrodinger se encuentra el espectro de energı́a

1
En = n + (18.23)
2

241
Probabilidad, Estadı́stica y sus Aplicaciones

18.3. El potencia isotónico de Nagiyev


El hamiltoniano utilizado por Nagiyev en [2] tiene la forma

2
b N = − 1 d + 1 x2 + g ,
H (18.24)
2 dx2 2 x2
donde aparece el usual término cuadrático del oscilador armónico. La parte singular
de este hamiltoniano está caracterizada por la constante g.

 
± 1 d d + 1/2
c =√
b ∓ +x− (18.25)
2 dx x
La factorización del hamiltoniano es de la forma

c− + d + 1
c+ b

H
b N = ~ω b (18.26)

lo cual se puede demostrar sin mucha dificultad. En (18.26) aparece el parámetro d


el cual es
p
d = 1 + 8g (18.27)

y asume que g > −1/8 para que d sea real. El conmutador de los operadores (18.25)
es
 − + d + 1/2
c ,b
c =1+ . (18.28)
x2
b

El hecho de que este conmutador dependa de la posición x a través de la variable


ξ indica que los operadores b c− , b
c+ no son de escalera, es decir, que no generan
a las funciones de onda ψn (x) soluciones de la ecuación de Schrodinger (18.2).
Es conocido que cuando en el potencial de un sistema cuántico hay dos terminos
dependientes de la posición, los operadores de escalera, si existen, son operadores
diferenciales de segundo orden. Es el caso del potencial de Nagiyev, el cual es
1 2 g
VN (x) = x + 2 , x > 0. (18.29)
2 x
Por la forma del potencial las condiciones de frontera son

lim ψn (x) = 0, (18.30)


x→0
lim ψn (x) = 0. (18.31)
x→±∞

Los operadores de escalera se proponen de la siguiente forma

b± = b
2 g
A a± − , (18.32)
x2
a− (18.6) del oscilador
a+ y descenso b
en donde aparecen los operadores de ascenso b
armónico

242
Probabilidad, Estadı́stica y sus Aplicaciones

 
1 d
a± = √
b ∓ +x . (18.33)
2 dx

b± como
Podemos introducir (18.9) en (18.8) para tener la forma explı́cita de A
operadores difernciales de segundo orden:

2
b+ = 1 d − x d + 1 x2 − 1 − g ,

A 2
(18.34)
2 dx dx 2 x2

2
b− = 1 d + x d + 1 x2 + 1 − g .

A 2
(18.35)
2 dx dx 2 x2
b± tienen las siguientes propiedades:
Los operadores A
h i
b− , A
A b+ = H bN , (18.36)

h i
H b+ = A
bN , A b+ , (18.37)

h i
H b− = −A
bN , A b− . (18.38)

b+ es
Son precisamente las propiedades (18.13) y (18.14) las que aseguran que A

un operador de ascenso y que A es de descenso, respectivamente, pues
b

b+ ψn (x)
A = cn+1 ψn+1 (x) , (18.39)
b− ψn (x)
A = cn−1 ψn−1 (x) . (18.40)

siendo ψn (x) una solución de (18.2) correspondiente a la energı́a En . Las propie-


dades (13) y (14) garantizan que ψn+1 (x) y ψn−1 (x) tambien son soluciones de
(18.2).

18.4. Nuestro método de solución


Como hemos mencionado, los operadores de escalera del potencial de Nagiyev
son operadores diferenciales de segundo orden, como se puede ver en las formas
(18.10) y (18.11). Ahora vamos a demostrar que se pueden reducir a operadores
diferenciales de primer orden, si usamos la ecuación de Schrodinger (18.2) con el
potencial (18.7), en la forma

d2 ψn
 
1 2 g
= 2 [V (x) − En ] ψn = 2 x + 2 − En ψn . (18.41)
dx2 2 x

243
Probabilidad, Estadı́stica y sus Aplicaciones

Si aplicamos los operadores (18.10) y (18.11) a la función ψn (x) podemos escribir

 
+ dψn 2 1
A ψn = −x
b + x − En − ψn = cn+1 ψn+1 (x) (18.42)
dx 2

 
b− ψn = x dψn + x2 − En + 1 ψn = cn−1 ψn−1 (x)
A (18.43)
dx 2

La expresiones (18.15) y (18.18) muestran un mecanismo que nos permite cons-


truir la función de onda ψn+1 (x) por medio de un operador diferencial de primer
orden, a diferencia del operador de ascenso (18.15) el cual es de segundo orden. El
ahorro en la cantidad de cálculos es considerable, pues siguiendo el procedimiento
usual de crear la función de onda ψn (x) a partir de la función del estado base ψ0 (x)
de acuerdo a

 n
b+ ψ0 (x)
ψn+1 (x) = A (18.44)

tendrı́amos que realizar 2n derivadas usando (18.10), mientras que con (18.18) sólo
serı́an n derivadas, como lo vamos a hacer a continuación. Una restricción de (18.18)
y (18.19) es que sólo son válidas para soluciones ψn (x) de la ecuación de Schro-
dinger. A continuación calculamos ψ0 (x) con (18.19), con la hipótesis de que es la
función de onda correspondiente al estado de mı́nima energı́a. La afirmación de que
existe una energı́a mı́nima se basa en el hecho de que el potencial da lugar a una
fuerza que obliga a la partı́cula cuántica a moverse en una región

0 < x < ∞, (18.45)

es decir, está confinada. Lo anterior nos lleva a la condición

b− ψ0 = 0
A (18.46)

que por (18.18) se convierte en la ecuación diferencial

 
dψ0 1
x + x2 − E 0 + ψ0 = 0, (18.47)
dx 2

la cual se resuelve por separación de variables para llegar a

1 2
ψ0 (x) = xE0 − 2 e−x /2
, x ∈ R. (18.48)

La función (18.20) satisface automáticamente las condiciones de frontera. A


continuación calculamos la derivada de la función (18.21) por ser necesaria para
construir ψ0 (x) y todas las demás funciones ψn (x). El resultado es

244
Probabilidad, Estadı́stica y sus Aplicaciones

"
1 1 2 #
E0 − E0 −

dψ0 2 2
= − −1+ −x ψ0 . (18.49)
dx x2 x

De (18.21) iniciamos la escalera de estados cuánticos:

 
dψ0 2 1
ψ0 = C1 ψ0 (x) Ld1 x2

ψ1 (x) = −x + x − E1 − (18.50)
dx 2
 
dψ1 1
+ x2 − E2 − ψ1 = C2 ψ0 (x) Ld2 x2

ψ2 (x) = −x (18.51)
dx 2
···  
dψn−1 2 1
ψn−1 = Cn ψ0 (x) Ldn x2 (18.52)

ψn (x) = −x + x − En−1 −
dx 2

En las expresiones (18.23) es el polinomio de Laguerre de grado n y Cn es una


constante de normalización sujeta a la condición

Z ∞ Z ∞
2
Cn2 ψ0 (x) Ldn x2 2 dx = 1.

|ψn (x)| dx = (18.53)
0 0

La condición (18.24) es absolutamente necesaria para la correcta interpretación


probabilı́stica de la mecánica cuántica.

El espectro de energı́a es dado por

En = 2d + n + 1 (18.54)

18.5. La densidad de probabilidad


Entre los postulados de la mecánica cuántica está la identificación de las variables
fı́sicas con operadores herméticos. Ası́, si q es una cantidad fı́sica (energı́a, momento,
posición,...), entonces se le asocia un operador hermético que representamos con el
sı́mbolo Q.b La densidad de probabilidad es precisamente

2
ρ (x) = |ψn (x)| = ψn∗ (x) ψn (x) , x ∈ R. (18.55)

En nuestro caso la densidad de probabilidad tiene como parámetro a d, el cual


mide la intensidad del término singular del potencial de Nagiyev.

2 2
ρdn (x) = x4d+1 e−x Ldn x2

, x ∈ R. (18.56)

El valor promedio o valor esperado de la variable fı́sica q debe especificarse con


cuidado pues es su operador el que debe entrar en los cálculos. La manera que
concuerda con los experimentos es la siguiente

245
Probabilidad, Estadı́stica y sus Aplicaciones

D E Z b
Q
b = ψn∗ (x) Qψ
b n (x) dx. (18.57)
a

En donde [a, b] es el intervalo en el cual está la partı́cula.

Para el oscilador isotónico de este trabajo el valor esperado en el estado n es

D E Z b
ψ0 (x) Ldn x2 Qψ
b 0 (x) Ldn x2 dx
 
Q
b = (18.58)
a

Introduciendo la forma especı́fica de ψ0 (x) según (21)

D E Z b
2
1
xE0 − 2 e−x /2 b E0 − 12 e−x2 /2 Ldn x2 dx
Ldn x2 Qx
 
Q
b = (18.59)
a

Esta fvrmula para el valor esperado de una cantidad fı́sica de una partı́cula
confinada por un potencial isotónico es el objetivo de este trabajo. Con (18.59) po-
demos calcular todos los valores que predice la mecánica cuántica para este sistema.
Para una aplicación de (18.59) hemos elegido la posición x. En este caso el operador
asociado a la posición es la misma variable x. Asói, la posición más probable de la
partı́cula en el estado n es la integral

Z ∞  d 2 2
2
hb
xin = x2E0 e−x Ln x dx (18.60)
0

Entonces
 el valor esperado de la posición de la partı́cula en el estado base n = 0
y Ld0 x2 = 1 es:

Z ∞
2
hb
xin=0 = x2E0 e−x dx, (18.61)
Z0 ∞
2
hb
xi0 = x4d+2 e−x dx. (18.62)
0

Con la finalidad de simplificar la integral realizamos el siguiente cambio de


variable
1 1 1
u = x2 , x = u 2 , dx = u− 2 du
2
e introducimos la función gamma

Z ∞
Γ (x) = ux−1 e−u du. (18.63)
0

finalmente el valor esperado de la posición en el estado base se simplifica como

246
Probabilidad, Estadı́stica y sus Aplicaciones

Figura 18.1: Gráfica de 12 Γ 2d + 3



2 como función de d.

 
1 3
hb
xi0 = Γ 2d + , d>0 (18.64)
2 2

También se representa gráficamente la densidad de probabilidad del estado base,

para algunos valores de la variable d:

Figura 18.2: Estado base: ρ00 (x) en rojo, ρ10 (x) en verde, ρ20 (x) en azul.

247
Probabilidad, Estadı́stica y sus Aplicaciones

De forma similar podemos obtener hb


xi para cualquier estado. por ejemplo en los
primeros 3 estados:

 2  2 2
Para la base n = 1 y Ld1 x2 = −x + d + 1 , el valor de la posición es

Z ∞  d 2 2
d 2
hb
xi1 = x4d+2 e−x L1 x dx (18.65)
0

d
reescribimos hb
xi1 , usando la función gamma

  
d 1 3 7
hb
xi1 = Γ 2d + d2 + 3d + , d > 0. (18.66)
2 2 4

d 7
1 3

xi1 = d2 + 3d +
Figura 18.3: Gráfica hb 4 2Γ 2d + 2 como función de d.

La representación de la densidad de probabilidad para n = 1, cuando d toma los


valores d = 0, 1, 2 es:

Figura 18.4: Estado n = 1: ρ01 (x) en negro, ρ11 (x) en rojo, ρ21 (x) en verde.

248
Probabilidad, Estadı́stica y sus Aplicaciones

1
  4 
Por otra parte si n = 2 y Ld2 x2 = 2 x − 2 (d + 2) x2 + (d + 1) (d + 2) . El
valor esperado es:

  
d 1 3 1 4 3 43 2 290
hb
xin=2 = Γ 2d + d + 2d + d + 6d + , d > 0. (18.67)
2 2 4 8 128

Valor
 esperado de la posición n = 3 y
Ld3 x2 = − 61 x6 − 3 (d + 3) x4 + 3 (d + 2) (d + 3) x2 − (d + 1) (d + 2) (d + 3)
 

Tenemos para d > 0

  
d 1 3 1 6 5 349 4 57 3 6427 2 1693 687
hb
xin=3 = Γ 2d + d + d5 + d + d + d + d+ .(18.68)
2 2 36 12 144 8 576 192 256

249
Probabilidad, Estadı́stica y sus Aplicaciones

Observamos la representación de el valor esperado de x en los estados n =


0, 1, 2, 3 en la siguiente grafica

d d d d
Figura 18.5: hb
xi0 en rojo, hb
xi1 en azul y hb
xi2 en verde y hb
xi3 en gris.

18.6. Conclusiones
En este trabajo hemos realizado dos contribuciones que creemos son originales:
la primera es el método de solución por operadores diferenciales de primer orden,
el cual simplifica bastante los cálculos de las funciones de onda, y que puede ser
aplicado a otros sistemas cuanticos. La segunda consiste en dar una expresión exacta
para calcular los valores mas probables de la posición x de la partı́cula en el estado
cuántico n. Nuestro principal interés es en el tema de soluciones exactas de la
ecuación de Schrodinger, y este trabajo se encuadra en él, aunque esperamos que
nuestra contribución tenga alguna utilidad práctica. Además se encuentra que d
tiene un papel importante en el aspecto probabilı́stico

250
Probabilidad, Estadı́stica y sus Aplicaciones

Bibliografı́a

[1] S.M. Nagiyev, E.I. Jafarov y R.M. Imanov, On a dynamical symmetry


group of the relativistic linear singular oscillator, arXiv math ph/0628057.
[2] David J. Griffiths Introduction to Quantum Mechanics. Pearson Education
India, 2005
[3] M. D. Fayer. Elements of Quantum Mechanics. New York, 2001
[4] P. Camiz et a. Exact solution of a time dependent quantal harmonic oscillators
with a singular perturbation, Journal of Mathematical Physics 12 (1971) 2040-
2043.

251
Probabilidad, Estadı́stica y sus Aplicaciones

Capı́tulo 19
Análisis preliminar de la satisfacción laboral de un hospital del estado de Puebla

José Daniel Velázquez-Martı́nez, Juan Manuel Hernández-Ramos, Carolina Solı́s-


Peña y Jonathan Cuellar

Universidad Autónoma de Nuevo León,


Facultad de Ciencias Quı́micas,
Avenida Universidad sin número, San Nicolás de los Garza
Nuevo León, C.P. 66455. [email protected]

Resumen. Mejorar la seguridad del paciente ha llegado a ser uno de los ob-
jetivos clı́nicos y de investigación más importantes en las pasadas dos décadas y
actualmente, por consiguiente, en este trabajo de investigación se analiza la satis-
facción laboral vista como una dimensión esencial de la cultura de seguridad debido
a que la satisfacción laboral en general tiende a relacionarse con resultados positi-
vos y mayores ı́ndices de productividad. Por lo tanto, los objetivos de este estudio
son: llevar a cabo el análisis de la satisfacción laboral de un hospital del Estado de
Puebla, difundir el conocimiento, desarrollar y fortalecer esta lı́nea de investigación
en México. Para lo cual se llevo a cabo un estudio observacional del tipo transversal
con una muestra por conglomerados donde se pudo encuestar a más del 80 % del
personal (n = 30). Dentro de los hallazgos encontrados, se obtuvo una puntuación
media de la dimensión satisfacción laboral de 20,43±3,44 puntos en escala de Likert
de 25 puntos posibles, lo que indica que la satisfacción laboral es percibida como
positiva en el hospital en estudio sin llegar a ser completamente positiva, lo que
constituye un área de oportunidad para el hospital en estudio. Por otro lado, se
encontró una relación significativa entre la satisfacción laboral y algunas variables
sociodemográficas como por ejemplo los años trabajados en el hospital. Por lo que
podemos concluir que en el caso de esta investigación, la satisfacción laboral se per-
cibe más como una fortaleza que como una debilidad para el hospital en estudio,
pero que es necesario focalizar los esfuerzos en el área de oportunidad detectada a
fin de generar un proceso de mejora continua.

Abstract. Improving patient safety has become one of the most important cli-
nical and research objectives in the past two decades and today, therefore, in this
research work is analysed job satisfaction seen as an essential dimension of safety
culture because job satisfaction in general tends to be related to positive results
and higher productivity indexes. Therefore, the objectives of this study are: carry
out the analysis of job satisfaction of a hospital in the State of Puebla, dissemina-
te knowledge, develop and strengthen this line of research in Mexico. For which an

252
Probabilidad, Estadı́stica y sus Aplicaciones

observational study of the transversal type was carried out with a sample by conglo-
merates where it was possible to survey more than 80 % of the personnel (n = 30).
Among the findings, we obtained an average score of the satisfaction dimension of
20,43 ± 3,44 points on the Likert scale of 25 possible points, which indicates that
job satisfaction is perceived as positive in the hospital under study without being
completely positive, which constitutes an area of opportunity for the hospital under
study. On the other hand, a significant relationship was found between job satisfac-
tion and some socio-demographic variables such as the years worked in the hospital.
So we can conclude that in the case of this research, job satisfaction is perceived
more as a strength than as a weakness for the hospital under study, but that it is
necessary to focus efforts in the area of opportunity detected in order to generate a
process of continuous improvement.

Palabras clave: Satisfacción Laboral, Cultura de Seguridad, Hospital, Seguridad del


Paciente.

19.1. Introducción
Mejorar la seguridad del paciente ha llegado a ser uno de los objetivos clı́nicos
y de investigación más importantes en las pasadas dos décadas y actualmente. Es
importante mejorar la seguridad del paciente para poder prevenir y minimizar el
riesgo, por ejemplo el inherente al sistema de salud en el que se presta la atención
médica en pro de salvaguardar la vida de los pacientes y el de prevenir y proteger
tanto a pacientes como al personal al servicio de la salud, siempre tomando en
cuenta el contexto sociocultural, tecnológico, económico, demográfico, etc., donde
se presta la atención sanitaria. Al respecto, debe mencionarse que en este trabajo
de investigación, la satisfacción laboral es vista como parte de una dimensión de
la cultura de seguridad. En este sentido, es importante mencionar que en algunas
investigaciones destacan que personas motivadas y satisfechas con su trabajo y
con la organización, aumentan su rendimiento y la calidad de los servicios que se
prestan (ver [1] y [2]), ası́ como también mencionan que la satisfacción laboral no
solo influye en la práctica laboral y en la calidad de servicio, sino que también es un
factor determinante en la satisfacción de los usuarios [2]. En este mismo sentido, es
importante señalar que algunos reportes cientı́ficos manifiestan que la falta de apoyo
social, la insatisfacción laboral, la percepción de niveles altos de estrés, entre otras,
son antecedentes de niveles altos del burnout [3]. Por otro lado, encontramos que
según algunas investigaciones a partir de los escritos de porter y Lawler y Locke,
se señala que en las teorı́as motivacionales, se basan en el concepto de discrepancia
o desajuste, es decir que la satisfacción depende del grado en que coincide lo que
un individuo busca en su trabajo con lo que realmente consigue de él, ası́, cuanto
mayor sea la distancia entre lo que se quiere conseguir y lo que se obtiene del trabajo,
menor será la satisfacción laboral [2].
Desde otra perspectiva, otro estudio menciona que la exposición prolongada
al estrés laboral está asociada al sı́ndrome de desgaste profesional, este desgaste
profesional está caracterizado por elevados niveles de agotamiento emocional, que se

253
Probabilidad, Estadı́stica y sus Aplicaciones

refiere a la disminución o la pérdida de recursos emocionales, la despersonalización


o desarrollo de actitudes negativas hacia los pacientes y, por último, la falta de
realización personal, lo que provoca tendencias a evaluar el propio trabajo de forma
negativa [4].
En México, se está en vı́as de desarrollo en esta área del conocimiento acerca de
los hospitales del paı́s, por lo que es importante desarrollar este tipo de investiga-
ciones para aprender y poder fortalecer la calidad y seguridad de la atención médica
en las instituciones hospitalarias. Al respecto, se señala que en 2004 se publico un
estudio acerca de la satisfacción de los usuarios de 15 hospitales de Hidalgo, México
donde se reporto entre otros resultados, que la insatisfacción de los usuarios fue del
15.06 %, ası́ como también se reporto una percepción de mala calidad asociada con
la insatisfacción del 10.8 % (p <0.05) [5].
Al respecto, en Bernal-González I et al. [6] se señala que evaluar las percepcio-
nes tanto de los usuarios como del trabajador mismo es una necesidad inherente del
acto médico y representa una oportunidad de mejora en la gestión de los servicios
sanitarios, es decir, se deben tomar en cuenta tanto las percepciones de los pacientes
como del personal de salud desde su organización interna, para comprender como se
organizan y se brindan los servicios. Por otro lado, Salinas-Oviedo C et al. [7], men-
ciona que la Dirección General de Servicios de Salud del departamento del Distrito
Federal desarrollo desde 1991 el programa integral de mejorı́a de la calidad, apoya-
do en los principios del desarrollo y cambio organizacional, por lo cual llevo a cabo
un estudio de la satisfacción laboral en un hospital de la ciudad de México donde
encontró en uno de sus resultados que la relación entre la percepción del usuario y
la del trabajador se manifestó en ambos grupos como de adecuada satisfacción [7].
Sin embargo, algunos reportes de investigación señalan que la evidencia actual
revela a la satisfacción laboral como un predictor de permanencia en el trabajo,
motivación y productividad laboral, pero en este mismo contexto podemos apreciar,
que el nivel de satisfacción laboral del personal de enfermerı́a está disminuyendo en
todo el mundo y que las principales fuentes de insatisfacción de enfermerı́a incluyen
la falta de personal, elevada presión asistencial y escaso reconocimiento profesional,
entre otras [4].
Mientras que para el caso especı́fico de los médicos, algunos reportes señalan que
su posición social se ha desdibujado con relación a décadas pasadas y que hoy se
puede observar que recurren al multiempleo como la última posibilidad de mantener
las caracterı́sticas adscriptas a su rol [8].
También y desde otro punto de vista se puede mencionar que en México los
reportes de investigación acerca de este tema no se consiguen con facilidad, se en-
cuentran dispersos y se publican de forma esporádica, por lo que es conveniente
aumentar este tipo de estudios para poder generar un ciclo de mejora continua, que
permita entender la situación que se vive en México y fortalecer a sus instituciones
de salud.
Debido a lo anterior expuesto, podemos destacar la importancia de la medición
de la satisfacción laboral en los trabajadores de las instituciones sanitarias dado a
que está implicada en la calidad asistencial, lo que le confiere una elevada impor-
tancia a su medición en los trabajadores de las instituciones sanitarias [9]. Por lo
que, el objetivo de este trabajo es: llevar a cabo el análisis de la satisfacción laboral
de un hospital del Estado de Puebla, difundir el conocimiento, ası́ como desarrollar
y fortalecer esta lı́nea de investigación en México.

254
Probabilidad, Estadı́stica y sus Aplicaciones

19.2. Material y métodos


19.2.1. Cuestionario utilizado y población de estudio
Se llevó a cabo un estudio observacional del tipo transversal y se consideró
una muestra por conglomerados, mediante la aplicación del CAS-MX-II que es la
retraducción, adaptación y fiabilización del Cuestionario de Actitudes Seguras Ame-
ricano (SAQ Ambulatory), para las generalidades ver [10] y [11]. Cabe mencionar
que en este estudio se presenta el caso de la dimensión satisfacción laboral de un
hospital de la región de puebla, el hospital en estudio corresponde al segundo nivel
de atención y los cuestionarios fueron aplicados en las áreas de urgencias, hospital
y ambulatoria.

19.2.2. Instrumento: CAS-MX-II


Dicho cuestionario está diseñado para ser aplicado en áreas hospitalarias con pa-
cientes ambulatorios, de urgencias y hospitalizados con excepción de las unidades de
cuidado intensivo (UCI). Al personal al que estuvo dirigido este cuestionario, com-
prendió los siguientes participantes: Personal médico (médicos residentes, médicos
radiólogos, médicos pasantes, etcétera), Personal de enfermerı́a (Jefe(s) de enfer-
merı́a, enfermeras auxiliares), otros (psicólogos, trabajadoras sociales, asistentes de
consultorio, técnicos de laboratorio, técnicos radiólogos, etc.)
El cuestionario consistió de las siguientes secciones: sección 1, la cual tiene como
objetivo fundamental de conocer la calidad de comunicación y colaboración que
existe en estas áreas clı́nicas. La sección cuenta con la siguiente escala: ”Pésima”
(A), ”Mala” (B), ”Adecuada” (C), ”Buena” (D), ”Excelente” (E), y ”No aplica”
(X). La sección 2, la parte central del instrumento que consiste de un total de 39
ı́tems, de los cuales 5 ı́tems son para medir la dimensión de satisfacción laboral, para
su llenado se usa la escala Likert, es decir: ”Completamente en desacuerdo” (A),
”Ligeramente en desacuerdo” (B), ”Neutral” (C), ”Ligeramente de acuerdo” (D),
y ”Completamente de acuerdo” (E). Finalmente, la sección 3, consiste en obtener
la información demográfica de los participantes. El cuestionario toma de 5 a 10
minutos para completarlo.

19.2.3. Participantes
Para calificar para la inclusión, tanto el personal a jornada completa como el
personal de tiempo parcial tiene que haber trabajado en la unidad al menos un
mes antes de la administración del cuestionario. La ”regla de oro” que se aplica es
que todo el personal dentro de un área clı́nica, o bien influyen o son influenciados
por el ”ambiente de trabajo” en esa área clı́nica. Dentro del análisis estadı́stico y
con la finalidad de prevenir sesgos, las siguientes consideraciones fueron tomadas:
criterios de inclusión, exclusión y de eliminación. A continuación se describen bre-
vemente cada uno de ellos. El cuestionario fue suministrado uno por uno y de forma
voluntaria en el área de investigación por los investigadores, garantizando en todo
momento el anonimato a los encuestados.

255
Probabilidad, Estadı́stica y sus Aplicaciones

19.2.4. Criterios de inclusión


Se consideró, por ejemplo, que los encuestados estén influenciados por la cultura
de su hospital o área clı́nica. El personal seleccionado para la investigación fueron:
médicos, enfermeras, otros (trabajadoras sociales y personal de apoyo médico y de
diagnóstico). Otras de las consideraciones fue el hecho de que el personal debió ha-
ber tenido al menos 4 semanas y 20 horas/semana laborales, para ser considerado
en el análisis. En el caso particular del personal médico, el criterio considerado fue
el hecho de que el médico que atienda a más de 2 pacientes a la semana puede ser
incluido en el análisis. El personal médico que realice cirugı́a debe ser incluido. El
personal voluntariamente debe estar de acuerdo en llenar el cuestionario proporcio-
nado.

19.2.5. Criterios de exclusión


Personal médico o de apoyo que trabaje con personas no vivas (por ejemplo,
anfiteatro). Personal que no esté relacionado directamente con la salud del paciente.

19.2.6. Criterios de eliminación


No se tomaron en cuenta para el análisis estadı́stico los cuestionarios o ı́tems sin
responder o ilegibles.

19.2.7. Limitaciones
En este rubro hubo limitaciones en cuanto a poder aplicar cuestionarios en di-
versos hospitales. Por ejemplo, en algunos hospitales se dio un protocolo de investi-
gación de acuerdo a sus normas internas; sin embargo, nunca emitieron respuesta,
ni dieron el permiso necesario para tener acceso a las instalaciones, etc.

19.3. Resultados
En la Figura 19.1, se puede observar el histograma de la satisfacción laboral de los
participantes encuestados del hospital en estudio, en el cual se tiene una puntuación
media de 20.43 puntos ±3.44 de un total de 25 puntos posibles en escala Likert, lo
que refleja una muy alta satisfacción laboral en general en el hospital en estudio.
Además, se llevo a cabo la Prueba de normalidad de Kolmogorov-Smirnov el cual
obtuvo un valor p > 0.192, y también se obtuvo el gráfico de normal esperado vs
valor observado,)véase la Figura 19.2, por lo que a partir de los resultados obtenidos
con esta prueba no se tiene evidencia suficiente para poder rechazar la normalidad.
Siguiendo con el análisis de los datos en la Tabla 19.1, se muestran los valores
de los estadı́sticos descriptivos de las variables analizadas: la satisfacción laboral
general, la edad actual, el estatus de trabajo, el puesto de trabajo, los años de expe-
riencia y los años trabajados en el hospital, de donde se tiene que la edad promedio
de los trabajadores fue de 36.20 ± 11.372 años, lo que indica que en promedio se
tiene una edad productiva adecuada en el hospital en estudio, en cuanto al estatus
de trabajo, se observa que el personal en promedio labora por tiempo completo y en
segundo lugar por medio tiempo, ası́ como también, los resultados indican que en

256
Probabilidad, Estadı́stica y sus Aplicaciones

Figura 19.1: Histograma ”Total Satisfacción en el trabajo”, describe la puntuación


total obtenida de la satisfacción laboral en el hospital en estudio, se puede observar
también que la mayorı́a de los encuestados optaron por manifestarse en ligeramente
y completamente de acuerdo en cuanto a la satisfacción laboral percibida, debe
mencionarse además que en el grafico la frecuencia (eje Y) corresponde a los 5
puntos en escala likert y el total de la satisfacción en el trabajo (eje X) corresponde
a la satisfacción de las personas encuestadas.

Figura 19.2: En el gráfico de Normal esperado vs valor observado para la prueba


de normalidad de Kolmogorov-Smirnov, se puede observar que en general la nube
de puntos correlaciona con la lı́nea recta, por lo que gráficamente no se observa
un comportamiento que permita rechazar la ”normalidad”, lo que se también se
contrasta con el valor de la prueba K-S de p > 0,192.

257
Probabilidad, Estadı́stica y sus Aplicaciones

promedio se tiene más personal de enfermerı́a. Siguiendo con el análisis, Se observa


una adecuada experiencia que es mayor a los 2 años de experiencia como mı́nimo,
en cuanto a los años trabajados en el hospital también se observa que se tienen
más de dos años laborados como mı́nimo en el hospital en estudio, lo cual permite
que el personal pueda tener una percepción relativamente adecuada acerca de la
satisfacción laboral en el hospital en estudio.
Con base en lo anterior, se procedió a verificar si existe una relación significativa
entre la satisfacción laboral como variable dependiente y las variables: edad actual, el
estatus de trabajo, el puesto, los años de experiencia, ası́ como los años trabajados en
el hospital como variables independientes o predictoras, obteniendo de acuerdo con
los resultados que existe influencia y/o una relación significativa entre la variables
predictoras y la variable de desenlace (ver Tablas 19.2 y 19.3), lo cual se puede
representar por medio de la Ec. 1 que es el modelo de regresión lineal múltiple
que se presenta a continuación: SL=14.738+(0.86)Edad Act+(3.009)Estatus Trab-
(2.112)Puesto-(0.282)AñosExp+(0.509)AñosTrabHosp.
La expresión anterior se analizó para verificar si existe una relación entre las
variables antes mencionadas, ası́ pues se procedió a llevar a cabo un análisis de
varianza (Tabla 19.2), ası́ como también pruebas de hipótesis (Tabla 19.3). En la
Tabla 19.2, se puede observar que las variables independientes se relacionan signi-
ficativamente con la satisfacción laboral con un nivel de confianza del 95 %, con un
valor p <0.042, por lo que de acuerdo con los resultados obtenidos se encuentra
evidencia significativa de que existe una relación entre los años trabajados en el
hospital, el puesto, el estatus de trabajo, la edad actual y los años de experiencia
con la variable de respuesta satisfacción laboral. Sin embargo, en la Tabla 19.3, se
pueden apreciar mediante las pruebas de hipótesis que el valor de la constante es
significativo, es decir que la lı́nea recta pasarı́a por un punto diferente al origen,
por otro lado, en el caso de la edad actual, el estatus de trabajo, el puesto, los
resultados fueron no significativos principalmente, lo que significa que no tendrı́an
influencia en la variable de respuesta pero al prescindir de estas variables el análisis
de varianza tiende a apuntar como no significativo, por lo que se decidieron dejar
en este análisis y verlas como una oportunidad de análisis más profundo, en cuanto
a los años de experiencia no son significativos al 95 % de nivel de confianza, sin
embargo convendrı́a tomarlo en cuenta ya que se encuentra muy cerca de la signifi-
cación, ası́ como también se debe mencionar que en las cuestiones socio-culturales
y organizacionales hay a menudo variabilidad, en el caso de los años trabajados en
el hospital resulto ser una variable significativa con un valor p <0.021, por lo que
en base a estos resultados se podrı́a apuntar que no hay suficiente evidencia para
contradecir, que los años trabajados en el hospital influyen significativamente en la
satisfacción laboral del hospital en estudio.
Siguiendo con el análisis de los datos obtenidos, se procedió a verificar mediante
el coeficiente de determinación si la relación entre las variables encontradas con
el modelo de regresión obtenido, permiten hacer estimaciones con una precisión
aceptable, lo cual se resume en la Tabla 19.4, de donde se tiene un coeficiente
de determinación de 0.529, es decir que el 52.9 % de la variación observada en la
satisfacción laboral es explicada por el modelo (lı́nea recta), por lo tanto la calidad
de ajuste no es satisfactoria a un coeficiente de determinación mı́nimo del 70 %,
pero es muy bueno para seguir profundizando en el tema. Por otro lado, debido
a que se tienen varios términos en la ecuación de regresión se prefiere observar la

258
Probabilidad, Estadı́stica y sus Aplicaciones

Media Desviación tı́pica N


Total Satisfacción Laboral 20.40 3.733 20
Edad actual 36.20 11.372 20
Estatus de trabajo 1.55 0.510 20
Puesto 1.85 0.67082 20
Años de experiencia 11.20 8.841 20
Años trabajados en el hospital 9.70 6.860 20

Tabla 19.1: Estadı́sticos descriptivos de las variables socio demográficas que podrı́an
influir en la satisfacción laboral del hospital en estudio

Modelo Suma de cuadrados gl Media cuadratica F sig.


1 Regresión 139.953 5 27.991 3.139 0.042(a)
Residual 124.847 14 8.918
Total 264.80 19

Tabla 19.2: Muestra el Análisis de Varianza con las siguientes variables predictoras:
(Constante), años trabajados en el hospital, puesto, estatus de trabajo, edad actual,
años de experiencia. Y como variable dependiente: el total satisfacción en el trabajo.

Modelo Coeficientes no estandarizados Coeficientes estandarizados t Sig.


1 B Error tı́pico Beta
(Constante) 14.738 4.467 3.299 0.005
Edad actual 0.086 0.089 0.263 0.971 0.348
Estatus de trabajo 3.009 1.864 0.411 1.614 0.129
Puesto -2.112 1.28 -0.379 -1.650 0.121
Años de experiencia -0.282 0.147 -0.668 -1.919 0.076
Años trabajados en el hospital 0.509 0.196 0.936 2.593 0.021

Tabla 19.3: Se muestra la prueba de hipótesis la cual también nos sirve para ve-
rificar si existe relación entre cada una de las variables edad actual, estatus de
trabajo, puesto, años de experiencia y años trabajados en el hospital con la variable
satisfacción laboral.

259
Probabilidad, Estadı́stica y sus Aplicaciones

R2 2adj la cual es aún más baja y con la cual solo se podrı́a explicar el 36 % de la
variación observada en la satisfacción laboral que es explicada por el modelo, en
cuanto a la intensidad de la relación lineal entre las variables estudiadas se observa
una correlación lineal aceptable positiva r = 0.727.
Por último, siguiendo con el análisis se puede apreciar en la Figura 19.3 que
se tiene el diagrama de cajas y bigotes, donde se muestra que en general se tuvo
una satisfacción laboral (de ligero acuerdo) por parte del personal médico, de en-
fermerı́a y otros, pero también se observa que como oportunidad de mejora se tiene
la posibilidad de llegar al completo acuerdo en la escala de likert de la satisfacción
laboral. Por otro lado, se puede observar un comportamiento atı́pico en el área de
enfermerı́a que debe tenerse en cuenta para su estudio, dada la importancia que
tiene la satisfacción laboral en el personal al cuidado de la salud.

19.4. Discusión
Los resultados obtenidos nos permiten visualizar que en general, en el personal
al cuidado de la salud del hospital en estudio se percibe en ligero acuerdo a la
satisfacción laboral del personal, por lo que es motivo de oportunidad de mejora el
estudiar las causas por las cuales no se alcanza la completa satisfacción laboral, lo
que coincide con el reporte de Silvia Portero et. al. Por otro lado, puede observarse
que en general en los profesionales del área de enfermerı́a se percibe un nivel de
satisfacción ubicado en el ligero acuerdo, sin embargo es de llamar la atención la
percepción de un profesional del área de enfermerı́a debido a que puntúa de manera
atı́pica lo que refleja ligera insatisfacción con su puesto de trabajo. Pero que en
general se coincide con otros estudios en cuanto a qué algunos de los aspectos mejor
valorados por los profesionales de enfermerı́a fueron los que hacen referencia a la
experiencia, los años trabajando en el hospital, entre otros factores, como podrı́a ser
también, la variedad de las tareas que realiza en su trabajo y a la estabilidad de su
empleo [2]. En otros estudios han mencionado que las posibilidades de promoción
suelen mostrar valoraciones bajas y que eso es causa de insatisfacción desde hace
años ya que estudios de la década de los 90 referı́an insatisfacción en este aspecto
[2]. Sin embargo en este estudio no se considero esa variable, lo que deberı́a ser
considerado para estudios posteriores.
También se coincide con otros estudios en considerar como necesario desarrollar
la teorı́a de la motivación-mantenimento de la satisfacción en el trabajo (la polı́tica
organizacional, la supervisión técnica, las relaciones interpersonales con mandos,
entre compañeros y con subordinados, la retribución, la seguridad en el trabajo, la
vida personal, las condiciones laborales y el estatus) y factores de ”mantenimiento”
(necesidades psicológicas y sociales del trabajador) [1], con el fin de incrementar la
satisfacción laboral en las instituciones de salud.
Respecto a las caracterı́sticas sociodemográficas asociadas con la satisfacción,
en este estudio, no se observa una gran diferencia entre la satisfacción del personal
médico en comparación con el de enfermerı́a y con el de otros profesionales al servicio
de la salud (ej. Técnicos radiólogos), como lo sugieren otros estudios al apuntar que
la satisfacción aumenta con el nivel profesional [1].
Siguiendo con el análisis de este estudio, coincidimos con otros estudios en
señalar que la implantación y revisión periódica de la atención ofrecida a los ciuda-

260
Probabilidad, Estadı́stica y sus Aplicaciones

Modelo R R Cuadrado R cuadrado correjida Error tı́pico de la estimación


1 0.727 0.529 0.360 2.986

Tabla 19.4: Describe si las relaciones encontradas con el modelo de regresión lineal
múltiple, permiten hacer estimaciones con una precisión aceptable.

Figura 19.3: Diagrama de caja y bigotes del puesto de trabajo vs la satisfacción


laboral

261
Probabilidad, Estadı́stica y sus Aplicaciones

danos ası́ como la satisfacción de los profesionales permitirá configurar un sistema


de información corporativa que facilite los procesos de reflexión y definición de las
polı́ticas y estrategias generales [ 1], por lo cual se tienen que promover y llevar a
cabo este tipo de estudios con más regularidad con el fin de poder tener un mejor
conocimiento del área laboral y poder establecer también las polı́ticas necesarias
que ayuden a mejorar en la dimensión de satisfacción laboral ası́ como también en
la seguridad y calidad de atención para los pacientes.

19.5. Conclusiones
En general se percibe como una fortaleza la satisfacción laboral en el hospital
en estudio, por lo que es necesario focalizar el área de oportunidad detectada a fin
de generar un proceso de mejora continua. La satisfacción laboral es una dimensión
muy importante, dado que esta puede relacionarse con la mejor atención y trato
para el paciente y por lo tanto incidir directamente sobre la seguridad del paciente.
Es necesario llevar a cabo más estudios de la satisfacción laboral en el personal de
salud en hospitales mexicanos, ası́ como también ampliar los tópicos a explorar en
este tipo de investigaciones.

262
Probabilidad, Estadı́stica y sus Aplicaciones

Bibliografı́a

[1] ROBLES-GARCÍA M., DIERSSEN-SOTOS T., MARTÍNEZ-OCHOA


E., HERRERA-CARRAL P., DÍAZ-MANDI A.R., LLORCA-DÍAZ J.
Variables Relacionadas con la Satisfacción Laboral: un Estudio Tranversal a
Partir del Modelo EFQM. Gaveta Sanitaria, Vol. 19, No. 2, 2005.

[2] CARRILLO-GARCÍA C., RÍOS-RÍSQUEZ M.I., FERNÁNDEZ-CÁNO-


VAS M.L., CELDRÁN-GIL F., VIVO-MOLINA M.C., MARTÍNEZ-
ROCHE M.E. La Satisfación de la Vida Laboral de los Enfermeros de las
Unidades Móviles de Emergencias de la Región de Murcia. Enfermerı́a Global,
Vol. 14, 2015.

[3] PRECIADO M., POZOS E., COLUNGA C., VÁZQUEZ J., Y ÁVALOS
M. Relación Entre Factores Psicosociales, Agotamiento Emocional Laboral y
Burnout en Odontólogos Mexicanos. Universitas Psychologica, Vol.16 No. 2,
2017.
[4] PORTERO DE LA CRUZ S., VAQUERO ABELLÁN M. Desgaste pro-
fesional, estrés y satisfacción laboral del presonal de enfermerı́a en un hospital
universitario. Revista Latino-Americana de Enfermagem, Vol. 23 No. 3, 2015.
[5] ORTIZ ESPINOZA R.M., MUÑOZ JUÁREZ S., TORRES CARREÑO
E. Satisfacción de los usuarios de 15 hospitales de Hidalgo, México. Rev Esp
Salud Pública, Vol. 78 No. 4, 2004

[6] BERNAL GONZÁLEZ I, PEDRAZA MELO N.A., SÁNCHEZ LIMÓN


M.L. El clima organizacional y su relación con la calidad de los servicios publicos
de salud: diseño de un modelo teórico. Revista Estudios Gerenciales, Vol. 31,
2015.

[7] SALINAS-OVIEDO C., LAGUNA-CALDERON J., MENDOZA-


MARTÍNEZ M.R. La Satisfacción Laboral y Su Papel en la Evaluación de la
Calidad de la Atención Médica. Salud Publica de México. Vol. 36, 1994.
[8] PARIS L. Estrategias de Afrontamiento del Estres Asistencial y Satisfaccion
Laboral-Personal en Medicos y Enfermeros. Revista Interamericana de Psico-
logı́a Ocupacional, Vol. 26 No.2, 2007.
[9] CARRILLO-GARCÍA C. MARTÍNEZ-ROCHE M.E., GÓMEZ-
GARCÍA C.I., MESEGUER-DE-PEDRO M. Satisfacción Laboral de

263
Probabilidad, Estadı́stica y sus Aplicaciones

los Profesionales Sanitarios de un Hospital Univeritario: Análisis General y


Catergorı́as Laborales. Anales de Psicologı́a, Vol. 31 No. 2, 2015.
[10] VELÁZQUEZ-MARTÍNEZ D, SANTOS-REYES J. Assessing the Safety
Climate in Operating Rooms: The Case of Healthcare Organizations in Mexico.
Nova Science Publishers, Inc., New York, 2012.

[11] VELÁZQUEZ-MARTÍNEZ J. D. Diagnóstico de la cultura de seguridad en


hospitales.Tesis de Doctorado. Centro de Investigacion en Ciencia Aplicada y
Tecnologı́a Avanzada. México DF, México: CICATA-Legaria.

264
Probabilidad, Estadı́stica y sus Aplicaciones

Capı́tulo 20
Aplicación del modelo exponencial en hilados textiles

Ana Marı́a Islas Cortés1 , Gabriel Guillén Buendı́a2 y Yolanda Montoya Vargas1

1
Instituto Politécnico Nacional, ESIT,
AV. IPN s/n, U. P. Adolfo López Mateos, Lindavista,
07320 GAM, Ciudad de México, México.
2
Instituto Politécnico Nacional, ESIME,
Azcapotzalco. Av. De las Granjas No. 682, Santa Catarina,
02550, Azcapotzalco, Ciudad de México.
[email protected], yolanda [email protected], [email protected]
Resumen. En este estudio fue ajustado el modelo exponencial con ası́ntota
sobre datos de la variación del diámetro de un filamento de poliamida de tı́tulo
nominal de 25 tex (peso en gramos de 1,000 metros de filamento) en función de la
tensión aplicada. El ajuste numérico fue realizado mediante el método de mı́nimos
cuadrados no lineales, ası́ como dos técnicas de transformación lineal del modelo en
estudio. Se concluye que los ajustes numéricos resultaron significativos al 99 %.

Abstract. In this study the exponential model with asymptote was fitted on dia-
meter variations data of a 25 tex polyamide filaments nominal title (weight in grams
of 1,000 meters of filament) in function to applied tension. Numerical fit was made
using nonlinear least squares method, as well as two linear transformation techni-
ques of the model under study. It is concluded that numerical fit was significant at
99 %.

Palabras clave: Estructuras textiles, Ecuación diferencial, Mı́nimos cuadrados.

20.1. Introducción
El mejor conocimiento de las estructuras textiles a lo largo de la cadena de
producción permite que el consumidor final disponga de un producto que satisfaga
plenamente sus necesidades.
Varias caracterı́sticas o propiedades de hilados evolucionan como una función
exponencial, como es el caso de la contracción residual ( %) de un filamento de
poliéster de 17.0 tex con 68 multifilamentos que fue estirado en una máquina in-
dustrial a diversas temperaturas, se ilustra en la Figura 1. Es importante conocer
dicha propiedad porque nos indica la capacidad del material a deformarse cuando

265
Probabilidad, Estadı́stica y sus Aplicaciones

es sometido al calor [1] .

Figura 20.1.- La contracción residual ( %) de multifilamentos de poliéster esti-


rados a diferentes temperaturas (◦ C) en una máquina industrial.

Otra propiedad que evoluciona de la misma manera es la resistencia especı́fica


(lbf ) de un hilado de algodón/poliéster de tı́tulo 40 tex, cuando se ha incrementado
el contenido de fibra natural ( %), como se muestra en la Figura 20.2. Aunque la
resistencia del hilado se reduce, gana en el confort que está muy relacionada con la
permitividad al vapor de agua del algodón.

Figura 20.2.- La resistencia especı́fica (lbf ) de un hilado algodón/poliéster cuan-


do se incrementa el contenido de fibra natural ( %).

Las propiedades de las estructuras textiles han sido estudiadas mediante mode-
los matemáticos, en este estudio el objetivo fue ajustar el modelo exponencial a una
caracterı́stica de los hilados textiles.

20.2. Diámetro de un filamento de poliamida so-


metido a tensión.
La variación del diámetro de un filamento de poliamida (mm) de tı́tulo 25 tex
cuando es sometido a diversos niveles de tensión (g), sin llegar a la rotura [3]; tam-
bién evoluciona como una exponencial, como se muestra en Figura 20.3.

266
Probabilidad, Estadı́stica y sus Aplicaciones

Figura 20.3.- Variación del diámetro (mm) de un filamento de poliamida de tı́tu-


lo 25 tex cuando es sometido a diferentes niveles de tensión (g).

La evolución de la caracterı́stica del hilado ilustrada arriba cumple la expresión:


= −k (φ − φmin ) (20.1)

Donde:
φ es el diámetro del hilado, σ es la tensión aplicada al hilado, φmin es el diámetro
del hilado antes de romperse uando es sometido a una tensión deteminada, −k es
la constante de evolución del diámetro del hilado sometido a tensión.

Por separación de variables:

Z φ∗ Z σ

= −k dσ (20.2)
φ0 φ − φmin 0

Integrando:

φ∗ = (φo − φmin ) e− k σ + φmin (20.3)


El diámetro estimado del hilado φ∗ expuesto en la expresión (20.3) requiere de-
terminar numéricamente sus constantes, lo anterior mediante la técnica de mı́nimos
cuadrados no lineales [2], que en esencia minimiza la suma de cuadrados de las
desviaciones (o error) SSE entre los valores ajustados φ∗ a través del modelo y los
valores observados:

n
X 2
SSE = [φ∗ − φ ] (20.4)
i=1

267
Probabilidad, Estadı́stica y sus Aplicaciones

Es decir,

n
X 2
(φ0 − φmin ) e−k σ + φmin − φ

SSE = ]
i=1

La SSE tiene un mı́nimo, ocurre para valores que satisfacen las derivadas par-
ciales:
∂SSE ∂SSE ∂SSE
= = = 0
∂ (φ0 − φmin ) ∂k ∂φmin

Se obtiene un sistema de tres ecuaciones no lineales con tres incógnitas, como


se indica:
n
X n
X n
X
(φ0 − φmin ) e−2 k σ + φmin e− k σ = φ e− k σ
i=1 i=1 i=1

n
X n
X n
X
(φ0 − φmin ) σ e−2kσ + φmin σ e−k σ = σ φ e−kσ
i=1 i=1 i=1

n
X n
X
(φ0 − φmin ) e−kσ + φmin n = φ
i=1 i=1

Mismo que se resuelve por un método iterativo, como es el método de Newton-


Raphson.
Existen otras técnicas de evaluación numérica de modelos no lineales mediante
su correspondiente transformación lineal, que también logra niveles de ajuste muy
significativos; su estimación requiere una calculadora de bolsillo que disponga de
regresión lineal simple.
A continuación, se exponen dos técnicas de transformación lineal del modelo
exponencial.
Una técnica usa un algoritmo que sirvió para evaluar las constantes numéricas
en cinética quı́mica [4]. En esencia indica que, tomando valores sobre el modelo
igualmente espaciados en las abscisas, se establecen dos subconjuntos de n/2 puntos
cada uno (σ, φ) y (σ 0 , φ0 ). Donde (σ, φ) son los primeros n/2 puntos de la curva y
(σ 0 , φ0 ) son los siguientes n/2 puntos de esta, y cumplen respectivamente:

σ → φ (20.5)
σ0 → φ0

268
Probabilidad, Estadı́stica y sus Aplicaciones

A partir de estos subconjuntos de puntos se construye un arreglo rectangular,


en donde la diferencia entre cada una de las abscisas y sus correspondientes primas
es una constante de desplazamiento. Por ende:

σ0 = σ + τ
Aplicando la primera expresión (20.5) al modelo exponencial, se tiene:

φ − φmin = (φ0 − φmin ) e− k σ (20.6)


Para la segunda expresión de (5) al mismo modelo:

φ 0 − φmin = (φ − φmin ) e− k (σ + τ ) (20.7)


Dividiendo la ecuación (20.7) entre la ecuación (20.6) miembro a miembro, y
simplificando se llega a:

φ 0 = φ e− kτ + φmin 1 − e− k τ

(20.8)
k = − LNτ(m) , φmin = 1 − eb−k τ
Corresponde a la transformación lineal del modelo exponencial expuesto en an-
tecedentes, aplicando regresión lineal simple a la columna transformación versus
variable respuesta, se obtuvo la pendiente de la recta e intersección al eje verti-
cal. Con ello, fue posible hallar el valor de κ y φmin , como se indicó en (20.8).
Finalmente, despejando de la expresión (20.3) el último término, se llega a:
φ − φmin
φ0 − φmin = (20.9)
e−k σ
Está completa la estimación numérica del modelo exponencial en estudio.
La otra técnica que permite hallar las constantes numéricas del modelo expo-
nencial es a través de tres puntos de apoyo leı́dos sobre la curva [5]. Es decir, dos
puntos sobre los extremos de la curva, el tercer punto es:
 
σ1 + σ2
P1 (σ1 , φ1 ) , P2 (σ2 , φ2 ) , P3 , φ3
2
El primer punto por estar colocado en la curva cumple:

φ1 − φmin = (φ0 − φmin ) e− k σ1 ( 20.10)


Por la misma razón, el segundo punto se escribe:

φ1 − φmin = (φ0 − φmin ) e− k σ1 (20.11)


Entonces, el tercer punto:
σ1 + σ2
φ3 − φmin = (φ0 − φmin ) e− k σ( 2 ) (20.12)
Multiplicando las ecuaciones (20.10) y (20.11) miembro a miembro e igualando
con el cuadrado del tercer punto (20.12), y simplificando:

φ1 φ2 − φ23
φmin = (20.13)
φ1 + φ2 − 2 φ3

269
Probabilidad, Estadı́stica y sus Aplicaciones

Con ello, fue posible realizar la transformación lineal del modelo exponencial:

LN (φ − φmin ) = −k σ + LN (φ0 − φmin ) (20.14)


k = − m , (φ0 − φmin ) = eb
Igual que la técnica anterior, al aplicar regresión lineal simple sobre la columna
transformación versus variable independiente se obtienen los valores numéricos de
la pendiente e intersección al eje vertical, de donde es posible obtener los valores de
κ y (φ0 - φmin ), como se indicó en (20.14).

20.3. Presentación y análisis de resultados.


El ajuste numérico del modelo exponencial se realizó sobre los datos de variación
del diámetro de filamentos sometidos a tensión sin llegar a la rotura, señalados en
la Tabla 1.

Tabla 20.1.- Datos de la variación del diámetro de un filamento de poliamida en


función de la tensión aplicada.

No. Tensión Diámetro No. Tensión Diámetro


σ (g) φ (mm) σ (g) φ (mm)
1 2 0.353 7 20 0.298
2 5 0.344 8 23 0.295
3 8 0.324 9 26 0.293
4 11 0.312 10 29 0.29
5 14 0.308 11 32 0.288
6 17 0.304 12 35 0.286

Aplicando los mı́nimos cuadrados no lineales conduce al modelo numérico-funcional


siguiente:

φ∗ = 0.0858 e− 0.0873 σ + 0.2829 (20.15)


r = 0.9945 R2 = 0.9891 χ2 = 1.76E −4

De acuerdo con el coeficiente de correlación, coeficiente de determinación y el


test de chi cuadrada, la bondad de ajuste numérico fue de 99 % de confianza es-
tadı́stica. En la figura 20.4 se aprecia el elevado nivel de ajuste numérico alcanzado.

270
Probabilidad, Estadı́stica y sus Aplicaciones

Figura 20.4.- La bondad del ajuste numérico sobre la variación del diámetro de
un filamento en función de la tensión aplicada, fue del 99 % de confianza estadı́stica
usando los mı́nimos cuadrados no lineales.

De acuerdo con algoritmo de Guggenheim expuesto en antecedentes, se cons-


truyó el arreglo rectangular, Tabla 20.2:

Tabla 20.2.- Arreglo rectangular de Guggenheim usando los datos de la variación


del diámetro del filamento de poliamida sometido a diversos niveles de tensión.

σ σ0 φ φ0
(g) (g) (mm) (mm)
2 20 0.353 0.298
5 23 0.344 0.295
8 26 0.324 0.293
11 29 0.312 0.29
14 32 0.308 0.288
17 35 0.304 0.286

Como los datos fueron igualmente espaciados sobre la curva, permite determinar
la constante de desplazamiento:

τ = σ 0 − σ = 18

Procediendo a aplicar regresión lineal simple a los datos de la tabla 20.2, según
la expresión (20.8). Los parámetros de la recta de regresión se indican en Figura
20.5.

271
Probabilidad, Estadı́stica y sus Aplicaciones

Figura 20.5.- Recta de regresión obtenida al relacionar tensión versus columna


de transformación lineal de acuerdo con el algoritmo de Guggenheim.

Con los valores de la pendiente e intersección al eje vertical de la recta de regre-


sión anterior, fue posible determinar parámetros −k y φmin . El tercer parámetro del
modelo exponencial se obtuvo de calcular el promedio de (20.9) usando los valores
de la Tabla 1.

Entonces, el modelo numérico-funcional resulta:

φ∗ = 0.0838 e− 0.0849 σ + 0.2826 (20.16)


r = 0.9941 R2 = 0.9883 χ2 = 1.88E −4

La bondad de ajuste numérico del modelo fue significativa al 99 %, de acuerdo


con el coeficiente de correlación, coeficiente de determinación y test de chi cuadrada.
En la Figura 20.6 fue ilustrada lo antes señalado, comparada con el ajuste realizado
por mı́nimos cuadrados no lineales.

Figura 20.6.- Ajustes numéricos del modelo exponencial realizados mediante la


técnica de mı́nimos cuadrados no lineales y el algoritmo de Guggenheim ilustrados
en color rojo y negro respectivamente.

Continuando con el estudio, se procedió a determinar las constantes del mode-


lo no lineal mediante la técnica de tres puntos de apoyo. Los puntos considerados
fueron:

272
Probabilidad, Estadı́stica y sus Aplicaciones

P1 (2, 0.353) , P2 (35, 0.286) , P3 (18.5, 0.3)

Al sustituir dichos puntos en la expresión (20.13) se llega:

φmin = 0.2809 (20.17)

Con ello, al aplicar regresión lineal simple a los datos de la tabla 20.1, de acuerdo
con la transformación lineal (20.14) se obtuvo Figura 20.7.

Figura 20.7.- Recta de regresión obtenida al relacionar la tensión versus columna


de transformación lineal de acuerdo con la técnica de los tres puntos de apoyo.

De la pendiente e intersección al eje vertical de la ecuación de regresión lineal


anterior, se obtienen los valores de κ y (φ0 - φmin ). Por ende, el modelo numérico-
funcional obtenido es:

φ∗ = 0.0836 e− 0.0781 σ + 0.2809 (20.18)


r = 0.9936 R2 = 0.9872 χ2 = 2.06E −4

La bondad de ajuste numérico fue significativa al 99 % de acuerdo con el co-


eficiente de correlación, coeficiente de determinación y test de chi cuadrada. En
la Figura 20.8 aparece la bondad de ajuste numérico antes indicado (color negro),
comparado con el alcanzado con los mı́nimos cuadrados no lineales (color rojo).

273
Probabilidad, Estadı́stica y sus Aplicaciones

Figura 20.8.- Ajustes numéricos del modelo exponencial realizados mediante la


técnica de tres puntos de apoyo y mı́nimos cuadrados no lineales, ilustrados en color
negro y rojo respectivamente.

20.4. Conclusiones
Las técnicas de transformación lineal del modelo exponencial aquı́ expuestas
condujeron a ajustes numéricos significativos al 99 % de confianza, muy similar a la
bondad de ajuste numérico obtenido con regresión no lineal. Las primeras tienen la
ventaja que pueden resolverse con el uso de una calculadora de bolsillo que disponga
de regresión lineal simple.

274
Probabilidad, Estadı́stica y sus Aplicaciones

Bibliografı́a

[1] AGUIRRE, F. Influencia de las condiciones del proceso de texturizado en las


propiedades mecánicas de hilos de poliéster, Tesis de Maestrı́a en Ciencias, SEPI
ESIT, Instituto Politécnico Nacional, 2009.

[2] GUILLEN, G., ET AL. Contracción residual de multifilamentos texturiza-


dosRevista electrónica Humanidades, Tecnologı́a y Ciencia del IPN, ISSN 207-
1957. Ejemplar 18, Enero-Junio 2018.
[3] HEARLE, J.W.S., GROSBERG, P. AND BACKER, S. Structural Me-
chanics of Fibers, Yarns and Fabrics, Vol. 1.Wiley Interscience. 1969

[4] ISLAS, A. M., ET AL. Alternativas al gráfico de probabilidad normal como


test de validación. Revista electrónica Humanidades, Tecnologı́a y Ciencia del
IPN, ISSN 207-1957. Ejemplar 16, Enero-Junio 2017.
[5] ISLAS, A. M., ET AL. La ecuación de Gompertz como modelo de crecimiento
Revista electrónica Humanidades, Tecnologı́a y Ciencia del IPN, ISSN 207-1957.
Ejemplar 15, Julio-Diciembre 2016.
[6] WACKERLY , D., MENDENHALL, W. AND SCHEAFFER, R. Es-
tadı́stica matemática con aplicaciones. Séptima edición, CENGAGE Learning.
2013.

275
PROBABILIDAD, ESTADÍSTICA Y SUS APLICACIONES

Editores:

Dr. Hugo Adán Cruz Suárez.

Dr. Fernando Velasco Luna.

Dr. José Dionicio Zacarías Flores.

Dr. Francisco S. Tajonar Sanabria.

Dra. Hortensia J. Reyes Cervantes.

Dr. Bulmaro Juárez Hernández.

Dr. Víctor Hugo Vázquez Guevara (Responsable)

Se terminó de imprimir en Septiembre de 2018

en los talleres de A.L. Digital

El cuidado de la edición y la producción editorial son

de Víctor Hugo Vázquez Guevara.

El tiraje es de 1000 ejemplares

También podría gustarte