Probabilidad, Estadística y Sus Aplicaciones
Probabilidad, Estadística y Sus Aplicaciones
Probabilidad, Estadística y Sus Aplicaciones
Editores:
Hugo Adán Cruz Suárez
Bulmaro Juárez Hernández
Francisco Solano Tajonar Sanabria
Hortensia Josefina Reyes Cervantes
Fernando Velasco Luna
José Dionicio Zacarías Flores
Víctor Hugo Vázquez Guevara (responsable)
ISBN: 978-607-525-589-7
www.buap.mx
www.dgp.buap.mx
Av. San Claudio y 18 sur, Colonia San Manuel, Puebla, Pue. CP 72570
www.fcfm.buap.mx
Capítulo 1 ……………………….………………………………………………………………………………………………..1
Índice de la calidad de la Vivienda en México
G. Olivera y O.V. Serrano
Capítulo 2 ……………………….………………………………………………………………………………………………13
Uso del condón de los adolescentes según las
características de la pareja sexual
C. Menkes, I.A. Sosa y L. Núñez
Capítulo 3 ……………………….…………………………………………………………………………………………….25
Una caracterización de la satisfacción estudiantil
mediante análisis de clases latentes
R. Álvarez-Vaz y E. Vernazza
Capítulo 4 ……………………….…………………………………………………………………………………………….40
Modelación espacial de la plaga Sigatoka Negra
(Mycosphaerella fijiensis) en cultivos de plátano
del estado de Guerrero
J.E. Solís, M. Guzmán, R. Reyes y D. Briones
Capítulo 5……………………….……………………………………………………………………………………………….53
Aplicación del análisis de supervivencia en datos
de pacientes sometidos a transplante renal
J.A. Gil, B. Juárez y V.H. Vázquez
Capítulo 6………………………………………………………………………………………………………………………64
Modelación espacial de la infestación del ácaro rojo
De las palmas (Raoiella Indica) en el estado de
Guerrero con un proceso espacial Poisson
D.A. Ozuna, M. Guzmán, F. Godínez y R. Reyes
Capítulo 7………………………………………………………………………………………………………………………..76
Una aplicación de la metodología Biplot Logístico:
Análisis de la sostenibilidad empresarial
A. Urruticoechea y E. Vernazza
Capítulo 8………………………………………………………………………………………………………………………..92
Análisis de la deserción en las licenciaturas
de la FCFM-BUAP mediante el modelo de
riesgo proporcional semiparamétrico
B.X. Muñoz, B. Juárez, L. Cervantes y H. Reyes
Capítulo 9………………………………………………………………………………………………………………………108
Modelación estadística con imágenes
Satelitales en Ciencias Ambientales
A.A. Oroza, G. Linares, H. Reyes y
M. L. Sandoval
Capítulo 10…………………………………………………………………………………………………………………….124
Riesgo de Crédito usando Redes Neuronales
A. Herrera, H. Reyes, G. Linares y B. Juárez
Capítulo 11…………………………………………………………………………………………………………………….136
Embarazo adolescente, desigualdad social
y salud sexual y reproductiva según
condición de indigenismo en México
I.A. Sosa e I. A. Quallenberg
Capítulo 12…………………………………………………………………………………………………………………….150
Uso de la distribución Bernoulli Multivariada
en salud bucal
R. Álvarez-Vaz y F. Massa
Capítulo 13…………………………………………………………………………………………………………………….166
Determinación de la distribución de
Probabilidad de la demanda en un
modelo de control de inventarios
E. Hernández y R. Ilhuicatzi
Capítulo 14…………………………………………………………………………………………………………………….179
El Conteo en la Probabilidad
F. Tajonar, E. Morales, F. Velasco,
H. Cruz y J. Zacarìas
Capítulo 15…………………………………………………………………………………………………………………….191
Optimalidad de políticas (s,S) para un modelo
de inventarios vía la teoría de los procesos
de decisión de Markov
R. Blancas, H. Cruz, F. Velasco y F. Tajonar
Capítulo 16…………………………………………………………………………………………………………………….208
Reemplazo óptimo de un equipo y
algoritmo creciente de inducción
hacia atrás
R.M. Flores, R. Ilhuicatzi y R. Rosales
Capítulo 17…………………………………………………………………………………………………………………….225
Juegos Estocásticos y criterios de
rendimiento
C. Briones, V.H. Vázquez y D. Zacarías
Capítulo 18…………………………………………………………………………………………………………………….238
Probabilidad de localización de una
Partícula en un potencial isotónico
cuántico
M. Castillo y M.A. Maya
Capítulo 19…………………………………………………………………………………………………………………….252
Análisis preliminar de la satisfacción
laboral de un hospital del estado
de Puebla
J.D. Velázquez, J.M. Hernández,
C. Solís y J. Cuéllar
Capítulo 20…………………………………………………………………………………………………………………….265
Aplicación del modelo exponencial
en hilados textiles
A.M. Islas, G. Buendía y
Y. Montoya
Probabilidad, Estadı́stica y sus Aplicaciones
Capı́tulo 1
1
Índice de Calidad de la Vivienda en México
DGAPA-UNAM, ”La polı́tica de vivienda en propiedad ¿Dónde estamos veinte años después?
Una mirada global y desde Morelos”, coordinado por los autores.
1
Probabilidad, Estadı́stica y sus Aplicaciones
1.1. Introducción
La vivienda en México ha sido uno de los sectores privilegiados en los programas
de desarrollo de los gobiernos federales desde fines del siglo XX, pero sobre todo en
lo que va del tercer milenio. La centralidad que ha tenido este sector se cimienta en
su importante aportación al Producto Interno Bruto, ası́ como en su contribución
para resolver una de las necesidades primordiales de la población [3]. Del año 2000
a la fecha, sin embargo, cabe distinguir dos etapas en la polı́tica federal de vivien-
da, pero sobre todo, en las acciones ejecutadas por organismos públicos como el
Instituto del Fondo Nacional de la Vivienda para los Trabajadores (INFONAVIT)
y el Fondo de la Vivienda del Instituto de Seguridad y Servicios Sociales de los
Trabajadores del Estado (FOVISSSTE), ası́ como la Comisión Nacional de Vivien-
da (CONAVI). La primera etapa (2000-2008) se constituyó en un periodo dorado
para el otorgamiento de créditos hipotecarios, favorecido, entre otras razones, por
la existencia de un mercado o ´demanda efectiva´ conformado por trabajadores
formales con ingresos a partir de 2.6 veces el salario mı́nimo, pero sobre todo por
arriba de 4 veces el salario mı́nimo. A ese auge contribuyó la estabilidad económica,
la reducción progresiva de las tasas de interés y el fortalecimiento del sector finan-
ciero [1]. La evolución positiva del sector vivienda se tradujo en la asignación de 5.2
millones de créditos y subsidios, de los cuales dos terceras partes (66 por ciento)
sirvieron para financiar la venta de vivienda nueva. Estas acciones, sin embargo,
aunque debı́an centrarse en la disminución del déficit cuantitativo de vivienda (ca-
sas que debı́an reemplazarse por término de la vida útil de sus materiales y 756
mil hogares sin vivienda en 2001) [2], se orientaron más a atender las necesidades
de vivienda de los hogares de nueva formación (750 mil por año, misma cantidad
que los créditos programados a otorgarse). Parte importante de la demanda provino,
además, de propietarios patrimonialistas que compraron casas nuevas sin ocuparlas,
en tanto que otros que sı́ las requerı́an dejaron de pagarlas y las abandonaron por
su lejanı́a. Como resultado del creciente stock de vivienda nueva desocupada a cau-
sa de la ubicación de las unidades habitacionales construidas lejos de las cuencas
de empleo, con insuficiente acceso a equipamiento urbano e inadecuada conexión
con los sistemas de transporte, ası́ como debido a la crisis financiera de dos de las
principales empresas constructoras, coincidente con la recesión económica de 2008,
el modelo de desarrollo habitacional también entró en crisis. Diversos análisis sobre
los resultados de la polı́tica habitacional resaltaron el inconveniente de privilegiar
la atención del déficit cuantitativo cuando sólo representaba el 42.3 del rezago habi-
tacional al inicio de siglo. De ahı́ que en el periodo 2009 a la fecha (2018), el énfasis
de la polı́tica de vivienda se reorientó hacia la atención del rezago cualitativo, sin
desatender las necesidades de vivienda nueva ni el déficit cuantitativo. ¿Qué mide
el rezago cualitativo? De acuerdo con la metodologı́a de la Sociedad Hipotecaria
Federal (SHF)[6], la calidad de los materiales con que están construidas las vivien-
das -ya sea materiales en deterioro o materiales de calidad regular- , y aquellas que
están en situación de hacinamiento cuando tienen más de 2.5 personas por recáma-
ra. Los datos resultantes del análisis de la Encuesta Intercensal 2015 del INEGI,
con base en la metodologı́a de la SHF arrojaron que 67.8 % del parque habitacional
del paı́s estaba en situación de rezago habitacional cualitativo, correspondiente a
8.9 millones de viviendas. Desglosado en sus tres componentes la mayor parte del
rezago (67.8 %) estaba en las viviendas con hacinamiento (6 millones); le seguı́a la
2
Probabilidad, Estadı́stica y sus Aplicaciones
vivienda construida con materiales regulares (30.9 %) (2.7 millones), en tanto que
la vivienda construida con materiales en deterioro (110 mil) apenas representaba
1.2 por ciento. Ahora bien, aunque la medición del rezago cualitativo permite to-
mar medidas para su atención, estas se constriñen a soluciones como ampliación o
mejoramiento de vivienda en función de los materiales con que están construidas.
Dicho ejercicio omite otros aspectos relacionados con el tipo de servicios básicos a
que tienen acceso las viviendas, relacionadas con condiciones de salubridad, y que
son indicadores también importantes. Esto es posible medirlo con otro tipo de técni-
cas y métodos, como puede ser un ı́ndice de Calidad de Vivienda, del cual derivan
resultados que permitirı́an tomar medidas complementarias a las que considera la
polı́tica de vivienda vigente. De acuerdo a los resultados principales, la atención a la
condición de los servicios hidrosanitarios de las viviendas, contribuirı́a a mejorar de
forma notable la calidad de las viviendas a nivel nacional, y su incidencia principal
ocurrirı́a en los estados más desfavorecidos social y económicamente, que son los del
sur del paı́s.
1.3. Metodologı́a
1.3.1. Unidad de análisis
Se analizan las viviendas que cumplen con la caracterı́stica de ser particulares y
estar habitadas en cada una de las entidades federativas del paı́s.
1.3.2. Variables
Se utilizan diez variables que reflejan las caracterı́sticas de las viviendas relacio-
nadas con el tipo de materiales de construcción, el nivel de acceso a servicios, ası́
como condiciones de salubridad y de hacinamiento en que se encuentran las casas-
habitación.
3
Probabilidad, Estadı́stica y sus Aplicaciones
4
Probabilidad, Estadı́stica y sus Aplicaciones
1.4. Resultados
Utilizando la matriz de correlaciones se obtuvieron los eigenvalores o valores
propios y eigenvectores o vectores principales. Se estandarizaron las variables ori-
ginales para que cada una de ellas sea de igual importancia en el cálculo de las
CP o factores. En el cuadro 1.1, se presentan los valores propios y sus porcentajes
de variación correspondientes. Se observa que las dos primeras componentes prin-
cipales representan el 78.5 % de la variabilidad de los datos y la disminución del
segundo al tercer valor principal es del 30.7 %. Por lo tanto, según el criterio de la
raı́z principal y del porcentaje de variación3 el número apropiado de nuevos factores
3 En el criterio de la raı́z principal, sólo se consideran significativos los valores propios o auto-
valores mayores que 1. Esto se basa al considerar el cálculo de CP con datos estandarizados en
5
Probabilidad, Estadı́stica y sus Aplicaciones
es dos4 . El primer factor, que es el que explica la mayor variabilidad de los datos, es
el que se utilizó para calcular las proyecciones de los datos originales en los nuevos
ejes componentes principales, y de esta manera, obtener el ı́ndice de calidad de las
viviendas para cada una de las entidades federativas.
El rango de variabilidad del ı́ndice es muy amplio, lo cual sugiere que podrı́an
formarse grupos de entidades federativas similares entre sı́ y disı́miles entre los
grupos. Mediante un análisis de clúster o de cúmulos, es posible identificar objetos
con caracterı́sticas similares. Aplicando esta metodologı́a5 , se obtienen los siguientes
base a la matriz de correlaciones. El criterio del porcentaje de variación, consiste en declarar como
diferente de cero, a tantas raı́ces caracterı́sticas como sea necesario, para que las nuevas variables
expliquen un porcentaje de la variación original considerado como satisfactorio.
4 En el caso del cálculo del ı́ndice de calidad, se utilizó la primera CP, por ser, por definición,
6
Probabilidad, Estadı́stica y sus Aplicaciones
Componente
IC1 IC2 IC3
Con paredes de tabique, ladri- 0.638 0.662 0.125
llo,cantera, etc
Con techos que son de losa de 0.756 0.380 -0.175
concreto o viguetas con bovedi-
llo.
Con pisos de cemento, firme, mo- 0.945 0.052 0.025
saico, madera u otro.
Con cuarto para cocinar. 0.697 -0.226 -0.631
Con luz eléctrica. 0.791 0.384 0.128
Con agua entubada que obtienen 0.928 -0.230 0.167
de llaves o mangueras que están
dentro de la vivienda.
Con servicio sanitario. 0.948 -0.219 -0.058
Con taza de baño exclusiva de la 0.608 -0.544 0.503
vivienda.
Con drenaje a la red pública o 0.886 0.074 0.221
fosa séptica o biodigestor.
Sin hacinamiento. 0.837 -0.262 -0.282
grupos:
Región 1: Aguascalientes, Jalisco, Nuevo León, Distrito Federal, Coahuila de
Zaragoza, Tamaulipas, Sonora, Baja California Sur, México, Tlaxcala, Guana-
juato, Querétaro, Sinaloa, Quintana Roo, Nayarit, Hidalgo, Morelos, San Luis
Potosı́, Yucatán, Puebla, Michoacán, Colima, Baja California y Chihuahua.
Región 2: Campeche, Veracruz y Tabasco.
Región 4: Guerrero y Oaxaca.
Región 5: Chiapas.
En la Figura 1.2, se representan las 32 entidades federativas, utilizando las dos
primeras componentes principales. Lo grupos que se forman corresponden a las re-
giones descritas anteriormente. Lo más evidente en esta representación, es la enorme
desigualdad que existe en los estados del sur-sureste, ya que los estados de Chiapas,
Guerrero y Oaxaca en un grado extremo, junto con Campeche, Veracruz y Tabasco
padecen rezagos importantes en términos de calidad de la vivienda; en contraste
con Nuevo León, Aguascalientes, Distrito Federal, Coahuila y Jalisco que cuentan
con los valores más altos del ı́ndice de calidad.
7
Probabilidad, Estadı́stica y sus Aplicaciones
8
Probabilidad, Estadı́stica y sus Aplicaciones
1 Aguascalientes
2 Baja California
3 Baja California Sur
4 Campeche
5 Chiapas
6 Chihuahua
7 Coahuila de Zaragoza
8 Colima
9 Distrito Federal
10 Durango
11 Guanajuato
12 Guerrero
13 Hidalgo
14 Jalisco
15 México
16 Michoacán de Ocampo
17 Morelos
18 Nayarit
19 Nuevo León
20 Oaxaca
21 Puebla
22 Querétaro
23 Quintana Roo
24 San Luis Potosı́
25 Sinaloa
26 Sonora
27 Tabasco
28 Tamaulipas
29 Tlaxcala
30 Veracruz de Ignacio de la Llave
31 Yucatán
32 Zacatecas
9
Probabilidad, Estadı́stica y sus Aplicaciones
10
Probabilidad, Estadı́stica y sus Aplicaciones
1.5. Conclusión
Según los resultados obtenidos con la aplicación de la metodologı́a de CP, por
medio de la primera componente principal es posible describir la calidad de las vi-
viendas con un indicador que es combinación lineal de 10 variables. Las variables
originales que conforman este indicador, son las relacionadas con servicios hidrosa-
nitarios y material del suelo en la vivienda.
Con la regionalización del paı́s por medio del análisis de cúmulos, se identifican
desigualdades importantes en la calidad de las viviendas por regiones. La región más
desfavorecida es el sur (Oaxaca, Guerrero y Chiapas), seguida de otros tres estados
del sureste (Campeche, Tabasco y Veracruz). La primera de ellas con fuerte presen-
cia de población rural y tradicionalmente asociada con pobreza y atraso económico;
los otros tres estados, relacionados con el declive de la industria petrolera. En el caso
opuesto, las mejores condiciones de vivienda corresponden a las entidades donde se
localizan las tres principales zonas metropolitanas del paı́s, que son la Ciudad de
México, Guadalajara (Jalisco) y Monterrey (Nuevo León), ası́ como otras entidades
con dinámicos procesos de urbanización reciente y fuerte concentración económica
en la ciudad principal (Aguascalientes y Querétaro), ası́ como Coahuila.
Para disminuir la brecha entre las regiones más desarrolladas y las más desfavo-
recidas, es necesario tomar medidas para aumentar la calidad de las viviendas.
Es importante mencionar, que las 10 variables utilizadas en la regionalización y en
el análisis de componentes principales no son suficientes para describir la calidad
de la vivienda, ya que no reflejan la situación exacta del paı́s. Consideramos que
es necesario ampliar el número de variables que se relacionen con la calidad de la
vivienda, para hacer una evaluación más precisa del desarrollo regional, dadas las
implicaciones que pudo tener el sismo de 2017 en las entidades afectadas.
Por otra parte, sin embargo, una posible implicación de polı́tica que pudieran
tener los resultados del ejercicio de componentes principales aplicado, es que los
programas de mejoramiento y ampliación de vivienda que tienen a cargo los orga-
nismos nacionales de vivienda y el gobierno federal, que otorgan créditos y subsidios,
respectivamente, pudieran dirigirse al mejoramiento de los servicios hidrosanitarios
como una forma de mejorar la calidad de la vivienda, ya que actualmente los prime-
ros dan prioridad a la ampliación de las viviendas mediante la construcción de un
cuarto adicional. Con esta acción se complementarı́an las medidas que actualmente
se llevan a cabo para reducir el rezago habitacional prevaleciente, que es de carácter
cualitativo, más que cuantitativo.
11
Probabilidad, Estadı́stica y sus Aplicaciones
Bibliografı́a
[1] BBVA, México. Situación inmobiliaria, BBVA Research, julio, México, 2010.
[2] CONAFOVI, Rezago Habitacional, México, Consejo Nacional de Fomento a la
Vivienda, 2002.
12
Probabilidad, Estadı́stica y sus Aplicaciones
Capı́tulo 2
Uso del condón de los adolescentes según las caracterı́sticas de la pareja sexual
Abstract. The main objective of the present study is to identify which characte-
ristics of sexual partners increase the likelihoods of condom use in the case of 14 to
19 year old students who have begun their sexual life.
We analyze the relevant sociodemographic characteristics of the students and we
establish several comparisons between the genders and between the different fede-
ral entities where they live through bivariate analysis. In order to understand the
factors which tend to increase sexual protection among the mentioned group, we
use models of logistic regression. The dependent variable is male condom use during
their last sexual relation and the independent variables are the different characte-
ristics of sexual partners.
Results show that more gender equity tends to decrease the likelihood of condomless
sexual relations occurring in the case of the studied group. This applies to dispa-
rities between their respective ages as much as to power imbalances associated to
different sexual-related topics.
13
Probabilidad, Estadı́stica y sus Aplicaciones
2.1. Introducción
El embarazo adolescente en México es un problema importante no sólo de salud
sexual y reproductiva sino de derechos sexuales, reproductivos y humanos y ha ad-
quirido mayor visibilidad en las últimas décadas.
Al respecto, diversos estudios han señalado que el embarazo en edades tempranas
puede limitar las opciones de desarrollo personal de los adolescentes en determina-
dos contextos socioculturales [1]. Para el caso mexicano las estimaciones sugieren
que las gestaciones de las adolescentes de 15 a 19 años, constituyeron 17.5 % de la
tasa de embarazo del total de mujeres de 15 a 49 años en 2013, además, a partir
de las encuestas nacionales, se ha observado un ligero aumento en los últimos años,
ya que la tasa especı́fica de 15 a 19 años pasó de 68 a 85 embarazos por cada mil
mujeres, entre 2005 y 2013 [2].
Cabe mencionar, que diversos estudios en el tema, han dado origen a una reflexión
en torno a los vı́nculos entre las relaciones y desigualdades de género y los compor-
tamientos y actitudes frente a la salud y a la sexualidad. Desde esta perspectiva,
se han propuesto algunas dimensiones analı́ticas para profundizar en el estudio de
la forma en que la construcción de las identidades y relaciones de género y las de-
sigualdades de acceso al poder se constituyen como un factor de riesgo en torno a
la salud y a la sexualidad tanto para las mujeres como para los hombres a partir de
distintos mecanismos: la construcción simbólica del cuerpo, la asignación genérica
del concepto de cuidado, la relación entre la afirmación de la identidad de género,
el comportamiento sexual y las decisiones sobre reproducción [5].
Ası́, más allá de la inestabilidad en las parejas sexuales de los adolescentes, las
evidencias empı́ricas han enfatizado en el importante rol que juegan las desigual-
dades de género y poder (que se intersectan e interactúan con otras desigualdades
sociales como la clase social, la edad, la etnia, etc.). Estas desigualdades dificultan
las negociaciones en torno al uso de métodos anticonceptivos y condón en esta po-
14
Probabilidad, Estadı́stica y sus Aplicaciones
Por lo dicho anteriormente, uno de los ejes fundamentales para tratar de en-
tender las prácticas sexuales y reproductivas de los adolescentes, lo constituye la
perspectiva de género, y las desigualdades en particular con la pareja sexual.
Al respecto, varios estudios han señalado que no basta con estudiar los com-
portamientos individuales, sino que la protección sexual de los adolescentes puede
estar en función de la pareja, en particular si existe un balance de poder desigual [12].
15
Probabilidad, Estadı́stica y sus Aplicaciones
2.2. Metodologı́a
Todos los datos que presentamos provienen de la Encuesta sobre Noviazgo, Em-
poderamiento y Salud Sexual y Reproductiva en Adolescentes Estudiantes de Pre-
paratoria en México (ENESSAEP) efectuada en el año 2014 por el Centro Regional
de Investigaciones Multidisciplinarias de la UNAM. La encuesta es representativa
de los estudiantes que acuden a escuelas públicas y privadas de Puebla, Jalisco y
Morelos. Nuestra unidad de análisis lo constituyen los estudiantes de 14 a 19 años
que declararon haber tenido novia/o, free, amiga/o con derechos o pareja en los
últimos 12 meses y que tuvieron relaciones sexuales con su pareja actual.
16
Probabilidad, Estadı́stica y sus Aplicaciones
Para establecer el ı́ndice se sumaron todos los valores de las distintas preguntas, y
se dividió el ı́ndice en balance de poder y desbalance del poder. Para la recodifica-
ción de la variable se tomó como punto de corte a la mediana, ası́ el 57.9 % fueron
clasificados como balance del poder y el 42.1 % como desbalance del poder.
2.3. Resultados
2.3.1. Caracterı́sticas socio-demográficas de los estudiantes y
de la pareja actual según el sexo. Análisis bivariado
Al observar las caracterı́sticas socio-demográficas de los estudiantes iniciados
sexualmente y cuya última relación sexual fue con la pareja actual según el sexo
de los estudiantes de preparatoria, vemos que la mayorı́a tiene entre 16 y 17 años
17
Probabilidad, Estadı́stica y sus Aplicaciones
Respecto a las diferencias de edad con la pareja sexual, se observa una enorme bre-
cha entre hombres y mujeres. Ası́, mientras que el 70.3 % de los estudiantes varones
reportó tener una diferencia de edad de 3 años o más con su pareja, únicamente el
28 % de las mujeres se encontraban en esta situación. Por el contrario, el 37 % del
sexo femenino y únicamente el 8.1 % de los varones reportaron tener la misma edad
o una edad menor a su pareja sexual.
Finalmente, también hay un uso diferenciado por sexo en el uso del condón en la
última relación sexual, ya que mientras que el 34.4 % de los varones NO uso un pre-
servativo, este porcentaje aumenta a 45.9 % en el caso de las mujeres(Ver Cuadro
2.1).
Ası́, los datos refuerzan los hallazgos encontrados tradicionalmente, en que se mues-
tra que los varones tienden a iniciarse sexualmente antes que las mujeres, por los
mandatos de género que presionan a los varones a probar su virilidad teniendo
relaciones sexuales siempre que sea posible, mientras que el ideal femenino tradi-
cional justifica las relaciones sexuales de las mujeres, únicamente a través del amor
romántico o bien al interior de la unión o matrimonio.
Un dato que llama la atención, es que los varones reportan mayor abuso sexual que
las mujeres. Habrı́a que seguir investigando en futuros estudios, qué está sucediendo
con esta población.
18
Probabilidad, Estadı́stica y sus Aplicaciones
Caracterı́sticas sociodemográficas de los estudiantes que tuvieron su última relación sexual los
últimos 12 meses con la pareja actual según sexo
Sexo Total Grado de significancia según
Hombre Mujer (N=2557) pruebas χ2 de Pearson
Grupos de edad 18-19 24.1 % 22.2 % 23.1 %
16-17 55.4 % 57.7 % 56.7 %
14-15 20.5 % 20.1 % 20.3 % p = 0.180
Grupos de edad a la 17-19 10.5 % 16.9 % 14.0 %
primera rel. sexual 15-16 52.0 % 63.9 % 58.4 %
≤14 37.5 % 19.2 % 27.7 % p = 0.000
Diferencia de edad menor o igual 8.1 % 37.0 % 23.6 %
con la pareja 1-2 años 21.6 % 34.9 % 28.7 %
mayor o igual a 3 70.3 % 28.0 % 47.6 % p = 0.000
Índice balance de más equitativo 59.5 % 61.1 % 60.4 %
poder desigual 40.5 % 38.9 % 39.6 % p = 0.393
Abuso sexual Sı́ 9.0 % 5.7 % 7.3 %
No 91.0 % 94.3 % 92.7 % p = 0.000
Usó condón en Sı́ 65.6 % 54.1 % 59.4 %
la última rel. No 34.4 % 45.9 % 40.6 % p = 0.000
19
Probabilidad, Estadı́stica y sus Aplicaciones
Caracterı́sticas sociodemográficas de los estudiantes que tuvieron su última relación sexual los
últimos 12 meses con la pareja actual según entidad federativa
Entidad federativa Grado de significancia según
Morelos Jalisco Puebla pruebas χ2 de Pearson
Grupos de edad 18-19 40.4 % 22.2 % 14.6 %
16-17 53.3 % 56.9 % 58.2 %
14-15 6.3 % 20.9 % 27.2 % p = 0.000
Grupos de edad a la 17-19 27.3 % 11.1 % 10.7 %
primera rel. sexual 15-16 53.2 % 59.4 % 59.8 %
≤14 19.5 % 29.5 % 29.6 % p = 0.000
Diferencia de edad menor o igual 24.3 % 25.8 % 19.8 %
con la pareja 1-2 años 30.5 % 29.6 % 26.5 %
mayor o igual a 3 45.1 % 44.6 % 53.7 % p = 0.002
Índice balance de más equitativo 58.5 % 63.3 % 56.8 %
poder desigual 41.5 % 36.7 % 43.2 % p = 0.483
Abuso sexual Sı́ 6.2 % 7.1 % 8.1 %
No 93.8 % 92.9 % 91.9 % p = 0.097
Usó condón en Sı́ 57.2 % 62.6 % 55.7 %
la última rel. No 42.8 % 37.4 % 44.3 % p = 0.079
Ası́, se puede ver que la prevalencia del preservativo masculino disminuye consi-
derablemente si hubo abuso sexual. En el caso de los varones se reduce el uso de
66.8 % a 56.2 %, y en el caso de las mujeres de 54.9 % a 43.1 %. Cabe mencionar
que mientras que en caso de los varones se observa una relación estadı́sticamente
significativa (p=.000), en el caso del sexo femenino hay una relación marginalmente
significativa (p=.083).
20
Probabilidad, Estadı́stica y sus Aplicaciones
Porcentaje de estudiantes que SÍ usaron condón en la última relación sexual con la pareja
actual según sexo
Esfera de la pareja Hombres Grado de significancia según Mujeres Grado de significancia según
pruebas χ2 Pearson pruebas χ2 Pearson
Abuso de la pareja sexual
Sı́ 56.2 % 0.001 43.1 % 0.083
No 66.8 % 54.9 %
Diferencia de edad con la pareja
Misma edad o menor 57.8 % 0.904 52 % 0.144
1-2 años 65.0 % 51.9 %
3 o mayor 67.4 % 59.7 %
Balance de poder entre los sexos
Equitativo 78.6 % 0.000 62.8 % 0.000
Desigual 48.1 % 41.7 %
Cuadro 2.3: Porcentaje de estudiantes que sı́ usaron el condón en la última relación
con la pareja actual por sexo.
De hecho, en el caso de los varones, la única variable que resultó ser estadı́sticamen-
te significativa según el modelo de regresión logı́stico fue el balance de poder con
la pareja; en cuanto al sexo femenino, además del balance de poder, también hay
21
Probabilidad, Estadı́stica y sus Aplicaciones
mayor uso cuando la pareja tiene la misma edad o es menor ya que la probabilidad
de uso del condón aumenta en 32 % (p=.049).
Ası́, los datos muestran claramente que las caracterı́sticas de la pareja son determi-
nantes para lograr una mejor protección sexual, en particular en lo que se refiere a
un poder más equitativo en la pareja (Ver Cuadro 2.4).
Factores asociados al uso del condón según las caracterı́sticas de la pareja sexual por sexo
Uso de condon el la última relación sexual
Hombres Mujeres Total
Razones de Razones de Razones de
Caracterı́sticas momios P >t momios P >t momios P >t
Balance de Poder (en la sexualidad)
No 1.00 1.00 1
Sı́ 3.49 0.000 2.35 0.000 2.81 0.000
Abuso sexual del novio o ex-novio
Sı́ 1 1 1
No 1.47 0.062 1.25 0.317 1.25 0.415
Diferencia de edad con la pareja
Tres años y más 1.00 1
Mayor hasta 2 años 0.92 0.773 1.23 0.112 1.17 0.495
Misma edad o menor 0.98 0.950 1.32 0.049 1.84 0.004
Cuadro 2.4: Factores asociados al uso del condón según las caracterı́sticas de la
pareja sexual por sexo.
2.4. Conclusiones
Ası́, los hallazgos relacionados con la pareja sexual de los adolescentes muestran
claramente que es de fundamental importancia lograr una mayor equidad de género
en las prácticas sexuales, tanto en lo que se refiere a la edad de ambos adolescentes
que se encuentran en pareja, como en el balance del poder en distintos temas re-
lacionados con la sexualidad para disminuir las prácticas de riesgo en esta población.
Esto significa reconocer que el sexo protegido involucra complejos procesos de ne-
gociación sexual, que requieren un grado de comunicación abierta sobre el propio
deseo, lo cual no es fácilmente accesible en sociedades como la mexicana donde las
relaciones heterosexuales están frecuentemente marcadas por las desigualdades de
género y poder.
22
Probabilidad, Estadı́stica y sus Aplicaciones
Bibliografı́a
23
Probabilidad, Estadı́stica y sus Aplicaciones
24
Probabilidad, Estadı́stica y sus Aplicaciones
Capı́tulo 3
Una caracterización de la satisfacción estudiantil mediante análisis de clases
latentes.
Universidad de la República,
Facultad de Ciencias Económicas y de Administración,
Departamento de Métodos Cantitativos,
Instituto de Estadı́stica,
Eduardo Acevedo 1139, Cordón,
C.P. 11200, Montevideo, Uruguay,
[email protected], [email protected]
Resumen. En este trabajo se estudian las principales caracterı́sticas de la cons-
trucción de la Satisfacción Estudiantil en los cursos de grado de la Facultad de
Ciencias Económicas y de Administración, Universidad de la República, Uruguay,
mediante Análisis de Clases Latentes (ACL). Los datos utilizados para la aplicación
presentada en este trabajo provienen de una encuesta aplicada sobre una muestra de
estudiantes de grado de la Facultad, en el año 2009. Dicho cuestionario presenta una
estructura de bloques: por un lado (primer bloque) se encuentran las variables que
permitirán realizar una caracterización sociodemográfica de los estudiantes y por
otro se presentan las variables del modelo ECSI (European Customer Satisfaction
Index) que serán las utilizadas para la caracterización de la Satisfacción Estudiantil.
Las variables manifiestas consideradas como insumo para la construcción y carac-
terización de la Satisfacción Estudiantil son las siguientes 6: expectativas (E) de
los estudiantes al ingresar al centro de estudios, la imagen (I) que tienen de éste,
la calidad de la enseñanza recibida (CSA) y de los servicios brindados (CSF), las
necesidades y deseos personales con respecto a la facultad (ND) y el valor percibido
(VP). Los resultados presentados surgen de considerar que efectivamente existe una
variable que refiere a la Satisfacción Estudiantil y que ésta queda definida, a partir
de la interacción de las 6 variables manifiestas, por 4 clases latentes.
25
Probabilidad, Estadı́stica y sus Aplicaciones
Abstract. This paper studies the main characteristics of the construction of Stu-
dent Satisfaction in the undergraduate courses of the Facultad de Ciencias Económi-
cas y de Administración, Universidad de la República, Uruguay, through Analysis
of Latent Classes (LCA). The data used for the application presented in this paper
comes from a survey applied to a sample of undergraduate students of the Facul-
tad, in 2009. This questionnaire presents a structure with several blocks: on the
one hand (first block) are the variables that will allow a sociodemographic charac-
terization of the students and, on the other hand, the variables of the ECSI model
(European Customer Satisfaction Index) that will be used for the characterization
of the Student Satisfaction. The variables used are the next 6: expectations of the
incoming students (E), the image that students have about courses (I), the received
teaching quality (CSA) and services provided (CSF), the needs and personal desires
about the Facultad (ND), and the perceived value (VP).The results presented arise
from considering that there is indeed an unobserved variable that refers to Student
Satisfaction, defined from the interaction of the 6 manifest variables, by four latent
classes.
3.1. Introducción
Conocer el nivel de satisfacción de los clientes, con un determinado servicio que
se les brinda resulta fundamental como insumo en la toma de decisiones que tengan
como objetivo primordial mantener o mejorar, en caso de que sea necesario, aquellos
aspectos que se entiende determinan la Satisfacción.
Vinculando esta idea con la educación universitaria, se toma lo propuesto por
Alves y Raposo [6], quienes plantean: “Sólo con la satisfacción de los alumnos se
podrá alcanzar el éxito escolar, la permanencia de los estudiantes en la institución
y, sobre todo, la formación de una valoración positiva boca a boca. En este sentido,
es extremamente importante encontrar formas fiables de medir la satisfacción del
alumno en la enseñanza universitaria, permitiendo ası́ a las instituciones de enseñan-
za conocer su realidad, compararla con la de los otros competidores y analizarla a
lo largo del tiempo”.
En este trabajo se considera a los estudiantes universitarios que concurren a la
Facultad de Ciencias Económicas y Administración (FCEA) de la Universidad de
la República, como “clientes” y se determina que el “servicio” que se les brinda es
el de la educación de nivel terciario.
La información necesaria para poder establecer cómo se construye el concepto
de Satisfacción, se obtiene a través de la aplicación de un cuestionario formado por
apartados de preguntas que conforman el modelo ECSI (European Customer Satis-
faction Index). Sobre este instrumento, y a través del Análisis de Clases Latentes,
se analiza cómo se construye la Satisfacción Estudiantil [5],[21].
La estructura de este documento es la siguiente: en primera instancia se ha-
ce referencia a las caracterı́sticas generales de las técnica estadı́stica empleada. A
continuación se presenta una descripción de los datos, seguida de los principales
resultados obtenidos y por último, se plantean las principales conclusiones y pro-
26
Probabilidad, Estadı́stica y sus Aplicaciones
3.2. Metodologı́a
Generalmente, al trabajar con datos categóricos multivariados, resulta de interés
investigar eventuales fuentes de confusión entre las variables observadas, identifi-
car/caracterizar grupos de individuos y aproximar la distribución de las observacio-
nes a través de las variables en estudio [15]. Existe una técnica que contempla todas
estas situaciones: Análisis de Clases Latentes (ACL) o Modelos de Clases Latentes
(MCL) [1], [7], [11],[12], [14].
Este método puede verse como un modelo de regresión y, por lo tanto, serı́a
posible incluir variables predictivas para la membresı́a de cada observación a una
clase latente [7].
Por otra parte, en el trabajo “Modelos De Clases Latentes Para Definir Perfiles
Conductuales en Niños De 4 y 5 Años” [9] sus autores elaboran perfiles conductuales
en niños de 4 o 5 años de México aplicando ACL sobre los resultados del test de
screening “Child Behavior Check List” (CBCL).
En otras áreas de la salud como la epidemiologı́a, se presenta el trabajo “Análisis de
clases latentes en tablas poco ocupadas: consumo de alcohol, tabaco y otras drogas
en adolescentes” [8], en el que sus autores presentan una segmentación del tipo de
consumo de drogas en jóvenes de Costa Rica.
27
Probabilidad, Estadı́stica y sus Aplicaciones
Yijk será el valor observado de las J variables manifiestas para el individuo i, tal
que Yijk = 1 si el individuo i da la respuesta k de la variable j y Yijk = 0 en otro
caso, con j = 1....J y k = 1....Kj y πjrk representará la probabilidad condicional
de que una observación en la clase r = 1, ..., R produzca el k-ésimo resultado de la
variable j-ésima.
Dentro de cada clase, para cada variable manifiesta, se cumple:
Kj
X
πjrk = 1.
k
con ri = 1, ..., R.
Se debe tener en cuenta que las π̂jrk son estimaciones de las probabilidades de
los resultados condicionales en la clase r. También es importante observar que el
número de parámetros independientes estimados aumenta rápidamente
P con R, J y
Kj . Dados estos valores, el número de parámetros a estimar es R j (Kj − 1) + (R −
1). Este último resultado puede producir una situación no deseada, ya que cuando
28
Probabilidad, Estadı́stica y sus Aplicaciones
este número excede el número total de observaciones, o una menos que el número
total de celdas en la tabla de clasificación cruzada de las variables manifiestas, el
modelo no puede ser identificado.
Dicha verosimilitud será maximizada con respecto a pr y πjrk a través del al-
goritmo EM [10], [16]. Como con cualquier modelo de mezcla finita, el algoritmo
EM se puede aplicar en virtud de que la membresı́a a la clase de cada individuo es
desconocida, por lo que se trata como un problema de datos faltantes. El algoritmo
trabaja en forma iterativa en dos fases a partir de valores iniciales arbitrarios de p̂r
y π̂jrk , los que se etiquetan como p̂anterior
r
anterior
y π̂jrk .
Por último, cabe destacar que la aplicación de este método de estimación de-
pende de: los valores iniciales elegidos para p̂anterior
r
anterior
y π̂jrk y de la complejidad
del modelo que se estima, por lo que el algoritmo EM puede encontrar un máximo
local de la función log-verosimilitud, en lugar del máximo global deseado, con lo
cual es recomendable estimar más de una vez.
29
Probabilidad, Estadı́stica y sus Aplicaciones
Agregar una clase al modelo mejorará el ajuste, pero incorporará ruido y paráme-
tros a estimar, por lo que será necesario tener en consideración un criterio de par-
simonia que establezca un equilibrio entre la mejora del ajuste y la cantidad de
parámetros que se incorporan al aumentar una clase en el modelo. El criterio de
parsimonia utilizado en este trabajo será el del mı́nimo BIC (Bayesian information
criterion).
3.3. Resultados
En esta sección se presentan, en forma resumida, los datos con los que se trabajó,
describiendo el diseño muestral empleado y el cuestionario utilizado. Por último se
exponen los principales resultados del Análisis de Clases Latentes.
30
Probabilidad, Estadı́stica y sus Aplicaciones
3.3.3. Aplicación
La aplicación presentada en este trabajo, toma como insumo las puntuaciones
(categorizadas) de las seis variables del ECSI. éstas, y sus respectivas categorı́as,
son:
ER : Expectativas
Altas (> 90), Medias (81 : 90), Bajas (< 81)
31
Probabilidad, Estadı́stica y sus Aplicaciones
IR : Imagen
Alta (> 50), Media (41 : 50), Baja (< 41)
CSAR : Calidad de los Servicios Académicos
Alta (> 70), Media (61 : 70), Baja (< 61)
CSFR : Calidad de los Servicios Funcionales
Alta (> 65), Media (56 : 65), Baja (< 56)
N DR : Necesidades/Deseos
Alta (> 70), Media (61 : 70), Baja (< 61)
V PR : Valor Percibido
Alta (> 60), Media (51 : 60), Baja (< 51).
Simplificando la notación, la codificación utilizada será (para i = 1:6):
3 Alto
Yi = 2 M edio
1 Bajo
En resumen, se tiene:
Tamaño de muestra: n = 470 (luego de depurar los datos y descartar obser-
vaciones con datos faltantes).
Una variable de clases latentes: Satisfacción estudiantil.
Seis variables (Yi ) manifiestas: p = 6.
Cada una de las variables manifiestas posee 3 categorı́as de respuestas posibles:
ki = 3 (para i = 1:6).
En el Cuadro 3.1 se presentan los seis patrones de respuesta más frecuentes (de
las 163 secuencias observadas), y sus respectivas frecuencias, para el caso de los 470
estudiantes en estudio. En dicha tabla se puede observar que los dos patrones más
frecuentes son los que representan los extremos: niveles altos de todas las variables
manifiestas y valores bajos en todas ellas, respectivamente.
32
Probabilidad, Estadı́stica y sus Aplicaciones
Para el caso del modelo con una variable con cuatro clases latentes la hipótesis
nula no puede ser rechazada, por lo que podrı́a considerarse que ajustar un modelo
con cuatro clases latentes es adecuado. Además, se verifica que al estimar este modelo
no existen problemas de identificabilidad y que en el proceso de maximización se
alcanza, al menos, un máximo local (que puede coincidir con el máximo global).
Clase Latente 1
Los estudiantes que se encuentran en esta clase presentan un nivel de expectativas
y una percepción de la calidad de los servicios funcionales medio-bajo y niveles
medios de imagen, percepción de la calidad de los servicios académicos, necesidades
y deseos y valor percibido.
En función de la descripción hecha se entiende que los patrones caracterı́sticos de
esta clase son:
1 Se considera un α = 0.05.
33
Probabilidad, Estadı́stica y sus Aplicaciones
Clase Latente 2
Los estudiantes que se encuentran en la clase latente 2, presentan un nivel alto de
todas las variables manifiestas. Cabe destacar, además, el hecho de que la proba-
bilidad de que un estudiante que pertenece a esta clase, tenga niveles bajos en su
percepción de la calidad de los servicios académicos, es 0.
El patrón especı́fico de esta clase es:
(ER , IR , CSAR , CSFR , N DR , V PR ) = (3,3,3,3,3,3).
Clase Latente 3
En el extremo opuesto a los estudiantes cuya Satisfacción se define a partir de la
clase latente 2, se encuentran los estudiantes de esta clase. éstos presentan un nivel
bajo de todas las variables manifiestas. Cabe destacar, además, el hecho de que la
probabilidad de que un estudiante que pertenece a esta clase, tenga niveles altos en
imagen y necesidades/deseos, es 0.
El patrón especı́fico de esta clase es:
(ER , IR , CSAR , CSFR , N DR , V PR ) = (1,1,1,1,1,1).
Clase Latente 4
Por último, los estudiantes que pertenecen a la clase latente 4 se caracterizan por
tener nivel medio-alto de expectativas, nivel medio de imagen, percepción de la ca-
lidad de los servicios académicos, necesidades/deseos y valor percibido. En lo que
refiere a la percepción de la calidad de los servicios funcionales, los estudiantes que
se encuentran en esta clase presentan valores altos.
Además, se destaca que la probabilidad de que un estudiante que pertenece a esta
clase, tenga niveles bajos en imagen, percepción de la calidad los servicios académi-
cos y necesidades/deseos, es 0.
34
Probabilidad, Estadı́stica y sus Aplicaciones
35
Probabilidad, Estadı́stica y sus Aplicaciones
Figura 3.1: Perfil de las 4 clases latentes en función de las 6 variables manifiestas.
36
Probabilidad, Estadı́stica y sus Aplicaciones
37
Probabilidad, Estadı́stica y sus Aplicaciones
Bibliografı́a
[5] Álvarez-Vaz, R., Freira, D., Vernazza, E., y Alves, H. Can students’
satisfaction indexes be applied the same way in different countries? Int Rev
Public Nonprofit Marketing, 13(101), 2016.
[6] Alves, H. y Raposo, M. La medición de la satisfacción en la enseñanza
universitaria: El ejemplo de la universidade da beira interior. Int Rev Public
Nonprofit Marketing, 1(1):73–88, 2014.
[7] Bandeen-Roche, K., Miglioretti, D. L., Zeger, S. L., y Rathouz,
P. J. Latent variable regression for multiple discrete outcomes. Journal of the
American Statistical Association, 92(440):1375–1386, 1997.
38
Probabilidad, Estadı́stica y sus Aplicaciones
39
Probabilidad, Estadı́stica y sus Aplicaciones
Capı́tulo 4
Modelación espacial de la plaga Sigatoka Negra (Mycosphaerella fijiensis) en
cultivos de plátano del estado de Guerrero
Juan Elı́as Solı́s Alonso1 , Marı́a Guzmán Martı́nez1 , Ramón Reyes Carreto1 y
Dolores Briones Reyes2
1
Universidad Autónoma de Guerrero,
Facultad de Matemáticas,
Av. Lázaro Cárdenas S/N, Ciudad Universitaria,
C.P. 39087, Chilpancingo, Guerrero,
2
INIFAP, Campo Experimental Pabellon
Km 32.5 Carretera Aguascalientes a Zacatecas,
C.P. 20660, Pabellón de Arteaga, Aguascalientes,
[email protected], [email protected],
[email protected], briones [email protected]
Resumen. El plátano (Musa spp.) se cultiva en más de 120 paı́ses alrededor
del mundo, es una importante fuente de carbohidratos en la dieta de millones de
personas, sobre todo en paı́ses tropicales, además representan a nivel mundial el
cuarto cultivo de mayor importancia, después del maı́z (Zea mays), trigo (Triticum
aestivum) y arroz (Oryza sativa). La variedad de plátanos que se cultivan en México
es amplia, entre ellas destacan el Plátano Tabasco o Roatán, Enano Gigante, Crio-
llo, Valery, Dominico, Manzano, Macho, Morado y Pera. Guerrero ocupa el octavo
lugar con una producción anual de 50 a 60 toneladas por hectárea. Este cultivo
como cualquier otro presenta problemas de plagas, una de ellas es la Sigatoka negra
(Mycosphaerella fijiensis) que es una de las principales enfermedades del cultivo,
provoca una considerable reducción en el área foliar de la planta y en consecuencia
los racimos y los frutos tienen un menor peso en comparación con las plantas sanas.
Este problema finalmente se ve reflejado en la producción total. El objetivo de este
trabajo fue modelar la distribución espacial de la enfermedad en el municipio de
Tecpán de Galeana, ubicado en Costa Grande, Guerrero, a través de un proceso
espacial gaussiano estacionario. Para la modelación de la estructura de dependencia
espacial de los datos se utilizó la función del semivariograma; y para la interpolación
el método de kriging ordinario y universal. Esta investigación permitió identificar
los puntos de mayor gravedad de la enfermedad en la zona de estudio, lo cual es
muy importante a la hora de implementar las medidas de control para la Sigatoka
negra. La base de datos comprende los monitoreos de julio a diciembre del año 2017,
6 meses en total. La información fue proporcionada por SAGARPA.
Abstract. The banana (Musa spp.) is grown in more than 120 countries around the
40
Probabilidad, Estadı́stica y sus Aplicaciones
4.1. Introducción
El plátano es un cultivo muy importante, aunque poco estudiado en todo el
mundo. Mucha gente que hoy disfruta de los plátanos no se da cuenta de la amplia
gama de esfuerzos humanos que implica su cultivo [11] ni de los problemas fitosani-
tarios a los cuales el cultivo se enfrenta como la Sigatoka negra, Sigatoka amarilla,
Moko del plátano, entre otras.
Aunque la Sigatoka negra se describió por primera vez en 1964 [15], una descrip-
ción detallada de los sı́ntomas fue publicada por primera vez en 1969 por Meredith
y Lawrence [13]. Con base en estas observaciones, Fouré [8] redefinió los sı́ntomas
mostrados durante el desarrollo de la enfermedad en seis etapas. En cuanto a la sin-
tomatologı́a de la enfermedad, el primer sı́ntoma que se presenta son las manchas
cloróticas que aparecen entre los 14 a 20 dı́as después de la infección. El perı́odo
entre la aparición de manchas y el desarrollo de rayas y, posteriormente, puntos
necróticos varı́a en longitud de acuerdo con el cultivar y la gravedad de la infección.
Otros autores mencionan que en algunas áreas de cultivo, la primera aparición de
sı́ntomas se correlaciona con la susceptibilidad del cultivar [4]. Sin embargo, la du-
ración del perı́odo de incubación no parece correlacionarse con la resistencia general
[8].
41
Probabilidad, Estadı́stica y sus Aplicaciones
Por otro lado, Alves et al. [2], aplicaron técnicas de geoinformación para desa-
rrollar modelos predictivos para estudiar las áreas de riesgo en la Sigatoka negra
(Mycosphaerella fijiensis var. difformis) en banano, considerando el clima carac-
terı́stico de Brasil y la distribución de cultivos de banano. Considerando datos de
temperatura y precipitación para el periodo comprendido entre 1950 y 2000, para
los cuales se disponı́a de datos de observación, y de simulaciones para 2020, 2050
y 2080; utilizando los escenarios de emisiones (SRESA2, por sus siglas en inglés),
de cambio climático, a partir del análisis de componentes principales, se generó una
sola variable en base a 57 variables, para determinar un ı́ndice que explica el 90 %
de la variabilidad de cultivos de banano, en distritos municipales de todo Brasil.
El modelo climático se utilizó para generar la zonificación de la enfermedad de la
planta, utilizando la temperatura y la humedad de la hoja como insumo. Se trazaron
áreas de favorabilidad para la enfermedad contra las principales áreas productoras
de banano en Brasil. Esta metodologı́a permitió la visualización de los cambios en
áreas favorables para epidemias bajo posibles escenarios futuros de cambio climático
[2].
Por otra parte Freitas et al. [9], analizaron la distribución espacial de la Mancha
de Sigatoka amarilla en relación con la fertilidad del suelo y el estado nutricional de
la planta mediante geoestadı́stica. El área experimental comprendió 1.2 hectáreas,
donde 27 puntos fueron georeferenciados y espaciados en una cuadrı́cula regular
de 18m × 18m. La severidad de la Sigatoka amarilla, la fertilidad del suelo y el
estado nutricional de la planta se evaluaron en cada punto. Para estas variables se
ajustó el modelo esférico cuyos parámetros se estimaron por máxima verosimilitud
restringida. Los mapas de interpolación mostraron que la mayor tasa de infección
de Sigatoka ocurrió en áreas altas del campo que tenı́an la mayor concentración de
arena, mientras que la tasa más baja se encontró en áreas bajas con limo inferior,
materia orgánica, bases intercambiables totales, capacidad efectiva de intercambio
catiónico, Ca y Mg en el suelo, y azufre foliar [9].
El objetivo de este trabajo fue modelar la distribución espacial del ı́ndice de in-
festación de la Sigatoka negra (Mycosphaerella fijiensis) en plátanos del municipio
de Tecpán de Galeana, ubicado en Costa Grande, Guerrero, a través de un proceso
42
Probabilidad, Estadı́stica y sus Aplicaciones
espacial gaussiano estacionario. Cabe señalar que para esta enfermedad en el estado
de Guerrero no se tienen identificados trabajos de este tipo.
43
Probabilidad, Estadı́stica y sus Aplicaciones
donde ahora µ(xi ) es una función que depende de las ubicaciones xi . El Modelo
(4.2) es de alguna manera una generalización del Modelo (4.1).
Algunos de los modelos teóricos para la función del semivariograma son el Ex-
ponencial, Esférico, Gaussiano y Wave (Cuadro 4.1), entre otros (ver [3]).
44
Probabilidad, Estadı́stica y sus Aplicaciones
Para cada ubicación xi se tiene entonces, un valor observado Y (xi ) y valor predi-
cho Ŷ (xi ), la validación es a través del criterio del error cuadrado medio normalizado
que se define por:
n
1 X (Y (xi ) − Ŷ (xi ))2
M SN E = (4.4)
n i=1 σ̂x2i
donde σ̂x2i es la varianza del kriging. Si el modelo del semivariograma esta correcta-
mente identificado y bien estimado, entonces el MSNE deberı́a ser muy cercano a 1
[10].
Nuestro objetivo es crear un mapa de predicción para Y (xi ) sobre todo D cuan-
do Y (xi ) solo se observa en un número finito de puntos de D. La palabra “kriging”
es sinónimo de “predicción óptima”, en otras palabras, se refiere a hacer inferen-
cias sobre valores no observados del proceso aleatorio Y (xi ), a partir de ubicaciones
xi ∈ D.
que es la predicción espacial del proceso Y (x0 ) bajo los siguientes dos supuestos,
Esta última condición, que los coeficientes del predictor lineal (4.5) suman 1, ga-
rantiza uniformidad insesgada, es decir, E(Kok (Y (x0 ))) = µ, para toda µ ∈ R.
el cual será insesgado si E(Kuk (Y (x0 ))) = µ(x0 ) [7], donde µ(x0 ) es la función de
la media, entonces la ecuación (4.6) queda como,
n
X
E [Kuk (Y (x0 ))] = λi µ(xi ) = µ(x0 ). (4.7)
i=1
4.3. Aplicación
4.3.1. Descripción de los datos
La base de datos comprende los monitoreos de julio a diciembre del año 2017,
la cual fue proporcionada por SAGARPA. En cada mes se muestreo 2 veces cada
45
Probabilidad, Estadı́stica y sus Aplicaciones
●●●
●
● ●
●
●● ●●
● ●
● ● ●
● ●
●
●
●
●●
● ● ●
●
●● ● ●
●
● ● ● ●
● ●
●
● ●
●
● ●
●● ●
●
●● ●
●
●
●
●
● ● ● ●
●●●●
●●●
●● ●
●
●
●
●
● ●
●
●● ●
●
●
●
● ●
● ●
● ●●
●●
●
● ●●
●● ● ● ● ●
● ●
●
●●
● ●● ●
●
●● ●
●●●
● ● ●●
●
● ●
●
●
●●●
● ●
●
●
●●●●
●
●●
●
●●
●
46
Probabilidad, Estadı́stica y sus Aplicaciones
50
50
● ● ● ● ● ● ● ● ● ● ● ●● ● ● ●
● ●
● ● ● ●
● ●
● ●
● ●
● ● ● ● ● ● ● ●
● ● ● ● ●
●
45
45
● ●
● ●
● ●
● ● ● ● ● ●
● ● ● ●
● ● ● ● ● ● ● ●
● ● ● ● ● ● ●
● ● ● ● ●● ● ● ●
● ● ● ●
● ● ● ●
● ●
● ● ● ● ● ● ● ● ● ●● ●
● ●
● ●
40
40
● ● ● ● ● ● ●●
● ●
● ●
● ●
● ●
● ● ● ●
Infestacion
Infestacion
● ●
● ● ● ● ● ●
● ● ● ● ● ● ● ● ●● ● ● ● ●
● ● ● ● ● ● ● ●
● ● ● ● ● ● ● ●
● ● ● ●
35
35
● ●
● ●
● ●● ● ● ● ● ● ● ● ● ●
● ● ● ● ● ● ●● ● ● ● ● ● ● ●
● ● ● ● ● ●
● ●
● ● ● ●
● ●
● ●
● ● ● ●
● ●
30
●
30
●
● ●
● ● ● ●
● ●
● ● ● ● ● ●
● ●
● ● ● ●
● ● ● ● ● ● ● ●
● ●
● ●
25
25
● ● ● ● ● ●
● ●
● ●
● ● ● ●
● ●
● ●
● ●
20
20
● ● ● ●
● ● ● ●
−100.675 −100.665 −100.655 −100.645 17.16 17.17 17.18 17.19 17.20 17.21
W−E S−N
●●●
● ●
● ●
●
●●
● ●
●● ●
● ● ●
17.20
●
●
●●
● ●●
●
●●
●
● ●●●
● ● ● ●
●
●●
● ●
● ●
17.19
●●
● ●●●
● ●
●● ●
Latitud
● ●●●●●
●●●
●
●
●
17.18
● ●
●
●
●
● ●
●
●●
●
●
● ●
●● ●
●
●
17.17
●●
●●
●●
● ●●
●● ●
●
●● ●●●
●●
●
●●
● ●●
●
●
●
●●●●
●
●
●
●●●
●●
17.16
●
●●
●
Longitud
La Figura 4.4 tiene el ajuste de los modelos del Cuadro 4.1 al semivariograma
empı́rico, el modelo Wave es el que más aproxima la forma del semivariograma. Se
usa el criterio (4.4) para validar el ajuste de los modelos al semivariograma empı́rico.
120
Exp
Spherical
Gauss
100
Wave
●
80
semivariance
● ●
●
●
60
●
● ●
●
●
●
● ●
40
20
distance
47
Probabilidad, Estadı́stica y sus Aplicaciones
4.3.3. Resultados
Para el mes de agosto en la primera quincena se tiene un mayor ı́ndice de infesta-
ción hacia el suroeste del mapa de interpolación alcanzando un 46 %, en la segunda
quincena el ı́ndice de infestación es mayor en la parte sur del mapa de interpolación
alcanzando un 46 %, en todo el mes el rango del ı́ndice de infestación está entre
30 % y 46 % (Figura 4.5).
17.21
30
30
17.20
17.20
32
30
17.19
17.19
32
Latitud
Latitud
30
38
17.18
17.18
34
34
40 36
36
38 42
46
40
17.17
42 17.17
44
44
44
17.16
17.16
30 35 40 45 30 35 40 45
−100.68 −100.67 −100.66 −100.65 −100.64 −100.63 −100.68 −100.67 −100.66 −100.65 −100.64 −100.63
Longitud Longitud
17.21
30
32
34
17.20
17.20
32 30
30
17.19
17.19
Latitud
Latitud
32
34
17.18
17.18
50 36
34
38
38
36
40
42
48
42
40
44
44
46 46
17.17
17.17
48 48
52
50
50
52
17.16
17.16
30 35 40 45 50 30 35 40 45 50
−100.68 −100.67 −100.66 −100.65 −100.64 −100.63 −100.68 −100.67 −100.66 −100.65 −100.64 −100.63
Longitud Longitud
48
Probabilidad, Estadı́stica y sus Aplicaciones
17.21
17.21
30
17.20
17.20
34
28 30
28
17.19
17.19
26
Latitud
Latitud
26 30
34
32
17.18
17.18
30
38
32
46
42
36
34
38 36
40
50
44
48
40
42
48 44
46
17.17
17.17
48
50
50
48
17.16
17.16
25 30 35 40 45 50 30 35 40 45 50
−100.68 −100.67 −100.66 −100.65 −100.64 −100.68 −100.67 −100.66 −100.65 −100.64
Longitud Longitud
17.21
35
30
40
38
36
36
36
34
36 38
17.20
17.20
36 38
40
36 34
36
38
36
35 32
17.19
17.19
34 40
38 34
38
40
Latitud
Latitud
38 34
36
36
32
34 36
17.18
17.18
38
38 40
37
36
39
38
34
38 38
38 38
36 34
40
37
34 36
41 32
17.17
17.17
32
42 36 34 40
34
38
43
38 38
34
36
32
43
17.16
17.16
36
34
36 38 40 42 30 35 40 45
−100.68 −100.67 −100.66 −100.65 −100.64 −100.63 −100.68 −100.67 −100.66 −100.65 −100.64 −100.63
Longitud Longitud
4.4. Conclusiones
Esta investigación permitió identificar las zonas de mayor infestación en el área
de estudio, esto porque el modelo toma en cuenta la estructura de dependencia es-
49
Probabilidad, Estadı́stica y sus Aplicaciones
pacial que presenta la enfermedad, lo cual es muy importante para los agricultores y
campesinos que cultivan el plátano a la hora de implementar las medidas de control
para la Sigatoka negra, ya que saber con precisión sobre que áreas aplicar medidas
de control disminuye la reproducción de la enfermedad y por ende baja el ı́ndice de
infestación.
50
Probabilidad, Estadı́stica y sus Aplicaciones
Bibliografı́a
[1] Alvarez E., Pantoja A., Gañan L., & Ceballos G.. Estado del arte
y opciones de manejo del Moko y la Sigatoka negra en América Latina y el
Caribe, 2013.
[2] Alves M. D. C., de Carvalho L. G., Pozza E. A., Sanches L., &
Maia J. D. S.. Ecological zoning of soybean rust, coffee rust and banana black
sigatoka based on Brazilian climate changes. Procedia Environmental Sciences,
6, 35-49, 2011.
[3] Banerjee S., Carlin B. P., & Gelfand A. E.. Hierarchical modeling and
analysis for spatial data. Crc Press, 2014.
[4] Carlier J., Fouré E., Gauhl F., Jones D. R., Lepoivre P., Mourichon
X., Pasber-Gauhl C. & Romero R. A.. Black Leaf Streak, Diseases of
Banana, Abaca and Enset. D. R. Jones, ed. CAB International, Wallingford,
UK, 1985.
[5] Chillet M., Abadie C., Hubert O., Chilin-Charles Y. & de Bellaire
L. D. L.. Sigatoka disease reduces the greenlife of bananas. Crop Protection,
28(1), 41-45, 2009.
[6] Cook D. C., Liu S., Edwards J., Villalta O. N., Aurambout J. P.,
Kriticos D. J., ... & De Barro, P. J.. Predicted economic impact of black
Sigatoka on the Australian banana industry. Crop protection, 51, 48-56, 2013.
[7] Cressie N.. Statistics for spatial data. John Wiley & Sons, 2015.
[8] Fouré E. Black Leaf Streak Disease of Bananas and Plantains (Mycosphae-
rella fijiensis Morelet). Study of the symptoms and stages of the disease in
Gabon. IRFACIRAD, Parı́s, 1985.
[9] Freitas A. S., Pozza E. A., Alves M. C., Coelho G., Rocha H. S., &
Pozza, A. A. A.. Spatial distribution of Yellow Sigatoka Leaf Spot correlated
with soil fertility and plant nutrition. Precision agriculture, 17(1), 93-107, 2016.
[10] Gaetan C. & Guyon X.. Spatial statistics and modeling. New York: Springer,
2010.
[11] Marin D. H., Romero R. A., Guzmán M. & Sutton T. B.. Black Siga-
toka: an increasing threat to banana cultivation.. Plant disease, 87(3), 208-222,
2003.
51
Probabilidad, Estadı́stica y sus Aplicaciones
52
Probabilidad, Estadı́stica y sus Aplicaciones
Capı́tulo 5
Aplicación del análisis de superviviencia en datos de pacientes sometidos a trans-
plante renal.
Jorge Antonio Gil Mota, Bulmaro Juárez Hernández y Vı́ctor Hugo Vázquez
Guevara
Abstract. In this work, kidney transplant rejection was modeled, identifying the
clinical characteristics and risk factors that influence graft loss, for which an analysis
was made with the survival approach in patients with renal graft whose surgery was
performed in the Regional General Hospital, number 36 of the Mexican Institute of
Social Security (IMSS), of the city of Puebla, Pue., Mexico, between 2006 and 2014.
5.1. Introducción
El análisis de supervivencia se puede definir como el conjunto de métodos es-
tadı́sticos destinados al análisis de datos que provienen de observar la ocurrencia
de un evento, llamado falla, el cual sólo puede suceder a lo más una vez. Algunos
ejemplos de falla son la muerte de un paciente en un ensayo clı́nico, encontrar la
primera filtración de agua en una tuberı́a, el divorcio en una pareja, la primera
contratación de un recién egresado en ciencias, etc.
53
Probabilidad, Estadı́stica y sus Aplicaciones
En la práctica, existen factores que impiden registrar cada tiempo de falla, ge-
neralmente debido a la conclusión del periodo de observación, en este caso se dice
que el individuo cuyo momento no se registra presenta censura. A diferencia de los
modelos usuales de regresión, los métodos y modelos del análisis de supervivencia
incorporan de forma correcta información tanto de observaciones censuradas como
no censuradas.
y denota la probabilidad de que un individuo sobreviva más allá del instante t, [5].
54
Probabilidad, Estadı́stica y sus Aplicaciones
f (t)
2. h(t) = ,
S(t)
Z t
3. S(t) = exp(−H(t)), donde H(t) := h(u)du es llamada la función de
0
riesgo acumulado,
3. f (t) = h(t)S(t−).
55
Probabilidad, Estadı́stica y sus Aplicaciones
56
Probabilidad, Estadı́stica y sus Aplicaciones
han mejorado el éxito del trasplante, el rechazo continúa siendo uno de los princi-
pales problemas, [6].
El rechazo del injerto renal es una respuesta inmunológica compleja del huésped,
cuando se expone a antı́genos no compatibles del donante.
Son múltiples los factores que han contribuido a mejorar la supervivencia del in-
jerto y del paciente; entre los más importantes se mencionan el uso de nuevas drogas
inmunosupresoras, las transfusiones especı́ficas pre trasplante, una mayor compati-
bilidad entre el donante y el receptor, un seguimiento organizado del paciente y un
óptimo manejo de las múltiples complicaciones pos trasplante. Sin embargo, aún el
20 % de pacientes padecen el rechazo durante el primer año pos trasplante, [7].
Variable (Nomenclatura)
Lugar de Procedencia (LP)
Sexo (S)
Tipo de trasplante (TT)
Constante (C)
Hemotipo del paciente (HP)
Hemotipo del donador (HD)
Tipo de diálisis pre trasplante (TDP)
Causa de la insuficiencia renal (CIR)
Edad al momento del trasplante (EMT)
Talla (T)
Índice de masa corporal (IMC)
Edad del diágnostico de insuficiencia (EDIR)
Filtración glomerular (FGMT)
Creatinina Sérica (CSMT)
Tiempo de rechazo (TR)
Indicador de censura (EST)
Tabla 5.1: Variables medidas en pacientes que recibieron el transplante renal. Fuente:
Elaboración propia a partir de la base de datos proporcionada por el IMSS.
57
Probabilidad, Estadı́stica y sus Aplicaciones
Por la naturaleza del estudio, cada paciente tiene un tiempo origen y tiempo de
censura diferente, esto se debe a que la fecha de trasplante y el seguimiento para
cada paciente no es el mismo, por lo que se asumió que el esquema de censura es
censura aleatoria independiente.
Masculino
Femenino
20
Frecuencia
15
10
5
0
5 10 15 20 25 30 35
Edad
58
Probabilidad, Estadı́stica y sus Aplicaciones
(a)
Estimación + Kaplan−Meier
1.00 +
++
+ +
0.75 +
+ +
+ +
S(t)
0.50
0.25
0.00
0 25 50 75
t: tiempo en meses
Estimación
(b)
− 77
0
34
25
26
50
t: tiempo en meses
6
75
59
Probabilidad, Estadı́stica y sus Aplicaciones
Estimación + Kaplan−Meier
0.6
+ +
+ +
0.4
H(t)
0.2
+ +
+
+
0.0 +
0 25 50 75
t: tiempo en meses
䔀砀瀀漀渀攀渀挀椀
愀氀 䔀砀瀀漀渀攀渀挀椀
愀氀
䜀愀洀洀愀
䜀攀渀攀爀
愀氀 䜀愀洀洀愀
䜀攀渀攀爀
愀氀
䜀漀洀瀀攀爀
琀稀 䜀漀洀瀀攀爀
琀稀
䰀漀最
䰀漀最
猀琀椀
挀愀 䰀漀最
䰀漀最
猀琀椀
挀愀
䰀漀最
一漀爀
洀愀氀 䰀漀最
一漀爀
洀愀氀
䬀愀瀀氀
愀渀ⴀ
䴀攀椀
攀爀 䬀愀瀀氀
愀渀ⴀ
䴀攀椀
攀爀
圀攀椀
戀甀氀
氀 圀攀椀
戀甀氀
氀
60
Probabilidad, Estadı́stica y sus Aplicaciones
0.5
0.4
Estimación Kaplan−Meier
0.3
0.2
0.1
0.0
Call:
coxph(formula=Surv(TR, EST)~EMT+C+LP, data=dat)
coef exp(coef) p
EMT -0.1530 0.8582 0.015
C 6.7556 858.8700 0.055
LPOaxaca -0.4835 0.6166 0.655
LPTlaxcala -0.9159 0.4002 0.055
5.5. Conclusiones
En este trabajo se utilizó el criterio de Aikake para eligir el modelo Gompertz
como el modelo paramétrico que mejor representa el comportamiento del tiempo
de rechazo en injertos renales. El modelo Gompertz es usado para modelizar pro-
cesos que tienen un crecimiento lento al inicio y al final, usando el estimador de
61
Probabilidad, Estadı́stica y sus Aplicaciones
62
Probabilidad, Estadı́stica y sus Aplicaciones
Bibliografı́a
[7] G. Gamarra & J. Gómez. Rechazo en pacientes con trasplante renal. Acta
Médica Colombiana Vol. 16 No. 5, Septiembre 1991.
[8] J. D. Kalbfleisch & R. L. Prentice. The statistical analysis of failure
time data. John Wiley & Sons, 2002.
[9] J. F. Lawless. Statistical models and methods for lifetime data. Wiley Inters-
cience, 2003.
[10] J. P. Klein & M. L. Moeschberger. Survival analysis techniques for
censored and truncated data. Springer-Verlag, 2003.
[11] T. Therneau & T. Lumley. Paquete “survival” versión 2.42 − 3, CRAN,
Abril 2018.
[12] W. Hadley & W. Chang. Paquete “ggplot2” versión 2.2.1., CRAN, Diciem-
bre 2016.
[13] X. Chen & M. Baron. Change-point analysis of survival data with application
in clinical trials. Scientific Research Publishing Inc., volumen 4, páginas 663 −
677, Octubre 2014.
63
Probabilidad, Estadı́stica y sus Aplicaciones
Capı́tulo 6
Modelación espacial de la infestación del ácaro rojo de las palmas (Raoiella In-
dica) en el estado de Guerrero con un proceso espacial Poisson
Abstract.The state of Guerrero is the first producer of coconut palm, currently has
between 40,000 to 50,000 hectares dedicated to that crop. This contributes greatly
to Guerrero’s economy. Given that the coconut palm has a significant economic im-
pact in several sectors of society, it is necessary not to neglect phytosanitary aspects
64
Probabilidad, Estadı́stica y sus Aplicaciones
to ensure production and quality. One way to do this is with actions that control
the pests that affect it; one of them is the red acarus, which occupies the fourth
place in losses of production, hence the importance of its control. The objective
of this work was to model and study the spatial distribution of the red acarus in-
festation through a Poisson spatial process in the entire coastal area of Guerrero
that includes Costa Grande, Costa Chica and Acapulco during the year 2017. With
the study was achieved determine the areas of greatest infestation, this because the
model takes into account the structure of spatial variability that the pest presents,
which is very important in precision agriculture.
The knowledge of the zones of greater infestation allows a better direction of the
chemical controls, achieving with it a reduction of the costs by the handle of the
crop. The direction of the control measures on specific zones decreases the resistance
of the pest, brings benefits to the health of people and is not contaminated more
to the environment by the excessive use of chemicals. The data was provided by
SENASICA. Taking into account the methodology and the database, this study is
the first analysis carried out so far for the red acarus of the coconut palm, which is
innovative in the area of phytosanitation in the state of Guerrero.
6.1. Introducción
Raoiella Indica es una plaga originaria de la India, encontrada en hojas del cocotero
(Cocos nucifera L.). Su primera notificación en América se produjo en el año 2004,
en Martinica, región que invadió rápidamente. Hoy la plaga se encuentra en muchos
paı́ses del continente americano, en los que destacan los de las regiones tropicales
[8]. Raoiella Indica ha sido considerada como una plaga severa en el cocotero (Co-
cos nucifera L.), en la palma Areca (Areca catechu L.) en India y en la palma Dátil
(Phoenix dactylifera L.) en Egipto. En el 2004 fue considerada como severa en la
región del Caribe, y se ha distribuido ampliamente en la mayorı́a de las islas. Poste-
riormente, esta plaga fue registrada en Florida, Venezuela y más recientemente en
México, Brasil y Colombia [16]. Cabe destacar que su alimentación provoca amari-
llamiento de la zona afectada y, cuando aumenta la densidad poblacional del ácaro,
se produce una clorosis generalizada. De acuerdo a muestreos realizados en tres es-
pecies de palmas en Quintana Roo en el 2015, se observó que el mayor número de
individuos de Raoiella Indica se encuentran en cocotero, donde a altas densidades
de la plaga los porcentajes de daños pueden estar entre el 60 y 90 por ciento [8].
65
Probabilidad, Estadı́stica y sus Aplicaciones
En la actualidad diversos autores han estudiado esta plaga. Los dos siguien-
tes autores realizaron un estudio mediante componentes principales: Vásquez et al.
[15], descubrieron que el cambio de la planta hospedera influye en la alimentación
de Raoiella Indica y en consecuencia afecta su tamaño [16]; Flores-Galano et al. [8]
concluyen que existe poca información sobre el efecto de los factores abióticos en la
fluctuación poblacional de Raoiella Indica. Sin embargo, la información disponible
sugiere que este ácaro está bien adaptado a las condiciones de clima tropical y que
en los periodos prolongados de sequı́a pueden favorecer el incremento poblacional
[8]. Vásquez et al. [15], discuten las medidas morfometricas y barreras de alimenta-
ción de Raoiella Indica en la cual se basan en la distribución espacial del ácaro rojo
de las palmas [15]. Por su parte Roda et al. [14], estudian la distribución espacial
del ácaro rojo de las palmas donde interpretan la variabilidad total y la densidad de
la varianza total que se modela mediante la ley de poder de Taylor, en su estudio
enfatizan el tipo de muestreo que debe llevarse para la presencia-ausencia de conteos
del ácaro rojo de las palmas [14]. Notemos que existen aspectos importantes confor-
me a la distribución del ácaro, como Pielou [12] argumenta que su distribución es
de manera no aleatoria en Europa, donde determina algunas distribuciones, entre
las que destaca doble Poisson, Binomial Negativa y Neyman [12]. Esto es de vital
importancia para tener conocimientos previos conforme a la modelación espacial de
la infestación del ácaro rojo de la palmas.
66
Probabilidad, Estadı́stica y sus Aplicaciones
el enfoque en Diggle et al. [6], donde los datos espaciales se analizaron utilizando
modelos lineales mixtos generalizados (GLMM por sus siglas en inglés). Para la pre-
dicción espacial del proceso se utilizó Cadenas de Markov Monte Carlo (MCMC)
con un algoritmo MCMC más eficiente, el cual está basado en las actualizaciones
de Langevin-Hastings.
Los modelos lineales mixtos generalizados [1] son extensiones de modelos li-
neales generalizados [10], los GLMM incorporaran efectos aleatorios no observables
en el modelo, permitiendo de esta forma agregar fuentes adicionales de variabilidad.
A continuación se explican los GLMM para los datos de conteo, donde los efectos
aleatorios se modelan mediante un campo Gaussiano correlacionado espacialmente
[6].
67
Probabilidad, Estadı́stica y sus Aplicaciones
68
Probabilidad, Estadı́stica y sus Aplicaciones
Aproximar
m
1 X
E[λ(x0 )|y] ≈ E[λ(x0 )|s(j)].
m j=0
69
Probabilidad, Estadı́stica y sus Aplicaciones
6.4. Aplicación
6.4.1. Descripción de los Datos
Los datos proporcionados por SENASICA fueron conteos del ácaro rojo (Raoiella
Indica) de las palmas del cocotero para el año 2017. Dichos muestreos fueron reali-
zados parcialmente en la zona de Acapulco, Costa Chica y Costa Grande del estado
de Guerrero (Figura 6.1).
Figura 6.1: Distribución del ácaro rojo en la zona costera del estado de Guerrero.
Para el análisis de la infestación del ácaro rojo, la base de datos se dividió men-
sualmente. En la Figura 6.2 se observa la intensidad de infestación del ácaro rojo
de las palmas para los meses de Enero, Mayo, Septiembre y Diciembre. La intensi-
dad del color de los puntos está relacionado con el número de ácaros encontrados
en la zona de muestreo. Observe que hay una tendencia decreciente de Oeste-Este
(Costa grande-Costa Chica) en el número de ácaros rojos. Los valores del ı́ndice de
infestación se encuentran entre un rango de valores de 1.4 y 22.
Con la ayuda de los paquetes geoR [13] y geoRglm [2] del software R se llevó a
cabo el análisis espacial de la infestación del ácaro rojo.
70
Probabilidad, Estadı́stica y sus Aplicaciones
Enero Mayo
Septiembre Diciembre
71
Probabilidad, Estadı́stica y sus Aplicaciones
19.0
19.0
18.5
1.8
18.5
18.5
1.8
1.8
18.0
1.7
18.0
18.0
1.7
** **
** 1.6
5
17.5
1.7 * 1.6
17.5
17.5
1.6 1.8 *
65
* *
7
7
* *
5
1.
1.
1.
**
1.5
**
1.5
**
6
5
1.
1.4
5
******** ** *** 1.3 ********* *****
1.3
******* *******
4
1.3
1.5
3
17.0
1.
1.5 * **
17.0
1.3
17.0
1.
* *** * *
1.3 ** *** ** ********
1.2
***** *
* * * * *** 1.4
1.25
* *
* **** ** * * ** ** ********
1.2
*
1.25
1.4
1.1
1.2
* * *** ***
1.2
16.5
**** **
16.5
1.3
16.0
16.0
1.3 1.2
16.0
1.2
15.5
15.5
1.2
15.5
−101.5 −100.5 −99.5 −99.0 −98.5 −101.5 −101.0 −100.5 −100.0 −99.5 −99.0 −101.5 −100.5 −99.5 −99.0 −98.5
19.0
19.0
18.5
18.5
18.5
1.8 1.8
2.0
18.0
18.0
18.0
** ** **
1.7
1.8
** *
17.5
17.5
** *
17.5
2
* 1.8 1.7
1.7
5
* *
1.7
*
1.6
** ** **
1.5
1.8
5
1.5
********* *******
1.5
********* *******
1.4
17.0
17.0
17.0
1.7
** ***** **
1.4 * ***** * ****** **
* *** *** 7
1.45* ** ******** **
*1.5 ** ***** 1. * ** ******1.
1.5
1.5
1.4
1.6 ***4
1.5
*** **
16.5
16.5
*** ***
16.5
16.0
16.0
1.4 1.5
1.4
15.5
15.5
15.5
−101.5 −100.5 −99.5 −99.0 −98.5 −101.5 −100.5 −99.5 −99.0 −98.5 −101.5 −100.5 −99.5 −99.0 −98.5
19.0
19.0
2.35 2.8
18.5
18.5
18.5
1.8
2.30 2.6
18.0
18.0
18.0
** ** **
** 2.25 ** * 2.4
17.5
17.5
** *
17.5
1.8 1.7 *
1.7
*
2.2
** 2.2 **
1.9
2.25
********* ******** ********* *******
2
**
*1.5 ** ***** ** *******
1.9
*2.2 ** ***
1.7
1.6 *
1.5
***** ** ****** *
16.5
16.5
** * **
16.5
2.10 1.8
1.5
15.5
15.5
15.5
−101.5 −100.5 −99.5 −99.0 −98.5 −101.5 −100.5 −99.5 −99.0 −98.5 −101.5 −100.5 −99.5 −99.0 −98.5
Figura 6.3: Valores pronosticados de la infestación del ácaro para el año 2017.
72
Probabilidad, Estadı́stica y sus Aplicaciones
Con este estudio se logró determinar la zonas de mayor infestación del ácaro rojo
en la zona costera del estado de Guerrero. Esto gracias a que el modelo Poisson-log-
lineal toma en cuenta la estructura de variabilidad espacial que presenta la plaga.
Este tipo de estudios es muy importante en la agricultura de precisión ya que per-
mite una mejor dirección de los controles quı́micos logrando con ello: una reducción
de los costos del manejo del cultivo, una disminución en la resistencia de la plaga a
los quı́micos y beneficios a la salud de las personas, además de disminuir la conta-
minación del medio ambiente.
Este estudio es importante porque implementa los modelos lineales mixtos gene-
ralizados para la predicción espacial de una plaga, ya que al usarlo permite predecir
la intensidad de la plaga en ubicaciones no muestreadas. Esto es importante porque
ayuda en la elaboración de un plan de alerta para la utilización de herbicidas en
sitios especı́ficos.
73
Probabilidad, Estadı́stica y sus Aplicaciones
Bibliografı́a
[2] Christensen, O. F., & Ribeiro Jr, P. J. geoRglm-a package for generalized
linear spatial models. R News, 2(2), 26-28, 2002.
[3] Christensen, O. F., & Waagepetersen, R. Bayesian prediction of spatial
count data using generalized linear mixed models. Biometrics, 58(2), 280-286,
2002.
[4] Cressie, N. A. Statistics for spatial data. Wiley series in probability and mat-
hematical statistics, 1993.
[5] Diggle, P. J., Ribeiro, P. J., & Christensen, O. F.An introduction to
model-based geostatistics. In Spatial statistics and computational methods, 43-
86. Springer, New York, NY, 2003.
[6] Diggle, P. J., Tawn, J. A., & Moyeed, R. A.Model based geostatistics
(with discussion). Journal of the Royal Statistical Society: Series C (Applied
Statistics), 47(3), 299-350, 1998.
[7] Emilio G., Fernando F. Agricultura de Precisión. Tecnologı́a Agropecuaria.
[11] Navia, D., Hamada, E., Gondim Jr, M. G. C., & Benito, N. P. Spatial
forecasting of red palm mite in Brazil under current and future climate change
scenarios. Pesquisa Agropecuaria Brasileira, v.51(5), n.5, 586-598, maio 2016.
74
Probabilidad, Estadı́stica y sus Aplicaciones
[14] Roda, A., Nachman, G., Hosein, F., Rodrigues, J. C. V., & Peña, J. E.
Spatial distributions of the red palm mite, Raoiella Indica (Acari: Tenuipalpidae)
on coconut and their implications for development of efficient sampling plans.
Experimental and applied acarology, 57(3-4), 291-308, 2012.
[15] Vásquez, C., Egurrola, Z., Valera, R., Sanabria, M. E., & Col-
menárez, Y. Anatomı́a y quı́mica foliar en especies ornamentales de Arecaceae:
posibles barreras a la alimentación de Raoiella Indica Hirst (Acari: Tenuipalpi-
dae). Gayana. Botánica, 72(2), 296-304, 2015.
[16] Vásquez, C. L., Rodrı́guez, G., Hernández, A., Mendez, N., Dávila,
M., Valera, N., & Morales, J. Variabilidad de poblaciones de Raoiella In-
dica (Acari: Tenuipalpidae) evaluada mediante análisis morfológico y molecular
en Venezuela. Sociedad Venezolana de Entomologı́a Vol. 29(2): 105-120, agosto
2014.
75
Probabilidad, Estadı́stica y sus Aplicaciones
Capı́tulo 7
Una aplicación de la metodologı́a Biplot Logı́stico: Análisis de la sostenibilidad
empresarial
Universidad de la República,
1
Facultad de Psicologı́a,
Instituto de Fundamentos y Métodos en Psicologı́a,
Dr Tristón Narvaja 1674, C.P. 11200, Montevideo, Uruguay,
2
Facultad de Ciencias Económicas y de Administración,
Eduardo Acevedo 1139, C.P. 11200, Montevideo, Uruguay
[email protected], [email protected]
Resumen. Esta investigación es una continuación del trabajo “Sostenibilidad
Empresarial: Análisis desde una perspectiva multivariante a través de la metodo-
logı́a HJ-Biplot”[9]. Los resultados aquı́ presentados refieren a las mismas empresas
que el mencionado trabajo, pero en esta oportunidad se tiene en consideración
únicamente los ı́ndices reportados por el Global Reporting Initiative (GRI, en su
versión G4), en su calidad de variables binarias (reporta/no reporta).
Se presenta, en primera instancia, un análisis descriptivo de las variables a utilizar
y se da paso a una comparación multivariante, a través de la implementación de
la metodologı́a Biplot (en particular Biplot Logı́stico). Por último, se presentan los
principales resultados obtenidos al realizar un análisis de cluster que permite encon-
trar y caracterizar grupos de empresas similares en función de los indicadores de
sostenibilidad que reportan. En cada uno de estos análisis se hace especial énfasis
en la distinción existente por región (América Latina y América del Norte).
Entre los principales resultados obtenidos se destaca: a) la diferencia en el reporte
de los indicadores al considerar las distintas regiones y b) la existencia de 3 grupos
de empresas con las siguientes caracterı́sticas: empresas que presentan ausencias y
presencias en igual proporción en los indicadores de sostenibilidad, empresas que
presentan ausencias en la mayorı́a de los indicadores y, por último, empresas que
muestran presencia de reporte de la mayorı́a de indicadores.
76
Probabilidad, Estadı́stica y sus Aplicaciones
7.1. Introducción
La sostenibilidad es un concepto tan amplio que puede ser aplicado a los más
diversos ámbitos. Es posible hablar de economı́a sostenible, de sociedad, de empresa,
de medio ambiente y hasta de polı́tica sostenible, entre otros. Se entiende que en
todos los casos se refiere al mismo concepto pero aplicado a distintos contextos.
Este concepto, tal como se percibe en la actualidad, surge a fines de la década
del 80 a partir de la necesidad de estudiar (y tratar de delimitar) el impacto que
tienen las acciones humanas sobre el medio ambiente.
Desde entonces, los gobiernos de diferentes paı́ses han trabajado para concienciar
a las empresas sobre la necesidad de poseer polı́ticas empresariales sostenibles. Gra-
cias a la presión llevada a cabo por diversos sectores económicos y sociales en 2002
se redactó el Código de Buen Gobierno de la Empresa Sostenible, donde se define
la empresa sostenible y se le vincula a la idea de responsabilidad social corporativa
(RSC) [8].
La RSC se entiende como la promoción e implementación de buenas prácticas
de negocio, asumiendo la responsabilidad del impacto que genera la actividad de la
empresa. La RSC consta de cinco dimensiones: polı́tica filantrópica de la empresa
(concepto alejado de la RSC en el marco del desarrollo sostenible), ética en los ne-
gocios (principios y valores compartidos con todos aquellos miembros de la sociedad
que tengan relación con la empresa), polı́tica de la empresa (gobernabilidad basada
en rendición de cuentas con monitoreo y validación externa, transparencia y cumpli-
miento de las normativas), preocupación y atención a todo el ciclo productivo (desde
el proveedor de materia prima hasta el consumidor final) y, por último, normativa
77
Probabilidad, Estadı́stica y sus Aplicaciones
7.2. Metodologı́a
Los métodos Biplot son una representación gráfica (en baja dimensión) de la
información proporcionada por una matriz de datos multivariantes [1], al igual que
un diagrama de dispersión representa gráficamente una relación (correlación lineal)
entre dos variables, los métodos Biplot representan relaciones existentes entre más
de dos variables [2].
Siendo X una matriz de datos con información referente a n individuos y p varia-
bles, por lo general continuas, una representación Biplot de ésta se logra a partir de
la determinación de a1 , a2 , ..., an marcadores fila y b1 , b2 , ..., bp marcadores columna
de forma tal que el producto interno ati bj logre reproducir el elemento xij original.
En formato matricial, si se considera A una matriz cuyas filas sean los marcado-
res a1 , a2 , ..., an y otra matriz B tal que sus filas sean los marcadores b1 , b2 , ..., bp
entonces, la matriz X podrá ser aproximada como X ∼ = AB t .
La factorización de la matriz X siempre es posible, pero ésta no es única. Por lo
tanto, para que la representación Biplot sea válida es necesario imponer restricciones
que garanticen que la descomposición, y por lo tanto la representación Biplot, sea
única.
Al igual que en la mayorı́a de las técnicas clásicas de análisis de datos multi-
variantes basada en la reducción de dimensionalidad, la factorización propuesta es
la que se obtiene al realizar una descomposición de la matriz X en valores singu-
lares. Por lo tanto, el punto de partida de un análisis a través de la metodologı́a
Biplot, será: X = U DV t , donde U es una matriz cuyas columnas coinciden con los
vectores propios de XX t , V otra matriz cuyas columnas coinciden con los vectores
propios de X t X y D la matriz diagonal que contiene los valores singulares de X,
equivalentes a las raı́ces cuadradas (≥ 0) de los valores propios de X t X.
Ası́, dependiendo de como se decida realizar la factorización de la matriz X se
obtendrá un tipo de representación Biplot diferente [9].
Por otra parte, si X es una matriz de datos con información referente a n in-
dividuos y p variables binarias, se tiene una formulación del problema diferente,
denominada Biplot Logı́stico [10], [12]. Siendo Πij la probabilidad esperada de que
1 Estas empresas se seleccionaron tomando en cuenta el ranking FORTUNE 500.
http://fortune.com/global500/
78
Probabilidad, Estadı́stica y sus Aplicaciones
Lo que equivale, en formato matricial, a logit(Π) = 1n bt0 +AB t (con A y B las matrices
de marcadores ya definidas y 1n vector de unos).
7.3. Resultados
Los datos utilizados en este trabajo corresponden a las 56 empresas más grandes de
América Latina, el Caribe y América del Norte. Se cuenta con información referente a
variables divididas en 2 grupos: caracterı́sticas propias de las empresas (Paı́s, Región,
Tamaño, Sector) e indicadores de sustentabilidad reportados en el GRI (en su versión
G4). Estas variables son de naturaleza binaria: reporta/no reporta.
Por otra parte, en el Cuadro 7.2 se observa la distribución de las empresas por paı́s
según tamaño, donde se puede ver que ninguna pertenece a pequeñas empresas y poco
más del 50 % son multinacionales.
79
Probabilidad, Estadı́stica y sus Aplicaciones
En lo que refiere al sector de actividad económica de las empresas (ver Cuadro 7.3), un
46 % se dedica a la Industria, Agua y Energı́a, seguidas de aquellas que se dedican a brindar
otro tipo de servicios (20 %). Cabe resaltar que hay solo una empresa del sector Primario,
una del sector Reparaciones, y una del sector Educación y que las tres corresponden
a empresas de Estados Unidos. Sólo una de las 56 empresas es estatal, se encuentra en
Brasil, pertenece al sector otros servicios y es una empresa de tamaño grande. Las restantes
empresas corresponden todas al sector privado.
80
Probabilidad, Estadı́stica y sus Aplicaciones
Para finalizar, se presentan los porcentajes de los reportes de cada ı́ndice separado por
región, Latinoamérica y Norteamérica (ver Figura 7.1 y Figura 7.2).
Para los indicadores EN (Medio Ambiente), se destaca que en las dos regiones el com-
portamiento es muy parecido. Resalta EN15 (20 %), emisiones directas de gases de efecto
invernadero y los picos altos de EN18 (85 %) y EN27 (70 %) que atienden, respectivamente,
a la intensidad de las emisiones de gases de efecto invernadero y la mitigación del impacto
ambiental de los productos y servicios.
En lo que refiere a los indicadores HR (Derechos Humanos), se observa que latinoaméri-
ca presenta mayor porcentaje de reporte en todos, excepto en el indicador HR10 porcentaje
de nuevos proveedores que se examinaron en función de criterios relativos a los derechos
humanos.
Los indicadores LA (Prácticas Laborales) se comportan de manera similar al HR,
siempre con valores más altos para latinoamérica excepto en los indicadores LA10 (85 %),
programas de gestión de habilidades y formación continua que fomentan la empleabilidad
de los trabajadores y le ayudan a gestionar el final de sus carreras profesionales, y LA12
(85 %), composición de los órganos de gobierno y desglose de la plantilla por categorı́a
profesional y sexo, edad, pertenencia a minorı́as y otros indicadores de diversidad. Tam-
bién se destaca la bajada de reporte que se da en latinoamérica en los indicadores LA3
(60 %), ı́ndices de reincorporación al trabajo y de retención tras el permiso por maternidad
o paternidad, desglosado por sexo, y LA4 (60 %), plazos mı́nimos de preaviso de cambios
operativos y posible inclusión de estos en los convenios colectivos.
81
Probabilidad, Estadı́stica y sus Aplicaciones
82
Probabilidad, Estadı́stica y sus Aplicaciones
Los indicadores de la escala SO (Sociedad), muestran picos altos para SO1 (70 %),
porcentaje de operaciones donde se han implantado programas de desarrollo, evaluación de
impactos y participación de la comunidad local, SO4 (75 %), polı́tica y procedimientos de
comunicación y capacitación sobre la lucha contra la corrupción y SO6 (70 %), valor de las
contribuciones polı́ticas, por paı́s y destinatario, para norteamérica, y SO4 (85 %) y SO6
(100 %) para latinoamérica. Mientras que muestran picos bajos en SO11 (30 %), número de
reclamaciones sobre impactos sociales que se han presentado, abordado y resuelto mediante
mecanismos formales de reclamación, para norteamérica y para latinoamérica en SO2
(60 %), centros de operaciones con efectos negativos significativos, reales o potenciales,
sobre las comunidades locales, SO7 (60 %), número de procedimientos legales por causas
reclamadas con prácticas monopolı́sticas y contra la libre competencia, y sus resultados,
y SO8 (60 %), valor monetario de las multas significativas y número de sanciones no
monetarias por incumplimiento de la legislación y la normativa, aunque todos los ı́ndices
son más reportados por las empresas de latinoamérica.
Por último, al considerar el reporte de los ı́ndices de manera general, se aprecia que
todas las categorı́as son más reportadas por las empresas latinoamericanas.
83
Probabilidad, Estadı́stica y sus Aplicaciones
De esta forma se obtiene una solución que resulta fácilmente interpretable y que logra
explicar más del 30 % de la variabilidad total (porcentaje que se entiende razonable, si se
considera que están en estudio 91 variables).
Los resultados generales, sin imponer ninguna restricción sobre la calidad de represen-
tación, se presentan en la Figura 7.3.
84
Probabilidad, Estadı́stica y sus Aplicaciones
85
Probabilidad, Estadı́stica y sus Aplicaciones
Dimensión Económica
Tal como se observa en la Figura 7.4, en esta dimensión quedan bien representadas las
variables EC5 (Relación entre el salario inicial desglosado por sexo y el salario mı́nimo
local en lugares donde se desarrollan operaciones significativas) y EC6 (Porcentaje de altos
directivos procedentes de la comunidad local en lugares donde se desarrollan operaciones
significativas).
La caracterización de los clusters, en función de la dimensión económica, es:
Cluster 1 y 2 ausencia en ambas variables.
Cluster 3 presencia en ambas variables.
86
Probabilidad, Estadı́stica y sus Aplicaciones
Dimensión Ambiental
En cuanto a la dimensión ambiental, como puede verse en la Figura 7.5, en esta di-
mensión quedan bien representadas los ı́ndices EN1, EN2, EN4, EN9, EN10, EN11, EN12,
EN14, EN16, EN20, EN21, EN22, EN23, EN24, EN25, EN26, EN32, EN34.
87
Probabilidad, Estadı́stica y sus Aplicaciones
Prácticas Laborales
En esta dimensión, y considerando el mismo R2 de las dimensiones anteriores quedan
representadas todas las indicadoras menos LA2, LA4, LA5, LA12 y LA13 (ver Figura 7.6).
Los culsters se caracterizan por:
Cluster 1 ausencia en todas menos LA6.
Cluster 2 ausencia en todas menos LA9 y LA10.
Cluster 3 presencia en todas.
88
Probabilidad, Estadı́stica y sus Aplicaciones
7.4. Conclusiones
Las principales conclusiones obtenidas del análisis presentado en este trabajo se expo-
nen a continuación:
Teniendo en consideración la comparación por región, se destaca que América Latina
presenta mayores reportes en todos los indicadores.
Los indicadores más reportados por las empresas de América Latina son: Prácticas
Laborales y Sociedad, y para las empresas de norteamérica: Económica y Ambiental.
Existen 3 grupos de empresas con las siguientes caracterı́sticas:
• Cluster I: se detecta ausencia y presencia en igual proporción en el reporte de
los indicadores de sostenibilidad.
• Cluster II: ausencia de reporte en la mayorı́a de los indicadores.
• Cluster III: presencia de reporte de la mayorı́a de indicadores.
89
Probabilidad, Estadı́stica y sus Aplicaciones
Bibliografı́a
[1] Gabriel, K., The biplot graphic display of matrices with application to principal
component analysis., Biometrika 58(3), 453 - 467, 1971.
[8] Ricart, J.E. y Rodrı́guez, M.A., Código de Gobierno para la empresa Sostenible:
Guı́a para su implementación. Center for Business in Society, IESE, 2002.
[9] Vernazza, E., Urruticoechea, A., Sostenibilidad Empresarial: Análisis desde una
perspectiva multivariante a través de la metodologı́a HJ-Biplot, 2017. Disponible en:
https : //www.f cf m.buap.mx/SIEP 2017/M emorias/Extensos/Carteles/8.pdf .
[10] Vicente Villardán, J.L., Biplot for binary data based on logistic response surfaces.,
Salamanca Statistics Seminar IV. Advances in Multivariate Analysis. Salamanca,
December, 2001.
90
Probabilidad, Estadı́stica y sus Aplicaciones
[12] Vicente Villardán, J.L., Galindo, M.P., y Blazquez, A., Logistic Biplots.,
Múltiple Correspondence Análisis And Related Methods, 491 - 509, 2006.
91
Probabilidad, Estadı́stica y sus Aplicaciones
Capı́tulo 8
Análisis de la deserción en las licenciaturas de la FCFM-BUAP mediante el
modelo de riesgo proporcional semiparamétrico
Abstract. The Survival Analysis models the time it takes to occur a specific
event. This paper presents the main definitions of the Survival Analysis and diffe-
rent survival models, in addition the semi-parametric proportional hazard model
is applied to the problem of dropout in the Actuarial, Mathematics and Applied
Mathematics degrees taught in the Facultad de Ciencias Fı́sico Matemáticas of the
Benemérita Universidad Autónoma de Puebla (FCFM-BUAP).
8.1. Introducción
El Análisis de Supervivencia es un conjunto de técnicas que tienen como obje-
tivo modelizar el tiempo que se tarda en ocurrir un evento especı́fico. Este evento
frecuentemente se llama fracaso, falla o muerte, y ocurre después de un periodo
llamado el tiempo de falla, tiempo de supervivencia o tiempo de vida.
Las aplicaciones del Análisis de Supervivencia van desde investigaciones de la
durabilidad de artı́culos manufacturados hasta estudios de enfermedades humanas
y sus tratamientos [3].
92
Probabilidad, Estadı́stica y sus Aplicaciones
8.2. Definiciones
A continuación se presentan algunas definiciones utilizadas en el Análisis de Su-
pervivencia. Se considera una población homogénea de individuos, teniendo cada
uno un tiempo de falla, es decir, se trata con una variable aleatoria no negativa, T .
Supóngase que T es continua, con función de densidad de probabilidad (f.d.p.) f (·) y
Las funciones S(·), f (·) y F (·) proporcionan tres formas matemáticas equivalen-
tes para especificar la distribución de una variable aleatoria continua no negativa, y
por supuesto hay otras funciones equivalentes. Una con valor especial en el contexto
presente es la función de riesgo, definida por,
P r(t 6 T < t + ∆|t 6 T )
h(t) = lim+ , para t > 0. (8.2)
∆→0 ∆
La función de riesgo especı́fica la tasa instantánea de muerte o falla en el tiem-
po t, dado que el individuo sobrevive hasta el tiempo t; h(t)∆ es la probabilidad
aproximada de falla en [t, t + ∆), dado que sobrevivió hasta el tiempo t.
93
Probabilidad, Estadı́stica y sus Aplicaciones
94
Probabilidad, Estadı́stica y sus Aplicaciones
b 2
X dj
Vd
ar(S(t))
b = S(t) , (8.5)
rj (rj − dj )
j:tj 6t
95
Probabilidad, Estadı́stica y sus Aplicaciones
paramétrico especificando una relación entre los parámetros del modelo y las cova-
riables. Sin embargo, frecuentemente sólo ciertos parámetros en una distribución de
tiempo de falla se asumen dependientes de las covariables [3].
Otra forma frecuente de formular modelos es definir al vector x de variables ex-
plicativas de modo que x = 0 corresponde a algún conjunto de condiciones estándar
significativas, por ejemplo un tratamiento control. Luego, se pueden desarrollar los
modelos convenientemente en dos partes:
Supóngase ahora que el vector de variables explicativas depende del tiempo, x(t).
La esencia del modelo de vida acelerada es que el tiempo es contraı́do o ampliado
relativamente a éste en x = 0. Esto sugiere que para un individuo caracterizado
por x(t), el tiempo t(x) , evoluciona con respecto al tiempo t(0) para tal individuo
estando en x = 0 de acuerdo con
dt(x) 1
(0)
= ,
dt ψ(x(t(x) ))
i.e.
Z t(x)
(0)
t = ψ(x(u))du = Ψ(t(x) ),
0
donde ψ(·) es una función positiva y ψ(0) = 1, ası́ que el tiempo de falla está
relacionado por T = Ψ−1 (T0 ) [1].
Por lo tanto, en el modelo de vida acelerada la función de supervivencia, la f.d.p.
y la función de riesgo son
S(t|X) = S0 [Ψ(t)],
f (t|X) = ψ[x(t)]f0 [Ψ(t)], (8.6)
h(t|X) = ψ[x(t)]h0 [Ψ(t)],
96
Probabilidad, Estadı́stica y sus Aplicaciones
S(t|x(t)) = exp[−H(t|x(t))]
h R i
t
= exp − 0 h(u|x(u))du
h R i
t
= exp − 0 ψ(x(u))h0 (u)du
y
f (t|x(t)) = h(t|x(t))S(t|x(t))h i
Rt
= ψ(x(t))h0 (t) exp − 0
ψ(x(u))h0 (u)du .
Si x(·) es constante sobre el tiempo, i.e. x(t) = x para todo t > 0, entonces se
tiene el modelo de riesgo proporcional simple.
Se puede considerar a h0 (·) igual a la función de riesgo de alguna familia pa-
ramétrica y a una forma paramétrica para ψ(·), que se denotará por ψ(·; β), para
tener un modelo paramétrico. 0
Tres parametrizaciones para ψ(·) son: la forma log lineal ψ(x; β) = eβ x , que por
buenas razones ha llegado a ser la más popular, la forma lineal ψ(x; β) = 1 + β 0 x,
0
y el logı́stico, ψ(x; β) = log(1 + eβ x ).
en donde ψ(·) está restringida para que ψ(0) = 0 y ψ(x) + h0 (t) > 0 para todo x
y t > 0, además h0 (·) es la función de riesgo para un individuo bajo la condición
estándar (x = 0). La función de supervivencia y la f.d.p. cumplen que
S(t|x) = exp[−H(t|x)]
h R i
t
= exp − 0 (ψ(x) + h0 (u))du
= exp [−ψ(x)t − H0 (t)]
= exp [−ψ(x)t] exp [−H0 (t)] ,
i.e.
S(t|x) = exp [−ψ(x)t] S0 (t) (8.8)
97
Probabilidad, Estadı́stica y sus Aplicaciones
y
f (t|x) = h(t|x)S(t|x)
= (ψ(x) + h0 (t)) exp [−ψ(x)t] S0 (t).
Los modelos completamente paramétricos se obtienen considerando a h0 (·) igual
a la función de riesgo de alguna de las familias de distribuciones y una forma pa-
ramétrica para ψ(·).
El análisis de los modelos de regresión paramétricos se concentra en los métodos
basados en la función de verosimilitud. Para una variedad de mecanismos de censura
por la derecha, la función de verosimilitud de las observaciones (ti , δi , Xi (ti )), i =
1, . . . , n, cumple que
n
Y
L∝ f (ti |Xi (ti ))δi S(ti |Xi (ti ))1−δi ,
i=1
en donde U denota al conjunto de los individuos que fallan y Ri = R(ti ) = {j|tj >
ti } es el conjunto de individuos en riesgo justo antes de ti .
98
Probabilidad, Estadı́stica y sus Aplicaciones
ha tomado un lugar importante dado que no tiene sentido realizar un esfuerzo sig-
nificativo por aumentar la cobertura, calidad y equidad en educación superior, sin
controlar la deserción y su problemática multicausal y compleja. De esta manera,
el emprendimiento de este tipo de estudios aporta a la comprensión del fenómeno
y permite generar estrategias de retención estudiantil al interior de las IES y por
parte del Estado [4].
99
Probabilidad, Estadı́stica y sus Aplicaciones
100
Probabilidad, Estadı́stica y sus Aplicaciones
101
Probabilidad, Estadı́stica y sus Aplicaciones
En Actuarı́a:
h(t|x) = h0 (t) exp{(0.535, −0.093, −0.164, −1.071)x},
b
102
Probabilidad, Estadı́stica y sus Aplicaciones
En Matemáticas:
h(t|x) = h0 (t) exp{(−0.006, 0.846, 0.717, −0.589)x},
b
En Matemáticas Aplicadas:
h(t|x) = h0 (t) exp{(−0.007, −0.560, 0.603, 0.095)x},
b
El modelo obtenido para Actuarı́a muestra que mayor puntuación en Teórico in-
dica menor riesgo de deserción, lo cual también ocurre con la puntuación de Lawson.
Se nota que los alumnos que proceden de un bachillerato general (TipoBach=0) tie-
nen mayor riesgo de desertar que los que proceden de un bachillerato especializado
(TipoBach=1). También se observa que a mayor número de materias reprobadas
durante el bachillerato (MatRep) mayor es el riesgo de desertar.
El modelo para la Licenciatura en Matemáticas muestra que mayor Puntaje
indica menor riesgo de deserción. También, los alumnos que proceden de un bachi-
llerato general (TipoBach=0) tienen mayor riesgo de desertar que los que proceden
de un bachillerato especializado (TipoBach=1). En esta licenciatura, los alumnos
que trabajan (Trabajo=1) tienen mayor riesgo de desertar que los alumnos que no
trabajan (Trabajo=0). Además, los alumnos que eligieron estudiar Matemáticas co-
mo primera opción (OpCarrera=0) tienen menor riesgo de desertar que los que la
estudian como segunda opción (OpCarrera=1).
El modelo para Matemáticas Aplicadas señala que mayor Puntaje indica menor
riesgo de deserción y que mayor puntuación en Lawson indica mayor riesgo de
deserción, esto posiblemente se debe a la correlación positiva moderada existente
entre Puntaje y Lawson. Este modelo también revela que los alumnos con más
recursos semanales (RecSem) tienen menor riesgo de desertar y que los alumnos que
proceden de un bachillerato público (FinBach=0) tienen menor riesgo de deserción
que los que proceden de un bachillerato privado (FinBach=1). Estas interpretaciones
se resumen en la Tabla 8.5.4.
Dado que en las licenciaturas en matemáticas (Matemáticas y Matemáticas Apli-
cadas) la covariable Puntaje es indicadora de mayor riesgo de deserción, se realiza
una comparación de las estimaciones de la función de supervivencia y de la fun-
ción de riesgo acumulado para los alumnos con Puntaje mayor o igual a 750 con los
alumnos con Puntaje menor a 750. La Figura 8.2 muestra que los alumnos con Pun-
taje mayor o igual a 750 tienen mayor supervivencia estimada que los alumnos con
Puntaje menor a 750. Además, la Figura 8.3 muestra que los alumnos con Puntaje
mayor o igual a 750 ya no están en riesgo de desertar a partir del quinto semestre
y medio en la LM y a partir del séptimo semestre y medio en la LMA.
103
Probabilidad, Estadı́stica y sus Aplicaciones
104
Probabilidad, Estadı́stica y sus Aplicaciones
el otro considerando a todas las covariables. Estos modelos sólo contienen covariables
estadı́sticamente significativas y muestran que valores en las covariables indican
mayor riesgo de deserción.
Los modelos obtenidos cuando sólo se consideran a las covariables de escala
mı́nima de intervalo muestran que el Puntaje es una covariable significativa en las
licenciaturas estudiadas y que mayor Puntaje indica menor riesgo de deserción. En
la Licenciatura en Actuarı́a otras covariables que tienen la misma interpretación
son Teórico y Autoestima.
Los modelos resultantes cuando se consideran a todas las covariables incluyen
al menos una covariable académica (Teórico, Lawson o Puntaje) y una covariable
que tiene que ver con las caracterı́sticas del bachillerato de procedencia (TipoBach
o FinBach). Esto significa que el bachillerato de procedencia influye en el riesgo de
deserción de los alumnos de las licenciaturas estudiadas.
Sólo en las licenciaturas de matemáticas (Matemáticas y Matemáticas Apli-
cadas), los modelos contienen una covariable que tiene que ver con la economı́a
(Trabajo o RecSem). Lo cual se puede deber a la diferencia económica existente
entre los alumnos de estas carreras y los de Actuarı́a.
Los modelos muestran que el número de materias reprobadas en el bachillerato
(MatRep) sólo aumenta el riesgo de deserción de los estudiantes de Actuarı́a. Mien-
tras que el hecho de estar estudiando la carrera como segunda opción (OpCarrera)
sólo aumenta el riesgo de los estudiantes de Matemáticas.
La comparación por Puntaje muestra que en las licenciaturas en matemáticas
(Matemáticas y Matemáticas Aplicadas) los alumnos con Puntaje mayor o igual a
750 tienen mayor supervivencia estimada que los alumnos con Puntaje menor a 750.
A pesar de que los modelos obtenidos varı́an, se puede decir que en las licen-
ciaturas estudiadas el Puntaje de ingreso a la universidad es un factor que tiene
gran influencia en la deserción. Además, el bachillerato de procedencia también in-
fluye en la deserción. También, caracterı́sticas respecto a la economı́a sólo afectan
a los estudiantes de las licenciaturas de matemáticas (Matemáticas y Matemáticas
Aplicadas).
105
Probabilidad, Estadı́stica y sus Aplicaciones
8.6. Conclusiones
El Análisis de Supervivencia consiste en un conjunto de técnicas que estudian
el tiempo hasta que ocurre un evento especı́fico. Su metodologı́a es muy extensa
ya que incluye una gran variedad de modelos (paramétricos, no paramétricos y se-
miparamétricos), además algunos modelos permiten incluir variables explicativas o
covariables para evaluar la relación existente entre el tiempo de falla y las covaria-
bles. Los diferentes modelos de supervivencia, con o sin covariables, se pueden usar
para estudiar diferentes datos, incluso cuando se tienen individuos de los que no se
conoce el tiempo de falla exacto (censurados).
La flexibilidad del Análisis de Supervivencia permite aplicarlo en una gran va-
riedad de estudios. En este trabajo se aplica esta metodologı́a en un estudio de la
deserción de las licenciaturas de la Facultad de Ciencias Fı́sico Matemáticas (FCFM)
de la Benemérita Universidad Autónoma de Puebla (BUAP).
Para las licenciaturas en Actuarı́a, Matemáticas y Matemáticas Aplicadas el
análisis de deserción con covariables proporciona modelos de riesgo proporcional
semiparamétricos. Estos modelos muestran que mayor puntaje de ingreso a la uni-
versidad (Puntaje) indica menor riesgo de desertar. Además, al considerar todas
las covariables estudiadas los modelos resultantes muestran que la puntuación alta
de una covariable académica (en Actuarı́a: Teórico o Lawson; en Matemáticas y
Matemáticas Aplicadas: Puntaje) indica menor riesgo de desertar, que las carac-
terı́sticas del bachillerato de procedencia influyen en el riesgo de deserción y que
sólo los modelos correspondientes a las licenciaturas de matemáticas (Matemáti-
cas y Matemáticas Aplicadas) indican que una covariable de economı́a (Trabajo o
RecSem) esta relacionada con el riesgo de deserción.
106
Probabilidad, Estadı́stica y sus Aplicaciones
Bibliografı́a
[1] Cox, D. R.; Oakes, D. Analysis of Survival Data. 1a ed., Gran Bretaña,
Chapman & Hall, 1984.
[2] “Historia Universitaria”. BUAP. http://www. buap. mx/. Consultado: 14 de
abril de 2017.
[3] Lawless, J. F. Statistical Models and Methods for Lifetime Data. 2a ed., Nueva
Jersey, Wiley-Interscience, 2003.
[4] Montes Gutiérrez, I. C.; Almonacid Hurtado, P. Ma.; Gómez Car-
dona, S.; Zuluaga Dı́az, Fco. I.; Tamayo Zea, E. Análisis de la deserción
estudiantil en los programa de pregrado de la Universidad EAFIT. Grupo de
investigación estudios en economı́a y empresa, Departamento de Economı́a, Es-
cuela de Administración, Universidad EAFIT. Medellı́n. ISSN 1692-0694, 2010.
[5] Muñoz Vargas, B. X. Análisis de la deserción en las licenciaturas de la
FCFM-BUAP mediante modelos de supervivencia. Tesis de maestrı́a. Facultad
de Ciencias Fı́sico Matemáticas, Benemérita Universidad Autónoma de Puebla,
2017.
[6] Navidi, W.Estadı́stica para ingenieros y cientı́ficos. Mc Graw Hill, 556-599,
2006.
107
Probabilidad, Estadı́stica y sus Aplicaciones
Capı́tulo 9
Modelación estadı́stica con imágenes satelitales en Ciencias Ambientales
1
Facultad de Ciencias Fı́sico Matemáticas,
2
Departamento de Investigación en Ciencias Agrı́colas,
3
Facultad de Ciencias de la Computación,
Benemérita Universidad Autónoma de Puebla,
Av. San Claudio y 18 Sur, Col. San Manuel,
C.P. 72570, Puebla, Puebla,
[email protected], [email protected]
[email protected], [email protected]
Resumen. Actualmente la modelación medio ambiental puede considerarse un
campo maduro con muchos artı́culos presentados en un amplio espectro de pro-
blemas ambientales y distintos estudios de caso que cubren diferentes modelos. El
desarrollo de la teledetección o percepción remota ha incrementado aún más las
posibilidades de la modelación estadı́stica en este campo. En el presente capı́tulo se
describe brevemente, a través de dos estudios de caso, la manera en que los modelos
de regresión lineales de efectos- fijos y mixtos son construidos y aplicados a los pro-
blemas del medio ambiente. Un caso se refiere a la modelación de escenarios de las
coberturas y usos de suelo a través de imágenes satelitales en el sureste de la Presa
de Valsequillo, Puebla. El otro caso enfoca la modelación del secuestro de carbono
por suelos forestales en la Región Terrestre Prioritaria 105, Puebla, para mostrar
cómo integrar las herramientas estadı́sticas con otros enfoques y estrategias, como
son las imágenes satelitales y los modelos mixtos, que combinados contribuyen a
una mejor explicación del fenómeno que se estudia, debido a que se pueden incluir
efectos fijos y efectos aleatorios. El software R es utilizado para la estimación, ajuste
y selección de los modelos elaborados.
Palabras claves: Regresión Lineal y polinomial, Modelos mixtos, ı́ndices de vegeta-
ción.
108
Probabilidad, Estadı́stica y sus Aplicaciones
9.1. Introducción
El uso de los modelos se ha incrementado en el manejo medioambiental, debido
a que ellos son la única herramienta que permite relacionar cuantitativamente el
impacto en un ecosistema con las consecuencias para el estado del ecosistema [13].
El campo de la modelación medio ambiental se ha desarrollado enormemente desde
que emergieron los primeros modelos en 1970, no sólo debido al desarrollo de la tec-
nologı́a computacional sino también al desarrollo de la teledetección o percepción
remota.
9.2. Teledetección
La teledetección es una técnica que nos permite obtener información a distancia
de objetos que se encuentran situados sobre la superficie terrestre. El fenómeno de
la Teledetección es posible gracias a la interacción de la energı́a electromagnéti-
ca con las cubiertas terrestres. Estas tienen un comportamiento reactivo variable,
condicionado tanto por los factores externos (ambientales) como por sus propias
caracterı́sticas fisicoquı́micas en el momento de la toma de la imagen.
La primera experiencia de teledetección se retoma en 1859, donde Gaspar Félix de
Tournachon obtuvo las primeras fotografı́as aéreas desde un globo, después se hizo
uso del avión hasta llegar en 1960 al uso de los satélites. Actualmente son numerosos
los centros de producción, enseñanza e investigación que trabajan activamente en
este campo con el uso de satélites (Teledetección espacial).
Para obtener información mediante teledetección espacial es importante que los
objetos y el sensor tengan algún tipo de interacción. Para que la observación sea
posible, se necesitan los siguientes elementos:
Sensor: Instrumentos de grabación, instrumentos de escaneo, aviones, satélites,
boyas o barcos.
Objeto observado: arboles, suelos, etc.
Flujo energético que permite poner a ambos en relación.
109
Probabilidad, Estadı́stica y sus Aplicaciones
(N IR − RED)
N DV I = . (9.1)
(N IR + RED)
110
Probabilidad, Estadı́stica y sus Aplicaciones
donde N DV Isd es el NDVI del suelo desnudo y N DV IV V es el NDVI del pixel con
la mayor cobertura de vegetación verde en el área.
y = Xβ + . (9.3)
donde:
y es un vector n × 1 de observaciones de la variable dependiente.
X es una matriz n × p que consiste de n observaciones de las p variables,
β es un vector p × 1 de coeficientes de la regresión (parámetros desconocidos), y
es un vector n×1 de errores independientes e idénticamente distribuidos con media
cero y varianza σ 2 .
El modelo lineal de efectos mixtos (LMM) es una poderosa herramienta de mo-
delado que permite el análisis de conjuntos de datos correlacionados (clúster) [6]. El
LMM fue presentado originalmente por Laird y Ware, donde presentaron diferentes
aplicaciones en el estudio epidemiológico con datos longitudinales [15], la denomi-
nación de “efectos mixtos” se asigna para tener efectos tanto fijos como aleatorios.
Actualmente se usan para modelar datos de muchos campos en diferentes áreas,
como biologı́a, bioestadı́stica, ciencias sociales, salud y medicina [4, 6] y, particular-
mente, en el medio ambiente.
yi = Xi β + Zi bi + εi (9.4)
bi ∼ Nq (0, ψ)
εi ∼ Nni (0, σ 2 Λi )
donde
yi es el vector de respuesta ni × 1 para observaciones en el grupo i-ésimo.
Xi es la matriz del modelo ni × p para los efectos fijos y las observaciones en el
grupo i.
β es el vector p × 1 de los coeficientes de efectos fijos.
Zi es la matriz del modelo ni × q para los efectos aleatorios para las observaciones
en el grupo i.
bi es el vector q × 1 de los coeficientes de efecto aleatorio para el grupo i.
εi es el vector de errores ni × 1 para las observaciones en el grupo i.
111
Probabilidad, Estadı́stica y sus Aplicaciones
Los errores residuales εi para el mismo grupo son independientes de los efectos
aleatorios bi .
112
Probabilidad, Estadı́stica y sus Aplicaciones
Figura 9.1: Localización de la zona de estudio. Fuente: Pacheco Rı́os, A., 2018.
y manejo sobre las tasas de erosión. Sus valores indican cuánto protege la
vegetación la erosión del suelo [19]. El factor C USLE corresponde a la pérdida
de suelo bajo condiciones especı́ficas de cultivo, en relación con la que ocurre
en un suelo desnudo. Toma valores de 0 (cubierta vegetal alto) a 1 (suelo
desnudo). Esto puede ser representado como
Acrop
C U SLE = ∗ 100. (9.6)
Af allow
Este factor refleja el efecto de las prácticas de cultivo y manejo sobre las tasas
de erosión. Los valores de C USLE indican cuánto protege de la erosión la
vegetación del suelo.
El factor C exp puede estimarse aplicando la relación utilizada por Van der
Knijff en [14]:
N DV I)
C exp = exp(−α ∗ ). (9.7)
(β − N DV I)
Se considera como un factor de gestión de cobertura de cultivo calculado. En
[14] se sugiere que al aplicar esta relación, se obtienen mejores resultados que
usando una relación lineal.
113
Probabilidad, Estadı́stica y sus Aplicaciones
Modelos de regresión
Se ajustaron tres modelos lineales, uno para cada variable FVC, C FVC y C exp,
tomadas como variables dependientes y como variable independiente el NDVI. Sus
estimaciones fueron ajustadas usando la función lm() del software R. Las estima-
ciones de intercepto y pendientes de cada modelo se muestran en la Tabla 9.2.
A pesar de que las estimaciones para cada modelo, tanto del intercepto como de
la pendiente, son significativas, una parte importante dentro de la modelación que
no debe ser olvidado, es la validez de los supuestos del modelo, para ello hicimos uso
de los gráficos de residuales que proporciona el comando plot() en el software R. Los
gráficos de valores ajustados y residuales mostraron un comportamiento particular
que sugirieron el uso de otro tipo de modelo, por ejemplo, un modelo polinomial
para ajustar los datos.
Las estimaciones de cada modelo usando modelos polinomiales se muestran en
la Tabla 9.3. Estas estimaciones son de igual forma significativas, con excepción de
la pendiente del modelo 1 no lineal, por lo cual sólo se realiza el ajuste del modelo
sin intercepto para el primer modelo polinomial. El ajuste y las predicciones dentro
114
Probabilidad, Estadı́stica y sus Aplicaciones
de cada modelo se muestran en los gráficos correspondientes en las Figuras 9.5, 9.6
y 9.7.
Las estimaciones de los parámetros de los modelos no lineales son significativas y
también poseen un buen ajuste ya que el coeficiente de determinación R2 es igual
0.98.
La Figuras de los residuos que se muestran en 9.2, 9.3 y 9.4 son usados para el
ajuste de modelos lineales, para verificar los supuestos de linealidad, normalidad y
homogeneidad de varianzas, que no todos se consideran dentro de los modelos no
lineales. Un modelo lineal adecuado muestra gráficas de residuos con valores ajusta-
dos distribuidos de manera homogénea sobre un intervalo, mientras que el supuesto
de normalidad y linealidad se verifica con el gráfico de residuales estandarizados
y cuantiles teóricos, en caso de cumplir el supuesto de normalidad los datos estos
deben estar muy cercanos a la recta de dicho gráfico. Finalmente, estas ecuaciones
que se estimaron se puede calcular la cantidad de cobertura vegetal, en función
del ı́ndice de vegetación NDVI que es obtenido por medio de la imagen de satélite
considerada.
F CV = 100 ∗ N DV I 2 + ε (9.8)
115
Probabilidad, Estadı́stica y sus Aplicaciones
116
Probabilidad, Estadı́stica y sus Aplicaciones
PASO 1 Ajustar un modelo donde la componente fija contenga todas las variables
explicativas e interacciones posibles. Dentro de las variables de la zona RTP-
105, se realizó una selección de variables que aportan más información al
modelo. Los distintos modelos de regresión se realizaron usando la función
117
Probabilidad, Estadı́stica y sus Aplicaciones
lm() del software R, llegando a que el mejor modelo de efectos fijos es el que
se muestra en la tabla 9.4.
PASO 2 Teniendo como base el mejor modelo con las componentes fijas, ahora
continuamos con el segundo paso de la metodologı́a de Zuur, sin embargo, en
este estudio sólo se requiere ver las variaciones en F V (formación vegetal),
como variable aleatoria que queremos introducir dentro del modelo, por lo
cual el modelo en este paso de la metodologı́a de de Zuur, para el caso de la
Zona RTP-105 queda como: parte fija las variables del modelo modelo2.lm y
parte aleatoria F V.
PASO 3 Se busca la estructura óptima de la componente fija del modelo. Para
ello podemos utilizar el estadı́stico F o el estadı́stico t obtenido mediante el
estimador REML con la función lme() o comparar modelos anidados. Para
comparar modelos que tienen la misma estructura en la componente aleato-
ria, pero difieren en la componente fija se debe de utilizar un estimador LM
y no un estimador de REML.
Se construyen distintos modelos, donde se varı́a la componente aleatoria, intro-
duciéndola como una intercepto, pendiente, que afecta a los distintos modelos,
para buscar la mejor estructura de modelo con componente fija y componente
aleatoria.
Para realizar los distintos modelos mixtos, en este trabajo se usan la librerı́a
library(lme4), library(Matrix), library(Rcpp)y library(nlme). Estas librerı́as,
contienen distintas funciones que nos ayudan a poder estimar los efectos de las
variables fijas y aleatorias en modelos mixtos. Los siguientes modelos mixtos
contienen la misma componente aleatoria, pero buscando la mejor componen-
te fija. Para seleccionar el mejor modelo en esta parte, usamos los criterios de
selección de modelos AIC y BIC.
118
Probabilidad, Estadı́stica y sus Aplicaciones
Fixed effects:
Estimate Std. Error df t value Pr(>|t|)
Ntot 1.9082 0.4780 21.7410 3.992 0.000627 ***
NDVI 2.2151 0.5194 21.9890 4.264 0.000317 ***
Con los siguientes comandos en R, realizamos los gráficos, para analizar las
suposiciones del modelo mixed.model1.
119
Probabilidad, Estadı́stica y sus Aplicaciones
La parte de los resultados que se refiere a los efectos aleatorios nos muestra que
la varianza residual es σ 2 = .392 y la varianza de la constante σa2 = .402 . Para la
parte de los efectos fijos del modelo, β1 ∗ N tot + β2 ∗ N DV Iij , la constante se
estima con el valor β1 = 1.90 y la segunda en β2 = 2.21. Ambos parámetros son
significativamente distintos de 0. Un observación importante es sobre la correlación
entre las constantes es de −.50.
El Ntot y NDVI tienen efecto significativo sobre el logaritmo del carbono orgáni-
co, obervando en la salida del software R que hay en promedio más cantidad de
Carbono orgánico por el ı́ndice de vegetación, mientras que el Ntot hay ligeramente
menos. El modelo es bastante adecuado y se cumplen los supuestos (Figura 9.7).
9.5. Conclusiones
En los dos casos de estudios, donde el NDVI que se obtiene por medio de imáge-
nes de satélite resultó ser significativo en ambos modelos, es decir permite predecir
120
Probabilidad, Estadı́stica y sus Aplicaciones
121
Probabilidad, Estadı́stica y sus Aplicaciones
Bibliografı́a
[2] Boettinger, J. L., Ramsey, R.D. , Bodily, J.M., Cole, N.J., Kienast-
Brown, S., Nield, S.J., Saunders, A.M., and Stum, A.K. Landsat
Spectral Data for Digital Soil Mapping. In Digital Soil Mapping with Limited
Data, A.E. 2008.
[3] A. Bannari and D. Morin F. Bonn A. R. Huete . A review of vegetation
indices, Remote Sensing Reviews. Vol.(13), p. (95-120), Taylor & Francis,
1995.
[4] Demidenko, E.. Mixed models. Theory and applications with R. 2nd edition.
Wiley, New York, USA, 2013
[5] Dı́az G. y Cervigón, J. J. Estudio de ı́ndices de vegetación a partir de
imágenes aéreas tomadas desde UASRPAS y aplicaciones de estos a la agri-
cultura de precisión , 2015.
[6] Galecki A. and Burzykowski T.Linear mixed-effects models using R. A
step by step approach. 1st edition. Springer, New York, p.(542), 2013.
[7] Ieno N. E., Saveliev A. A., Smith M. G., Walker J. N. and Zuur
F. A Mixed Effects Models and Extensions in Ecology with R. Springer, 2009.
[8] Instituto Nacional de Estadı́stica y Geografı́a (INEGI),
Marco Geoestadı́stico Nacional, México. Disponible.
http://www.beta.inegi.org.mx/app/biblioteca/ficha, 2017.
[9] Jensen, J.R. Remote Sensing of the Environment: An Earth Resource Pers-
pective. Pearson Prentice Hall, New Jersey, 2000.
[10] Jensen, J.R. Introductory Digital Image Processing: A Remote Sensing
Perspective. Pearson Prentice Hall, New Jersey, 2005.
[11] John, R., Jensen y Dr. Kalmesh Lulla, Introductory digital ima-
ge processing: A remote sensing perspective, Geocarto International. Vol.(2),
p.(65-65), 1987.
122
Probabilidad, Estadı́stica y sus Aplicaciones
123
Probabilidad, Estadı́stica y sus Aplicaciones
Capı́tulo 10
Riesgo de Crédito usando Redes Neuronales
1
Facultad de Ciencias Fı́sico Matemáticas,
2
Departamento de Investigación en Ciencias Agrı́colas
Facultad de Ciencias Fı́sico Matemáticas,
Av. San Claudio y 18 Sur, Col. San Manuel,
C.P. 72570, Puebla, Puebla,
[email protected], [email protected]
[email protected], [email protected]
Resumen. Los modelos de Credit scoring estiman las probabilidades de in-
cumplimiento y determinan criterios a los deudores y solicitantes de financiamiento
en función de su riesgo de incumplimiento. Estos procedimientos se han venido
desarrollando dentro de las últimas cuatro décadas, debido al perfeccionamiento de
mejores recursos estadı́sticos y computacionales. La modelación de la base de datos
es importante adecuarla a los tipos de clientes y la información con la que se cuenta
de los solicitantes. La información de estudio contenı́a 30,000 datos de un banco
de Taiwán, se usó una técnica de minerı́a de datos (redes neuronales), debido a
la ventaja de ser un método flexible y de fácil aplicación. Las variables de mayor
importancia que se obtienen en la modelación están relacionadas con información
financiera y no con las variables demográficas.
Abstract. Credit scoring models estimate the probabilities of default and determine
criteria for debtors and loan applicants based on their default risk. These procedures
have been developed within the last four decades, due to the improvement of better
statistical and computational resources. The modeling of the database is important
to adapt it to the types of clients and the knowledge with which the applicants
are counted. The study information contained 30,000 data from a Taiwan bank, a
data mining technique (neural networks) was used, due to the advantage of being
a flexible and easy to apply method. The most important variables obtained in the
modeling are related to financial information and not to the demographic variables.
10.1. Introducción
A lo largo de los años el aumento en el uso de créditos ha llevado a la industria
a desarrollar métodos para determinar a qué personas fı́sicas o morales se les otórga
124
Probabilidad, Estadı́stica y sus Aplicaciones
uno. Para una institución financiera es esencial poder reducir los riesgos que pue-
dan producir pérdidas debido a una mala selección de clientes, ya que si los créditos
otorgados no son pagados estos se traducen en pérdidas económicas para estas ins-
tituciones. Los modelos de Credit scoring son herramientas estadı́sticas que se han
desarrollado en el tiempo para poder realizar la clasificación de clientes buenos o
malos [4]. Antiguamente un gerente de créditos o alguna persona representante de
una institución mediante su criterio decidı́a si aceptaba o no el préstamo o crédito
a un cliente, hoy en dı́a es más frecuente usar en las instituciones los modelos de
Credit scoring, el cual es más objetivo pues cuentan con un respaldo matemático y
con mucha información relevante sobre el comportamiento de solicitantes con cuen-
tas en la institución, aunque estas no son tan precisas en general para cada cliente
que solicita un crédito. Cada institución tiene sus propias caracterı́sticas en sus so-
licitantes, clientes y sus instituciones. Es común encontrar en las bases de datos de
los Credit scoring que se incluyan datos demográficos y caracterı́sticas financieras
de los clientes, como: edad, género, historial crediticio, ingreso económico, tipo de
trabajo, morosidad en los pagos, etc. ([2], [3]). Para determinar a los clientes buenos
las instituciones financieras cuentan con una fórmula con parámetro desconocido,
que estiman usando la información de los solicitantes, la experiencia anterior con
el solicitante y si es posible la información que ha tenido con otras instituciones. A
partir de este parámetro se podrá determinar las probabilidades de incumplimiento.
Los métodos estadı́sticos más frecuentes que se utilizan son: análisis discriminan-
te, modelo de probabilidad lineal, modelo Logit, modelos de programación lineal,
redes neuronales, árboles de decisión y otras más ([1], [3], [8], [11]). La metodologı́a
usada fue con redes neuronales, una técnica de la minerı́a de datos, que tiene su
origen en las neurociencias, matemáticas, fı́sica y ciencias computacionales, entre
otras. Uno de los problemas para desarrollar estos sistemas de Credit scoring es la
escasez de información pública, disponible, actual y completa. Esto es debido a la
confidenciabilidad que las instituciones financieras que tienen con sus solicitantes y
clientes. Los datos de este trabajo se obtuvieron de un sitio de internet de la Uni-
versidad de California, que cuenta con 30,000 clientes de un banco de Taiwán en un
periodo de Abril a Septiembre del 2005 y contenı́a cerca de 23 variables explicativas
socioeconómicas.
125
Probabilidad, Estadı́stica y sus Aplicaciones
126
Probabilidad, Estadı́stica y sus Aplicaciones
10.2.2. Estimación
Sea i = 1, ..., n una muestra de n observaciones (yi , xi ) donde Y es una variable
dependiente dicotómica y las variables independientes (xi ), son las caracterı́sticas
del i-ésimo individuo en la muestra con una distribución asociada Bernoulli. Se
presenta la ecuación
H0 : βi = 0 vs H1 : βi 6= 0
β̂i
W ald = . (10.4)
σ̂(βi )
127
Probabilidad, Estadı́stica y sus Aplicaciones
VP
Sensibilidad= V P +F N , Especificidad = V NV+F
N
P y el
128
Probabilidad, Estadı́stica y sus Aplicaciones
2. Cálculo del área del ROC. El procedimiento consiste: a) Guarda los valores
estimados del modelo. b) Calcula el estadı́stico de Mann-Whitney para los
valores esperados.
3. Elección del punto de corte óptimo. a) Hay que optimizar la sensibilidad y
especificidad. b) Buscar el punto de corte para encontrar diferentes modelos
logı́sticos. c) Buscar la constante estimada para maximizar la sensibilidad y
especificidad. d) Hay reglas generales para ROC en la discriminación: total,
aceptable, excelente y extraordinaria.
129
Probabilidad, Estadı́stica y sus Aplicaciones
los valores de unidad en la capa correcta, una función común es yi = 1/[1 + exp(vi )]
donde vj es la suma ponderada de todas las entradas sinápticas más el sesgo de
la neurona de todas las entradas sinápticas más el sesgo de la neurona j con yj la
salida de la neurona. Otra es que la red puede contener una o más capas ocultas,
distintas a la capa de entrada y de salida, son las capas que ayudan a que la red
“aprender”, y finalmente la red muestra un alto grado de conectividad determinada
por la sinápsis de la red.
Hay dos formas para entrenar una red neuronal, con respecto a la presentación
de los datos a la red y los ajustes en los pesos, son: 1) Entrenamiento de patrón
por patrón, a la red se le presenta un patrón e inmediatamente después se realiza la
propagación hacia atrás ajustando los pesos y 2)Entrenamiento conjunto o Batch,
los datos se presentan en la red y el cálculo de la modificación de los pesos es
almacenado hasta que todas las muestran sean presentadas a la red y luego se
modifican los pesos con la suma de las modificaciones almacenadas.
130
Probabilidad, Estadı́stica y sus Aplicaciones
Se usa la paqueterı́a de SPSS [10] en la base de datos, para crear una red neuronal
MLP, para clasificar a los clientes. Se realizaron diversas pruebas para elegir una red
neuronal, cambiando el orden de las variables, eliminando variables y se probaron
diversas tipos de entrenamiento.
131
Probabilidad, Estadı́stica y sus Aplicaciones
10.4. Conclusiones
En los modelos de Credit scoring las bases de datos se deben de adecuar según
el tipo de cliente y la información con la que cuente el solicitante, se definen a
los clientes buenos y malos, ya sea con base a la experiencia previa o tomando
en cuenta la experiencia de las fuentes externas y ası́ limitar los parámetros para
definir a los clientes buenos. Para realizar el Credit scoring se separó la muestra
en un backtesting y se comprueba si la clasificación obtenida es adecuada, esto es
importante realizarlo en forma recurrente para actualizar correctamente los ajustes
de las variables que se utilizan.
En este trabajo se usa una base de datos de Taiwán y se aplica una técnica de
132
Probabilidad, Estadı́stica y sus Aplicaciones
133
Probabilidad, Estadı́stica y sus Aplicaciones
134
Probabilidad, Estadı́stica y sus Aplicaciones
Bibliografı́a
135
Probabilidad, Estadı́stica y sus Aplicaciones
Capı́tulo 11
Embarazo adolescente, desigualdad social y salud sexual y reproductiva según
condición de indigenismo en México
136
Probabilidad, Estadı́stica y sus Aplicaciones
which play a central role over the reproductive behavior of the adolescent popu-
lation (including indigenous population). Using data from the national survey of
the demographic dynamic (ENADID, 2014) we document the teenage pregnancy
and sexual and reproductive health among adolescents according to their indige-
nous status in Mexico. Results show the particular vulnerability and backwardness
of the sexual and reproductive health among the adolescent indigenous population.
This situation is particularly exacerbated by their status as indigenous people. The
results show the specificities of the indigenous teenage pregnancy and reproduc-
tive trends, revealing the effects that diverse structural inequalities have on the
reproductive behaviour among this population. In this way, 35.1 % of women aged
between 20 and 29 years old (sexually initiated) report having been pregnant during
their adolescence. This percentage continues to be significantly higher among the
indigenous language-speaking women (48.8 %) and among the women with ethnic
affiliation (39.9 %) than among the non-indigenous teenage women. These findings
highlight the important role played by social inequalities and social contexts over
the reproductive behaviour and over alternative life projects (other than conjugality
and early maternity) among the studied population.
11.1. Introducción
Desde la demografı́a mexicana se han aportado conocimientos importantes res-
pecto a la salud reproductiva y la dinámica de la población en general. Sin embargo,
no ha sucedido lo mismo respecto a los conocimientos referidos a la población indı́ge-
na en general y a la población indı́gena adolescente en particular [11]. En América
Latina en general y en México en particular existen colectivos de jóvenes muy hete-
rogéneos1 en términos demográficos y socio culturales que expresan la persistencia
de fuertes desigualdades (de diversa ı́ndole) en la región y que se manifiestan en
forma particular entre la población indı́gena adolescente2 [8, 12].
Según los resultados de la encuesta intercensal en México 6.1 % de la población en
México habla alguna lengua indı́gena y 21.2 % se considera indı́gena (auto adscri-
tas) [6]. Paralelamente, las estimaciones de esta misma encuesta sugieren que en
2015, 45.3 % de la población que habla lengua indı́gena tiene menos de 30 años [13]
señalándose que una significativa proporción de la población indı́gena en México la
constituyen los adolescentes [12].
homogéneo es, en parte una muestra más del racismo hacia estas poblaciones [18].
2 Es necesario precisar que reconocemos la plasticidad de los conceptos de adolescencia y juven-
137
Probabilidad, Estadı́stica y sus Aplicaciones
mayorı́a habita en municipios de alta o muy alta marginación y cuenta con los ı́ndi-
ces más bajos de desarrollo humano [18], lo que se ve reflejado de manera especı́fica
en su salud sexual y reproductiva y en su comportamiento reproductivo [8, 10]. Al
respecto, estudios recientes han sugerido que en la última década, los indicadores
de salud sexual y reproductiva en la población indı́gena en general y en la población
indı́gena adolescente en particular han experimentado cambios importantes (sobre
todo en lo que se refiere al acceso a información y uso de anticoncepción moderna)
[6, 10]. Estos cambios en el comportamiento reproductivo se ven reflejados de ma-
nera diferencial según la etapa de la vida en la que las mujeres se encuentran [22].
Por ejemplo, estudios en el tema han sugerido que esta población tiene una mayor
demanda insatisfecha de métodos anticonceptivos, un menor conocimiento y acceso
a métodos anticonceptivos, un menor uso de los mismos, tienen una menor atención
relativa a la salud materno-infantil, niveles más bajos de escolaridad y patrones de
fecundidad más temprana que las mujeres no indı́genas [2, 12, 23].
Adicionalmente, se ha señalado (sobre todo desde la última década un incremento en
la ocurrencia de embarazo adolescente en México [19, 20])). Al respecto las eviden-
cias son consistentes y sugieren que el embarazo adolescente tiene lugar mayorita-
riamente en estratos socioeconómicos bajos y en mujeres con niveles de escolaridad
bajos. Si bien en trabajos anteriores hemos analizado la fecundidad adolescente,
en este trabajo el análisis se centra en el embarazo adolescente dado que asumimos
que el análisis del comportamiento del mismo puede impactar de diferentes maneras
las trayectorias de las mujeres que lo experimentan (independientemente de que el
resultado final sea o no un nacimiento).
11.2. Objetivos
A partir de los datos de la Encuesta Nacional de la Dinámica Demográfica
(ENADID, 2014) se compara el porcentaje de mujeres de 20 a 29 años (sexualmente
iniciadas) hablantes de lengua indı́gena (HLI), auto-adscritas (pertenencia étnica)
y no indı́genas que se embarazaron durante la adolescencia según diferentes indica-
dores socio-demográficos utilizando la prueba de ji-cuadrada.
Objetivos especı́ficos
Identificar y caracterizar a las mujeres de 20 a 29 años que experimentaron un
embarazo durante la adolescencia.
138
Probabilidad, Estadı́stica y sus Aplicaciones
X ∼ χ2n
y su función de densidad es de la forma:
( −n/2
2 −x/2 n/2−1
f (x) = Γ(n/2) e x si x > 0
0 si x ≤ 0
Propiedades:
Es una función asimétrica.
La esperanza es igual a E (X) = n.
La varianza es igual a V (X) = 2n.
Y ∼ χ2n+m
139
Probabilidad, Estadı́stica y sus Aplicaciones
Donde i se refiere a una fila cualquiera; j a una columna cualquiera; ij a una casilla
cualquiera. En otras palabras, bajo la condición de independencia, la frecuencia
esperada de una casilla concreta resulta de dividir el producto de las frecuencias
marginales correspondientes a esta casilla (su total de fila y su total de columna)
140
Probabilidad, Estadı́stica y sus Aplicaciones
por el número total de casos. Una vez obtenidas las frecuencias esperadas para cada
casilla, el estadı́stico X 2 o ji-cuadrado es obtenido de la siguiente manera:
X X (nij − mij )2
X2 =
i j
mij
Donde nij se refiere a las frecuencias observadas y mij a las esperadas y donde de
la ecuación se desprende que la X 2 valdrá cero cuando las variables sean totalmente
independientes (dado que las frecuencias observadas y las esperadas serán iguales),
y que el valor del estadı́stico X 2 será tanto mayor cuanto mayor sea la diferencia
entre las frecuencias observadas y las esperadas (diferencia que será tanto mayor
cuanto mayor sea la relación entre las variables) [3, 9].
Es preciso
señalar que para que las probabilidades de la distribución ji-cuadrada
χ2 constituyan una buena aproximación a la distribución de este estadı́stico es
conviene que se cumplan algunas condiciones. Por ejemplo, que las frecuencias espe-
radas no sean demasiado pequeñas, es decir que todas las frecuencias esperadas sean
iguales o mayores a 5, asumiéndose que, si existen frecuencias esperadas menores
que 5, éstas no deben superar el 20 por ciento del total de frecuencias esperadas.
Se supone que el valor del estadı́stico X 2 se podrá aproximar por una distribución
ji-cuadrado cuando el tamaño muestral n sea grande (n > 30).
La distribución χ2 tiene muchas aplicaciones en inferencia estadı́stica. La más co-
nocida es la de la denominada prueba χ2 utilizada:
1. Como prueba de independencia entre dos variables categóricas,
2. Como prueba de bondad de ajuste para evaluar la credibilidad de que los
datos muestrales, que vienen de una población cuyos elementos se ajustan a
un tipo especı́fico de distribución de probabilidad,
3. En la estimación de varianzas.
En resumen, esta prueba contrasta frecuencias observadas con frecuencias esperadas
de acuerdo a la hipótesis nula. En el análisis llevado a cabo, se contrasta la hipótesis
de que hay asociación entre variables frente a la hipótesis alternativa de que no
existe asociación. Si existe concordancia perfecta entre las frecuencias observadas y
las esperadas el estadı́stico toma un valor igual a 0; por el contrario, si existe una
gran discrepancia entre estas frecuencias el estadı́stico tomará un valor grande y, en
consecuencia, se rechazará la hipótesis nula [3, 9].
Es preciso señalar que en ciencias sociales, el nivel de significación (riesgo de error
que se está dispuesto a asumir en caso de rechazar la hipótesis nula), suele ser del
0.05; es decir, con un 5 % de errores posibles (como máximo) en el momento de
rechazar la hipótesis nula (intervalo o margen de confianza del 95 %, e intervalo o
margen de error del 5 %). A menor sea el nivel de significación, mayor es el nivel de
confianza y por tanto menor será la probabilidad de cometer un error en la prueba
de hipótesis [9, 3]. En otras palabras, esto representa una seguridad del 95 % que la
asociación que estamos estudiando no se deba al azar. Este es el criterio que se asume
en este documento cuando se afirma que las diferencias encontradas en las tablas
de contingencia presentadas en este análisis son estadı́sticamente significativas.
141
Probabilidad, Estadı́stica y sus Aplicaciones
11.4. Resultados
Con la finalidad de caracterizar a la población de estudio en el cuadro 1 se pre-
sentan las caracterı́sticas socio demográficas de todas las mujeres de 20 a 29 años de
edad (sexualmente iniciadas y no sexualmente iniciadas), resultante del análisis de
la ENADID 2014. De estas el 37.1 % de las mujeres de 20 a 29 años se unieron en la
adolescencia. También sobresale que la mayorı́a de estas mujeres se concentran en
el estrato bajo (39.4 %) y muy bajo (21.9 %) lo que evidencia condiciones objetivas
de vida poco favorables al desarrollo de proyectos de vida alternativos a la mater-
nidad y a la conyugalidad tempranos. A su vez, 5.2 % (n = 1521) son Hablantes de
Lengua Indı́gena, y 29.6 % se auto-perciben como indı́genas (n = 8120). Sobresale
que poco más de la mitad de las mujeres encuestadas de 20 a 29 años contaban con
preparatoria o más. De las mujeres de 20 a 29 años que participaron en la encuesta
el 79.9 % son sexualmente iniciadas (han tenido relaciones sexuales alguna vez en
su vida (cuadro 11.1).
142
Probabilidad, Estadı́stica y sus Aplicaciones
143
Probabilidad, Estadı́stica y sus Aplicaciones
% de mujeres 20-29 años sexualmente iniciadas que tuvieron su primera relación sexual
o se unieron conyugalmente en la adolescencia según condición de indigenismo.
Habla una lengua Pertenece a una No habla lengua Significancia
Porcentajes indı́gena(n=1202) etnia(n=6749) indı́gena (n=20295) estadı́stica
Situación conyugal en la adolescencia ∗∗∗
Se unió en la adol. 64.9 % 53.1 % 45.0 %
No se unió en la adol. 35.1 % 46.9 % 55.0 %
Tuvo primera rel. sexual en la adol. NS
Sı́ 76.3 % 76.6 % 76.7 %
No 23.7 % 23.4 % 23.3 %
p = 0,0000 N S = sin significancia estadı́stica
Edad media en distintos eventos demográficos según condición de indigenismo de las mujeres
de 20-29 años
Habla lengua indı́gena Pertenece a una etnia No habla lengua indı́gena
Edad a la primera rel. sexual 17.7 % 17.8 % 17.94 %
Edad a la primera unión 17.8 % 17.9 % 18.7 %
Edad al primer matrimonio 19.1 % 19.2 % 19.6 %
Ası́, a partir de lo que se observa en el cuadro 11.3 los resultados sugieren que
hay un mayor número de mujeres hablantes no indı́genas que se inician sexualmente
estando solteras, mientras que en el caso de las hablantes indı́genas, en gran parte,
la primera relación sexual ocurrió en el caso de las mujeres de 20 a 29 años muy
poco tiempo antes de establecerse la primera unión (patrón al que se asemeja lo que
ocurre con las mujeres con pertenencia étnica).
De hecho, en las no indı́genas la edad media en la primera relación sexual es sig-
nificativamente menor que la edad media en la primera unión, y entre las jóvenes
hablantes de lengua indı́gena la edad media de ambos eventos es casi la misma.
Cabe señalar, que el inicio sexual y la unión temprana no se ven acompañadas con
una mayor protección en la primera relación sexual, lo que es particularmente cierto
en el caso de las mujeres hablantes de lengua indı́gena. Por ejemplo, como se obser-
va en el cuadro 11.4 sólo dos de cada diez mujeres hablantes de lengua indı́gena se
protegieron en su primera relación sexual. Este porcentaje asciende a 42 % en las
mujeres con pertenencia étnica y a 51 % en las mujeres no indı́genas.
144
Probabilidad, Estadı́stica y sus Aplicaciones
Paralelamente, conocer las razones por las cuales las mujeres no se protegie-
ron en la primera relación sexual posibilita tener un panorama más amplio de las
condiciones y obstáculos que tienen las mujeres para protegerse durante la primera
relación sexual.
Ası́, sobresale que sin importar la condición de indigenismo, poco más de dos de ca-
da diez mujeres de 20 a 29 años sexualmente iniciadas no usó ninguna protección en
su primera relación sexual porque querı́a embarazarse, lo que puede estar sugiriendo
en estas mujeres la existencia de un proyecto de vida vinculado a la maternidad y a
la unión conyugal tempranas. Pese a esto, es preciso subrayar que entre las mujeres
hablantes de lengua indı́gena (HLI) el 45.7 % no se protegió en las primera relación
sexual porque no conocı́a los métodos anticonceptivos, porcentaje que desciende a
26.5 % entre las mujeres con pertenencia y a 19.0 % entre las no hablantes de lengua
indı́gena.
Esto, como otros estudios sugieren [11, 12] evidencia la particular falta de acceso
de las mujeres indı́genas a información relativa a la salud reproductiva y a servicios
de salud de calidad elementos centrales que condicionan el acceso de las mujeres a
información y al uso de métodos anticonceptivos.
145
Probabilidad, Estadı́stica y sus Aplicaciones
lengua indı́gena donde alcanza el 48.8 % y en las mujeres con pertenencia étnica
(auto-adscritas) donde asciende a 39.9 % mientras que este porcentaje es de 35.1 %
entre las mujeres adolescentes no indı́genas.
Relación entre el embarazo y la deserción escolar de las mujeres de 20-29 años sexualmente
iniciadas (con experiencias de embarazo en la adolescencia) según condicón de indigenismo
CUANDO SE EMBARAZÓ: Habla lengua Pertenece a una No habla lengua Significancia
indı́gena etnia indigéna estadı́stica
ANTES de la deserción escolar 2.6 % 6.8 % 11 % ∗∗∗
MISMO año que desertó 1.3 % 0.8 % 1.1 % ∗∗∗
DESPUÉS de la deserción 96.1 % 92.3 % 87.9 % ∗∗∗
p = 0,0000 N S = sin significancia estadı́stica
11.5. Conclusiones
Los resultados son consistentes con lo que ya han sugerido algunos estudios
realizados con la población indı́gena [11, 12] y con población adolescente. Ası́ los
resultados ponen de manifiesto, la particular vulnerabilidad y rezago de la salud
sexual y reproductiva en la población adolescente, lo que es particularmente acre-
centado por la condición de indigenismo.
146
Probabilidad, Estadı́stica y sus Aplicaciones
Ası́, sin dejar de lado el componente cultural asociado a los patrones de fecun-
didad temprana entre la población indı́gena en general [4, 5] los resultados de este
análisis son consistentes con otros estudios [19, 20]) ya que permiten subrayar el
peso de las desigualdades sociales y de los contextos sociales sobre la ocurrencia
del embarazo adolescente y sobre la deserción escolar temprana, lo que sin lugar
a dudas restringe las oportunidades de las mujeres adolescentes en general, y de
las adolescentes indı́genas en particular y que dificultan proyectos alternativos a la
conyugalidad y a la maternidad. Estas desigualdades se reflejan por ejemplo, como
vimos precedentemente en el alto reporte de desconocimiento de métodos anticon-
ceptivos particularmente entre la población hablante de lengua indı́gena cuando
inician su vida sexual y que condiciona el bajo uso de protección sexual durante la
primera relación sexual.
147
Probabilidad, Estadı́stica y sus Aplicaciones
Bibliografı́a
[1] Bourdieu P. La “Jeunesse”N 'est Qu'un Mot. Questions de sociologie, les pages
Bourdieu. Minuit, Paris, 1992.
[2] Bonfil, Paloma “Introducción”, en Bonfil, P: Derechos y salud sexual y repro-
ductiva entre jóvenes indı́genas: hacia la construcción de una agenda necesaria.
GIMTRAP, México; 2014.
[3] Castañeda, B., Cabrera, A., Navarro, Y., y de Vries, W. Procesa-
miento de datos y análisis estadı́sticos utilizando SPSS. Un libro práctico para
investigadores y administradores educativos. EDIPUCRs: Porto Alegre, 2010.
[4] Chávez, A.; Hernández, H.; Menkes, C.; Ruiz, A. y Flores, R. “La
salud reproductiva de la población indı́gena”, en Los indios de México en el
siglo XXI. CRIM-UNAM, México, 2007.
[5] Chávez, A.; Hernández, H.; Menkes, C. y González, E. “Tendencias de
la fecundidad indı́gena en México, 1997, 2003”, en Los indios de México en el
siglo XXI. Cuernavaca: CRIM-UNAM, 2007a.
[6] CONAPO. Infografı́a población indı́gena. CONAPO, México, 2015.
[7] CONEVAL La pobreza en la población indı́gena de México 2012. CONEVAL,
México, 2014.
[8] Del Popolo, F.; López, M y Acuna, M. Juventud indı́gena y afrodescen-
diente en América Latina: inequidades sociodemográficas y desafı́os de polı́ticas.
CELADE, UNFPA, Chile, 2009.
[9] Fierro, J. Métodos Cuantitativos en Ciencias Sociales: Apuntes de Apoyo a la
Docencia. Santiago de Chile. Departamento de Sociologı́a, Universidad de Chile.
Formato digital. 115 págs, Chile: 2013.
[10] Hernández, M.; Muradás, M. y Sánchez, M. “Panorama de la salud se-
xual y reproductiva, 2014”, en La situación demográfica de México 2015. CO-
NAPO, México, 2015.
[11] Hernández, Héctor. “Introducción”, en Los indios de México en el S. XXI.
UNAM-CRIM-México.
[12] Hernández, Marı́a, Hernández, Mario y Sánchez, M. “La salud sexual
y reproductiva de las mujeres hablantes de lengua indı́gena, 1997-2009”, en La
situación demográfica de México 2013, pp. 21-41, México, 2013.
148
Probabilidad, Estadı́stica y sus Aplicaciones
149
Probabilidad, Estadı́stica y sus Aplicaciones
Capı́tulo 12
Uso de la Distribución Bernoulli Multivariada en salud bucal
Universidad de la República,
Facultad de Ciencias Económicas y de Administración,
Departamento de Métodos Cuantitativos,
Instituto de Estadı́stica,
Eduardo Acevedo 1139,
C.P. 11200, Montevideo, Uruguay,
[email protected],[email protected],
[email protected]
Resumen. En general, en muy variadas disciplinas como la Economı́a, el Mar-
keting, la Epidemiologı́a, se dan situaciones donde la matriz de datos de la que se
dispone está formada por datos binarios (unos y ceros) que surgen de trabajar con
varias variables aleatorias resultantes de un experimento con 2 resultados posibles
en cada caso. El interés se centra entonces, generalmente, en analizar y dar cuenta
de las relaciones que se dan entre variables a través de la distribución Bernoulli
Multivariada (BM). Esta distribución puede ser caracterizada por un vector de in-
tensidades y una matriz de asociaciones entre las variables binarias, que se pueden
interpretar y asimilar como los parámetros de un modelo de regresión, por lo cual
es importante entonces ver como queda parametrizado este modelo probabilı́stico y
como puede ser estimado.
Se presenta luego a modo de ejemplo una aplicación en salud bucal para evaluar
la enfermedad periodontal en la población adulta uruguaya. Los datos surgen del
primer relevamiento nacional de salud bucal, llevado a cabo durante los años 2011
y 2012 en diversos departamentos de Uruguay, donde fueron encuestadas personas
de 3 grupos etarios (jóvenes, adultos y adultos mayores), a los que se les evalúa pre-
sencia de enfermedad periodontal, evaluada como atributos binarios en 6 sextantes
de la boca, por lo cual se tienen 6 variables binarias.
150
Probabilidad, Estadı́stica y sus Aplicaciones
12.1. Introducción
En este documento se presenta y caracteriza una distribución de probabilidad
multivariada que solo puede adoptar los valores cero o uno y que se denomina Ber-
noulli Multivariada (BM). Esta distribución equivale a considerar los vértices de
un hipercubo en Rk , cuyas coordenadas son los valores 0 y 1. Una de las primeras
aproximaciones a la temática se puede encontrar en [9] donde se plantea la distri-
bución de Bernoulli bivariada.
151
Probabilidad, Estadı́stica y sus Aplicaciones
p
P (X = x) = exlog( (1−p) )+log(1−p)) , x ∈ {0, 1}. (12.2)
2
P (X1 = x1 , X2 = x2 ) = p1x1 (1 − p1 )1−x1 px2 2 (1 − p2 )1−x2 , X1 , X2 ∈ {0, 1} (12.4)
152
Probabilidad, Estadı́stica y sus Aplicaciones
2
P (X1 = x1 , X2 = x2 ) = φ0 φx1 1 φx2 2 , X1 , X2 ∈ {0, 1} (12.5)
2
P (X1 = x1 , X2 = x2 ) = φ0 φx1 1 φx2 2 α12
x1 x2
, X1 , X2 ∈ {0, 1}
1 (12.6)
φ0 = 1+φ1 +φ2 +φ1 φ2 α12
En cuanto al parámetro α12 , es sencillo demostrar que equivale al odds ratio en-
tre X1 y X2 . Sin embargo, la interpretación de φ1 y φ2 cambia ligeramente, ya que
en este caso pasan a ser los odds de éxito de cada variable condicional a que la otra
variable valga cero. Ya en presencia de ambos tipos de parámetros, nos referiremos
al conjunto de valores φi como intensidades o fuerzas y al conjunto de valores αij
como asociaciones.
153
Probabilidad, Estadı́stica y sus Aplicaciones
k k
x x
Y Y k
P (X1 = x1 , X2 = x2 , . . . , Xk = xk ) = φ0 φxi i αiji j , x1 , x2 , ..., xk ∈ {0, 1}
i=1 j=i+1
(12.9)
k k
x x
Y Y k
P (X = x) = φ0 φxi i αiji j , X ∈ {0, 1}
i=1 j=i+1
k k (12.10)
x x
Y Y
= exp(log(φ0 φxi i αiji j ))
P i=1 j=i+1
P
= φ0 exp( xi logφi + xi xj logαij ).
X X X X
1= P (X = x) = φ0 exp( xi logφi + xi xj logαij )
x∈H x∈H
1
⇒ φ0 = X X X (12.11)
exp( xi logφi + xi xj logαij )
x∈H
1
⇒ φ0 = 1eHφ
0 0 0
logφ1
1 0 0
Γ = logφ2
H= 0 1 0
logα12
1 1 1
De esta manera:
154
Probabilidad, Estadı́stica y sus Aplicaciones
1
φ0 = 1eHΓ
1
= e<(0,0,0)Γ> +e<(1,0,0)Γ> +e<(0,1,0)Γ> +e<(1,1,1)Γ>
1
= e0 +elogφ1 +elogφ2 +elogφ1 +logφ2 +logα12
1
= 1+φ1 +φ2 +φ1 φ2 α12 ,
De aquı́ se puede concluir que todas las distribuciones marginales también per-
tenecen a la familia de distribuciones BM. En cuanto a F (x, φm ), es una función
que involucra a los elementos de x, a las intensidades (γ (m) ) correspondientes a las
variables sobre las cuales se suma y a las intensidades (φM ) que “vinculan” los ele-
mentos de X M y X m . Para la construcción de los parámetros marginales se utiliza el
resultado anterior conjuntamente con la definiciones de odd y odds ratio marginales.
La definición de las intensidades marginales φ∗i en (12.13) es la siguiente:
(k−M )
φ∗i = φi γ
ei , (12.14)
(m) Hφ(m)
donde φei = e1eHφm φM (m) . La interpretación de estas intensidades marginales co-
rresponde a una corrección de las intensidades originales, donde dicha corrección
se construye como un promedio ponderado de las asociaciones (αM (m) ) entre Xi
y las variables contenidas en X k , con ponderadores dados por las intensidades y
asociaciones (αm ) de las variables sobre las cuales se sumó.
155
Probabilidad, Estadı́stica y sus Aplicaciones
(m)
∗
γ
eij
αij = αij φi φj (m) (m)
. (12.15)
γ
ei γ
ej
Las distribuciones condicionales son mas sencillas y se construyen a partir de la
siguiente relación:
P (X M = xM , X m = xm ) M M
P (X M = xM |X (m) = xm ) = , X ∈ {0, 1} (12.16)
P (X m = xm )
donde el numerador no es otra cosa que la cuantı́a que ya se definió en (12.9) y el
denominador corresponde a la marginal del vector Xk que se acaba de presentar.
Finalmente la cuantı́a condicional es la siguiente:
M M
x x
Y Y M k−M
P (X M = xM |X m = xm ) = φ0|j φxi|m
i
αiji j , X M ∈ {0, 1} , X m ∈ {0, 1}
i=1 j=i+1
1
φ0|j = HφM |m ,
1e
x
Y
φi|m = φi αijj .
xj ∈m
(12.17)
Hay que tener en cuenta cómo el proceso de condicionar en los valores de las
variables contenidas en X m solo afecta las intensidades y no las asociaciones.
12.2.4. Estimación
Dado que la función de verosimilitud es no lineal en los parámetros, se opta
por realizar la estimación de los parámetros del modelo BM mediante técnicas de
optimización numérica. Para ello, se define la función de log-verosimilitud de una
muestra de n observaciones como:
k
X k
X k
`(x|φ) = n log(φ0 ) + Sj log φi + Sjk log αik , x ∈ {0, 1} , (12.18)
j=1 j=1
n
X n
X
donde Sj = xij y Sjk = xij xik .
i=1 i=1
156
Probabilidad, Estadı́stica y sus Aplicaciones
∂`(x|φ) H Γ
Sj 1e (j)
Uj (γ) = ∂φj = φj − n 1eHΓ ,
∂`(x|φ) Sjk H
1e (jk)
Γ (12.19)
Ujk (γ) = ∂αjk = αjk − n 1eHΓ ,
donde H(j) es la matriz compuesta por las filas de H que contienen unos en la
j-ésima columna (correspondiente a φj ), luego esta columna es reemplazada por un
vector de ceros. El caso de H(jk) es análogo al anterior pero con la columna corres-
pondiente a αjk reemplazada por un vector de ceros.
157
Probabilidad, Estadı́stica y sus Aplicaciones
158
Probabilidad, Estadı́stica y sus Aplicaciones
A partir de estos datos se van a ajustar modelos donde se supone que no hay
restricciones entre las relaciones de las 6 variables y luego modelos donde hay inde-
pendencia local y homogeneidad local de las asociaciones.
y<-datos[,c(15:20)]
modelo1<-estim(y)
L0<-c(modelo1$intensidades,modelo1$asociaciones)
int.conf(modelo1,0.05)
repar(modelo1$intensidades,modelo1$asociaciones)
Vemos entonces los valores estimados φ̂i y α̂ij que devuelve la función estim.
Por otra parte, para una mejor interpretación de lo resultados, se reparametrizan
los φ̂i y los α̂ij para ser presentados como proporciones,odds y OR
> modelo1[1:2]
$intensidades
[1] 0.097 0.066 0.124 0.076 0.130 0.045
$asociaciones
159
Probabilidad, Estadı́stica y sus Aplicaciones
repar(modelo1$intensidades,modelo1$asociaciones)
$proporciones
[1] 0.214 0.268 0.277 0.289 0.198 0.223
$odds
[1] 0.273 0.365 0.384 0.407 0.2464 0.286
$OR
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] Inf 6.535 7.237 5.7414 7.875 5.949
[2,] 6.535 Inf 5.532 3.9374 5.864 5.396
[3,] 7.237 5.532 Inf 9.0184 6.901 5.426
[4,] 5.741 3.937 9.018 Inf 7.662 5.906
[5,] 7.875 5.864 6.901 7.6617 Inf 11.56
[6,] 5.949 5.396 5.426 5.9057 11.56 Inf
intensidades
S1 S2 S3 S4 S5 S6
0.097 0.066 0.124 0.076 0.130 0.045
asociaciones
- 2.67 4.67 1.58 2.42 1.87
- 1.88 1.77 2.85 2.51
- 2.14 1.27 2.66
- 2.18 4.97
- 1.91
-
proporciones
S1 S2 S3 S4 S5 S6
0.277 0.214 0.289 0.223 0..268 0.198
OR
- 7.23 9.1 5.42 5.53 6.90
- 5.74 5.95 6.53 7.87
- 5.90 3.93 7.66
- 5.40 11.56
- 5.86
-
160
Probabilidad, Estadı́stica y sus Aplicaciones
Los intervalos de confianza para los parámetros que surgen del modelo (intensi-
dades y asociaciones) se calculan utilizando la normalidad asintótica de los estima-
dores máximo verosı́miles con la siguiente formulación:
12.3.3. Discusión
Puede verse en este caso que según el modelo ajustado, el sextante con mayor
intensidad (parcial) es el S5 con un valor de φ̂5 = 0.13 mientras que los sextantes
que presentan mayor asociación (parcial) son el S4, S6 y el S1, S3 que son los sex-
tantes posteriores inferiores y superiores respectivamente, con valores de α̂4,6 =4.97
161
Probabilidad, Estadı́stica y sus Aplicaciones
y α̂1,3 =4.67.
α13 = α46
Para esto, se ajustó un nuevo modelo bajo esta restricción. Al comparar las
verosimilitudes, el p-valor encontrado fue de 0.942, lo que sugirió que las asociaciones
posteriores eran efectivamente, de la misma magnitud.
\# para testear la hipotesis alfa13 = alfa46
restriccion<-rep(NA,15)
restriccion[c(2,14)]<- -1
restriccion<-c(rep(NA,6),restriccion)
modelo1.restr<-estim(x,restr=restriccion)
modelo1.indep<-estim(x,restr=c(rep(NA,6),rep(1,15)))
1-pchisq(-2*(modelo1.indep\$Logv-modelo1\$Logv),df=p*(p-1)/2)
162
Probabilidad, Estadı́stica y sus Aplicaciones
Para el caso de una aplicación en salud oral se analizan las asociaciones entre
sextantes en el sangrado.
A futuro se intentará establecer diferentes tipologı́as que den cuenta del gra-
diente de infección usando diferentes técnicas a ser combinadas con la distribución
Bernoulli Multivariada .
Por otra parte, resta estudiar cómo hacer el proceso de ajuste de los modelos
al trabajar con valores faltantes. Esto problema de datos faltates es frecuente en la
evaluación de la enfermedad periodontal, cuando existen sextantes que no pueden
ser evaluados por no tener las personas las piezas que componen cada sextante.
Resta a su vez poder implementar el cálculo de los intervalos de confianza para
las reparametrizaciones de los componentes del modelo (odds, y OR), en donde la
varianza debe ser estimada mediante simulación Monte Carlo.
163
Probabilidad, Estadı́stica y sus Aplicaciones
Bibliografı́a
[10] Moustaki, I. y Papageorgiou, I., 2004. Latent class models for mixed
variables with applications in archaeometry. Elsevier Computational Statistics
& Data Analysis, p. 17, 2004.
164
Probabilidad, Estadı́stica y sus Aplicaciones
165
Probabilidad, Estadı́stica y sus Aplicaciones
Capı́tulo 13
Determinación de la distribución de probabilidad de la demanda en un modelo
de control de inventarios
166
Probabilidad, Estadı́stica y sus Aplicaciones
13.1. Introducción
El presente trabajo está relacionado con un modelo de control de inventarios.
En todo sistema de inventarios, se pueden identificar las siguientes componentes:
demandas, costos y reabastecimientos. Por lo general, las demandas son estocásticas
y de ahı́ surge el problema de control de inventarios. Al considerar un inventario
de mercancı́a se incurre en diferentes costos, los tres más significativos son: cos-
to por mantener un inventario, costo por reabastecimiento y costo por escasez de
mercancia. Dos decisiones que se pueden tomar en cuenta al tratar de controlar
un inventario son: cuándo reabastecer el inventario y qué cantidad de mercancia
ordenar para el reabastecimiento. El problema de control de un inventario consiste
en establecer una polı́tica de reabastecimiento que minimize el costo total asociado
a su manejo.
El principal objetivo de este trabajo es proponer, con bases teóricas, una me-
todologı́a que permita estimar la distribución de probabilidad de la demanda. Se
propone estimar dicha distribución a partir de observaciones de la demanda, me-
diante la función de distribución empı́rica. Ası́ mismo, se considera el caso en donde
incluso se desconoce el horizonte de planeación. Para tal caso, se sugiere implemen-
167
Probabilidad, Estadı́stica y sus Aplicaciones
13.2. Preliminares
En esta sección, se introducen los conceptos básicos de la teorı́a de procesos de
decisión de Markov, los cuales han sido retomados de [5].
168
Probabilidad, Estadı́stica y sus Aplicaciones
st+1 = ft (st , at , ωt ),
Las reglas de decisión necesarias para el desarrollo de este trabajo son determi-
nistas markovianas, las cuales se definen como funciones dt : S → As que especifican
la elección de la acción con certeza cuando el sistema se encuentra en el estado s
en la época de decisión t. Para cada s ∈ S, dt (s) ∈ As . Se dicen ser markovianas
porque dependen únicamente del estado actual del sistema y no de previos estados
y acciones. El conjunto de dichas reglas de decisión será denotado por DM D
Una polı́tica de decisión o control π especifica en cada una de las épocas de deci-
sión la regla de decisión que debe ser usada, esto es, π = (d0 , d1 , . . . , dN −1 ) (cuando
el horizonte de planeación es finito, se adopta la convención de que ninguna acción
será tomada en la época de decisión N ).
st+1 = ft (st , at , ωt ), t = 0, 1, . . . , N − 1.
169
Probabilidad, Estadı́stica y sus Aplicaciones
Observación 13.2.3 La función objetivo (13.1) es referida como costo total espe-
rado con horizonte finito N . Dentro de la teorı́a de procesos de decisión de Markov,
existen otras funciones objetivo o de rendimiento, tales como son el costo total es-
perado descontado y el costo esperado promedio.
J ∗ es una función que asigna a cada estado inicial s0 el costo óptimo J ∗ (s0 ), es
llamada función de valor óptimo.
J ∗ (s0 ) = J0 (s0 ),
donde la función J0 esta dada por la última iteración del siguiente algoritmo, el
cual procede hacia atrás desde la época de decisión N − 1 a la época de decisión 0:
JN (sN ) = cN (sN )
Jt (st ) = min Eωt [ct (st , at , ωt ) + Jt+1 (ft (st , at , ωt ))], (13.2)
at ∈Ast
t = 0, 1, . . . , N − 1.
Además, si a∗t = d∗t (st ) minimiza el lado derecho de (13.2) para cada st y t, la ley
de control π ∗ = {d∗0 , d∗1 , . . . , d∗N −1 } es óptima.
170
Probabilidad, Estadı́stica y sus Aplicaciones
2. Hallar la polı́tica π ∗ = (d∗m , d∗m+1 , ..., d∗n−1 ), la cual es óptima para los periodos
de m a n, y sea dˆm = d∗m .
3. Hacer m = m + 1 y n = n + 1.
4. Regresar al Paso 2.
La polı́tica π̂ = (dˆ0 , dˆ1 , dˆ2 , ...) es llamada una polı́tica de horizonte rodante.
2. Las demandas del producto llegan a través del periodo pero todas son satis-
fechas al finalizar el periodo.
3. Si la demanda excede el inventario, el exceso de la demanda se pierde.
4. Los costos y la distribución de probabilidad de la demanda no varı́an de un
periodo a otro.
5. El producto es vendido sólo en unidades enteras
6. El almacen tiene una capacidad máxima de M unidades.
171
Probabilidad, Estadı́stica y sus Aplicaciones
172
Probabilidad, Estadı́stica y sus Aplicaciones
En el caso particular más simple donde la variable aleatoria ω puede tomar solo
un número finito de valores a0 , a1 , ..., aD , los términos de la sucesión de variación
podrı́an ser solo estos valores. Si k0 , k1 , ..., kD (k0 + k1 + .. + kD = n) denotan el
número de ensayos donde ω = a0 , ω = a1 , ...ω = aD , entonces, por la Ley de los
Grandes Números, estas frecuencias (para un n suficientemente grande) representa-
ron valores aproximados de las probabilidades desconocidas p0 = P {ω = a0 } , p1 =
P {ω = a1 } , ..., pD = P {ω = aD }, esto es p0 ≈ k0 /n, p1 ≈ k1 /n, ..., pD ≈ kD /n. Lo
descrito en este párrafo queda formalmente establecido en el siguiente teorema.
Teorema 13.4.1 (El Teorema de Borel). Sea µ el número de ocurrencias de un
evento A en n independientes ensayos en cada uno de los cuales el evento A podrı́a
ocurrir con probabilidad p. Entonces, cuando n → ∞
µ
P { → p} = 1
n
La demostración del Teorema de Borel puede consultarse en [3], pag. 212.
173
Probabilidad, Estadı́stica y sus Aplicaciones
174
Probabilidad, Estadı́stica y sus Aplicaciones
175
Probabilidad, Estadı́stica y sus Aplicaciones
t 0 1 2 3 4 5 6 7 8 9
s
0 3 2 1 0 0 0 0 0 0 0
1 5 4 3 2 1 0 0 0 0 0
2 6 5 4 3 2 1 0 0 0 0
3 6 5 4 3 2 1 0 0 0 0
4 6 5 4 3 2 1 0 0 0 0
5 6 5 4 3 2 1 0 0 0 0
6 6 5 4 3 2 1 0 0 0 0
7 6 5 4 3 2 1 0 0 0 0
176
Probabilidad, Estadı́stica y sus Aplicaciones
s 0 1 2 3 4 5 6 7
J0 (s)
102.67 101.67 100.67 99.67 98.67 97.67 96.67 96.29
13.6. Conclusiones
En este trabajo se ha estudiado mediante la teorı́a de procesos de decisión de
Markov un modelo de control de inventarios, en donde, se destaca la problemática
de no contar con la distribución de probabilidad de la demanda estocástica en
una aplicación real. Entonces, se propone estimar dicha distribución mediante la
distribución empı́rica a partir de observaciones previas de la demanda. Además, se
sugiere utilizar un procedimiento de horizonte rodante, que permite el control de
un inventario, aún cuando se desconozca el horizonte planeación.
177
Probabilidad, Estadı́stica y sus Aplicaciones
Bibliografı́a
178
Probabilidad, Estadı́stica y sus Aplicaciones
Capı́tulo 14
El Conteo en la Probabilidad
14.1. Introducción
En el siglo XX la Teorı́a de la Probabilidad tuvo un desarrollo importante tanto
en la parte teórica como en sus aplicaciones. En los años treinta se transformá del
cálculo de probabilidades en teorı́a de la probabilidad. El cálculo de probabilidades
ya tenı́a algunos de los ingredientes básicos de la teorı́a, pero consistı́a principalmen-
te en una colección de problemas computacionales con ideas intuitivas y resultados
poco precisos. La noción misma de probabilidad era confusa. Henri Poincaré afirmá
en su libro Calcul des probabilitı́es (1900) que no se podı́a dar una definición sa-
tisfactoria de probabilidad. En la actualidad la teorı́a de la probabilidad es una
179
Probabilidad, Estadı́stica y sus Aplicaciones
rama importante de las matemáticas y las matemáticas aplicadas, con sus propios
conceptos, métodos y resultados. Tiene relaciones profundas con otros campos de
las matemáticas e innumerables usos teóricos y aplicaciones prácticas en otras cien-
cias y en la tecnologı́a, ası́ como implicaciones que nos afectan más de lo que nos
imaginamos.
Uno puede observar que muchos de los eventos que ocurren en la vida diaria
no se pueden predecir con exactitud, ni con anticipación por diversas razones, pues
la mayorı́a de los hechos están influenciados por factores externos. Además, exis-
ten aquellos sucesos que están directamente influenciados por el azar, es decir, por
procesos en los cuales no se esta completamente seguro de lo que va ocurrir. Sin
embargo, la probabilidad nos permite tratar a este tipo de sucesos y estudiarlos,
ponderando las posibilidades de su ocurrencia y proporcionando métodos para tales
ponderaciones.
La probabilidad nos permite descubrir que algunos sucesos tienen una mayor
o menor probabilidad de ocurrir que la ponderación asignada a través del sentido
común. Esto nos permite señalar que la información previa que podamos tener,
conocimiento o postura, son algunos de los factores que intervienen para no per-
mitirnos hacer ponderaciones reales y sistemáticas. La probabilidad de estudiar los
eventos de manera sistemática y más cercana a la realidad, retribuirnos con infor-
maciaón más precisa y confiable y, por tanto, de utilidad para algunas disciplinas
de investigación.
14.2. Preguntas
La probabilidad y la estadı́stica son áreas de la matemática aplicada que han
tenido un gran crecimiento, tanto en su teorı́a como en sus aplicaciones. Sin embar-
go, son áreas diferentes; el primer reto del estudiante es diferenciar los conceptos y
herramientas que usa cada una de ellas. Para ello es necesario responder dos pre-
guntas: ¿Qué es la probabilidad?, ¿dónde se utiliza?
180
Probabilidad, Estadı́stica y sus Aplicaciones
1 + 1000 = 1001
2 + 999 = 1001
Continúe de esta forma y al terminar se dará cuenta que tiene 500 pares cuya suma
es igual a 1001, es decir:
Solution 14.2.4 Forme parejas con los números 1, 2, ..., 1000, es decir,
(1, 1), (1, 2), (1, 3), (1, 4), · · · , (1, 1000)
181
Probabilidad, Estadı́stica y sus Aplicaciones
n(n + 1) 1000(1000 + 1)
= .
2 2
Es el número de fichas de dominó que se pueden formar con los primeros 1000
enteros positivos.
ii) primero responde una de las dos y luego responde a una tercera.
¿Qué tiene que hacer el estudiante para saber si aprobará el examen o no?
Solution 14.2.6 Puede intentarlo haciendo cuentas y obtener todas sus posibilida-
des, ¿sabe contar?, o puede usar combinaciones y hacer uso de la lógica cuando usa
los conectivos: y, o., ¿su respuesta final tiene que ver con probabilidad?, ¿siempre
obtiene la misma respuesta?
d) A cada instante
182
Probabilidad, Estadı́stica y sus Aplicaciones
¿Habrá cambios en los diferentes tipos de composición?, ¿Qué concepto está escon-
dido en este problema?
A1 = (1 + 0,06) ∗ A0
A2 = (1 + 0,06) ∗ A1 = (1 + 0,06)2 ∗ A0
A5 = (1 + 0,06)A4 = (1 + 0,06)5 A0
En general se tiene
Ak = (1 + 0,06)A(k−1)
183
Probabilidad, Estadı́stica y sus Aplicaciones
Definición 14.2.14 Una variable aleatoria es una función con valores en los reales
que está definida sobre el espacio muestral Ω.
Definición 14.2.15 Función de probabilidad es una función que asocia a cada pun-
to de su espacio muestral Ω un número real p que denota la probabilidad de que
suceda.
184
Probabilidad, Estadı́stica y sus Aplicaciones
185
Probabilidad, Estadı́stica y sus Aplicaciones
P : F 7−→ [0, 1] es una función que asigna a cada uno de los eventos o sucesos
un valor numérico como medida de probabilidad y satisface los siguientes axiomas:
1. 0 ≤ P (A) ≤ 1.
2. P (Ω) = 1.
3. Si A y B son eventos disjuntos, es decir, A ∩ B = ∅ entonces
P (A ∪ B) = P (A) + P (B).
P (B|A) = P (B)
186
Probabilidad, Estadı́stica y sus Aplicaciones
P (A ∩ B) = P (A)P (B).
Los siguientes ejemplos muestran los experimentos más comunes que se presentan
en la literatura existente.
187
Probabilidad, Estadı́stica y sus Aplicaciones
Ω = A, S
que es una partición del espacio muestral. Entonces
A1 = (A0 ∩ A1 ) ∪ (S0 ∩ A0 )
S1 = (A0 ∩ S1 ) ∪ (S0 ∩ S1 )
Luego entonces
Análogamente para
188
Probabilidad, Estadı́stica y sus Aplicaciones
14.5. Comentario
Se hace notar nuevamente que la probabilidad ha logrado involucrarse con áreas
en la solución de sus problemas y aplicaciones. Este trabajo su objetivo primordial
es mostrar a todo lector que gusta de la probabilidad que debe iniciar por saber
contar.
189
Probabilidad, Estadı́stica y sus Aplicaciones
Bibliografı́a
[1] Robert B. Ash, Basic Probability Theory. Dover Publications, Mineola, N.Y,
2008.
[2] Morris H. DeGroot, Probabilidad y estadı́stica. Addison-Wesley Iberoameri-
cana, Estados Unidos, 1988.
[3] Paul M. Meyer, Probabilidad y aplicaciones estadı́sticas. Fondo educativo in-
teramericano, México, 1973.
[4] Susan J. Milton, Probabilidad y estadı́stica con aplicaciones para ingenierı́a
y ciencias computacionales. Mc Graw Hill, Virginia, 2004.
[5] Alexander M. Mood, Introduction to the theory of statistics. McGraw-Hill,
1974.
190
Probabilidad, Estadı́stica y sus Aplicaciones
Capı́tulo 15
Optimalidad de polı́ticas (s, S) para un modelo de inventario vı́a la teorı́a de los
procesos de decisión de Markov
15.1. Introducción
En este trabajo se plantea un sistema de inventarios con demanda estocástica,
el cual es observado de forma discreta en el tiempo y se busca controlar la can-
tidad ordenada o producida de artı́culos solicitados. En especı́fico suponemos que
191
Probabilidad, Estadı́stica y sus Aplicaciones
dicho sistema dinámico es modelado por una caminata aleatoria de tipo Lindley,
la cual recibe este nombre debido a que David Linley la propuso por primera vez
en la década de los 50’s para el estudio de sistemas de lı́neas de espera [12]. Con
la finalidad de generalizar dicho sistema se introduce una nueva variable, la cual
modela la posibilidad de que la mercancı́a solicitada no se encuentre disponible en
el periodo actual de observación. El objetivo es determinar una estrategia de ope-
ración, la cual minimice los costos descontados asociados al sistema de inventarios.
De acuerdo a las caracterı́sticas que presenta el problema de optimización planteado
las componentes del problema se pueden identificar en un modelo de decisión de
Markov. De esta manera la teorı́a de Procesos de Decisión de Markov (PDM) puede
ser aplicada.
Los PDMs son aplicados para modelar sistemas dinámicos cuyos estados son obser-
vados de manera periódica y es aplicado un control. El desarrollo de un PDM, a
través del tiempo está dado de acuerdo al siguiente procedimiento. En cada tiempo
t, t = 0, 1, ..., se elige un control que se aplicará dependiendo del estado del sistema,
entonces como consecuencia del estado actual y de haber aplicado un control se paga
un costo y el sistema se traslada a un nuevo estado en el instante de tiempo t + 1,
mediante una ley de transición. Al ocurrir un estado en t+1, el proceso se repite. De
esta manera se obtiene una sucesión de controles a la cual se le denomina polı́tica.
Con la finalidad de medir la calidad de una polı́tica, el PDM está dotado de una
función real llamada criterio de rendimiento. De este modo, el problema de control
óptimo consiste en encontrar una polı́tica que minimice el criterio de rendimiento,
a tal politica se le llama óptima, y al criterio de rendimiento evaluado en la polı́tica
óptima se le llama función de valor. Una metodologı́a comúnmente empleada para
caracterizar polı́ticas óptimas es programación dinámica.
Mediante la teorı́a de los Procesos de Decisión de Markov demostramos la existencia
de una polı́tica óptima estacionaria markoviana. Después, como resultado principal
de este trabajo se demuestra la optimalidad de una clase polı́ticas conocidas en el
contexto de sistemas de inventarios como (s, S). En general, una polı́tica del tipo
(s, S) consiste en un reordenamiento de hasta S productos si el nivel de almacenaje
se encuentra por debajo de s, en caso contrario no se ordena. En 1959, Scarf [16]
presenta el primer resultado de optimalidad de esta clase de polı́ticas para un mo-
delo de inventarios distinto al que estudiamos en este trabajo. Otras aportaciones
semejantes, se pueden consultar en [4], [10], [16], [17], [18], [19]. En [3], se demuestra
la optimalidad de esta clase de polı́icas para el modelo con demanda no suplida, pe-
ro utilizando espacio de estados compacto. En este trabajo extendemos el resultado
a espacios de estados no necesariamente compacto.
El trabajo está estructurado de la manera siguiente. Primero, presentamos los con-
ceptos preliminares de la teorı́a de los PDMs. En la siguiente sección presentamos
los elementos de un sistema de inventarios el cual se encuentra modelado por un
sistema dinámico llamado modelo con demanda no suplida. En la sección siguiente
se demuestra la existencia de una polı́tica óptima que resuelve el problema de con-
trol para el modelo en estudio. En la Sección 5 demostramos que la polı́tica óptima
resulta ser de la forma (s, S). Finalmente, presentamos nuestras conclusiones.
192
Probabilidad, Estadı́stica y sus Aplicaciones
193
Probabilidad, Estadı́stica y sus Aplicaciones
De acuerdo con esta definición, una polı́tica π = {πt } puede interpretarse como una
sucesión {at } de variables aleatorias sobre A, tales que, para cada t−historia y t =
0, 1, 2, ..., la distribución de at es πt (·|ht ), la cual está concentrada en el conjunto de
acciones admisibles A(xt ). En otras palabras, cuando usamos una polı́tica arbitraria,
la acción en cualquier tiempo t es una variable aleatoria y depende de todas las
t−historias.
Definición 15.2.2 Una polı́tica π ∈ Π es Determinista Markoviana, si existe
una sucesión {ft } ⊂ F, donde
194
Probabilidad, Estadı́stica y sus Aplicaciones
195
Probabilidad, Estadı́stica y sus Aplicaciones
ηt es una variable del tipo Bernoulli, la cual modela el arribo de producto ordenado
o producido en el almacén. En este trabajo supondremos que la relación entre las
variables presentadas satisface la siguiente ecuación en diferencias:
Q((−∞, y]|x, a) = 0.
En consecuencia, si y ≥ 0
196
Probabilidad, Estadı́stica y sus Aplicaciones
en donde
K > 0 es el costo fijo por producción, el cual también puede indicar un
impuesto,
c > 0 es el costo por unidad producida,
h > 0 es el costo por unidad almacenada,
l > 0 es el costo por unidad faltante.
Por lo tanto, para el modelo (15.4) se tiene la quı́ntupla (X, A, {A(x)|x ∈ X}, Q, C)
y ası́ podemos emplear resultados importantes de la teorı́a de los PDMs a tiempo
discreto.
En la sección anterior se mencioná el problema de control óptimo y las condiciones
que se requieren para encontrar una polı́tica óptima. Una clase de polı́ticas intere-
santes en el estudio de modelos de inventarios son frecuentemente conocidas como
punto de reorden, polı́tica con cantidad de orden s, o polı́ticas (s, S).
En la práctica ocurre lo siguiente con esta polı́tica: Cuando el inventario tiene un
nivel de productos por debajo de s, se ordena una cantidad de no más de S unidades
para estar por arriba de s.
En la Sección 4 se presenta la demostración de la optimalidad de esta clase de
polóticas. Cabe destacar que en la literatura se pueden encontrar resultados que de-
muestran la optimalidad de polı́ticas (s, S) para otros modelos de inventarios. Estos
resultados tienen sus inicios en el año 1966, con un resultado importante presentado
por Scarf [16]. Después podemos encontrar algunos resultados en [4], [10], [17], [18],
[19], [20].
15.4. Existencia
En esta sección, se demuestra la existencia de una polı́tica markoviana esta-
cionaria para el modelo (15.4) mediante la teorı́a de PDMs. El procedimiento de
197
Probabilidad, Estadı́stica y sus Aplicaciones
con V0 (x) = 0.
A continuación demostramos los siguientes resultados sobre el modelo (15.4).
Lema 15.4.2 Sea Q el kérnel estocástico inducido por la dinámica (15.4) entonces
Q es fuertemente continuo, es decir, para cada función u acotada y medible se tiene
que la integral de medida siguiente,
Z
u(y)Q(dy|x, a)
X
198
Probabilidad, Estadı́stica y sus Aplicaciones
Luego,
lim (hp(xn + an ) + h(1 − p)xn ) = hp lim (x + a) + h(1 − p) lim xn
n→∞ n→∞ n→∞
= hp(x + a) + h(1 − p)x,
y
Z ∞ Z ∞
lim lp (s − (xn + an ))dF (s) + l(1 − p) (s − xn )dF (s)
n→∞ x +a xn
Zn∞ n
= lp lim I[xn +an ,∞) (s − (xn + an ))dF (s)
n→∞ 0
Z ∞
+ l(1 − p) lim I[xn ,∞) (s − xn )dF (s),
n→∞ 0
199
Probabilidad, Estadı́stica y sus Aplicaciones
note que la función I[xn +an ,∞) (s − (xn + an )) ≤ s, y además se satisface la siguiente
propiedad
se tiene que I[0,xn ] converge a I[0,x] casi seguramente, análogamente I[0,xn +an ] con-
verge casi seguramente a I[0,x+a] , ası́ por el Teorema de Convergencia Dominada
[1],
Z ∞ Z ∞
lim lp (s − (xn + an ))dF (s) + l(1 − p) (s − xn )dF (s)
n→∞ x +a xn
Z ∞ n n Z ∞
= lp (s − (x + a))dF (s) + l(1 − p) (s − x)dF (s).
x+a x
Df (λ, A) = {0},
g(x) = 0, ∀x ∈ X.
Luego Vα∗ (x) ≤ vα (g, x), si probamos que vα (g, x) < ∞ para cada x ∈ X, se tiene
el resultado buscado.
Denotemos a xgt al proceso inducido por la dinámica (15.4) utilizando la polı́tica g.
Sea xg0 = x ≥ 0, entonces
200
Probabilidad, Estadı́stica y sus Aplicaciones
Pn
donde S0 = 0 y St = j=1 ξj . Observe que E[N (x)] < ∞ para cada x ≥ 0. Luego
"∞ #
X
vα (g, x) = Exg α t
C(xgt , 0)
t=0
= hx + lE[(ξ − x)+ ]
N (x)
X
f t +
+ Ex α (h(x − St ) + E[(ξt − (x − St )) ]
t=1
∞
X
+ Exf αt E[ξk ]
t=N (x)+1
∞ ∞
" #
X X
≤ hx + lµ + E αt (hx + µ) + αt µ
t=1 t=0
α 1
= hx + lµ + (hx + µ) + µ < ∞.
1−α 1−α
En la última igualdad se utilizá la Suposición 15.3.1. Ası́, Vα∗ es finita.
Con los resultados anteriores se demuestra el siguiente resultado.
Teorema 15.4.5 Existe una polı́tica óptima determinista estacionaria para el pro-
blema de control óptimo con horizonte finito e infinito bajo el modelo (15.4). Además
las funciones de iteración de valor óptimo Vn ↑ Vα∗ .
Demostración. Por los Lemas 15.4.2, 15.4.3, 15.4.4 y por el Teorema de existencia
de una polı́tica óptima determinista estacionaria en [9] se tiene el resultado del
teorema.
donde
201
Probabilidad, Estadı́stica y sus Aplicaciones
por el Lema 15.5.2 la función inf y≥x G0 (y) es convexa y la función min es también
convexa. Por otro lado,
inf G0 (x + a) = G0 (x + a∗0 ),
a≥0
202
Probabilidad, Estadı́stica y sus Aplicaciones
inf G0 (x + a) → ∞.
a≥0
lim Vn (x) = ∞,
x→∞
entonces Gn y Hn son convexas. Por tanto, por el Lema 15.5.2 se tiene que Vn+1 es
convexa. Por otro lado,
luego por el cambio de variable propuesto a y se tiene que existe a∗n ∈ A tal que
inf y≥x Gn (x + a∗n ) = Gn (x + a∗n ). Por tanto,
203
Probabilidad, Estadı́stica y sus Aplicaciones
en donde
H(y) = (h(1 − p) − c)x + (1 − p)E[(ξ − x)+ ] + α(1 − p)E[Vα∗ ((x − ξ)+ )].
204
Probabilidad, Estadı́stica y sus Aplicaciones
15.6. Conclusiones
En este capı́tulo se propone un modelo de inventarios con demanda estocástica
y con la caracterı́stica de permitir mercancia no abastecida al inventario. Para di-
cho sistema se caracterizan polı́ticas óptimas del tipo (s, S), mediante la técnica de
programación dinámica y algunos resultados de funciones convexas. Los resultados
obtenidos permiten la implementación numérica de polı́ticas estructurales al con-
texto de teorı́a de inventarios. Trabajos futuros en esta lı́nea de investigación son
los siguientes:
205
Probabilidad, Estadı́stica y sus Aplicaciones
Bibliografı́a
[1] Ash R. B. and Doleans-Dade C.A., Probability and Measure Theory Aca-
demic Press Elsevier, San Diego, 2005.
[2] Chen X. and Simchi-Levi D., Coordinating inventory control and pricing
strategies with random demand and fixed ordering cost: the infinite horizon
case. Operations Research Center,Vol 29, pp. 698-723, 2004.
[3] Daduna H., Knopov P. and Tur L., Optimal Strategies for an Inventory
System with Cost Functions of General Form. Cybernetic and Systems Analysis,
Springer, 1999.
[4] Ehrhardt R., The Power Approximation for Computing (s, S) Inventory Po-
licies. Management Science, pp. 777-786, 1979.
[5] Feinberg E., Optimality Conditions for Inventory Control, arxiv:1606.00957v1,
2016.
[6] Feinberg E. and Lewis M., On the Optimality of (s,S) Policies. ar-
xiv:1507.05125v1, 2015.
[7] Goldberg D., Dmitriy A., Yingdong L., Sharma M. and Squillante
M. Asymptotic Optimality of Constant-Order Policies for Lost Sales Inventory
Models with Large Lead Times. Septiembre 2014. arxiv:1211.4063v2.
[8] Guo X and Zhu Q., Average optimality for Markov decision processes in borel
spaces: a new conditions and approach. Journal of Applied Probability, Vol. 49,
2006.
[9] Hernández-Lerma O. and Lasserre J. B., Discrete-Time Markov Control.
Processes: Basic Optimality Criteria, Springer-Verlag, New York, 1996.
[10] Iglehart D., Optimality of (s,S) Policies in the Infinite Horizon Dynamic In-
ventory Problem. Institute for Operations Research and the Management Scien-
ces. pp. 259-267, 1963.
[11] Johansen G. and Shaler S., Control of Arrivals to a Stochastic Input-
Output System. Advances in Applied Probability, Vol. 12, No. 4, pp. 972-999,
1980.
[12] Lindley D., The Theory of Queues with Single Server, Proc. Cambridge Phi-
los. Soc. 48, pp. 277-289, 1952.
206
Probabilidad, Estadı́stica y sus Aplicaciones
[13] Margono S. and Dwi Y., Determine the Appropriate Inventory Model in
Tang Company. Journal of Business and Management. Vol.4, No. 4, 2015.
[14] Özekici S. y Parlar M., Inventory models with unreliable suppliersin a
random environment. Operations Research, pp.123-136, 1999.
[15] Porteus E., On the Optimality of Generalized (s,S) Policies. Management
Science, 1971.
[16] Scarf H., The Optimality of (S,s) Policies in the Dynamic Inventory Problem.
Applied Mathematics and Statistics Laboratory, Standford University, Califor-
nia, No. 11, 1959.
[17] Schal M., On The Optimality of (s,S)- Policies in Dynamic Inventory Models
with Finite Horizon. Siam J. Appl. Math., Vol. 30, No. 3, 1976.
[18] Suresh P. and Feng C., Optimality of (s,S) Policies in Inventory Models with
Markovian Demand. Operations Research. Vol. 4, No. 6, pp. 931-940, 1995.
[19] Veinott A., On the Optimality of (s,S) Inventory Policies: New Conditions
and New Proof. SIAM J. Appl. Math. No. 14, pp. 1067-1089, 1966.
[20] Veinott A. and Wagner H., Computing Optimal (s,S) policies. Manage-
ment Science. Vol. 11, No. 5, pp. 525-552, 1965.
[21] Zipkin P., Old and New Methods for Lost Sales Inventory Systems Operations
Research. Vol. 56, No. 5, pp. 1256-1263, 2008.
207
Probabilidad, Estadı́stica y sus Aplicaciones
Capı́tulo 16
Reemplazo óptimo de un equipo y algoritmo creciente de inducción hacia atrás.
16.1. Introducción
Los modelos de reemplazo de máquinas tienen importancia principalmente den-
tro de los grandes sistemas productivos, en donde detener alguna lı́nea de producción
por causa de algún fallo en las máquinas genera grandes pérdidas monetarias. Por
otro lado, reparar máquinas constantemente también implica grandes costos. El
problema de reemplazo óptimo consiste, por ejemplo, en determinar los momentos
adecuados en que se debe reemplazar una máquina de tal manera que se minimicen
208
Probabilidad, Estadı́stica y sus Aplicaciones
los costos.
Como podrá verse, algunas de las variantes que presentan estos modelos, son que el
conjunto de niveles de deterioro puede ser finito o infinito numerable, o en lugar de
considerar costos, se pueden considerar recompensas; incluso, en algunos modelos,
se plantea la reparación de la máquina en lugar del reemplazo (véase [1]). Cabe
señalar que un supuesto importante en el modelado del problema de reemplazo, co-
mo un problema de control óptimo dentro de la teorı́a de PDMs, es que el reemplazo
es inmediato.
209
Probabilidad, Estadı́stica y sus Aplicaciones
16.2.2. Polı́ticas
Una polı́tica estrategia es una colección de reglas de decisión
π = {f0 , f1 , . . .},
donde cada una de dichas reglas indica qué control aplicar, en cada instante de
tiempo.
Una polı́tica de decisión general π = {f¯0 , f¯1 , . . .} se define como una sucesión de
reglas (medibles, posiblemente aleatorias) para tomar decisiones y, en cada tiempo
t = 0, 1, ..., la decisión f¯t puede depender del estado actual y de todos los estados y
decisiones anteriores (véase [2]), es decir,
210
Probabilidad, Estadı́stica y sus Aplicaciones
y, la recompensa máxima:
Los problemas fundamentales que se presentan, en esta teorı́a, son los siguientes:
existencia, caracterización y aproximación de polı́ticas óptimas.
211
Probabilidad, Estadı́stica y sus Aplicaciones
JN (x) := rN (x)
y, para t = N − 1, N − 2, . . . , 0,
X
Jt (x) := max r(x, a) + Jt+1 (y)Q(y|x, a) .
a∈A(x)
y∈X
Si para cada t = 0, . . . , N − 1, existe una regla de decisión ft ∈ F tal que para toda
x∈X X
Jt (x) := r(x, ft (x)) + Jt+1 (y)Q(y|x, ft (x)),
y∈X
212
Probabilidad, Estadı́stica y sus Aplicaciones
213
Probabilidad, Estadı́stica y sus Aplicaciones
JN (x) = 0,
n
X
Jt (x) = min c(x, a) + Jt+1 (y)Q(y|x, a)
a∈{0,1}
y=1
n
X
= min g(x) + Jt+1 (y)pxy , R + g(1) + Jt+1 (1) ,
y=x
t = N − 1, N − 2, . . . , 0.
214
Probabilidad, Estadı́stica y sus Aplicaciones
El valor de desecho del equipo, al final del horizonte de planeación, es rN (x), el cual
se supone decreciente en x.
JN (x) = rN (x),
∞
X
Jt (x) = max r(x, a) + Jt+1 (y)Q(y|x, a)
a∈{0,1}
y=0
X∞ ∞
X
= max K − g(x) + Jt+1 (y)p(y − x), K − R − g(0) + Jt+1 (y)p(y) ,
y=x y=0
t = N − 1, N − 2, . . . , 0.
Considérese una máquina que puede estar en cualquiera de los estados {0, 1, . . .} y
supóngase que al comienzo de cada dı́a, el estado de la máquina es observado y se
toma la decisión sobre reemplazarla o no. Si se toma la decisión de reemplazarla,
entonces se supondrá que la máquina es reemplazada instantáneamente por una
máquina nueva cuyo estado es 0.
{g(x), x ≥ 0}
215
Probabilidad, Estadı́stica y sus Aplicaciones
JN (x) = 0,
∞
X
Jt (x) = min c(x, a) + Jt+1 (y)Q(y|x, a)
a∈{0,1}
y=0
∞
X
= min g(x) + Jt+1 (y)pxy , R + C(0) + Jt+1 (0)p0y ,
y=x
t = N − 1, N − 2, . . . , 0.
16.3.4. Ejemplo
Considérese que en el modelo de la Subsección 16.3.2, la probabilidad p(z), de te-
ner z niveles de deterioro, sigue una distribución geométrica con parámetro p = 0.4,
es decir, p(z) = (0.6)(0.4)z , z = 0, 1, . . .; dicha distribución es una de las principales
distribuciones discretas con soporte numerable, cuya estructura facilita los cálculos
en el AIHA, como podrá observarse a continuación. Además, sean N = 3 periodos,
K = 0, R = 5, g(x) = 2x y rN (x) = max{5 − x, 0}, x = 0, 1, . . ..
No es difı́cil observar que, en este caso, existe una polı́tica óptima, pues el mo-
delo considerado satisface la Hipótesis 16.2.2 a), pues X es un conjunto numerable
y A(x) = A = {0, 1}.
216
Probabilidad, Estadı́stica y sus Aplicaciones
Para t = 2,
∞
X ∞
X
y y
J2 (0) = max 0.6 J3 (y)(0.4) , −5 + 0.6 J3 (y)(0.4)
y=0 y=0
∞
X 4
X
y
= 0.6 J3 (y)(0.4) = 0.6 (5 − y)(0.4)y = 4.34016,
y=0 y=0
con f2 (0) = 0.
∞
X ∞
X
J2 (1) = max − 2 + 0.6 J3 (y)(0.4)y−1 , −5 + 0.6 J3 (y)(0.4)y
y=1 y=0
4
X
= max − 2 + 0.6 (5 − y)(0.4)y−1 , −5 + 4.34016
y=1
= max{1.3504, −0.65984} = 1.3504,
con f2 (1) = 0.
∞
X ∞
X
J2 (2) = max − 4 + 0.6 J3 (y)(0.4)y−2 , −5 + 0.6 J3 (y)(0.4)y
y=2 y=0
4
X
= max − 4 + 0.6 (5 − y)(0.4)y−2 , −0.65984
y=2
= max{−1.624, −0.65984} = −0.65984,
con f2 (2) = 1.
∞
X ∞
X
y−3 y
J2 (3) = max − 6 + 0.6 J3 (y)(0.4) , −5 + 0.6 J3 (y)(0.4)
y=3 y=0
4
X
y−3
= max − 6 + 0.6 (5 − y)(0.4) , −0.65984
y=3
= max{−4.56, −0.65984} = −0.65984,
con f2 (3) = 1.
∞
X ∞
X
J2 (4) = max − 8 + 0.6 J3 (y)(0.4)y−4 , −5 + 0.6 J3 (y)(0.4)y
y=4 y=0
4
X
= max − 8 + 0.6 (5 − y)(0.4)y−4 , −0.65984
y=4
= max{−7.4, −0.65984} = −0.65984,
217
Probabilidad, Estadı́stica y sus Aplicaciones
con f2 (4) = 1.
Para x = 5, 6, . . .,
∞
X ∞
X
y−5 y
J2 (x) = max − 2x + 0.6 J3 (y)(0.4) , −5 + 0.6 J3 (y)(0.4)
y=5 y=0
= max{−2x, −0.65984} = −0.65984,
con f2 (x) = 1.
x J2 (x) f2 (x)
0 4.34016 0
1 1.3504 0
2 -0.65984 1
3 -0.65984 1
4 -0.65984 1
.. .. ..
. . .
Para t = 1,
∞
X ∞
X
y y
J1 (0) = max 0.6 J2 (y)(0.4) , −5 + 0.6 J2 (y)(0.4)
y=0 y=0
∞
X
= 0.6 J2 (y)(0.4)y
y=0
∞
X
= 0.6 4.34016 + 1.3504(0.4) − 0.65984 (0.4)y
y=2
= 2.8226176,
con f1 (0) = 0.
∞
X ∞
X
y−1 y
J1 (1) = max − 2 + 0.6 J2 (y)(0.4) , −5 + 0.6 J2 (y)(0.4)
y=1 y=0
∞
X
= max − 2 + 0.6 1.3504 − 0.65984 (0.4)y−1 , −5 + 2.8226176
y=2
= max{−1.453696, −2.1773824} = −1.453696,
con f1 (1) = 0.
218
Probabilidad, Estadı́stica y sus Aplicaciones
Para x = 2, 3, . . .,
∞
X ∞
X
y−x y
J1 (x) = max − 2x + 0.6 J2 (y)(0.4) , −5 + 0.6 J2 (y)(0.4)
y=x y=0
∞
X
= max − 2x + 0.6(−0.65984) (0.4)y−x , −2.1773824
y=x
= max{−2x − 0.65984, −2.1773824} = −2.1773824,
con f1 (x) = 1.
x J1 (x) f1 (x)
0 2.8226176 0
1 -1.453696 0
2 -2.1773824 1
3 -2.1773824 1
.. .. ..
. . .
Finalmente, para t = 0,
∞
X ∞
X
y y
J0 (0) = max 0.6 J1 (y)(0.4) , −5 + 0.6 J1 (y)(0.4)
y=0 y=0
∞
X
= 0.6 J1 (y)(0.4)y
y=0
∞
X
y
= 0.6 2.8226176 − 1.453696(0.4) − 2.1773824 (0.4)
y=2
= 0.996302336,
con f1 (0) = 0.
∞
X ∞
X
J0 (1) = max − 2 + 0.6 J1 (y)(0.4)y−1 , −5 + 0.6 J1 (y)(0.4)y
y=1 y=0
∞
X
y−1
= max − 2 + 0.6 − 1.453696 − 2.1773824 (0.4) , −5 + 0.996302336
y=2
= max{−5.0496, −4.003697664} = −4.003697664,
con f0 (1) = 1.
219
Probabilidad, Estadı́stica y sus Aplicaciones
Para x = 2, 3, . . .,
∞
X ∞
X
y−x y
J0 (x) = max − 2x + 0.6 J1 (y)(0.4) , −5 + 0.6 J1 (y)(0.4)
y=x y=0
∞
X
= max − 2x + 0.6(−2.1773824) (0.4)y−x , −4.003697664
y=x
= max{−2x − 2.1773824, −4.003697664} = −4.003697664,
con f0 (x) = 1.
x J0 (x) f0 (x)
0 0.996302336 0
1 -4.003697664 1
2 -4.003697664 1
.. .. ..
. . .
Como podrá observarse en los Cuadros 16.1-16.3, las reglas de decisión ft , para
t = 2, 1, 0, son reglas de decisión óptimas crecientes. Por lo tanto, la polı́tica óptima
π ∗ = {f0 (x), f1 (x), f2 (x)} es creciente en x.
220
Probabilidad, Estadı́stica y sus Aplicaciones
e) rN (x) es decreciente en x.
221
Probabilidad, Estadı́stica y sus Aplicaciones
16.4.3. Un ejemplo
Finalmente, se mostrará que para el modelo del ejemplo de la Subsección 16.3.4,
existe una polı́tica óptima creciente y se obtendrá ésta usando el algoritmo creciente
de inducción hacia atrás.
1.
−2x, a=0
r(x, a) =
−5, a=1
es una función decreciente en x, para toda a ∈ {0, 1} y es una función super-
aditiva en K.
P∞ P∞
2. q(k|x, 0) = y=k 0.6(0.4)y−x y q(k|x, 1) = y=k 0.6(0.4)y son funciones cre-
cientes en x, para toda k ∈ X y a ∈ A.
P∞ y−x
P∞
3. y=0 0.6(0.4) u(y) y y=0 0.6(0.4)y u(y) son funciones superaditivas en K,
para cualquier función u decreciente.
4. rN (x) = max{5 − x, 0}, x = 0, 1, . . . es una función decreciente en x.
Por lo tanto, se puede concluir que existe una polı́tica óptima que es creciente.
Por otro lado, una ilustración de la versión creciente del AIHA, para este ejem-
plo, considerando los resultados obtenidos en la Subsección 16.3.4, es la siguiente:
Lo anterior implica que A0 (4) = A0 (5) = . . . = {1} y, de ahı́ que la regla de decisión
óptima ft (x) = 1, para x = 2, 3, . . .. Obsérvese la reducción de cálculos que se tiene.
222
Probabilidad, Estadı́stica y sus Aplicaciones
16.5. Conclusiones
La monotonicidad de las polı́ticas óptimas en los modelos de reemplazo, con espacios
finitos, simplifica el algoritmo de inducción hacia atrás y puede facilitar la obtención
de polı́ticas óptimas incluso en modelos con espacio de estados numerable, como se
pudo observar en el ejemplo mostrado en la SubsecciÃ3 n16.4.3.P araello, seránecesarioreestructurarlaversiónc
223
Probabilidad, Estadı́stica y sus Aplicaciones
Bibliografı́a
[1] Bertsekas D.P. Dynamic Programming and Optimal Control, Volume I. At-
hena Scientific, Third Edition, USA, 2005.
[2] Hernández-Lerma O. y Lasserre J.B. Discrete-Time Markov Control Pro-
cesses. Springer-Verlag, New York, 1996.
[3] Heyman D.P. y Sobel M.J. Stochastic Models in Operations Research, Vol.
II. Stochastic Optimization. McGraw-Hill, USA, 1984.
[4] Puterman M.L. Markov Decision Processes: Discrete Stochastic Dynamic Pro-
gramming. John Wiley & Sons, Inc., New Jersey, 2005.
[5] Ross S.M. Applied Probability Models with Optimization Applications. Dover
Publications, Inc., New York, 1970.
224
Probabilidad, Estadı́stica y sus Aplicaciones
Capı́tulo 17
Juegos Estocásticos y criterios de rendimiento
Palabras clave: juegos estocásticos, valor del juego, equilibrio de Nash, criterio
de rendimiento.
17.1. Introducción
La Teorı́a de juegos se inicia formalmente en 1944 con la publicación del libro The
theory of games and economic behavior de John Von Neumann y Oskar Morgenstern,
quienes estudiaron dos planteamientos: primero el comportamiento no cooperativo y
segundo el cooperativo. John Forbes Nash escribió una tesis, dirijida por Albert W.
Tucker, donde expuso por primera vez una solución para juegos no cooperativos, a
la que llamó equilibrio de Nash, como consecuencia consguió un gran reconocimiento
entre los especialistas del área. Una situación en la que ninguno de los jugadores
siente la necesidad de cambiar de estrategia porque cualquier cambio implicarı́a una
disminución de las ganancias es un equilibrio de Nash.
225
Probabilidad, Estadı́stica y sus Aplicaciones
El concepto de juego estocástico fue introducido por Shapley en 1953. Los juegos
estocásticos, son juegos dinámicos a diferencia de los juegos en forma normal; pueden
ser vistos como una generalización de los procesos de decisión de Markov, en los que
se permite que varios agentes tomen decisiones persiguiendo objetivos diferentes.
En 1997, Filar y Vrieze publicaron el libro Competitive Markov decision processes
cuyo tópico son los juegos estocásticos y los procesos de decisión de Markov.
17.2. Preliminares
En esta sección se presentan las definiciones básicas y notación necesarias para
exponer el modelo del juego. De aquı́ en adelante se considerarán juegos con solo
dos jugadores, cuando se tienen N > 2 jugadores el planteamiento se realiza de
forma análoga.
Llamaremos espacio de Borel a un subconjunto de Borel X de un espacio métrico
completo y separable. Su σ-álgebra de Borel se denotada por B(X). Solo trabaja-
remos con espacios de Borel, en este trabajo medible indicará “Borel medible”.
Dado un espacio de Borel X, denotamos por P(X) a la familia de medidas de
probabilidad en X, dotada de la topologı́a débil σ(P(X), Cb (X)), donde Cb repre-
senta el espacio de funciones acotadas continuas en X. Hay que notar que P(X) es
un espacio de Borel, además si X es compacto P(X) también lo es.
Definición 17.2.1 Sean X y Y espacios de Borel, un kernel estocástico en X dado
Y , o también conocida como probabilidad de transición de Y a X, es una función
medible ν(·|·) tal que
ν(·|y) es una medida de probabilidad sobre X para cada y ∈ Y , y
ν(D|·) es una función medible sobre Y para cada D ∈ B(X).
GM := (X, A, B, KA , KB , Q, r1 , r2 ), (17.1)
en donde
X es el espacio de estados, que supondremos de Borel,
A y B son los espacios de acciones para los jugadores 1 y 2, respectivamente,
ambos de Borel,
KA ∈ B(X × A) y KB ∈ B(X × B) son los cojuntos de restricciones. Para
cada x ∈ X definimos la x-sección no vacı́a de A como el siguiente conjunto
A(x) = {a ∈ A : (x, a) ∈ KA },
226
Probabilidad, Estadı́stica y sus Aplicaciones
17.3. Estrategias
Sean H0 := X y Ht := K × Ht−1 para t = 1, 2, . . . Para cada t, un elemento
de Ht representa una historia del juego hasta el tiempo t. Una estrategia aleatoria
π 1 para el jugador 1 es una sucesión π 1 = {πt1 , t = 0, 1, . . .} de kérneles estocásticos
πt1 en P(A|Ht ) tal que
227
Probabilidad, Estadı́stica y sus Aplicaciones
228
Probabilidad, Estadı́stica y sus Aplicaciones
siempre que las integrales esten bien definidas. En particular, para r y Q como en
la sección 2, Z Z
r(x, ϕ, ψ) := r(x, a, b)ψ(db)ϕ(da) (17.14)
A(x) B(x)
y Z Z
Q(·|x, ϕ, ψ) := Q(·|x, a, b)ψ(db)ϕ(da)
A(x) B(x)
229
Probabilidad, Estadı́stica y sus Aplicaciones
Z
ξ∗ + u∗ (x) = r(x, ϕ∗ (x), ψ∗ (x)) +u∗ (y)Q(dy|x, ϕ∗ (x), ψ∗ (x)) (17.15)
X
Z
= max [r(x, ϕ, ψ∗ (x)) + u∗ (y)Q(dy|x, ϕ, ψ∗ (x))] (17.16)
ϕ∈PA (x)
ZX
= min [r(x, ϕ∗ (x), ψ) + u∗ (y)Q(dy|x, ϕ∗ (x), ψ)] (17.17)
ψ∈PB (x) X
17.4.1. Suposiciones
Las siguientes suposiciones son necesarias para los teoremas que se mencionan
más adelante.
Suposición 17.4.4 a) Para cada estado x ∈ X, los conjuntos (no vacı́os) A(x)
y B(x) de acciones admisibles son compactos.
b) Para cada (x, a, b) en K, r(x, ·, b) es semicontinua superior (u.s.c.) en A(x) y
r(x, a, ·) es semicontinua inferior (l.s.c.) en B(x).
c) Para cada (x, a, b) en K y cada función medible acotada v definida en X, las
funciones Z Z
v(y)Q(dy|x, ·, b) y v(y)Q(dy|x, a, ·)
X X
230
Probabilidad, Estadı́stica y sus Aplicaciones
Definición 17.4.7 Bw (X) denota el espacio lineal de las funciones medibles reales
u definidas en X con una norma w finita que se define como
|u(x)|
||u||w := sup , (17.19)
x∈X w(x)
y Mw (X) representa el espacio lineal normado de las medidas finitas con signo µ
en X tales que Z
||µ||w := wd|µ| < ∞, (17.20)
X
Suposición 17.4.8 Existe una medida σ-finita γ sobre X y una función de densi-
dad estrictamente positiva g(a, b, ·) tal que
Z
Q(D|x, a, b) = g(x, a, b, y)γ(dy)
D
Fn := σ{x0 , a0 , b0 , . . . , xn , an , bn }. (17.22)
231
Probabilidad, Estadı́stica y sus Aplicaciones
Teorema 17.4.10 Bajo las hipótesis del Teorema 17.4.9, las siguientes expresiones
son equivalentes:
a) El par (ϕ∗ , ψ∗ ) ∈ Φ1 × Φ2 es EAP óptimo.
b) Para cada x ∈ X
∆(x, ϕ∗ (x), ψ∗ (x)) = max ∆(x, ϕ, ψ∗ (x))
ϕ∈PA (x)
(17.25)
= min ∆(x, ϕ∗ (x), ψ)) = 0.
ψ∈PB (x)
c) Para cada x ∈ X, π 1 ∈ Π1 , y π 2 ∈ Π2
c1) {Mn (h∞ ), Fn } es Pxϕ∗ ,ψ∗ -martingala,
2
c2) {Mn (h∞ ), Fn } es Pxϕ∗ ,π -submartingala,
1
c3) {Mn (h∞ ), Fn } es Pxπ ,ψ∗
-supermartingala.
Teorema 17.4.11 Supongamos que las hipótesis del Teorema 17.4.9 se satisfacen
y, además, existe una constante r̂ ≥ 0 tal que
J 1 (x, π 1∗ , π 2∗ ) ≥ J 1 (x, π 1 , π 2∗ ) ∀π 1 ∈ Π1 , x ∈ X,
y
J 2 (x, π 1∗ , π 2∗ ) ≥ J 2 (x, π 1∗ , π 2 ) ∀π 2 ∈ Π2 , x ∈ X.
232
Probabilidad, Estadı́stica y sus Aplicaciones
Teorema 17.5.5 Bajo las Suposiciones 17.4.4, 17.4.5, 17.4.8 y 17.5.2 - 17.5.4,
existe un par (ϕ∗ , ψ∗ ) ∈ Φ1 × Φ2 que es un equilibrio de Nash.
17.6. Ejemplo
Como ejemplo, usaremos el Dilema del Prisionero Iterado. La forma normal
estática del juego se representa en el Cuadro 17.1:
Consideremos las estrategias SC , SD , ST , SA , SG , SQ y SP , donde:
SC jugar siempre C,
233
Probabilidad, Estadı́stica y sus Aplicaciones
J2
C D
J1 C 3,3 0,5
D 5,0 1,1
SD jugar siempre D,
234
Probabilidad, Estadı́stica y sus Aplicaciones
y (
1, si at−1 = 0 o bt−1 = 0
πt1 ({0}|ht ) =
0, c.o.c.
(
q, si at = 1
SQ = {πt1 |πt1 ({at }|ht ) = t = 0, 1, . . .}
1 − q, si at = 0
y (
1 − p, si bt−1 = 0
πt1 ({0}|ht ) =
0, si bt−1 = 1
Nota: Todas las estrategias son estacionarias Markovianas. Por el Teorema 17.5.5
existe un par de estrategias que es un equilibrio de Nash.
De aquı́ observamos que los equilibrios de Nash son: (SD , SD ), (SG , SG ), (SG , ST ),
(ST , SG ), (ST , ST ) y (SQ , SQ ).
235
Probabilidad, Estadı́stica y sus Aplicaciones
17.7. Conclusiones
En teorı́a de juegos el objetivo es encontrar estrategias que optimicen el ren-
dimiento para cada uno de los jugadores, pero esto no siempre es sencillo. Los
resultados de la sección 4 nos aseguran que los 3 criterios que se presentaron son
equivalentes. Esto resulta de mucha utilidad pues nos permite elegir el criterio que
sea más sencillo al buscar dichos equilibrios. Por ejemplo en el Dilema del Prisionero
Iterado utilizamos el criterio EAP para hallar los equilibrios de Nash, cuya existen-
cia esta asegurada por el teorema de la sección 5. Aunque la elección del criterio
dependerá del problema que se este abordando.
236
Probabilidad, Estadı́stica y sus Aplicaciones
Bibliografı́a
237
Probabilidad, Estadı́stica y sus Aplicaciones
Capı́tulo 18
Probabilidad de localización de una partı́cula en un potencial isotónico cuántico
Abstract. The isotonic oscillator is one of the few quantum systems with exact
solution. In this work we present two contributions on this problem. The first is to
propose a algebraic method of solution easier than those that appear in the litera-
ture. The second contribution refers to the calculation of the probability of location
of the particle subject to the isotonic potential by using formulas that determine
the most likely places the particle.
18.1. Introducción
El potencial isotónico es un oscilador armónico con una barrera infinita de po-
tencial en el centro. Este es uno de los pocos problemas resueltos de forma exacta en
la mecánica cuántica. Tiene aplicaciones en óptica cuántica, en moléculas poliatómi-
cas, en teorı́a de muchos cuerpos, cadenas de espines para la computación cuántica.
En la literatura aparecen diversos enfoques para resolver la ecuación de Schrodinger
con este potencial. El que trataremos en este trabajo es un método algebraico por
medio de operadores de ascenso y descenso, como en el oscilador armónico [1], pero
a diferencia de este caso, en el que esos operadores contienen derivadas de primer
orden, los operadores para el potencial de tipo isotónico que hemos encontrado en
la literatura son de segundo orden [2], [3].
238
Probabilidad, Estadı́stica y sus Aplicaciones
2
b OA = − 1 d + 1 x2 .
H (18.1)
2 dx2 2
Debemos resolver la ecuación de Schrodinger
b OA Ψ = i ∂Ψ ,
H (18.2)
∂t
donde Ψ = Ψ (x, t) es la función de onda que describe el comportamiento de la
partı́cula sujeta al potencial
1 2
V (x) = x , x ∈ R. (18.3)
2
Debido a que el potencial (18.3) no depende del tiempo, es posible usar el me-
canismo de separación de las variables x y t para demostrar que la función de onda
tiene la forma
239
Probabilidad, Estadı́stica y sus Aplicaciones
H
b OA ψn (x) = En ψn (x) . (18.5)
± 1 d
a =√
b ∓ +x (18.6)
2 dx
1
H
b OA = b a− +
a+ b (18.7)
2
1
H
b OA a− b
= b a+ − . (18.8)
2
Con (7) y (8) se encuentra la relación de conmutación
− +
a ,b
b a = 1. (18.9)
a± y el hamiltoniano H
Las relaciones más relevantes de los operadores b b OA son las
siguientes
h i
H a−
b OA , b a− ,
= b (18.10)
h i
H a+
b OA , b = a+ ,
−b (18.11)
− −
H a ψn (x) = (En − 1) b
b OA b a ψn (x) , (18.12)
+ +
H a ψn (x) = (En + 1) b
b OA b a ψn (x) . (18.13)
240
Probabilidad, Estadı́stica y sus Aplicaciones
a− ψn (x) ,
ψn−1 (x) α b (18.14)
+
ψn+1 (x) α b
a ψn (x) . (18.15)
Por todo lo anterior se deduce que si de alguna manera encontramos una solución
ψn (x) de la ecuación de Schrodinger (18.5), podemos encontrar todas las demás.
En el caso del oscilador armónico, lo primero que debemos tomar en cuenta es que
la energı́a debe tener un valor mı́nimo E0 , ya que el potencial ası́ lo establece. Si
ψ0 (x) es la función de onda correspondiente a esta energı́a mı́nima, se debe cumplir
que
a− ψ0 (x) = 0.
b (18.16)
dψ0
+ xψ0 = 0 (18.17)
dx
cuya solución es
2
ψ0 (x) = e−x /2
, x ∈ R. (18.18)
a+ ψ0 (x)
ψ1 (x) ∼ b (18.19)
La correspondiente el estado n = 2 es
2
a+ ψ1 (x) ∼ b
ψ2 (x) ∼ b a+ ψ0 (x) (18.20)
y en general
n
a+
ψn (x) ∼ b ψ0 (x) (18.21)
2
Aplicando n veces a ψ0 (x) = e−x /2
se encuentra
2
ψn (x) ∼ Hn (x) ψ0 (x) = Hn (x) e−x /2
(18.22)
1
En = n + (18.23)
2
241
Probabilidad, Estadı́stica y sus Aplicaciones
2
b N = − 1 d + 1 x2 + g ,
H (18.24)
2 dx2 2 x2
donde aparece el usual término cuadrático del oscilador armónico. La parte singular
de este hamiltoniano está caracterizada por la constante g.
± 1 d d + 1/2
c =√
b ∓ +x− (18.25)
2 dx x
La factorización del hamiltoniano es de la forma
c− + d + 1
c+ b
H
b N = ~ω b (18.26)
y asume que g > −1/8 para que d sea real. El conmutador de los operadores (18.25)
es
− + d + 1/2
c ,b
c =1+ . (18.28)
x2
b
b± = b
2 g
A a± − , (18.32)
x2
a− (18.6) del oscilador
a+ y descenso b
en donde aparecen los operadores de ascenso b
armónico
242
Probabilidad, Estadı́stica y sus Aplicaciones
1 d
a± = √
b ∓ +x . (18.33)
2 dx
b± como
Podemos introducir (18.9) en (18.8) para tener la forma explı́cita de A
operadores difernciales de segundo orden:
2
b+ = 1 d − x d + 1 x2 − 1 − g ,
A 2
(18.34)
2 dx dx 2 x2
2
b− = 1 d + x d + 1 x2 + 1 − g .
A 2
(18.35)
2 dx dx 2 x2
b± tienen las siguientes propiedades:
Los operadores A
h i
b− , A
A b+ = H bN , (18.36)
h i
H b+ = A
bN , A b+ , (18.37)
h i
H b− = −A
bN , A b− . (18.38)
b+ es
Son precisamente las propiedades (18.13) y (18.14) las que aseguran que A
−
un operador de ascenso y que A es de descenso, respectivamente, pues
b
b+ ψn (x)
A = cn+1 ψn+1 (x) , (18.39)
b− ψn (x)
A = cn−1 ψn−1 (x) . (18.40)
d2 ψn
1 2 g
= 2 [V (x) − En ] ψn = 2 x + 2 − En ψn . (18.41)
dx2 2 x
243
Probabilidad, Estadı́stica y sus Aplicaciones
+ dψn 2 1
A ψn = −x
b + x − En − ψn = cn+1 ψn+1 (x) (18.42)
dx 2
b− ψn = x dψn + x2 − En + 1 ψn = cn−1 ψn−1 (x)
A (18.43)
dx 2
n
b+ ψ0 (x)
ψn+1 (x) = A (18.44)
tendrı́amos que realizar 2n derivadas usando (18.10), mientras que con (18.18) sólo
serı́an n derivadas, como lo vamos a hacer a continuación. Una restricción de (18.18)
y (18.19) es que sólo son válidas para soluciones ψn (x) de la ecuación de Schro-
dinger. A continuación calculamos ψ0 (x) con (18.19), con la hipótesis de que es la
función de onda correspondiente al estado de mı́nima energı́a. La afirmación de que
existe una energı́a mı́nima se basa en el hecho de que el potencial da lugar a una
fuerza que obliga a la partı́cula cuántica a moverse en una región
b− ψ0 = 0
A (18.46)
dψ0 1
x + x2 − E 0 + ψ0 = 0, (18.47)
dx 2
1 2
ψ0 (x) = xE0 − 2 e−x /2
, x ∈ R. (18.48)
244
Probabilidad, Estadı́stica y sus Aplicaciones
"
1 1 2 #
E0 − E0 −
dψ0 2 2
= − −1+ −x ψ0 . (18.49)
dx x2 x
dψ0 2 1
ψ0 = C1 ψ0 (x) Ld1 x2
ψ1 (x) = −x + x − E1 − (18.50)
dx 2
dψ1 1
+ x2 − E2 − ψ1 = C2 ψ0 (x) Ld2 x2
ψ2 (x) = −x (18.51)
dx 2
···
dψn−1 2 1
ψn−1 = Cn ψ0 (x) Ldn x2 (18.52)
ψn (x) = −x + x − En−1 −
dx 2
Z ∞ Z ∞
2
Cn2 ψ0 (x) Ldn x2 2 dx = 1.
|ψn (x)| dx = (18.53)
0 0
En = 2d + n + 1 (18.54)
2
ρ (x) = |ψn (x)| = ψn∗ (x) ψn (x) , x ∈ R. (18.55)
2 2
ρdn (x) = x4d+1 e−x Ldn x2
, x ∈ R. (18.56)
245
Probabilidad, Estadı́stica y sus Aplicaciones
D E Z b
Q
b = ψn∗ (x) Qψ
b n (x) dx. (18.57)
a
D E Z b
ψ0 (x) Ldn x2 Qψ
b 0 (x) Ldn x2 dx
Q
b = (18.58)
a
D E Z b
2
1
xE0 − 2 e−x /2 b E0 − 12 e−x2 /2 Ldn x2 dx
Ldn x2 Qx
Q
b = (18.59)
a
Esta fvrmula para el valor esperado de una cantidad fı́sica de una partı́cula
confinada por un potencial isotónico es el objetivo de este trabajo. Con (18.59) po-
demos calcular todos los valores que predice la mecánica cuántica para este sistema.
Para una aplicación de (18.59) hemos elegido la posición x. En este caso el operador
asociado a la posición es la misma variable x. Asói, la posición más probable de la
partı́cula en el estado n es la integral
Z ∞ d 2 2
2
hb
xin = x2E0 e−x Ln x dx (18.60)
0
Entonces
el valor esperado de la posición de la partı́cula en el estado base n = 0
y Ld0 x2 = 1 es:
Z ∞
2
hb
xin=0 = x2E0 e−x dx, (18.61)
Z0 ∞
2
hb
xi0 = x4d+2 e−x dx. (18.62)
0
Z ∞
Γ (x) = ux−1 e−u du. (18.63)
0
246
Probabilidad, Estadı́stica y sus Aplicaciones
1 3
hb
xi0 = Γ 2d + , d>0 (18.64)
2 2
Figura 18.2: Estado base: ρ00 (x) en rojo, ρ10 (x) en verde, ρ20 (x) en azul.
247
Probabilidad, Estadı́stica y sus Aplicaciones
2 2 2
Para la base n = 1 y Ld1 x2 = −x + d + 1 , el valor de la posición es
Z ∞ d 2 2
d 2
hb
xi1 = x4d+2 e−x L1 x dx (18.65)
0
d
reescribimos hb
xi1 , usando la función gamma
d 1 3 7
hb
xi1 = Γ 2d + d2 + 3d + , d > 0. (18.66)
2 2 4
d 7
1 3
xi1 = d2 + 3d +
Figura 18.3: Gráfica hb 4 2Γ 2d + 2 como función de d.
Figura 18.4: Estado n = 1: ρ01 (x) en negro, ρ11 (x) en rojo, ρ21 (x) en verde.
248
Probabilidad, Estadı́stica y sus Aplicaciones
1
4
Por otra parte si n = 2 y Ld2 x2 = 2 x − 2 (d + 2) x2 + (d + 1) (d + 2) . El
valor esperado es:
d 1 3 1 4 3 43 2 290
hb
xin=2 = Γ 2d + d + 2d + d + 6d + , d > 0. (18.67)
2 2 4 8 128
Valor
esperado de la posición n = 3 y
Ld3 x2 = − 61 x6 − 3 (d + 3) x4 + 3 (d + 2) (d + 3) x2 − (d + 1) (d + 2) (d + 3)
d 1 3 1 6 5 349 4 57 3 6427 2 1693 687
hb
xin=3 = Γ 2d + d + d5 + d + d + d + d+ .(18.68)
2 2 36 12 144 8 576 192 256
249
Probabilidad, Estadı́stica y sus Aplicaciones
d d d d
Figura 18.5: hb
xi0 en rojo, hb
xi1 en azul y hb
xi2 en verde y hb
xi3 en gris.
18.6. Conclusiones
En este trabajo hemos realizado dos contribuciones que creemos son originales:
la primera es el método de solución por operadores diferenciales de primer orden,
el cual simplifica bastante los cálculos de las funciones de onda, y que puede ser
aplicado a otros sistemas cuanticos. La segunda consiste en dar una expresión exacta
para calcular los valores mas probables de la posición x de la partı́cula en el estado
cuántico n. Nuestro principal interés es en el tema de soluciones exactas de la
ecuación de Schrodinger, y este trabajo se encuadra en él, aunque esperamos que
nuestra contribución tenga alguna utilidad práctica. Además se encuentra que d
tiene un papel importante en el aspecto probabilı́stico
250
Probabilidad, Estadı́stica y sus Aplicaciones
Bibliografı́a
251
Probabilidad, Estadı́stica y sus Aplicaciones
Capı́tulo 19
Análisis preliminar de la satisfacción laboral de un hospital del estado de Puebla
Resumen. Mejorar la seguridad del paciente ha llegado a ser uno de los ob-
jetivos clı́nicos y de investigación más importantes en las pasadas dos décadas y
actualmente, por consiguiente, en este trabajo de investigación se analiza la satis-
facción laboral vista como una dimensión esencial de la cultura de seguridad debido
a que la satisfacción laboral en general tiende a relacionarse con resultados positi-
vos y mayores ı́ndices de productividad. Por lo tanto, los objetivos de este estudio
son: llevar a cabo el análisis de la satisfacción laboral de un hospital del Estado de
Puebla, difundir el conocimiento, desarrollar y fortalecer esta lı́nea de investigación
en México. Para lo cual se llevo a cabo un estudio observacional del tipo transversal
con una muestra por conglomerados donde se pudo encuestar a más del 80 % del
personal (n = 30). Dentro de los hallazgos encontrados, se obtuvo una puntuación
media de la dimensión satisfacción laboral de 20,43±3,44 puntos en escala de Likert
de 25 puntos posibles, lo que indica que la satisfacción laboral es percibida como
positiva en el hospital en estudio sin llegar a ser completamente positiva, lo que
constituye un área de oportunidad para el hospital en estudio. Por otro lado, se
encontró una relación significativa entre la satisfacción laboral y algunas variables
sociodemográficas como por ejemplo los años trabajados en el hospital. Por lo que
podemos concluir que en el caso de esta investigación, la satisfacción laboral se per-
cibe más como una fortaleza que como una debilidad para el hospital en estudio,
pero que es necesario focalizar los esfuerzos en el área de oportunidad detectada a
fin de generar un proceso de mejora continua.
Abstract. Improving patient safety has become one of the most important cli-
nical and research objectives in the past two decades and today, therefore, in this
research work is analysed job satisfaction seen as an essential dimension of safety
culture because job satisfaction in general tends to be related to positive results
and higher productivity indexes. Therefore, the objectives of this study are: carry
out the analysis of job satisfaction of a hospital in the State of Puebla, dissemina-
te knowledge, develop and strengthen this line of research in Mexico. For which an
252
Probabilidad, Estadı́stica y sus Aplicaciones
observational study of the transversal type was carried out with a sample by conglo-
merates where it was possible to survey more than 80 % of the personnel (n = 30).
Among the findings, we obtained an average score of the satisfaction dimension of
20,43 ± 3,44 points on the Likert scale of 25 possible points, which indicates that
job satisfaction is perceived as positive in the hospital under study without being
completely positive, which constitutes an area of opportunity for the hospital under
study. On the other hand, a significant relationship was found between job satisfac-
tion and some socio-demographic variables such as the years worked in the hospital.
So we can conclude that in the case of this research, job satisfaction is perceived
more as a strength than as a weakness for the hospital under study, but that it is
necessary to focus efforts in the area of opportunity detected in order to generate a
process of continuous improvement.
19.1. Introducción
Mejorar la seguridad del paciente ha llegado a ser uno de los objetivos clı́nicos
y de investigación más importantes en las pasadas dos décadas y actualmente. Es
importante mejorar la seguridad del paciente para poder prevenir y minimizar el
riesgo, por ejemplo el inherente al sistema de salud en el que se presta la atención
médica en pro de salvaguardar la vida de los pacientes y el de prevenir y proteger
tanto a pacientes como al personal al servicio de la salud, siempre tomando en
cuenta el contexto sociocultural, tecnológico, económico, demográfico, etc., donde
se presta la atención sanitaria. Al respecto, debe mencionarse que en este trabajo
de investigación, la satisfacción laboral es vista como parte de una dimensión de
la cultura de seguridad. En este sentido, es importante mencionar que en algunas
investigaciones destacan que personas motivadas y satisfechas con su trabajo y
con la organización, aumentan su rendimiento y la calidad de los servicios que se
prestan (ver [1] y [2]), ası́ como también mencionan que la satisfacción laboral no
solo influye en la práctica laboral y en la calidad de servicio, sino que también es un
factor determinante en la satisfacción de los usuarios [2]. En este mismo sentido, es
importante señalar que algunos reportes cientı́ficos manifiestan que la falta de apoyo
social, la insatisfacción laboral, la percepción de niveles altos de estrés, entre otras,
son antecedentes de niveles altos del burnout [3]. Por otro lado, encontramos que
según algunas investigaciones a partir de los escritos de porter y Lawler y Locke,
se señala que en las teorı́as motivacionales, se basan en el concepto de discrepancia
o desajuste, es decir que la satisfacción depende del grado en que coincide lo que
un individuo busca en su trabajo con lo que realmente consigue de él, ası́, cuanto
mayor sea la distancia entre lo que se quiere conseguir y lo que se obtiene del trabajo,
menor será la satisfacción laboral [2].
Desde otra perspectiva, otro estudio menciona que la exposición prolongada
al estrés laboral está asociada al sı́ndrome de desgaste profesional, este desgaste
profesional está caracterizado por elevados niveles de agotamiento emocional, que se
253
Probabilidad, Estadı́stica y sus Aplicaciones
254
Probabilidad, Estadı́stica y sus Aplicaciones
19.2.3. Participantes
Para calificar para la inclusión, tanto el personal a jornada completa como el
personal de tiempo parcial tiene que haber trabajado en la unidad al menos un
mes antes de la administración del cuestionario. La ”regla de oro” que se aplica es
que todo el personal dentro de un área clı́nica, o bien influyen o son influenciados
por el ”ambiente de trabajo” en esa área clı́nica. Dentro del análisis estadı́stico y
con la finalidad de prevenir sesgos, las siguientes consideraciones fueron tomadas:
criterios de inclusión, exclusión y de eliminación. A continuación se describen bre-
vemente cada uno de ellos. El cuestionario fue suministrado uno por uno y de forma
voluntaria en el área de investigación por los investigadores, garantizando en todo
momento el anonimato a los encuestados.
255
Probabilidad, Estadı́stica y sus Aplicaciones
19.2.7. Limitaciones
En este rubro hubo limitaciones en cuanto a poder aplicar cuestionarios en di-
versos hospitales. Por ejemplo, en algunos hospitales se dio un protocolo de investi-
gación de acuerdo a sus normas internas; sin embargo, nunca emitieron respuesta,
ni dieron el permiso necesario para tener acceso a las instalaciones, etc.
19.3. Resultados
En la Figura 19.1, se puede observar el histograma de la satisfacción laboral de los
participantes encuestados del hospital en estudio, en el cual se tiene una puntuación
media de 20.43 puntos ±3.44 de un total de 25 puntos posibles en escala Likert, lo
que refleja una muy alta satisfacción laboral en general en el hospital en estudio.
Además, se llevo a cabo la Prueba de normalidad de Kolmogorov-Smirnov el cual
obtuvo un valor p > 0.192, y también se obtuvo el gráfico de normal esperado vs
valor observado,)véase la Figura 19.2, por lo que a partir de los resultados obtenidos
con esta prueba no se tiene evidencia suficiente para poder rechazar la normalidad.
Siguiendo con el análisis de los datos en la Tabla 19.1, se muestran los valores
de los estadı́sticos descriptivos de las variables analizadas: la satisfacción laboral
general, la edad actual, el estatus de trabajo, el puesto de trabajo, los años de expe-
riencia y los años trabajados en el hospital, de donde se tiene que la edad promedio
de los trabajadores fue de 36.20 ± 11.372 años, lo que indica que en promedio se
tiene una edad productiva adecuada en el hospital en estudio, en cuanto al estatus
de trabajo, se observa que el personal en promedio labora por tiempo completo y en
segundo lugar por medio tiempo, ası́ como también, los resultados indican que en
256
Probabilidad, Estadı́stica y sus Aplicaciones
257
Probabilidad, Estadı́stica y sus Aplicaciones
258
Probabilidad, Estadı́stica y sus Aplicaciones
Tabla 19.1: Estadı́sticos descriptivos de las variables socio demográficas que podrı́an
influir en la satisfacción laboral del hospital en estudio
Tabla 19.2: Muestra el Análisis de Varianza con las siguientes variables predictoras:
(Constante), años trabajados en el hospital, puesto, estatus de trabajo, edad actual,
años de experiencia. Y como variable dependiente: el total satisfacción en el trabajo.
Tabla 19.3: Se muestra la prueba de hipótesis la cual también nos sirve para ve-
rificar si existe relación entre cada una de las variables edad actual, estatus de
trabajo, puesto, años de experiencia y años trabajados en el hospital con la variable
satisfacción laboral.
259
Probabilidad, Estadı́stica y sus Aplicaciones
R2 2adj la cual es aún más baja y con la cual solo se podrı́a explicar el 36 % de la
variación observada en la satisfacción laboral que es explicada por el modelo, en
cuanto a la intensidad de la relación lineal entre las variables estudiadas se observa
una correlación lineal aceptable positiva r = 0.727.
Por último, siguiendo con el análisis se puede apreciar en la Figura 19.3 que
se tiene el diagrama de cajas y bigotes, donde se muestra que en general se tuvo
una satisfacción laboral (de ligero acuerdo) por parte del personal médico, de en-
fermerı́a y otros, pero también se observa que como oportunidad de mejora se tiene
la posibilidad de llegar al completo acuerdo en la escala de likert de la satisfacción
laboral. Por otro lado, se puede observar un comportamiento atı́pico en el área de
enfermerı́a que debe tenerse en cuenta para su estudio, dada la importancia que
tiene la satisfacción laboral en el personal al cuidado de la salud.
19.4. Discusión
Los resultados obtenidos nos permiten visualizar que en general, en el personal
al cuidado de la salud del hospital en estudio se percibe en ligero acuerdo a la
satisfacción laboral del personal, por lo que es motivo de oportunidad de mejora el
estudiar las causas por las cuales no se alcanza la completa satisfacción laboral, lo
que coincide con el reporte de Silvia Portero et. al. Por otro lado, puede observarse
que en general en los profesionales del área de enfermerı́a se percibe un nivel de
satisfacción ubicado en el ligero acuerdo, sin embargo es de llamar la atención la
percepción de un profesional del área de enfermerı́a debido a que puntúa de manera
atı́pica lo que refleja ligera insatisfacción con su puesto de trabajo. Pero que en
general se coincide con otros estudios en cuanto a qué algunos de los aspectos mejor
valorados por los profesionales de enfermerı́a fueron los que hacen referencia a la
experiencia, los años trabajando en el hospital, entre otros factores, como podrı́a ser
también, la variedad de las tareas que realiza en su trabajo y a la estabilidad de su
empleo [2]. En otros estudios han mencionado que las posibilidades de promoción
suelen mostrar valoraciones bajas y que eso es causa de insatisfacción desde hace
años ya que estudios de la década de los 90 referı́an insatisfacción en este aspecto
[2]. Sin embargo en este estudio no se considero esa variable, lo que deberı́a ser
considerado para estudios posteriores.
También se coincide con otros estudios en considerar como necesario desarrollar
la teorı́a de la motivación-mantenimento de la satisfacción en el trabajo (la polı́tica
organizacional, la supervisión técnica, las relaciones interpersonales con mandos,
entre compañeros y con subordinados, la retribución, la seguridad en el trabajo, la
vida personal, las condiciones laborales y el estatus) y factores de ”mantenimiento”
(necesidades psicológicas y sociales del trabajador) [1], con el fin de incrementar la
satisfacción laboral en las instituciones de salud.
Respecto a las caracterı́sticas sociodemográficas asociadas con la satisfacción,
en este estudio, no se observa una gran diferencia entre la satisfacción del personal
médico en comparación con el de enfermerı́a y con el de otros profesionales al servicio
de la salud (ej. Técnicos radiólogos), como lo sugieren otros estudios al apuntar que
la satisfacción aumenta con el nivel profesional [1].
Siguiendo con el análisis de este estudio, coincidimos con otros estudios en
señalar que la implantación y revisión periódica de la atención ofrecida a los ciuda-
260
Probabilidad, Estadı́stica y sus Aplicaciones
Tabla 19.4: Describe si las relaciones encontradas con el modelo de regresión lineal
múltiple, permiten hacer estimaciones con una precisión aceptable.
261
Probabilidad, Estadı́stica y sus Aplicaciones
19.5. Conclusiones
En general se percibe como una fortaleza la satisfacción laboral en el hospital
en estudio, por lo que es necesario focalizar el área de oportunidad detectada a fin
de generar un proceso de mejora continua. La satisfacción laboral es una dimensión
muy importante, dado que esta puede relacionarse con la mejor atención y trato
para el paciente y por lo tanto incidir directamente sobre la seguridad del paciente.
Es necesario llevar a cabo más estudios de la satisfacción laboral en el personal de
salud en hospitales mexicanos, ası́ como también ampliar los tópicos a explorar en
este tipo de investigaciones.
262
Probabilidad, Estadı́stica y sus Aplicaciones
Bibliografı́a
[3] PRECIADO M., POZOS E., COLUNGA C., VÁZQUEZ J., Y ÁVALOS
M. Relación Entre Factores Psicosociales, Agotamiento Emocional Laboral y
Burnout en Odontólogos Mexicanos. Universitas Psychologica, Vol.16 No. 2,
2017.
[4] PORTERO DE LA CRUZ S., VAQUERO ABELLÁN M. Desgaste pro-
fesional, estrés y satisfacción laboral del presonal de enfermerı́a en un hospital
universitario. Revista Latino-Americana de Enfermagem, Vol. 23 No. 3, 2015.
[5] ORTIZ ESPINOZA R.M., MUÑOZ JUÁREZ S., TORRES CARREÑO
E. Satisfacción de los usuarios de 15 hospitales de Hidalgo, México. Rev Esp
Salud Pública, Vol. 78 No. 4, 2004
263
Probabilidad, Estadı́stica y sus Aplicaciones
264
Probabilidad, Estadı́stica y sus Aplicaciones
Capı́tulo 20
Aplicación del modelo exponencial en hilados textiles
Ana Marı́a Islas Cortés1 , Gabriel Guillén Buendı́a2 y Yolanda Montoya Vargas1
1
Instituto Politécnico Nacional, ESIT,
AV. IPN s/n, U. P. Adolfo López Mateos, Lindavista,
07320 GAM, Ciudad de México, México.
2
Instituto Politécnico Nacional, ESIME,
Azcapotzalco. Av. De las Granjas No. 682, Santa Catarina,
02550, Azcapotzalco, Ciudad de México.
[email protected], yolanda [email protected], [email protected]
Resumen. En este estudio fue ajustado el modelo exponencial con ası́ntota
sobre datos de la variación del diámetro de un filamento de poliamida de tı́tulo
nominal de 25 tex (peso en gramos de 1,000 metros de filamento) en función de la
tensión aplicada. El ajuste numérico fue realizado mediante el método de mı́nimos
cuadrados no lineales, ası́ como dos técnicas de transformación lineal del modelo en
estudio. Se concluye que los ajustes numéricos resultaron significativos al 99 %.
Abstract. In this study the exponential model with asymptote was fitted on dia-
meter variations data of a 25 tex polyamide filaments nominal title (weight in grams
of 1,000 meters of filament) in function to applied tension. Numerical fit was made
using nonlinear least squares method, as well as two linear transformation techni-
ques of the model under study. It is concluded that numerical fit was significant at
99 %.
20.1. Introducción
El mejor conocimiento de las estructuras textiles a lo largo de la cadena de
producción permite que el consumidor final disponga de un producto que satisfaga
plenamente sus necesidades.
Varias caracterı́sticas o propiedades de hilados evolucionan como una función
exponencial, como es el caso de la contracción residual ( %) de un filamento de
poliéster de 17.0 tex con 68 multifilamentos que fue estirado en una máquina in-
dustrial a diversas temperaturas, se ilustra en la Figura 1. Es importante conocer
dicha propiedad porque nos indica la capacidad del material a deformarse cuando
265
Probabilidad, Estadı́stica y sus Aplicaciones
Las propiedades de las estructuras textiles han sido estudiadas mediante mode-
los matemáticos, en este estudio el objetivo fue ajustar el modelo exponencial a una
caracterı́stica de los hilados textiles.
266
Probabilidad, Estadı́stica y sus Aplicaciones
dφ
= −k (φ − φmin ) (20.1)
dσ
Donde:
φ es el diámetro del hilado, σ es la tensión aplicada al hilado, φmin es el diámetro
del hilado antes de romperse uando es sometido a una tensión deteminada, −k es
la constante de evolución del diámetro del hilado sometido a tensión.
Z φ∗ Z σ
dφ
= −k dσ (20.2)
φ0 φ − φmin 0
Integrando:
n
X 2
SSE = [φ∗ − φ ] (20.4)
i=1
267
Probabilidad, Estadı́stica y sus Aplicaciones
Es decir,
n
X 2
(φ0 − φmin ) e−k σ + φmin − φ
SSE = ]
i=1
La SSE tiene un mı́nimo, ocurre para valores que satisfacen las derivadas par-
ciales:
∂SSE ∂SSE ∂SSE
= = = 0
∂ (φ0 − φmin ) ∂k ∂φmin
n
X n
X n
X
(φ0 − φmin ) σ e−2kσ + φmin σ e−k σ = σ φ e−kσ
i=1 i=1 i=1
n
X n
X
(φ0 − φmin ) e−kσ + φmin n = φ
i=1 i=1
σ → φ (20.5)
σ0 → φ0
268
Probabilidad, Estadı́stica y sus Aplicaciones
σ0 = σ + τ
Aplicando la primera expresión (20.5) al modelo exponencial, se tiene:
φ 0 = φ e− kτ + φmin 1 − e− k τ
(20.8)
k = − LNτ(m) , φmin = 1 − eb−k τ
Corresponde a la transformación lineal del modelo exponencial expuesto en an-
tecedentes, aplicando regresión lineal simple a la columna transformación versus
variable respuesta, se obtuvo la pendiente de la recta e intersección al eje verti-
cal. Con ello, fue posible hallar el valor de κ y φmin , como se indicó en (20.8).
Finalmente, despejando de la expresión (20.3) el último término, se llega a:
φ − φmin
φ0 − φmin = (20.9)
e−k σ
Está completa la estimación numérica del modelo exponencial en estudio.
La otra técnica que permite hallar las constantes numéricas del modelo expo-
nencial es a través de tres puntos de apoyo leı́dos sobre la curva [5]. Es decir, dos
puntos sobre los extremos de la curva, el tercer punto es:
σ1 + σ2
P1 (σ1 , φ1 ) , P2 (σ2 , φ2 ) , P3 , φ3
2
El primer punto por estar colocado en la curva cumple:
φ1 φ2 − φ23
φmin = (20.13)
φ1 + φ2 − 2 φ3
269
Probabilidad, Estadı́stica y sus Aplicaciones
Con ello, fue posible realizar la transformación lineal del modelo exponencial:
270
Probabilidad, Estadı́stica y sus Aplicaciones
Figura 20.4.- La bondad del ajuste numérico sobre la variación del diámetro de
un filamento en función de la tensión aplicada, fue del 99 % de confianza estadı́stica
usando los mı́nimos cuadrados no lineales.
σ σ0 φ φ0
(g) (g) (mm) (mm)
2 20 0.353 0.298
5 23 0.344 0.295
8 26 0.324 0.293
11 29 0.312 0.29
14 32 0.308 0.288
17 35 0.304 0.286
Como los datos fueron igualmente espaciados sobre la curva, permite determinar
la constante de desplazamiento:
τ = σ 0 − σ = 18
Procediendo a aplicar regresión lineal simple a los datos de la tabla 20.2, según
la expresión (20.8). Los parámetros de la recta de regresión se indican en Figura
20.5.
271
Probabilidad, Estadı́stica y sus Aplicaciones
272
Probabilidad, Estadı́stica y sus Aplicaciones
Con ello, al aplicar regresión lineal simple a los datos de la tabla 20.1, de acuerdo
con la transformación lineal (20.14) se obtuvo Figura 20.7.
273
Probabilidad, Estadı́stica y sus Aplicaciones
20.4. Conclusiones
Las técnicas de transformación lineal del modelo exponencial aquı́ expuestas
condujeron a ajustes numéricos significativos al 99 % de confianza, muy similar a la
bondad de ajuste numérico obtenido con regresión no lineal. Las primeras tienen la
ventaja que pueden resolverse con el uso de una calculadora de bolsillo que disponga
de regresión lineal simple.
274
Probabilidad, Estadı́stica y sus Aplicaciones
Bibliografı́a
275
PROBABILIDAD, ESTADÍSTICA Y SUS APLICACIONES
Editores: