Combinacion 1
Combinacion 1
Combinacion 1
aleatorias
Clase nro. 5
CURSO 2010
Muestreos
• Los problemas que tratamos son estocásticos.
S.E.D. - Curso2010
1
Muestreos
• Generación de números aleatorios.
Se utilizan para obtener valores independientes de
variables aleatorias.
Muestreos
S.E.D. - Curso2010
2
Generación de números aleatorios
• Rol preponderante en el proceso de simulación.
• Para simular necesitamos de números aleatorios como
semillas para generar muestras de v.a.
• Características de un generador de nros aleatorios:
1) Muestrea valores de Distribución Uniforme.
2) Asegura la NO Correlación Serial.
3) Otras (Law y Kelton, 1992; Banks et. al., 2001).
S.E.D. - Curso2010
2) NO Correlación Serial.
La aparición de un número en la secuencia, no afecta la
probabilidad de sortear otro (o el mismo) número.
S.E.D. - Curso2010
3
Ejemplo
La sucesión 1,2,3,4,5,1,2,3,4,5...
podríamos decir es uniforme
pero
está correlacionada.
S.E.D. - Curso2010
Procedimientos para
generar números aleatorios
1. Utilización de tablas.
2. Dispositivos especiales.
3. Procedimientos, funciones que generan
números pseudoaleatorios.
S.E.D. - Curso2010
4
Tablas de números aleatorios
Se generan con métodos aleatorios puros mediante ruletas,
extracción de números al azar, dados, etc.
La secuencia generada se carga en la memoria de la
computadora. La compañía RAND (Research & Development)
publicó una tabla de un millón de números en 1955.
Ventajas: son números aleatorios puros.
Desventajas:
• la sucesión de números es finita.
• hay que cargar la tabla en memoria.
• ocupa mucha memoria (actualmente no es un problema).
S.E.D. - Curso2010
Dispositivos especiales
En base a algún circuito o mecanismo de la computadora (reloj
p.ej) se generan números que son puramente aleatorios.
5
Números pseudoaleatorios
Imitan los valores de una variable aleatoria uniforme. Cumplen
los tests de ajustes como si fueran esa variable aleatoria.
Se generan a través de una fórmula.
Se usan como semilla para generar valores de variables
aleatorias (discretas, continuas).
Pseudoaleatorios, porque se obtienen realizando un conjunto
de operaciones a partir del número generado en algún paso
anterior.
Ventaja: método muy veloz y barato.
Desventaja: son de período finito.
S.E.D. - Curso2010
Números pseudoaleatorios
Además:
4) deben ser secuencias largas y sin huecos
(densas)
5) algoritmos rápidos.
S.E.D. - Curso2010
6
Método Centros Cuadrados
Se elije un número, se lo eleva al cuadrado, luego se toman
los dígitos del centro como el siguiente número; y se repite el
procedimiento.
Ejemplo: 2061: 4247721
2477: 6135529
1355: ...
Desventaja: secuencia por lo general corta.
Este ejemplo, genera 34 números pasando luego a sortear
siempre 0. El 2500 genera siempre el 2500.
A veces, con grandes números se puede llegar a generar
secuencias de 100.000 números diferentes.
S.E.D. - Curso2010
7
Método Congruencial Lineal
Ejemplos:
a) a = 3, c = 0, m = 5 y n0 = 4; 2, 1, 3, 4, 2, 1 ....
b) a = 3, c = 0, m = 9 y n0 = 4; 3, 0, 0, ....
En el MCL, si se repite un número ya se repite toda la
secuencia.
Ventajas:
• utiliza poca memoria y es muy rápido.
• fácil de volver a generar la misma secuencia,
guardando un solo número, (alcanza con partir
desde la misma semilla: n0).
S.E.D. - Curso2010
8
Método Mersenne Twister (MT)
• Los generadores en base al método congruencial
lineal son muy utilizados, pero muchos de ellos
tienen un período mucho más corto que el que uno
desearía o necesita.
Donde:
X: entero de w bits.
⊕: XOR.
|: Concatenación de cadenas de bits.
Xj: fragmento de j bits de X. u son los bits más significativos y l los
menos significativos.
A: Matriz w × w.
n: grado de recurrencia con 1 ≤ m ≤ n
S.E.D. - Curso2010
9
Método Mersenne Twister
El método trabaja a más bajo nivel y por eso al utilizar operaciones
lógicas en cadenas de bits (XOR, AND, OR), entonces son generadores
rápidos.
Mt19937 es un ejemplo, tiene un periodo de 219937-1.
Ref.: http://en.wikipedia.org/wiki/Mersenne_twister#References
Homepage http://www.math.sci.hiroshima-u.ac.jp/~m-mat/MT/emt.html
S.E.D. - Curso2010
Streams (torrentes)
Un generador de números aleatorios que comience con
la misma semilla, siempre producirá el mismo torrente
o secuencia de números.
Diferentes semillas generarán diferentes secuencias. Si
las semillas se eligen con valores no cercanos (en el
ciclo del generador), entonces las secuencias de
números generados (torrentes) parecerán y actuarán
como números aleatorios independientes entre sí con lo
que colaborarán en la generación de v.a.
independientes entre sí.
S.E.D. - Curso2010
10
Streams (torrentes)
Al comparar los efectos de distintas políticas en un modelo, (p. ej el
número de camas) es importante que las corridas del modelo, se
ejecuten con los mismos valores (tiempos) en las actividades y las
variables de decisión (v.a.).
Cuando generamos muestras de una v.a., si utilizamos la misma
secuencia de números pseudo-aleatorios, generamos la misma
secuencia de valores (muestras) de esas v.a.
Para obtener valores esperados de las v.a., se realizan varias
corridas. En cada corrida deben ser usados diferentes torrentes de
números e independientes entre sí (n0 distinto para c/v.a.). El valor
de la muestra debe ser dado en un intervalo de confianza.
S.E.D. - Curso2010
Streams (torrentes)
Pascal Sim
make-stream: inicializa 32 streams.
original_seed: vector con las semillas iniciales.
seeds: vector con el valor actual de las semillas de cada stream.
Un stream puede ser reseteado individualmente:
seeds(j) := original_seeds(j).
function rnd (s : stream_num) : real;
genera el siguiente número de la secuencia, actualiza seed.
S.E.D. - Curso2010
11
Streams (torrentes)
EOSimulator
Las semillas se setean manualmente,
de forma centralizada
(Experiment::setSeed)
o individualmente
(Distribution::setSeed).
S.E.D. - Curso2010
12
Test de χ2
S.E.D. - Curso2010
Test de χ2
Construimos el (Y s − nPs ) 2
k
V =∑
estimador s =1 nPs
S.E.D. - Curso2010
13
Test de χ2
Se calcula V y se analiza el mismo utilizando la tabla de χ2
(Apéndice 5, Hillier y Lieberman) mediante el test de
significación siguiente:
• Si V > χ2(f) con f = k-1(valor de la tabla), rechazar la hipótesis.
• Si no, no rechazar la hipótesis.
Dado un nivel de significación (p.ej. de 0,05 equivalente al
95%) nos fijamos en la tabla el valor correspondiente a ese nivel
y para k-1 grados de libertad.
Si V > el valor crítico de la tabla se rechaza la hipótesis y si no,
no se rechaza.
S.E.D. - Curso2010
Ejemplo
Tirando 96 veces un dado se obtuvieron cantidades de 1s, 2s, etc:
15, 7, 9, 20, 26, 19.
Se desea saber si el dado es simétrico,
la hipótesis es que P1, P2, P3...., P6 = 1/6,
n = 96, Y1 =15, etc. n Pi = 16 suficientemente grande.
f = k-1 = 5. nivel de significación = 0.01 ; χ2(5) = 15.1
V = (15-16)2/16 + (7-16)2/16 + (9-16)2/16 +
(20-16)2/16 + (26-6)2/16 + (19 -16)2/16 = 16 > 15.1
Por lo tanto se rechaza la hipótesis. (se supone que el dado no es
simétrico)
S.E.D. - Curso2010
14
Test serial
S.E.D. - Curso2010
Test serial
Cada pareja tiene probabilidad
P(X 2j, X 2j+1) = 1/K²,
y tendremos K² categorías.
(que es la cantidad de combinaciones posibles de parejas de
números uniformes).
S.E.D. - Curso2010
15
Sorteos de variables aleatorias
General, Poisson.
S.E.D. - Curso2010
∑p
i =1
i =1
S.E.D. - Curso2010
16
Generación de v.a. discretas
Al intervalo i le corresponden aquellos valores xi que
cumplen:
i −1 i
∑
j=0
p j ≤ xi ≤ ∑ p j
j=0
S.E.D. - Curso2010
17
Ejemplo: v.a. discreta
Una v.a. X puede tomar los valores: rojo con prob. 1/6, azul con
prob. 1/3 y blanco con prob. 1/2.
Construyo el esquema:
Distribución Poisson
Cantidad de arribos en un intervalo de tiempo.
S.E.D. - Curso2010
18
Generación de v.a. continuas
x
Queremos generar valores de X v.a
con distribución:
FX ( x ) = ∫f
−∞
X ( t )dt
S.E.D. - Curso2010
Generación de v. a. continuas
U = Fx(X) X = Fx-1(U)
S.E.D. - Curso2010
19
Generación de v. a. continuas
S.E.D. - Curso2010
Método de la
Transformación Inversa
Problema:
aún cuando exista una expresión analítica de la inversa de la
distribución, su cálculo puede insumir cantidades importantes de
recursos y tiempo.
S.E.D. - Curso2010
20
Distribución Uniforme
x x
FX ( x ) = ∫ b−1 a dt y además u = ∫ b−1 a dt
a a
u = (x - a)/(b - a) , x = a + u(b - a)
x es U(a,b) con u v.a. U(0,1) (número pseudoaleatorio)
S.E.D. - Curso2010
Distribución Exponencial
Tiempos entre dos sucesos Poisson.
21
Distribución Normal
Actividades que varían estocásticamente alrededor de un valor
medio.
Ejemplo: tiempo que lleva arreglar una máquina con una falla
bien conocida.
Observar que esta distribución no debiera ser usada para
valores de tiempos, ya que no tiene cota inferior, puede tomar
valores negativos (los tiempos son positivos y tienen valor
mínimo 0 (cero)). Si se utiliza, deben eliminarse valores
negativos.
No existe expresión para la inversa, método de Box y Muller
(ver Davies y O’Keefe).
S.E.D. - Curso2010
22
Pascal Sim y EOSimulator
Pascal Sim:
function poisson (m: real; s : stream_num) : cardinal;
23
Muestreo de histogramas
Si los datos no se ajustan a ninguna distribución
conocida, las muestras deben tomarse de una distribución
de probabilidades derivada de un histograma de
frecuencias de actividades o tiempos de arribos.
S.E.D. - Curso2010
Muestreo de histogramas
Como una v.a discreta, utilizando las frecuencias
obtenidas (los porcentajes, fig 4.3).
24
Resumen
Los tiempos de actividades y los distintos criterios de decisión
son simulados mediante muestreo de distribuciones.
25
SIMULACIÓN DE
SISTEMAS
ING. OSCAR LEÓN GRANIZO, MSC.
INTRODUCCIÓN
La simulación es una técnica de análisis de sistemas.
Un sistema se define como un grupo de objetos que se encuentran relacionados por
algún tipo de interacción o interdependencia con el fin de cumplir un propósito
determinado.
Las aplicaciones de la simulación se centran en el estudio de los efectos que ocasionan
cambios en un sistema real y en el estudio del comportamiento de nuevos sistemas.
También se suelen utilizar en el análisis de las variables de control del sistema con el
objetivo de establecer los valores óptimos de las mismas.
Otras aplicaciones se centran en utilizar la simulación como instrumento pedagógico o
como entrenamiento de personal.
INTRODUCCIÓN
Los modelos de simulación se están convirtiendo en herramientas muy populares y
efectivas para el análisis de una gran variedad de problemas dinámicos.
Estos problemas suelen llevar asociados procesos complejos que no pueden
describirse analíticamente, debido a que suelen estar caracterizados por numerosas
interacciones entre sus componentes o entidades.
A veces, el comportamiento de estas entidades y sus interacciones pueden entenderse
y representarse matemáticamente con cierta fidelidad, aunque en general no es
posible.
Los modelos de simulación se diseñan para imitar el comportamiento de estos
sistemas .
INTRODUCCIÓN
Son representaciones o abstracciones matemáticas/lógicas de sistemas reales. Estos
modelos integran el comportamiento de entidades y sus interacciones para ofrecer una
descripción cuantitativa de las características del sistema. Estas representaciones pueden
tomar la forma de un software, pudiendo ejecutarse así en un ordenador.
Los usuarios de los simuladores de tráfico especifican una situación (configuración de la
red, demanda de tráfico) como entrada al modelo.
Los simuladores describen las simulaciones del sistema mediante dos formatos (estático y
gráfico). Los resultados numéricos ofrecen al analista una descripción cuantitativa de lo
que ocurre en el sistema.
Las gráficas y representaciones animadas de las funciones del sistema permiten
comprender y observar porqué el sistema se ha comportado así. Es responsabilidad del
analista interpretar correctamente la información y comprender las causas y efectos de las
relaciones.
USO
■ Sistemas de Computación: redes de ordenadores, componentes, programación, bases de
datos, fiabilidad.
■ Fabricación: manejo de materiales, líneas de montaje, equipos de almacenamiento, control de
inventario, mantenimiento, distribución en planta, diseño de máquinas.
■ Negocios: análisis de existencias, política de precios, estrategias de marketing, estudios de
adquisición, análisis de flujo de caja, predicción, alternativas del transporte, planificación de
mano de obra.
■ Gobierno: armamento y su uso, tácticas militares, predicción de la población, uso del suelo,
prevención de incendios, servicios de policía, justicia criminal, diseño de vías de comunicación,
servicios sanitarios.
■ Ecología y Medio Ambiente: contaminación y purificación del agua, control de residuos,
contaminación del aire, control de plagas, predicción del tiempo, análisis de sismos y
tormentas, exploración y explotación de minerales, sistemas de energía solar, explotación de
cultivos.
■ Sociedad y Comportamiento: estudios de alimentación de la población, políticas educativas,
estructuras organizativas, análisis de sistemas sociales, sistemas de asistencia social,
administración universitaria.
■ Biociencias: rendimiento en el deporte, control de epidemias, ciclos de vida biológicos,
estudios biomédicos.
Ventajas e inconvenientes
Las principales ventajas de la simulación son las siguientes:
■ Una vez que el modelo está construido, se puede utilizar repetidamente para analizar
cambios en el diseño o diversas políticas.
■ Suele ser menos costoso obtener datos de un proceso de simulación que de un
sistema real.
■ Los métodos de simulación son más fáciles de aplicar que los métodos analíticos.
■ Los modelos analíticos normalmente requieren asumir muchas simplificaciones para
hacerlos matemáticamente tratables. Los modelos de simulación no tienen estas
restricciones.
■ El entorno en el que se va a incluir el sistema puede ser controlado por el usuario.
■ Si se produce algún fallo en el diseño del sistema es más barato corregirlo en un
modelo simulado que en un sistema real.
Ventajas e inconvenientes
https://www.youtube.com/watch?v=ZvANa1aZCw0
MUESTREO
En ocasiones en que no es posible o conveniente realizar un
censo(analizar a todos los elementos de una población), se selecciona una
muestra, entendiendo por tal una parte representativa de la población.
El muestreo es por lo tanto una herramienta de la investigación científica,
cuya función básica es determinar que parte de una población debe
examinarse, con la finalidad de hacer inferencias sobre dicha población.
La muestra debe lograr una representación adecuada de la población, en
la que se reproduzca de la mejor manera los rasgos esenciales de dicha
población que son importantes para la investigación. Para que una
muestra sea representativa, y por lo tanto útil, debe de reflejar las
similitudes y diferencias encontradas en la población, es decir ejemplificar
las características de ésta.
MUESTREO
Los errores más comunes que se pueden cometer son:
1.-Hacer conclusiones muy generales a partir de la observación de sólo
una parte de la Población, se denomina error de muestreo.
2.-Hacer conclusiones hacia una Población mucho más grandes de la que
originalmente se tomo la muestra. Error de Inferencia.
Muestreo probabilístico
Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma
probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas
las posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo
estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra
extraída y son, por tanto, los más recomendables.
TIPO DE MUESTREO
Muestreo probabilístico
Solución:
x6 = (x5+x1) mod 100 = (69+65)mod100 = 34 r1=34/99=0.3434
x7 = (x6+x2) mod 100 = (34+89)mod100 = 23 r2=23/99=0.2323
x8 = (x7+x3) mod 100 = (23+98)mod100 = 21 r3=21/99=0.2121
x9 = (x8+x4) mod 100 = (21+03)mod100 = 24 r4=24/99=0.2424
x10 = (x9+x5) mod 100 = (24+69)mod100 = 93 r5=93/99=0.9393
x11 = (x10+x6)mod 100 =(93+34)mod100 = 27 r6=27/99=0.2727
x12 = (x11+x7)mod 100 =(27+23)mod100 = 50 r7=50/99=0.5050
Método Congruencial Multiplicativo
La ventaja de este método es que en comparación con el algoritmo lineal es que este
implica una operación menos.
Método Congruencial Multiplicativo
Los parámetros de arranque de este algoritmo son Xo, a y m, todos los cuales
deben ser números enteros y mayores que cero. Para transformar los números Xi
en el intervalo (0,1) sea la ecuación:
■ ri = xi/(m-1).
Las condiciones que deben cumplir los parámetros para que el algoritmo
congruencial multiplicativo alcance su máximo periodo son:
a= 3 + 8k
O a = 5 + 8k k= 0,1,2,3,… A partir de estas condiciones se logra un período de
vida máximo.
a= 5 + 8(2) = 21 y m = 32
Xo= 17
X1 = (21*17) mod 32 = 5 r1 = 5/31 = 0.1612
X2 = (21*5) mod 32 = 9 r1 = 9/31 = 0.2903
X3 = (21*9) mod 32 = 29 r1 = 29/31 = 0.9354
X4 = (21*29) mod 32 = 1 r1 = 1/31 = 0.3225
X5 = (21*1) mod 32 = 21 r1 = 21/31 = 0.6774
X6 = (21*21) mod 32 = 25 r1 = 25/31 = 0.8064
X7 = (21*25) mod 32 = 13 r1 = 13/31 = 0.4193
X8 = (21*13) mod 32 = 17 r1 = 17/31 = 0.5483
Método Congruencial Mixto
EJEMPLO EN EXCEL