Combinacion 1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 61

Muestreo de variables

aleatorias
Clase nro. 5
CURSO 2010

Muestreos
• Los problemas que tratamos son estocásticos.

• No podemos predecir la conducta de los elementos del


sistema, pero sí podemos enumerar los resultados
posibles de ellas.

• Entonces utilizamos técnicas de muestreo de


distribuciones.

S.E.D. - Curso2010

1
Muestreos
• Generación de números aleatorios.
Se utilizan para obtener valores independientes de
variables aleatorias.

• Muestreo de variables aleatorias.


Se obtienen a partir de números aleatorios.

• Muestreo a partir de histogramas.


Cuando los datos no se pueden ajustar a ninguna
distribución teórica paramétrica, se utiliza la
frecuencia relativa de las observaciones, representadas
por histogramas (distribuciones empíricas).
S.E.D. - Curso2010

Muestreos

• Para simular el comportamiento del sistema utilizamos valores


de las variables aleatorias (muestreados, sorteados).

• Si queremos observar el comportamiento general del sistema


alcanza con realizar una sola corrida.

• Si queremos obtener medidas o valores estadísticamente


válidos deben realizarse varias corridas con distintos números
aleatorios que generarán distintos valores de las distribuciones
muestreadas.

S.E.D. - Curso2010

2
Generación de números aleatorios
• Rol preponderante en el proceso de simulación.
• Para simular necesitamos de números aleatorios como
semillas para generar muestras de v.a.
• Características de un generador de nros aleatorios:
1) Muestrea valores de Distribución Uniforme.
2) Asegura la NO Correlación Serial.
3) Otras (Law y Kelton, 1992; Banks et. al., 2001).

S.E.D. - Curso2010

Propiedades de los Números


Aleatorios
1) Distribución Uniforme.
Cualquier número que pertenezca al rango de interés debe
tener la misma probabilidad de resultar sorteado.

2) NO Correlación Serial.
La aparición de un número en la secuencia, no afecta la
probabilidad de sortear otro (o el mismo) número.

S.E.D. - Curso2010

3
Ejemplo

La sucesión 1,2,3,4,5,1,2,3,4,5...
podríamos decir es uniforme
pero
está correlacionada.

Existen Tests que verifican las condiciones de


uniformidad y correlación serial.

S.E.D. - Curso2010

Procedimientos para
generar números aleatorios

1. Utilización de tablas.
2. Dispositivos especiales.
3. Procedimientos, funciones que generan
números pseudoaleatorios.

S.E.D. - Curso2010

4
Tablas de números aleatorios
Se generan con métodos aleatorios puros mediante ruletas,
extracción de números al azar, dados, etc.
La secuencia generada se carga en la memoria de la
computadora. La compañía RAND (Research & Development)
publicó una tabla de un millón de números en 1955.
Ventajas: son números aleatorios puros.
Desventajas:
• la sucesión de números es finita.
• hay que cargar la tabla en memoria.
• ocupa mucha memoria (actualmente no es un problema).

S.E.D. - Curso2010

Dispositivos especiales
En base a algún circuito o mecanismo de la computadora (reloj
p.ej) se generan números que son puramente aleatorios.

El método básicamente consiste en interrumpir un proceso


uniforme aleatoriamente. Es esencialmente lo que ocurre
cuando la bola cae en un casillero de la ruleta.

Ventajas: son números aleatorios puros.


Desventajas: si se desea generar la misma secuencia más de una
vez, es necesario grabarla, no siempre podremos repetir la
misma secuencia en caso de ser necesario.
S.E.D. - Curso2010

5
Números pseudoaleatorios
Imitan los valores de una variable aleatoria uniforme. Cumplen
los tests de ajustes como si fueran esa variable aleatoria.
Se generan a través de una fórmula.
Se usan como semilla para generar valores de variables
aleatorias (discretas, continuas).
Pseudoaleatorios, porque se obtienen realizando un conjunto
de operaciones a partir del número generado en algún paso
anterior.
Ventaja: método muy veloz y barato.
Desventaja: son de período finito.

S.E.D. - Curso2010

Números pseudoaleatorios

Tanto la secuencias como las subsecuencias de los


números generados deben cumplir las hipótesis de:
1) Distribución Uniforme.
2) Independencia (no correlación serial).

Además:
4) deben ser secuencias largas y sin huecos
(densas)
5) algoritmos rápidos.
S.E.D. - Curso2010

6
Método Centros Cuadrados
Se elije un número, se lo eleva al cuadrado, luego se toman
los dígitos del centro como el siguiente número; y se repite el
procedimiento.
Ejemplo: 2061: 4247721
2477: 6135529
1355: ...
Desventaja: secuencia por lo general corta.
Este ejemplo, genera 34 números pasando luego a sortear
siempre 0. El 2500 genera siempre el 2500.
A veces, con grandes números se puede llegar a generar
secuencias de 100.000 números diferentes.
S.E.D. - Curso2010

Método Congruencial Lineal


Este es el método utilizado por excelencia.

Se basa en la siguiente recurrencia:


ni = (a · ni-1 + c) mod m = f (ni-1)
Si se quiere obtener números Uniformes en
(0,1) se normaliza el resultado:
Ui = ni / m
S.E.D. - Curso2010

7
Método Congruencial Lineal
Ejemplos:
a) a = 3, c = 0, m = 5 y n0 = 4; 2, 1, 3, 4, 2, 1 ....
b) a = 3, c = 0, m = 9 y n0 = 4; 3, 0, 0, ....
En el MCL, si se repite un número ya se repite toda la
secuencia.

Ventajas:
• utiliza poca memoria y es muy rápido.
• fácil de volver a generar la misma secuencia,
guardando un solo número, (alcanza con partir
desde la misma semilla: n0).
S.E.D. - Curso2010

Método Congruencial Lineal


Importante: la velocidad de generación, y por sobre todo el
largo de la secuencia dependen de la elección de las constantes a,
c, m y la semilla n0.

Reglas que aseguran un ciclo maximal (Knuth):


1) c y m deben ser primos relativos (sin factores comunes)
2) si p es factor primo de m, entonces elegir a = 1 (mod p)
3) si 4 es factor de m, elegir a = 1(mod 4)
Pascal-SIM genera según la precisión de la computadora:
16-bit: ni+1 = f(ni) = (3993·n i + 1) mod 32 767
32-bit: ni+1 = f(ni) = (16 807·n i + 0) mod 2147 483 647
S.E.D. - Curso2010

8
Método Mersenne Twister (MT)
• Los generadores en base al método congruencial
lineal son muy utilizados, pero muchos de ellos
tienen un período mucho más corto que el que uno
desearía o necesita.

• En 1997, Matsumoto presentó los generadores MT


Son de período “largo” y “rápidos”.

• Hay varias implementaciones y es utilizado para


SED y Monte Carlo.

• Este método es el usado por EoSimulator.


S.E.D. - Curso2010

Método Mersenne Twister


Utiliza N celdas para generar los números aleatorios, bajo la siguiente
recurrencia:

Xk+n = Xk+m ⊕ (Xuk|Xlk+1)A, (k = 0, 1,…) (I)

Donde:
X: entero de w bits.
⊕: XOR.
|: Concatenación de cadenas de bits.
Xj: fragmento de j bits de X. u son los bits más significativos y l los
menos significativos.
A: Matriz w × w.
n: grado de recurrencia con 1 ≤ m ≤ n

S.E.D. - Curso2010

9
Método Mersenne Twister
El método trabaja a más bajo nivel y por eso al utilizar operaciones
lógicas en cadenas de bits (XOR, AND, OR), entonces son generadores
rápidos.
Mt19937 es un ejemplo, tiene un periodo de 219937-1.

El método ha sido validado y ha pasado tests exigentes (Die Hard;


Marsaglia, 1985).

Ref.: http://en.wikipedia.org/wiki/Mersenne_twister#References

Homepage http://www.math.sci.hiroshima-u.ac.jp/~m-mat/MT/emt.html

S.E.D. - Curso2010

Streams (torrentes)
Un generador de números aleatorios que comience con
la misma semilla, siempre producirá el mismo torrente
o secuencia de números.
Diferentes semillas generarán diferentes secuencias. Si
las semillas se eligen con valores no cercanos (en el
ciclo del generador), entonces las secuencias de
números generados (torrentes) parecerán y actuarán
como números aleatorios independientes entre sí con lo
que colaborarán en la generación de v.a.
independientes entre sí.
S.E.D. - Curso2010

10
Streams (torrentes)
Al comparar los efectos de distintas políticas en un modelo, (p. ej el
número de camas) es importante que las corridas del modelo, se
ejecuten con los mismos valores (tiempos) en las actividades y las
variables de decisión (v.a.).
Cuando generamos muestras de una v.a., si utilizamos la misma
secuencia de números pseudo-aleatorios, generamos la misma
secuencia de valores (muestras) de esas v.a.
Para obtener valores esperados de las v.a., se realizan varias
corridas. En cada corrida deben ser usados diferentes torrentes de
números e independientes entre sí (n0 distinto para c/v.a.). El valor
de la muestra debe ser dado en un intervalo de confianza.

S.E.D. - Curso2010

Streams (torrentes)
Pascal Sim
make-stream: inicializa 32 streams.
original_seed: vector con las semillas iniciales.
seeds: vector con el valor actual de las semillas de cada stream.
Un stream puede ser reseteado individualmente:
seeds(j) := original_seeds(j).
function rnd (s : stream_num) : real;
genera el siguiente número de la secuencia, actualiza seed.

S.E.D. - Curso2010

11
Streams (torrentes)
EOSimulator
Las semillas se setean manualmente,

de forma centralizada

(Experiment::setSeed)

o individualmente

(Distribution::setSeed).

Cada instancia de distribución tiene su propio generador


de números pseudoaleatorios (que genera su propio
torrente).
S.E.D. - Curso2010

Tests: Uniformidad e Independencia


Test de χ2
Utilizado para probar la uniformidad de la secuencia de los
números pseudoaleatorios (válido para ajustar otras funciones
de distribución).

El método consiste en tomar n observaciones independientes


de la variable aleatoria (en nuestro caso los números
generados), que llamaremos
X1, X2, ... , Xn

S.E.D. - Curso2010

12
Test de χ2

El intervalo en el que varía la variable aleatoria se divide en K


categorías,
Se conoce la probabilidad (teórica) Ps de que la v.a. muestree
en cada categoría s.
Sea Ys la cantidad de valores de Xi pertenecientes a la
categoría s. Entonces:
Y1 + Y2 + ... + Yk = n
P1 + P2 + ... + Pk = 1

S.E.D. - Curso2010

Test de χ2

Construimos el (Y s − nPs ) 2
k
V =∑
estimador s =1 nPs

Se demuestra que V es una v.a. con distribución χ2 con k-1


grados de libertad para n (n debe ser grande para que el test
sea válido).
Además, se debe cumplir que nPs > 5 (por lo menos 5
observaciones en cada categoría).

S.E.D. - Curso2010

13
Test de χ2
Se calcula V y se analiza el mismo utilizando la tabla de χ2
(Apéndice 5, Hillier y Lieberman) mediante el test de
significación siguiente:
• Si V > χ2(f) con f = k-1(valor de la tabla), rechazar la hipótesis.
• Si no, no rechazar la hipótesis.
Dado un nivel de significación (p.ej. de 0,05 equivalente al
95%) nos fijamos en la tabla el valor correspondiente a ese nivel
y para k-1 grados de libertad.
Si V > el valor crítico de la tabla se rechaza la hipótesis y si no,
no se rechaza.

S.E.D. - Curso2010

Ejemplo
Tirando 96 veces un dado se obtuvieron cantidades de 1s, 2s, etc:
15, 7, 9, 20, 26, 19.
Se desea saber si el dado es simétrico,
la hipótesis es que P1, P2, P3...., P6 = 1/6,
n = 96, Y1 =15, etc. n Pi = 16 suficientemente grande.
f = k-1 = 5. nivel de significación = 0.01 ; χ2(5) = 15.1
V = (15-16)2/16 + (7-16)2/16 + (9-16)2/16 +
(20-16)2/16 + (26-6)2/16 + (19 -16)2/16 = 16 > 15.1
Por lo tanto se rechaza la hipótesis. (se supone que el dado no es
simétrico)
S.E.D. - Curso2010

14
Test serial

Sirve para probar la correlación serial de la secuencia de


números observados.
Se agrupa la muestra en pares de valores los cuales estarán
distribuídos uniformemente e independientes entre sí, en caso
de verificar el test.
La muestra será de 2n valores.
Se consideran las n parejas X2j, X 2j+1 con 0 < j <n
(X0,X1) (X2,X3) ........ (X2n-2,X2n-1)
1 2 n-1

S.E.D. - Curso2010

Test serial
Cada pareja tiene probabilidad
P(X 2j, X 2j+1) = 1/K²,
y tendremos K² categorías.
(que es la cantidad de combinaciones posibles de parejas de
números uniformes).

Se aplica el test de χ2 con K²-1 grados de libertad con el mismo


criterio que definimos anteriormente.

S.E.D. - Curso2010

15
Sorteos de variables aleatorias

• Variables aleatorias discretas.

General, Poisson.

• Variables aleatorias continuas.


Exponencial negativa, Normal, log Normal.

S.E.D. - Curso2010

Generación de v.a. discretas


X es un v.a. que puede tomar los valores x1, x2, ... , xn,
con probabilidad respectiva p1, p2, ... , pn.
Dividimos el intervalo [0,1] en intervalos de longitud
p1, p2, .......pn, donde se cumple
n

∑p
i =1
i =1

S.E.D. - Curso2010

16
Generación de v.a. discretas
Al intervalo i le corresponden aquellos valores xi que
cumplen:
i −1 i


j=0
p j ≤ xi ≤ ∑ p j
j=0

Sorteo de una muestra de X


1. Se toma un valor u = U(0,1).
2. Tomamos el punto y = u.
3. Si este punto aparece en el intervalo correspondiente al
número i aceptamos que X= xi en este sorteo.
S.E.D. - Curso2010

Generación de v.a. discretas


Validez del método:
la probabilidad de que u pertenezca a uno de los intervalos es
igual a la longitud del mismo, ya que u es U(0,1).
P(0 < u < p1) = p1
P(p1 < u < p1+p2) = p2
.
.
P(1-pn < u < 1) = pn

S.E.D. - Curso2010

17
Ejemplo: v.a. discreta
Una v.a. X puede tomar los valores: rojo con prob. 1/6, azul con
prob. 1/3 y blanco con prob. 1/2.
Construyo el esquema:

Sorteo u = 0,1212 X = rojo


0,9432 blanco
0,6111 blanco
0,4343 azul
S.E.D. - Curso2010

Distribución Poisson
Cantidad de arribos en un intervalo de tiempo.

Función de probabilidad f(x) = λx exp(-λ)/x!

Función de distribución cumple F(x+1) = F(x) + f(x+1),


propiedad que se utiliza para la obtención de muestras (Ver
seudocódigo en Davies y O’Keefe)

S.E.D. - Curso2010

18
Generación de v.a. continuas
x
Queremos generar valores de X v.a
con distribución:
FX ( x ) = ∫f
−∞
X ( t )dt

Método de la transformación inversa.


Se iguala la función de distribución de X, a una v.a. U uniforme
(0,1).
U = Fx(X) X = Fx-1(U)
El problema se reduce a encontrar una expresión analítica de la
función inversa, de modo de despejar X en función de U.

S.E.D. - Curso2010

Generación de v. a. continuas

U = Fx(X) X = Fx-1(U)

Generamos una v.a. U de distribución U(0,1), según los


métodos de sorteo de números aleatorios (pseudoaleatorios).
Encontramos una expresión analítica de la función inversa; la
resolvemos en función de los valores sorteados de U.

S.E.D. - Curso2010

19
Generación de v. a. continuas

Si F(x) es continua y estrictamente creciente,


0 < F(x) < 1, entonces la función inversa siempre existe.
Interpretación Geométrica:

S.E.D. - Curso2010

Método de la
Transformación Inversa

Problema:
aún cuando exista una expresión analítica de la inversa de la
distribución, su cálculo puede insumir cantidades importantes de
recursos y tiempo.

S.E.D. - Curso2010

20
Distribución Uniforme

v.a. Uniforme U(a,b) f(x) = 1/(b - a)

x x
FX ( x ) = ∫ b−1 a dt y además u = ∫ b−1 a dt
a a

u = (x - a)/(b - a) , x = a + u(b - a)
x es U(a,b) con u v.a. U(0,1) (número pseudoaleatorio)

S.E.D. - Curso2010

Distribución Exponencial
Tiempos entre dos sucesos Poisson.

Fx(x) = 1 - e-λx ⇒ u = 1 - e-λx ⇒ e-λx = 1 - u ⇒


-λx = ln(1 - u) ⇒ x = - 1/λ ln(u)
(1 - u) es equivalente a u (u es U(0,1)).

Entonces x = - 1/λ ln(u) es una muestra de una v.a.


exponencial de parámetro λ, a partir de un muestra u
v.a. U (0,1) (número pseudoaleatorio).
S.E.D. - Curso2010

21
Distribución Normal
Actividades que varían estocásticamente alrededor de un valor
medio.
Ejemplo: tiempo que lleva arreglar una máquina con una falla
bien conocida.
Observar que esta distribución no debiera ser usada para
valores de tiempos, ya que no tiene cota inferior, puede tomar
valores negativos (los tiempos son positivos y tienen valor
mínimo 0 (cero)). Si se utiliza, deben eliminarse valores
negativos.
No existe expresión para la inversa, método de Box y Muller
(ver Davies y O’Keefe).
S.E.D. - Curso2010

Distribución log Normal


Usada para describir tiempos en filas de espera.

Tiene dos parámetros media m y desviación est. s.

Una muestra es log Normal, si su logaritmo


corresponde a una muestra N(µ,σ), sus parámetros se
relacionan de la siguiente manera:

µ = loge m - 1/2 loge [(s/m)2 +1]


σ2 = loge [(s/m)2 +1)

Nota: error en el libro Davies y O’Keefe.


S.E.D. - Curso2010

22
Pascal Sim y EOSimulator
Pascal Sim:
function poisson (m: real; s : stream_num) : cardinal;

function rnd (s : stream_num) : real;

function uniform (l, h : real; s : stream_num) : real;

function negexp (m: real; s : stream_num) : real;

function normal (m, sd : real; s : stream_num) : real;

function log_normal (m, sd : real; s : stream_num) : real;


S.E.D. - Curso2010

Pascal Sim y EOSimulator


EOSimulator:
• Clase abstracta Distribution con operaciones sample
(abstracta) y setSeed. Constructor recibe el generador de
números pseudoaleatorios a utilizarse (representado por un
label).
• Una clase concreta por cada distribución, define métodos
para sample.
• Distribuciones disponibles:
•LogNormalDist
•NegexpDist
•NormalDist
•PoissonDist
•UniformDist
S.E.D. - Curso2010

23
Muestreo de histogramas
Si los datos no se ajustan a ninguna distribución
conocida, las muestras deben tomarse de una distribución
de probabilidades derivada de un histograma de
frecuencias de actividades o tiempos de arribos.

Ver libro página 75.

S.E.D. - Curso2010

Muestreo de histogramas
Como una v.a discreta, utilizando las frecuencias
obtenidas (los porcentajes, fig 4.3).

Muestrear de la función acumulativa escalonada


(equivalente anterior) (fig 4.4).

Muestrear en rango de tiempo continuo, mediante


distribución acumulada continua (fig 4.5).

Si u está entre F(x) y F(x+1) ⇒ s está entre x y x+1

la distancia de s a x está en proporción a la distancia de u


a F(x) entonces s = x + (u-F(x))/(F(x+1) - F(x))
S.E.D. - Curso2010

24
Resumen
Los tiempos de actividades y los distintos criterios de decisión
son simulados mediante muestreo de distribuciones.

Los generadores de números pseudaleatorios proveen Streams de


números en el rango de (0,1) Uniformes independientes y no
correlacionados.

El método de transformación inversa se utiliza para para


muestrear valores de distribuciones o de histogramas de
frecuencias.

Otros métodos: Normal (Box-Muller), Log Normal.


S.E.D. - Curso2010

25
SIMULACIÓN DE
SISTEMAS
ING. OSCAR LEÓN GRANIZO, MSC.
INTRODUCCIÓN
La simulación es una técnica de análisis de sistemas.
Un sistema se define como un grupo de objetos que se encuentran relacionados por
algún tipo de interacción o interdependencia con el fin de cumplir un propósito
determinado.
Las aplicaciones de la simulación se centran en el estudio de los efectos que ocasionan
cambios en un sistema real y en el estudio del comportamiento de nuevos sistemas.
También se suelen utilizar en el análisis de las variables de control del sistema con el
objetivo de establecer los valores óptimos de las mismas.
Otras aplicaciones se centran en utilizar la simulación como instrumento pedagógico o
como entrenamiento de personal.
INTRODUCCIÓN
Los modelos de simulación se están convirtiendo en herramientas muy populares y
efectivas para el análisis de una gran variedad de problemas dinámicos.
Estos problemas suelen llevar asociados procesos complejos que no pueden
describirse analíticamente, debido a que suelen estar caracterizados por numerosas
interacciones entre sus componentes o entidades.
A veces, el comportamiento de estas entidades y sus interacciones pueden entenderse
y representarse matemáticamente con cierta fidelidad, aunque en general no es
posible.
Los modelos de simulación se diseñan para imitar el comportamiento de estos
sistemas .
INTRODUCCIÓN
Son representaciones o abstracciones matemáticas/lógicas de sistemas reales. Estos
modelos integran el comportamiento de entidades y sus interacciones para ofrecer una
descripción cuantitativa de las características del sistema. Estas representaciones pueden
tomar la forma de un software, pudiendo ejecutarse así en un ordenador.
Los usuarios de los simuladores de tráfico especifican una situación (configuración de la
red, demanda de tráfico) como entrada al modelo.
Los simuladores describen las simulaciones del sistema mediante dos formatos (estático y
gráfico). Los resultados numéricos ofrecen al analista una descripción cuantitativa de lo
que ocurre en el sistema.
Las gráficas y representaciones animadas de las funciones del sistema permiten
comprender y observar porqué el sistema se ha comportado así. Es responsabilidad del
analista interpretar correctamente la información y comprender las causas y efectos de las
relaciones.
USO
■ Sistemas de Computación: redes de ordenadores, componentes, programación, bases de
datos, fiabilidad.
■ Fabricación: manejo de materiales, líneas de montaje, equipos de almacenamiento, control de
inventario, mantenimiento, distribución en planta, diseño de máquinas.
■ Negocios: análisis de existencias, política de precios, estrategias de marketing, estudios de
adquisición, análisis de flujo de caja, predicción, alternativas del transporte, planificación de
mano de obra.
■ Gobierno: armamento y su uso, tácticas militares, predicción de la población, uso del suelo,
prevención de incendios, servicios de policía, justicia criminal, diseño de vías de comunicación,
servicios sanitarios.
■ Ecología y Medio Ambiente: contaminación y purificación del agua, control de residuos,
contaminación del aire, control de plagas, predicción del tiempo, análisis de sismos y
tormentas, exploración y explotación de minerales, sistemas de energía solar, explotación de
cultivos.
■ Sociedad y Comportamiento: estudios de alimentación de la población, políticas educativas,
estructuras organizativas, análisis de sistemas sociales, sistemas de asistencia social,
administración universitaria.
■ Biociencias: rendimiento en el deporte, control de epidemias, ciclos de vida biológicos,
estudios biomédicos.
Ventajas e inconvenientes
Las principales ventajas de la simulación son las siguientes:

■ Una vez que el modelo está construido, se puede utilizar repetidamente para analizar
cambios en el diseño o diversas políticas.
■ Suele ser menos costoso obtener datos de un proceso de simulación que de un
sistema real.
■ Los métodos de simulación son más fáciles de aplicar que los métodos analíticos.
■ Los modelos analíticos normalmente requieren asumir muchas simplificaciones para
hacerlos matemáticamente tratables. Los modelos de simulación no tienen estas
restricciones.
■ El entorno en el que se va a incluir el sistema puede ser controlado por el usuario.
■ Si se produce algún fallo en el diseño del sistema es más barato corregirlo en un
modelo simulado que en un sistema real.
Ventajas e inconvenientes

No obstante, la simulación también presenta una serie de inconvenientes:

■ Es una técnica imprecisa, por ser aproximada. Se estudia un modelo, no el


sistema real.

■ Aumentar la precisión implica aumentar la complejidad del modelo. Esto implica


un mayor coste de diseño.
■ Pueden ser necesarias numerosas ejecuciones de la simulación, lo que implica
un mayor coste de operación.

■ Los usuarios que están acostumbrados a utilizar la simulación pueden despreciar


el uso de técnicas analíticas aun en situaciones en las que estas últimas son
apropiadas y suficientes.
CONCLUSIÓN

En general la simulación se debe usar cuando el modelo no se puede


resolver mediante técnicas analíticas, o cuando las hipótesis
simplificativas del modelo analítico no reflejan suficientemente el
sistema real.
En resumen, la simulación se puede considerar una herramienta muy
útil en al análisis de todo tipo de procesos y tareas de diseño y operación
de sistemas complejos.

https://www.youtube.com/watch?v=ZvANa1aZCw0
MUESTREO
En ocasiones en que no es posible o conveniente realizar un
censo(analizar a todos los elementos de una población), se selecciona una
muestra, entendiendo por tal una parte representativa de la población.
El muestreo es por lo tanto una herramienta de la investigación científica,
cuya función básica es determinar que parte de una población debe
examinarse, con la finalidad de hacer inferencias sobre dicha población.
La muestra debe lograr una representación adecuada de la población, en
la que se reproduzca de la mejor manera los rasgos esenciales de dicha
población que son importantes para la investigación. Para que una
muestra sea representativa, y por lo tanto útil, debe de reflejar las
similitudes y diferencias encontradas en la población, es decir ejemplificar
las características de ésta.
MUESTREO
Los errores más comunes que se pueden cometer son:
1.-Hacer conclusiones muy generales a partir de la observación de sólo
una parte de la Población, se denomina error de muestreo.
2.-Hacer conclusiones hacia una Población mucho más grandes de la que
originalmente se tomo la muestra. Error de Inferencia.

En la estadística se usa la palabra población para referirse no sólo a


personas si no a todos los elementos que han sido escogidos para su
estudio y el término muestra se usa para describir una porción escogida
de la población.
TIPO DE MUESTREO
Existen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en
general pueden dividirse en dos grandes grupos:
■ Métodos de muestreo probabilísticos.
■ Métodos de muestreo no probabilísticos.

Muestreo probabilístico
Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma
probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas
las posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo
estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra
extraída y son, por tanto, los más recomendables.
TIPO DE MUESTREO
Muestreo probabilístico

■ Muestreo aleatorio simple.


■ Muestreo aleatorio sistemático.
■ Muestreo aleatorio estratificado.
■ Muestreo aleatorio por conglomerados.
Muestreo aleatorio simple.
El procedimiento empleado es el siguiente:
1) se asigna un número a cada individuo de la
población y
2) a través de algún medio mecánico (bolas
dentro de una bolsa, tablas de números
aleatorios, números aleatorios generados
con una calculadora u ordenador, etc.) se
eligen tantos sujetos como sea necesario
para completar el tamaño de muestra
requerido.

Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad


práctica cuando la población que estamos manejando es muy grande.
Muestreo aleatorio sistemático.
Este procedimiento exige, como el anterior, numerar todos los elementos de la
población, pero en lugar de extraer n números aleatorios sólo se extrae uno.
Se parte de ese número aleatorio i, que es un número elegido al azar, y los
elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k,
i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k.
El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en
la población ya que al elegir a los miembros de la muestra con una periodicidad
constante (k) podemos introducir una homogeneidad que no se da en la población.
Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos
en los que los 5 primeros son varones y los 5 últimos mujeres, si empleamos un
muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres
o sólo mujeres, no podría haber una representación de los dos sexos.
Muestreo aleatorio sistemático.
Muestreo aleatorio estratificado.
Trata de obviar las dificultades que presentan los anteriores ya que simplifican los
procesos y suelen reducir el error muestral para un tamaño dado de la muestra.
Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran
homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo,
según la profesión, el municipio de residencia, el sexo, el estado civil, etc.).
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos
de interés estarán representados adecuadamente en la muestra.
Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el
muestreo aleatorio simple o el estratificado para elegir los elementos concretos que
formarán parte de la muestra. En ocasiones las dificultades que plantean son
demasiado grandes, pues exige un conocimiento detallado de la población. (Tamaño
geográfico, sexos, edades,...).
Muestreo aleatorio estratificado.
Muestreo aleatorio por conglomerados.
En el muestreo por conglomerados la unidad muestral es un grupo de
elementos de la población que forman una unidad, a la que llamamos
conglomerado. Las unidades hospitalarias, los departamentos
universitarios, una caja de determinado producto, etc., son conglomerados
naturales.
En otras ocasiones se pueden utilizar conglomerados no naturales como,
por ejemplo, las urnas electorales.
Cuando los conglomerados son áreas geográficas suele hablarse de
"muestreo por áreas". El muestreo por conglomerados consiste en
seleccionar aleatoriamente un cierto numero de conglomerados y en
investigar después todos los elementos pertenecientes a los
conglomerados elegidos.
Muestreo aleatorio por conglomerados.
TAMAÑO DE LA
MUESTRA
Tamaño de la Muestra
Una encuesta es realmente valiosa cuando es confiable y representativa.
Uno de los factores para lograr esto es el tamaño de muestra, encontrar
a nuestra población ideal puede resultar verdaderamente difícil.
Por eso hoy conoceremos diferentes aspectos que tienes que considerar
para obtener la muestra correcta para tu investigación.
Tamaño de la Muestra
Una muestra es una selección de los encuestados
elegidos y que representan a la población total. El
tamaño de la muestra es una porción significativa de
la población que cumple con las características de la
investigación reduciendo los costos y el tiempo.

Saber cómo determinar el tamaño de la muestra


antes de comenzar una investigación es un principio
estadístico que nos ayuda a evitar el sesgo en la
interpretación de los resultados obtenidos.
¿De qué depende el tamaño muestral?
El tamaño muestral dependerá de decisiones estadísticas y no estadísticas, pueden incluir por ejemplo la
disponibilidad de los recursos, el presupuesto o el equipo que estará en campo.
Antes de calcular el tamaño de la muestra necesitamos determinar varias cosas:
■ Tamaño de la población. Una población es una colección bien definida de objetos o individuos que
tienen características similares. Hablamos de dos tipos: población objetivo, que suele tiene diversas
características y también es conocida como la población teórica. La población accesible es la población
sobre la que los investigadores aplicaran sus conclusiones.
■ Margen de error (intervalo de confianza). El margen de error es una estadística que expresa la cantidad
de error de muestreo aleatorio en los resultados de una encuesta, es decir, es la medida estadística del
número de veces de cada 100 que se espera que los resultados se encuentren dentro de un rango
específico.
■ Nivel de confianza. Son intervalos aleatorios que se usan para acotar un valor con una determinada
probabilidad alta. Por ejemplo, un intervalo de confianza de 95% significa que los resultados de una
acción probablemente cubrirán las expectativas el 95% de las veces.
■ La desviación estándar. Es un índice numérico de la dispersión de un conjunto de datos (o población).
Mientras mayor es la desviación estándar, mayor es la dispersión de la población.
¿Cómo calcular el tamaño de la muestra?
Ejemplo de cómo calcular el tamaño de
muestra finita
Tu nivel de confianza
corresponde a una
puntuación Z.
Este es un valor constante
necesario para esta
ecuación.
Aquí están las puntuaciones
Z para los niveles de
confianza más comunes:

90% - Puntuación Z = 1,645

95% - Puntuación Z = 1.96

99% - Puntuación Z = 2.576


Ejemplo de cómo calcular el tamaño de
muestra finita
Supongamos que nos piden calcular el tamaño para una población de 543.098
consumidores de una marca de bebidas energéticas, donde el investigador asigna un
nivel de confianza de 95% y un margen de error de 3%. Donde se desconoce la
probabilidad “p” del evento.
Basándonos en este ejemplo, y en nuestra fórmula, el "N" será 543.098, nuestro Z será
1.96 (recuerda que el investigador asignó un nivel de confianza de 95%) y “e” será de
3%. Y como nuestro ejemplo dice que se desconoce la probabilidad de que ocurra el
evento, se asigna un 50% a "p" y un 50% a "q".
El resultado de nuestro tamaño de muestra sería: 1065.2, y tendría que ser
redondeado pues estamos hablando de personas.
Ejemplo de cómo calcular el tamaño de
muestra infinita

Donde "Z" es el intervalo


de confianza al
cuadrado, en este caso
se pide que sea del 95%,
lo que indica que sería
1,96 al cuadrado, y cómo
no sabemos la
probabilidad de que
ocurra el evento, "p" y "q"
sería 50%.
Método Congruencial Aditivo
Es un algoritmo determinantico que nos permite generar una serie de números pseudo
aleatorios a partir de parámetros de arranque.
Este algoritmo requiere una secuencia previa de n números enteros x1, x2, x3….xn para
generar una nueva secuencia de numeros enteros que empiezan en xn+1, xn+2,xn+3…

Su ecuación recursiva es:


Xi= (Xi-1, +Xi-n)mod(m) i= n+1, n+2,n+3,…., N

Los numero ri se generan mediante la ecuacion:


ri= xi/(m-1)
Ejemplo
Generar 7 números pseudo aleatorios entre cero y uno a partir de la siguiente secuencia de
numero enteros: 65, 89, 98, 03, 69; m=100
Sean x1=65, x2=89, x3=98, x4=03, x5=69.
Generamos r1, r2, r3, r4, r5, r6, r7.
Xi= (Xi-1, +Xi-n)mod(m) i= n+1, n+2,n+3,…., N
Generamos x6,x7,x8,x9,x10,x11,x12
ri= xi/(m-1)

Solución:
x6 = (x5+x1) mod 100 = (69+65)mod100 = 34 r1=34/99=0.3434
x7 = (x6+x2) mod 100 = (34+89)mod100 = 23 r2=23/99=0.2323
x8 = (x7+x3) mod 100 = (23+98)mod100 = 21 r3=21/99=0.2121
x9 = (x8+x4) mod 100 = (21+03)mod100 = 24 r4=24/99=0.2424
x10 = (x9+x5) mod 100 = (24+69)mod100 = 93 r5=93/99=0.9393
x11 = (x10+x6)mod 100 =(93+34)mod100 = 27 r6=27/99=0.2727
x12 = (x11+x7)mod 100 =(27+23)mod100 = 50 r7=50/99=0.5050
Método Congruencial Multiplicativo

Surge del algoritmo congruencial lineal cuando C=0;


entonces la ecuación es:

La ventaja de este método es que en comparación con el algoritmo lineal es que este
implica una operación menos.
Método Congruencial Multiplicativo
Los parámetros de arranque de este algoritmo son Xo, a y m, todos los cuales
deben ser números enteros y mayores que cero. Para transformar los números Xi
en el intervalo (0,1) sea la ecuación:
■ ri = xi/(m-1).
Las condiciones que deben cumplir los parámetros para que el algoritmo
congruencial multiplicativo alcance su máximo periodo son:

a= 3 + 8k
O a = 5 + 8k k= 0,1,2,3,… A partir de estas condiciones se logra un período de
vida máximo.

X0 debe ser un numero impar


g debe ser entero
Ejemplo
Generar suficientes números entre 0 y 1 con los parámetros: Xo = 17, k = 2 y g
= 5, hasta encontrar el periodo o ciclo de vida.
Solución:

a= 5 + 8(2) = 21 y m = 32
Xo= 17
X1 = (21*17) mod 32 = 5 r1 = 5/31 = 0.1612
X2 = (21*5) mod 32 = 9 r1 = 9/31 = 0.2903
X3 = (21*9) mod 32 = 29 r1 = 29/31 = 0.9354
X4 = (21*29) mod 32 = 1 r1 = 1/31 = 0.3225
X5 = (21*1) mod 32 = 21 r1 = 21/31 = 0.6774
X6 = (21*21) mod 32 = 25 r1 = 25/31 = 0.8064
X7 = (21*25) mod 32 = 13 r1 = 13/31 = 0.4193
X8 = (21*13) mod 32 = 17 r1 = 17/31 = 0.5483
Método Congruencial Mixto

El Método Congruencial Mixto genera una sucesión de números pseudo aleatorios en la


cual el sucesor X n+1 del número pseudo aleatorio Xn es determinado justo a partir de
Xn. Particularmente para el caso del generador congruencial mixto la relación de
recurrencia es la siguiente:
METODO DE LA
TRANSFORMADA
INVERSA
TRANSFORMADA INVERSA
El método de la transformada (o transformación) inversa, también conocido como método
de la inversa de la transformada, es un método para la generación de números aleatorios
de cualquier distribución de probabilidad continua cuando se conoce la inversa de su
función de distribución.
Este método es en general aplicable, pero puede resultar muy complicado obtener una
expresión analítica de la inversa para algunas distribuciones de probabilidad.
El método de la transformada inversa también puede emplearse para simular variables
aleatorias de tipo discreto, como en las distribuciones de Poisson, de Bernoulli, binomial,
geométrica, discreta general, etc. La generación se lleva a cabo a través de la probabilidad
acumulada P(x) y la generación de números pseudoaleatorios ri ~U (0,1).
TRANSFORMADA INVERSA
El método consiste en:

■ Definir la función de Densidad f(x) que representa la variable a modelar.


■ Calcular la función acumulada f(x).
■ Despejar la variable aleatoria x y obtener la función acumulada inversa f(x)-1.
■ Generar las variables aleatorias x, sustituyendo valores con números
pdeudoaleatorios ri ~U (0,1) en la función acumulada inversa.

EJEMPLO EN EXCEL

También podría gustarte