Guia Basica para la simulacion de Monte Carlo.pdf

download Guia Basica para la simulacion de Monte Carlo.pdf

of 22

Transcript of Guia Basica para la simulacion de Monte Carlo.pdf

  • Juan Carlos Lpez Ag

    Gua bsica para la simulacin de

    Monte Carlo

  • ndice

    Captulo 1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

    1.1. Principios de la simulacin de Monte Carlo . . . . . . . . . . . . . . . . . . 16

    Captulo 2. Generacin de nmeros pseudoaleatorios . . . . . . . . . . . . . . . 31

    Captulo 3. Generacin de variables aleatorias no uniformes medianteel principio de inversin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

    Captulo 4. Algunas funciones de distribucin inversas o aproxima-ciones de ellas incluidas en la aplicacin ExcelTM . . . . . . 51

    4.1. Distribucin binomial, B(n ; n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

    4.2. Distribucin beta, beta(a ; b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

    4.3. Distribucin normal o gaussiana, N(k ;p2) . . . . . . . . . . . . . . . . . . 54

    4.4. Distribucin lognormal LN (k ; p2) . . . . . . . . . . . . . . . . . . . . . . . . . 55

    4.5. Distribucin gamma, gamma (a ; b) o I (a ; b) . . . . . . . . . . . . . . . 56

    4.6. Distribucin Ji-cuadrado, s2 (l) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

    4.7. Distribucin exponencial, Exp(j) . . . . . . . . . . . . . . . . . . . . . . . . . . 59

    4.8. Distribucin t de Student, t(l) o tl . . . . . . . . . . . . . . . . . . . . . . . . . 60

    4.9. Distribucin de Snedecor-Fisher, (l1 ; l2) . . . . . . . . . . . . . . . . . 63

  • Captulo 5. Simulacin de distribuciones truncadas por el mtodo deinversin o de la transformada inversa . . . . . . . . . . . . . . . . . . . 67

    Captulo 6. Generacin de variables aleatorias no uniformes medianteel mtodo de rechazo o de aceptacin/rechazo . . . . . 71

    Captulo 7. Generacin de variables aleatorias no uniformes medianteel empleo de transformaciones . . . . . . . . . . . . . . . . . . . . . . . . . . 79

    Captulo 8. Mtodos especficos para la simulacin de variables aleato-rias no uniformes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

    8.1. Distribucin normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

    8.1.1. Mtodo de Box-Muller, o mtodo polar . . . . . . . . . . . 88

    8.1.2. Variante de Marsaglia del mtodo polar . . . . . . . . . . . . 89

    8.1.3. Mtodo del teorema central del lmite . . . . . . . . . . . . . . 90

    8.1.4. Mtodo de Ahrens-Dieter . . . . . . . . . . . . . . . . . . . . . . . . . 91

    8.1.5. Mtodo de rechazo con la doble exponencial comodistribucin auxiliar para el muestreo . . . . . . . . . . . . . . . 92

    8.1.6. Mtodo del cociente de uniformes . . . . . . . . . . . . . . . . . 93

    8.1.7. Mtodo de aceptacin/rechazo con la logstica comodistribucin auxiliar para el muestreo (Propuesta delautor) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

    8.2. Distribucin de Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

    8.3. Distribuciones gamma y Erlang, gamma (a ; b) y Erl (a ; b) . . . 104

    8.3.1. Algoritmo de Cheng y Feast para a b1 . . . . . . . . . . . . 106

    8.3.2. Variante de Fishman para a b1 . . . . . . . . . . . . . . . . . . . . 106

    8.3.3. Algoritmo de Tadikamalla para ab3/4 . . . . . . . . . . . . 107

    8.3.4. Algoritmo de Ahrens y Dieter para 0a am1 . . . . . . 107

    8.4. Distribucin beta (a ; b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

    8.4.1. Algoritmo de Fox . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

    8.4.2. Algoritmo de Johnk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

    8.4.3. Algoritmo de Cheng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

    8.5. Distribucin Ji-cuadrado de Pearson, s2(l) . . . . . . . . . . . . . . . . . 112

    8.6. Distribucin de Snedecor-Fisher, (l1 ; l2) . . . . . . . . . . . . . . . 114

    10 ndice

  • 8.7. Distribucin t de Student, t(l) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

    8.8. Distribucin de Weibull, W(a ; b) . . . . . . . . . . . . . . . . . . . . . . . . . . 116

    8.9. Distribucin logstica, Logist (a ;b) . . . . . . . . . . . . . . . . . . . . . . . . . 116

    Captulo 9. Simulacin de estadsticos ordenados . . . . . . . . . . . . . . . . . . . 119

    Captulo 10. Los criterios de aceptabilidad y simulacin estadstica . . . 135

    Bibliografa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155

    ndice 11

  • Introduccin1Para los objetivos de esta gua bsica, simulacin ser sinnimo de generacinde datos artificiales en un ordenador. Entre sus objetivos podemos destacar lossiguientes (DAVISON, A.C. Cambridge Series in Statistical and ProbabilisticMathematics. Cambridge. 2003 {12}):

    a) estudiar la variabilidad que puede esperarse al muestrear en un determinadomodelo estadstico,

    b) evaluar el grado de adecuacin de una aproximacin terica determinada,c) realizar anlisis de sensibilidad de las conclusiones de un estudio en relacin

    con las hiptesis adoptadas,

    d) aportar mayor luz respecto de un supuesto o intuicin, sobre la base de quees preferible una respuesta incompleta a una cuestin correctamente formula-da, que una respuesta precisa a una cuestin incorrecta,

    e) proporcionar solucin numrica a un determinado problema estadsticocuando la solucin analtica o no existe o si existe es demasiado compleja,

    f) proporcionar solucin numrica a un determinado problema matemticopero de raz no directamente estadstica cuando la solucin analtica ono existe o si existe es demasiado compleja.

    g) servir de apoyo a los mtodos clsicos de enseanza de la Estadstica.

    La simulacin es, por otra parte, una manera econmica y til de experimenta-cin. En muchas ocasiones, el cientfico o el tcnico se encuentran con sistemas

  • reales cuyo funcionamiento desea controlar o mejorar. Un mtodo habitual paraalcanzar esos objetivos consiste en experimentar con el sistema real, si ello es posi-ble, e intentar utilizar los resultados de la experimentacin para conocer y mejorarel funcionamiento del sistema. En muchas ocasiones, sin embargo, tal experimen-tacin es imposible o, aun siendo posible, ticamente delicada por ejemplo enBiologa o muy costosa, siendo conveniente disponer de algn mtodo alterna-tivo para ampliar el conocimiento del sistema real. Dos son las posibilidades (Fi-gura 1.1). Construir fsicamente un prototipo, versin simplificada del sistema real,o crear un modelo lgico-matemtico que describa mediante un conjunto de ecua-ciones especificacin las relaciones bsicas entre los principales elementos delsistema, para experimentar con ellos y no con el sistema. La simulacin hace refe-rencia en este escenario a la experimentacin con el modelo, sobre todo cuandocomo suele ser general no son suficientes los procedimientos analticos y nu-mricos para su estudio, ya que el modelo incluye trminos de ruido o perturba-ciones aleatorias que son esenciales en el mismo, pues sintetizan el reconocimien-to de que el modelo es slo una aproximacin del sistema real.

    Figura 1.1. Experimentacin con el sistema, los modelos y los prototipos.

    La Figura 1.2 muestra de forma esquemtica el funcionamiento de un modelo deun determinado sistema real. Existen unas entradas, tanto estocsticas comodeterministas, y unas salidas. El proceso de conversin de las entradas en salidasno es una caja negra black box como sera si en ese mismo tipo de figura se

    14 Gua bsica para la simulacin de Monte Carlo

  • describiese el sistema real o incluso un prototipo del mismo. Por definicin, lasecuaciones constitutivas del modelo es decir, su especificacin son conocidas,de modo que el proceso interno de transformacin de las variables de entrada envariables de salida es conocido y fijo una vez construido el modelo, y general-mente establecido en forma de algoritmo.

    Figura 1.2. Representacin esquemtica de las ecuaciones lgico-matemticasy relaciones que constituyen el modelo.

    La simulacin consiste en la observacin y explotacin de resultados que sigue aun plan estructurado de aplicacin extensa del modelo. El analista hace variar deforma ordenada las entradas del modelo y obtiene como respuesta un gran nme-ro de salidas u observaciones artificiales que analiza estadsticamente para extraerconclusiones del propio modelo y extrapolarlas al sistema real para prever su com-portamiento.

    Los procedimientos o experimentos de simulacin pueden diferir dependiendo desi el conjunto de salidas u observaciones potenciales es discreto o continuo. Ade-ms, dichas observaciones pueden ser estticas o dinmicas, y en este ltimo casocomo funcin continua o discreta del tiempo. Por otro lado, las medidas del com-portamiento del sistema tambin pueden variar enormemente segn el modelo.

    Con tal abanico de posibilidades no es fcil al principio realizar una taxonoma delos procesos de simulacin. Sin embargo, la mayora de los experimentos de simu-lacin, una vez construido el modelo que simplifica el sistema real, se puedenadaptar al siguiente esquema (ROS INSA, D., ROS INSA, S. y MARTN, J.Simulacin. Mtodos y aplicaciones. RA-MA. 1997 {37}):

    1. Obtencin de observaciones bsicas de una fuente de nmeros aleatorios.

    2. Transformacin de las observaciones bsicas en entradas al modelo, segn lasespecificaciones del mismo para las entradas estocsticas y deterministas.

    3. Transformacin de las entradas deterministas y estocsticas en salidas.

    4. Estimacin de las medidas o pautas de comportamiento del sistema medianteel anlisis estadstico de las salidas del modelo.

    Introduccin 15

  • 1.1. Principios de la simulacin de Monte Carlo

    Dentro del contexto general de los procesos de simulacin que acaba de ser ex-puesto, los mtodo calificados de Monte Carlo inciden en la ltima fase del es-quema general de los experimentos de simulacin, constituyendo unos mtodosde estimacin bastante potentes de parmetros de inters del sistema real. Parallevar a cabo esa estimacin el mtodo de Monte Carlo explota ampliamente laanaloga entre probabilidad y volumen. La Estadstica Matemtica formaliza lanocin intuitiva de probabilidad de un suceso identificndola con su volumen omedida relativa en relacin con el del universo de posibles resultados de un experi-mento aleatorio. El mtodo de Monte Carlo utiliza esa identificacin en la direc-cin opuesta, es decir calculando el volumen de un conjunto e interpretandodicho volumen como una probabilidad. En el caso ms simple eso significa llevar acabo un muestreo aleatorio del universo de resultados posibles, hacer el recuentode los resultados que pertenecen a un determinado conjunto, calcular la fraccinde los resultados pertenecientes a dicho conjunto con respecto al nmero total deresultados generados, y tomar dicha fraccin como una estimacin del volumende dicho conjunto. Dentro de unas hiptesis bastante generales, la ley de los gran-des nmeros nos asegura que esa estimacin converge al verdadero valor del vo-lumen del conjunto a medida que aumenta el nmero de resultados generadosartificialmente. Adems, y de forma crucial, el teorema central del lmite facilitainformacin sobre la magnitud del error de estimacin cuando el tamao de lamuestra generada es finito, como por otra parte simpre va a suceder.

    De gran utilidad para la aplicacin de la metodologa Monte Carlo resulta tam-bin la identificacin de la probabilidad de un suceso con la esperanza matemticade cierta funcin que pasa a ser, por mor de esa identificacin, la caracterstica demayor inters de una variable aleatoria o de una funcin de ella. Sea X una variablealeatoria unidimensional, f(x) su funcin de densidad y D el soporte de dicha va-riable, de modo que

    ID f(x)dx% 1. [1.1]

    Como es bien sabido, la esperanza matemtica de dicha variable aleatoria es

    E[X]%ID x f (x) dx, [1.2]

    16 Gua bsica para la simulacin de Monte Carlo

  • y la esperanza matemtica de la funcin g(X), que puede ser considerada tambincomo una nueva variable aleatoria obtenida por transformacin de la primera,

    E[g(X)]%ID g(x) f (x)dx. [1.3]Sea ahora S un subconjunto de D, S D. La probabilidad del suceso X S es,como se sabe,

    Pr (X S)%IS f (x)dx, [1.4]donde la integral est extendida al conjunto de valores contenidos en S.

    Considrese la funcin indicadora de pertenencia a un determinado conjunto S,definida en la forma:

    S(x)% [x S]% E1 si x S0 si x S ( x S1).

    [1.5]

    Ntese que con ayuda de esta funcin indicadora la probabilidad Pr (X S) puedetambin expresarse en la forma

    Pr (X S)%ID S(x) f (x)dx, [1.6]pues por mero desarrollo de la misma, considerando que S S1 %D, se obtiene

    ID S(x)f(x) dx%IS 1 f(x)dx!IS1 0 f(x) dx%IS f(x) dx, [1.7]que concuerda con [1.4] como se quera demostrar.De modo que tanto [1.4] como [1.6] son expresiones vlidas y alternativas dePr (X S), pero [1.6] es un caso particular de [1.3], es decir es una esperanzamatemtica, concretamente de la funcin S(x), por lo que se llega a la importanteconclusin,

    Pr (X S)%E[S(x)], [1.8]

    que identifica la probabilidad de que X pertenezca a S con la esperanza matemti-ca de la funcin indicadora de pertenencia de X a S. Esta expresin es clave en la

    Introduccin 17

  • aplicacin de la metodologa Monte Carlo para la estimacin de probabilidades.Ntese que aunque los desarrollos precedentes se han hecho para el caso de que Xsea una variable aleatoria continua, los mismos son inmediatamente generalizablesal caso de que X sea discreta sin ms que sustituir las integrales por sumas, hacien-do que f (x) pase a ser la funcin de probabilidad de X en lugar de su funcin dedensidad.

    Ntese tambin que las expresiones anteriores son fcilmente generalizables al ca-so de que X sea una variable aleatoria multidimensional en ese caso se represen-tara por X. En efecto, las integrales simples seran ahora mltiples y la funcinindicadora, ahora representada por S(x), sera multivariable. No se enuncian lasexpresiones resultantes por brevedad y por resultar obvias a nuestro juicio.

    Estas ideas simples tienen una aplicacin inmediata en el campo cientfico. Supn-gase que se desea calcular la integral

    a%I1

    0g(x)dx, [1.9]

    siendo g(x) una funcin de la que se va a suponer que no tiene primitiva expresa-ble analticamente, lo que hace que a no sea calculable por mtodos analticosen particular por la regla de Barrow. El camino tradicional seguido en talescasos es el de utilizar algn mtodo de integracin numrica para calcular a conuna precisin prefijada. Muchos son los mtodos competidores, pudindose men-cionar entre otros la aproximacin de Riemann, la regla del trapecio o de Simp-son, el procedimiento de Newton-Cotes, el mtodo de Romberg, etc. Se trata entodos los casos de mtodos deterministas aplicados a un problema de enunciadopuramente determinista como es [1.9].

    Sin embargo, a pesar de que el sistema real es determinista y de que los mejoresprocedimientos de resolucin de [1.9] son tambin en este caso los del anlisisnumrico de base determinista, es posible construir un modelo de simula-cin de base estocstica que permita estimar a mediante la metodologa MonteCarlo.

    Considrese al efecto la variable aleatoria auxiliar X zU VUnif (0 ; 1) distribuidauniformemente en el intervalo [0 ; 1]. La funcin de densidad en dicho caso es:

    f (x)% E0 ; xm 0,1 ; 0a xm1,0 ; 1a x.

    [1.10]

    18 Gua bsica para la simulacin de Monte Carlo

  • Eso hace que se pueda interpretar [1.9], es decir la integral a calcular, como laesperanza matemtica de g(X), siendo X una variable aleatoria uniforme en elintervalo [0 ; 1]:

    a%E[g(X)], [1.11]

    XVUnif (0 ; 1). [1.12]

    La Figura 1.3 muestra el modelo de simulacin sugerido para estimar el parme-tro del sistema real a mediante la metodologa Monte Carlo.

    Figura 1.3. Modelo de simulacin sugerido para calcular [1.9].

    Se generara un nmero m elevado de extracciones aleatorias e independientes dela distribucin Unif (0 ; 1) en el siguiente epgrafe se ver cmo hacerlo, de-signadas por x1, x2, ..., xm, se evaluara la funcin g(x) para cada uno de esos valo-res y se obtendra la estimacin Monte Carlo de a mediante:

    a4 m%1m

    m

    ;i%1

    g(xi). [1.13]

    Ntese que si g( ) es integrable en [0 ; 1], entonces por la ley fuerte de los gran-des nmeros se obtiene el importante resultado de que a4 m tiende a a con probabi-lidad 1 cuando m tiende a .

    Si adems el cuadrado de g(x) es integrable en [0 ; 1] y se define,

    p2g% var [g(X)]%I1

    0[g(x). a]2 dx, [1.14]

    entonces el error de estimacin a4 m . a se distribuye, por el teorema central dellmite, aproximadamente normal con media cero y varianza p 2g /m, mejorandola aproximacin a medida que aumenta m.

    Introduccin 19

  • Las dos propiedades referidas pueden expresarse formalmente as:

    lmmr

    a4 m% a, con probabilidad 1, [1.15]

    m (a4 m . a)N(0 ; p 2g ) en distribucin. [1.16]

    En particular, este ltimo resultado muestra que el trmino de error, a4 m . a, tieneun error tpico desviacin tpica de a4 m . a igual a pg/m que va hacindosems y ms pequeo a medida que aumenta m. As pues, la velocidad de conver-gencia de a4 m hacia a est gobernada por la potencia m

    .1/2, que es caractersticadel mtodo de Monte Carlo y que es independiente de la dimensin de la variablealeatoria X sera la misma velocidad si el problema planteado fuera el clculo deuna integral triple, por ejemplo. Esto mismo tambin se expresa diciendo que laaproximacin es de orden m.1/2, O(m.1/2).

    Ntese que eso significa que si se desea aumentar al doble la precisin en la esti-macin de a, ser necesario multiplicar por cuatro el nmero de puntos muestrea-dos o lo que es igual, el nmero de variables aleatorias uniformes generadas.An ms, si se desea ampliar en un dgito significativo la precisin del resultadohabr que multiplicar por 100 el nmero de puntos muestreados.

    Esas modestas prestaciones en lo que se refiere a velocidad de convergencia soncaractersticas de la metodologa Monte Carlo. De hecho cualquier mtodo deintegracin numrica de los mencionados anteriormente supera con creces en efi-cacia al mtodo de Monte Carlo como procedimiento de integracin para la reso-lucin del problema propuesto, que es unidimensional. Sin embargo las cosascambian si aumenta la dimensin de la integral, pues el mtodo de Monte Carlono ve afectada su velocidad de convergencia, mientras que en los mtodos num-ricos se ve perjudicada drsticamente. Y en los modelos de simulacin habitualesla dimensin de la integral puede ser importante. Adems, la metodologa MonteCarlo tiene una raz estocstica tan evidente que la hace preferible en los modeloscon componente estocstico, aunque en muchos casos tambin podra aplicarseen los mtodos de integracin numricos deterministas.

    De vuelta a los resultados [1.15] y [1.16], especialmente a este ltimo, ntese queno pueden ser aplicados directamente para la construccin de intervalos de con-fianza para a, porque pg no es conocida a priori vase por [1.14] que su cl-culo precisa de a, que es precisamente la cantidad a estimar por ser desconocida.Este inconveniente se soslaya en parte al calcular

    20 Gua bsica para la simulacin de Monte Carlo

  • sg%J1

    m.1

    m

    ;i%1

    [g(xi). a4 m]2, [1.17]

    para lo que slo es necesario utilizar resultados del modelo de simulacin. Conayuda de sg se puede establecer un intervalo de confianza de nivel 100(1. d)%para a. Dicho intervalo, que tiene el carcter de aproximado, es a4 m u zd/2 sg /m,pues al ser m un nmero elevado en las aplicaciones de los modelos de simulacinest justificado utilizar el cuantil zd/2 de la N(0 ; 1). Se puede as poner,

    Pr Aa4 m . zd/2sg

    mm am a4 m! zd/2

    sgmB^ 1. d , [1.18]

    de modo que la estimacin puntual a4 m de la cantidad a queda enriquecida al seracompaada de acotaciones del tipo [1.18], o al menos del error tpico sg/m,que informan del grado de precisin de la estimacin a4 m.

    Todos los resultados que se acaban de exponer provienen de la discusin y resolu-cin de la integral [1.9] pero son mucho ms generales de lo que pudiera supo-nerse por estar ligados a un enunciado tan especfico. Y ello a pesar de que elenunciado estaba preparado para que los lmites de la integral coincidieran con losde la distribucin uniforme auxiliar, de modo que dicha integral pudiera ser direc-tamente identificada con una esperanza matemtica.

    No obstante, el hecho de que los lmites de la integral sean diferentes no suponeun problema serio. Si se desea calcular la integral

    a% Ib

    ah(y)dy, [1.19]

    se puede utilizar el cambio de variable y% a! (b. a)x, con dy% (b. a) dx, ydisponer la integral [1.19] en la forma,

    a% (b. a) I1

    0h[a! (b. a)x]dx% I

    1

    0g(x)dx, [1.20]

    con g(x)% (b. a)h[a! (b. a)x]. Esta integral coincide con [1.9], lo que haceaplicable inmediamente la metodologa de Monte Carlo para su resolucin. Incluso

    Introduccin 21

  • si alguno de los lmites no es finito existe una transformacin adecuada para utili-zar los resultados anteriores. Sea por ejemplo la integral

    a%I

    0t(y)dy, [1.21]

    y considrese el cambio de variable y%1/(1!x), para el que dy% [.1/(1!x)2]dx.Ahora se puede poner

    a%I1

    0tA

    11! xB

    dx(1! x)2

    %I1

    0g(x)dx, [1.22]

    con g(x)% t[1/(1! x)]/(1! x)2 y aplicar los resultados precedentes.

    Otro cambio de variable que produce resultados anlogos es y%.ln (1. x), condy% dx/(1. x). Aplicando esta transformacin a [1.21] se llega a [1.9], siendoen este caso g(x)% t[. ln (1. x)]/(1. x).

    Cuando la integral es del tipo

    a% I

    at( y)dy, [1.23]

    el cambio apropiado es y% a. ln (1. x), con dy% dx/(1. x). La integral[1.23] se transforma de nuevo en [1.9], con g(x)% t[a. ln (1. x)]/(1. x).

    Las integrales cuyo lmite inferior es . y el lmite superior b, como

    a% Ib

    .m(y)dy, [1.24]

    se transforman fcilmente en integrales del tipo [1.9] mediante el cambio de varia-ble y% b! ln (x) con dy% dx/x. Es claro que en tal caso la funcin g(x) de [1.9]sera g(x)%m[b! ln (x)]/x.

    Por ltimo, las integrales del tipo

    a%I

    .n(y)dy [1.25]

    se pueden transformar en integrales del tipo [1.9] mediante el cambio de variabley% ln (x). ln (1. x)% ln [x/(1. x)]. Para este cambio de variable se verificaque dy% dx/[x(1. x)]% dx/(x. x2) y g(x)%n[ln [x/(1. x)]]/(x. x2).

    22 Gua bsica para la simulacin de Monte Carlo

  • Como ha podido comprobarse, la mayor parte de las integrales definidas simplespueden resolverse mediante simulacin de Monte Carlo a partir de extraccionesde la variable aleatoria uniforme Unif (0 ; 1). La situacin es bastante ms comple-ja si se trata de una integral mltiple con dimensin db1, pues el cambio de va-riables que transforma el recinto S en que se extiende la integral

    a%I IIS g(x1, x2, ..., xd) dx1 dx2 dxd, [1.26]en el hipercubo [0 ; 1]d, puede ser muy complejo o no existir. En realidad dichocambio de variables no es necesario si se dispone de algn procedimiento para ge-nerar extracciones uniformemente distribuidas en el subconjunto S del soporte D,SD. Esa tarea puede ser tan compleja como la de encontrar el cambio de varia-bles que transforme S en [0 ; 1]d y que permita simplificar el proceso de extraccinde las variables aleatorias uniformes pues todas ellas pasan a ser Unif d [0 ; 1], esdecir uniformes multivariantes de dimensin d.

    No se piense sin embargo que la metodologa Monte Carlo exige ineludiblementela generacin de variables aleatorias uniformes. Eso ha sido as en el ejemplo intro-ductorio de clculo de la integral [1.9]. Pero ni la metodologa Monte Carlo seaplica exclusivamente al clculo de integrales, ni el clculo de stas tiene por queser conducido siempre de la manera en que ha sido expuesto.

    En muchas ocasiones los modelos de simulacin (vase la Figura 1.2) contienenentradas estocsticas que son variables aleatorias con distribucin de probabilidadcualquiera: normal o gaussiana, exponencial, logstica, etc. En estas circunstanciases necesario disponer de algoritmos para generar tales tipos de distribuciones. Cu-riosamente tales algoritmos utilizan como materia prima extracciones de variablesaleatorias uniformes para transformarlas a continuacin en extracciones de las dis-tribuciones deseadas, como si inevitablemente siempre hubiera que recurrir a ladistribucin uniforme lo cual es cierto, por otra parte.

    En otras ocasiones, aunque un determinado problema pueda resolverse haciendouso exclusivo de la distribucin uniforme, como por ejemplo las integrales [1.9] y[1.26], puede ser interesante muestrear de una distribucin auxiliar h(x) diferentede la uniforme con el objeto de mejorar la precisin de la estimacin de MonteCarlo para un tamao muestral dado. Esta es la idea del llamado muestreo por im-portancia, que busca disminuir la varianza del error de la estimacin Monte Carloconcentrando el muestreo en zonas de importancia en relacin con la estima-

    Introduccin 23

  • cin. Para fijar ideas se comentar a continuacin la aplicacin del muestreo porimportancia al clculo de integrales.

    Supngase que se quiere estimar como antes la integral [1.9]. Si la funcin g(x)difiere mucho de la funcin de densidad de la distribucin uniforme en forma,no en altura o valor entonces var [g(x)] dado por [1.14] toma un valor elevado,incidiendo negativamente en la precisin de la estimacin a4 m. La Figura 1.4 es tilpara entender que el hecho de que el muestreo se lleve a cabo en la distribucinuniforme tiene una relacin directa en la varianza de g(x) y por tanto en la preci-sin de la estimacin. Se ha elegido una funcin g(x) particular marcadamente de-creciente en el intervalo (0 ; 1). Ntese que a representa a la vez el rea bajo lacurva g(x) en el intervalo (0 ; 1) y el valor medio de g(x) en dicho intervalo por serde ancho unidad.

    Figura 1.4. Representacin conjunta de la funcin g(x ) y de la distribucinuniforme, f (x )%1, 0m xm1, que intervienen en la integral [1.9].

    Esta ltima es la razn por la que a aparezca representado en la Figura 1.4 comouna ordenada que, aunque desconocida por hiptesis, existe, y su inclusin es tilporque facilita la exposicin. Es evidente que la mayor parte del rea que represen-ta a se encuentra en la parte ms a la izquierda del intervalo (0 ; 1), donde las orde-nadas de g(x) son altas, mientras que una parte pequea de dicha rea se encuen-tra en la zona de la derecha del intervalo (0 ; 1) por la razn contraria. Esosignifica que cuando una extraccin aleatoria de la Unif (0 ; 1) ha ocurrido en unaparte de la izquierda del intervalo (0 ; 1) la contribucin de dicha extraccin alrea estimada a4 m, medida por g(xi)/m segn [1.13], tiende a sobrevalorar la con-tribucin media, y que la contribucin de dicha extraccin a s 2g vase [1.17]

    24 Gua bsica para la simulacin de Monte Carlo

  • tiende a ser muy alta. De forma parecida, cuando una extraccin aleatoria de laUnif (0 ; 1) tiene lugar en la parte derecha del intervalo (0 ; 1), la contribucin dedicha extraccin al rea estimada a4 m tiende a infravalorar la contribucin mediapero a aumentar el valor de s 2g .

    Si el muestreo se hubiera concentrado en los aledaos de x0 (vase la Figura 1.4)las cosas hubieran ido mejor, pues al ser prximos a a los valores g(xi) corres-pondientes a las extracciones realizadas, sus contribuciones individuales a a4 m ha-bran estado cerca de la media, a4 m/m, y la contribucin de g(xi) a s

    2g habra sido

    pequea. Sin embargo tal tipo de muestreo privilegiado, o muestreo por importan-cia no puede darse utilizando la distribucin uniforme, que tender a repartir uni-formemente, como es lgico, el conjunto de todas las extracciones en el intervalo(0 ; 1). Pero existe, afortunadamente, una manera indirecta de llevar a cabo esemuestreo por importancia, que consiste en ponderar de manera diferente las con-tribuciones de g(xi) en a4 m y en s

    2g . Esa ponderacin distinta de la cuota uniforme

    1/m se puede llevar a cabo utilizando otra mtrica de probabilidad en [1.9] dife-rente de la uniforme. El cambio de mtrica no es especialmente difcil como sever a continuacin.

    El desarrollo siguiente se realiza partiendo de la expresin [1.3] que permite ha-cerlo ms general prcticamente sin esfuerzo adicional. nicamente se necesitaaclarar que la esperanza matemtica es un operador que utiliza una determinadamtrica de probabilidad, la de la distribucin cuya funcin de densidad intervieneen el clculo de dicha esperanza. En la expresin [1.3] la mtrica viene inducidapor f(x) y tal vez hubiera sido ms adecuado expresar dicha integral en la forma

    a%Ef[g(X)]% ID g(x)f(x)dx. [1.27]

    Si no se hizo as y en general no se hace as, es porque el contexto suele dejarperfectamente clara la mtrica que se utiliza en el clculo de la esperanza matem-tica por lo que resulta en general innecesario reflejarla en el operador esperanza,como se ha hecho en [1.27] disponiendo como subndice del operador el smbolode la funcin de densidad con la que se integra.

    Como el mtodo del muestreo por importancia utiliza diferentes mtricas para elclculo de esperanzas matemticas, conviene utilizar el criterio de nomenclaturaexpresado en [1.27] por ser ms informativo.

    Introduccin 25

  • Sea ahora h(x) una funcin de densidad auxiliar, cuyo soporte se va a designar porH, de modo que DH, es decir que el soporte D de f(x) queda incluido en Ho, lo que es igual, que f(x)b0 implica que h(x)b 0 para todo x. Esta exigenciatambin implica que h(x)b0 para x D, de modo que la siguiente transforma-cin en [1.27] es vlida:

    a%Ef[g(X)]% ID Cg(x) f (x)

    h(x) D h(x)dx. [1.28]En esta ltima integral h(x) ha sustituido a f(x) como mtrica de probabilidad, y sino fuera porque la integral est extendida al conjunto D, diferente de H que es elsoporte de h(x), parecera que representa la esperanza matemtica de la funcinque integra el corchete bajo la mtrica h(x). La esperanza matemtica aludida enesta ltima frase es en realidad

    EhCg(x)f(x)

    h(x) D% IH Cg(x) f (x)

    h(x) Dh(x)dx, [1.29]extendida al conjunto H, soporte de h(x). El hecho de que los conjuntos D y Hpuedan ser diferentes recurdese que D H hace pensar que las integrales delas expresiones [1.28] y [1.29] tienen un valor diferente. Esa primera impresin essin embargo apresurada. En efecto, al partir H en la unin de conjuntos disjuntosH%D (H .D)%D (H D1 ), la integral [1.29] puede descomponerse en lasuma

    IH Cg(x) f (x)

    h(x) Dh(x)dx%IDCg(x) f (x)

    h(x) Dh(x)dx!IHD1 Cg(x) f (x)

    h(x) Dh(x)dx, [1.30]y si se observa que por ser D el soporte de f(x) debe ser necesariamente f(x)% 0para x D1 y por tanto para x H D1 , se concluye que la ltima integral de estedesarrollo es nula, por lo que se obtiene:

    a%Ef[g(X)]% IDCg(x) f (x)

    h(x) Dh(x)dx%EhCg(x) f (x)

    h(x) D. [1.31]Este resultado es la clave del procedimiento de reduccin de varianza denominadomuestreo por importancia. Establece que la integral a es a la vez la esperanza ma-temtica de g(X) calculada con la mtrica f (x) y la esperanza matemtica deg(X)f (X)/h(X) calculada con la mtrica h(x).

    26 Gua bsica para la simulacin de Monte Carlo

  • Si se designan por xf1, xf2, ..., xfm ciertas extracciones aleatorias e independientesde la distribucin f(x), y por xh1, xh2, ..., xhm ciertas extracciones aleatorias e inde-pendientes de la distribucin h(x), se pueden construir dos estimaciones diferen-tes de a, que van a ser designadas por a4 f,m y a4 h,m :

    a4 f,m%1m

    m

    ;i%1

    g(xf i), [1.32]

    a4 h,m%1m

    m

    ;i%1 C

    f (xhi)h(xhi)D g(xhi). [1.33]

    Estas dos estimaciones de Monte Carlo son realizaciones de estimadores centra-dos en a por [1.31], pero la varianza del error de estimacin puede ser muy dife-rente en uno y otro caso. Una eleccin adecuada de la distribucin auxiliar h(x)puede hacer que la varianza del error de estimacin a4 h,m . a sea sensiblementeinferior a la varianza del error de estimacin a4 f,m . a. Para ello es conveniente quela densidad h(x) sea prxima al producto de g(x) f (x) por una constante de pro-porcionalidad que no es necesario determinar. En tal caso los trminos delsumatorio [1.33] sern prximos a esa constante de proporcionalidad aludida ycomo consecuencia la varianza de f(x)g(x)/h(x) ser pequea. Ntese que en elcaso particular de que h(x) f (x)g(x) todos los trminos de [1.33] seran cons-tantes y la varianza nula. Sin embargo en este caso la constante de proporcionali-dad que al ser aplicada al producto f(x)g(x) la hace coincidir con h(x) es 1/a, elinverso de la integral a calcular, de modo que esa eleccin tan precisa de h(x)cuando es posible es equivalente al clculo de la integral solicitada y no esnecesario continuar con ningn tipo de muestreo. Ni que decir tiene que unaeleccin desafortunada de h(x) puede conducir a un resultado distinto del desea-do: que la varianza de a4 h,m . a sea superior a la de a4 f,m . a.

    En el caso particular de que f(x) sea la funcin de densidad de la distribucin uni-forme Unif (0 ; 1), la integral [1.27] coincide con [1.9] pues f (x)% 1 para0a xm1 y f(x)%0 para x fuera del intervalo (0 ; 1]. En ese caso las extraccionesxfi de la expresin [1.32] son uniformes Unif (0 ; 1). Ntese que la expresin[1.33] en tal caso no puede simplificarse sustituyendo f(xhi) por la unidad, puesesto sucede slo en el caso de que 0a xhi m1, pero como el soporte H de h(x)puede contener valores de xhi fuera del intervalo (0 ; 1], en tales casos serf(xhi)%0, por lo que f(xhi) debe permanecer como tal en [1.33] a pesar de quef(x) sea la distribucin uniforme. Slo cuando el soporte H de h(x) coincida con

    Introduccin 27

  • el intervalo (0 ; 1] ser posible simplificar la expresin [1.33] utilizando el hechode que en tal caso es f(xhi)%1.

    Al comparar las expresiones [1.32] y [1.33] se observa que el muestreo por im-portancia es equivalente a calcular a4 h,m ponderando los valores g(xhi) con los pe-sos f(xhi)/mh(xhi). Algunos de estos pesos pueden ser cero cuando xhi D1 yotros en cambio relativamente elevados, siendo en tal caso xhi extracciones impor-tantes por su contribucin al clculo de a. Ntese que a pesar de la apariencia de[1.33], a4 h,m no ser en general una media ponderada de los valores g(xhi), y elloporque los pesos de las diferentes observaciones g(xhi) no tienen por qu sumar launidad.

    Un caso de gran importancia es el de la integral [1.6] que identifica la probabili-dad de un suceso con la esperanza matemtica de la funcin indicadora de dichosuceso. Comparando [1.6] y [1.27] se deduce que en este caso es g(x)% s(x), demodo que la eleccin ideal de h(x), que coincide con el producto g(x)f(x) dividi-do por el valor de la integral, resulta ser

    h(x)ideal%g(x)f (x)

    a%

    s(x)f (x)Pr (X S)

    % f (x S), [1.34]

    es decir la funcin de densidad de X condicionada por el suceso X S. Una elec-cin de h(x) lo ms prxima que se pueda a f(x S) provocar una disminucinnotable de la varianza del error de estimacin.

    El muestreo por importancia pone de manifiesto que en muchos casos ser conve-niente muestrear de distribuciones h(x) cualesquiera y no slo de la distribucinuniforme. No obstante, el muestreo de la distribucin uniforme es muy importan-te la en simulacin de Monte Carlo, tanto porque es la base de la resolucin dealgunos problemas tpicos de la metodologa Monte Carlo como la integraciny la optimizacin de funciones como por ser un paso previo para la generacinde otro tipo de variables aleatorias, en tanto que los algoritmos ideados para llevara cabo esa generacin se apoyan siempre en la extraccin de variables aleatoriasuniformemente distribuidas.

    La importancia que tiene el muestreo de la distribucin uniforme en la simulacinestadstica hace aconsejable que se le dedique un epgrafe, aunque el estudio delmismo se puede omitir sin prdida importante de continuidad. Si as se hace, sepuede pasar directamente al captulo 3 dando por hecho que los ordenadores son

    28 Gua bsica para la simulacin de Monte Carlo

  • capaces de generar secuencias de nmeros aleatorios en realidad pseudoalea-torios del tipo U1, U2, ..., Ui, que se comportan como extracciones indepen-dientes de la distribucin uniforme Unif (0 ; 1). En ExcelTM, por ejemplo, cadavez que se ejecuta la funcin ALEATORIO( ) la mquina devuelve un nmeroaproximadamente aleatorio de la secuencia referida.

    Introduccin 29

  • La intencin de este libro es hacer que la auditora sea algo positivo, plantear un enfoque participativo sobre el terreno, ayudar a controlar las emociones que suscita, etc.

    Esta nueva obra de Genievive Krebs es una recopilacin real de situaciones vividas a lo largo de las auditoras donde la autora comparte su experiencia respondiendo a las preguntas planteadas con mayor frecuencia tanto por los auditores como por los auditados:

    Cmo puedo ser innovador durante la auditora?

    *NA:@HM>GB=HMB>FIHLNGM>I:K:IK>I:K:KFB:N=BMHK: Cmo reacciono cuando no se alcanza el consenso en la reunin de cierre?

    Cmo hago una auditora cuando apenas conozco la actividad en cuestin?

    Cmo reacciono ante la falta de implicacin de la direccin?

    FH:?KHGMHJN>EHL:N=BM:=HLGHL>BFIEBJN>G>GE:IE:GB