Distribución de Probabilidades para variables aleatorias continuas

23
(Distribución de Probabilidades para variables aleatorias continuas) Prof. Ing. MSc. David Capriles Pérez 2013

Transcript of Distribución de Probabilidades para variables aleatorias continuas

(Distribución de Probabilidades para variables aleatoriascontinuas)

Prof. Ing. MSc. David Capriles Pérez

2013

TEMARIO

1. Distribución Normal

2. Definición de Ajuste a una Distribución Probabilística

3. Prueba de la Chi Cuadrado o Gi Dos (X2), para medir la

Bondad de los Ajustes.

4. Ejercicios

Distribución Normal o de Gauss

Es una Distribución de tipo continua y por tanto aplicable a variables continuas.

Es una Distribución Simétrica con respecto al ejede ordenadas y presenta una forma acampanada, donde elpunto de eje horizontal correspondiente a la ordenadamáxima se corresponde con el valor de la MediaAritmética, el cual coincide también con los de laMediana y de la Moda.

X = Md = Mo

Relaciones que se cumplen en toda Distribución Normal

0,50 0,50

1. Entre la Media Aritmética y más o menos una vez laDesviación Típica (X ± σ) se halla comprendido el 68,27%de los datos de la Serie.

2. Entre la Media Aritmética y más o menos dos veces laDesviación Típica (X±2σ) se encuentra comprendido el95,45% de los datos.

3. Entre la Media Aritmética y más y menos tres veces laDesviación Típica (X± 3 σ) estaría ubicado el 99,73% delos datos.

Relación entre la Distribución Binomial y la DistribuciónNormal

Si “n” es grande y ni “p” ni “q” están muy próximos acero, la Distribución Binomial puede aproximarse a laDistribución Normal. Esta aproximación se considera muy buenaen la práctica si los productos (np) y (nq) son superiores acinco.

Luego, cuando ocurran estos casos, los problemas deBinomial se resuelven más fácilmente usando la DistribuciónNormal.

Ejemplo

Si se sabe que el 15% de los tornillos producidos por unamáquina es defectuoso, se pide determinar la probabilidad deque en una muestra de 500 tornillos, más de 70 seandefectuosos.

Datos

p = 15/100 = 0,15 (probabilidad de ser defectuoso)

q = 1 – p = 1 – 0,15 = 0,85 (probabilidad contraria)

n = 500 (tamaño de la muestra)

X = 71, 72, 73,……………,500 (casos favorables)

Si usáramos la Distribución Binomial tendríamos:

Px = n pxqn-x

x 500 n

Reemplazando: P(x= 71,…..500) = Ʃ x pxqn-x

X =71

Pero, como de acuerdo a la relación entre la Binomial con laNormal, cuando los productos (np) y (nq) sean mayores quecinco, se recomienda el uso de la Normal, tendremos:

(n) (p) = (500) (0,15) = 75 > 5 ; (n) (q) = (500) (0,85)= 425 > 5

Para aplicar la Normal, recordaremos las constantes dela Binomial, a fin de obtener la Media Aritmética y laDesviación Típica de la Distribución en estudio, lo cualpermite tipificar la variable considerada.

X = (n) (p) = (500) (0,15) = 75

σ = √(n)(p)(q) = √ (500)(0,15)(0,85) =√63,75 σ = 7,98≈ 8

Datos:

X = 75

σ = 8

X1 = 70

p(>70) =?

Área rayada = Área a determinar

70 75

Para la obtención de las áreas de la Curva Normal, acudir a la Tabla de Áreas bajo la Curva Normal.

Tipificando la variable:

Z1 = X1 – X = 70 – 75 = -5/8 = -0,52 para Z1 = -0,62 corresponde un Σ 8

Área o probabilidad = 0,2324

Sumando 0,50 al área anterior: p(>70) = 0,50 + 0,2324 = 0,7324 = 73,24%

Uso de la tabla de las áreas y ordenadas de la DistribuciónNormal y de la Chi Cuadrado.

El requisito fundamental para el uso de la tabla es:

Media Aritmética distinta de cero y de Desviación estándar distinta de uno a una N (0; 1). Léase Normal de Media Aritmética igual a cero y Desviación Típica igual a 1.

Z1 = Xi –X σ

O,2324 0,50

Donde:

Zi = Variable Tipificada con la cual entraríamos en la Tabla

Xi = Cada uno de los valores de la variable estudiada

X = Media Aritmética

σ = Desviación Estándar

Ejemplo

a) Los sueldos de 65 técnicos de la industria Petrolera se distribuyen normalmente con una X = 2300 Bs. F y una σ= 150 Bs. F.

Se desea conocer:

a) Hallar la Probabilidad de que un técnico dentro de esa industria obtenga un sueldo inferior a Bs. F. 2400.

Datos:

N = 65 técnicos

X = 2300 Bs. F.

σ = 150 Bs. F

X1 = 2400 Bs. F

p(˂2400)=?

Área Rayada en gráfico adjunto = Probabilidad a determinar

23002400

Tipificando la variable: Z1= X1 – X = 2400 – 2300 = 0,66σ 150

Para Z1 = 0,66 corresponde un área o probabilidad de 0,2454

Luego:

p(˂2.400 Bs.F) = 0,50 +0,2454 = 0,7454 = 74,54%

b) Determinar la probabilidad de que un técnico obtenga unsueldo superior a 25oo Bs. F diarios.

Datos:

X = 2300 Bs.F

σ = 150 Bs.F

X1 = 2500 Bs.F

N = 65 técnicos

p(>2500)=?

0,50 0,2454

Área rayada = probabilidad a determinar

23002500

Tipificando la variable: Z1 = X1 – X σ = 2500 – 2300 150= 1,33

Para Z1 = 1,33 le corresponde un área o probabilidad de0,4082

Como la tabla nos da el área que va desde la Media Aritmética(centro de la curva) a un lado, para hallar el área oprobabilidad por encima de 2500 Bs.F, tendríamos que restardicha área obtenida de 0,50

p(>2500Bs.F) = 0,50 – 0,4082 = 0,0918 = 9,18%

c) Determinar el número de técnicos que se espera, dentrode esa industria, obtenga sueldo comprendidos entre 2000Bs.F y 2250 Bs.F

Datos:

X = 2300 Bs.F

σ = 150 Bs.F

X1 = 2000 Bs.F

0,4082

N = 65 técnicos

X2 = 2250 Bs.F

P(entre 2000 y 2250 Bs.F) =?

N(entre 2000 y 2250 Bs.F)=?

2000 2250 0,1293 2300

0,4772

Tipificando la variable:

Z1 = X1 – X σ = 2000 – 2300 = -2 al cual corresponde unárea o σ 150

probabilidad de 0,4772

Z2 = X2 – X σ = 2250 – 3000 = -0,33 al cual correspondeun área o 150

probabilidad de 0,1293.

0,3479

Restando ambas áreas o probabilidades:

0,4772 – 0,1293 = 0,3479 = 34,79%

Para determinar el número de técnicos, trabajaremos a travésde la siguiente regla de tres, bien sea considerando latotalidad del área como 1 o como 100%

N 1 651

X 0,3479 X0,3479

Luego:

X = (65) (0,3479) = 22,61 ≈ 23 técnicos 1

d. Determinar la probabilidad de que un técnico obtenga unsalario comprendido entre 2200 y 2450 Bs. F

Datos:

X = 2300 Bs.F σ = 150 Bs.F

X1 = 2200 Bs.F X2 = 2450 Bs. F

P(entre 2200 y 2450 Bs. F) =?

Área rayada del gráfico adjunto = Probabilidad a determinar

2200 23002450

Tipificando las variables:

Z1 = X1 – X = 2200 – 2300 = -0,66 al cual corresponde unÁrea o Σ 150

probabilidad de 0,2454

Z2 = X2 – X = 2450 – 2300 = 1,00 al cual corresponde un Áreao σ 150

Probabilidad de 0,3413.

Sumando ambas Áreas o Probabilidades (Por hallarse adistintos lados de la ordenada máxima) tendremos:

0,2454 + 0,3413 =0,5867 = 58,67%

Ajuste a la Distribución Normal

(Método de las Ordenadas)

0,2454 0,3413

Se determina la Media Aritmética ( X ) y la DesviaciónTípica de la Distribución en estudio (σ )

X = (FiXi)/ Fi σ =∑ ∑(FiXi∑ 2)

X 2

Fi ∑

Se tipifican los Puntos Medios o Marcas de Clases (Xi) de laDistribución:

Zi = Xi - X σ

Con tales valores de Zi se acude a la denominada Tabla dela Curva Normal (tabla 2), obteniéndose las respectivasOrdenadas (Yi).

Se obtienen las frecuencias Teóricas Calculadas o Esperadas(FT ), multiplicando cada ordenada ( Yi ) por la relaciónconstante:

K = (Ic) ( Fi)/σ es decir F∑ T = ( Yi ) ( K )

Recordar que la suma de las Frecuencias Teóricas ( F∑ T ) debeser igual a la suma de las Frecuencias Absolutas uObservadas, o sea: F∑ T = Fi.∑

Se aplica la Prueba de Chi Cuadrado para comprobar la Bondaddel Ajuste, cambiando los grados de libertad (g de I), loscuales están en función o dependiendo del número de Clasesque tenga la Distribución de Frecuencias objeto del Ajuste ala Curva Normal.

G de I = K – 3 (Normal)

Donde:

K = No. de clases

La probabilidad recomendada, es para variables socio-económicas del 95%, es decir, p= 0,95.

Ejemplos

La siguiente Distribución de Frecuencias representa losgastos en Bs. F, ocurridos en un determinado período en undepartamento de una empresa.

ClasesGastos (Bs.F)

(Fi)No. de días

500799,9

7

8001099,9

20

11001399,9

40

14001699,9

9

17002000

4

Fi = 80∑

Se desea Ajustar la Distribución por la Distribución Normalsegún el Método de las Ordenadas y su correspondientecomprobación para la Prueba de la Chi Cuadrada.

Determinando la X y σ por sus correspondientes fórmulas,tendremos:

X = 1186 Bs. F y σ = 270 Bs. F

Tipificando los Puntos Medios o Marcas de Clases:

Xi Zi =Xi-X/σ YiOrdenadas

FT = (K)(Yi)

500 -1,98 0,0562 5

950 -0,87 0,2732 24

1250 0,23 0,3885 35

1550 1,34 0,1626 14

1850 2,45 0,0198 2

F∑ T = 80

Las FT se han aproximado, unas por defecto y otraspor exceso, para que su sumatoria sea igual a 80.

K = (Ic)( Fi)/ σ = (300)(80)/270 = 88,88 = 89∑

Aplicando la prueba de la X2c

X2c = [Fi∑ 2/FT N ] = 85,95 – 80 = 5,95

Fi2 Fi2/FT

49 49/5 = 9,50400 400/24 = 16,661600

1600/35 = 45,71

81 81/14 = 5,7816 16/2 = 8,00

(Fi∑ 2/FT) = 85,95

Obteniendo la X2

T

g de I = K – 3 = 5 – 3 = 2 (Normal)

Donde K = No. de clases

p = 0,95

X2 = 5,99 T

Luego de obtenidas la X2 = 5,95 y la X2 = 5,99 c T

Realizaremos la comparación correspondiente, como X2 < X2

c T

(5,95) < (5,99)

Se acepta la Hipótesis establecida Ho de que no existendiferencias significativas entre las Frecuencias Teóricas FT

y las Frecuencias Absolutas u Observadas Fi.

Luego, el Ajuste es considerado como bueno, es decir, laDistribución de Frecuencias anterior sigue la tendencia o seajusta a la Curva Normal, por lo que se podrán aplicar a talDistribución todos los conceptos teóricos de la DistribuciónNormal o de Gauss.

El razonamiento anterior se puede observar claramente en elsiguiente gráfico:

Zona de Aceptación de la hipótesis Ho (Área Rayada)

X2T Zona

de Rechazo de la hipótesis de Ho

Cualquier valor de X2C mayor que X2

T, caería en la Zona de Rechazo de Ho

PROBLEMAS PROPUESTOS

1. Si se sabe que los sueldos de 315 empleados de unaempresa se distribuyen normalmente con una MediaAritmética de 2432 Bs. F y una Desviación Típica de 125Bs.F, se desea conocer:

a. Probabilidad de que un empleado obtenga un sueldoinferior a 2656 Bs.F.

b. ¿Cuál es el sueldo mínimo que debe obtener unempleado para estar comprendido dentro del 58% delos mayores sueldos de la empresa?c. Determinar el número de empleados con sueldossuperiores a 2100 Bs. F.

d. Determinar el número de empleados con sueldossuperiores a 2500 Bs. F

e. ¿Cuál es el sueldo máximo que debe obtener unempleado para estar comprendido dentro del 65% delos sueldos más bajos de la empresa?

2. En una investigación sobre el gato familiar mensual enuna parroquia de Caracas se observaron mil familias quearrojaron un gasto promedio mensual de 3000 Bs. F, conuna Desviación Típica de 200 Bs.F., si el 27,42% de lasfamilias presentan un alto nivel de gastos, es decir,familias del Sector A, las cuales están por arriba deun valor mínimo de gastos y al 15,87% se les considerancon un bajo nivel de gastos, ¿Cuál será ese valor mínimoa partir del cual se define el estrato de familia tipoA y cuál ese valor máximo que define el estrato de lafamilia tipo C.?

3. Los ingresos semanales de las familias de una comunidadse asumen como distribuyéndose normalmente, con unaMedia Aritmética igual a 1500 Bs.F y con un Coeficientede Variación de Pearson (CVP) del 20%. Si se sabe, que el0,78% de dichas familias se las considera como mercadode alta potencialidad (Clase o Sector A) y al 62,17% deellas como mercado de baja potencialidad (Clase osector C), se desea conocer:

a) ¿Cuál será el valor mínimo de ingreso semanal paraser considerado del sector o clase A)

b) ¿Cuál será el valor máximo de ingreso semanal paraser considerado del sector o clase A?

c) Si posteriormente en esta comunidad se observan 500familias, ¿Cuántas de ellas ha de esperarse pertenezcana un mercado potencial clase B?

4. Una empresa vendedora de telas para cortinas, disponede 1000 piezas en un momento dado para distribuir en elmercado en forma promocional. Según años anteriores, lasventas en el tiempo se han comportado con una tendenciahacia una Curva Normal, con un promedio de ventas iguala 40 días y una Desviación Típica de 10 días. Si lapresente campaña de ventas se inicia el día 01 deAgosto, se desea conocer:

a) ¿Cuántas piezas de telas se habrían vendido para el31 de Agosto?

b) ¿En qué fecha se habrán vendido 7000 piezas?

5. En un determinado curso, el 35% de los estudiantespresenta calificaciones superiores a 16 puntos y el 15%calificaciones inferiores a 8 ptos.. Se desea conocer:

a) La Media Aritmética y la Desviación Típica de dichascalificaciones

b) Probabilidad de que un estudiante obtenga notascomprendidas entre 15 y 17 ptos.

6. Una tienda por departamentos tiene otorgados 1000créditos, con un Promedio Aritmético de 600Bs.F, porcrédito y una Desviación Típica de 150 Bs.F. Sí se asumeque dichos créditos se distribuyen en Normalmente, sepide:

a) No. De créditos comprendidos entre 250 y 750 Bs.F

b) No. De créditos por encima de 1000 Bs.F

c) No. De créditos por debajo de 100 Bs.F

7. Una empresa que comercializa artículos para el hogarrealiza su inventario anual en sus almacenes, dando porresultado que el precio promedio por artículo es de 300Bs.F, con una Desviación Típica de 20 Bs.F. Por otraparte, se pudo observar que el 30% de dichos bienes eraconsiderado de precios altos por encima de un valormínimo, así como el 16% de precios bajos por debajo deun valor máximo. Asumiendo que los precios sedistribuyen normalmente. ¿Cuáles serán esos valoresmínimo y máximo respectivamente?

8. La Siderúrgica Nacional pretende exportar a undeterminado país, lotes de producción de acero. A talefecto, sondea dichos mercados obteniendo la siguienteinformación estadística: El consumo Promedio es de 250Tons/mensual. El Coeficiente de Variación es del 18%mientras que el No. De empresas que requieren acero esde 650. Asumiendo que dicho consumo se distribuyenormalmente. ¿Cuántas empresas necesitarán pedidos por

encima de 300 Tons/mes y cuántas por debajo de 100Tons/mes?

9. Las ventas diarias de una empresa que elabora productosde consumo masivo se distribuyen normalmente con unaMedia Aritmética igual a 3000 Bs.F diarios. Por análisisestadísticos previos, se conoce que la probabilidad deque las ventas en undía cualquiera estén comprendidasentre 2500 y 3500 Bs.F es del 80%. El Gerente de Ventasseñala a la Junta Directiva el hacer un esfuerzo paralograr vender más de 4000 Bs.F. en un día. ¿Cuál es laprobabilidad de lograr la meta `planteada por elGerente?.

10.Se supone que un Auditor Junior, en un chequeo deatributos, comete un error por cada diez facturaschequeadas. Partiendo de este hecho como cierto,determinar de un grupo de 100 facturas tomadas al azar:a) Probabilidad de que se le pasen más de 15 facturascon errores. b) Probabilidad de que se le pasen menos de8 facturas con errores. c)¿Qué conclusión se puede sacaren el caso “a”, en cuanto a la eficiencia de dichoauditor?

11. Se constituye un panel, para discutir un avisopublicitario que anuncia un nuevo producto a lanzarse almercado. Dicho panel lo integran 20 personas, de lascuales el 50% se asume, tiene experiencia en esta formade investigación publicitaria. Determinar laprobabilidad de que tal panel tenga:

a) 11 ó más personas con experiencia

b) 9 ó menos personas con experiencia

Use los dos modelos de probabilidad para la resolución deeste problema y haga un análisis comparativo (Binomial yDistribución Normal)

OTROS EJERCICIOS A RESOLVER

1. En seguida aparece el Número de Accidentes Laboralesocurridos en una industria durante un período de 30 días

(Xi) No. De

Accidentes

Laborales

(Fi)No.días

0 10

1 15

2 5

Ajustar la Distribución anterior a la Binomial,comprobando la bondad del ajuste mediante la Prueba dela Chi-Cuadrado con una probabilidad del 99% (0,99)

2. Los sueldos de un grupo de empleados de una empresa sedistribuyen normalmente con Media Aritmética igual a1896 Bs. F y Desviación Típica de 125 Bs. F. Se pide,determinar:

a) Sueldo mínimo que deba obtener un empleado para estarcomprendido dentro del 68% de los mayores sueldos.

b) Sueldo máximo que deba percibir un empleado paraestar comprendido dentro del 75% de los menoressueldos.

Respuestas: a) 1837,25 Bs. F ; b) 1979,75 Bs. F

3. Se pretende realizar un inventario en una empresavendedora de repuestos para automóviles. En virtud de

que el inventario es muy grande se procede a tomar ellibro de registro del año anterior, estratificando enBs. F la cantidad de 10000 renglones. Suponiendo quelos renglones en Bs. F. se distribuyen de acuerdo a laCurva Normal con Media Aritmética igual a 700 Bs. F. yDesviación Típica de 15 Bs. F. se pregunta:

a) No. De Renglones por encima de 720Bs.F

b) No. De Renglones entre Bs. F. 650 y 720 Bs.F

c) No. De Renglones por debajo de 650 Bs. F

Repuesta a) 918 renglones, b) 9.078 renglones,; c) 4renglones

4. El consumo mensual de energía eléctrica en unaUrbanización de Caracas que consta de 6000 viviendas,se distribuía normalmente con una Media de 1100Kw/hora, y con un Coeficiente de Variación del 18%. Sise deseaba estratificar el consumo de energíaeléctrica, ¿Cuántas viviendas tendrán?

a) Un consumo por encima de 1300 Kw/hora

b) Entre 1000 Kw/hora y 1300 KW/hora

c) Hasta 1000 Kw/horas

Repuestas: a) 15,62% y N = 937 viviendas, b) 53,88% yN = 3233 viviendas, c) 30,50% y N= 1830 viviendas.

NOTA: LES RECUERDO QUE ESTA EVALUACIÓN ES DEL 30% Y SERÁ EVALUADA DE LASIGUIENTE MANERA:

A) TRABAJO ESCRITO 10%

B) EVALUACIÓN 20%

LAS CONDICIONES SERÁN:

1. LA NOTA DEL TRABAJO ESTARÁ SUPEDITADA A LA NOTA QUE SAQUE EN ELEXAMEN

2. ES DE OBLIGATORIO CUMPLIMIENTO ENTREGAR EL TRABAJO EN LA FECHA YHORA ESTABLECIDA PARA EL EXAMEN.

3. EL NO ENTREGAR EL TRABAJO EN LA FECHA ESTABLECIDA TENDRA COMORESULTADO LA PERDIDA DE LA EVALUACIÓN CON UNA PONDERACIÓN DEL 30%.

4. EL NO ENTREGAR EL TRABAJO EL DÍA DE LA EVALUACIÓN PERDERA EL 10% DELA NOTA.

5. FECHA DE LA EVALUACIÓN: JUEVES 16 / 01/ 2013