Post on 10-Oct-2015
UNIVERSIDAD POLITCNICA DE VALENCIA
ESTADSTICA BSICA
PARA
INGENIERA
Mara Teresa Carot Snchez
Gonzalo Clemente Marn
Jos Mara Sanz Juan
DEPARTAMENTO DE ESTADSTICA E INVESTIGACIN OPERATIVA APLICADAS Y CALIDAD
Enero 2013
Contenido
-2-
Contenido
-3-
CONTENIDO
1. INTRODUCCIN
1.1. LA METODOLOGA ESTADSTICA ............................................................ 9
1.2. EL MTODO CIENTFICO ........................................................................ 12
1.3. SOFTWARE ESTADSTICO ...................................................................... 14
1.4. REDONDEO DE LOS DATOS ................................................................... 15
1.5. ALFABETO GRIEGO ................................................................................. 17
2. ESTADSTICA DESCRIPTIVA
2.1. INTRODUCCIN ........................................................................................... 19
2.2 ESTADSTICA DESCRIPTIVA UNIDIMENSIONAL ......................................... 22
2.2.1. Tablas de frecuencias ............................................................................ 23
2.2.2. Histogramas ........................................................................................... 23
2.2.3. Polgono de frecuencias ......................................................................... 25
2.2.4. Diagrama de puntos ............................................................................... 25
2.2.5. Grfico de tartas..................................................................................... 26
2.2.6. Grfico de Pareto ................................................................................... 26
2.2.7. Medidas de posicin .............................................................................. 27
2.2.8. Medidas de dispersin ........................................................................... 29
2.2.9. Diagrama e tallos y hojas ....................................................................... 31
2.2.10. Diagrama de caja-y-bigotes.................................................................. 32
2.3. ESTADSTICA DESCRIPTIVA BIDIMENSIONAL ........................................... 33
2.3.1. Tablas de frecuencia de doble entrada .................................................. 33
2.3.2. Frecuencias marginales ......................................................................... 36
2.3.3. Frecuencias condicionales ..................................................................... 37
2.3.4. Representaciones grficas de las distribuciones bidimensionales .......... 38
2.3.5. Covarianza muestral .............................................................................. 40
2.3.6. Regresin lineal ..................................................................................... 40
2.4. PROBLEMAS Y CUESTIONES DE EXMENES ........................................... 41
3. PROBABILIDADES
3.1. INTRODUCCIN ........................................................................................... 47
3.2. PROBABILIDAD ............................................................................................. 48
3.2. ESPACIOS DE PROBABILIDADES ............................................................... 48
3.4. PROBABILIZACIN DE ESPACIOS MUESTRALES ..................................... 52
Probabilizacin de Espacios Muestrales Discretos .......................................... 52
Probabilizacin de Espacios Muestrales Finitos Simtricos. Combinatoria ...... 53
Combinatoria ................................................................................................... 53
Contenido
-4-
3.5. PROBABILIDAD CONDICIONADA ................................................................ 54
3.6. TEOREMA DE LA INTERSECCIN .............................................................. 56
3.7. TEOREMA DE LA PARTICIN TOTAL ......................................................... 56
3.8. SUCESOS INDEPENDIENTES ..................................................................... 57
3.9. TEOREMA DE BAYES ................................................................................... 58
3.10. PROBLEMAS PROPUESTOS ..................................................................... 59
Probabilidad condicional .................................................................................. 61
3.11. PROBLEMAS Y CUESTIONES DE EXMENES ........................................ 66
4. CONCEPTO DE VARIABLE ALEATORIA
4.1. DEFINICIN DE VARIABLE ALEATORIA UNIDIMENSIONAL ...................... 77
4.2. FUNCIN DE DISTRIBUCIN ...................................................................... 78
4.3. VARIABLES DISCRETAS .............................................................................. 79
4.4. VARIABLES CONTINUAS ............................................................................. 81
Funcin de densidad ....................................................................................... 81
Transformacin de variables aleatorias ........................................................... 84
4.5. ESPERANZA MATEMTICA ......................................................................... 85
Esperanza matemtica .................................................................................... 85
Momentos ........................................................................................................ 86
4.6 PARMETROS DE TENDENCIA .................................................................... 88
Valor medio ..................................................................................................... 88
Mediana ........................................................................................................... 89
Cuartiles .......................................................................................................... 89
Moda ............................................................................................................... 90
4.7. VARIANZA. CONCEPTO Y PROPIEDADES ................................................. 90
Desviacin tpica.............................................................................................. 91
4.8. OTROS PARMETROS DE UNA DISTRIBUCIN ........................................ 91
Rango o Recorrido ........................................................................................... 91
Coeficiente de variacin ................................................................................... 92
Coeficiente de asimetra ................................................................................. 92
Coeficiente de apuntamiento o de curtosis ...................................................... 92
4.9. DISTRIBUCIONES BIDIMENSIONALES ....................................................... 93
Concepto ......................................................................................................... 93
Funcin de distribucin .................................................................................... 94
Funcin de densidad ....................................................................................... 95
Funcin de densidad marginal ......................................................................... 96
Funcin de densidad condicional ..................................................................... 98
Independencia de variables aleatorias ............................................................. 99
Esperanza de vectores aleatorios .................................................................. 100
Momentos ...................................................................................................... 101
Matriz de varianzas-covarianzas .................................................................... 102
Contenido
-5-
Combinacin lineal de variables aleatorias .................................................... 106
Curva de regresin condicional ...................................................................... 106
Recta de regresin mnimo cuadrtica ........................................................... 107
4.10. PROBLEMAS PROPUESTOS ................................................................... 109
4.11. PROBLEMAS Y CUESTIONES DE EXMENES ....................................... 113
5. PRINCIPALES DISTRIBUCIONES DISCRETAS
5.1. DISTRIBUCIN DICOTMICA ............................................................... 121
5.2. DISTRIBUCIN BINOMIAL ..................................................................... 122
5.3. DISTRIBUCIN HIPERGEOMTRICA ................................................... 123
5.4. DISTRIBUCIN DE POISSON ................................................................ 125
5.5. DISTRIBUCIN BINOMIAL-NEGATIVA .................................................. 126
5.6. DISTRIBUCIN MULTINOMIAL .............................................................. 127
5.7. PROBLEMAS PROPUESTOS ................................................................. 129
5.8. PROBLEMAS Y CUESTIONES DE EXMENES .................................... 143
6. PRINCIPALES DISTRIBUCIONES CONTINUAS
6.1. DISTRIBUCIN UNIFORME ................................................................... 149
6.2. DISTRIBUCIN EXPONENCIAL ............................................................. 150
Tasa de fallos ................................................................................................ 152
6.3. DISTRIBUCIN NORMAL UNIDIMENSIONAL ....................................... 154
6.3.1. Variable normal tipificada ..................................................................... 155
6.3.2. Variable normal general ....................................................................... 158
6.3.3. Teorema central del lmite .................................................................... 160
Aproximacin de la binomial a la normal ....................................................... 161
Aproximacin de la Poisson a la normal ........................................................ 162
Correccin por continuidad ............................................................................ 163
6.4. LA DISTRIBUCIN NORMAL BIDIMENSIONAL ..................................... 165
Distribuciones marginales .............................................................................. 166
Distribuciones condicionales .......................................................................... 166
6.5. PROBLEMAS PROPUESTOS .................................................................... 169
Distribucin uniforme ..................................................................................... 169
Distribucin exponencial ................................................................................ 170
Distribucin Normal ........................................................................................ 172
Distribuciones bidimensionales ...................................................................... 182
6.6. PROBLEMAS Y CUESTIONES DE EXMENES ........................................ 185
Contenido
-6-
7. DISTRIBUCIONES DERIVADAS DE LA NORMAL
7.1. DISTRIBUCIN CHI-CUADRADO .......................................................... 191
7.2. DISTRIBUCIN t ................................................................................... 192
7.3. DISTRIBUCIN F.................................................................................... 194
7.4. PROBLEMAS PROPUESTOS ................................................................ 195
8. DISTRIBUCIONES EN EL MUESTRO
8.1. POBLACIN, MUESTREO Y MUESTRA ................................................ 197
8.2. DISTRIBUCIN DE LA VARIANZA MUESTRAL ..................................... 201
8.3. DISTRIBUCIN DE LA MEDIA MUESTRAL ........................................... 203
8.4. DISTRIBUCIN DEL COCIENTE DE VARIANZAS ................................. 204
8.5. DISTRIBUCIN DE LA PROPORCIN .................................................. 206
8.6. DISTRIBUCIN DE LA DIFERENCIA DE MEDIAS MUESTRALES ........ 207
8.7. DISTRIBUCIN DE LA DIFERENCIA DE PROPORCIONES ................. 208
8.8. VARIANZA EN POBLACIONES FINITAS ................................................ 210
8.9. PROBLEMAS PROPUESTOS ................................................................ 211
8.10. PROBLEMAS Y CUESTIONES DE EXMENES .................................... 212
9. INTRODUCCIN A LA INFERENCIA ESTADSTICA
9.1 ESTIMACIN PUNTUAL......................................................................... 217
9.2. ESTIMACIN POR INTERVALOS DE CONFIANZA ............................... 220
9.2.1. Intervalo de confianza para la media poblacional ................................. 221
9.2.2. Intervalo de confianza para la varianza poblacional ............................. 223
9.2.3. Intervalo de confianza para el cociente de varianzas poblacionales.... 224
9.2.4. Intervalo de confianza para la proporcin ............................................ 225
9.2.5. Intervalo de confianza para la diferencia de proporciones .................... 227
9.2.6. Intervalo de confianza para la diferencia de medias poblacionales ...... 228
9.3. TEST DE HIPTESIS ............................................................................. 230
Conceptos ..................................................................................................... 230
Obtencin de los tests .................................................................................. 234
9.4. TEST DE HIPTESIS PARMETRICOS ..................................................... 235
9.4.1. Contrastes de la media de una poblacional normal ............................. 235
9.4.2. Test de hiptesis para la varianza poblacional ..................................... 240
9.4.3. Test de hiptesis para el cociente de varianzas poblacionales ............ 241
9.4.4. Contrastes de proporciones ................................................................. 242
9.4.5. Test de hiptesis para la diferencia de medias poblacionales con
Contenido
-7-
muestras independientes ............................................................................... 246
9.4.6. Test para la diferencia de medias poblacionales con datos apareados ...................................................................................................................... 247
9.4.7.Test para la diferencia de proporciones ................................................ 248
9.4.8. Test de ajuste a una distribucin .......................................................... 250
9.4.9. Test de independencia ......................................................................... 252
9.5. PROBLEMAS PROPUESTOS ..................................................................... 255
Test de hiptesis ............................................................................................ 256
Tabla de contingencia .................................................................................... 260
Test de ajuste a una distribucin .................................................................... 261
9.6. PROBLEMAS Y CUESTIONES DE EXMENES ......................................... 262
10. ANLISIS DE LA VARIANZA
10.1. ANLISIS DE LA VARIANZA (I). UN FACTOR CONTROLADO................. 271
10.1.1. Generalidades ................................................................................... 271
10.1.2. Modelo terico. Hiptesis del modelo ................................................ 273
10.1.3. Hiptesis nula ................................................................................... 276
10.1.4. Ecuacin fundamental ....................................................................... 277
10.1.5. Test F ................................................................................................ 277
10.1.6. Comparacin de medias. Test L.S.D. (diferencia mnima significativa) ...................................................................................................................... 278
10.2. ANLISIS DE LA VARIANZA (II). DOS FACTORES CONTROLADOS ...... 280
10.2.1. Introduccin. Planes factoriales ......................................................... 280
10.2.2. Anova para dos factores con repeticiones ......................................... 281
10.2.3. Concepto de Interaccin ................................................................... 281
10.2.4. Modelo y supuestos tericos ............................................................. 283
10.2.5. Hiptesis Nulas ................................................................................. 284
10.2.6. Descomposicin de las Sumas de Cuadrados. Test F ...................... 284
10.2.7. Comparacin de Medias. Test L.S.D. ................................................ 284
10.2.8. Validacin del modelo ........................................................................ 287
10.2.9. Igualdad de las varianzas ................................................................... 287
10.2.10. Estimacin de los efectos ................................................................. 288
10.2.11. Predicciones .................................................................................... 289
10.3. PROBLEMAS Y CUESTIONES DE EXAMEN ............................................ 290
11. REGRESIN LINEAL
11.1. HIPTESIS DEL MODELO ..................................................................... 301
11.2. ESTIMACIN DE LOS COEFICIENTES DE REGRESIN ..................... 303
11.3. CONTRASTES DE SIGNIFICACIN DE LOS COEFICIENTES .............. 305
Contenido
-8-
11.4. VALIDACIN DEL MODELO .................................................................. 310
11.5. INTERVALOS DE PREDICCIN ............................................................. 313
11.6. BONDAD DE AJUSTE ............................................................................ 315
11.7. PROBLEMAS Y CUESTIONES DE EXMENES .................................... 317
ANEXO A. Tablas de las principales distribuciones de probabilidad
DISTRIBUCIN DE POISSON ........................................................................... 328
DISTRIBUCIN NORMAL TIPIFICADA .............................................................. 331
DISTRIBUCIN DE PEARSON ........................................................................ 332
DISTRIBUCIN t de Student ............................................................................. 335
DISTRIBUCIN F de snedecor ........................................................................... 338
BIBLIOGRAFA ......................................................................... 341
1. Introduccin
-9-
1. INTRODUCCIN
Contenido 1.1. LA METODOLOGA ESTADSTICA ............................................................ 9 1.2. EL MTODO CIENTFICO ........................................................................ 12 1.3. SOFTWARE ESTADSTICO ...................................................................... 14 1.4. REDONDEO DE LOS DATOS ................................................................... 15 1.5. ALFABETO GRIEGO ................................................................................. 17
1.1. LA METODOLOGA ESTADSTICA
La estadstica es la ciencia que se ocupa de recoger los datos, analizarlos, resumirlos
e interpretarlos, y todo eso para convertir los datos en informacin, de manera que
nos sirva para tomar buenas decisiones o bien para resolver problemas.
Cuando alguien habla de hacer una estadstica quiere decir que le gustara
saber aspectos como cules son los valores ms frecuentes, cules son el mximo y
el mnimo, cul es la distribucin de sus frecuencias, porcentajes de algunos valores,
la tendencia a lo largo del tiempo o bien hacer predicciones de valores futuros.
La materia prima de la estadstica son los datos, y estos se pueden obtener de
tres maneras:
1) De datos histricos: a partir de los registros, formularios, facturas, etc. Por
ejemplo, ventas de un determinado producto.
2) Datos experimentales: se hacen pruebas para ver cmo funciona un
proceso. Por ejemplo, qu relacin hay entre el rendimiento y la temperatura
de un proceso.
3) A partir de encuestas: es muy comn intentar conocer a una poblacin a
partir de una pequea parte de la misma elegida al azar. Por ejemplo, para
conocer las opiniones de los alumnos de la UPV, en lugar de preguntar a los
37000 ms de alumnos, es ms econmico preguntar a una parte
representativa de la poblacin a estudiar.
Esta tercera forma se la que vamos a seguir en primer lugar en el inicio de
esta materia en la ETSII.
Un ejemplo de encuesta es la que se muestra a continuacin:
1. Introduccin
-10-
Los pasos que seguimos son:
EL OBJETO DE ESTA ENCUESTA ES OBTENER DATOS PARA LA REALIZACIN DE EJERCICIOS EN LAS CLASE DE ESTADSTICA. Pregunta 1. Indique su peso en kgs.
[________] Pregunta 2. Indique su altura en cms. [________] Pregunta 3. Qu medios de transporte emplea para venir a la UPV?
1. Coche propio 2. Coche compartido 3. Bus 4. Metro o tranva 5. Bicicleta 6. Andando 7. Tren 8. Moto 9. Otro Pregunta 4. Tiempo diario dedicado al estudio, en horas, de lunes a viernes [________] Pregunta 5. Tiempo dedicado al estudio durante el fin de semana (sbado y domingo), en horas.
[________] Pregunta 6. Tiempo que tarda en llegar al Politcnico por las maanas, en minutos. [________] Pregunta 7. Qu deportes practica en la UPV?
1. Ftbol 2. Ftbol sala 3. Baloncesto 4. Tenis 5. Natacin 6. Bici 7. Gimnasia 8. Artes marciales 9. Vela 10. Marcha 11. Montaismo 12. Otros Pregunta 8. Nota de entrada en la Universidad [________]
Pregunta 9. Dispone de conexin a internet desde casa? 1. Si 2. No Pregunta 10. En general, las instalaciones y servicios ofertados por la UPV son,
1. Muy malos 2. Malos 3. Regular 4. Buenos 5. Muy buenos Pregunta 11. Edad. [________]
Pregunta 12. Sexo. 1. Hombre 2. Mujer MUCHAS GRACIAS POR SU COLABORACIN
1. Introduccin
-11-
1) Repartir el cuestionario a los alumnos y cumplimentarlo.
2) Introducir los datos al ordenador. Para esto podemos desarrollar un programa
de captura de los datos aprovechando el Access de Microsoft, o mejor un
programa que est preparado por la captura de los datos de los encuestas,
como puede ser el DYANE 4.
3) Una vez introducido los datos, hay que revisarlos por si hay alguien error o
valor raro que no fuera correcto.
4) Hacer anlisis descriptivos de los datos:
a) Resumen de todos los valores,
b) Resumen en forma grfica.
5) Contestar a varias preguntas, aplicando la metodologa estadstica pertinente.
Ejemplos de preguntas puede ser:
a) Cul es la nota media de acceso a la Universidad?
b) Cul es la proporcin de alumnos que cogen la bici para venir al Poli?
c) Cul distribucin de edades que hay en la clase?
d) Cul es la relacin que hay entre el peso y la altura de los alumnos?
e) La altura de los alumnos es diferente si es chico o chica?
f) etc.
La metodologa estadstica que aplican se resume en la figura siguiente
1. Introduccin
-12-
Metodologa
estadstica
Recogida
de los datos
Organizacin y
representacin
Estadstica
predictiva
Descriptiva
Inferencia
estadstica
Distribucin de
frecuencias
Histogramas
Tendencia central
Dispersin
Pruebas de hiptesis
Analisis de la
variancia
Diseo de
Experimentos
Anlisis de
correlacin
Analisis de
regressin
Estimacin
Modelos
Clculo de
probabilidades
Variable
aleatoriaDistribuciones
Figura 1. 1. La metodologa estadstica
La inferencia estadstica se el proceso de conocer las propiedades de una poblacin
a partir de una muestra representativa de la misma.
La Estadstica tiene su fundamento en el clculo de probabilidades.
1.2. EL MTODO CIENTFICO
La Estadstica utiliza el mtodo cientfico para desarrollar sus teoras. El mtodo
cientfico se basa en observar la naturaleza y formular una hiptesis de su
funcionamiento, y segn esta teora se producirn una serie de consecuencias. Si lo
que observamos no est en contradiccin con estas consecuencias, aceptamos la
hiptesis inicial. sta es aceptada hasta que encontramos una prueba que lo
invalida, y entonces debemos formular otra hiptesis y empezar de nuevo el proceso.
En la estadstica las etapas que seguimos se muestran en la Figura 1.2.:
1. Introduccin
-13-
Planteamiento del
problema
Formulacin del
modelo
Recogida de los
datos
Estimacin de los
parmetros
Hiptesis del
modelo
Es vlido?
Prediccin y
control
SI
NO
Figura 1. 2. El mtodo cientfico
Por ejemplo, queremos ver la prediccin del peso de una persona sabiendo su
altura. Se trata de un problema de regresin y el proceso que seguimos es parecido
al de la figura anterior.
1. Introduccin
-14-
1.3. SOFTWARE ESTADSTICO
Para el tratamiento de los datos es muy interesante disponer de unos programas en
ordenador que nos facilita todo el desarrollo.
Es muy frecuente almacenar los datos con una hoja de EXCEL y a partir de
sta, cualquier software estadstico es capaz de leer la hoja de EXCEL y disponer los
datos para su tratamiento y anlisis.
La misma hoja de EXCEL tiene un complemento de anlisis de los datos. La
ventaja es que en cualquier empresa podemos disponer de la EXCEL y hacer un
anlisis bsico de los datos. Adems, uno mismo puede desarrollar programas
especficos por el tratamiento de los datos haciendo uso de los macros y del
VisualBasic que lleva incorporado el EXCEL.
El software que vamos a utilizar en esta materia es:
1. Statgraphics para Windows. El que damos en las prcticas de estadstica es la
versin 5.1 en ingls. En la UPVNET, dentro de los programas cientficos,
hay disponible la ltima versin del Statgraphics que se denomina Centurion,
y sta la podemos poner en ingls o en castellano.
2. EXCEL. Empleamos las funciones estadsticas o bien los complementos que
lleva la propia EXCEL. Es interesante cargar el complemento de Anlisis de
Datos, y tambin se pueden emplear las tablas dinmicas para extraer
informacin de un conjunto de datos.
3. DYANE 4. Es un programa muy til para el anlisis de las encuestas. Se
puede utilizar por la grabacin de los datos y despus hacer la exportacin a
un fichero en formato txt y pasarlo a formato de EXCEL.
4. MATHCAD 2000. Este software utilizamos para hacer los clculos
matemticos, pero tambin lleva todas las funciones estadsticas.
5. Lenguaje R. Es un programa de libre distribucin que se puede descargar de
http://cran.r-project.org. Es muy interesante, sobre todo para principiantes, el
cargar la librera Rcmdr. De esta forma no hace falta saberse los comandos
del R, ya que se presenta con mens como si fuera el Statgraphics.
Otro software estadstico muy bueno y que est disponible para toda la
comunidad de la UPV es el SPSS. Se lanza accediendo a UPVNET y a la carpeta de
programas cientficos. La nica limitacin es el nmero de usuarios que estn
utilizndolo al mismo tiempo. Eso depende de las licencias que haya contratado la
UPV.
Programas estadsticos adicionales son:
1. SAS. Dicen que es el mejor, pero tambin el ms caro.
1. Introduccin
-15-
2. BMDP. Fue el primero que haba y estaba programado en Fortran.
Actualmente hay una versin por Windows y an hay gente que le utiliza.
3. MINITAB. Este programa lo utilizan muchas empresas para sus clculos
estadsticos.
Actualmente todas las calculadoras cientficas disponen de las funciones
estadsticas ms bsicas. Es importante leer las instrucciones de las calculadoras
para utilizar esas funciones. Muchas veces hemos perdido el manual de la
calculadora, pero se puede obtener una copia accediendo a la WEB.
1.4. REDONDEO DE LOS DATOS
La estadstica hace mucho uso de clculos a partir de los datos. Por eso es
importante tener en cuenta las siguientes reglas por el redondeo de los datos:
Cifras significativas:
1. La primera cifra significativa es el 1er dgito a partir de la izquierda que
es diferente de 0.
2. Cifras significativas es el nmero de dgitos contados a partir de la
primera incluida.
Ejemplos: 34,5 tiene 3 cifras significativas; 3,450 tiene 4 cifras
significativas; 0,0023 tiene 2 cifras significativas; 0,00230 tiene 3
cifras significativas.
Redondeo de un nmero que est justo a la mitad del intervalo: la regla que
se solo seguir es redondear el nmero par ms prximo que antecede al 5.
Las mquinas redondean hacia arriba a partir del 5. Ejemplos: 33,45 se
redondea a 33,4; 33,35 podra redondearse a 33,4 33,3; pero est ms
prximo el valor de 33,4. Si fuera 33,445 se redondea a 33,4, ya que tiene
menos distancia al valor de 33,4.
Cifras significativas en la presentacin de datos: se sigue la regla de los 2
dgitos de variacin. Ejemplo, si los datos son: 4,562 ; 4,673 ; 4,726; 4,364 ;
4,891; se pueden representar como: 4,56; 4,67; 4,73; 4,36; 4,89
Cifras significativas de una probabilidad: 3 cifras (o bien 4). Ejemplo:
Probabilidad de que llueva el fin de semana se del 10,5% 0,105; o bien
10,54 0,1054.
Decimales para el clculo de parmetros: Ejemplo de datos originales 3,4; 3,5;
3,1; 3,3; 3,9; 3,5; 3,5
1. Introduccin
-16-
3. Media aritmtica: 1 cifra ms. Ejemplo: 3,46
4. Desviacin tpica: 1 cifra ms. Ejemplo: 0,24
5. Variancia: 2 cifras ms. Ejemplo: 0,0595 bien 0,060
6. Recorrido: mismas cifras. Ejemplo: 0,8
7. Modo: mismas cifras. Ejemplo 3,5
8. Coeficiente de variacin: 3 cifras. Ejemplo: 7,06% bien 0,0706
9. Coeficiente de correlacin: 2 cifras. Ejemplo: r=0,23 y la R cuadrado
es 0,23^2=5,29%
10. Coeficientes de regresin: y=a+bx. Por ejemplo, si y tiene dos
decimales, cada uno de los sumandos debe tener como mnimo 3
decimales. As a se expresar con 3 decimales, y b, en caso de
que x tenga valores hasta 100, debe estar expresado en 5 cifras
decimales porque al multiplicar por la cantidad x nos da un nmero
con 3 cifras decimales. Ejemplo: a=1,246; b=0,37152; x=75;
Y=1,246+0,37152*75=1,246+27,864=29,11
Cifras a guardar en los clculos:
1. En los clculos de sumas y restas de nmeros, el resultado final no
tiene ms cifras significativas despus del lugar decimal que el de
con menor nmero de ellas despus de la coma decimal. Ejemplo:
3,32+1,7= 5,0 ; 73,52-63=11,63 si no es exacto; 37,512-24 =
37,512 si 24 es exacto.
2. En los clculos con multiplicacin, divisin y extraccin de races de
nmeros, el resultado final no puede tener ms cifras significativas
que los datos con menor nmero de ellas. Ejemplo 72,34x 5,45 =
394; 1,547/0,032 = 46; (4,89)^0,5 = 2,21; 7,381x40= 295,2 si 40 es
exacto.
1. Introduccin
-17-
1.5. ALFABETO GRIEGO
Debido a la notacin que se emplea en estadstica, es til conocer el alfabeto griego
que exponemos en la siguiente tabla.
Mays. Mins. Nombre Equivalente latino Comentario
A Alfa a Probabilidad
B Beta b Probabilidad
Gamma c
Delta d
psilon e error
Zeta f
Eta
Theta Parmetro poblacional en general
Iota i
Kappa k
Lambda l Parmetro de una exponencial o de
Poisson
Mu m media
Nu n
Xi
Omicron o
Pi p
Rho r
Sigma s Desviacin tpica
Tau t
Upsilon u
Fi v
Chi x
Psi y
Omega z
1. Introduccin
-18-
2. Estadstica Descriptiva
-19-
2. ESTADSTICA DESCRIPTIVA
Contenido 2.1. INTRODUCCIN ........................................................................................... 19 2.2 ESTADSTICA DESCRIPTIVA UNIDIMENSIONAL ......................................... 22
2.2.1. Tablas de frecuencias ............................................................................. 23 2.2.2. Histogramas ............................................................................................ 23 2.2.3. Polgono de frecuencias .......................................................................... 25 2.2.4. Diagrama de puntos ................................................................................ 25 2.2.5. Grfico de tartas ...................................................................................... 26 2.2.6. Grfico de Pareto .................................................................................... 26 2.2.7. Medidas de posicin ................................................................................ 27 2.2.8. Medidas de dispersin ............................................................................. 29 2.2.9. Diagrama e tallos y hojas ........................................................................ 31 2.2.10. Diagrama de caja-y-bigotes ................................................................... 32
2.3. ESTADSTICA DESCRIPTIVA BIDIMENSIONAL ........................................... 33 2.3.1. Tablas de frecuencia de doble entrada .................................................... 33 2.3.2. Frecuencias marginales........................................................................... 36 2.3.3. Frecuencias condicionales ...................................................................... 37 2.3.4. Representaciones grficas de las distribuciones bidimensionales ........... 38 2.3.5. Covarianza muestral ................................................................................ 40 2.3.6. Regresin lineal ....................................................................................... 40
2.4. PROBLEMAS Y CUESTIONES DE EXMENES ........................................... 41
2.1. INTRODUCCIN
Gran parte de la Estadstica trata sobre la recopilacin de datos, anlisis de los
mismos, y la extraccin de conclusiones con objeto de resolver problemas.
Los datos que se presentan en la prctica pueden ser de tres tipos bsicos:
1) Datos cualitativos, que expresan una cualidad del objeto, como puede ser
bueno, malo, o tambin un color, blanco, negro, azul, etc..
2) Datos cuantitativos discretos, que expresan algo que podemos contar,
por ejemplo, nmero de defectos que tiene una pieza mecnica, nmero de
terminales en funcionamiento, nmero de accidentes de coche en una semana, etc..
3) Datos cuantitativos continuos, es decir, pueden medirse sobre una
escala continua y llevan comas decimales, por ejemplo, el dimetro de un eje, tiempo
que tarda una transaccin en ejecutarse, etc...
Decimos que los datos observados corresponden a valores de una variable
que representamos por X. Si disponemos de n datos, se representan por
x,...,x,x,x n321
2. Estadstica Descriptiva
-20-
y si son todos los datos de la variable X, se denomina poblacin y se representan por
x,...,x,x,x N321
La simple enumeracin de estos datos no nos da mucha informacin acerca
del fenmeno que estamos observando, por lo cual siempre se prefiere condensar la
informacin de modo que su interpretacin sea ms sencilla.
La forma de condensacin puede ser grfica o numrica. Para una sola
variable vamos a estudiar los procedimientos ms usuales.
Escala de los datos
Otra clasificacin de los datos se refiere a la escala con que estn medidos. sta
puede ser de cuatro tipos:
a) Escalas No Mtricas (cualitativas) i. Escala nominal. Cuando la asignacin de los valores es totalmente
arbitraria. Por ejemplo, el cdigo de sexo, 1=hombre; 2=mujer.
ii. Escala ordinal. Cuando la asignacin de los valores guarda una cierta relacin de importancia, pero las diferencias no tienen sentido. Por ejemplo, nivel de estudios: 1=Primaria, 2=Secundaria, 3=Bachiller, 4=Graduado.
b) Escalas Mtricas (cuantitativas) i. Escala de intervalo. Cuando la asignacin guarda un orden de
importancia y la diferencia entre intervalos tiene sentido. Se caracteriza porque el origen de los datos es arbitrario. Por ejemplo, grado de acuerdo con una afirmacin, la codificacin puede ser:
1. Totalmente en desacuerdo 2. Ms bien en desacuerdo. 3. Indiferente. 4. Ms bien de acuerdo. 5. Totalmente de acuerdo
Pero la codificacin tambin podra haber sido con los cdigos -2, -1,
0, 1, 2.
ii. Escala de ratio o de razn. Cuando el origen de los datos no es arbitrario y tiene sentido las operaciones de multiplicacin y de divisin. Por ejemplo, el peso, la altura, la longitud, etc.
Actividad 2.1.
En la encuesta que hay en el tema 1, para cada pregunta decir qu tipo de escala utiliza la codificacin de los datos.
2. Estadstica Descriptiva
-21-
Mtodos estadsticos empleados para analizar la dependencia o la interdependencia
entre los datos observados
TCNICA DE ANLISIS MULTIVARIANTE
A) Relaciones de dependencia
Una variable dependiente/Mltiples
variables dependiente
Mltiples dependientes/mltiples
independientes
1. Anlisis de regresin mltiple 2. Anlisis de regresin logstica
binaria 3. Anlisis de clasificacin mltiple 4. AID (Automatic interaction
detection) 5. CHAID (Chi Square Automatic
Interaction Detection) 6. Anlisis conjunto categrico 7. Anlisis conjunto ordinal
1. Anlisis discriminante multiple 2. Anlisis de correlaciones
cannicas 3. Redes neuronales artificiales
B) Relaciones de interdependencias
Entre variables Entre casos objetos
1. Anlisis de componentes principales
2. Anlisis factorial de correspondencias
3. Anlisis multidimensional
1. Anlisis de grupos (anlisis cluster)
MTODOS DE DEPENDENCIA ENTRE VARIABLES
Mtodo Relacin funcional
Anlisis de
regresin
simple
11 XY
(mtrica) (mtrica, no mtrica)
Anlisis de
regresin
mltiple
n211 XXXY
(mtrica) (mtrica, no mtrica)
Anlisis de la
varianza n211 XXXY
(mtrica) (no mtrica)
Anlisis
multivariante de
la varianza
n21m21 XXXYYY
(mtrica) (no mtrica)
2. Estadstica Descriptiva
-22-
MTODOS DE DEPENDENCIA ENTRE VARIABLES
Mtodo Relacin funcional
Anlisis
discriminante
mltiple
n211 XXXY
(no mtrica) (mtrica)
Anlisis conjunto n211 XXXY
(no mtrica, mtrica) (mtrica)
Correlacin
cannica n21m21 XXXYYY
(mtrica, no mtrica) (mtrica, no mtrica)
Modelo de
ecuaciones
estructurales
n112111 XXXY
n222212 XXXY
n332313 XXXY
(mtrica, no mtrica) (mtrica, no mtrica)
2.2 ESTADSTICA DESCRIPTIVA UNIDIMENSIONAL
Si observamos una variable X y disponemos de n datos, en la forma x,...,x,x n21 , una
manera sencilla de representarlos es mediante una tabla o un histograma de
frecuencias.
Llamamos "frecuencia absoluta" de un valor, al nmero de veces que aparece
dicho valor. La "frecuencia relativa" es el nmero de veces que aparece el valor
dividido por el nmero total de datos observados. Esto es:
nesobservacio de total nmero
aparece que veces de nmero=relativa Frecuencia
El campo de existencia de una variable es el conjunto de posibles valores que
pueden tomar los datos.
2. Estadstica Descriptiva
-23-
2.2.1. Tablas de frecuencias
Una vez ordenados los datos de menor a mayor y agrupados en intervalos, se puede
formar la siguiente tabla de frecuencias,
N
Lmites
del
intervalo
Valor
de
clase
Frecuencia Frecuencia
relativa
Frecuencia
acumulada
Frecuencia
acumulada
relativa
1 1n n
n1 1n
n
n1
21 nn n
nn 21
i ii bxa ix in ii f
n
n i21 nnn
n
nnn i21
k kn n
nk n 1
Sumas n 1
2.2.2. Histogramas
El histograma de frecuencias divide el campo de existencia de la variable en una
serie de intervalos, que por lo general, son de igual longitud, determinando
exactamente los lmites de cada intervalo.
Para cada intervalo contamos el nmero de datos que pertenecen al mismo, y
en un diagrama X-Y, tomando como eje X la variable, y como ordenadas el nmero
de datos que hay en cada intervalo, representamos unos rectngulos con base igual
2. Estadstica Descriptiva
-24-
a la longitud del intervalo de clase y con altura igual al nmero de datos de dicha
clase.
Con el histograma podemos ver qu intervalos son ms frecuentes que otros.
Para ello es importante el nmero de subdivisiones que hagamos, ya que si son
pocas, no veremos nada, y si son muchas, tampoco. Por lo general, el nmero de
intervalos se sita entre 5 y 20. Tambin est la opcin de tomar como nmero de
intervalos la raz cuadrada del nmero de datos.
Si en lugar de poner como altura de los rectngulos la frecuencia absoluta,
ponemos la frecuencia relativa, se tiene el "histograma de frecuencias relativas", cuya
forma es exactamente la misma que el histograma de frecuencias absolutas, slo que
hay un cambio de escalas en la ordenada.
Al punto medio de cada intervalo se le llama valor de clase y representa a
dicho intervalo.
Si empezando por la izquierda del histograma, vamos acumulando las
frecuencias de los siguientes rectngulos, y los representamos, tendremos una figura
con una serie de rectngulos escalonados. Esta figura recibe el nombre de
"histograma de frecuencias acumuladas", el cual puede ser de frecuencias absolutas
o relativas, segn lo que vayamos acumulando.
Si la variable es discreta, el valor de la clase coincide con el valor discreto,
entonces recurrimos a un "diagrama de barras", colocando encima de cada valor una
barra de longitud igual a la frecuencia del valor. Lo mismo hacemos si las clases
corresponden a valores de una variable cualitativa (tipo de defecto,)
Figura 2. 1 Ejemplo de histograma.
2. Estadstica Descriptiva
-25-
2.2.3. Polgono de frecuencias
Un polgono de frecuencias se obtiene uniendo los puntos medios de la base superior
de cada rectngulo. Al igual que con los histogramas, tendremos cuatro tipos de
polgonos de frecuencias.
Histogram
43 53 63 73 83 93 103
Peso
0
3
6
9
12
15
18
freq
uen
cy
Figura 2. 2 Polgono de frecuencias
2.2.4. Diagrama de puntos
Cuando hay pocos datos se pueden representar con un diagrama de puntos, el cual
se forma haciendo coincidir un punto grueso con cada valor de X que aparece. En
caso de que haya dos iguales, se coloca un punto encima de otro.
Figura 2. 3 Diagrama de puntos
2. Estadstica Descriptiva
-26-
2.2.5. Grfico de tartas
Otra representacin tpica para variables cualitativas es el grfico de tartas o en
crculo, en el cual cada clase se representa por un sector de rea proporcional a su
frecuencia. La frecuencia puede ser absoluta o relativa. En este ltimo caso se
interpreta que el 100% de la tarta se reparte entre las clases existentes.
Figura 2. 4 Grfico de tartas
2.2.6. Grfico de Pareto
El grfico de Pareto es un histograma de frecuencias pero ordenado de mayor
frecuencia a menor frecuencia. De esta forma se intenta destacar el hecho de que
unas pocas clases representan casi el total de los datos aparecidos. Esto recibe el
nombre de la ley del 20-80%, que se aplican en distintos aspectos de la economa.
Figura 2. 5 Grfico de Pareto
2. Estadstica Descriptiva
-27-
Adems de dar grficamente la situacin de los valores de una variable X, nos
interesa bsicamente contestar a dos preguntas:
1) Dnde est situada la variable?
2) Cul es su campo de variabilidad?
Para poder realizar comparaciones necesitamos unos valores numricos.
Aquellos que contestan a la primera pregunta se llaman "parmetros de posicin", y
los de la segunda pregunta, "parmetros de dispersin".
2.2.7. Medidas de posicin
Los parmetros de posicin que vamos a ver son: la media, la mediana, y la moda.
Si de una variable X, tenemos un conjunto de valores x,...,x,x n21 , se define la
media como:
n
x
=x
i
n
=1i
Este valor coincide con la media aritmtica, pero como aqu slo son un parte
de los posibles valores de X, se denomina "media muestral".
Cuando el conjunto de valores de que disponemos son todos los de la
variable X, al conjunto de ellos se denomina "Poblacin", y su media recibe el nombre
de "media poblacional", representndola con el smbolo :
N
x
=m=
i
N
=1i
La media muestral representa el centro de masas de un histograma, y
corresponde al valor medio que toman los datos.
Es una medida poco robusta, ya que ante la aparicin de un valor anmalo, la
media se ve bastante modificada.
La "mediana" expresa aquel valor que por debajo de l hay 50% de los datos,
y por encima el 50% de los datos. Se representa por X~
, para una muestra, y el valor
depende de si el nmero de datos es impar o par. Si es impar la mediana coincide
con el valor central, previamente ordenados los valores de menor a mayor, y si es
2. Estadstica Descriptiva
-28-
par, se toma el punto medio de los valores centrales. De aqu que empleemos la
expresin:
impar es n si2
x+x
impar es n siX
=X~
1)+([n/2](n/2)
)2
1+n(
La "mediana poblacional" se representa por ~ .
La mediana es una medida robusta, esto es, se modifica poco ante la
aparicin de un dato anmalo.
La "moda" es aquel valor de X que se repite ms, es decir, el de ms
frecuencia. Si solamente hay una moda, se denomina "unimodal"; si hay varias, se
llama "multimodal". Vienen a ser los picos que forman un histograma de frecuencias
no acumulado.
En una distribucin simtrica, coinciden los tres parmetros, pero si hay una
cola hacia la derecha, lo que se llama "asimetra positiva", ocurre que:
moda < mediana < media
f(x)
moda
mediana
media
Asimtrica positiva
s
x~xPearson.Asim.Coef
y si la cola es hacia la izquierda, es "asimetra negativa", y ocurre que
moda > mediana > media
2. Estadstica Descriptiva
-29-
f(x)
x
moda
mediana
media
Asimtrica negativa
s
x~xPearson.Asim.Coef
Se define el "percentil p%" como aqul valor de X que deja a su izquierda un
p% de los datos. Si p = 25%, se le llama "primer cuartil" Q1 , si p= 50%, es el
"segundo cuartil " Q2 , que coincide con la mediana, y para p=75% es el "tercer
cuartil" Q3 . Los cuartiles dividen a los datos en 4 partes con igual nmero de ellos.
f(x)
x
25% 25%
25%25%
Q1 Q2 Q3
CUARTILES
2.2.8. Medidas de dispersin
Las principales medidas que empleamos son: la varianza, la desviacin tpica, el
rango, y el coeficiente de variacin.
La varianza poblacional se representa por 2 , y se define con todos los datos
de la poblacin:
2. Estadstica Descriptiva
-30-
N
)-x(
=
2
i
N
=1i2
Para el conjunto de valores x,...,x,x,x n321 de la variable X, la "varianza" es:
1-n
)x-x(
=s
2
i
n
1=i2
Dicho valor nos sirve para hacer estimaciones de la varianza poblacional y recibe el
nombre de "cuasivarianza o varianza muestral corregida:
La varianza es una medida cuyas unidades estn al cuadrado. Para hacerlas
homogneas con las unidades de los datos y de la media se define la "desviacin
tpica muestral" como la raz cuadrada con signo positivo de la varianza muestral.
As:
s+=s2
Cuanto mayor es la varianza, mayor es la dispersin de los datos.
Otra idea de la variabilidad de los datos la proporciona el "recorrido", que se
define como la diferencia entre el mximo y el mnimo de los valores observados. Se
expresa como:
x-x=R minax m
Si n=2 la informacin que dan R y s2 acerca de la dispersin de los datos es
la misma, ya que utilizan los mismos datos, pero para n=3, R ya no emplea uno de
ellos, pero an es una buena aproximacin. Para n>10, el rango ya no es til para ver
la dispersin de los datos, y entonces se preferir el empleo de s2 .
El "coeficiente de variacin" es una medida adimensional de la dispersin, se
define como el cociente entre la desviacin tpica y la media, esto es:
100x
s=C.V. o bien 100CV
y permite comparar la dispersin de dos conjuntos de datos.
As, por ejemplo, dos grupos de datos pueden tener la misma dispersin, sea
s=1, pero si la media de uno es de 10, y la del otro de 1000, lgicamente hay mayor
variacin relativa en el primero que en el segundo. Este coeficiente de variacin nos
da una idea de la "precisin" de los datos.
2. Estadstica Descriptiva
-31-
Otras medidas de dispersin son.
El recorrido intercuartlico: Q3-Q1
Desviaciones:
i. Media de las desviaciones absolutas respecto a la media:
Dm=n
xxn
1i
i
ii. Mediana de las desviaciones absolutas respecto de la
mediana: MEDA= x~xmediana i
MEDIDA DE ASIMETRA
El coeficiente de asimetra es,
s
/n)x-x(
=g3
3
1
n
1=i
1
Si CA = 0 se trata de una distribucin simtrica; si CA0 la distribucin es asimtrica hacia la derecha.
MEDIDA DEL APLANAMIENTO
El coeficiente de aplanamiento es,
s
/n)x-x(
=g4
4
i
n
1=i2
Si CC=3 tiene el mismo aplanamiento (curtosis) que una campana de Gauss;
si CC>3 la distribucin es ms puntiaguda que la campana de Gauss; y si CC
2. Estadstica Descriptiva
-32-
Se trata de dividir los nmeros en dos partes. La parte de la izquierda, que
llamamos "tallo", y la parte de la derecha, que llamamos "hojas". As el nmero 123,
tenemos el 12, que constituye el tallo, y el 3, que es la hoja. De esta forma para una
misma lnea agrupamos todos los nmeros que tienen el mismo tallo, as, por
ejemplo, para el 128, se agrupa junto al anterior como:
38|12
separando el tallo de las hojas mediante una barra vertical. Si tenemos el 115,
aparece otro tallo, y ahora la figura es:
38|12
5|11
De esta manera no perdemos los datos individuales, a la vez que se va
formando algo parecido a un histograma de frecuencias.
Cuando se quiere subdividir ms las clases, los diez dgitos de la derecha se
van agrupando de dos en dos, formando 5 nuevas clases. As:
Clase * = el 0 y el 1.
Clase T = el 2 y el 3.
Clase F = el 4 y el 5.
Clase S = el 6 y el 7.
Clase . = el 8 y el 9.
Tambin se puede hacer una agrupacin en dos: una del 0 al 4, y otra del 5 al
9.
2.2.10. Diagrama de caja-y-bigotes
Otra forma de representar los datos es mediante un diagrama de una Caja, cuyos
lados vienen dados por el primer cuartil y el tercer cuartil, y en su interior se dibuja el
segundo cuartil, esto es, la mediana. Partiendo de cada lado se dibujan unas lneas
que llegan hasta el 10 percentil, por un lado, y el 90 percentil por el otro. Para datos
extensos, se dibuja el 5 y el 95 percentiles. Concretamente, en el STATGRAPHICS
los bigotes se calculan con una longitud de 1,5 veces la anchura del rectngulo, y los
extiende hasta el ltimo punto que est dentro del bigote. De esta forma aquellos
puntos que quedan fuera de los bigotes, se consideran puntos anmalos, esto es,
puntos que posiblemente no pertenecen a la distribucin considerada.
2. Estadstica Descriptiva
-33-
La anchura de la Caja contiene el 50% de los datos, lo cual da una idea de la
dispersin, y la posicin de la mediana, junto con la longitud de los bigotes nos da
una idea de la simetra o no de los datos.
Este diagrama es muy til para comparar dos grupos de datos y observar de
forma grfica si hay diferencia o no entre ellos.
Box-and-Whisker Plot
45 55 65 75 85
Peso
Figura 2. 6 Diagrama de Caja y bigotes
2.3. ESTADSTICA DESCRIPTIVA BIDIMENSIONAL
2.3.1. Tablas de frecuencia de doble entrada
Cuando para cada elemento de la poblacin, o bien para cada unidad de estudio, se
observan dos caractersticas, y clasificamos cada unidad segn las dos
caractersticas, asignndola a una de las celdillas que resultan de dividir cada
caracterstica en un conjunto de intervalos, y contamos el nmero de unidades que
resultan en cada celdilla, se tiene una tabla de doble entrada o tambin se llama una
tabla de contingencia.
Como ejemplos tenemos:
- De cada alumno de una clase tomamos nota de su peso y su altura y lo
clasificamos en su celdilla correspondiente.
- Cada persona se puede clasificar segn que haya tomado o no la vacuna
contra la gripe y segn que haya o no contrado la enfermedad.
2. Estadstica Descriptiva
-34-
- En una fbrica donde hay tres turnos de produccin se cuenta el nmero de
defectos de calidad que hay en los coches producidos y se clasifican stos
en funcin del turno en que han sido producidos(1, 2 3) y del nmero de
defectos que contienen (0, 1, 2, 3 >=4)
Las caractersticas observadas se representan por (X,Y) siendo X la primera
de ellas, por ejemplo el peso, e Y la segunda, por ejemplo la altura. Para las
unidades observadas 1, 2,..., n tenemos los valores
)y,x(),...,y,x(),y,x( nn2211 . Estas caractersticas, que tambin llamamos
variables muestrales, pueden ser ambas cualitativas, por ejemplo,
defectuoso- correcto, o tipo de defecto; o ser ambas cuantitativas, caso del
peso-altura, o bien una de ellas cualitativa y la otra cuantitativa, en cuyo
caso se dice que es una variable bidimensional mixta.
Si la primera caracterstica podemos tener I intervalos, los cuales representan
I filas de una matriz, y para la segunda caracterstica tenemos J columnas de una
matriz, entonces se tiene una tabla de doble entrada de la siguiente forma:
Tabla 2.1. Tabla de frecuencias
1
2
j
J
total
1
2
i nij ni
I
total n j n
Donde se tiene la siguiente notacin:
nij = nmero de elemento en la celdilla ij.
ni = nmero de elementos de la fila i.
n j = nmero de elementos de la columna j.
n = nmero total de elemento observados.
2. Estadstica Descriptiva
-35-
La frecuencia absoluta de cada celdilla es nij y la frecuencia relativa es:
n
n=
n
n=)y,x(f
ijij
jir
La suma de las frecuencias relativas de todas las casillas es igual a la unidad,
esto es:
1=n
n=
n
nyxf
ij
ji
jir
ji
)=,(
Como ejemplo de una tabla de doble entrada, supongamos que un fabricante
de automviles dispone de tres turnos de fabricacin de coches, y para cada turno
cuenta aquellos coches que han tenido 0 defectos de calidad, 1, 2,3, ms de 4
defectos de calidad. Para un da de produccin ha obtenido la siguiente tabla de
doble entrada
Tabla 2.2. Ejemplo de tabla de frecuencias
nmero de defectos de calidad
0 1 2 3 >=4 Total
turno
A 310 50 30 40 20 450
B 390 40 60 50 10 550
C 220 60 90 10 20 400
Total 920 150 180 100 50 1400
La tabla de frecuencias relativas es:
Tabla 2.3. Tabla de frecuencias relativas
nmero de defectos de calidad
0 1 2 3 >=4 Total
turno
A .221 .036 .021 .029 .014
B .279 .029 .043 .036 .007
C .157 .043 .064 .007 .014
Total
2. Estadstica Descriptiva
-36-
2.3.2. Frecuencias marginales
Si a partir de una tabla de doble entrada solamente queremos estudiar una de las
caractersticas, tomaremos las frecuencias que aparecen en el lado derecho de la
tabla, si deseamos estudiar la primera caracterstica, o bien la fila que el margen de
abajo, si deseamos estudiar las segunda caracterstica. Cada una de esas
frecuencias son las llamadas frecuencias marginales, ya que aparecen justamente
en los mrgenes de las tablas de doble entrada.
As la frecuencia relativa de la clase xi es:
n
n=)x(f
iir
y la frecuencia relativa de la clase y j es:
n
n=)y(f
j
jr
Lgicamente se cumple que:
1=n
n=
n
nxf
i
i
ir
i
)=(
y
1=n
n=
n
nyf
.j
j
jr
j
)=(
Por ejemplo la distribucin de frecuencias marginales del nmero de defectos
de calidad es:
2. Estadstica Descriptiva
-37-
Tabla 2.4. Tabla de frecuencias marginales
nmero de defectos de calidad
0 1 2 3 >=4 Total
turno
A .321
B .393
C .286
Total .657 .107 .129 .071 .036
2.3.3. Frecuencias condicionales
En otras situaciones se quiere conocer la distribucin de una variable para un valor
dado de la otra. Por ejemplo, en la tabla de doble entrada para una valor de y j se
desea conocer la distribucin de las casillas que aparecen en esa columna. Dicha
distribucin recibe el nombre de distribucin de frecuencias condicionales, y su valor
para cada casilla es:
n
n=)y/ x(f
j
ij
jir
Como es lgico, la suma de todas las frecuencias condicionales para ese
valor de y j es igual a la unidad.
1=n
n=
n
nyxf
j
j
j
ij
i
jir
i
)=/ (
Por ejemplo para el turno B la distribucin de frecuencias condicionales es:
2. Estadstica Descriptiva
-38-
Tabla 2.5. Tabla de frecuencias condicionales
nmero de defectos de calidad
0 1 2 3 >=4 Total
turno
A
B .709 .073 .109 .091 .018 1.000
C
Total
2.3.4. Representaciones grficas de las distribuciones bidimensionales
Cuando se tienen los datos como )y,x(),...,y,x(),y,x( nn2211 una forma inmediata de
representacin son unos ejes coordenados en los que cada punto representado
corresponde a un elemento observado con la primera coordenada igual al valor de X
y la segunda coordenada igual al valor de Y. Por ejemplo, si de cada alumno de la
clase se ha observado el peso y la altura, cada punto representa a un alumno.
El inters de estas representaciones se basa en la necesidad de contestar a
las preguntas de:
- Existe una relacin lineal entre las dos caractersticas?
- Cul es el grado de relacin lineal que hay?
- Se puede predecir un valor a partir del otro?
El diagrama que resulta recibe el nombre de diagrama de dispersin. Un
ejemplo de diagrama de dispersin aparece en la Figura 2.7.
2. Estadstica Descriptiva
-39-
Plot of Peso vs Altura
150 160 170 180 190 200
Altura
45
55
65
75
85
Peso
Figura 2. 7 Grfico de Dispersin
Otra forma de representacin es el histograma en tres dimensiones. Este
consiste en representar en un sistema de ejes X-Y-Z, las celdillas de la tabla de doble
entrada como formando un suelo de baldosas en el plano X-Y, y encima de cada
baldosa, que corresponde con cada casilla, una columna de altura proporcional a la
frecuencia relativa de cada una de ellas. Un ejemplo de histograma en tres
dimensiones es el que aparece en la Figura 2.8.
Figura 2. 8 Histograma en 3 dimensiones
2. Estadstica Descriptiva
-40-
El volumen del edificio que resulta se dice que es igual a la unidad. La
proyeccin de ese edificio sobre el plano X-Z resulta el histograma de frecuencias
relativas de X, y la proyeccin del edificio sobre el plano Y-Z resulta el histograma de
frecuencias relativas de la caracterstica Y.
2.3.5. Covarianza muestral
Mediante el grfico de dispersin o el histograma tridimensional, se puede observar si
hay una relacin lineal entre las variables, es decir, si para valores altos de una de
ellas, la otra tambin toma valores elevados. En este caso la relacin lineal es en
sentido positivo, y grficamente los puntos tienden a situarse alrededor de una recta
de pendiente positiva.
Cuando para valores altos de X se observan valores bajos de Y se dicen que
la relacin lineal es negativa.
Para dar una idea numrica de la relacin lineal entre las dos variables, se
define la covarianza muestral sxy como:
)y-y)(x-x(1n
1=s ii
i
2xy
Como sxy tiene dimensiones, por ejemplo para (peso, altura) puede ser
kgs.cms, con objeto de tener una medida adimensional, se emplea el coeficiente de
correlacin muestral r xy que se define por:
ss
s=r
yx
2xy
xy
r xy es un valor que siempre est entre -1 y +1. Cunto ms se acerca a la
unidad en valor absoluto, mayor es la relacin lineal que hay entre las dos variables.
Si vale cero, no hay ninguna relacin lineal entre las dos variables
2.3.6. Regresin lineal
Si observamos una relacin lineal entre los valores de X e Y, podemos ajustar un
recta que sea la que minimice, para el conjunto de todos los casos, la suma de
cuadrados entre el valor observado y el predicho por dicha recta.
2. Estadstica Descriptiva
-41-
La ecuacin de la recta de regresin de ajuste por mnimos cuadrados del
valor de Y conocido un valor de x, viene dada por,
)xx(s
sryy
x
y
xy
O bien,
)xx(s
syy
2
x
xy
2.4. PROBLEMAS Y CUESTIONES DE EXMENES
2.4.1.- En las pruebas de acceso del ltimo ao se seleccionaron al azar 120
alumnos de tres tipos de colegio y se tomaron en cuenta las notas obtenidas por cada
uno de ellos. Con estos datos se defini la variable aleatoria bidimensional (Tipo de
colegio, Calificaciones obtenidas) como muestra la tabla siguiente:
SUSPENSOS APROBADOS NOTABLES SOBRESALIENTES Total
fila
-----------------------------------------------------
PUBLICO | 3 | 15 | 22 | 6 | 46
-----------------------------------------------------
PRIVADO | 3 | 24 | 8 | 5 | 40
-----------------------------------------------------
CONCERTADO | 4 | 8 | 17 | 5 | 34
-----------------------------------------------------
Total columna 10 47 47 16 120
a) Completar la tabla anterior calculando las probabilidades de la distribucin
bidimensional conjunta de la variable (Tipo de colegio, Calificaciones) (0,5
puntos)
b) Completar la tabla siguiente con las distribuciones unidimensionales
marginales de las variables Tipo de colegio y Calificaciones (1 punto)
2. Estadstica Descriptiva
-42-
SUSPENSOS APROBADOS NOTABLES SOBRESALIENTES Total
fila
-----------------------------------------------------
PUBLICO | 3 | 15 | 22 | 6 | 46
-----------------------------------------------------
PRIVADO | 3 | 24 | 8 | 5 | 40
-----------------------------------------------------
CONCERTADO | 4 | 8 | 17 | 5 | 34
-----------------------------------------------------
Total columna 10 47 47 16 120
c) Completar la tabla siguiente con la distribucin condicional de las calificaciones en los colegios privados (0,5 puntos)
SUSPENSOS APROBADOS NOTABLES SOBRESALIENTES Tot fila
-----------------------------------------------------
PUBLICO | 3 | 15 | 22 | 6 | 46
-----------------------------------------------------
PRIVADO | 3 | 24 | 8 | 5 | 40
-----------------------------------------------------
CONCERTADO | 4 | 8 | 17 | 5 | 34
-----------------------------------------------------
Total columna 10 47 47 16 120
2. Estadstica Descriptiva
-43-
SOLUCIN
Las frecuencias de cada casilla (en porcentaje) son:
SUSPENSOS APROBADOS NOTABLES SOBRESAL. Total
fila
PBLICO 3/120 15/120 22/120 6/120
PRIVADO 3/120 24/120 8/120 5/120
CONCERTADO 4/120 8/120 17/120 5/120
Total columna 120
Las distribuciones marginales (en porcentaje) son:
SUSPENSOS APROBADOS NOTABLES SOBRESAL. Total fila
PBLICO 46/120
PRIVADO 40/120
CONCERTADO 34/120
Total columna 10/120 47/120 47/120 5/120 120
La distribucin condicional de las notas para los colegios privados (en porcentaje) es:
SUSPENSOS APROBADOS NOTABLES SOBRESAL. Total
fila
PBLICO
PRIVADO 3/40 24/40 8/40 5/40 40
CONCERTADO
Total columna
2.4.2.- A partir del diagrama siguiente, que representa los datos de consumo
elctrico mensual entre enero 2010 y junio 2011, elija la respuesta correcta a las
2. Estadstica Descriptiva
-44-
siguientes preguntas:
Box-and-Whisker Plot
Consumo
20 30 40 50 60 70
1. El consumo medio ha sido: (0,25 puntos)
a. 49.4
b. 56.5
c. 43.5
2. El 75% de los meses se consumi: (0,25 puntos)
a. Menos de 56.5 .
b. Ms de 56.5 .
c. Entre 43.5 y 56.5 .
3. El consumo mnimo observado en estos 20 meses fue de: (0,25 puntos)
a. 20 .
b. 39 .
c. 42.5 .
4. La distribucin tiene una asimetra (0,25 puntos)
a. Positiva, porque el tercer cuartil es mayor que el primer cuartil.
b. Negativa, porque el tercer cuartil es mayor que el primer cuartil.
c. Se puede decir que la distribucin es simtrica.
5. El 50% de los meses se consumi: (0,25 puntos)
a. Ms de 56.5 .
b. Menos de 43.5 .
2. Estadstica Descriptiva
-45-
c. Entre 43.5 y 56.5 .
2.4.3.- Una empresa decide realizar un estudio sobre el consumo de un determinado
material, necesario para el proceso de fabricacin que lleva a cabo, en funcin del da
de la semana, en vistas a optimizar su stock semanal del producto y la deteccin de
posibles anomalas. Se han analizado un total de 57 das, de lunes a viernes. Con
estos datos de consumo se realiza el diagrama Box-Whisker mltiple que se muestra
a continuacin:
Lunes
Martes
Mircoles
Jueves
Viernes
Grf ico de Cajas y Bigotes
0 100 200 300 400 500
CONSUMO
DIA
2. Estadstica Descriptiva
-46-
A la vista de los diagramas, responder a las siguientes preguntas justificando
convenientemente las respuestas.
1. La mayor dispersin de consumo se produce: (0.25 puntos)
a. Los lunes b. Los martes c. Los mircoles d. Todos tiene la misma dispersin ya que el consumo es independiente
del da Pues el rango intercuartlico es mayor.
2. La mayor asimetra se presenta: (0.25 puntos) a. Los jueves y es positiva b. Los martes y es negativa c. Los martes y es positiva d. Los jueves y es negativa
Pues ese da se da la mayor distancia entre la mediana y la media, y media > mediana.
3. En trminos medios, los das de menor consumo son: (0.25 puntos)
a. Los mircoles b. Los viernes c. Los martes d. No se dispone de datos suficientes
Pues la media es la que est ms a la izquierda de todos los das.
4. Cul de las siguientes afirmaciones es cierta? (0.25 puntos)
a. El 75% de los lunes se consume por encima de 300 b. El 75% de los lunes se consume por debajo de 300 c. El 25% de los mircoles se consume por debajo de 260 d. El 25% de los mircoles se consume por encima de 180
El lmite derecho de la caja de los lunes, que corresponde al tercer cuartil, est en 300.
3. Probabilidades
-47-
TEMA 3. PROBABILIDADES
Contenido 3.1. INTRODUCCIN ........................................................................................... 47
3.2. PROBABILIDAD ............................................................................................. 48
3.2. ESPACIOS DE PROBABILIDADES ............................................................... 48
3.4. PROBABILIZACIN DE ESPACIOS MUESTRALES ..................................... 52
Probabilizacin de Espacios Muestrales Discretos ............................................ 52
Probabilizacin de Espacios Muestrales Finitos Simtricos. Combinatoria ........ 53
Combinatoria ..................................................................................................... 53
3.5. PROBABILIDAD CONDICIONADA ................................................................ 54
3.6. TEOREMA DE LA INTERSECCIN............................................................... 56
3.7. TEOREMA DE LA PARTICIN TOTAL .......................................................... 56
3.8. SUCESOS INDEPENDIENTES ...................................................................... 57
3.9. TEOREMA DE BAYES ................................................................................... 58
3.10. PROBLEMAS PROPUESTOS ..................................................................... 59
Probabilidad condicional.................................................................................... 61
3.11. PROBLEMAS Y CUESTIONES DE EXMENES ........................................ 66
3.1. INTRODUCCIN
El objeto central del Clculo de probabilidades y de la estadstica, lo constituyen los
llamados fenmenos aleatorios. Los fenmenos aleatorios son aquellos fenmenos
reales que se caracterizan por la impredecibilidad de sus resultados y por la llamada
regularidad estadstica.
El clculo de probabilidades se ha desarrollado en situaciones en las cuales
se realiza un experimento y se observa un resultado. Pero dicho resultado no se
puede predecir de antemano con exactitud. A estos experimentos los llamamos
Experimentos Aleatorios. Este concepto tiene otras caractersticas comunes. La
primera de ellas es que no podemos saber de antemano su resultado, a lo sumo
podemos describir un conjunto de posibles resultados. Segundo es que dicho
experimento lo podemos repetir exactamente en las mismas condiciones y el
resultado ser totalmente distinto. No obstante, a medida que el nmero de
repeticiones del experimento va aumentando se presenta un comportamiento
caracterstico de la frecuencia con que aparece cada resultado, que llamamos
"regularidad estadstica"
3. Probabilidades
-48-
Si llamamos n al nmero de repeticiones del experimento aleatorio, a la frecuencia absoluta, es decir, al nmero de veces que ocurre un determinado
resultado y a f r su frecuencia relativa, tendremos que:
n=f r
Por definicin de fenmeno aleatorio, cuando n crece fr tiende a estabilizarse
alrededor de un cierto valor. Cuando el fenmeno aleatorio tiene esta propiedad,
diremos que posee la caracterstica de la Regularidad Estadstica.
3.2. PROBABILIDAD
Al repetir el experimento aleatorio, se observa que unos resultados aparecen ms
que otros, por lo cual cabe hablar de la posibilidad de que un suceso aparezca ms
veces que otro. Esto es, a cada suceso asociamos una medida de la posibilidad de
que tenga lugar. A esta medida se llama probabilidad de ocurrencia del suceso.
Tres puntos de vista o enfoques de la probabilidad:
Frecuencialista: la probabilidad de un suceso es el lmite al que tiende la
frecuencia relativa con que se presenta dicho suceso.
Objetivas: es el grado de evidencia de una proposicin cualquiera.
Subjetiva: es el grado de creencia personal en la veracidad de una
proposicin.
3.2. ESPACIOS DE PROBABILIDADES
Figura 3. 1 Espacio muestral
E= Espacio muestral
x
x
x
x
x
A
A=suceso compuesto
x=suceso elemental
3. Probabilidades
-49-
Al conjunto de los posibles resultados del experimento aleatorio se denomina
"Espacio muestral". Grficamente lo solemos representar por un crculo, tal como
aparece en la Figura 3. 1.
Si los resultados se pueden contar, o se pueden contabilizar, aunque sea para
un nmero infinito, el espacio muestral es discreto.
Si el espacio muestral es incontable, caso de un nmero real en el intervalo
de la recta real, se dice que el espacio muestral es "continuo".
Ejemplos de espacio muestrales son:
- Nmero de puntos al lanzar un dado (discreto y finito),
- Nmero de accionamiento de un interruptor hasta su fallo (discreto e infinito
numerable),
- Medida del peso de un paquete de arroz (contnuo).
Al espacio muestral lo representamos por la letra E.
Actividad 3.1:
Cul es el espacio muestral al lanzar un dado?
Cul es el espacio muestral al lanzar una moneda?
Cul es el espacio muestral al medir el peso de un paquete de arroz?.
Un suceso A, es cualquier subconjunto contenido en el espacio muestral. Si el
suceso es un posible resultado del experimento aleatorio, lo llamamos "suceso
elemental". Cualquier otro subconjunto se denomina "suceso compuesto".
Otros sucesos que se definen a partir del espacio muestral son:
1) Suceso vaco. El que tericamente nunca va a aparecer. Lo representamos por
. (ej. Obtener 7 puntos al lanzar un dado normal)
2) Suceso cierto. El que siempre aparece. El suceso E siempre aparece, ya que al
realizar el experimento aleatorio siempre tendr lugar algn resultado del espacio
muestral.
3) Suceso complementario. Dado el suceso EA , el complementario A ocurre cuando no aparece el A.
3. Probabilidades
-50-
4) Sucesos mutuamente excluyentes. Cuando dados dos sucesos A,A 21 , si
ocurre uno de ellos no ocurre el otro, es decir, no se pueden dar al mismo
tiempo.
5) Suceso unin. Dados dos sucesos A,A 21 , se llama suceso unin AA 21
cuando aparece el A1 o el A2 ambos a la vez. Tambin recibe el nombre de
adicin.
6) Suceso interseccin. Dados los sucesos EA,A 21 se llama interseccin
AA 21 , cuando sucede A1 y A2 a la vez.
Al igual que con el conjunto de nmeros se establecen unas operaciones que
dan lugar a otros nmeros, con los sucesos pertenecientes al espacio muestral, y
mediante operaciones de complementacin, unin e interseccin, dan lugar a otros
sucesos. El conjunto de dichos sucesos se dice que forman una -lgebra si se
cumplen las dos condiciones siguientes:
1) Si FA el suceso A tambin pertenece a F.
2) Si F,....A,A 21 , el suceso unin infinita tambin pertenece a F.
Recordar las propiedades conmutativas y asociativas de la unin y de la
interseccin, y la propiedad distributiva de cada una de estas operaciones respecto
de la otra.
Realmente la probabilidad es una aplicacin del espacio muestral en la recta
real. Dado un espacio muestral E, y una -algebra F, decimos que la aplicacin
F:P es una probabilidad, si y solo si se cumplen los siguientes axiomas:
1) 0P(A) FA
2) 1=P(E)
3) )AP(AAA F;,....A,A ii
ij
ji
i21 =)P( es =
A partir de estos axiomas se demuestran las siguientes propiedades:
1) Probabilidad del suceso contrario: P(A)-1=)AP(
2) Probabilidad del suceso vaco: 0=1-1=P(E)-1=)P(
3. Probabilidades
-51-
3) Inclusin. Si P(B)P(A) B,A
4) 1P(A)0 F,A , ya que cualquier EA .
5) Probabilidad de la unin: B)P(A-P(B)+P(A)=B)P(A
Grficamente se observa en la Figura 3. 2.
Figura 3. 2 Unin de sucesos
La demostracin es:
=B)A(Ay B),A(A=BA
la probabilidad ser la suma de probabilidades,
B)AP(+P(A)=B)P(A
pero tambin el suceso B se puede poner como
B)A(B)(A=B
como son conjuntos disjuntos
B)AP(+B)P(A=P(B)
de donde despejando B)AP( queda:
B)P(A-P(B)+P(A)=B)P(A
E= Espacio muestral
B A
AB
3. Probabilidades
-52-
Como generalizacin de la unin de tres o ms sucesos, tenemos la
expresin general de la unin de sucesos:
C)BP(A+C)P(B-C)P(A-B)P(A-P(C)+P(B)+P(A)=C)BP(A
Observar la correspondencia que hay entre probabilidades y la frecuencia
relativa de un suceso A.
A la tripleta (E,F,P) se denomina espacio probabilstico.
Actividad 3.2:
Un submarino lanza tres torpedos contra un barco. Cada uno de los torpedos
tiene una probabilidad de 0,7 de alcanzar el barco. Cul es la probabilidad
de hundir el barco?
Si de una baraja de 40 cartas extraemos 3 al azar, cul es la probabilidad
de que salgan 2 oros?
o Con reposicin,
o Sin reposicin.
3.4. PROBABILIZACIN DE ESPACIOS MUESTRALES
Podemos asimilar, desde un punto de vista mecnico, la probabilidad como la
cantidad de masa de 1 gramo que se reparte en el espacio muestral. De forma que la
probabilidad de un suceso corresponde con la cantidad de masa que incluye dicho
suceso dentro del espacio muestral. Si el espacio muestral es discreto, la cantidad de
masa de un gramo se encuentra repartida en un serie de puntos discretos. Si el
espacio muestral es continuo, la masa se reparte de forma continua en el espacio
muestral, aunque puede haber zonas donde haya ms cantidad de masa que en
otras.
Probabilizacin de Espacios Muestrales Discretos
Cuando el espacio muestral es discreto, cada resultado elemental tiene asignado un
peso, probabilidad, de manera que la suma de pesos elementales debe dar la unidad,
ya que la unin de todos ellos forma el espacio muestral E, y cada suceso elemental
es excluyente respecto a cualquier otro suceso elemental.
Si el espacio muestral discreto es finito y, adems cada uno de los resultados
es igualmente probable, entonces el peso, o probabilidad, que asignamos a cada
3. Probabilidades
-53-
suceso elemental es 1/n de resultados que hay. Pero si es un espacio muestral
discreto infinito pero numerable, como la suma debe dar 1, no puede pesar igual un
resultado que otro, no obstante se debe cumplir que la suma infinita de los pesos
converja a la unidad.
En cualquiera de los casos anteriores, la probabilidad de un suceso
compuesto es la suma de las probabilidades de los resultados individuales que lo
integran.
Probabilizacin de Espacios Muestrales Finitos Simtricos. Combinatoria
Para el caso de un espacio muestral discreto finito y simtrico, esto es, que cada
posible resultado tiene el mismo peso, la probabilidad de un suceso se puede calcular
sumando las probabilidades de los sucesos elementales que incluye, lo cual equivale
a aplicar la regla de:
posibles casos
favorables casos=A) P(suceso
y para hacer un recuento de casos favorables y casos posibles debemos acudir a la
combinatoria, donde habr que distinguir si influye el orden, variaciones, o no influye
el orden, combinaciones, y dentro de cada uno de ellos, si los elementos se pueden
repetir no. As tenemos el siguiente esquema:
Combinatoria
Variaciones sin repeticin de m elementos tomados de n en n.:
- 1)+n-2)...(m-1)(m-m(m=V nm,
- n!=Pn
Variaciones con repeticin de m elementos tomados de n en n:
- m=Vn
nm,
- n=...++ donde !...!
n!=P
,...,n,
Combinaciones sin repeticin de m elementos tomados de n en n:
- n)!-(mn!
m!=
n
m=C nm,
Combinaciones con repeticin de m elementos tomados de n en n.:
3. Probabilidades
-54-
-
n
1-n+m=C
nm,
La probabilizacin de espacios muestrales contnuos se lleva a cabo mediante
una funcin llamada funcin de densidad.
Actividad 3.3:
Con las letras a, b, c, d
o Cuntas palabras de 2 letras se pueden formar?
o Cuntas palabras de 3 letras se pueden formar?
o Cuntas palabras de 4 letras se pueden formar?
o Si podemos repetir las letras, cuntas palabras de 2 letras se pueden
tener?
o Si no podemos repetir las letras, cuntas combinaciones de 2 letras
podra obtener?
o Si ahora podemos repetir las letras, Cuntas palabras podemos
obtener?
3.5. PROBABILIDAD CONDICIONADA
Dado un espacio muestral E, si conocemos que ha ocurrido un suceso EA , el espacio muestral realmente se ha reducido ahora a dicho suceso A conocido, con lo
cual las probabilidades de los sucesos pertenecientes a E se modifican de acuerdo
con el conocimiento de A, y entonces el peso de cualquier EB viene dado por la parte comn de B con A en relacin al total de A, que en el nuevo espacio muestral
es el suceso cierto.
Si partimos del espacio de probabilidades (E,F,P) y conocemos el suceso
0P(A) con F,A , definimos la probabilidad de suceso C condicionado a que ha
ocurrido el suceso A, como:
P(A)
A)P(B=P(B/A)=(B)PA
3. Probabilidades
-55-
Actividad 3.4:
Al lanzar un dado, cul es la probabilidad de sacar un 2?
Si antes de mostrar el dado, yo lo veo y digo que es un nmero par, cul es
la probabilidad de que ahora sea el 2?
Esta medida as definida cumple los axiomas de probabilidad, esto es:
1) 0P(B/A)
2) 1=P(A/A)
3) Si /A)BP(+/A)BP(=/A)BBP(;=BB 212121 .
Como es una probabilidad, rene todas las propiedades de la misma, es decir:
1) P(B/A)-1=/A)BP( .
2) 0=/A)P( .
3) /A)BP(/A)BP( ,BB Si 2121 .
4) 1P(B/A)0 F,B .
5) /A)BBP(-/A)BP(+/A)BP(=/A)BBP( 21121 1
6) La definicin de probabilidad condicional se puede aplicar a la propia probabilidad
condicional:
(B)P
B)(CP=(C/B)P
A
AA
B)P(A
C)BP(A=
P(A)
B)P(A
P(A)
A)BP(C
=
A)P(C/B=P(C/B/A)
3. Probabilidades
-56-
3.6. TEOREMA DE LA INTERSECCIN
La probabilidad de la interseccin de dos sucesos se puede obtener de la propia
definicin de probabilidad condicionada como:
)P(B).P(B/A=)P(A).P(B/A=B)P(A
Para el caso de ser tres sucesos, la probabilidad de la interseccin es:
B)).P(C/AP(A).P(B/A=C)BP(A
Lo anterior tambin se aplica a probabilidades condicionales, as:
C)/AP(A/C).P(B=B/C)P(A
Si A y B son independientes tambin lo son los sucesos complementarios, as
como entre todos ellos.
3.7. TEOREMA DE LA PARTICIN TOTAL
Dado un espacio muestral E, recibe el nombre de particin al conjunto de sucesos
A,....,A,A,A n321 tales que:
1) =A.....AAA n321 siendo ji =AA ji , es decir son mutuamente
excluyentes.
2) La unin de dichos sucesos forman el espacio muestral, esto es:
E=A,.....,AA n21
Grficamente se representa en la Figura 3. 3.
Figura 3. 3 Teorema de la particin
E= Espacio muestral
B
AiB
A1 A2
An
Ai
3. Probabilidades
-57-
Si definimos otro suceso B incluido en E,