630 Estadistica Basica Para La Ingenieria

download 630 Estadistica Basica Para La Ingenieria

of 341

Transcript of 630 Estadistica Basica Para La Ingenieria

  • UNIVERSIDAD POLITCNICA DE VALENCIA

    ESTADSTICA BSICA

    PARA

    INGENIERA

    Mara Teresa Carot Snchez

    Gonzalo Clemente Marn

    Jos Mara Sanz Juan

    DEPARTAMENTO DE ESTADSTICA E INVESTIGACIN OPERATIVA APLICADAS Y CALIDAD

    Enero 2013

  • Contenido

    -2-

  • Contenido

    -3-

    CONTENIDO

    1. INTRODUCCIN

    1.1. LA METODOLOGA ESTADSTICA ............................................................ 9

    1.2. EL MTODO CIENTFICO ........................................................................ 12

    1.3. SOFTWARE ESTADSTICO ...................................................................... 14

    1.4. REDONDEO DE LOS DATOS ................................................................... 15

    1.5. ALFABETO GRIEGO ................................................................................. 17

    2. ESTADSTICA DESCRIPTIVA

    2.1. INTRODUCCIN ........................................................................................... 19

    2.2 ESTADSTICA DESCRIPTIVA UNIDIMENSIONAL ......................................... 22

    2.2.1. Tablas de frecuencias ............................................................................ 23

    2.2.2. Histogramas ........................................................................................... 23

    2.2.3. Polgono de frecuencias ......................................................................... 25

    2.2.4. Diagrama de puntos ............................................................................... 25

    2.2.5. Grfico de tartas..................................................................................... 26

    2.2.6. Grfico de Pareto ................................................................................... 26

    2.2.7. Medidas de posicin .............................................................................. 27

    2.2.8. Medidas de dispersin ........................................................................... 29

    2.2.9. Diagrama e tallos y hojas ....................................................................... 31

    2.2.10. Diagrama de caja-y-bigotes.................................................................. 32

    2.3. ESTADSTICA DESCRIPTIVA BIDIMENSIONAL ........................................... 33

    2.3.1. Tablas de frecuencia de doble entrada .................................................. 33

    2.3.2. Frecuencias marginales ......................................................................... 36

    2.3.3. Frecuencias condicionales ..................................................................... 37

    2.3.4. Representaciones grficas de las distribuciones bidimensionales .......... 38

    2.3.5. Covarianza muestral .............................................................................. 40

    2.3.6. Regresin lineal ..................................................................................... 40

    2.4. PROBLEMAS Y CUESTIONES DE EXMENES ........................................... 41

    3. PROBABILIDADES

    3.1. INTRODUCCIN ........................................................................................... 47

    3.2. PROBABILIDAD ............................................................................................. 48

    3.2. ESPACIOS DE PROBABILIDADES ............................................................... 48

    3.4. PROBABILIZACIN DE ESPACIOS MUESTRALES ..................................... 52

    Probabilizacin de Espacios Muestrales Discretos .......................................... 52

    Probabilizacin de Espacios Muestrales Finitos Simtricos. Combinatoria ...... 53

    Combinatoria ................................................................................................... 53

  • Contenido

    -4-

    3.5. PROBABILIDAD CONDICIONADA ................................................................ 54

    3.6. TEOREMA DE LA INTERSECCIN .............................................................. 56

    3.7. TEOREMA DE LA PARTICIN TOTAL ......................................................... 56

    3.8. SUCESOS INDEPENDIENTES ..................................................................... 57

    3.9. TEOREMA DE BAYES ................................................................................... 58

    3.10. PROBLEMAS PROPUESTOS ..................................................................... 59

    Probabilidad condicional .................................................................................. 61

    3.11. PROBLEMAS Y CUESTIONES DE EXMENES ........................................ 66

    4. CONCEPTO DE VARIABLE ALEATORIA

    4.1. DEFINICIN DE VARIABLE ALEATORIA UNIDIMENSIONAL ...................... 77

    4.2. FUNCIN DE DISTRIBUCIN ...................................................................... 78

    4.3. VARIABLES DISCRETAS .............................................................................. 79

    4.4. VARIABLES CONTINUAS ............................................................................. 81

    Funcin de densidad ....................................................................................... 81

    Transformacin de variables aleatorias ........................................................... 84

    4.5. ESPERANZA MATEMTICA ......................................................................... 85

    Esperanza matemtica .................................................................................... 85

    Momentos ........................................................................................................ 86

    4.6 PARMETROS DE TENDENCIA .................................................................... 88

    Valor medio ..................................................................................................... 88

    Mediana ........................................................................................................... 89

    Cuartiles .......................................................................................................... 89

    Moda ............................................................................................................... 90

    4.7. VARIANZA. CONCEPTO Y PROPIEDADES ................................................. 90

    Desviacin tpica.............................................................................................. 91

    4.8. OTROS PARMETROS DE UNA DISTRIBUCIN ........................................ 91

    Rango o Recorrido ........................................................................................... 91

    Coeficiente de variacin ................................................................................... 92

    Coeficiente de asimetra ................................................................................. 92

    Coeficiente de apuntamiento o de curtosis ...................................................... 92

    4.9. DISTRIBUCIONES BIDIMENSIONALES ....................................................... 93

    Concepto ......................................................................................................... 93

    Funcin de distribucin .................................................................................... 94

    Funcin de densidad ....................................................................................... 95

    Funcin de densidad marginal ......................................................................... 96

    Funcin de densidad condicional ..................................................................... 98

    Independencia de variables aleatorias ............................................................. 99

    Esperanza de vectores aleatorios .................................................................. 100

    Momentos ...................................................................................................... 101

    Matriz de varianzas-covarianzas .................................................................... 102

  • Contenido

    -5-

    Combinacin lineal de variables aleatorias .................................................... 106

    Curva de regresin condicional ...................................................................... 106

    Recta de regresin mnimo cuadrtica ........................................................... 107

    4.10. PROBLEMAS PROPUESTOS ................................................................... 109

    4.11. PROBLEMAS Y CUESTIONES DE EXMENES ....................................... 113

    5. PRINCIPALES DISTRIBUCIONES DISCRETAS

    5.1. DISTRIBUCIN DICOTMICA ............................................................... 121

    5.2. DISTRIBUCIN BINOMIAL ..................................................................... 122

    5.3. DISTRIBUCIN HIPERGEOMTRICA ................................................... 123

    5.4. DISTRIBUCIN DE POISSON ................................................................ 125

    5.5. DISTRIBUCIN BINOMIAL-NEGATIVA .................................................. 126

    5.6. DISTRIBUCIN MULTINOMIAL .............................................................. 127

    5.7. PROBLEMAS PROPUESTOS ................................................................. 129

    5.8. PROBLEMAS Y CUESTIONES DE EXMENES .................................... 143

    6. PRINCIPALES DISTRIBUCIONES CONTINUAS

    6.1. DISTRIBUCIN UNIFORME ................................................................... 149

    6.2. DISTRIBUCIN EXPONENCIAL ............................................................. 150

    Tasa de fallos ................................................................................................ 152

    6.3. DISTRIBUCIN NORMAL UNIDIMENSIONAL ....................................... 154

    6.3.1. Variable normal tipificada ..................................................................... 155

    6.3.2. Variable normal general ....................................................................... 158

    6.3.3. Teorema central del lmite .................................................................... 160

    Aproximacin de la binomial a la normal ....................................................... 161

    Aproximacin de la Poisson a la normal ........................................................ 162

    Correccin por continuidad ............................................................................ 163

    6.4. LA DISTRIBUCIN NORMAL BIDIMENSIONAL ..................................... 165

    Distribuciones marginales .............................................................................. 166

    Distribuciones condicionales .......................................................................... 166

    6.5. PROBLEMAS PROPUESTOS .................................................................... 169

    Distribucin uniforme ..................................................................................... 169

    Distribucin exponencial ................................................................................ 170

    Distribucin Normal ........................................................................................ 172

    Distribuciones bidimensionales ...................................................................... 182

    6.6. PROBLEMAS Y CUESTIONES DE EXMENES ........................................ 185

  • Contenido

    -6-

    7. DISTRIBUCIONES DERIVADAS DE LA NORMAL

    7.1. DISTRIBUCIN CHI-CUADRADO .......................................................... 191

    7.2. DISTRIBUCIN t ................................................................................... 192

    7.3. DISTRIBUCIN F.................................................................................... 194

    7.4. PROBLEMAS PROPUESTOS ................................................................ 195

    8. DISTRIBUCIONES EN EL MUESTRO

    8.1. POBLACIN, MUESTREO Y MUESTRA ................................................ 197

    8.2. DISTRIBUCIN DE LA VARIANZA MUESTRAL ..................................... 201

    8.3. DISTRIBUCIN DE LA MEDIA MUESTRAL ........................................... 203

    8.4. DISTRIBUCIN DEL COCIENTE DE VARIANZAS ................................. 204

    8.5. DISTRIBUCIN DE LA PROPORCIN .................................................. 206

    8.6. DISTRIBUCIN DE LA DIFERENCIA DE MEDIAS MUESTRALES ........ 207

    8.7. DISTRIBUCIN DE LA DIFERENCIA DE PROPORCIONES ................. 208

    8.8. VARIANZA EN POBLACIONES FINITAS ................................................ 210

    8.9. PROBLEMAS PROPUESTOS ................................................................ 211

    8.10. PROBLEMAS Y CUESTIONES DE EXMENES .................................... 212

    9. INTRODUCCIN A LA INFERENCIA ESTADSTICA

    9.1 ESTIMACIN PUNTUAL......................................................................... 217

    9.2. ESTIMACIN POR INTERVALOS DE CONFIANZA ............................... 220

    9.2.1. Intervalo de confianza para la media poblacional ................................. 221

    9.2.2. Intervalo de confianza para la varianza poblacional ............................. 223

    9.2.3. Intervalo de confianza para el cociente de varianzas poblacionales.... 224

    9.2.4. Intervalo de confianza para la proporcin ............................................ 225

    9.2.5. Intervalo de confianza para la diferencia de proporciones .................... 227

    9.2.6. Intervalo de confianza para la diferencia de medias poblacionales ...... 228

    9.3. TEST DE HIPTESIS ............................................................................. 230

    Conceptos ..................................................................................................... 230

    Obtencin de los tests .................................................................................. 234

    9.4. TEST DE HIPTESIS PARMETRICOS ..................................................... 235

    9.4.1. Contrastes de la media de una poblacional normal ............................. 235

    9.4.2. Test de hiptesis para la varianza poblacional ..................................... 240

    9.4.3. Test de hiptesis para el cociente de varianzas poblacionales ............ 241

    9.4.4. Contrastes de proporciones ................................................................. 242

    9.4.5. Test de hiptesis para la diferencia de medias poblacionales con

  • Contenido

    -7-

    muestras independientes ............................................................................... 246

    9.4.6. Test para la diferencia de medias poblacionales con datos apareados ...................................................................................................................... 247

    9.4.7.Test para la diferencia de proporciones ................................................ 248

    9.4.8. Test de ajuste a una distribucin .......................................................... 250

    9.4.9. Test de independencia ......................................................................... 252

    9.5. PROBLEMAS PROPUESTOS ..................................................................... 255

    Test de hiptesis ............................................................................................ 256

    Tabla de contingencia .................................................................................... 260

    Test de ajuste a una distribucin .................................................................... 261

    9.6. PROBLEMAS Y CUESTIONES DE EXMENES ......................................... 262

    10. ANLISIS DE LA VARIANZA

    10.1. ANLISIS DE LA VARIANZA (I). UN FACTOR CONTROLADO................. 271

    10.1.1. Generalidades ................................................................................... 271

    10.1.2. Modelo terico. Hiptesis del modelo ................................................ 273

    10.1.3. Hiptesis nula ................................................................................... 276

    10.1.4. Ecuacin fundamental ....................................................................... 277

    10.1.5. Test F ................................................................................................ 277

    10.1.6. Comparacin de medias. Test L.S.D. (diferencia mnima significativa) ...................................................................................................................... 278

    10.2. ANLISIS DE LA VARIANZA (II). DOS FACTORES CONTROLADOS ...... 280

    10.2.1. Introduccin. Planes factoriales ......................................................... 280

    10.2.2. Anova para dos factores con repeticiones ......................................... 281

    10.2.3. Concepto de Interaccin ................................................................... 281

    10.2.4. Modelo y supuestos tericos ............................................................. 283

    10.2.5. Hiptesis Nulas ................................................................................. 284

    10.2.6. Descomposicin de las Sumas de Cuadrados. Test F ...................... 284

    10.2.7. Comparacin de Medias. Test L.S.D. ................................................ 284

    10.2.8. Validacin del modelo ........................................................................ 287

    10.2.9. Igualdad de las varianzas ................................................................... 287

    10.2.10. Estimacin de los efectos ................................................................. 288

    10.2.11. Predicciones .................................................................................... 289

    10.3. PROBLEMAS Y CUESTIONES DE EXAMEN ............................................ 290

    11. REGRESIN LINEAL

    11.1. HIPTESIS DEL MODELO ..................................................................... 301

    11.2. ESTIMACIN DE LOS COEFICIENTES DE REGRESIN ..................... 303

    11.3. CONTRASTES DE SIGNIFICACIN DE LOS COEFICIENTES .............. 305

  • Contenido

    -8-

    11.4. VALIDACIN DEL MODELO .................................................................. 310

    11.5. INTERVALOS DE PREDICCIN ............................................................. 313

    11.6. BONDAD DE AJUSTE ............................................................................ 315

    11.7. PROBLEMAS Y CUESTIONES DE EXMENES .................................... 317

    ANEXO A. Tablas de las principales distribuciones de probabilidad

    DISTRIBUCIN DE POISSON ........................................................................... 328

    DISTRIBUCIN NORMAL TIPIFICADA .............................................................. 331

    DISTRIBUCIN DE PEARSON ........................................................................ 332

    DISTRIBUCIN t de Student ............................................................................. 335

    DISTRIBUCIN F de snedecor ........................................................................... 338

    BIBLIOGRAFA ......................................................................... 341

  • 1. Introduccin

    -9-

    1. INTRODUCCIN

    Contenido 1.1. LA METODOLOGA ESTADSTICA ............................................................ 9 1.2. EL MTODO CIENTFICO ........................................................................ 12 1.3. SOFTWARE ESTADSTICO ...................................................................... 14 1.4. REDONDEO DE LOS DATOS ................................................................... 15 1.5. ALFABETO GRIEGO ................................................................................. 17

    1.1. LA METODOLOGA ESTADSTICA

    La estadstica es la ciencia que se ocupa de recoger los datos, analizarlos, resumirlos

    e interpretarlos, y todo eso para convertir los datos en informacin, de manera que

    nos sirva para tomar buenas decisiones o bien para resolver problemas.

    Cuando alguien habla de hacer una estadstica quiere decir que le gustara

    saber aspectos como cules son los valores ms frecuentes, cules son el mximo y

    el mnimo, cul es la distribucin de sus frecuencias, porcentajes de algunos valores,

    la tendencia a lo largo del tiempo o bien hacer predicciones de valores futuros.

    La materia prima de la estadstica son los datos, y estos se pueden obtener de

    tres maneras:

    1) De datos histricos: a partir de los registros, formularios, facturas, etc. Por

    ejemplo, ventas de un determinado producto.

    2) Datos experimentales: se hacen pruebas para ver cmo funciona un

    proceso. Por ejemplo, qu relacin hay entre el rendimiento y la temperatura

    de un proceso.

    3) A partir de encuestas: es muy comn intentar conocer a una poblacin a

    partir de una pequea parte de la misma elegida al azar. Por ejemplo, para

    conocer las opiniones de los alumnos de la UPV, en lugar de preguntar a los

    37000 ms de alumnos, es ms econmico preguntar a una parte

    representativa de la poblacin a estudiar.

    Esta tercera forma se la que vamos a seguir en primer lugar en el inicio de

    esta materia en la ETSII.

    Un ejemplo de encuesta es la que se muestra a continuacin:

  • 1. Introduccin

    -10-

    Los pasos que seguimos son:

    EL OBJETO DE ESTA ENCUESTA ES OBTENER DATOS PARA LA REALIZACIN DE EJERCICIOS EN LAS CLASE DE ESTADSTICA. Pregunta 1. Indique su peso en kgs.

    [________] Pregunta 2. Indique su altura en cms. [________] Pregunta 3. Qu medios de transporte emplea para venir a la UPV?

    1. Coche propio 2. Coche compartido 3. Bus 4. Metro o tranva 5. Bicicleta 6. Andando 7. Tren 8. Moto 9. Otro Pregunta 4. Tiempo diario dedicado al estudio, en horas, de lunes a viernes [________] Pregunta 5. Tiempo dedicado al estudio durante el fin de semana (sbado y domingo), en horas.

    [________] Pregunta 6. Tiempo que tarda en llegar al Politcnico por las maanas, en minutos. [________] Pregunta 7. Qu deportes practica en la UPV?

    1. Ftbol 2. Ftbol sala 3. Baloncesto 4. Tenis 5. Natacin 6. Bici 7. Gimnasia 8. Artes marciales 9. Vela 10. Marcha 11. Montaismo 12. Otros Pregunta 8. Nota de entrada en la Universidad [________]

    Pregunta 9. Dispone de conexin a internet desde casa? 1. Si 2. No Pregunta 10. En general, las instalaciones y servicios ofertados por la UPV son,

    1. Muy malos 2. Malos 3. Regular 4. Buenos 5. Muy buenos Pregunta 11. Edad. [________]

    Pregunta 12. Sexo. 1. Hombre 2. Mujer MUCHAS GRACIAS POR SU COLABORACIN

  • 1. Introduccin

    -11-

    1) Repartir el cuestionario a los alumnos y cumplimentarlo.

    2) Introducir los datos al ordenador. Para esto podemos desarrollar un programa

    de captura de los datos aprovechando el Access de Microsoft, o mejor un

    programa que est preparado por la captura de los datos de los encuestas,

    como puede ser el DYANE 4.

    3) Una vez introducido los datos, hay que revisarlos por si hay alguien error o

    valor raro que no fuera correcto.

    4) Hacer anlisis descriptivos de los datos:

    a) Resumen de todos los valores,

    b) Resumen en forma grfica.

    5) Contestar a varias preguntas, aplicando la metodologa estadstica pertinente.

    Ejemplos de preguntas puede ser:

    a) Cul es la nota media de acceso a la Universidad?

    b) Cul es la proporcin de alumnos que cogen la bici para venir al Poli?

    c) Cul distribucin de edades que hay en la clase?

    d) Cul es la relacin que hay entre el peso y la altura de los alumnos?

    e) La altura de los alumnos es diferente si es chico o chica?

    f) etc.

    La metodologa estadstica que aplican se resume en la figura siguiente

  • 1. Introduccin

    -12-

    Metodologa

    estadstica

    Recogida

    de los datos

    Organizacin y

    representacin

    Estadstica

    predictiva

    Descriptiva

    Inferencia

    estadstica

    Distribucin de

    frecuencias

    Histogramas

    Tendencia central

    Dispersin

    Pruebas de hiptesis

    Analisis de la

    variancia

    Diseo de

    Experimentos

    Anlisis de

    correlacin

    Analisis de

    regressin

    Estimacin

    Modelos

    Clculo de

    probabilidades

    Variable

    aleatoriaDistribuciones

    Figura 1. 1. La metodologa estadstica

    La inferencia estadstica se el proceso de conocer las propiedades de una poblacin

    a partir de una muestra representativa de la misma.

    La Estadstica tiene su fundamento en el clculo de probabilidades.

    1.2. EL MTODO CIENTFICO

    La Estadstica utiliza el mtodo cientfico para desarrollar sus teoras. El mtodo

    cientfico se basa en observar la naturaleza y formular una hiptesis de su

    funcionamiento, y segn esta teora se producirn una serie de consecuencias. Si lo

    que observamos no est en contradiccin con estas consecuencias, aceptamos la

    hiptesis inicial. sta es aceptada hasta que encontramos una prueba que lo

    invalida, y entonces debemos formular otra hiptesis y empezar de nuevo el proceso.

    En la estadstica las etapas que seguimos se muestran en la Figura 1.2.:

  • 1. Introduccin

    -13-

    Planteamiento del

    problema

    Formulacin del

    modelo

    Recogida de los

    datos

    Estimacin de los

    parmetros

    Hiptesis del

    modelo

    Es vlido?

    Prediccin y

    control

    SI

    NO

    Figura 1. 2. El mtodo cientfico

    Por ejemplo, queremos ver la prediccin del peso de una persona sabiendo su

    altura. Se trata de un problema de regresin y el proceso que seguimos es parecido

    al de la figura anterior.

  • 1. Introduccin

    -14-

    1.3. SOFTWARE ESTADSTICO

    Para el tratamiento de los datos es muy interesante disponer de unos programas en

    ordenador que nos facilita todo el desarrollo.

    Es muy frecuente almacenar los datos con una hoja de EXCEL y a partir de

    sta, cualquier software estadstico es capaz de leer la hoja de EXCEL y disponer los

    datos para su tratamiento y anlisis.

    La misma hoja de EXCEL tiene un complemento de anlisis de los datos. La

    ventaja es que en cualquier empresa podemos disponer de la EXCEL y hacer un

    anlisis bsico de los datos. Adems, uno mismo puede desarrollar programas

    especficos por el tratamiento de los datos haciendo uso de los macros y del

    VisualBasic que lleva incorporado el EXCEL.

    El software que vamos a utilizar en esta materia es:

    1. Statgraphics para Windows. El que damos en las prcticas de estadstica es la

    versin 5.1 en ingls. En la UPVNET, dentro de los programas cientficos,

    hay disponible la ltima versin del Statgraphics que se denomina Centurion,

    y sta la podemos poner en ingls o en castellano.

    2. EXCEL. Empleamos las funciones estadsticas o bien los complementos que

    lleva la propia EXCEL. Es interesante cargar el complemento de Anlisis de

    Datos, y tambin se pueden emplear las tablas dinmicas para extraer

    informacin de un conjunto de datos.

    3. DYANE 4. Es un programa muy til para el anlisis de las encuestas. Se

    puede utilizar por la grabacin de los datos y despus hacer la exportacin a

    un fichero en formato txt y pasarlo a formato de EXCEL.

    4. MATHCAD 2000. Este software utilizamos para hacer los clculos

    matemticos, pero tambin lleva todas las funciones estadsticas.

    5. Lenguaje R. Es un programa de libre distribucin que se puede descargar de

    http://cran.r-project.org. Es muy interesante, sobre todo para principiantes, el

    cargar la librera Rcmdr. De esta forma no hace falta saberse los comandos

    del R, ya que se presenta con mens como si fuera el Statgraphics.

    Otro software estadstico muy bueno y que est disponible para toda la

    comunidad de la UPV es el SPSS. Se lanza accediendo a UPVNET y a la carpeta de

    programas cientficos. La nica limitacin es el nmero de usuarios que estn

    utilizndolo al mismo tiempo. Eso depende de las licencias que haya contratado la

    UPV.

    Programas estadsticos adicionales son:

    1. SAS. Dicen que es el mejor, pero tambin el ms caro.

  • 1. Introduccin

    -15-

    2. BMDP. Fue el primero que haba y estaba programado en Fortran.

    Actualmente hay una versin por Windows y an hay gente que le utiliza.

    3. MINITAB. Este programa lo utilizan muchas empresas para sus clculos

    estadsticos.

    Actualmente todas las calculadoras cientficas disponen de las funciones

    estadsticas ms bsicas. Es importante leer las instrucciones de las calculadoras

    para utilizar esas funciones. Muchas veces hemos perdido el manual de la

    calculadora, pero se puede obtener una copia accediendo a la WEB.

    1.4. REDONDEO DE LOS DATOS

    La estadstica hace mucho uso de clculos a partir de los datos. Por eso es

    importante tener en cuenta las siguientes reglas por el redondeo de los datos:

    Cifras significativas:

    1. La primera cifra significativa es el 1er dgito a partir de la izquierda que

    es diferente de 0.

    2. Cifras significativas es el nmero de dgitos contados a partir de la

    primera incluida.

    Ejemplos: 34,5 tiene 3 cifras significativas; 3,450 tiene 4 cifras

    significativas; 0,0023 tiene 2 cifras significativas; 0,00230 tiene 3

    cifras significativas.

    Redondeo de un nmero que est justo a la mitad del intervalo: la regla que

    se solo seguir es redondear el nmero par ms prximo que antecede al 5.

    Las mquinas redondean hacia arriba a partir del 5. Ejemplos: 33,45 se

    redondea a 33,4; 33,35 podra redondearse a 33,4 33,3; pero est ms

    prximo el valor de 33,4. Si fuera 33,445 se redondea a 33,4, ya que tiene

    menos distancia al valor de 33,4.

    Cifras significativas en la presentacin de datos: se sigue la regla de los 2

    dgitos de variacin. Ejemplo, si los datos son: 4,562 ; 4,673 ; 4,726; 4,364 ;

    4,891; se pueden representar como: 4,56; 4,67; 4,73; 4,36; 4,89

    Cifras significativas de una probabilidad: 3 cifras (o bien 4). Ejemplo:

    Probabilidad de que llueva el fin de semana se del 10,5% 0,105; o bien

    10,54 0,1054.

    Decimales para el clculo de parmetros: Ejemplo de datos originales 3,4; 3,5;

    3,1; 3,3; 3,9; 3,5; 3,5

  • 1. Introduccin

    -16-

    3. Media aritmtica: 1 cifra ms. Ejemplo: 3,46

    4. Desviacin tpica: 1 cifra ms. Ejemplo: 0,24

    5. Variancia: 2 cifras ms. Ejemplo: 0,0595 bien 0,060

    6. Recorrido: mismas cifras. Ejemplo: 0,8

    7. Modo: mismas cifras. Ejemplo 3,5

    8. Coeficiente de variacin: 3 cifras. Ejemplo: 7,06% bien 0,0706

    9. Coeficiente de correlacin: 2 cifras. Ejemplo: r=0,23 y la R cuadrado

    es 0,23^2=5,29%

    10. Coeficientes de regresin: y=a+bx. Por ejemplo, si y tiene dos

    decimales, cada uno de los sumandos debe tener como mnimo 3

    decimales. As a se expresar con 3 decimales, y b, en caso de

    que x tenga valores hasta 100, debe estar expresado en 5 cifras

    decimales porque al multiplicar por la cantidad x nos da un nmero

    con 3 cifras decimales. Ejemplo: a=1,246; b=0,37152; x=75;

    Y=1,246+0,37152*75=1,246+27,864=29,11

    Cifras a guardar en los clculos:

    1. En los clculos de sumas y restas de nmeros, el resultado final no

    tiene ms cifras significativas despus del lugar decimal que el de

    con menor nmero de ellas despus de la coma decimal. Ejemplo:

    3,32+1,7= 5,0 ; 73,52-63=11,63 si no es exacto; 37,512-24 =

    37,512 si 24 es exacto.

    2. En los clculos con multiplicacin, divisin y extraccin de races de

    nmeros, el resultado final no puede tener ms cifras significativas

    que los datos con menor nmero de ellas. Ejemplo 72,34x 5,45 =

    394; 1,547/0,032 = 46; (4,89)^0,5 = 2,21; 7,381x40= 295,2 si 40 es

    exacto.

  • 1. Introduccin

    -17-

    1.5. ALFABETO GRIEGO

    Debido a la notacin que se emplea en estadstica, es til conocer el alfabeto griego

    que exponemos en la siguiente tabla.

    Mays. Mins. Nombre Equivalente latino Comentario

    A Alfa a Probabilidad

    B Beta b Probabilidad

    Gamma c

    Delta d

    psilon e error

    Zeta f

    Eta

    Theta Parmetro poblacional en general

    Iota i

    Kappa k

    Lambda l Parmetro de una exponencial o de

    Poisson

    Mu m media

    Nu n

    Xi

    Omicron o

    Pi p

    Rho r

    Sigma s Desviacin tpica

    Tau t

    Upsilon u

    Fi v

    Chi x

    Psi y

    Omega z

  • 1. Introduccin

    -18-

  • 2. Estadstica Descriptiva

    -19-

    2. ESTADSTICA DESCRIPTIVA

    Contenido 2.1. INTRODUCCIN ........................................................................................... 19 2.2 ESTADSTICA DESCRIPTIVA UNIDIMENSIONAL ......................................... 22

    2.2.1. Tablas de frecuencias ............................................................................. 23 2.2.2. Histogramas ............................................................................................ 23 2.2.3. Polgono de frecuencias .......................................................................... 25 2.2.4. Diagrama de puntos ................................................................................ 25 2.2.5. Grfico de tartas ...................................................................................... 26 2.2.6. Grfico de Pareto .................................................................................... 26 2.2.7. Medidas de posicin ................................................................................ 27 2.2.8. Medidas de dispersin ............................................................................. 29 2.2.9. Diagrama e tallos y hojas ........................................................................ 31 2.2.10. Diagrama de caja-y-bigotes ................................................................... 32

    2.3. ESTADSTICA DESCRIPTIVA BIDIMENSIONAL ........................................... 33 2.3.1. Tablas de frecuencia de doble entrada .................................................... 33 2.3.2. Frecuencias marginales........................................................................... 36 2.3.3. Frecuencias condicionales ...................................................................... 37 2.3.4. Representaciones grficas de las distribuciones bidimensionales ........... 38 2.3.5. Covarianza muestral ................................................................................ 40 2.3.6. Regresin lineal ....................................................................................... 40

    2.4. PROBLEMAS Y CUESTIONES DE EXMENES ........................................... 41

    2.1. INTRODUCCIN

    Gran parte de la Estadstica trata sobre la recopilacin de datos, anlisis de los

    mismos, y la extraccin de conclusiones con objeto de resolver problemas.

    Los datos que se presentan en la prctica pueden ser de tres tipos bsicos:

    1) Datos cualitativos, que expresan una cualidad del objeto, como puede ser

    bueno, malo, o tambin un color, blanco, negro, azul, etc..

    2) Datos cuantitativos discretos, que expresan algo que podemos contar,

    por ejemplo, nmero de defectos que tiene una pieza mecnica, nmero de

    terminales en funcionamiento, nmero de accidentes de coche en una semana, etc..

    3) Datos cuantitativos continuos, es decir, pueden medirse sobre una

    escala continua y llevan comas decimales, por ejemplo, el dimetro de un eje, tiempo

    que tarda una transaccin en ejecutarse, etc...

    Decimos que los datos observados corresponden a valores de una variable

    que representamos por X. Si disponemos de n datos, se representan por

    x,...,x,x,x n321

  • 2. Estadstica Descriptiva

    -20-

    y si son todos los datos de la variable X, se denomina poblacin y se representan por

    x,...,x,x,x N321

    La simple enumeracin de estos datos no nos da mucha informacin acerca

    del fenmeno que estamos observando, por lo cual siempre se prefiere condensar la

    informacin de modo que su interpretacin sea ms sencilla.

    La forma de condensacin puede ser grfica o numrica. Para una sola

    variable vamos a estudiar los procedimientos ms usuales.

    Escala de los datos

    Otra clasificacin de los datos se refiere a la escala con que estn medidos. sta

    puede ser de cuatro tipos:

    a) Escalas No Mtricas (cualitativas) i. Escala nominal. Cuando la asignacin de los valores es totalmente

    arbitraria. Por ejemplo, el cdigo de sexo, 1=hombre; 2=mujer.

    ii. Escala ordinal. Cuando la asignacin de los valores guarda una cierta relacin de importancia, pero las diferencias no tienen sentido. Por ejemplo, nivel de estudios: 1=Primaria, 2=Secundaria, 3=Bachiller, 4=Graduado.

    b) Escalas Mtricas (cuantitativas) i. Escala de intervalo. Cuando la asignacin guarda un orden de

    importancia y la diferencia entre intervalos tiene sentido. Se caracteriza porque el origen de los datos es arbitrario. Por ejemplo, grado de acuerdo con una afirmacin, la codificacin puede ser:

    1. Totalmente en desacuerdo 2. Ms bien en desacuerdo. 3. Indiferente. 4. Ms bien de acuerdo. 5. Totalmente de acuerdo

    Pero la codificacin tambin podra haber sido con los cdigos -2, -1,

    0, 1, 2.

    ii. Escala de ratio o de razn. Cuando el origen de los datos no es arbitrario y tiene sentido las operaciones de multiplicacin y de divisin. Por ejemplo, el peso, la altura, la longitud, etc.

    Actividad 2.1.

    En la encuesta que hay en el tema 1, para cada pregunta decir qu tipo de escala utiliza la codificacin de los datos.

  • 2. Estadstica Descriptiva

    -21-

    Mtodos estadsticos empleados para analizar la dependencia o la interdependencia

    entre los datos observados

    TCNICA DE ANLISIS MULTIVARIANTE

    A) Relaciones de dependencia

    Una variable dependiente/Mltiples

    variables dependiente

    Mltiples dependientes/mltiples

    independientes

    1. Anlisis de regresin mltiple 2. Anlisis de regresin logstica

    binaria 3. Anlisis de clasificacin mltiple 4. AID (Automatic interaction

    detection) 5. CHAID (Chi Square Automatic

    Interaction Detection) 6. Anlisis conjunto categrico 7. Anlisis conjunto ordinal

    1. Anlisis discriminante multiple 2. Anlisis de correlaciones

    cannicas 3. Redes neuronales artificiales

    B) Relaciones de interdependencias

    Entre variables Entre casos objetos

    1. Anlisis de componentes principales

    2. Anlisis factorial de correspondencias

    3. Anlisis multidimensional

    1. Anlisis de grupos (anlisis cluster)

    MTODOS DE DEPENDENCIA ENTRE VARIABLES

    Mtodo Relacin funcional

    Anlisis de

    regresin

    simple

    11 XY

    (mtrica) (mtrica, no mtrica)

    Anlisis de

    regresin

    mltiple

    n211 XXXY

    (mtrica) (mtrica, no mtrica)

    Anlisis de la

    varianza n211 XXXY

    (mtrica) (no mtrica)

    Anlisis

    multivariante de

    la varianza

    n21m21 XXXYYY

    (mtrica) (no mtrica)

  • 2. Estadstica Descriptiva

    -22-

    MTODOS DE DEPENDENCIA ENTRE VARIABLES

    Mtodo Relacin funcional

    Anlisis

    discriminante

    mltiple

    n211 XXXY

    (no mtrica) (mtrica)

    Anlisis conjunto n211 XXXY

    (no mtrica, mtrica) (mtrica)

    Correlacin

    cannica n21m21 XXXYYY

    (mtrica, no mtrica) (mtrica, no mtrica)

    Modelo de

    ecuaciones

    estructurales

    n112111 XXXY

    n222212 XXXY

    n332313 XXXY

    (mtrica, no mtrica) (mtrica, no mtrica)

    2.2 ESTADSTICA DESCRIPTIVA UNIDIMENSIONAL

    Si observamos una variable X y disponemos de n datos, en la forma x,...,x,x n21 , una

    manera sencilla de representarlos es mediante una tabla o un histograma de

    frecuencias.

    Llamamos "frecuencia absoluta" de un valor, al nmero de veces que aparece

    dicho valor. La "frecuencia relativa" es el nmero de veces que aparece el valor

    dividido por el nmero total de datos observados. Esto es:

    nesobservacio de total nmero

    aparece que veces de nmero=relativa Frecuencia

    El campo de existencia de una variable es el conjunto de posibles valores que

    pueden tomar los datos.

  • 2. Estadstica Descriptiva

    -23-

    2.2.1. Tablas de frecuencias

    Una vez ordenados los datos de menor a mayor y agrupados en intervalos, se puede

    formar la siguiente tabla de frecuencias,

    N

    Lmites

    del

    intervalo

    Valor

    de

    clase

    Frecuencia Frecuencia

    relativa

    Frecuencia

    acumulada

    Frecuencia

    acumulada

    relativa

    1 1n n

    n1 1n

    n

    n1

    21 nn n

    nn 21

    i ii bxa ix in ii f

    n

    n i21 nnn

    n

    nnn i21

    k kn n

    nk n 1

    Sumas n 1

    2.2.2. Histogramas

    El histograma de frecuencias divide el campo de existencia de la variable en una

    serie de intervalos, que por lo general, son de igual longitud, determinando

    exactamente los lmites de cada intervalo.

    Para cada intervalo contamos el nmero de datos que pertenecen al mismo, y

    en un diagrama X-Y, tomando como eje X la variable, y como ordenadas el nmero

    de datos que hay en cada intervalo, representamos unos rectngulos con base igual

  • 2. Estadstica Descriptiva

    -24-

    a la longitud del intervalo de clase y con altura igual al nmero de datos de dicha

    clase.

    Con el histograma podemos ver qu intervalos son ms frecuentes que otros.

    Para ello es importante el nmero de subdivisiones que hagamos, ya que si son

    pocas, no veremos nada, y si son muchas, tampoco. Por lo general, el nmero de

    intervalos se sita entre 5 y 20. Tambin est la opcin de tomar como nmero de

    intervalos la raz cuadrada del nmero de datos.

    Si en lugar de poner como altura de los rectngulos la frecuencia absoluta,

    ponemos la frecuencia relativa, se tiene el "histograma de frecuencias relativas", cuya

    forma es exactamente la misma que el histograma de frecuencias absolutas, slo que

    hay un cambio de escalas en la ordenada.

    Al punto medio de cada intervalo se le llama valor de clase y representa a

    dicho intervalo.

    Si empezando por la izquierda del histograma, vamos acumulando las

    frecuencias de los siguientes rectngulos, y los representamos, tendremos una figura

    con una serie de rectngulos escalonados. Esta figura recibe el nombre de

    "histograma de frecuencias acumuladas", el cual puede ser de frecuencias absolutas

    o relativas, segn lo que vayamos acumulando.

    Si la variable es discreta, el valor de la clase coincide con el valor discreto,

    entonces recurrimos a un "diagrama de barras", colocando encima de cada valor una

    barra de longitud igual a la frecuencia del valor. Lo mismo hacemos si las clases

    corresponden a valores de una variable cualitativa (tipo de defecto,)

    Figura 2. 1 Ejemplo de histograma.

  • 2. Estadstica Descriptiva

    -25-

    2.2.3. Polgono de frecuencias

    Un polgono de frecuencias se obtiene uniendo los puntos medios de la base superior

    de cada rectngulo. Al igual que con los histogramas, tendremos cuatro tipos de

    polgonos de frecuencias.

    Histogram

    43 53 63 73 83 93 103

    Peso

    0

    3

    6

    9

    12

    15

    18

    freq

    uen

    cy

    Figura 2. 2 Polgono de frecuencias

    2.2.4. Diagrama de puntos

    Cuando hay pocos datos se pueden representar con un diagrama de puntos, el cual

    se forma haciendo coincidir un punto grueso con cada valor de X que aparece. En

    caso de que haya dos iguales, se coloca un punto encima de otro.

    Figura 2. 3 Diagrama de puntos

  • 2. Estadstica Descriptiva

    -26-

    2.2.5. Grfico de tartas

    Otra representacin tpica para variables cualitativas es el grfico de tartas o en

    crculo, en el cual cada clase se representa por un sector de rea proporcional a su

    frecuencia. La frecuencia puede ser absoluta o relativa. En este ltimo caso se

    interpreta que el 100% de la tarta se reparte entre las clases existentes.

    Figura 2. 4 Grfico de tartas

    2.2.6. Grfico de Pareto

    El grfico de Pareto es un histograma de frecuencias pero ordenado de mayor

    frecuencia a menor frecuencia. De esta forma se intenta destacar el hecho de que

    unas pocas clases representan casi el total de los datos aparecidos. Esto recibe el

    nombre de la ley del 20-80%, que se aplican en distintos aspectos de la economa.

    Figura 2. 5 Grfico de Pareto

  • 2. Estadstica Descriptiva

    -27-

    Adems de dar grficamente la situacin de los valores de una variable X, nos

    interesa bsicamente contestar a dos preguntas:

    1) Dnde est situada la variable?

    2) Cul es su campo de variabilidad?

    Para poder realizar comparaciones necesitamos unos valores numricos.

    Aquellos que contestan a la primera pregunta se llaman "parmetros de posicin", y

    los de la segunda pregunta, "parmetros de dispersin".

    2.2.7. Medidas de posicin

    Los parmetros de posicin que vamos a ver son: la media, la mediana, y la moda.

    Si de una variable X, tenemos un conjunto de valores x,...,x,x n21 , se define la

    media como:

    n

    x

    =x

    i

    n

    =1i

    Este valor coincide con la media aritmtica, pero como aqu slo son un parte

    de los posibles valores de X, se denomina "media muestral".

    Cuando el conjunto de valores de que disponemos son todos los de la

    variable X, al conjunto de ellos se denomina "Poblacin", y su media recibe el nombre

    de "media poblacional", representndola con el smbolo :

    N

    x

    =m=

    i

    N

    =1i

    La media muestral representa el centro de masas de un histograma, y

    corresponde al valor medio que toman los datos.

    Es una medida poco robusta, ya que ante la aparicin de un valor anmalo, la

    media se ve bastante modificada.

    La "mediana" expresa aquel valor que por debajo de l hay 50% de los datos,

    y por encima el 50% de los datos. Se representa por X~

    , para una muestra, y el valor

    depende de si el nmero de datos es impar o par. Si es impar la mediana coincide

    con el valor central, previamente ordenados los valores de menor a mayor, y si es

  • 2. Estadstica Descriptiva

    -28-

    par, se toma el punto medio de los valores centrales. De aqu que empleemos la

    expresin:

    impar es n si2

    x+x

    impar es n siX

    =X~

    1)+([n/2](n/2)

    )2

    1+n(

    La "mediana poblacional" se representa por ~ .

    La mediana es una medida robusta, esto es, se modifica poco ante la

    aparicin de un dato anmalo.

    La "moda" es aquel valor de X que se repite ms, es decir, el de ms

    frecuencia. Si solamente hay una moda, se denomina "unimodal"; si hay varias, se

    llama "multimodal". Vienen a ser los picos que forman un histograma de frecuencias

    no acumulado.

    En una distribucin simtrica, coinciden los tres parmetros, pero si hay una

    cola hacia la derecha, lo que se llama "asimetra positiva", ocurre que:

    moda < mediana < media

    f(x)

    moda

    mediana

    media

    Asimtrica positiva

    s

    x~xPearson.Asim.Coef

    y si la cola es hacia la izquierda, es "asimetra negativa", y ocurre que

    moda > mediana > media

  • 2. Estadstica Descriptiva

    -29-

    f(x)

    x

    moda

    mediana

    media

    Asimtrica negativa

    s

    x~xPearson.Asim.Coef

    Se define el "percentil p%" como aqul valor de X que deja a su izquierda un

    p% de los datos. Si p = 25%, se le llama "primer cuartil" Q1 , si p= 50%, es el

    "segundo cuartil " Q2 , que coincide con la mediana, y para p=75% es el "tercer

    cuartil" Q3 . Los cuartiles dividen a los datos en 4 partes con igual nmero de ellos.

    f(x)

    x

    25% 25%

    25%25%

    Q1 Q2 Q3

    CUARTILES

    2.2.8. Medidas de dispersin

    Las principales medidas que empleamos son: la varianza, la desviacin tpica, el

    rango, y el coeficiente de variacin.

    La varianza poblacional se representa por 2 , y se define con todos los datos

    de la poblacin:

  • 2. Estadstica Descriptiva

    -30-

    N

    )-x(

    =

    2

    i

    N

    =1i2

    Para el conjunto de valores x,...,x,x,x n321 de la variable X, la "varianza" es:

    1-n

    )x-x(

    =s

    2

    i

    n

    1=i2

    Dicho valor nos sirve para hacer estimaciones de la varianza poblacional y recibe el

    nombre de "cuasivarianza o varianza muestral corregida:

    La varianza es una medida cuyas unidades estn al cuadrado. Para hacerlas

    homogneas con las unidades de los datos y de la media se define la "desviacin

    tpica muestral" como la raz cuadrada con signo positivo de la varianza muestral.

    As:

    s+=s2

    Cuanto mayor es la varianza, mayor es la dispersin de los datos.

    Otra idea de la variabilidad de los datos la proporciona el "recorrido", que se

    define como la diferencia entre el mximo y el mnimo de los valores observados. Se

    expresa como:

    x-x=R minax m

    Si n=2 la informacin que dan R y s2 acerca de la dispersin de los datos es

    la misma, ya que utilizan los mismos datos, pero para n=3, R ya no emplea uno de

    ellos, pero an es una buena aproximacin. Para n>10, el rango ya no es til para ver

    la dispersin de los datos, y entonces se preferir el empleo de s2 .

    El "coeficiente de variacin" es una medida adimensional de la dispersin, se

    define como el cociente entre la desviacin tpica y la media, esto es:

    100x

    s=C.V. o bien 100CV

    y permite comparar la dispersin de dos conjuntos de datos.

    As, por ejemplo, dos grupos de datos pueden tener la misma dispersin, sea

    s=1, pero si la media de uno es de 10, y la del otro de 1000, lgicamente hay mayor

    variacin relativa en el primero que en el segundo. Este coeficiente de variacin nos

    da una idea de la "precisin" de los datos.

  • 2. Estadstica Descriptiva

    -31-

    Otras medidas de dispersin son.

    El recorrido intercuartlico: Q3-Q1

    Desviaciones:

    i. Media de las desviaciones absolutas respecto a la media:

    Dm=n

    xxn

    1i

    i

    ii. Mediana de las desviaciones absolutas respecto de la

    mediana: MEDA= x~xmediana i

    MEDIDA DE ASIMETRA

    El coeficiente de asimetra es,

    s

    /n)x-x(

    =g3

    3

    1

    n

    1=i

    1

    Si CA = 0 se trata de una distribucin simtrica; si CA0 la distribucin es asimtrica hacia la derecha.

    MEDIDA DEL APLANAMIENTO

    El coeficiente de aplanamiento es,

    s

    /n)x-x(

    =g4

    4

    i

    n

    1=i2

    Si CC=3 tiene el mismo aplanamiento (curtosis) que una campana de Gauss;

    si CC>3 la distribucin es ms puntiaguda que la campana de Gauss; y si CC

  • 2. Estadstica Descriptiva

    -32-

    Se trata de dividir los nmeros en dos partes. La parte de la izquierda, que

    llamamos "tallo", y la parte de la derecha, que llamamos "hojas". As el nmero 123,

    tenemos el 12, que constituye el tallo, y el 3, que es la hoja. De esta forma para una

    misma lnea agrupamos todos los nmeros que tienen el mismo tallo, as, por

    ejemplo, para el 128, se agrupa junto al anterior como:

    38|12

    separando el tallo de las hojas mediante una barra vertical. Si tenemos el 115,

    aparece otro tallo, y ahora la figura es:

    38|12

    5|11

    De esta manera no perdemos los datos individuales, a la vez que se va

    formando algo parecido a un histograma de frecuencias.

    Cuando se quiere subdividir ms las clases, los diez dgitos de la derecha se

    van agrupando de dos en dos, formando 5 nuevas clases. As:

    Clase * = el 0 y el 1.

    Clase T = el 2 y el 3.

    Clase F = el 4 y el 5.

    Clase S = el 6 y el 7.

    Clase . = el 8 y el 9.

    Tambin se puede hacer una agrupacin en dos: una del 0 al 4, y otra del 5 al

    9.

    2.2.10. Diagrama de caja-y-bigotes

    Otra forma de representar los datos es mediante un diagrama de una Caja, cuyos

    lados vienen dados por el primer cuartil y el tercer cuartil, y en su interior se dibuja el

    segundo cuartil, esto es, la mediana. Partiendo de cada lado se dibujan unas lneas

    que llegan hasta el 10 percentil, por un lado, y el 90 percentil por el otro. Para datos

    extensos, se dibuja el 5 y el 95 percentiles. Concretamente, en el STATGRAPHICS

    los bigotes se calculan con una longitud de 1,5 veces la anchura del rectngulo, y los

    extiende hasta el ltimo punto que est dentro del bigote. De esta forma aquellos

    puntos que quedan fuera de los bigotes, se consideran puntos anmalos, esto es,

    puntos que posiblemente no pertenecen a la distribucin considerada.

  • 2. Estadstica Descriptiva

    -33-

    La anchura de la Caja contiene el 50% de los datos, lo cual da una idea de la

    dispersin, y la posicin de la mediana, junto con la longitud de los bigotes nos da

    una idea de la simetra o no de los datos.

    Este diagrama es muy til para comparar dos grupos de datos y observar de

    forma grfica si hay diferencia o no entre ellos.

    Box-and-Whisker Plot

    45 55 65 75 85

    Peso

    Figura 2. 6 Diagrama de Caja y bigotes

    2.3. ESTADSTICA DESCRIPTIVA BIDIMENSIONAL

    2.3.1. Tablas de frecuencia de doble entrada

    Cuando para cada elemento de la poblacin, o bien para cada unidad de estudio, se

    observan dos caractersticas, y clasificamos cada unidad segn las dos

    caractersticas, asignndola a una de las celdillas que resultan de dividir cada

    caracterstica en un conjunto de intervalos, y contamos el nmero de unidades que

    resultan en cada celdilla, se tiene una tabla de doble entrada o tambin se llama una

    tabla de contingencia.

    Como ejemplos tenemos:

    - De cada alumno de una clase tomamos nota de su peso y su altura y lo

    clasificamos en su celdilla correspondiente.

    - Cada persona se puede clasificar segn que haya tomado o no la vacuna

    contra la gripe y segn que haya o no contrado la enfermedad.

  • 2. Estadstica Descriptiva

    -34-

    - En una fbrica donde hay tres turnos de produccin se cuenta el nmero de

    defectos de calidad que hay en los coches producidos y se clasifican stos

    en funcin del turno en que han sido producidos(1, 2 3) y del nmero de

    defectos que contienen (0, 1, 2, 3 >=4)

    Las caractersticas observadas se representan por (X,Y) siendo X la primera

    de ellas, por ejemplo el peso, e Y la segunda, por ejemplo la altura. Para las

    unidades observadas 1, 2,..., n tenemos los valores

    )y,x(),...,y,x(),y,x( nn2211 . Estas caractersticas, que tambin llamamos

    variables muestrales, pueden ser ambas cualitativas, por ejemplo,

    defectuoso- correcto, o tipo de defecto; o ser ambas cuantitativas, caso del

    peso-altura, o bien una de ellas cualitativa y la otra cuantitativa, en cuyo

    caso se dice que es una variable bidimensional mixta.

    Si la primera caracterstica podemos tener I intervalos, los cuales representan

    I filas de una matriz, y para la segunda caracterstica tenemos J columnas de una

    matriz, entonces se tiene una tabla de doble entrada de la siguiente forma:

    Tabla 2.1. Tabla de frecuencias

    1

    2

    j

    J

    total

    1

    2

    i nij ni

    I

    total n j n

    Donde se tiene la siguiente notacin:

    nij = nmero de elemento en la celdilla ij.

    ni = nmero de elementos de la fila i.

    n j = nmero de elementos de la columna j.

    n = nmero total de elemento observados.

  • 2. Estadstica Descriptiva

    -35-

    La frecuencia absoluta de cada celdilla es nij y la frecuencia relativa es:

    n

    n=

    n

    n=)y,x(f

    ijij

    jir

    La suma de las frecuencias relativas de todas las casillas es igual a la unidad,

    esto es:

    1=n

    n=

    n

    nyxf

    ij

    ji

    jir

    ji

    )=,(

    Como ejemplo de una tabla de doble entrada, supongamos que un fabricante

    de automviles dispone de tres turnos de fabricacin de coches, y para cada turno

    cuenta aquellos coches que han tenido 0 defectos de calidad, 1, 2,3, ms de 4

    defectos de calidad. Para un da de produccin ha obtenido la siguiente tabla de

    doble entrada

    Tabla 2.2. Ejemplo de tabla de frecuencias

    nmero de defectos de calidad

    0 1 2 3 >=4 Total

    turno

    A 310 50 30 40 20 450

    B 390 40 60 50 10 550

    C 220 60 90 10 20 400

    Total 920 150 180 100 50 1400

    La tabla de frecuencias relativas es:

    Tabla 2.3. Tabla de frecuencias relativas

    nmero de defectos de calidad

    0 1 2 3 >=4 Total

    turno

    A .221 .036 .021 .029 .014

    B .279 .029 .043 .036 .007

    C .157 .043 .064 .007 .014

    Total

  • 2. Estadstica Descriptiva

    -36-

    2.3.2. Frecuencias marginales

    Si a partir de una tabla de doble entrada solamente queremos estudiar una de las

    caractersticas, tomaremos las frecuencias que aparecen en el lado derecho de la

    tabla, si deseamos estudiar la primera caracterstica, o bien la fila que el margen de

    abajo, si deseamos estudiar las segunda caracterstica. Cada una de esas

    frecuencias son las llamadas frecuencias marginales, ya que aparecen justamente

    en los mrgenes de las tablas de doble entrada.

    As la frecuencia relativa de la clase xi es:

    n

    n=)x(f

    iir

    y la frecuencia relativa de la clase y j es:

    n

    n=)y(f

    j

    jr

    Lgicamente se cumple que:

    1=n

    n=

    n

    nxf

    i

    i

    ir

    i

    )=(

    y

    1=n

    n=

    n

    nyf

    .j

    j

    jr

    j

    )=(

    Por ejemplo la distribucin de frecuencias marginales del nmero de defectos

    de calidad es:

  • 2. Estadstica Descriptiva

    -37-

    Tabla 2.4. Tabla de frecuencias marginales

    nmero de defectos de calidad

    0 1 2 3 >=4 Total

    turno

    A .321

    B .393

    C .286

    Total .657 .107 .129 .071 .036

    2.3.3. Frecuencias condicionales

    En otras situaciones se quiere conocer la distribucin de una variable para un valor

    dado de la otra. Por ejemplo, en la tabla de doble entrada para una valor de y j se

    desea conocer la distribucin de las casillas que aparecen en esa columna. Dicha

    distribucin recibe el nombre de distribucin de frecuencias condicionales, y su valor

    para cada casilla es:

    n

    n=)y/ x(f

    j

    ij

    jir

    Como es lgico, la suma de todas las frecuencias condicionales para ese

    valor de y j es igual a la unidad.

    1=n

    n=

    n

    nyxf

    j

    j

    j

    ij

    i

    jir

    i

    )=/ (

    Por ejemplo para el turno B la distribucin de frecuencias condicionales es:

  • 2. Estadstica Descriptiva

    -38-

    Tabla 2.5. Tabla de frecuencias condicionales

    nmero de defectos de calidad

    0 1 2 3 >=4 Total

    turno

    A

    B .709 .073 .109 .091 .018 1.000

    C

    Total

    2.3.4. Representaciones grficas de las distribuciones bidimensionales

    Cuando se tienen los datos como )y,x(),...,y,x(),y,x( nn2211 una forma inmediata de

    representacin son unos ejes coordenados en los que cada punto representado

    corresponde a un elemento observado con la primera coordenada igual al valor de X

    y la segunda coordenada igual al valor de Y. Por ejemplo, si de cada alumno de la

    clase se ha observado el peso y la altura, cada punto representa a un alumno.

    El inters de estas representaciones se basa en la necesidad de contestar a

    las preguntas de:

    - Existe una relacin lineal entre las dos caractersticas?

    - Cul es el grado de relacin lineal que hay?

    - Se puede predecir un valor a partir del otro?

    El diagrama que resulta recibe el nombre de diagrama de dispersin. Un

    ejemplo de diagrama de dispersin aparece en la Figura 2.7.

  • 2. Estadstica Descriptiva

    -39-

    Plot of Peso vs Altura

    150 160 170 180 190 200

    Altura

    45

    55

    65

    75

    85

    Peso

    Figura 2. 7 Grfico de Dispersin

    Otra forma de representacin es el histograma en tres dimensiones. Este

    consiste en representar en un sistema de ejes X-Y-Z, las celdillas de la tabla de doble

    entrada como formando un suelo de baldosas en el plano X-Y, y encima de cada

    baldosa, que corresponde con cada casilla, una columna de altura proporcional a la

    frecuencia relativa de cada una de ellas. Un ejemplo de histograma en tres

    dimensiones es el que aparece en la Figura 2.8.

    Figura 2. 8 Histograma en 3 dimensiones

  • 2. Estadstica Descriptiva

    -40-

    El volumen del edificio que resulta se dice que es igual a la unidad. La

    proyeccin de ese edificio sobre el plano X-Z resulta el histograma de frecuencias

    relativas de X, y la proyeccin del edificio sobre el plano Y-Z resulta el histograma de

    frecuencias relativas de la caracterstica Y.

    2.3.5. Covarianza muestral

    Mediante el grfico de dispersin o el histograma tridimensional, se puede observar si

    hay una relacin lineal entre las variables, es decir, si para valores altos de una de

    ellas, la otra tambin toma valores elevados. En este caso la relacin lineal es en

    sentido positivo, y grficamente los puntos tienden a situarse alrededor de una recta

    de pendiente positiva.

    Cuando para valores altos de X se observan valores bajos de Y se dicen que

    la relacin lineal es negativa.

    Para dar una idea numrica de la relacin lineal entre las dos variables, se

    define la covarianza muestral sxy como:

    )y-y)(x-x(1n

    1=s ii

    i

    2xy

    Como sxy tiene dimensiones, por ejemplo para (peso, altura) puede ser

    kgs.cms, con objeto de tener una medida adimensional, se emplea el coeficiente de

    correlacin muestral r xy que se define por:

    ss

    s=r

    yx

    2xy

    xy

    r xy es un valor que siempre est entre -1 y +1. Cunto ms se acerca a la

    unidad en valor absoluto, mayor es la relacin lineal que hay entre las dos variables.

    Si vale cero, no hay ninguna relacin lineal entre las dos variables

    2.3.6. Regresin lineal

    Si observamos una relacin lineal entre los valores de X e Y, podemos ajustar un

    recta que sea la que minimice, para el conjunto de todos los casos, la suma de

    cuadrados entre el valor observado y el predicho por dicha recta.

  • 2. Estadstica Descriptiva

    -41-

    La ecuacin de la recta de regresin de ajuste por mnimos cuadrados del

    valor de Y conocido un valor de x, viene dada por,

    )xx(s

    sryy

    x

    y

    xy

    O bien,

    )xx(s

    syy

    2

    x

    xy

    2.4. PROBLEMAS Y CUESTIONES DE EXMENES

    2.4.1.- En las pruebas de acceso del ltimo ao se seleccionaron al azar 120

    alumnos de tres tipos de colegio y se tomaron en cuenta las notas obtenidas por cada

    uno de ellos. Con estos datos se defini la variable aleatoria bidimensional (Tipo de

    colegio, Calificaciones obtenidas) como muestra la tabla siguiente:

    SUSPENSOS APROBADOS NOTABLES SOBRESALIENTES Total

    fila

    -----------------------------------------------------

    PUBLICO | 3 | 15 | 22 | 6 | 46

    -----------------------------------------------------

    PRIVADO | 3 | 24 | 8 | 5 | 40

    -----------------------------------------------------

    CONCERTADO | 4 | 8 | 17 | 5 | 34

    -----------------------------------------------------

    Total columna 10 47 47 16 120

    a) Completar la tabla anterior calculando las probabilidades de la distribucin

    bidimensional conjunta de la variable (Tipo de colegio, Calificaciones) (0,5

    puntos)

    b) Completar la tabla siguiente con las distribuciones unidimensionales

    marginales de las variables Tipo de colegio y Calificaciones (1 punto)

  • 2. Estadstica Descriptiva

    -42-

    SUSPENSOS APROBADOS NOTABLES SOBRESALIENTES Total

    fila

    -----------------------------------------------------

    PUBLICO | 3 | 15 | 22 | 6 | 46

    -----------------------------------------------------

    PRIVADO | 3 | 24 | 8 | 5 | 40

    -----------------------------------------------------

    CONCERTADO | 4 | 8 | 17 | 5 | 34

    -----------------------------------------------------

    Total columna 10 47 47 16 120

    c) Completar la tabla siguiente con la distribucin condicional de las calificaciones en los colegios privados (0,5 puntos)

    SUSPENSOS APROBADOS NOTABLES SOBRESALIENTES Tot fila

    -----------------------------------------------------

    PUBLICO | 3 | 15 | 22 | 6 | 46

    -----------------------------------------------------

    PRIVADO | 3 | 24 | 8 | 5 | 40

    -----------------------------------------------------

    CONCERTADO | 4 | 8 | 17 | 5 | 34

    -----------------------------------------------------

    Total columna 10 47 47 16 120

  • 2. Estadstica Descriptiva

    -43-

    SOLUCIN

    Las frecuencias de cada casilla (en porcentaje) son:

    SUSPENSOS APROBADOS NOTABLES SOBRESAL. Total

    fila

    PBLICO 3/120 15/120 22/120 6/120

    PRIVADO 3/120 24/120 8/120 5/120

    CONCERTADO 4/120 8/120 17/120 5/120

    Total columna 120

    Las distribuciones marginales (en porcentaje) son:

    SUSPENSOS APROBADOS NOTABLES SOBRESAL. Total fila

    PBLICO 46/120

    PRIVADO 40/120

    CONCERTADO 34/120

    Total columna 10/120 47/120 47/120 5/120 120

    La distribucin condicional de las notas para los colegios privados (en porcentaje) es:

    SUSPENSOS APROBADOS NOTABLES SOBRESAL. Total

    fila

    PBLICO

    PRIVADO 3/40 24/40 8/40 5/40 40

    CONCERTADO

    Total columna

    2.4.2.- A partir del diagrama siguiente, que representa los datos de consumo

    elctrico mensual entre enero 2010 y junio 2011, elija la respuesta correcta a las

  • 2. Estadstica Descriptiva

    -44-

    siguientes preguntas:

    Box-and-Whisker Plot

    Consumo

    20 30 40 50 60 70

    1. El consumo medio ha sido: (0,25 puntos)

    a. 49.4

    b. 56.5

    c. 43.5

    2. El 75% de los meses se consumi: (0,25 puntos)

    a. Menos de 56.5 .

    b. Ms de 56.5 .

    c. Entre 43.5 y 56.5 .

    3. El consumo mnimo observado en estos 20 meses fue de: (0,25 puntos)

    a. 20 .

    b. 39 .

    c. 42.5 .

    4. La distribucin tiene una asimetra (0,25 puntos)

    a. Positiva, porque el tercer cuartil es mayor que el primer cuartil.

    b. Negativa, porque el tercer cuartil es mayor que el primer cuartil.

    c. Se puede decir que la distribucin es simtrica.

    5. El 50% de los meses se consumi: (0,25 puntos)

    a. Ms de 56.5 .

    b. Menos de 43.5 .

  • 2. Estadstica Descriptiva

    -45-

    c. Entre 43.5 y 56.5 .

    2.4.3.- Una empresa decide realizar un estudio sobre el consumo de un determinado

    material, necesario para el proceso de fabricacin que lleva a cabo, en funcin del da

    de la semana, en vistas a optimizar su stock semanal del producto y la deteccin de

    posibles anomalas. Se han analizado un total de 57 das, de lunes a viernes. Con

    estos datos de consumo se realiza el diagrama Box-Whisker mltiple que se muestra

    a continuacin:

    Lunes

    Martes

    Mircoles

    Jueves

    Viernes

    Grf ico de Cajas y Bigotes

    0 100 200 300 400 500

    CONSUMO

    DIA

  • 2. Estadstica Descriptiva

    -46-

    A la vista de los diagramas, responder a las siguientes preguntas justificando

    convenientemente las respuestas.

    1. La mayor dispersin de consumo se produce: (0.25 puntos)

    a. Los lunes b. Los martes c. Los mircoles d. Todos tiene la misma dispersin ya que el consumo es independiente

    del da Pues el rango intercuartlico es mayor.

    2. La mayor asimetra se presenta: (0.25 puntos) a. Los jueves y es positiva b. Los martes y es negativa c. Los martes y es positiva d. Los jueves y es negativa

    Pues ese da se da la mayor distancia entre la mediana y la media, y media > mediana.

    3. En trminos medios, los das de menor consumo son: (0.25 puntos)

    a. Los mircoles b. Los viernes c. Los martes d. No se dispone de datos suficientes

    Pues la media es la que est ms a la izquierda de todos los das.

    4. Cul de las siguientes afirmaciones es cierta? (0.25 puntos)

    a. El 75% de los lunes se consume por encima de 300 b. El 75% de los lunes se consume por debajo de 300 c. El 25% de los mircoles se consume por debajo de 260 d. El 25% de los mircoles se consume por encima de 180

    El lmite derecho de la caja de los lunes, que corresponde al tercer cuartil, est en 300.

  • 3. Probabilidades

    -47-

    TEMA 3. PROBABILIDADES

    Contenido 3.1. INTRODUCCIN ........................................................................................... 47

    3.2. PROBABILIDAD ............................................................................................. 48

    3.2. ESPACIOS DE PROBABILIDADES ............................................................... 48

    3.4. PROBABILIZACIN DE ESPACIOS MUESTRALES ..................................... 52

    Probabilizacin de Espacios Muestrales Discretos ............................................ 52

    Probabilizacin de Espacios Muestrales Finitos Simtricos. Combinatoria ........ 53

    Combinatoria ..................................................................................................... 53

    3.5. PROBABILIDAD CONDICIONADA ................................................................ 54

    3.6. TEOREMA DE LA INTERSECCIN............................................................... 56

    3.7. TEOREMA DE LA PARTICIN TOTAL .......................................................... 56

    3.8. SUCESOS INDEPENDIENTES ...................................................................... 57

    3.9. TEOREMA DE BAYES ................................................................................... 58

    3.10. PROBLEMAS PROPUESTOS ..................................................................... 59

    Probabilidad condicional.................................................................................... 61

    3.11. PROBLEMAS Y CUESTIONES DE EXMENES ........................................ 66

    3.1. INTRODUCCIN

    El objeto central del Clculo de probabilidades y de la estadstica, lo constituyen los

    llamados fenmenos aleatorios. Los fenmenos aleatorios son aquellos fenmenos

    reales que se caracterizan por la impredecibilidad de sus resultados y por la llamada

    regularidad estadstica.

    El clculo de probabilidades se ha desarrollado en situaciones en las cuales

    se realiza un experimento y se observa un resultado. Pero dicho resultado no se

    puede predecir de antemano con exactitud. A estos experimentos los llamamos

    Experimentos Aleatorios. Este concepto tiene otras caractersticas comunes. La

    primera de ellas es que no podemos saber de antemano su resultado, a lo sumo

    podemos describir un conjunto de posibles resultados. Segundo es que dicho

    experimento lo podemos repetir exactamente en las mismas condiciones y el

    resultado ser totalmente distinto. No obstante, a medida que el nmero de

    repeticiones del experimento va aumentando se presenta un comportamiento

    caracterstico de la frecuencia con que aparece cada resultado, que llamamos

    "regularidad estadstica"

  • 3. Probabilidades

    -48-

    Si llamamos n al nmero de repeticiones del experimento aleatorio, a la frecuencia absoluta, es decir, al nmero de veces que ocurre un determinado

    resultado y a f r su frecuencia relativa, tendremos que:

    n=f r

    Por definicin de fenmeno aleatorio, cuando n crece fr tiende a estabilizarse

    alrededor de un cierto valor. Cuando el fenmeno aleatorio tiene esta propiedad,

    diremos que posee la caracterstica de la Regularidad Estadstica.

    3.2. PROBABILIDAD

    Al repetir el experimento aleatorio, se observa que unos resultados aparecen ms

    que otros, por lo cual cabe hablar de la posibilidad de que un suceso aparezca ms

    veces que otro. Esto es, a cada suceso asociamos una medida de la posibilidad de

    que tenga lugar. A esta medida se llama probabilidad de ocurrencia del suceso.

    Tres puntos de vista o enfoques de la probabilidad:

    Frecuencialista: la probabilidad de un suceso es el lmite al que tiende la

    frecuencia relativa con que se presenta dicho suceso.

    Objetivas: es el grado de evidencia de una proposicin cualquiera.

    Subjetiva: es el grado de creencia personal en la veracidad de una

    proposicin.

    3.2. ESPACIOS DE PROBABILIDADES

    Figura 3. 1 Espacio muestral

    E= Espacio muestral

    x

    x

    x

    x

    x

    A

    A=suceso compuesto

    x=suceso elemental

  • 3. Probabilidades

    -49-

    Al conjunto de los posibles resultados del experimento aleatorio se denomina

    "Espacio muestral". Grficamente lo solemos representar por un crculo, tal como

    aparece en la Figura 3. 1.

    Si los resultados se pueden contar, o se pueden contabilizar, aunque sea para

    un nmero infinito, el espacio muestral es discreto.

    Si el espacio muestral es incontable, caso de un nmero real en el intervalo

    de la recta real, se dice que el espacio muestral es "continuo".

    Ejemplos de espacio muestrales son:

    - Nmero de puntos al lanzar un dado (discreto y finito),

    - Nmero de accionamiento de un interruptor hasta su fallo (discreto e infinito

    numerable),

    - Medida del peso de un paquete de arroz (contnuo).

    Al espacio muestral lo representamos por la letra E.

    Actividad 3.1:

    Cul es el espacio muestral al lanzar un dado?

    Cul es el espacio muestral al lanzar una moneda?

    Cul es el espacio muestral al medir el peso de un paquete de arroz?.

    Un suceso A, es cualquier subconjunto contenido en el espacio muestral. Si el

    suceso es un posible resultado del experimento aleatorio, lo llamamos "suceso

    elemental". Cualquier otro subconjunto se denomina "suceso compuesto".

    Otros sucesos que se definen a partir del espacio muestral son:

    1) Suceso vaco. El que tericamente nunca va a aparecer. Lo representamos por

    . (ej. Obtener 7 puntos al lanzar un dado normal)

    2) Suceso cierto. El que siempre aparece. El suceso E siempre aparece, ya que al

    realizar el experimento aleatorio siempre tendr lugar algn resultado del espacio

    muestral.

    3) Suceso complementario. Dado el suceso EA , el complementario A ocurre cuando no aparece el A.

  • 3. Probabilidades

    -50-

    4) Sucesos mutuamente excluyentes. Cuando dados dos sucesos A,A 21 , si

    ocurre uno de ellos no ocurre el otro, es decir, no se pueden dar al mismo

    tiempo.

    5) Suceso unin. Dados dos sucesos A,A 21 , se llama suceso unin AA 21

    cuando aparece el A1 o el A2 ambos a la vez. Tambin recibe el nombre de

    adicin.

    6) Suceso interseccin. Dados los sucesos EA,A 21 se llama interseccin

    AA 21 , cuando sucede A1 y A2 a la vez.

    Al igual que con el conjunto de nmeros se establecen unas operaciones que

    dan lugar a otros nmeros, con los sucesos pertenecientes al espacio muestral, y

    mediante operaciones de complementacin, unin e interseccin, dan lugar a otros

    sucesos. El conjunto de dichos sucesos se dice que forman una -lgebra si se

    cumplen las dos condiciones siguientes:

    1) Si FA el suceso A tambin pertenece a F.

    2) Si F,....A,A 21 , el suceso unin infinita tambin pertenece a F.

    Recordar las propiedades conmutativas y asociativas de la unin y de la

    interseccin, y la propiedad distributiva de cada una de estas operaciones respecto

    de la otra.

    Realmente la probabilidad es una aplicacin del espacio muestral en la recta

    real. Dado un espacio muestral E, y una -algebra F, decimos que la aplicacin

    F:P es una probabilidad, si y solo si se cumplen los siguientes axiomas:

    1) 0P(A) FA

    2) 1=P(E)

    3) )AP(AAA F;,....A,A ii

    ij

    ji

    i21 =)P( es =

    A partir de estos axiomas se demuestran las siguientes propiedades:

    1) Probabilidad del suceso contrario: P(A)-1=)AP(

    2) Probabilidad del suceso vaco: 0=1-1=P(E)-1=)P(

  • 3. Probabilidades

    -51-

    3) Inclusin. Si P(B)P(A) B,A

    4) 1P(A)0 F,A , ya que cualquier EA .

    5) Probabilidad de la unin: B)P(A-P(B)+P(A)=B)P(A

    Grficamente se observa en la Figura 3. 2.

    Figura 3. 2 Unin de sucesos

    La demostracin es:

    =B)A(Ay B),A(A=BA

    la probabilidad ser la suma de probabilidades,

    B)AP(+P(A)=B)P(A

    pero tambin el suceso B se puede poner como

    B)A(B)(A=B

    como son conjuntos disjuntos

    B)AP(+B)P(A=P(B)

    de donde despejando B)AP( queda:

    B)P(A-P(B)+P(A)=B)P(A

    E= Espacio muestral

    B A

    AB

  • 3. Probabilidades

    -52-

    Como generalizacin de la unin de tres o ms sucesos, tenemos la

    expresin general de la unin de sucesos:

    C)BP(A+C)P(B-C)P(A-B)P(A-P(C)+P(B)+P(A)=C)BP(A

    Observar la correspondencia que hay entre probabilidades y la frecuencia

    relativa de un suceso A.

    A la tripleta (E,F,P) se denomina espacio probabilstico.

    Actividad 3.2:

    Un submarino lanza tres torpedos contra un barco. Cada uno de los torpedos

    tiene una probabilidad de 0,7 de alcanzar el barco. Cul es la probabilidad

    de hundir el barco?

    Si de una baraja de 40 cartas extraemos 3 al azar, cul es la probabilidad

    de que salgan 2 oros?

    o Con reposicin,

    o Sin reposicin.

    3.4. PROBABILIZACIN DE ESPACIOS MUESTRALES

    Podemos asimilar, desde un punto de vista mecnico, la probabilidad como la

    cantidad de masa de 1 gramo que se reparte en el espacio muestral. De forma que la

    probabilidad de un suceso corresponde con la cantidad de masa que incluye dicho

    suceso dentro del espacio muestral. Si el espacio muestral es discreto, la cantidad de

    masa de un gramo se encuentra repartida en un serie de puntos discretos. Si el

    espacio muestral es continuo, la masa se reparte de forma continua en el espacio

    muestral, aunque puede haber zonas donde haya ms cantidad de masa que en

    otras.

    Probabilizacin de Espacios Muestrales Discretos

    Cuando el espacio muestral es discreto, cada resultado elemental tiene asignado un

    peso, probabilidad, de manera que la suma de pesos elementales debe dar la unidad,

    ya que la unin de todos ellos forma el espacio muestral E, y cada suceso elemental

    es excluyente respecto a cualquier otro suceso elemental.

    Si el espacio muestral discreto es finito y, adems cada uno de los resultados

    es igualmente probable, entonces el peso, o probabilidad, que asignamos a cada

  • 3. Probabilidades

    -53-

    suceso elemental es 1/n de resultados que hay. Pero si es un espacio muestral

    discreto infinito pero numerable, como la suma debe dar 1, no puede pesar igual un

    resultado que otro, no obstante se debe cumplir que la suma infinita de los pesos

    converja a la unidad.

    En cualquiera de los casos anteriores, la probabilidad de un suceso

    compuesto es la suma de las probabilidades de los resultados individuales que lo

    integran.

    Probabilizacin de Espacios Muestrales Finitos Simtricos. Combinatoria

    Para el caso de un espacio muestral discreto finito y simtrico, esto es, que cada

    posible resultado tiene el mismo peso, la probabilidad de un suceso se puede calcular

    sumando las probabilidades de los sucesos elementales que incluye, lo cual equivale

    a aplicar la regla de:

    posibles casos

    favorables casos=A) P(suceso

    y para hacer un recuento de casos favorables y casos posibles debemos acudir a la

    combinatoria, donde habr que distinguir si influye el orden, variaciones, o no influye

    el orden, combinaciones, y dentro de cada uno de ellos, si los elementos se pueden

    repetir no. As tenemos el siguiente esquema:

    Combinatoria

    Variaciones sin repeticin de m elementos tomados de n en n.:

    - 1)+n-2)...(m-1)(m-m(m=V nm,

    - n!=Pn

    Variaciones con repeticin de m elementos tomados de n en n:

    - m=Vn

    nm,

    - n=...++ donde !...!

    n!=P

    ,...,n,

    Combinaciones sin repeticin de m elementos tomados de n en n:

    - n)!-(mn!

    m!=

    n

    m=C nm,

    Combinaciones con repeticin de m elementos tomados de n en n.:

  • 3. Probabilidades

    -54-

    -

    n

    1-n+m=C

    nm,

    La probabilizacin de espacios muestrales contnuos se lleva a cabo mediante

    una funcin llamada funcin de densidad.

    Actividad 3.3:

    Con las letras a, b, c, d

    o Cuntas palabras de 2 letras se pueden formar?

    o Cuntas palabras de 3 letras se pueden formar?

    o Cuntas palabras de 4 letras se pueden formar?

    o Si podemos repetir las letras, cuntas palabras de 2 letras se pueden

    tener?

    o Si no podemos repetir las letras, cuntas combinaciones de 2 letras

    podra obtener?

    o Si ahora podemos repetir las letras, Cuntas palabras podemos

    obtener?

    3.5. PROBABILIDAD CONDICIONADA

    Dado un espacio muestral E, si conocemos que ha ocurrido un suceso EA , el espacio muestral realmente se ha reducido ahora a dicho suceso A conocido, con lo

    cual las probabilidades de los sucesos pertenecientes a E se modifican de acuerdo

    con el conocimiento de A, y entonces el peso de cualquier EB viene dado por la parte comn de B con A en relacin al total de A, que en el nuevo espacio muestral

    es el suceso cierto.

    Si partimos del espacio de probabilidades (E,F,P) y conocemos el suceso

    0P(A) con F,A , definimos la probabilidad de suceso C condicionado a que ha

    ocurrido el suceso A, como:

    P(A)

    A)P(B=P(B/A)=(B)PA

  • 3. Probabilidades

    -55-

    Actividad 3.4:

    Al lanzar un dado, cul es la probabilidad de sacar un 2?

    Si antes de mostrar el dado, yo lo veo y digo que es un nmero par, cul es

    la probabilidad de que ahora sea el 2?

    Esta medida as definida cumple los axiomas de probabilidad, esto es:

    1) 0P(B/A)

    2) 1=P(A/A)

    3) Si /A)BP(+/A)BP(=/A)BBP(;=BB 212121 .

    Como es una probabilidad, rene todas las propiedades de la misma, es decir:

    1) P(B/A)-1=/A)BP( .

    2) 0=/A)P( .

    3) /A)BP(/A)BP( ,BB Si 2121 .

    4) 1P(B/A)0 F,B .

    5) /A)BBP(-/A)BP(+/A)BP(=/A)BBP( 21121 1

    6) La definicin de probabilidad condicional se puede aplicar a la propia probabilidad

    condicional:

    (B)P

    B)(CP=(C/B)P

    A

    AA

    B)P(A

    C)BP(A=

    P(A)

    B)P(A

    P(A)

    A)BP(C

    =

    A)P(C/B=P(C/B/A)

  • 3. Probabilidades

    -56-

    3.6. TEOREMA DE LA INTERSECCIN

    La probabilidad de la interseccin de dos sucesos se puede obtener de la propia

    definicin de probabilidad condicionada como:

    )P(B).P(B/A=)P(A).P(B/A=B)P(A

    Para el caso de ser tres sucesos, la probabilidad de la interseccin es:

    B)).P(C/AP(A).P(B/A=C)BP(A

    Lo anterior tambin se aplica a probabilidades condicionales, as:

    C)/AP(A/C).P(B=B/C)P(A

    Si A y B son independientes tambin lo son los sucesos complementarios, as

    como entre todos ellos.

    3.7. TEOREMA DE LA PARTICIN TOTAL

    Dado un espacio muestral E, recibe el nombre de particin al conjunto de sucesos

    A,....,A,A,A n321 tales que:

    1) =A.....AAA n321 siendo ji =AA ji , es decir son mutuamente

    excluyentes.

    2) La unin de dichos sucesos forman el espacio muestral, esto es:

    E=A,.....,AA n21

    Grficamente se representa en la Figura 3. 3.

    Figura 3. 3 Teorema de la particin

    E= Espacio muestral

    B

    AiB

    A1 A2

    An

    Ai

  • 3. Probabilidades

    -57-

    Si definimos otro suceso B incluido en E,