Inferencia Estadística (Ing. Comercial) I.- Distribuciones Muestrales

39

Transcript of Inferencia Estadística (Ing. Comercial) I.- Distribuciones Muestrales

Inferencia Estadística (Ing. Comercial)I.- Distribuciones Muestrales

Prof.: Dr. Marco Riquelme A.

Primer Semestre - 2014. UTAL

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 1 / 21

Muestra aleatoria

De�nición (Muestra aleatoria)

Sea X una v.a. con cierta distribución de probabilidad. Sean X1,X2, ...,Xn

n v.a.'s independientes cada una tiene asociada la misma distribución de X .Entonces, diremos que X1,X2, ...,Xn constituye una muestra aleatoria de

tamaño n (ma(n)).

Notación: vaiid = Variables aleatorias independientes idénticamente

distribuidas.

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 2 / 21

Muestra aleatoria

De�nición (Muestra aleatoria)

Sea X una v.a. con cierta distribución de probabilidad. Sean X1,X2, ...,Xn

n v.a.'s independientes cada una tiene asociada la misma distribución de X .Entonces, diremos que X1,X2, ...,Xn constituye una muestra aleatoria de

tamaño n (ma(n)).

Notación: vaiid = Variables aleatorias independientes idénticamente

distribuidas.

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 2 / 21

Algunas de�niciones

De�nición (Parámetro)

Un parámetro es una caracterización numérica de la distribución de la

población de manera que describe completamente la función de densidad

de probabilidad (f.d.p.) o función de cuantía (f.c).

Por ejemplo, si X ∼ Exp(λ), entonces λ es el parámetro.

El objetivo, más adelante, será estimar estos parámetros en función de

información muestral.

De�nición (Estadístico)

Un estadístico, o también llamado estadístico muestral, es cualquier

función de la ma(n), de manera que la función no contiene parámetros

desconocidos.

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 3 / 21

Algunas de�niciones

De�nición (Parámetro)

Un parámetro es una caracterización numérica de la distribución de la

población de manera que describe completamente la función de densidad

de probabilidad (f.d.p.) o función de cuantía (f.c).

Por ejemplo, si X ∼ Exp(λ), entonces λ es el parámetro.

El objetivo, más adelante, será estimar estos parámetros en función de

información muestral.

De�nición (Estadístico)

Un estadístico, o también llamado estadístico muestral, es cualquier

función de la ma(n), de manera que la función no contiene parámetros

desconocidos.

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 3 / 21

Algunas de�niciones

De�nición (Parámetro)

Un parámetro es una caracterización numérica de la distribución de la

población de manera que describe completamente la función de densidad

de probabilidad (f.d.p.) o función de cuantía (f.c).

Por ejemplo, si X ∼ Exp(λ), entonces λ es el parámetro.

El objetivo, más adelante, será estimar estos parámetros en función de

información muestral.

De�nición (Estadístico)

Un estadístico, o también llamado estadístico muestral, es cualquier

función de la ma(n), de manera que la función no contiene parámetros

desconocidos.

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 3 / 21

Algunas de�niciones

De�nición (Parámetro)

Un parámetro es una caracterización numérica de la distribución de la

población de manera que describe completamente la función de densidad

de probabilidad (f.d.p.) o función de cuantía (f.c).

Por ejemplo, si X ∼ Exp(λ), entonces λ es el parámetro.

El objetivo, más adelante, será estimar estos parámetros en función de

información muestral.

De�nición (Estadístico)

Un estadístico, o también llamado estadístico muestral, es cualquier

función de la ma(n), de manera que la función no contiene parámetros

desconocidos.

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 3 / 21

Ejemplo

Ejemplo

Todas las medidas de resumen, vistas en Estadística Descriptiva, son

estadísticos. Es decir, las siguientes expresiones serían estadísticos:

X =1

n

n∑i=1

Xi ,

S2 =1

n − 1

n∑i=1

(Xi − X )2,

mín = minni=1{Xi}

máx = maxni=1{Xi}

Parámetro V Población

Estadístico V Muestra

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 4 / 21

Ejemplo

Ejemplo

Todas las medidas de resumen, vistas en Estadística Descriptiva, son

estadísticos. Es decir, las siguientes expresiones serían estadísticos:

X =1

n

n∑i=1

Xi ,

S2 =1

n − 1

n∑i=1

(Xi − X )2,

mín = minni=1{Xi}

máx = maxni=1{Xi}

Parámetro V Población

Estadístico V Muestra

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 4 / 21

Ejemplo

Ejemplo

Todas las medidas de resumen, vistas en Estadística Descriptiva, son

estadísticos. Es decir, las siguientes expresiones serían estadísticos:

X =1

n

n∑i=1

Xi ,

S2 =1

n − 1

n∑i=1

(Xi − X )2,

mín = minni=1{Xi}

máx = maxni=1{Xi}

Parámetro V Población

Estadístico V Muestra

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 4 / 21

Ejemplo

Ejemplo

Todas las medidas de resumen, vistas en Estadística Descriptiva, son

estadísticos. Es decir, las siguientes expresiones serían estadísticos:

X =1

n

n∑i=1

Xi ,

S2 =1

n − 1

n∑i=1

(Xi − X )2,

mín = minni=1{Xi}

máx = maxni=1{Xi}

Parámetro V Población

Estadístico V Muestra

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 4 / 21

Ejemplo

Ejemplo

Todas las medidas de resumen, vistas en Estadística Descriptiva, son

estadísticos. Es decir, las siguientes expresiones serían estadísticos:

X =1

n

n∑i=1

Xi ,

S2 =1

n − 1

n∑i=1

(Xi − X )2,

mín = minni=1{Xi}

máx = maxni=1{Xi}

Parámetro V Población

Estadístico V Muestra

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 4 / 21

Distribución muestral

De�nición (Distribución muestral)

La distribución muestral es la distribución de probabilidad teórica asociada

a un estadístico muestral.

Esta distribución se obtiene como resultado de un número in�nito de

ma(n), provenientes de la población de interés.

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 5 / 21

Distribución muestral

De�nición (Distribución muestral)

La distribución muestral es la distribución de probabilidad teórica asociada

a un estadístico muestral.

Esta distribución se obtiene como resultado de un número in�nito de

ma(n), provenientes de la población de interés.

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 5 / 21

Teorema del límite central

Teorema (Teorema del límite central (TLC))

Supongamos que tenemos una muestra aleatoria de tamaño n, es decir,

X1,X2, ...,Xn, independientes e idénticamente distribuidas, con distribución

de probabilidad no especi�cada y que tienen media µ = E (X ) y varianza

σ2 = V (X ). Entonces, la media muestral (estadístico) X =1

n

n∑i=1

Xi tiende

a una distribución normal (para n grande) con media µ y varianza σ2/n, esdecir,

Xn→∞∼ N (µ, σ2/n)

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 6 / 21

Algunas consideraciones del TLC

Independientemente de la naturaleza de la distribución de probabilidad:

discreta, continua, simétrica o sesgada, unimodal o multimodal, la

distribución muestral de X es normal (continua, simétrica y unimodal),

mientras el tamaño de la muestra sea su�cientemente grande.

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 7 / 21

Ejemplo

Ejemplo

Suponga que un banco, se registran los tiempos de atención (en segundos)

en una muestra de clientes. Los expertos saben, (más adelante

enseñaremos como encontrar este valor del parámetro), que el tiempo

medio de atención debería ser de 150 segundos, por lo cual proponen una

distribución exponencial con parámetro λ = 1/150. Las mediciones se

realizan diariamente y se debe especi�car el tamaño de muestra (clientes n)

a considerar.

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 8 / 21

Continuación

Por ejemplo, se considera una muestra de tamaño 4 clientes (n=4), y se

realizan mediciones cada día, a lo largo de 30 (30 réplicas).

En una muestra de tamaño 4, es difícil visualizar la distribución

exponencial, pero así es (por lo menos teóricamente). Y según el TLC, a

medida que el tamaño de muestra se incrementa, la distribución del

promedio debería aproximarse a la distribución normal.

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 9 / 21

Continuación

Por ejemplo, se considera una muestra de tamaño 4 clientes (n=4), y se

realizan mediciones cada día, a lo largo de 30 (30 réplicas).

En una muestra de tamaño 4, es difícil visualizar la distribución

exponencial, pero así es (por lo menos teóricamente). Y según el TLC, a

medida que el tamaño de muestra se incrementa, la distribución del

promedio debería aproximarse a la distribución normal.

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 9 / 21

Continuación: Visualizando el TLC

Para poder visualizar, el TLC, consideraremos distintos tamaños de

muestras (n), y se realizará el estudio a lo largo de 500 días.

Del problema sabemos que, X ∼ Exp(1/150), lo que implica que

µ = E (X ) = 150 y σ2 = V (X ) = 1502

Según el TLC, la distribución (aproximada) de X , considerando una

ma(n), es:

Xn→∞∼ N

(150, 1502/n

)La distribución de exacta del promedio es:

X ∼ G(n,

150

n

).

Se gra�cará la distribución de X , (para distintos valores de n). La

distribución gamma con azul y la normal con negro.

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 10 / 21

Continuación: Visualizando el TLC

Para poder visualizar, el TLC, consideraremos distintos tamaños de

muestras (n), y se realizará el estudio a lo largo de 500 días.

Del problema sabemos que, X ∼ Exp(1/150), lo que implica que

µ = E (X ) = 150 y σ2 = V (X ) = 1502

Según el TLC, la distribución (aproximada) de X , considerando una

ma(n), es:

Xn→∞∼ N

(150, 1502/n

)La distribución de exacta del promedio es:

X ∼ G(n,

150

n

).

Se gra�cará la distribución de X , (para distintos valores de n). La

distribución gamma con azul y la normal con negro.

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 10 / 21

Continuación: Visualizando el TLC

Para poder visualizar, el TLC, consideraremos distintos tamaños de

muestras (n), y se realizará el estudio a lo largo de 500 días.

Del problema sabemos que, X ∼ Exp(1/150), lo que implica que

µ = E (X ) = 150 y σ2 = V (X ) = 1502

Según el TLC, la distribución (aproximada) de X , considerando una

ma(n), es:

Xn→∞∼ N

(150, 1502/n

)

La distribución de exacta del promedio es:

X ∼ G(n,

150

n

).

Se gra�cará la distribución de X , (para distintos valores de n). La

distribución gamma con azul y la normal con negro.

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 10 / 21

Continuación: Visualizando el TLC

Para poder visualizar, el TLC, consideraremos distintos tamaños de

muestras (n), y se realizará el estudio a lo largo de 500 días.

Del problema sabemos que, X ∼ Exp(1/150), lo que implica que

µ = E (X ) = 150 y σ2 = V (X ) = 1502

Según el TLC, la distribución (aproximada) de X , considerando una

ma(n), es:

Xn→∞∼ N

(150, 1502/n

)La distribución de exacta del promedio es:

X ∼ G(n,

150

n

).

Se gra�cará la distribución de X , (para distintos valores de n). La

distribución gamma con azul y la normal con negro.

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 10 / 21

Continuación: Visualizando el TLC

Para poder visualizar, el TLC, consideraremos distintos tamaños de

muestras (n), y se realizará el estudio a lo largo de 500 días.

Del problema sabemos que, X ∼ Exp(1/150), lo que implica que

µ = E (X ) = 150 y σ2 = V (X ) = 1502

Según el TLC, la distribución (aproximada) de X , considerando una

ma(n), es:

Xn→∞∼ N

(150, 1502/n

)La distribución de exacta del promedio es:

X ∼ G(n,

150

n

).

Se gra�cará la distribución de X , (para distintos valores de n). La

distribución gamma con azul y la normal con negro.

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 10 / 21

Continuación: Distribución de X , para n = 1

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 11 / 21

Continuación: Distribución de X , para n = 7

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 12 / 21

Continuación: Distribución de X , para n = 31

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 13 / 21

Continuación: Distribución de X , para n = 365

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 14 / 21

Distribución muestral de X

Teorema

Supongamos que tenemos una muestra aleatoria de tamaño n, es decir,

X1,X2, ...,Xn, independientes e idénticamente distribuidas, con distribución

de probabilidad normal y que tienen media µ = E (X ) y varianza

σ2 = V (X ). Entonces, la media muestral X =1

n

n∑i=1

Xi tiene una

distribución normal con media µ y varianza σ2/n, es decir,

X ∼ N (µ, σ2/n)⇔ X − µσ/√n∼ N (0, 1)

El teorema anterior, supone que al hacer el histograma de los datos, debe

tener forma de campana.

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 15 / 21

Distribución muestral de X

Teorema

Supongamos que tenemos una muestra aleatoria de tamaño n, es decir,

X1,X2, ...,Xn, independientes e idénticamente distribuidas, con distribución

de probabilidad normal y que tienen media µ = E (X ) y varianza

σ2 = V (X ). Entonces, la media muestral X =1

n

n∑i=1

Xi tiene una

distribución normal con media µ y varianza σ2/n, es decir,

X ∼ N (µ, σ2/n)⇔ X − µσ/√n∼ N (0, 1)

El teorema anterior, supone que al hacer el histograma de los datos, debe

tener forma de campana.

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 15 / 21

Distribución muestral de S2, suponiendo µ conocida.

Teorema

Sean X1,X2, ...,Xn una muestra aleatoria de una distribución normal con

media µ y varianza σ2. Entonces,∑ni=1

(Xi − µ)2

σ2∼ χ2(n).

Es necesario suponer que µ es conocida y σ2 no.

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 16 / 21

Distribución muestral de S2, suponiendo µ conocida.

Teorema

Sean X1,X2, ...,Xn una muestra aleatoria de una distribución normal con

media µ y varianza σ2. Entonces,∑ni=1

(Xi − µ)2

σ2∼ χ2(n).

Es necesario suponer que µ es conocida y σ2 no.

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 16 / 21

Distribución muestral de S2, suponiendo µ desconocida.

En la práctica es muy difícil conocer el verdadero valor de µ, entoncesla expresión anterior tiene poca utilidad.

De acuerdo a lo anterior, si se muestrea una población normal con

media µ y varianza σ2 (ambas desconocidas), la varianza muestral se

de�ne por

S2 =1

n − 1

n∑i=1

(Xi − X )2.

Entonces,

(n − 1)S2

σ2∼ χ2(n − 1).

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 17 / 21

Distribución muestral de S2, suponiendo µ desconocida.

En la práctica es muy difícil conocer el verdadero valor de µ, entoncesla expresión anterior tiene poca utilidad.

De acuerdo a lo anterior, si se muestrea una población normal con

media µ y varianza σ2 (ambas desconocidas), la varianza muestral se

de�ne por

S2 =1

n − 1

n∑i=1

(Xi − X )2.

Entonces,

(n − 1)S2

σ2∼ χ2(n − 1).

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 17 / 21

Distribución muestral de S2, suponiendo µ desconocida.

En la práctica es muy difícil conocer el verdadero valor de µ, entoncesla expresión anterior tiene poca utilidad.

De acuerdo a lo anterior, si se muestrea una población normal con

media µ y varianza σ2 (ambas desconocidas), la varianza muestral se

de�ne por

S2 =1

n − 1

n∑i=1

(Xi − X )2.

Entonces,

(n − 1)S2

σ2∼ χ2(n − 1).

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 17 / 21

Distribución muestral de X−µS/√n

La distribución t−Student

Lema

Sea Z ∼ N (0, 1) y X ∼ χ2(ν), dos v.a.'s independientes, entonces

T =Z√X/ν

∼ t(ν)

Teorema

Supongamos que tenemos una muestra aleatoria de tamaño n, es decir,

X1,X2, ...,Xn, independientes e idénticamente distribuidas, con distribución

de probabilidad normal y que tienen media µ = E (X ) y varianza

σ2 = V (X ). Entonces,X − µS/√n∼ t(n − 1)

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 18 / 21

Distribución muestral de X − Y , suponiendo varianzasconocidas

Teorema

Suponga que le muestreo se lleva a cabo bajo dos poblaciones normales

independientes, digamos, X1,X2, ...,XnX e Y1,Y2, ...,YnY , con varianzas

conocidas. Es decir, X ∼ N (µX , σ2

X ) y Y ∼ N (µY , σ2

Y ). Entonces,

X − Y − (µX − µY )√σ2X

nX+

σ2Y

nY

∼ N (0, 1),

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 19 / 21

Distribución muestral de X − Y , suponiendo varianzasdesconocidas

En la práctica, puede surgir la necesidad de comparar las medias de dos

distribución.

Teorema

Suponga que le muestreo se lleva a cabo bajo dos poblaciones normales

independientes, digamos, X1,X2, ...,XnX y Y1,Y2, ...,YnY , con varianzas

iguales, pero desconocidas. Es decir, X ∼ N (µX , σ2) y Y ∼ N (µY , σ

2).Entonces,

X − Y − (µX − µY )

Sp

√1

nX+ 1

nY

∼ t(nX + nY − 2),

donde S2p =

(nX−1)S2X+(nY−1)S2

Y

nx+ny−2 , además S2

X y S2

Y son las varianzas

muestrales de la población X e Y , respectivamente.

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 20 / 21

Distribución muestral de S2

X/σ2

X

S2

Y/σ2

Y

La distribución Fisher

Lema

Sean X ∼ χ2(ν1) e Y ∼ χ2(ν2) dos v.a.'s independientes, entonces

F =X/ν1Y /ν2

∼ F(ν1, ν2)

Teorema

Suponga que le muestreo se lleva a cabo bajo dos poblaciones normales

independientes, digamos, X1,X2, ...,XnX e Y1,Y2, ...,YnY . Es decir,

X ∼ N (µX , σ2

X ) e Y ∼ N (µY , σ2

Y ). Entonces,

S2

X/σ2

X

S2

Y /σ2

Y

∼ F(nX − 1, nY − 1)

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 21 / 21