Inferencia Estadística (Ing. Comercial) I.- Distribuciones Muestrales

Inferencia Estadística (Ing. Comercial)I.- Distribuciones Muestrales

Prof.: Dr. Marco Riquelme A.

Primer Semestre - 2014. UTAL

Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 1 / 21

Muestra aleatoria

De�nición (Muestra aleatoria)

Sea X una v.a. con cierta distribución de probabilidad. Sean X1,X2, ...,Xn

n v.a.'s independientes cada una tiene asociada la misma distribución de X .Entonces, diremos que X1,X2, ...,Xn constituye una muestra aleatoria de

tamaño n (ma(n)).

Notación: vaiid = Variables aleatorias independientes idénticamente

distribuidas.

Muestra aleatoria

De�nición (Muestra aleatoria)

Sea X una v.a. con cierta distribución de probabilidad. Sean X1,X2, ...,Xn

n v.a.'s independientes cada una tiene asociada la misma distribución de X .Entonces, diremos que X1,X2, ...,Xn constituye una muestra aleatoria de

tamaño n (ma(n)).

Notación: vaiid = Variables aleatorias independientes idénticamente

distribuidas.

Algunas de�niciones

De�nición (Parámetro)

Un parámetro es una caracterización numérica de la distribución de la

población de manera que describe completamente la función de densidad

de probabilidad (f.d.p.) o función de cuantía (f.c).

Por ejemplo, si X ∼ Exp(λ), entonces λ es el parámetro.

El objetivo, más adelante, será estimar estos parámetros en función de

información muestral.

De�nición (Estadístico)

Un estadístico, o también llamado estadístico muestral, es cualquier

función de la ma(n), de manera que la función no contiene parámetros

desconocidos.

Ejemplo

Todas las medidas de resumen, vistas en Estadística Descriptiva, son

estadísticos. Es decir, las siguientes expresiones serían estadísticos:

n∑i=1

n − 1

n∑i=1

(Xi − X )2,

mín = minni=1{Xi}

máx = maxni=1{Xi}

Parámetro V Población

Estadístico V Muestra

Ejemplo

n∑i=1

n − 1

n∑i=1

(Xi − X )2,

mín = minni=1{Xi}

máx = maxni=1{Xi}

Ejemplo

n∑i=1

n − 1

n∑i=1

(Xi − X )2,

mín = minni=1{Xi}

máx = maxni=1{Xi}

Ejemplo

n∑i=1

n − 1

n∑i=1

(Xi − X )2,

mín = minni=1{Xi}

máx = maxni=1{Xi}

Ejemplo

n∑i=1

n − 1

n∑i=1

(Xi − X )2,

mín = minni=1{Xi}

máx = maxni=1{Xi}

Distribución muestral

De�nición (Distribución muestral)

La distribución muestral es la distribución de probabilidad teórica asociada

a un estadístico muestral.

Esta distribución se obtiene como resultado de un número in�nito de

ma(n), provenientes de la población de interés.

Distribución muestral

De�nición (Distribución muestral)

La distribución muestral es la distribución de probabilidad teórica asociada

a un estadístico muestral.

Esta distribución se obtiene como resultado de un número in�nito de

ma(n), provenientes de la población de interés.

Teorema del límite central

Teorema (Teorema del límite central (TLC))

Supongamos que tenemos una muestra aleatoria de tamaño n, es decir,

X1,X2, ...,Xn, independientes e idénticamente distribuidas, con distribución

de probabilidad no especi�cada y que tienen media µ = E (X ) y varianza

σ2 = V (X ). Entonces, la media muestral (estadístico) X =1

n∑i=1

Xi tiende

a una distribución normal (para n grande) con media µ y varianza σ2/n, esdecir,

Xn→∞∼ N (µ, σ2/n)

Algunas consideraciones del TLC

Independientemente de la naturaleza de la distribución de probabilidad:

discreta, continua, simétrica o sesgada, unimodal o multimodal, la

distribución muestral de X es normal (continua, simétrica y unimodal),

mientras el tamaño de la muestra sea su�cientemente grande.

Ejemplo

Suponga que un banco, se registran los tiempos de atención (en segundos)

en una muestra de clientes. Los expertos saben, (más adelante

enseñaremos como encontrar este valor del parámetro), que el tiempo

medio de atención debería ser de 150 segundos, por lo cual proponen una

distribución exponencial con parámetro λ = 1/150. Las mediciones se

realizan diariamente y se debe especi�car el tamaño de muestra (clientes n)

a considerar.

Continuación

Por ejemplo, se considera una muestra de tamaño 4 clientes (n=4), y se

realizan mediciones cada día, a lo largo de 30 (30 réplicas).

En una muestra de tamaño 4, es difícil visualizar la distribución

exponencial, pero así es (por lo menos teóricamente). Y según el TLC, a

medida que el tamaño de muestra se incrementa, la distribución del

promedio debería aproximarse a la distribución normal.

Continuación

Por ejemplo, se considera una muestra de tamaño 4 clientes (n=4), y se

realizan mediciones cada día, a lo largo de 30 (30 réplicas).

En una muestra de tamaño 4, es difícil visualizar la distribución

exponencial, pero así es (por lo menos teóricamente). Y según el TLC, a

medida que el tamaño de muestra se incrementa, la distribución del

promedio debería aproximarse a la distribución normal.

Continuación: Visualizando el TLC

Para poder visualizar, el TLC, consideraremos distintos tamaños de

muestras (n), y se realizará el estudio a lo largo de 500 días.

Del problema sabemos que, X ∼ Exp(1/150), lo que implica que

µ = E (X ) = 150 y σ2 = V (X ) = 1502

Según el TLC, la distribución (aproximada) de X , considerando una

ma(n), es:

Xn→∞∼ N

(150, 1502/n

)La distribución de exacta del promedio es:

X ∼ G(n,

Se gra�cará la distribución de X , (para distintos valores de n). La

distribución gamma con azul y la normal con negro.

µ = E (X ) = 150 y σ2 = V (X ) = 1502

ma(n), es:

Xn→∞∼ N

(150, 1502/n

X ∼ G(n,

µ = E (X ) = 150 y σ2 = V (X ) = 1502

ma(n), es:

Xn→∞∼ N

(150, 1502/n

La distribución de exacta del promedio es:

X ∼ G(n,

µ = E (X ) = 150 y σ2 = V (X ) = 1502

ma(n), es:

Xn→∞∼ N

(150, 1502/n

X ∼ G(n,

µ = E (X ) = 150 y σ2 = V (X ) = 1502

ma(n), es:

Xn→∞∼ N

(150, 1502/n

X ∼ G(n,

Continuación: Distribución de X , para n = 1

Distribución muestral de X

Teorema

de probabilidad normal y que tienen media µ = E (X ) y varianza

σ2 = V (X ). Entonces, la media muestral X =1

n∑i=1

Xi tiene una

distribución normal con media µ y varianza σ2/n, es decir,

X ∼ N (µ, σ2/n)⇔ X − µσ/√n∼ N (0, 1)

El teorema anterior, supone que al hacer el histograma de los datos, debe

tener forma de campana.

Distribución muestral de X

Teorema

σ2 = V (X ). Entonces, la media muestral X =1

n∑i=1

Xi tiene una

distribución normal con media µ y varianza σ2/n, es decir,

X ∼ N (µ, σ2/n)⇔ X − µσ/√n∼ N (0, 1)

El teorema anterior, supone que al hacer el histograma de los datos, debe

tener forma de campana.

Distribución muestral de S2, suponiendo µ conocida.

Teorema

Sean X1,X2, ...,Xn una muestra aleatoria de una distribución normal con

media µ y varianza σ2. Entonces,∑ni=1

(Xi − µ)2

σ2∼ χ2(n).

Es necesario suponer que µ es conocida y σ2 no.

Distribución muestral de S2, suponiendo µ conocida.

Teorema

Sean X1,X2, ...,Xn una muestra aleatoria de una distribución normal con

media µ y varianza σ2. Entonces,∑ni=1

(Xi − µ)2

σ2∼ χ2(n).

Es necesario suponer que µ es conocida y σ2 no.

Distribución muestral de S2, suponiendo µ desconocida.

En la práctica es muy difícil conocer el verdadero valor de µ, entoncesla expresión anterior tiene poca utilidad.

De acuerdo a lo anterior, si se muestrea una población normal con

media µ y varianza σ2 (ambas desconocidas), la varianza muestral se

de�ne por

n − 1

n∑i=1

(Xi − X )2.

Entonces,

(n − 1)S2

σ2∼ χ2(n − 1).

de�ne por

n − 1

n∑i=1

(Xi − X )2.

Entonces,

(n − 1)S2

σ2∼ χ2(n − 1).

de�ne por

n − 1

n∑i=1

(Xi − X )2.

Entonces,

(n − 1)S2

σ2∼ χ2(n − 1).

Distribución muestral de X−µS/√n

La distribución t−Student

Sea Z ∼ N (0, 1) y X ∼ χ2(ν), dos v.a.'s independientes, entonces

T =Z√X/ν

∼ t(ν)

Teorema

σ2 = V (X ). Entonces,X − µS/√n∼ t(n − 1)

Distribución muestral de X − Y , suponiendo varianzasconocidas

Teorema

Suponga que le muestreo se lleva a cabo bajo dos poblaciones normales

independientes, digamos, X1,X2, ...,XnX e Y1,Y2, ...,YnY , con varianzas

conocidas. Es decir, X ∼ N (µX , σ2

X ) y Y ∼ N (µY , σ2

Y ). Entonces,

X − Y − (µX − µY )√σ2X

∼ N (0, 1),

Distribución muestral de X − Y , suponiendo varianzasdesconocidas

En la práctica, puede surgir la necesidad de comparar las medias de dos

distribución.

Teorema

independientes, digamos, X1,X2, ...,XnX y Y1,Y2, ...,YnY , con varianzas

iguales, pero desconocidas. Es decir, X ∼ N (µX , σ2) y Y ∼ N (µY , σ

2).Entonces,

X − Y − (µX − µY )

∼ t(nX + nY − 2),

donde S2p =

(nX−1)S2X+(nY−1)S2

nx+ny−2 , además S2

X y S2

Y son las varianzas

muestrales de la población X e Y , respectivamente.

Distribución muestral de S2

La distribución Fisher

Sean X ∼ χ2(ν1) e Y ∼ χ2(ν2) dos v.a.'s independientes, entonces

F =X/ν1Y /ν2

∼ F(ν1, ν2)

Teorema

independientes, digamos, X1,X2, ...,XnX e Y1,Y2, ...,YnY . Es decir,

X ∼ N (µX , σ2

X ) e Y ∼ N (µY , σ2

Y ). Entonces,

Y /σ2

∼ F(nX − 1, nY − 1)

Inferencia Estadística (Ing. Comercial) I.- Distribuciones Muestrales

Documents

Transcript of Inferencia Estadística (Ing. Comercial) I.- Distribuciones Muestrales