Inferencia Estadística (Ing. Comercial) I.- Distribuciones Muestrales
-
Upload
independent -
Category
Documents
-
view
0 -
download
0
Transcript of Inferencia Estadística (Ing. Comercial) I.- Distribuciones Muestrales
Inferencia Estadística (Ing. Comercial)I.- Distribuciones Muestrales
Prof.: Dr. Marco Riquelme A.
Primer Semestre - 2014. UTAL
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 1 / 21
Muestra aleatoria
De�nición (Muestra aleatoria)
Sea X una v.a. con cierta distribución de probabilidad. Sean X1,X2, ...,Xn
n v.a.'s independientes cada una tiene asociada la misma distribución de X .Entonces, diremos que X1,X2, ...,Xn constituye una muestra aleatoria de
tamaño n (ma(n)).
Notación: vaiid = Variables aleatorias independientes idénticamente
distribuidas.
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 2 / 21
Muestra aleatoria
De�nición (Muestra aleatoria)
Sea X una v.a. con cierta distribución de probabilidad. Sean X1,X2, ...,Xn
n v.a.'s independientes cada una tiene asociada la misma distribución de X .Entonces, diremos que X1,X2, ...,Xn constituye una muestra aleatoria de
tamaño n (ma(n)).
Notación: vaiid = Variables aleatorias independientes idénticamente
distribuidas.
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 2 / 21
Algunas de�niciones
De�nición (Parámetro)
Un parámetro es una caracterización numérica de la distribución de la
población de manera que describe completamente la función de densidad
de probabilidad (f.d.p.) o función de cuantía (f.c).
Por ejemplo, si X ∼ Exp(λ), entonces λ es el parámetro.
El objetivo, más adelante, será estimar estos parámetros en función de
información muestral.
De�nición (Estadístico)
Un estadístico, o también llamado estadístico muestral, es cualquier
función de la ma(n), de manera que la función no contiene parámetros
desconocidos.
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 3 / 21
Algunas de�niciones
De�nición (Parámetro)
Un parámetro es una caracterización numérica de la distribución de la
población de manera que describe completamente la función de densidad
de probabilidad (f.d.p.) o función de cuantía (f.c).
Por ejemplo, si X ∼ Exp(λ), entonces λ es el parámetro.
El objetivo, más adelante, será estimar estos parámetros en función de
información muestral.
De�nición (Estadístico)
Un estadístico, o también llamado estadístico muestral, es cualquier
función de la ma(n), de manera que la función no contiene parámetros
desconocidos.
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 3 / 21
Algunas de�niciones
De�nición (Parámetro)
Un parámetro es una caracterización numérica de la distribución de la
población de manera que describe completamente la función de densidad
de probabilidad (f.d.p.) o función de cuantía (f.c).
Por ejemplo, si X ∼ Exp(λ), entonces λ es el parámetro.
El objetivo, más adelante, será estimar estos parámetros en función de
información muestral.
De�nición (Estadístico)
Un estadístico, o también llamado estadístico muestral, es cualquier
función de la ma(n), de manera que la función no contiene parámetros
desconocidos.
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 3 / 21
Algunas de�niciones
De�nición (Parámetro)
Un parámetro es una caracterización numérica de la distribución de la
población de manera que describe completamente la función de densidad
de probabilidad (f.d.p.) o función de cuantía (f.c).
Por ejemplo, si X ∼ Exp(λ), entonces λ es el parámetro.
El objetivo, más adelante, será estimar estos parámetros en función de
información muestral.
De�nición (Estadístico)
Un estadístico, o también llamado estadístico muestral, es cualquier
función de la ma(n), de manera que la función no contiene parámetros
desconocidos.
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 3 / 21
Ejemplo
Ejemplo
Todas las medidas de resumen, vistas en Estadística Descriptiva, son
estadísticos. Es decir, las siguientes expresiones serían estadísticos:
X =1
n
n∑i=1
Xi ,
S2 =1
n − 1
n∑i=1
(Xi − X )2,
mín = minni=1{Xi}
máx = maxni=1{Xi}
Parámetro V Población
Estadístico V Muestra
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 4 / 21
Ejemplo
Ejemplo
Todas las medidas de resumen, vistas en Estadística Descriptiva, son
estadísticos. Es decir, las siguientes expresiones serían estadísticos:
X =1
n
n∑i=1
Xi ,
S2 =1
n − 1
n∑i=1
(Xi − X )2,
mín = minni=1{Xi}
máx = maxni=1{Xi}
Parámetro V Población
Estadístico V Muestra
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 4 / 21
Ejemplo
Ejemplo
Todas las medidas de resumen, vistas en Estadística Descriptiva, son
estadísticos. Es decir, las siguientes expresiones serían estadísticos:
X =1
n
n∑i=1
Xi ,
S2 =1
n − 1
n∑i=1
(Xi − X )2,
mín = minni=1{Xi}
máx = maxni=1{Xi}
Parámetro V Población
Estadístico V Muestra
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 4 / 21
Ejemplo
Ejemplo
Todas las medidas de resumen, vistas en Estadística Descriptiva, son
estadísticos. Es decir, las siguientes expresiones serían estadísticos:
X =1
n
n∑i=1
Xi ,
S2 =1
n − 1
n∑i=1
(Xi − X )2,
mín = minni=1{Xi}
máx = maxni=1{Xi}
Parámetro V Población
Estadístico V Muestra
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 4 / 21
Ejemplo
Ejemplo
Todas las medidas de resumen, vistas en Estadística Descriptiva, son
estadísticos. Es decir, las siguientes expresiones serían estadísticos:
X =1
n
n∑i=1
Xi ,
S2 =1
n − 1
n∑i=1
(Xi − X )2,
mín = minni=1{Xi}
máx = maxni=1{Xi}
Parámetro V Población
Estadístico V Muestra
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 4 / 21
Distribución muestral
De�nición (Distribución muestral)
La distribución muestral es la distribución de probabilidad teórica asociada
a un estadístico muestral.
Esta distribución se obtiene como resultado de un número in�nito de
ma(n), provenientes de la población de interés.
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 5 / 21
Distribución muestral
De�nición (Distribución muestral)
La distribución muestral es la distribución de probabilidad teórica asociada
a un estadístico muestral.
Esta distribución se obtiene como resultado de un número in�nito de
ma(n), provenientes de la población de interés.
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 5 / 21
Teorema del límite central
Teorema (Teorema del límite central (TLC))
Supongamos que tenemos una muestra aleatoria de tamaño n, es decir,
X1,X2, ...,Xn, independientes e idénticamente distribuidas, con distribución
de probabilidad no especi�cada y que tienen media µ = E (X ) y varianza
σ2 = V (X ). Entonces, la media muestral (estadístico) X =1
n
n∑i=1
Xi tiende
a una distribución normal (para n grande) con media µ y varianza σ2/n, esdecir,
Xn→∞∼ N (µ, σ2/n)
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 6 / 21
Algunas consideraciones del TLC
Independientemente de la naturaleza de la distribución de probabilidad:
discreta, continua, simétrica o sesgada, unimodal o multimodal, la
distribución muestral de X es normal (continua, simétrica y unimodal),
mientras el tamaño de la muestra sea su�cientemente grande.
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 7 / 21
Ejemplo
Ejemplo
Suponga que un banco, se registran los tiempos de atención (en segundos)
en una muestra de clientes. Los expertos saben, (más adelante
enseñaremos como encontrar este valor del parámetro), que el tiempo
medio de atención debería ser de 150 segundos, por lo cual proponen una
distribución exponencial con parámetro λ = 1/150. Las mediciones se
realizan diariamente y se debe especi�car el tamaño de muestra (clientes n)
a considerar.
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 8 / 21
Continuación
Por ejemplo, se considera una muestra de tamaño 4 clientes (n=4), y se
realizan mediciones cada día, a lo largo de 30 (30 réplicas).
En una muestra de tamaño 4, es difícil visualizar la distribución
exponencial, pero así es (por lo menos teóricamente). Y según el TLC, a
medida que el tamaño de muestra se incrementa, la distribución del
promedio debería aproximarse a la distribución normal.
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 9 / 21
Continuación
Por ejemplo, se considera una muestra de tamaño 4 clientes (n=4), y se
realizan mediciones cada día, a lo largo de 30 (30 réplicas).
En una muestra de tamaño 4, es difícil visualizar la distribución
exponencial, pero así es (por lo menos teóricamente). Y según el TLC, a
medida que el tamaño de muestra se incrementa, la distribución del
promedio debería aproximarse a la distribución normal.
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 9 / 21
Continuación: Visualizando el TLC
Para poder visualizar, el TLC, consideraremos distintos tamaños de
muestras (n), y se realizará el estudio a lo largo de 500 días.
Del problema sabemos que, X ∼ Exp(1/150), lo que implica que
µ = E (X ) = 150 y σ2 = V (X ) = 1502
Según el TLC, la distribución (aproximada) de X , considerando una
ma(n), es:
Xn→∞∼ N
(150, 1502/n
)La distribución de exacta del promedio es:
X ∼ G(n,
150
n
).
Se gra�cará la distribución de X , (para distintos valores de n). La
distribución gamma con azul y la normal con negro.
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 10 / 21
Continuación: Visualizando el TLC
Para poder visualizar, el TLC, consideraremos distintos tamaños de
muestras (n), y se realizará el estudio a lo largo de 500 días.
Del problema sabemos que, X ∼ Exp(1/150), lo que implica que
µ = E (X ) = 150 y σ2 = V (X ) = 1502
Según el TLC, la distribución (aproximada) de X , considerando una
ma(n), es:
Xn→∞∼ N
(150, 1502/n
)La distribución de exacta del promedio es:
X ∼ G(n,
150
n
).
Se gra�cará la distribución de X , (para distintos valores de n). La
distribución gamma con azul y la normal con negro.
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 10 / 21
Continuación: Visualizando el TLC
Para poder visualizar, el TLC, consideraremos distintos tamaños de
muestras (n), y se realizará el estudio a lo largo de 500 días.
Del problema sabemos que, X ∼ Exp(1/150), lo que implica que
µ = E (X ) = 150 y σ2 = V (X ) = 1502
Según el TLC, la distribución (aproximada) de X , considerando una
ma(n), es:
Xn→∞∼ N
(150, 1502/n
)
La distribución de exacta del promedio es:
X ∼ G(n,
150
n
).
Se gra�cará la distribución de X , (para distintos valores de n). La
distribución gamma con azul y la normal con negro.
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 10 / 21
Continuación: Visualizando el TLC
Para poder visualizar, el TLC, consideraremos distintos tamaños de
muestras (n), y se realizará el estudio a lo largo de 500 días.
Del problema sabemos que, X ∼ Exp(1/150), lo que implica que
µ = E (X ) = 150 y σ2 = V (X ) = 1502
Según el TLC, la distribución (aproximada) de X , considerando una
ma(n), es:
Xn→∞∼ N
(150, 1502/n
)La distribución de exacta del promedio es:
X ∼ G(n,
150
n
).
Se gra�cará la distribución de X , (para distintos valores de n). La
distribución gamma con azul y la normal con negro.
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 10 / 21
Continuación: Visualizando el TLC
Para poder visualizar, el TLC, consideraremos distintos tamaños de
muestras (n), y se realizará el estudio a lo largo de 500 días.
Del problema sabemos que, X ∼ Exp(1/150), lo que implica que
µ = E (X ) = 150 y σ2 = V (X ) = 1502
Según el TLC, la distribución (aproximada) de X , considerando una
ma(n), es:
Xn→∞∼ N
(150, 1502/n
)La distribución de exacta del promedio es:
X ∼ G(n,
150
n
).
Se gra�cará la distribución de X , (para distintos valores de n). La
distribución gamma con azul y la normal con negro.
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 10 / 21
Continuación: Distribución de X , para n = 1
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 11 / 21
Continuación: Distribución de X , para n = 7
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 12 / 21
Continuación: Distribución de X , para n = 31
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 13 / 21
Continuación: Distribución de X , para n = 365
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 14 / 21
Distribución muestral de X
Teorema
Supongamos que tenemos una muestra aleatoria de tamaño n, es decir,
X1,X2, ...,Xn, independientes e idénticamente distribuidas, con distribución
de probabilidad normal y que tienen media µ = E (X ) y varianza
σ2 = V (X ). Entonces, la media muestral X =1
n
n∑i=1
Xi tiene una
distribución normal con media µ y varianza σ2/n, es decir,
X ∼ N (µ, σ2/n)⇔ X − µσ/√n∼ N (0, 1)
El teorema anterior, supone que al hacer el histograma de los datos, debe
tener forma de campana.
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 15 / 21
Distribución muestral de X
Teorema
Supongamos que tenemos una muestra aleatoria de tamaño n, es decir,
X1,X2, ...,Xn, independientes e idénticamente distribuidas, con distribución
de probabilidad normal y que tienen media µ = E (X ) y varianza
σ2 = V (X ). Entonces, la media muestral X =1
n
n∑i=1
Xi tiene una
distribución normal con media µ y varianza σ2/n, es decir,
X ∼ N (µ, σ2/n)⇔ X − µσ/√n∼ N (0, 1)
El teorema anterior, supone que al hacer el histograma de los datos, debe
tener forma de campana.
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 15 / 21
Distribución muestral de S2, suponiendo µ conocida.
Teorema
Sean X1,X2, ...,Xn una muestra aleatoria de una distribución normal con
media µ y varianza σ2. Entonces,∑ni=1
(Xi − µ)2
σ2∼ χ2(n).
Es necesario suponer que µ es conocida y σ2 no.
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 16 / 21
Distribución muestral de S2, suponiendo µ conocida.
Teorema
Sean X1,X2, ...,Xn una muestra aleatoria de una distribución normal con
media µ y varianza σ2. Entonces,∑ni=1
(Xi − µ)2
σ2∼ χ2(n).
Es necesario suponer que µ es conocida y σ2 no.
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 16 / 21
Distribución muestral de S2, suponiendo µ desconocida.
En la práctica es muy difícil conocer el verdadero valor de µ, entoncesla expresión anterior tiene poca utilidad.
De acuerdo a lo anterior, si se muestrea una población normal con
media µ y varianza σ2 (ambas desconocidas), la varianza muestral se
de�ne por
S2 =1
n − 1
n∑i=1
(Xi − X )2.
Entonces,
(n − 1)S2
σ2∼ χ2(n − 1).
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 17 / 21
Distribución muestral de S2, suponiendo µ desconocida.
En la práctica es muy difícil conocer el verdadero valor de µ, entoncesla expresión anterior tiene poca utilidad.
De acuerdo a lo anterior, si se muestrea una población normal con
media µ y varianza σ2 (ambas desconocidas), la varianza muestral se
de�ne por
S2 =1
n − 1
n∑i=1
(Xi − X )2.
Entonces,
(n − 1)S2
σ2∼ χ2(n − 1).
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 17 / 21
Distribución muestral de S2, suponiendo µ desconocida.
En la práctica es muy difícil conocer el verdadero valor de µ, entoncesla expresión anterior tiene poca utilidad.
De acuerdo a lo anterior, si se muestrea una población normal con
media µ y varianza σ2 (ambas desconocidas), la varianza muestral se
de�ne por
S2 =1
n − 1
n∑i=1
(Xi − X )2.
Entonces,
(n − 1)S2
σ2∼ χ2(n − 1).
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 17 / 21
Distribución muestral de X−µS/√n
La distribución t−Student
Lema
Sea Z ∼ N (0, 1) y X ∼ χ2(ν), dos v.a.'s independientes, entonces
T =Z√X/ν
∼ t(ν)
Teorema
Supongamos que tenemos una muestra aleatoria de tamaño n, es decir,
X1,X2, ...,Xn, independientes e idénticamente distribuidas, con distribución
de probabilidad normal y que tienen media µ = E (X ) y varianza
σ2 = V (X ). Entonces,X − µS/√n∼ t(n − 1)
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 18 / 21
Distribución muestral de X − Y , suponiendo varianzasconocidas
Teorema
Suponga que le muestreo se lleva a cabo bajo dos poblaciones normales
independientes, digamos, X1,X2, ...,XnX e Y1,Y2, ...,YnY , con varianzas
conocidas. Es decir, X ∼ N (µX , σ2
X ) y Y ∼ N (µY , σ2
Y ). Entonces,
X − Y − (µX − µY )√σ2X
nX+
σ2Y
nY
∼ N (0, 1),
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 19 / 21
Distribución muestral de X − Y , suponiendo varianzasdesconocidas
En la práctica, puede surgir la necesidad de comparar las medias de dos
distribución.
Teorema
Suponga que le muestreo se lleva a cabo bajo dos poblaciones normales
independientes, digamos, X1,X2, ...,XnX y Y1,Y2, ...,YnY , con varianzas
iguales, pero desconocidas. Es decir, X ∼ N (µX , σ2) y Y ∼ N (µY , σ
2).Entonces,
X − Y − (µX − µY )
Sp
√1
nX+ 1
nY
∼ t(nX + nY − 2),
donde S2p =
(nX−1)S2X+(nY−1)S2
Y
nx+ny−2 , además S2
X y S2
Y son las varianzas
muestrales de la población X e Y , respectivamente.
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 20 / 21
Distribución muestral de S2
X/σ2
X
S2
Y/σ2
Y
La distribución Fisher
Lema
Sean X ∼ χ2(ν1) e Y ∼ χ2(ν2) dos v.a.'s independientes, entonces
F =X/ν1Y /ν2
∼ F(ν1, ν2)
Teorema
Suponga que le muestreo se lleva a cabo bajo dos poblaciones normales
independientes, digamos, X1,X2, ...,XnX e Y1,Y2, ...,YnY . Es decir,
X ∼ N (µX , σ2
X ) e Y ∼ N (µY , σ2
Y ). Entonces,
S2
X/σ2
X
S2
Y /σ2
Y
∼ F(nX − 1, nY − 1)
Prof.: Dr. Marco Riquelme A. (UTAL) Inferencia Estadística Primer Semestre - 2014 21 / 21