Muestreo y Distribuciones de Muestreo 2012
Transcript of Muestreo y Distribuciones de Muestreo 2012
1. Determinar el tamaño de una muestra2. Asegurarse que las muestras que se
extraigan sean representativas de la población de la que provienen
3. Comprender las distribuciones del muestreo
4. Comprender la relación entre el costo del tomar muestras más grandes y la precisión adicional que esto le proporcione a las decisiones tomadas a partir de ellas
Al finalizar la Sesión 9, el participante será capaz de:
OBJETIVOS
Material de clase, Clodoaldo 2012
CONTENIDO
1. Tipos de Muestreo2. El muestreo3. Distribuciones de muestreo4. El teorema del límite central
Material de clase, Clodoaldo 2012
9.1 Importancia del muestreo
En lugar de levantar un censo “completo” se realiza un muestreo, debido a que un censo:
1. requiere demasiado tiempo2. es muy costoso3. muy laborioso e ineficiente
Material de clase, Clodoaldo 2012
A) MUESTREO NO PROBABILÍSTICO: No permite inferencia estadística.
1. M. de Juicio: Abarca el juicio del experto, opiniones de especialista
2. M. de Cuotas: Se decide la estructura del marco muestral, sin tener en cuenta la estructura del marco poblacional.
3. M. de Trozo: La elección de los “racimos” no se hace al azar.
9.2 Tipos de Muestreo
Material de clase, Clodoaldo 2012
(B) MUESTREO PROBABILÍSTICO: Permite inferencia estadística. Cada elemento del marco poblacional tiene una probabilidad conocida diferente de cero de conformar o ser parte de la muestra.
1. Muestreo Aleatorio Simple (MAS):Concepto: Todas las unidades elementales tienen la misma probabilidad de conformar la muestra. Dicho de otro modo, significa que cada una de las posibles muestras de tamaño n, tenga a la misma probabilidad: 1/N CN de ser seleccionada (muestreo sin sustitución). Es el caso de un sorteo.
Material de clase, Clodoaldo 2012
Tamaño de la muestra: Depende de:
1. La magnitud del máximo error permisible (e) y,
2. el grado de confianza de que el error en la estimación no exceda del máximo error permisible (1-)
Material de clase, Clodoaldo 2012
A. Para estimar una media poblacional:Se calcula a partir de la formula siguiente
donde: Valor tabular para un nivel de confianza. Depende del nivel de confianza utilizado por la estimación del parámetro desconocido. Toma un valor de 1,96 para un nivel de confianza de 0,95. : Variancia obtenida de revisión bibliográfica o estudio piloto.
2Z
2es
2
2e2
SZn
2
Material de clase, Clodoaldo 2012
A mayor variabilidad de la muestra,mayor varianza. A mayor varianza mayor tamaño muestral.
representa el error de muestreo, llamado error de estimación o precisión de la estimación. El valor debe ser asumido por el investigador. En este caso
Para poblaciones finitas (se conoce N), el tamaño final (nf) queda definido por la siguiente relaciónN
n1nnf
2es
)x(
Material de clase, Clodoaldo 2012
Ejemplo 1:A fin de conocer el gasto mensual en medicinas por familia, el Gerente de Marketing de un laboratorio farmacéutico desea determinar el tamaño de la muestra que le proporcione un nivel de confianza de 0,95 (Z = 1,96). Además conoce por estudios anteriores que las compras medias por familia eran de S/. 120 mensuales, con una desviación estándar de 30. El Gerente busca un tamaño de muestra que le permita estimar el nivel de gasto con un error de 10.
Material de clase, Clodoaldo 2012
Ejemplo 2En cierta población se 1200 escolares, se desea estimar el nivel promedio de Hb con 0,95 de confianza. Al realizar un estudio piloto se encontró que y S = 1,6. Si los investigadores están dispuestos a asumir un .Calcular n
N = 1200Se = 1,6
3,12x
5,096,1Z 2
5,0
33,395,0
6,196,1sZn 2
22
2
2e
22
Material de clase, Clodoaldo 2012
InterpretaciónEl número mínimo necesario de escolares para realizar el estudio es de 39, si se desea estimar el nivel promedio de Hb en la población con una precisión de 0,5.
3908,38
120033,391
33,39
Nn1
nnf
Material de clase, Clodoaldo 2012
Ejemplo 3En cierta población se 1200 escolares, de 9 – 11 años se desea estimar el nivel promedio de hierro sérico. Con este fin se va a seleccionar una muestra probabilistic. Si en un estudio similar se obtuvo una media aritmética de 60,6 mg/dl y S = 22,4 mg/dl. Calcular el tamaño mínimo de la muestra si la estimación del parámetro se va a realizar con 0,95 de confianza y se asume un
N = 1200Se = 22,4
5
96,1Z 2
5
10,775
4,2296,1sZn 2
22
2
2e
22
Material de clase, Clodoaldo 2012
7344,72
120010,771
10,77
Nn1
nnf
Interpretación :El número mínimo necesario de escolares para realizar el estudio es 73, si se desea estimar el nivel promedio de hierro sérico en la población con una precisión
5
Material de clase, Clodoaldo 2012
B. Para estimar una proporción poblacional:
donde:pe = proporción “estimada” de sujetos con
la característica de interés. Se puede obtener de revisón bibliográfica, estudio piloto o asumiendo pe = qe= 0,50 qe = proporción “estimada” de sujetos sin la caracteristica de interés.
= Error absoluto de muestreo o precisión. Debe ser asumido por el investigador.
2ee
22 qpZn
p
Material de clase, Clodoaldo 2012
Ejemplo 1:En una población grande, se desea estimar la prevalencia de cierta enfermedad con 0,95 de confianza. De la literatura se sabe que p = 0,10 si se asume un error muestral de 5%, calcular n
Nn1
nnf
Si se conoce N:
Material de clase, Clodoaldo 2012
Interpretación: Si se desea estimar la prevalencia poblacional con 0,95 de confianza y un de 5% se deberá evaluar 139 sujetos.
2ee
22 qpZn
05,090,0%90q10,0%10p
96,1Z
e
e
2
1393,1380025,0345744,0n
05,09,01,096,1n 2
2
Datos
Material de clase, Clodoaldo 2012
2. M. Sistemático: Las unidades elementales son seleccionadas dentro de un intervalo (I) de igual tamaño. Se extrae la muestra de acuerdo a la lista de pacientes atendidosI1 I2 I3 I4
X1
Material de clase, Clodoaldo 2012
3. M. Estratificado: El marco poblacional se divide en grupos homogéneos (estratos); de cada uno se extrae una submuestra, proporcional al tamaño del estrato. Muestreo por tipo de servicio
4. M. por Conglomerado: El marco poblacional se encuentra agrupado en conglomerados o racimos Se selecciona en forma aleatoria, el o los racimos. Todos los pacientes que ingresaron un determinado día.
Material de clase, Clodoaldo 2012
MUESTREO
PROBABILISTÍCO
NO PROBABILÍSTICO
ALEATORIO SIMPLE
SISTEMÁTICO
ESTRATIFICADOPOR CONGLOMERADO
DE JUICIODE CUOTAS
DE TROZO
Material de clase, Clodoaldo 2012
Es una medida de dispersión de una distribución muestral. Es equivalente a la desviación estándar.
Desviación estándar de la Error estándardistribución de medias de muestra de la media
Desviación estándar de la Error estándar distribución de proporciones de muestra de la proporción
El error estándar
Material de clase, Clodoaldo 2012
9.3 Distribuciones de muestreo
La totalidad de datos de una población, constituye la distribución de población original (PO)
POX1X2X3...XN
Media :
Varianza :
x
-x
z
2x
Material de clase, Clodoaldo 2012
De la PO se extraen muestras de tamaño n. A cada una se calcula su media. El conjunto de ese total de medias se denomina población derivada de medias (PDM)
POX1
X2
X3
.
..XN
n
xxx
xm
1
2
3
.
.
Media
:
Varianza
: x
zx
x -
n
xxn
x
x
x
2
2
PDM
Material de clase, Clodoaldo 2012
Si se busca comparar dos poblaciones, se deriva de cada
población una población de medias y luego se comparan
Material de clase, Clodoaldo 2012
2
22
1
21
2121 )()(
nn
xxz
2
22
1
212
21 nnxx
PO1
X1
X2
X3
.
.
.XN
xxx
xm
1
2
3
.
.
PDM1 PO2
X1
X2
X3
.
.
.XN
xxx
xm
1
2
3
.
.
PDM2 ( )( )( )..(
x xx xx x
1 2
)
PDDM
1 x1 2 x2 d 1 2Media
Varianza
Material de clase, Clodoaldo 2012
9.3 El teorema del límite central
Muestra la relación entre la forma de la distribución de la población y la forma de la distribución de muestro. Se basa en dos aspectos:(1) La media de la PDM será igual a la media de la PO, sin importar el tamaño de la muestra (n) incluso si la población no es normal
x x
Material de clase, Clodoaldo 2012
(2) Al incrementarse el tamaño de la muestra, la PDM se acercará a la normalidad, sin importar la forma de la distribución de la población.
El teorema del límite central nos permite utilizar las propiedades de la distribución normal en muchos casos en los que los datos subyacentes pueden no estar distribuidos normalmente.
Material de clase, Clodoaldo 2012