Libro quimica

15
1 DETERMINACIÓN DEL TAMAÑO MUESTRAL Notas Índice 1 . INTRODUCCIÓN 1 2. TAMAÑO MUESTRAL EN ESTUDIOS PARA DETERMINAR PARÁMETROS 2 2.1. Tamaño muestral para estimar una proporción 2 2.2. Tamaño muestral para estimar una media 3 3. TAMAÑO MUESTRAL EN ESTUDIOS PARA CONTRASTE DE HIPÓTESIS 4 3.1. Tamaño muestral para comparación de dos proporciones 4 3.2. Tamaño muestral en estudios en que se compararán dos proporciones por la prueba de Fisher-Irwin de probabilidades exactas 4 3.3. Tamaño muestral para la comparación de dos medias 5 4. TAMAÑO MUESTRAL EN ESTUDIOS BIOMÉDICOS 7 4.1 Cálculo del tamaño muestral en estudios de casos y controles 7 4.2. Tamaño muestral en estudios en que se indagará sobre una prevalencia 10 4.3. Tamaño muestral en estudios en que se investigará una prueba diagnóstica 11 4.4. Tamaño muestral en estudios de cohortes 13 4.5. Tamaño muestral en estudios de concordancia 13 5. BIBLIOGRAFÍA 15 1 . Introducción Todo estudio epidemiológico lleva implícito en la fase de diseño la determinación del tamaño muestral necesario para la ejecución del mismo. El no realizar dicho proceso, puede conducir a dos situaciones diferentes: primera que se realice el estudio sin el número adecuado de pacientes, con lo cual no se podrá ser precisos al estimar los parámetros y además no se encontraran diferencias significativas cuando en realidad sí existen. La segunda es que se podría estudiar un número innecesario de pacientes, lo cual lleva implícito no solo la pérdida de tiempo y de recursos innecesarios sino que además la calidad del estudio, a causa de dicho exceso, puede verse afectada en sentido negativo. Para determinar el tamaño muestral de un estudio, deben considerar diferentes situaciones: (a) Estudios para determinar parámetros, es decir, cuando se pretende hacer inferencias de valores poblacionales (proporciones, medias…) a partir de una muestra (figura 1); (b) Estudios para contraste de hipótesis, es decir, cuando se pretende comparar si proporciones o las medias de las muestras son diferentes.

Transcript of Libro quimica

1

DETERMINACIÓN DEL TAMAÑO MUESTRAL

Notas

Índice

1. INTRODUCCIÓN 12. TAMAÑO MUESTRAL EN ESTUDIOS PARA DETERMINAR PARÁMETROS 22.1. Tamaño muestral para estimar una proporción 22.2. Tamaño muestral para estimar una media 33. TAMAÑO MUESTRAL EN ESTUDIOS PARA CONTRASTE DE HIPÓTESIS 43.1. Tamaño muestral para comparación de dos proporciones 43.2. Tamaño muestral en estudios en que se compararán dos proporciones por la prueba de Fisher-Irwin deprobabilidades exactas 43.3. Tamaño muestral para la comparación de dos medias 54. TAMAÑO MUESTRAL EN ESTUDIOS BIOMÉDICOS 74.1 Cálculo del tamaño muestral en estudios de casos y controles 74.2. Tamaño muestral en estudios en que se indagará sobre una prevalencia 104.3. Tamaño muestral en estudios en que se investigará una prueba diagnóstica 114.4. Tamaño muestral en estudios de cohortes 134.5. Tamaño muestral en estudios de concordancia 135. BIBLIOGRAFÍA 15

1. Introducción

Todo estudio epidemiológico lleva implícito en la fase de diseño la determinación del tamaño muestralnecesario para la ejecución del mismo. El no realizar dicho proceso, puede conducir a dos situacionesdiferentes: primera que se realice el estudio sin el número adecuado de pacientes, con lo cual no se podráser precisos al estimar los parámetros y además no se encontraran diferencias significativas cuando enrealidad sí existen. La segunda es que se podría estudiar un número innecesario de pacientes, lo cual llevaimplícito no solo la pérdida de tiempo y de recursos innecesarios sino que además la calidad del estudio, acausa de dicho exceso, puede verse afectada en sentido negativo.Para determinar el tamaño muestral de un estudio, deben considerar diferentes situaciones:(a) Estudios para determinar parámetros, es decir, cuando se pretende hacer inferencias de valores

poblacionales (proporciones, medias…) a partir de una muestra (figura 1);(b) Estudios para contraste de hipótesis, es decir, cuando se pretende comparar si proporciones o las

medias de las muestras son diferentes.

2

Figura 1. Elementos de la Inferencia Estadística

2. Tamaño muestral en estudios para determinar parámetros

Con estos estudios se pretende hacer inferencias de valores poblacionales (proporciones, medias) a partirde una muestra.

2.1. Tamaño muestral para estimar una proporciónSi se desea estimar una proporción, debe conocerse:

(a) El nivel de confianza o seguridad ( )1− α . El nivel de confianza prefijado da lugar a un coeficiente

( )zα . Para un nivel de seguridad del 95 % 1,96α = , para un nivel de seguridad del 99 % 2,58α = ;

(b) La precisión que se desea para el estudio;(c) Una idea del valor aproximado del parámetro que se quiere medir (en este caso, una proporción). Esta

idea se puede obtener revisando la literatura o mediante estudio pilotos previos. En caso de no tenerdicha información se utilizará el valor 0,5p= (50 %).

Por ejemplo, ¿a cuántas personas tendría que estudiarse para conocer la prevalencia de diabetes?Seguridad = 95 %;Precisión = 3 %;Proporción esperada = asumiendo que puede ser próxima al 5 %; si no se tuviese ninguna idea de dichaproporción se utilizaría el valor 0,5p= (50 %) que maximiza el tamaño muestral:

2

2

z p qn

dα × ×

=

donde: 2 21,96 3,84zα = = ya que la seguridad buscada es del 95 %;

p es la proporción esperada (en este caso 5 % ó 0,05);

1q p= − (en este caso 1 – 0,05 = 0,95);

d es la precisión deseada (en este caso un 3 %):2

2

1,96 0,05 0,95 2030,03

n × ×= =

Población

Muestra

Observación(experimento,

medición)

Resultados

Seguridad

Estimación

Intervalo deConfianza

p < 0,0…

3

Si la población es finita, es decir se conoce el total de la población y se desea saber cuántos individuos hayque estudiar, la respuesta sería:

( )

2

2 21N z p q

nd N z p q

α

α

× × ×=

× − + × ×

donde: N es el total de la población;

2zα es 21,96 si la seguridad deseada es del 95 %;

p es la proporción esperada (en este caso 5 % ó 0,05);

1q p= − (en este caso 1 0,05 0,95− = );

d es la precisión (en este caso se desea un 3 %).

¿A cuántas personas de una población de 15.000 habitantes tendría que estudiarse para conocer laprevalencia de diabetes?Seguridad = 95 %;Precisión = 3 %;Proporción esperada = asumiendo que puede ser próxima al 5 %; si no se tuviese ninguna idea de dichaproporción se utilizaría el valor 0,5p= (50 %) que maximiza el tamaño muestral:

( )2

2 2

15000 1,96 0,05 0,95 2000,03 15000 1 1,96 0,05 0,95

n × × ×= =

× − + × ×

El coeficiente de zα varía según diferentes niveles de seguridad, así:

• Si la seguridad zα fuese del 90 % el coeficiente sería 1,645;

• Si la seguridad Zα del 95 % el coeficiente sería 1,96;

• Si la seguridad zα fuese del 97,5 % el coeficiente sería 2,24;

• Si la seguridad zα fuese del 99 % el coeficiente sería 2,576.

2.2. Tamaño muestral para estimar una mediaSi se desea estimar una media habrá que conocer:

(a) El nivel de confianza o seguridad ( )1− α . El nivel de confianza prefijado da lugar a un coeficiente

( )zα . Para un nivel de seguridad del 95 %, 1,96α = , para un nivel de seguridad del 99 % 2,58α = ;

(b) La precisión con que se desea estimar el parámetro ( 2 d× es la amplitud del intervalo de confianza);

(c) Una idea de la varianza 2s de la distribución de la variable cuantitativa que se supone existe en lapoblación

2 2

2

z sn

dα=

Por ejemplo, si se desea conocer la media de la glucemia basal de una población, con una seguridad del 95% y una precisión de ± 3 mg/dl y se tiene información a través un estudio piloto o de una revisiónbibliográfica que la varianza es de 250 mg/dl:

2

2

1,96 250 106,73

n ×= =

4

Si la población es finita, como previamente se señaló, es decir se conoce el total de la población y sedesearía saber cuántos individuos debería estudiarse, la respuesta sería:

( )

2 2

2 2 21N z s

nd N z s

α

α

=− +

3. Tamaño muestral en estudios para contraste de hipótesis

Estos estudios pretenden comparar si las medias o las proporciones de las muestras son diferentes.Habitualmente, el investigador pretende comparar dos tratamientos. Para el cálculo del tamaño muestral seprecisa conocer:(a) Magnitud de la diferencia a detectar que tenga interés clínicamente relevante. Se pueden comparar dos

proporciones o dos medias;(b) Tener una idea aproximada de los parámetros de la variable que se estudia (a través de la bibliografía o

de estudios previos);(c) Seguridad del estudio (riesgo de cometer un error α );

(d) Potencia estadística ( )1−β (riesgo de cometer un error β );

(e) Definición de si la hipótesis va a ser unilateral o bilateral:• Bilateral: cualquiera de los dos parámetros a comparar (medias o proporciones) puede ser mayor o

menor que el otro. No se establece ninguna dirección;• Unilateral: cuando se considera que uno de los parámetros debe ser mayor que el otro, indicando

por tanto una dirección de las diferencias.La hipótesis bilateral es una hipótesis más conservadora y disminuye el riesgo de cometer un error de tipo I(rechazar la 0H cuando en realidad es verdadera).

3.1. Tamaño muestral para comparación de dos proporciones

( ) ( ) ( )2

1 1 2 2

1 2

2 1 1 1z p p z p p p pn

p pα β

− + − + − = −

donde: n es el número de sujetos necesarios en cada una de las muestras;

zα es el valor z correspondiente al riesgo α ;

zβ es el valor z correspondiente al riesgo β ;

1p es el valor de la proporción en el grupo de referencia, placebo, control o tratamiento habitual;

2p es el valor de la proporción en el grupo del nuevo tratamiento, intervención o técnica;

p es la media de las dos proporciones 1p y 2p :

Los valores zα según la seguridad y zβ según la potencia del test se indican en la tabla I.

3.2. Tamaño muestral en estudios en que se compararán dos proporciones por la pruebade Fisher-Irwin de probabilidades exactasEn ocasiones, se puede presumir que en la investigación se incluirá una muestra pequeña y se compararándos grupos por la mencionada prueba de hipótesis.

5

Se dispone de tablas que proporcionan el tamaño muestral por grupo requerido para satisfacer los erroresalfa y beta planteados frente a la comparación de dos proporciones. A modo de ejemplo, véase los datosque se proporcionan en la tabla II.El cálculo del tamaño muestral para estudiar la diferencia entre dos proporciones en una tabla de 2 x 2, conhipótesis unilateral, incluye las dos proporciones y los errores α y β . Debe contemplarse una proporción

1p como "control" o valor "patrón" y la otra 2p como "experimental". En tales condiciones:

( ) ( )

2

1 2

1,64 1,6arcsin arcsin

z zn

p pα β

+ = × × −

donde: zα es 1,64 si α es 0,05 para una prueba unilateral y 1,96 si es bilateral;

zβ es 0,84 si β es 0,20, tanto para una prueba unilateral como bilateral;

( )1arcsin p es el “arco seno” (corresponde "al ángulo cuyo seno es el valor dado"1) de la raíz

cuadrada de la primera proporción;

( )2arcsin p es el “arco seno” (corresponde "al ángulo cuyo seno es el valor dado") de la raíz

cuadrada de la segunda proporción;

p2 p10,80 0,70 0,60 0,50 0,40 0,30 0,20

0,60 73

0,50 36 84

0,40 23 41 85

0,30 15 23 42 84

0,20 10 15 23 36 73

0,10 8 10 13 19 30 56 67

0,05 6 9 11 14 20 34

Tabla I. Tamaño muestral necesario por grupo, según proporciones que se comparan 1p y 2p , para

hipótesis unilateral, dado error α de 0,05 y β de 0,20.

La prueba de hipótesis que se supone se empleará con los resultados del estudio es ji cuadrado.

3.3. Tamaño muestral para la comparación de dos medias

( )2 2

2

2 z z sn

dα β+

=

donde: n son los individuos necesarios en cada una de las muestras;

zα es el valor z correspondiente al riesgo deseado;

zβ es el valor z correspondiente al riesgo deseado;

2s es la varianza de la variable cuantitativa que tiene el grupo control o de referencia;

d es el valor mínimo de la diferencia que se desea detectar (datos cuantitativos).

1 En una calculadora “ arcsin ” sería “sin ” elevado a –1.

6

Los valores zα según el nivel de seguridad y zβ según la potencia se indican en la tabla II:

α test unilateral test bilateral0,2000,1500,1000,0500,0250,010

0,8421,0361,2821,6451,9602,326

1,2821,4401,6451,9602,2402,576

potenciaβ (1-β) Zβ

0,010,050,100,150,200,250,300,350,400,450,50

0,990,950,900,850,800,750,700,650,600,550,50

2,3261,6451,2821,0360,8420,6740,5240,3850,2530,1260,000

Tabla II. Valores de zα y zβ más frecuentemente utilizados.

Ejemplo de comparación de dos medias

Se desea utilizar un nuevo fármaco antidiabético y se considera que sería clínicamente eficaz si lograse undescenso de 15 mg/dl respecto al tratamiento habitual con el antidiabético estándar. Por estudios previossabemos que la desviación típica de la glucemia en pacientes que reciben el tratamiento habitual es de 16mg/dl. Se acepta un riesgo de 0,05 y se desea una potencia estadística del 90 % para detectar diferencias,si es que existen:

( )

( )

2 2

2

2 2

2

2

2 1,645 1,282 1619,49

15

z z sn

d

n

α β+=

+= =

se precisan, pues, 20 pacientes en cada grupo.

Ejemplo de comparación de dos proporciones

Se desea evaluar si el tratamiento 2T es mejor que el tratamiento 1T para el alivio del dolor para lo que sediseña un ensayo clínico. Se sabe por datos previos que la eficacia del fármaco habitual está alrededor del70 % y se considera clínicamente relevante si el nuevo fármaco alivia el dolor en un 90 %. El nivel de riesgose fija en 0,05 y se desea una potencia estadística de un 80 %.

7

( ) ( ) ( )

( ) ( ) ( )

2

1 1 2 2

1 2

2

2 1 1 1

0,7 0,9 0,82

1,645 2 0,8 1 0,8 0,842 0,7 1 0,7 0,9 1 0,90,7 0,9

48

z p p z p p p pn

p p

p

n pacientes

α β − + − + − = −

+= =

× × − + × − + × − −

=

El tamaño muestral ajustado a las pérdidas

En todos los estudios es preciso estimar las posibles pérdidas de pacientes por razones diversas (pérdidade información, abandono, no respuesta…) por lo que se debe incrementar el tamaño muestral respecto adichas pérdidas. El tamaño muestral ajustado a las pérdidas se puede calcular:

11

muestra ajustada a las pérdidas nR

= −

donde: n es el número de individuos sin pérdidas;

R es la proporción esperada de pérdidas.Así por ejemplo, si en el estudio anterior se espera tener un 15 % de pérdidas, el tamaño muestralnecesario sería:

148 561 0,15

= −

pacientes en cada grupo.

4. Tamaño muestral en estudios biomédicos

4.1 Cálculo del tamaño muestral en estudios de casos y controlesSupóngase que se quiere llevar a cabo un estudio de casos y controles con el fin de determinar si existeuna relación significativa entre la exposición a un factor y la presencia de una determinada enfermedad. Acontinuación se explica cómo calcular el tamaño de muestra necesario para contrastar la hipótesis de que elodds ratio (OR) sea igual a 1.

Si se conoce la probabilidad de exposición entre los controles 2p , y se prevé que el OR asociado al factor

de estudio es w , el valor de 1p , la frecuencia de exposición entre los casos, puede obtenerse fácilmente:

( )( )

( ) ( )( )

( )

1 2

2 1

2 1 1 2

1 2 2 2

21

2 2

1

1

1 1

1

1

p pOR w

p p

w p p p p

p p w p w p

w pp

p w p

−= = ⇒

− = − ⇒

− + = ⇒

=− +

donde: p1 y p2 son las proporciones esperadas;w valor aproximado del OR que se desea estimar.

8

Así, el problema del cálculo del tamaño muestral podrá abordarse mediante las fórmulas habitualesempleadas en la comparación de dos proporciones.Recurriendo a las fórmulas habituales para determinar el tamaño muestral mínimo necesario para lacomparación de dos proporciones, se precisará conocer:(a) La magnitud de la diferencia a detectar, que tenga interés clínicamente relevante. En este caso, como

ya se vio, bastaría con conocer dos de los siguientes tres parámetros:

• Una idea del valor aproximado del OR que se desea estimar ( )w ;

• La frecuencia de la exposición entre los casos ( )1p ;

• La frecuencia de la exposición entre los controles ( )2p .

(b) El nivel de seguridad α o riesgo de cometer un error de tipo I, con que se desea trabajar.Generalmente con un nivel de seguridad del 95 %, 0,05α = .

(c) La potencia estadística o riesgo de cometer un error de tipo II ( )1−β que se desea para el estudio,. Es

habitual tomar 0,2β= , es decir, una potencia del 80 %.

Con estos datos, y para un planteamiento bilateral, para el cálculo del tamaño muestral se utilizará laexpresión:

( ) ( ) ( )2

2

1 1 1 2 21

1 2

2 1 1 1z p p z p p p pn

p pα −β−

− + − + − = −

[ecuación 1]

donde: 1 2

2p p

p+

= ;

w es una idea del valor aproximado del OR que se desea estimar;

1p es la frecuencia de la exposición entre los casos;

2p es la frecuencia de la exposición entre los controles; y

21z α− y 1z −β son valores que se obtienen de la distribución normal estándar en función de la

seguridad y la potencia seleccionadas para el estudio. En particular, para un nivelde seguridad de un 95 % y una potencia estadística del 80 % se tiene que

21 1,96z α− = y 1 0,84z −β = .

Hasta ahora se ha asumido un tamaño muestral igual para casos y controles. En caso de que el número decasos y controles no esté equilibrado, la expresión anterior deberá ser ligeramente modificada:

( ) ( ) ( ) ( )( )( )

2

2

1 1 1 2 21

2

1 2

1 1 1 1z c p p z c p p p pn

c p p

α −β− + − + − + −=

−[ecuación 2]

donde: n es el número de casos;m es el número de controles; y

mc n= es el número de controles por cada caso.

Así, el número de controles vendría dado por m c n= × .

Debe precisarse que se ha tratado en el presente trabajo de exponer del modo lo más sencillo posible elprocedimiento a seguir en el cálculo del tamaño de la muestra en un estudio de casos y controles. Noobstante, en ocasiones se utilizan para este cálculo expresiones más complejas basadas en una correcciónde la fórmula del cálculo del tamaño muestral para la comparación de dos proporciones. Así mismo, existenfórmulas específicas para el cálculo del tamaño de la muestra en el caso de que el diseño corresponda a unestudio de casos y controles apareados.

9

Ejemplo del cálculo del tamaño muestral en un estudio de casos y controles

Como ejemplo, supóngase que se desea estudiar la existencia de una asociación entre el consumo detabaco y el hecho de sufrir un infarto de miocardio. Para poner en evidencia dicha asociación y cuantificarsu magnitud, se diseña un estudio de casos y controles en el que se investigará el consumo de tabaco deuna serie de pacientes que han padecido un infarto de miocardio (casos) y una serie de pacientes sanos(controles). Se cree que alrededor de un 40 % de los controles son fumadores y se considera comodiferencia importante entre ambos grupos un OR de 4. Con estos datos, se puede calcular el tamaño demuestra necesario en cada grupo para detectar un OR de 4 como significativamente diferente de 1 con unaseguridad del 95 % y una potencia del 80 %. De acuerdo con lo expuesto anteriormente, y conociendo lossiguientes parámetros:(a) Frecuencia de exposición entre los controles: 40 %;(b) OR previsto: 4;(c) Nivel de seguridad: 95 %;(d) Potencia estadística: 80 %.La frecuencia de exposición entre los casos vendrá dada por:

( )

( )

21

2 21

4 0,401 0,40 4 0,401,6 0,73

0,60 1,6

w pp

p w p= =

− +

×= =

− + ×

= =+

Esto es, se estima que aproximadamente un 73 % de los casos son fumadores.Aplicando la ecuación 1, se obtiene:

( ) ( ) ( )2

1,96 2 0,565 1 0,565 0,84 0,73 1 0,73 0,4 1 0,435

0,73 0,4n

× × − + × − + × − = ≈ −

Es decir, se necesitaría estudiar a 35 sujetos por grupo (35 pacientes con infarto de miocardio y 35controles) para detectar como significativo un valor del OR de 4.Si se reduce el tamaño del efecto a detectar, asumiendo que el OR es aproximadamente igual a 3, seobtiene:

( )

( )

21

2 21

3 0,40 0,671 0,40 3 0,40

w pp

p w p= =

− +

×= =

− + ×

y, de acuerdo con la ecuación 1, serían necesarios 54n= pacientes por grupo para llevar a cabo el estudio.

En algunos estudios, el investigador reúne un número mayor de controles que de casos con el objeto deincrementar la potencia estadística. Supóngase que en este ejemplo se planea obtener dos controles porcaso, y se asume que el OR a detectar es aproximadamente igual a 3. Aplicando la ecuación 2:

( ) ( ) ( ) ( )( )( )

( ) ( ) ( ) ( )( )( )

2

2

1 1 1 2 21

2

1 2

2

1

2

1 1 1 1

1,96 2 1 0,565 1 0,565 0,84 2 0,73 1 0,4 1 0,440

2 0,73 0,4

z c p p z c p p p pn

c p p

pn

α −β− + − + − + −=

+ × × − + × × − + × −= ≈

10

Por tanto, se necesitará un grupo de 40n= casos (pacientes con infarto de miocardio) y 2 40 80m= × =controles para llevar a cabo la investigación.El cálculo del tamaño muestral en los estudios de casos y controles debe formar parte del diseñometodológico, ya que la ejecución de este tipo de estudios es costosa. El iniciar un estudio sin conocer lapotencia estadística y la seguridad para detectar diferencias, si es que existen, podría ser motivo de incurriren un error de tipo II en el sentido de no detectar diferencias cuando realmente las hay.

casos controlesexpuestos a b a + b

no expuestos c d c + d

a + c b + d nTabla III. Disposición de los sujetos incluidos en un estudio de casos y controles. Tabla de 2 x 2.

4.2. Tamaño muestral en estudios en que se indagará sobre una prevalenciaEn estos se requiere conocer el tamaño de la población, la precisión deseada (%), la prevalencia esperada,el efecto del diseño y el error α .En este caso se debe tener una idea aproximada de la prevalencia que se está investigando, a continuaciónse debe establecer cuánto se aceptaría que varíe (precisión), seguidamente el nivel de confianza deseadopara la indagación y, finalmente, el efecto de diseño de la investigación. Este es igual a 1 (no hay efecto dediseño) si se ha empleado un procedimiento de muestreo aleatorio simple o bien sistemático y correspondea un error sistemático.La fórmula:

( )( ) ( )

21

2 21

11 1

N z p pn

d N z p p−α

−α

−=

− + −

donde: n es el tamaño de la muestra;

N es la población total;

1z −α es el valor de z para el nivel de confianza ( )1− α ;

p es la proporción esperada en la población; y

d es la precisión absoluta.El tamaño de la muestra es, en definitiva, igual a n por el efecto de diseño. El tamaño de la población de laque se extraerá la muestra es habitualmente desconocido, pero no es muy importante tener unconocimiento exacto, basta con una aproximación razonable.Por ejemplo, supóngase que se estima una proporción p en la población a estudiar de 7 % y se desea untamaño muestral que permita, con una seguridad de 95 % (entonces 1,96z = ), una variación alrededor de 7% de hasta 3 %. Ello significa que si la proporción poblacional es de 7 % se espera, con 95 % de confianza,obtener un valor entre 4–10 %. Para estos requisitos, si la población es de 500.000 personas, la muestrarequerida es de 278 casos, si es de 10.000 personas, 271 casos, si sólo son 5.000 personas 264 y si son1.000 personas, 218 casos.Si se desconoce valor de p aún es posible estimar el tamaño muestral: en la fórmula, la expresión

( )1p p− tiene un valor creciente a medida que la proporción p se va acercando a 0,50, alcanza su máximo

en ese punto y luego va descendiendo nuevamente. Entonces, cuando 0,50p= la mencionada expresiónvale 0,25 y con esa cifra se calculará en la fórmula el tamaño muestral, que será el más elevado para lascondiciones establecidas. Ese tamaño de muestra será, entonces, el apropiado.

11

4.3. Tamaño muestral en estudios en que se investigará una prueba diagnósticaPara estos estudios se requiere conocer: error alfa, error beta, proporción esperada de falsos positivos o laespecificidad, razón de verosimilitud considerada digna de ser detectada, intervalo de confianza deseadopara la sensibilidad y la prevalencia esperada de la patología en estudio. (No se comenta con detalle elprocedimiento de cálculo).Las razones de verosimilitud (likelihood ratios, LR), índices fijos como sensibilidad y especificidad ofrecenuna relación entre las cuatro celdas (a, b, c, d) de la tabla 2 x 2, en que se estudia una prueba diagnóstica:Es así como, si se considera un LR+, se verá que tal resultado se obtiene de la razón entre las proporciones

( )aa c+ y ( )

bb d+ de modo que

( )

( )

aa c

LR bb d

++ =

+

En esta división, el numerador corresponde a la sensibilidad de la prueba y el denominador a la proporciónde falsos positivos (1-especificidad).Es posible, entonces, plantear la búsqueda del tamaño muestral a partir de una comparación de dosproporciones (LR), en prueba unilateral (puesto que se espera que el numerador será mayor que eldenominador, LR+ veces), para lo cual se requeriría estimar los falsos positivos (o la especificidad)probables en esa prueba y la prevalencia esperada del trastorno en estudio dentro de la muestra. Al mismotiempo, se debe elegir un valor de LR+ digno de ser detectado, contemplando el nivel de error alfa y betaque se considere adecuado. Tal comparación es entre dos proporciones independientes (aunqueintrínsecamente relacionadas) y de tamaño casi siempre diferente, con una proporción de verdaderosenfermos habitualmente inferior a 50 %.La estimación de los falsos positivos determina en parte el LR+ elegible, puesto que, si los primerosconstituyen un 5%, es poco probable que interese un LR+ de 3 si se considera que 5 % x 3 indicará lasensibilidad de la prueba en tal caso, es decir, 15% y esta seguramente no resultaría de mucho interés alinvestigador como nivel inicial de detección. Del mismo modo, si la proporción de falsos positivos fuera muyalta, LR+ puede tener como límite un valor sorprendentemente bajo. Por ejemplo, una cifra de falsospositivos del 30 % (0,30) tiene un LR+ límite posible de 3,33, ya que una cifra mayor supondría unasensibilidad de la prueba superior al 100 %. Como sea, es generalmente aceptado que LR+ en el margende 2 a 5 suele ser de importancia en el sentido que el cambio de la probabilidad previo a la prueba a aquelladespués de la prueba cuando LR+ está en esos valores, sería de una magnitud de consideración.El poder estimar algunos valores, como la proporción de falsos positivos, requiere algún conocimientoprevio de la situación o efectuar un estudio piloto para obtenerlo.Aceptando que se cumplen los requisitos para efectuar la correspondiente prueba de hipótesis, de acuerdocon Fleiss se tendría:

( )2

2 1

2 11 1

4rNN

N r p p

+′ = + + ′ −

donde:( )( )

( )

2

1 1 2 2

2

2 1

1z r p q z r p q p qN

r p p

α β+ − +′ =

N es uno de los tamaños muestrales; y

rN el otro;

r es la fracción que representa la muestra más pequeña respecto a la mayor;

( )1ap a c= + es la sensibilidad de la prueba, y que es igual a 2p LR× + ;

1 11q p= − ;

12

( )2bp b d= + es la proporción de falsos positivos (1-especificidad);

2 21q p= − ;

1z −α para hipótesis unilateral es 1,645 (para un error α de 0,05) ó 2,326 (para α de0,01);

zβ es –0,842 (para un error β de 0,20), –1,29 (para β 0,10) o –1,645 (para β de0,05);

1 2

1p r p

pr+

=+

; y

1q p= − .

Como es de esperar una prevalencia inferior a 50 %, la muestra que corresponde a verdaderos enfermossegún estándar ideal será rN y la de verdaderos no afectados N .

Ahora bien, se puede indicar que para detectar un LR+ de 2,5 o mayor (en hipótesis unilateral), con un errorα de 5 % y β de 10 %, es decir, una potencia del estudio de 90 %, contemplando una prevalencia deafectados por la patología de interés de 25 % en la muestra y falsos positivos de 22 %, se requiere estudiarun total de 111 casos. Estos se encontrarán distribuidos como 28 y 83 casos. Si la estimación de falsospositivos fuera más alta o más baja requerirían, respectivamente, menos y más casos integrando lamuestra, si no se modifica la LR+ escogida.Efectuada esta primera fase del cálculo, se puede perfeccionar estableciendo el intervalo de confianza (IC)que se considere apropiado o aceptable para la sensibilidad. El intervalo de confianza del 95 % (IC 95 %) de

1p 0,55 o 55 % puede establecerse, por ejemplo, en ± 10 %.

El error estándar deseado sería 10 5,101,96 = .

Se puede calcular el número de casos necesarios para generar ese error estándar, contemplando que elprocedimiento se modifica si la proporción se aleja mucho de 0,50. El siguiente cálculo es adecuado paramuestras no muy pequeñas y proporción no menor de 0,30 o mayor de 0,70. Varios programas informáticosproporcionan este cálculo. Como sea, para los fines perseguidos, no se requiere una precisión extrema.Entonces

( )100 55 555,10

n− ×

=

despejando n se obtienen 95 casos.Esto significa que para lograr el intervalo de confianza deseado el número de afectados por la patología deinterés debe ser de 95 en vez de 28 casos y por lo tanto, conservando la prevalencia estimada, el segundogrupo debería ser de 285 casos en vez de 83. Esto da un N total definitivo de 383 casos.Es de destacar que si el nivel de sensibilidad encontrado (0,55), tan cercano a 0,50, fuese mayor o menor,el número de casos encontrado (95) generaría un intervalo de confianza más estrecho. Dicho de otro modo,en tales circunstancias se requeriría una muestra menor.

Por otro lado, el intervalo de confianza de 2p será al menos tan estrecho como el de la sensibilidad si laprevalencia es menor que 0,50, como es usual. Pero si no es así y la prevalencia supera 0,50, para lamuestra calculada el intervalo de confianza de 2p será más ancho de lo deseado.

Es necesario tener presente que el tamaño de la muestra, para un mismo LR+, cambiará substancialmentecon la proporción de falsos positivos. Así, si se establece un LR+ deseable de detectar igual o mayor que 3y 2p es 0,20, consecuentemente 1p será 0,60 y la diferencia a detectar 0,40 (40 %). Para ello se requerirá

una muestra pequeña por tratarse de una gran diferencia. Sin embargo, si 2p fuese 0,05, debiera ser 0,15y la diferencia a detectar sólo de 0,10 (10 %), por lo que se requerirá una muestra mucho mayor.

13

Si se comenzara con la sensibilidad 1p y su intervalo de confianza para conocer el respectivo tamaño de lamuestra para esa proporción, según " r " sería posible conocer la segunda muestra parcial. Sin embargo, detodas maneras se requiere verificar que el N total no es insuficiente para los errores α y β establecidos,

particularmente si el valor de 1p se aleja de 0,50, donde se encontrará un n más pequeño para el mismoIC y asimismo si la prevalencia supera 0,50, donde la muestra de no afectados sería menor que la deenfermos, con un IC mayor que el deseado para el grupo de afectados.

4.4. Tamaño muestral en estudios de cohortesLa siguiente fórmula proporciona el número de expuestos requeridos y, naturalmente, el de no expuestoscomo c N× :

( )( )

2

0

1 2 11

4 1cnN

n c p RR

+ +′ = + ′ −

donde:( ) ( ) ( ) ( )( )

( )( )

2

0 0 0

2

0

1 1 1 1

1

z c p p z c p p p RR p RRn

c p RR

α β+ − + − + −′ =

( ) ( )0 0

1p RR p c

pc

+ +=

+;

1q p= − ;

0p es la frecuencia de la condición en estudio en la población no expuesta, expresada en formadecimal: 0,05 (5 %);

RR es el riesgo relativo que se considere digno de ser detectado (o mayor): 1RR= significa queel factor de exposición no se encuentra asociado a un aumento del riesgo, puesto que este esigual en expuestos y no expuestos;

c es la relación numérica de expuestos/no expuestos (muestra si las cohortes son de igualtamaño o no);

α es el error α y zα es su respectivo valor z ;

β es el error β y zβ es su respectivo valor z ;

Un ensayo clínico controlado puede ser considerado un seguimiento de dos cohortes, una expuesta altratamiento experimental y la otra no. La similitud se puede comprobar también en el cálculo del tamaño dela muestra, que genera iguales resultados si se emplea RR de 3, como en el ejemplo recién presentado, ose calcula con el resultado en la forma de dos proporciones, 0,10 en los no expuestos y 0,30 en losexpuestos.

4.5. Tamaño muestral en estudios de concordancia

En estudios de concordancia conviene recordar que el índice kappa ( )κ tiene una distribución normal si el

efectivo de la muestra es mayor que 2 5g , siendo g el número de categorías en investigación. En talescircunstancias se puede verificar la hipótesis 0k = . La comparación de dos κ requiere un tamaño muestral

mínimo de 23g para poder intentarla. Otro tema es establecer cuántos casos se requiere estudiar en unasituación específica para detectar un κ como diferente de cero o para comparar dos índices. Lo usual estener que efectuar un estudio piloto. Supóngase que en un estudio de 50 casos dos observadores clínicoscalifican los casos como con o sin una determinada manifestación clínica como se señala en la Tabla IV.

14

observador Acon sin total

con 25 10 25observador B

sin 5 20 25

total 20 30 50

Tabla IV. Estudio de concordancia entre dos observadores según presencia de una manifestación clínica.

En esta, la prevalencia del hallazgo según el observador A fue de 20 40%50= con IC 95 % (26,7–54,8 %)

y la prevalencia del hallazgo según observador B fue de 25 50%50= con IC 95% (35,7–64,3 %).

Recuérdese que si se desea establecer el número de casos necesario para detectar un κ comosignificativamente diferente de cero ( )0,05p< se requiere calcular primero el error estándar de 0κ = :

( )0 1c

c

pEE

n pκ= =−

donde: cp es la proporción de concordancia dada por el azar; y

n es el número de casos a estudiar.

El valor cp se puede determinar según el intervalo de confianza de la prevalencia del hallazgo clínico paracada observador, de la manera siguiente: Tomando las prevalencias menores, sabiendo que el total de latabla es "1" o 100%, de tal manera que, conociendo los marginales 0,357 y 0,267, se puede calcular losfaltantes, como se muestra en la Tabla V.

observador Acon sin total

con 0,095 0,357observador B

sin 0,471 0,643

total 0,567 0,733 1Tabla V. Estudio de concordancia entre dos observadores según presencia de una manifestación clínica.

Determinación de cp (explicación en el texto).

Ahora, teniendo los marginales correspondientes a las celdas "a" y "d", se puede calcular a su vez losvalores esperados en esas celdas (0,095 resulta de 0,357 por 0,267, dividido por el total, 1). Finalmente, cpes igual a la suma de 0,095 y 0,471, es decir 0,566. Por este procedimiento se alcanza a saber que cpfluctuará entre 0,43 y 0,56. Entonces, si se desea detectar como significativamente diferente de cero un κde 0,25 o mayor, se puede decir que el error estándar de κ igual a cero debe ser de 0,25/ 1,96, es decir0,127. Disponiendo del valor cp y del error estándar de 0κ = se resolverá n a partir la fórmula indicadaanteriormente. Así, se obtendrá que n fluctúa entre 47 y 79 casos. El tamaño muestral será entonces de 79casos.

15

5. Bibliografía

Lwanga SK, Lemeshow S. Sample size determination in health studies. A practical manual. Geneva: WorldHealth Organisation, 1991.www.fisterra.com/mbe/investiga/9muestras/9muestras.htmwww.itch.edu.mx/academic/industrial/estadistica1/toc.htmlwww.fisterra.com/mbe/investiga/index.aspwww.seh-lelha.org/stat1.htmwww.isciii.es/htdocs/redes/investen/publicaciones/calculo_muestra.pdfwww.sportsci.org/resource/stats/ssdetermine.htmlwww.statsdirect.com/help/sample_size_and_methods/ss.htmwww.brodgar.com/PowerAnalysis.pdfwww.uic.edu/classes/epid/epid401/lectures/sampling.pdfhttp://myphliputil.pearsoncmg.com/student/bp_berenson_bbs_9/chap06.pptwww.ilir.uiuc.edu/courses/lir593/chap71999.ppthttp://www.pnl.gov/main/publications/external/technical_reports/PNNL-13434.pdfwww.hqlo.com/content/2/1/26