Todo estudio epidemiológico lleva implícito en la fase de diseño la determinación del tamaño muestral necesario para la ejecución del mismo. El no realizar dicho proceso, puede llevarnos a dos situaciones diferentes: a) la primera situación es que realicemos el estudio sin el número adecuado de pacientes, con lo cual no podremos ser precisos al estimar los parámetros y además no encontraremos diferencias significativas cuando en la realidad sí existen; b) la segunda situación es que podríamos estudiar un número innecesario de pacientes, lo cual lleva implícito no solo la pérdida de tiempo e incremento de recursos innecesarios, sino que además la calidad del estudio, dado dicho incremento, puede verse afectada en sentido negativo.
La importancia de estimar el tamaño muestral no es una decisión trivial, si no que su cálculo adecuado nos permitirá obtener resultados concluyentes y reproducibles o por el contrario los resultados no serán informativos ni robustos. Y, además, no es ético utilizar más o menos tamaño muestral del necesario.
Y para su cálculo conviene responder a estas preguntas:
- ¿Qué sería un resultado relevante en mi experimento? ¿Qué estoy buscando? Con ello queremos decidir a priori el TAMAÑO DE EFECTO que consideramos sería relevante en el experimento (y no en pocas ocasiones es una cifra estimada). Lo primero que debemos determinar en la estimación de la muestra es la variable de interés o variable respuesta o primary outcome. Esta es una decisión muy importante, porque el tipo de variable influirá de manera considerable en el tamaño de la muestra: una variable continua siempre tendrá más sensibilidad que una variable categórica, por lo que siempre que sea posible, se recomienda medir en continuo la respuesta, así el tamaño muestral requerido será menor.
- ¿Qué tipo de fluctuaciones espero alrededor de la media de mi parámetro de interés? Esto se refiere a la VARIABILIDAD de los datos. Lo mejor es que seamos conservadores si no podemos cuantificar exactamente la varianza y para ello podemos aumentar un 10 o 20% la desviación y así aseguramos que los datos que se puedan obtener estén contenidos en el rango esperado.
- ¿Qué porcentaje de falsos positivos estoy dispuesto a asumir? Sabemos que cuando contrastamos una hipótesis, existe la posibilidad de que el test determine que existe una diferencia entre el grupo tratamiento y control cuando en realidad, no existe tal diferencia. Esto es lo que se conoce como un falso positivo o la probabilidad de error de tipo I. Si elegimos el estándar 0,05, entonces el NIVEL DE CONFIANZA será del 95%. Es decir, asumimos que el 5% de las veces concluiremos erróneamente que los grupos son distintos.
- ¿Qué potencia quiero tener? Que viene a ser la SENSIBILIDAD que espero que tenga mi muestra para detectar diferencias cuando realmente existen. La potencia se calcula como 1 – β (también conocido como error de tipo II). La probabilidad de error de tipo II determina el porcentaje de veces que asumimos que, habiendo una diferencia entre los grupos, no seremos capaces de detectarla y por tanto estaremos cometiendo un falso negativo. Normalmente asumimos un error de tipo II de 10 o 20%, pero si nosotros queremos realmente ser más sensibles, deberemos fijar una mayor potencia. Esto se traducirá en un mayor tamaño muestral.
Existe al respecto ingente información, y también la Universidad Miguel Hernández, a través de su Oficina de Investigación Responsable (OIR) nos deja este enlace de interés, donde nos ofrece el acceso al programa GPower, que es una calculadora online gratuita desarrollada en la Universidad de Düsseldorf, con su manual de uso. Y se nos presenta una breve demostración del cálculo muestral para una diferencia de medias y para una diferencia de proporciones.
Aquí podéis obtener información más detallada al respecto. Porque es importante conocer bien este tema por su importancia científica y ética, porque el tamaño (muestral) si importa… y mucho.
No hay comentarios:
Publicar un comentario