Caso 1
En un estudio de casos y controles, madres de recién nacidos con malformaciones congénitas (casos) y madres de recién nacidos sanos (controles) responden un cuestionario sobre exposiciones durante el embarazo. Las madres de los casos, motivadas por buscar una explicación, recuerdan e informan con mucho mayor detalle exposiciones a fármacos y químicos que las madres de los controles. ¿Qué tipo de error sistemático introduce este fenómeno?
- A. Sesgo del trabajador sano
- B. Sesgo de memoria (recall bias), una forma de sesgo de información
- C. Sesgo de selección por pérdidas en el seguimiento
- D. Confusión residual por nivel socioeconómico
El fenómeno descrito —madres de niños con malformaciones que rememoran e informan exposiciones de forma más exhaustiva que las madres de niños sanos— es el SESGO DE MEMORIA (recall bias), una forma específica de sesgo de INFORMACIÓN (opción B). Ocurre típicamente en estudios de casos y controles, donde el desenlace ya es conocido al recoger la exposición, y la calidad/intensidad del recuerdo difiere SISTEMÁTICAMENTE entre grupos: tener un hijo afectado motiva una búsqueda más intensa de causas y un recuerdo más detallado (clasificación errónea diferencial de la exposición). Esto puede crear o exagerar una asociación que no existe. Es un sesgo DIFERENCIAL (afecta a casos y controles de modo distinto), por lo que puede sesgar la estimación en cualquier dirección, no solo atenuarla. Mitigaciones: usar registros objetivos previos al desenlace (expediente, recetas), cegar a los entrevistadores respecto al estatus caso/control, o usar como controles a niños con otras malformaciones no relacionadas. La opción A (trabajador sano) es un sesgo de SELECCIÓN propio de cohortes ocupacionales, ajeno a este escenario. La opción C (pérdidas en seguimiento) es un sesgo de selección típico de cohortes prospectivas; aquí el diseño es retrospectivo de casos y controles, sin seguimiento. La opción D (confusión por nivel socioeconómico) es una variable de confusión, no un error en la MEDICIÓN de la exposición; la confusión se controla con ajuste/estratificación, mientras que el recall bias es un problema de obtención de la información.
Perla ENARM: el recall bias es el sesgo prototípico de los casos y controles retrospectivos; clave diferenciadora = el recuerdo difiere según el desenlace ya conocido. La distinción esencial es: sesgo de información (cómo se MIDE la exposición) ≠ sesgo de selección (cómo se ELIGEN los sujetos) ≠ confusión (tercera variable asociada a exposición y desenlace).
Caso 2
Un equipo de investigación del Instituto Nacional de Cardiología compara la concentración sérica de colesterol LDL (mg/dL, distribución normal confirmada por prueba de Shapiro-Wilk) entre dos grupos independientes de pacientes: uno tratado con estatina de alta intensidad y otro con estatina de moderada intensidad. La variable desenlace es cuantitativa continua y se compara entre DOS grupos independientes. ¿Cuál es la prueba estadística de elección para comparar el LDL entre ambos grupos?
- A. Prueba de chi-cuadrada de Pearson
- B. Prueba t de Student para muestras independientes
- C. Prueba de Wilcoxon de los rangos con signo
- D. ANOVA de una vía con post-hoc de Tukey
La elección de la prueba estadística se rige por tres preguntas: (1) ¿qué tipo de variable es el desenlace?, (2) ¿cuántos grupos se comparan?, y (3) ¿los datos cumplen los supuestos paramétricos (normalidad)? Aquí el desenlace (LDL en mg/dL) es CUANTITATIVO CONTINUO, se comparan DOS grupos INDEPENDIENTES (pacientes distintos en cada brazo) y la normalidad está confirmada por Shapiro-Wilk. La combinación "una variable continua y normal, dos grupos independientes" corresponde exactamente a la prueba t de Student para muestras independientes (opción B). La opción A (chi-cuadrada) es incorrecta: la chi-cuadrada compara variables CUALITATIVAS (proporciones/frecuencias en tablas de contingencia), no medias de una variable continua. La opción C (Wilcoxon de rangos con signo) es incorrecta por dos razones: es una prueba NO paramétrica —que se reservaría si los datos no fueran normales— y además es para datos APAREADOS (mediciones repetidas en los mismos sujetos), no para dos grupos independientes; su equivalente no paramétrico para grupos independientes sería Mann-Whitney. La opción D (ANOVA) es incorrecta porque ANOVA se usa cuando hay TRES o más grupos; con solo dos grupos, ANOVA es innecesario (de hecho, ANOVA con dos grupos equivale matemáticamente a la t de Student: F = t²).
Perla ENARM: memoriza el árbol de decisión: continua + normal + 2 grupos independientes → t independiente; + 2 grupos pareados → t pareada; + ≥3 grupos → ANOVA; si NO normal → equivalentes no paramétricos (Mann-Whitney, Wilcoxon, Kruskal-Wallis).
Caso 3
En un modelo de regresión logística múltiple que predice mortalidad hospitalaria (sí/no) en pacientes con sepsis del INER, una de las variables predictoras es "lactato sérico elevado". El modelo reporta para esta variable un OR ajustado de 2.5 (IC 95%: 1.8 a 3.5; p = 0.001). ¿Cuál es la interpretación correcta de este OR ajustado?
- A. Los pacientes con lactato elevado tienen un riesgo absoluto de mortalidad del 2.5%
- B. 2.5 veces mayor MOMIO (odds) de mortalidad, ajustando por las demás variables
- C. El lactato elevado causa directamente el 250% de las muertes en la cohorte
- D. Como el IC 95% (1.8 a 3.5) incluye valores mayores de 1, la asociación no es estadísticamente significativa
El odds ratio (OR, razón de momios) ajustado de una regresión logística múltiple se interpreta como el factor por el cual cambia el MOMIO (odds) del desenlace al pasar de la categoría de referencia a la categoría expuesta, MANTENIENDO CONSTANTES (ajustando por) todas las demás variables del modelo. Un OR de 2.5 significa que los pacientes con lactato elevado tienen 2.5 veces el momio de mortalidad respecto a los que no lo tienen, controlando por los demás predictores: la opción B es correcta. La frase "manteniendo constantes las demás variables" es la firma del coeficiente ajustado en un modelo multivariado. La opción A es incorrecta: el OR es una razón (medida relativa), NO un riesgo absoluto; 2.5 no es 2.5% ni una probabilidad. La opción C es incorrecta por dos razones: (1) el OR mide ASOCIACIÓN, no causalidad directa probada (la causalidad requiere más criterios que un coeficiente de regresión), y (2) "250% de las muertes" malinterpreta groseramente el OR como un porcentaje atribuible, lo cual es absurdo. La opción D es el error de interpretación del intervalo de confianza más relevante para razones (OR/RR): el valor nulo de una RAZÓN es 1 (no 0). Un IC 95% que va de 1.8 a 3.5 NO incluye el 1, por lo que la asociación SÍ es estadísticamente significativa (consistente con p = 0.001); el error de la opción D es pensar que "incluir valores >1" anula la significancia, cuando lo determinante es si el IC CRUZA el 1. Perla ENARM de altísimo rendimiento: para razones (OR, RR, HR) el valor nulo es 1; el resultado es significativo si el IC 95% NO incluye el 1. Para diferencias (diferencia de medias, de riesgos) el valor nulo es 0; significativo si el IC NO incluye el 0. Confundir el valor nulo (1 vs 0) según sea razón o diferencia es un error clásico que evalúa el ENARM.