Resumen
Conclusiones: Entre las pruebas de detección disponibles actualmente para enfermedades donde la muerte es un resultado común, las reducciones en la mortalidad específica por enfermedad son poco frecuentes y las reducciones en la mortalidad por todas las causas son muy raras o inexistentes.
- aneurisma aórtico abdominal
- ultrasonografia
- cáncer colonrectal
- prueba de sangre fecal oculta
- adulto
- mamografía
- antígeno específico de la próstata
- mortalidad
- cáncer de mama
- sigmoidoscopia de fibra óptica flexible
- Prueba de pantalla
- colaboración cochrane
- grupo de trabajo de servicios preventivos de estados unidos
- Se evaluaron las pruebas en 39 pruebas de detección para 19 enfermedades en las que la mortalidad es un resultado común.
- Se encontraron 48 ensayos controlados aleatorios y 9 metanálisis que abordaron la mortalidad por enfermedad específica o por todas las causas.
- Las reducciones en la mortalidad por enfermedad específica fueron poco frecuentes y las reducciones en la mortalidad por todas las causas fueron muy poco frecuentes, o incluso inexistentes con estas pruebas de detección.
Introducción
La detección de enfermedades es un componente clave de la atención médica moderna. El razonamiento es simple y atractivo: detectar enfermedades tempranamente en individuos asintomáticos y tratarlas para reducir la morbilidad, la mortalidad y los costos asociados. Sin embargo, el papel de la detección a menudo entra en duda. Algunas controversias de alto perfil han aparecido últimamente en este sentido. Por ejemplo, para el cáncer de mama, el Grupo de Trabajo de Servicios Preventivos de los Estados Unidos (USPSTF, por sus siglas en inglés) recomienda actualmente el examen mamográfico de rutina para mujeres de 40 a 49 años de edad, luego de retractarse de su recomendación previa a favor de la mamografía, ya que los datos no demuestran que el beneficio sea mayor que el daño . 1 La decisión en contra de la detección provocó fuertes críticas de varios grupos de interés, incluidos los pacientes que sobrestimaron el beneficio de la detección.2 De manera similar, USPSTF ahora recomienda no detectar el cáncer de próstata en hombres sanos, ya que los daños causados por el antígeno prostático específico (PSA) superan el beneficio, los ensayos no muestran una mejoría en la supervivencia a largo plazo 3 y el examen conlleva un alto riesgo de diagnóstico excesivo con Consecuencias adversas. Nuevamente, se han generado acalorados debates sobre este cambio de recomendación, tanto en la prensa científica como en la popular.
Algunas pruebas de detección se afianzaron en la práctica clínica y de salud pública antes de que los ensayos controlados aleatorios (ECA) se usaran ampliamente. Dado que la agenda de selección abarca una gran cantidad de pruebas y se proponen continuamente nuevas, es útil reevaluar las pruebas que respaldan su uso. Nuestra pregunta de investigación es si las pruebas de detección recomendadas, entre adultos asintomáticos, tienen pruebas de ECA sobre la mortalidad por enfermedades en las que la muerte es un resultado común. En particular, ¿hay evidencia de reducción de la mortalidad, ya sea específica de la enfermedad o por todas las causas, a partir de la detección? Con este fin, hemos recopilado y examinado sistemáticamente la evidencia de los ECA individuales y los metanálisis de los mismos para las pruebas de detección que se han propuesto para detectar enfermedades graves en adultos que no tienen síntomas.
Los metodos
Criterio de elegibilidad
Se evaluaron las enfermedades / trastornos en adultos, que USPSTF agrupó en diferentes categorías clínicas y realizó recomendaciones de detección. Nos centramos en las categorías «Cáncer» y «Enfermedades vasculares y cardiacas», así como en la diabetes mellitus tipo 2 y la enfermedad pulmonar obstructiva crónica, ya que la mortalidad es un resultado común de estas enfermedades. No incluimos enfermedades / trastornos en los que la mortalidad no es un resultado común, y que incluyó las siguientes categorías clínicas: enfermedades infecciosas; condiciones de salud mental y abuso de sustancias; trastornos metabólicos, nutricionales y endocrinos (excepto diabetes tipo 2); trastornos musculoesqueléticos; Lesiones y violencia; trastornos de la visión y audición; Condiciones obstétricas y ginecológicas; y varios (excepto enfermedades pulmonares obstructivas crónicas).
Para las enfermedades incluidas, compilamos una lista de pruebas de detección y evaluamos cuáles de ellas son recomendadas por USPSTF y si tienen pruebas aleatorias sobre los resultados de mortalidad. Definimos la detección como el uso de una prueba específica en una población no enferma, asintomática, para detectar una enfermedad determinada. Solo se consideraron las pruebas que compararon la mortalidad entre los grupos de control de selección y los de no selección. No consideramos la detección / detección en individuos ya enfermos (por ejemplo, pacientes que tienen diabetes mellitus o que ya tienen algún diagnóstico de cáncer).
Estrategias de búsqueda y documentación de evidencia.
Recopilamos información de USPSTF, Base de Datos Cochrane de Revisiones Sistemáticas y PubMed. Documentamos las recomendaciones actuales y el nivel de evidencia correspondiente de USPSTF. Se recopilaron pruebas metaanalíticas sobre el cribado de Cochrane y PubMed. Además, recopilamos de la información de PubMed sobre los ECA individuales sobre la detección que no se habían incluido en un metanálisis publicado.
En el sitio web de USPSTF, revisamos la documentación de las pruebas de ECA para la detección de cada enfermedad en adultos (última actualización: enero de 2014).
Se realizaron búsquedas en la Base de Datos Cochrane de Revisiones Sistemáticas utilizando el término de búsqueda ‘screening’ en el título, resumen o palabras clave. Se documentaron todas las revisiones sistemáticas sobre las pruebas de detección que tenían al menos un ECA elegible o un metanálisis de varios ECA con resultados de mortalidad (última actualización: enero de 2014).
Se realizaron búsquedas en PubMed utilizando los términos de búsqueda ‘pantalla’ o ‘selección’ o ‘prueba’ en el título y ‘muerte’ o ‘mortalidad’ o ‘supervivencia’ en el título, resumen o palabras clave. Realizamos dos búsquedas de artículos publicados en inglés; uno se limitó a los ECA y el otro a los metanálisis (utilizando el límite de ‘tipo de publicación’) (última actualización: enero de 2014).
Selección de estudios: metaanálisis y ensayos individuales.
Se examinaron, identificaron y organizaron los metanálisis elegibles por enfermedad y la prueba de detección asociada (Cochrane, PubMed). Cuando varios metanálisis fueron elegibles para la misma enfermedad y la prueba de detección, seleccionamos los más completos (más ensayos, más seguimiento a largo plazo en los ensayos incluidos).
Se seleccionaron e identificaron los ensayos individuales elegibles (PubMed). Primero organizamos la lista por prueba de detección, luego por nombre de prueba y luego por año de publicación. Si hubiera más de una cita por ensayo, seleccionamos la publicación más reciente. Al mismo tiempo, compilamos una lista de ensayos que estaban en los metanálisis seleccionados. Se compararon los ensayos individuales en PubMed con los de los metanálisis seleccionados para determinar cuántos ensayos tenían en común. Finalmente, compilamos una lista de ensayos individuales, incluidos los que estaban en común y los que eran exclusivos de PubMed o de un metanálisis. Finalmente, si no se disponía de un metanálisis, pero existían varios ensayos individuales para una prueba de detección determinada, realizamos el metanálisis por nosotros mismos utilizando la síntesis de varianza inversa con efectos fijos.
Extracción de datos
Desde USPSTF, documentamos lo siguiente para cada enfermedad: pruebas de detección, declaración de recomendación, categoría de evidencia, presencia o ausencia de evidencia de ECA y la población específica a la que se aplica la recomendación.
Para cada metanálisis incluido de ECA (Cochrane o PubMed) y ECA único (PubMed), extrajimos lo siguiente: enfermedad; se evaluó la intervención de cribado; número de ECA analizados; uso del análisis estratificado (sí, no) y, en caso afirmativo, tipos de estratos; número de muertes por enfermedad específica / muestra total y estimaciones de riesgo de mortalidad por enfermedad específica; y número de muertes totales / muestra total y estimaciones del riesgo de mortalidad por todas las causas. Los datos fueron extraídos por dos coautores y cualquier desacuerdo se resolvió con la discusión con el autor principal (tercero).
Presentación de resultados de mortalidad.
La mortalidad específica por enfermedad se definió como la muerte atribuida a la enfermedad en cuestión y la mortalidad por todas las causas se definió como la muerte por cualquier causa; en ambos casos, el denominador fue la muestra total por grupo aleatorizado y no aquellos que fueron detectados como enfermos. Presentamos el efecto del tratamiento (estimaciones de riesgo con un intervalo de confianza del 95%) tal como se informaron en los ECA o metanálisis originales.
Resultados
Pruebas de detección evaluadas en USPSTF
USPSTF proporciona una evaluación de detección de 19 enfermedades en las que la mortalidad es un resultado común (cáncer n = 12, enfermedades vasculares y cardíacas n = 5, diabetes tipo 2, enfermedad pulmonar obstructiva crónica) ( Tabla complementaria 1 , disponible como datos complementarios en el IJE en línea) .
En total, se tratan 39 pruebas de detección diferentes para estas 19 enfermedades. Se recomiendan pruebas de detección para 6 de las 19 enfermedades (para un total de 12 pruebas recomendadas de las 14 pruebas disponibles para estas 6 enfermedades). Se citan pruebas aleatorias con un resultado de mortalidad para solo 5 enfermedades (cáncer de mama, cervical y colorrectal, aneurisma aórtico abdominal y diabetes tipo 2) para 11 pruebas recomendadas entre 13 evaluadas por USPSTF ( Figura 1 ).
Los ensayos aleatorios con datos sobre la mortalidad no están disponibles para una enfermedad (hipertensión) en la que se recomienda el cribado (se recomienda una de una prueba). Además, el cribado de mutaciones del gen BRCA para el cáncer de mama 4 y la colonoscopia para el cáncer colorrectal no tienen ensayos aleatorios sobre su efectividad, pero actualmente se recomiendan ambos para adultos con antecedentes familiares.
No se recomienda el cribado para las 13 enfermedades restantes donde hay 25 pruebas disponibles; de estos, los ensayos aleatorios con datos sobre mortalidad están disponibles solo para 7 pruebas en 4 enfermedades: cáncer de pulmón, oral, ovárico y de próstata. Para el cáncer de mama, se recomienda la detección de BRCA y la mamografía, pero no se recomiendan el examen clínico y el autoexamen de la mama. Existe evidencia aleatorizada para mamografía, 5 clínica y autoexamen 6 , 7 pero no para BRCA (existe un ensayo sobre asesoramiento genético pero no para la prueba de detección per se).
Se evaluaron los metanálisis sobre las pruebas de detección en Cochrane y PubMed.
La búsqueda produjo 595 artículos en Cochrane y 125 artículos en PubMed; de ellos, 59 y 85, respectivamente, fueron evaluados en texto completo. En Cochrane y PubMed, 12 y 44 metanálisis, respectivamente, cumplieron con los criterios de elegibilidad; estas incluyeron 8 revisiones Cochrane que también se presentaron como artículos de revistas, por lo que hubo 48 metanálisis diferentes elegibles. Estos 48 metanálisis se agruparon por prueba y enfermedad para identificar el metanálisis más reciente y no superpuesto sobre cada tema. Finalmente, se seleccionaron ocho metanálisis que cubrían ocho pruebas de detección para seis enfermedades; 3 , 5 , 6 , 8–12Además, realizamos un metanálisis de los datos de los ensayos sobre el cribado con tomografía computarizada (TC) para el cáncer de pulmón, ya que hubo varios ensayos individuales pero ningún metanálisis publicado ( Figura 2 ).
Evaluación de ensayos individuales en pruebas de detección en PubMed
La búsqueda produjo 590 artículos; Se evaluaron 83 registros más y 40 ensayos cumplieron con los criterios de inclusión. De los 40, 28 ensayos se incluyeron en al menos uno de los ocho metanálisis elegibles mencionados anteriormente. 13–40 Los otros 12 ensayos 7 , 41–51encontrados en PubMed incluyeron en su mayoría ( n = 9) ensayos sobre temas para los cuales no hubo metanálisis previos elegibles; tres ensayos 42 , 44 , 45 se excluyeron del metanálisis respectivo porque el tiempo de seguimiento fue inferior a 5 años. Otros ocho juicios 52–59que se había incluido en los ocho metanálisis elegibles no fueron capturados por la búsqueda de ensayos de PubMed; PubMed no los seleccionó debido a que uno estaba en idioma ruso, dos no fueron etiquetados como ensayos controlados aleatorios de PubMed y cinco no tenían los términos de búsqueda en sus títulos. Por lo tanto, se consideraron un total de 48 ECA elegibles ( Figura 3 ).
Pruebas metaanalíticas y de ensayos individuales por enfermedad.
Aneurisma aórtico abdominal
Se encontraron ocho metanálisis; se utilizó el metanálisis de Takagi et al . 12 que habían incluido cuatro ensayos (Chichester, 16 MASS, 60Viborg. 13 Western Australia 35 ) con el seguimiento más prolongado (≥10 años). Además, MASS 18 ha publicado datos de seguimiento extendidos (13 años) después del metanálisis de Takagi. La razón para excluir seis metanálisis fue un seguimiento más corto. 61–66 El último fue excluido porque evaluó una mortalidad a los 30 días después de la cirugía electiva para el aneurisma aórtico. 67
Cáncer de mama
Se encontraron doce metanálisis de cribado con mamografía; Gotzsche et al. 5 habían revisado los ocho ensayos (Canadá 1980a, b, 17 , 68Edimburgo, 14 Goteborg, 15 Malmo, 19 Nueva York, 26 Estocolmo, 20 Dos condados 27 y Reino Unido edad 24 ) y reportaron el tiempo de seguimiento más largo ( 13 años). Los otros metanálisis se excluyeron porque eran publicaciones anteriores, 69–71 tuvieron menos ensayos 72–76o más cortos de seguimiento 77 o seleccionaron un grupo de edad particular 78–82 o un subtipo de cáncer.83 Para el estudio de dos condados, Tabar et al . también presentaron estimaciones de mortalidad por enfermedad con un seguimiento más prolongado (29 años); 27 las estimaciones del ensayo para la mortalidad por todas las causas se extrajeron de Gotzsche et al . 5
Sólo se encontró un metanálisis 6 para la detección con autoexamen de mamas con dos ensayos (Russia 58 y Shanghai 59 ) y un solo ensayo (Mumbai 7 ) para el examen clínico de mamas.
Cáncer de cuello uterino
Se encontraron dos ensayos individuales (Tamil Nadu 46 y Maharashtra 47 en la India) en la detección con inspección visual, pruebas del virus del papiloma humano y pruebas citológicas para el cáncer cervical.
Colorectal cancer
Four meta-analyses of screening with fecal occult blood (FOBT) test were found; Hewitson et al.8 presented four trials (Funen,21 Goteborg,23Minnesota 84 and Nottingham25) with the longest follow-up (11.7 to 18 years); the other three were excluded for including fewer trials85 or shorter follow-up time.86,87 After the Hewitson meta-analysis was published, the Minnesota study has published a 30-year follow-up.49Two meta-analyses9,88 of screening with flexible sigmoidoscopy (single, multiple or in combination with FOBT) were also found; both included five trials: Telemark Polyp Study,54 NCCPS,31 UK trial,29SCORE,40 and PLCO.38 One meta-analysis was excluded because it did not provide all-cause mortality estimates.88
Hepatocellular cancer
Two reviews of screening with alpha-fetoprotein plus ultrasound were found; Wun et al.89 included two trials (Toronto90 and Shanghai,91) and Aghoram et al.92 included three trials (Toronto,90 Taiwan93 and Shanghai51,91); neither review gave meta-analytical evidence. The Toronto and Taiwan trials evaluated comparative screening and therefore were not included in our evaluation of individual trials. The two reports from the Shanghai trial had discrepant results; the earlier report91 did not show benefit with screening [odds ratio (OR) 0.81, 95% confidence interval (CI) = 0.54, 1.22] but the later one51 showed benefit [relative risk (RR) = 0.63, 95% CI = 0.41, 0.98]. The later one has been included in the analysis as it had longer follow-up data. One additional single trial (Qidong, China41) of screening with only alpha-fetoprotein was also found.
Lung cancer
Three meta-analyses of screening with chest X-ray were found; Manser et al.10 presented seven trials of screening with chest X-ray (Czech,22 Erfurt County,94 Kaiser,53 Mayo lung,57 North London,52 Johns Hopkins56 and Memorial Sloan-Kettering34) and has been selected for analysis. However, the Erfurt County study was excluded from the individual trial evidence (Table 2) because of its non-randomized design. The other two meta-analyses on chest X-ray were excluded because they were earlier publications and contained non-randomized data.95,96 Data from PLCO36 (chest X-ray) was not included in any of the meta-analyses but we presented its estimates in the individual trial evidence. There were four trials (DLCST,45 MILD,44 DANTE42 and NLST97) on computer tomography (CT) scan, but no available meta-analyses. We excluded NLST as it evaluated comparative screening (CT scan vs chest X-ray). We recorded the estimates from the other three trials and conducted our own meta-analysis.
Oral cancer
One review98 of screening with visual examination was found. It contained only one trial from Kerala, India.48,99 The estimate with longer follow-up data from that trial was presented in the individual trial evidence.48
Ovarian cancer
One meta-analysis on screening with CA-125 was found;11 it contained two individual trials (PLCO,30 UK32).
Prostate cancer
Six meta-analyses of screening with prostate specific antigen (PSA) were found. Four were by Ilic et al.3,100–102 and contained the same data from five trials (ERSPC,103 Norrkoping,104 PLCO,105 Quebec33 and Stockholm55); we used the estimates from the most recent publication.3The other two were not used because they included site-specific data (e.g. French ERSPC and Gothenburg are part of original ERSPC) or used non-randomized data.106,107 Of the individual trials, we also included updated estimates for Norrkoping37 and PLCO.28
Cardiovascular disease
One individual trial of screening with echocardiography was found.43
Type 2 diabetes mellitus
One individual trial of screening with fasting blood glucose and haemoglobin A1c (HbA1c) was found.50
Synopsis of RCT evidence (meta-analytic and individual) for mortality
Meta-analytic evidence
Como se muestra en la Tabla 1 , los metanálisis de los ensayos aleatorios estaban disponibles para nueve pruebas de detección en seis enfermedades. Los IC del 95% excluyeron el nulo en 4 de las 11 estimaciones disponibles (36%) de la mortalidad específica por enfermedad, pero en ninguna de las 10 estimaciones disponibles para la mortalidad por todas las causas. La mortalidad específica por enfermedad se redujo con la ecografía para el aneurisma aórtico abdominal en hombres; 12 mamografía para cáncer de mama; 5 y prueba de sangre oculta en heces 8 y sigmoidoscopia flexible 9 para el cáncer colorrectal. El rango de reducción del riesgo relativo en estos cuatro casos fue de entre 16% y 45%. Las estimaciones de riesgo relativo para la mortalidad por todas las causas fueron muy cercanas a 1.00 (rango 0.98–1.03).
|
|
||||||||
---|---|---|---|---|---|---|---|---|---|
Enfermedad | Cribado | Muerte específica por enfermedad
|
Muerte por cualquier causa
|
Muerte específica por enfermedad | Muerte por cualquier causa | ||||
---|---|---|---|---|---|---|---|---|---|
No. RCTs | Detección de muerte / muestra | Control de muerte / muestra | No. RCTs | Detección de muerte / muestra | Control de muerte / muestra | Estimación de riesgo (IC 95%) | Estimación de riesgo (IC 95%) | ||
Aneurisma aórtico abdominal | Ultrasonido 12 , a | 3 | 221/43211 | 405/43238 | 4 | 19960/57181 | 20280/57195 | 0.55 (0.35, 0.86) f | 0.98 (0.96, 1.00) f |
Cáncer de mama | Mamografía 5 , b | 3 | 404/119504 | 572/172649 | 3 | 4644/119897 | 5671/173061 | 0.90 (0.79, 1.02) d | 0.99 (0.95, 1.03)e |
Mammography5,c | 4 | 633/170048 | 746/136889 | 5 | 14355/128749 | 11839/116119 | 0.75 (0.67, 0.83)d | 0.99 (0.97, 1.01)e | |
Breast self-exam6 | 2 | 292/190691 | 295/197844 | 1.05 (0.90, 1.24)d | |||||
Colorectal cancer | Fecal occult blood test (FOBT)8 | 4 | 1476/172734 | 1592/156908 | 4 | 53666/172734 | 48202/156908 | 0.84 (0.78, 0.90)d | 1.00 (0.99, 1.01)d |
Flexible sigmoidoscopy9 | 5 | Not given | Not given | 3 | Not given | Not given | 0.71 (0.61, 0.81)d | 0.99 (0.91, 1.07)e | |
Lung cancer | Chest X-ray10 | 4 | 710/42668 | 629/38635 | 4 | 4757/54477 | 9639/115672 | 1.11 (1.00, 1.23)d | 1.01 (0.94, 1.08)e |
Chest X-ray + cytology10 | 2 | 256/10194 | 293/10233 | 1 | 493/4968 | 491/5072 | 0.88 (0.74, 1.03)d | 1.03 (0.91, 1.15)e | |
CT scang | 3 | 53/5704 | 38/4971 | 3 | 158/5704 | 107/4971 | 1.23 (0.81, 1.87)d | 1.34 (0.93, 1.93)e | |
Ovarian cancer | CA-12511 | 2 | 127/45211 | 118/45281 | 1 | 2924/34253 | 2914/34304 | 1.08 (0.84, 1.38)d | 1.00 (0.96, 1.06)e |
Prostate cancer | Prostate-specific-antigen3 | 5 | 698/156157 | 1318/185185 | 4 | 22833/125024 | 35790/169832 | 1.00 (0.86, 1.17)d | 1.00 (0.96, 1.03)e |
aMen.
bOptimal trial.
cSub-optimal trial.
dOdds ratio.
eRelative risk or rate ratio.
fHazard ratio.
gWe conducted the meta-analyses for screening with CT scan using data from DANTE, DLCST, and MILD trial (see Table 2).
Individual trial evidence
Como se muestra en la Tabla 2 , se recopilaron pruebas de 48 ensayos aleatorios en 19 pruebas de detección para 11 enfermedades. Los IC del 95% excluyeron el nulo en 16 de 54 estimaciones informadas (30%) (algunos ensayos informaron más de una estimación, por ejemplo, en diferentes subgrupos) para la mortalidad específica por enfermedad y para 4 de las 36 estimaciones informadas (11%) para mortalidad por cualquier causa. El rango de reducción del riesgo relativo en los 16 casos con mejor mortalidad por enfermedad específica fue de entre el 13% y el 73% (mediana del 29%) y en los cuatro casos de mejora de la mortalidad por todas las causas fue de entre el 3% y el 13% (mediana de 10 %).
|
|
|||||||
---|---|---|---|---|---|---|---|---|
Enfermedad | Prueba de pantalla | Ensayo individual | Muerte específica por enfermedad
|
Muerte por cualquier causa
|
Muerte específica por enfermedad | Muerte por cualquier causa | ||
---|---|---|---|---|---|---|---|---|
Detección de muerte / muestra | Control de muerte / muestra | Detección de muerte / muestra | Control de muerte / muestra | Estimación de riesgo (IC 95%) | Estimación de riesgo (IC 95%) | |||
Aneurisma aórtico abdominal | Ultrasonido | Viborg 13 | 14/6333 | 51/6306 f | 2184/6333 | 2234/6306 f | 0.27 (0.15, 0.49) d | 0,97 (0,91, 1,03) d |
Australia Occidental 35 ,a | 18/19352 | 25/19352 f | 2232/19352 | 2571/19352 f | 0.72 (0.39, 1.32) b | 0.98 (incluye 1.00) c | ||
MASS 18 | 224/33883 | 381/33887 | 13858/33883 | 14134/33887 | 0.58 (0.49, 0.69) d | 0,97 (0,95, 0,99) d | ||
Chichester 16 | 19/6333 | 55/6306 | 2931/6333 | 2964/6306 | 0.34 (0.20, 0.57) d | 0,98 (0,93, 1,03) d | ||
Cáncer de mama | Mamografía | Canada 1980 17,a,f | 105/25214 | 108/25216f | 413/25214 | 413/25216f | 0.97 (0.74, 1.27)c | 1.00 (0.87, 1.14)c |
1980b,6,8 | 107/19711 | 105/19694f | 734/19711 | 690/19694f | 1.02 (0.78, 1.33)c | 1.06 (0.96, 1.18)c | ||
Edinburgh14 | 156/28628 | 167/26026 | 0.79 (0.60, 1.02)c | |||||
Goteborg15 | 88/21650 | 162/29961 | 1430/21000 | 2241/29200 | 0.75 (0.58, 0.97)c | 0.89 (0.83, 0.95)c | ||
Malmo19 | 87/20695 | 108/20783 | 2537/21088 | 2593/21195 | 0.81 (0.61, 1.07)c | 0.98 (0.93, 1.04)c | ||
New York26 | 218/31000 | 262/31000 | 2062/30239 | 2116/30765 | 0.83 (0.66, 1.04)c | 0.99 (0.94, 1.05)c | ||
Stockholm20 | 66/40318 | 45/19943 | 1768/39139 | 1036/20978 | 0.73 (0.50, 1.06)c | 0.91 (0.85, 0.99)c | ||
Two-county27,f | 351/77080 | 367/55985 | 6034/38568f | 0.73 (0.59, 0.89)d | ||||
Kopparberg71,f | 4829/38942 | 2796/18479f | 1.03 (0.99, 1.08)c,f | |||||
Ostergland71 | 4686/37675f | 1.00 (0.96, 1.04)c | ||||||
UK Age trial24 | 105/53884 | 251/106956 | 960/53884 | 1975/106956 | 0.83 (0.66, 1.04)c,f | 0.96 (0.89, 1.04)c | ||
Clinical breast exam | Mumbai7 | 22/75360 | 10/76178 | P = 0.304e | ||||
Breast self-exam | Russia6,58 | 157/57712 | 164/64759 | 1.07 (0.86, 1.34)c | ||||
Shanghai59 | 135/132979 | 131/133085 | 1.03 (0.81, 1.31)c | |||||
Cervical cancer | Visual inspection | Tamil Nadu, India46 | 83/31343 | 92/30958 | 1303/31343 | 977/30958 | 0.65 (0.47, 0.89)d | 0.87 (0.78, 0.96)d |
Visual inspection | Maharashtra India47,f | 56/34074f | 0.86 (0.60, 1.25)d,f | |||||
Human papilloma virus | 34/34126f | 64/31488 | 0.52 (0.33, 0.83)d,f | |||||
Cytology | 54/32058 | 0.89 (0.62, 1.27)d | ||||||
Cardiovascular disease | Echocardiography | Norwa 43 | 250/3272 | 299/3589 | 880/3272 | 989/3589 | 0.91 (0.77, 1.08)d | 0.97 (0.89, 1.06)d |
Colorectal cancer | Fecal occult blood test (FOBT) | Funen21 | 362/30967 | 431/30966 | 12205/30967 | 12248/30966 | 0.84 (0.73, 0.96)b | 0.99 (0.96, 1.03)b |
Goteborg23 | 252/34144 | 300/34164 | 10591/34144 | 10432/34164 | 0.84 (0.71, 0.99)b | 1.02 (0.99, 1.06)b | ||
Minnesota – annual49 | 200/15570 | 295/15394 | 11072/15570 | 10944/15394 | 0.68 (0.56,0.82)c | 1.00 (0.99, 1.01)c | ||
Minnesota – biennial49 | 237/15587 | 295/15394 | 11004/15587 | 10944/15394 | 0.78 (0.65, 0.93)c | 0.99 (0.98, 1.01)c | ||
Nottingham25 | 593/76466 | 684/76384 | 20421/76466 | 20336/76384 | 0.87 (0.77, 0.97)b | 1.00 (0.98, 1.03)b | ||
Flexible sigmoidoscopy with or without FOBT | Norwegian NCCPS31 | 24/13653 | 99/41092 | Not given | Not given | 0.73 (0.47, 1.13)d,f | 1.02 (0.98, 1.07)d | |
Single flexible sigmoidoscopy | Telemark54 | 1/400 | 4/399 | 62/400 | 40/399 | 0.25 (0.03, 2.23)c | 1.55(1.04, 2.30)c | |
UK trial29 | 189/57099 | 538/112939 | 6775/57099 | 13768/112939 | 0.69 (0.59, 0.82)d | 0.97 (0.94, 1.00)d | ||
SCORE40 | 65/17136 | 83/17136 | 1202/17136 | 1233/17136 | 0.78 (0.56, 1.08)c | 0.97 (0.90, 1.05)c | ||
Multiple flexible sigmoidoscopy | PLCO38 | 252/77445 | 341/77455 | 0.74 (0.63, 0.87)c | ||||
Type 2 diabetes | Fasting blood glucose + HbA1c | ADDITION-Cambridge50 | Not given | Not given | 1532/16047 | 377/4137 | 1.26(0.75, 2.10)d | 1.06 (0.90,1.25)d |
Hepatocellular carcinoma | Alphafetoprotein + ultrasound | Shanghai51 | 32/9373 | 54/9443 | 0.63 (0.41, 0.98)c | |||
Alphafetoprotein | Qidong, China41 | 218/3712 | 109/1869 | 353/3712 | 175/1869 | 1.01 (0.81, 1.26)c | 1.01 (0.85, 1.21)c | |
Lung cancer | Chest X-ray | Czech22 | 247/3171 | 216/3174 | 341/3171 | 292/3174 | 1.14 (0.96, 1.36)c | 1.16 (1.00, 1.35)c |
Kaiser53 | 44/5156 | 42/5557 | 585/5156 | 643/5557 | 1.13 (0.74, 1.72)c | 0.98 (0.88, 1.09)c | ||
Mayo Lung57 | 337/4618 | 303/4593 | 688/4618 | 665/4593 | 1.11 (0.95, 1.28)c | 1.03 (0.93, 1.14)c | ||
North London52 | 82/29723 | 68/25311 | 1.03 (0.74, 1.42)c | |||||
John Hopkins56,f | 141/5226 | 173/5161 | 0.80 (0.65, 1.00)c | |||||
Memorial Sloan-Kettering34,f | 115/4968 | 120/5072 | 493/4968 | 491/5072 | 0.98 (0.76, 1.26)c | 1.03 (0.91, 1.15)c | ||
PLCO36,f | 1213/77445 | 1230/77456 | 0.99 (0.87, 1.22)c | |||||
CT scan | DANTE42,f | 20/1276 | 20/1196 | 46/1276 | 45/1196 | 0.94 (0.50, 1.73)c | 0.96 (0.64, 1.43)c | |
DLCST45 | 15/2052 | 11/2052 | 61/2052 | 42/2052 | 1.36 (0.63, 2.96)c | 1.45 (0.98, 2.14)c | ||
MILD44 | 18/2376 | 7/1723 | 51/2376 | 20/1723 | 1.64 (0.67, 4.01)d | 1.40 (0.82, 2.38)d | ||
Oral cancer | Visual exam | Kerala, India -overall48 | 138/96517 | 154/95356 | 0.88 (0.69, 1.12)c | |||
Kerala, India –high risk48,f | 129/45791 | 147/39151 | 0.76 (0.60, 0.97)c | |||||
Kerala, India –low risk48,g | 9/50726 | 7/56205 | 1.36 (0.57, 3.26)c | |||||
Ovarian cancer | CA – 125 | PLCO30 | 118/34253 | 100/34304 | 2924/34253 | 2914/34304 | 1.18 (0.82, 1.71)c | 1.01 (0.96, 1.06)c |
UK32 | 9/10958 | 18/10977 | 0.50 (0.22, 1.11)c | |||||
Prostate cancer | Prostate-specific-antigen | ERSPC103 | 261/82816 | 363/99184 | 13082/82816 | 15717/99184 | 0.86 (0.73, 1.01)c | 1.00 (0.98, 1.02)c |
Norkopping37 | 30/1494 | 130/7532 | 1.16 (0.78, 1.73)c | |||||
PLCO28 | 158/38340 | 145/38345 | 1.09 (0.87, 1.36)c | |||||
Quebec33 | 153/31133 | 75/15353 | 1.01 (0.76, 1.33)c | |||||
Stockholm55 | 53/2374 | 506/24772 | 986/2374 | 10328/24772 | 1.09 (0.83, 1.45)c | 1.00 (0.95, 1.05)c |
aThe estimate for all-cause mortality in the Western Australia study is based on the ratio of the age standardized mortality data provided in Table 5 of Norman et al.35Although Lindholt et al.62 show a decrease in all-cause mortality with longer follow-up (odds ratio = 0.91 (0.88, 0.95), this seems to be an artefact of age imbalance in the two arms; and Takagi et al.12 show no difference between groups in the 65 to 74 age stratum, which is well age-balanced (hazard ratio = 0.99 (0.96, 1.02).
bOdds ratio.
cRelative risk or rate ratio.
dHazard ratio.
eNot specified.
fHigh-risk participants (smokers and alcohol users).
gLow-risk participants.
Disease-specific mortality was reduced with ultrasound for abdominal aortic aneurysm in the Viborg,13 MASS60 and Chichester16 trials; with mammography for breast cancer in the Goteborg15 and Two-county27trials; with visual inspection for cervical cancer in the Tamil Nadu46and Maharashtra47 trials; with FOBT for colorectal cancer in the Funen,21 Goteborg,23 Minnesota49 and Nottingham25 trials; with flexible sigmoidoscopy for colorectal cancer in the UK trial29 and PLCO;38 with alpha-fetoprotein and ultrasound for hepatocellular cancer in the Shanghai51 trial; and with visual examination for oral cancer in the Kerala99 trial. Overall, seven tests for six diseases had at least one RCT with a disease-specific mortality benefit: of those, three diseases had also been documented in meta-analyses.
All-cause mortality was reduced with ultrasound in abdominal aortic aneurysm in MASS;18 with mammography in breast cancer in Goteborg15 and Stockholm;20 and with visual examination for cervical cancer in Tamil Nadu.46 Mammography and ultrasound for aortic aneurysm had no all-cause mortality benefits in the respective meta-analyses including all the relevant trials. Visual examination for cervical cancer had also been assessed in another trial that did not report results on all-cause mortality.47
Discussion
Our comprehensive overview shows that there are currently at least 48 RCTs and 9 non-overlapping meta-analyses that have evaluated the impact of any screening test vs no screening on mortality in asymptomatic adults for diseases where mortality is a common outcome. Documented reductions in disease-specific mortality in randomized trials of screening are uncommon. Reduction in all-cause mortality is even more uncommon in single trials and has not been documented in the latest available meta-analysis of multiple trials for any of the examined topics. This overview offers to researchers, policy makers and healthcare providers a synthesis of RCT evidence on the potential benefits of screening on mortality, and is timely in the wake of recent controversies around breast and prostate cancer screening.
Of the handful of trials that have reported survival benefits from screening, it is likely that in a few of them the benefit is substantially overestimated. For example, visual inspection of the cervix with acetic acid (cervical cancer screening) offered a 13% estimated relative risk reduction for all-cause death in one trial46 conducted in rural India. Women in the screened group received other interventions apart from screening, such as correction of anaemia and measurement of blood pressure. Hence this large difference in total mortality, if true, was likely the result of multiple interventions and not the screening alone (cervical cancer does not account for 13% of all deaths even in rural India). Similarly, a mortality reduction shown in the Shanghai trial for screening in hepatocellular cancer51 is in question. The earlier paper91from that trial did not report a risk estimate but only reported percent survival; a subsequent Cochrane review89 used the survival data to calculate a risk estimate with 95% CIs that did not exclude the null. In the same way, the original publication35 from the Western Australia study for screening in abdominal aortic aneurysm did not report a relative risk estimate for all-cause mortality; a subsequent meta-analysis62 calculated a mortality reduction with 95% CIs that excluded the null, but this did not take into account the substantial age imbalance that existed between the study groups; and another more recent meta-analysis12 that realized this caveat had 95% CIs that did not exclude the null.
There are many potential underlying reasons for the overall poor performance of screening in reducing mortality: the screening test may lack sufficient sensitivity and specificity to capture the disease early in its process; there are no markedly effective treatment options for the disease; treatments are available but the risk-benefit ratio of the whole screening and treatment process is unfavourable; or competing causes of death do not allow us to see a net benefit. Often, these reasons may coexist. Whether screening saves lives can only be reliably proven with RCTs.108 However, even for newly proposed tests, we suspect that their adoption in practice may evade RCT testing. A very large number of tests continuously become available due to technological advancement.109 One may be tempted to claim a survival benefit of screening based on observational cohorts showing improved survival rates,110 but these are prone to lead-time and other types of bias. Even RCTs can be biased sometimes, as has been discussed and hotly debated in the controversy over mammography.71
Some limitations should be acknowledged in our overview. First, we synthesized randomized evidence, but did not include data from other research designs, such as cohort and case-control studies. However, as we stated above, non-randomized studies have serious limitations. Non-randomized studies may provide useful suggestions and insights, but typically these would be less definitive, unless the effect is very robust and large, and most screening tests do not seem to have large effects on mortality. Second, one should acknowledge that given the many competing causes of death, it is very difficult to document reductions in all-cause mortality, unless the disease of interest is a leading cause of death and extremely large RCTs are performed. This is the reason why we also addressed comprehensively all the available data on disease-specific mortality. Third, we used broad search terms in PubMed and in Cochrane to maximize the capture of relevant trials and meta-analyses. It is possible that a few trials may have been missed, but it is unlikely that we have missed major trials that had found mortality benefits. As a quality check, we also matched our search results with the USPSTF documents. We found that we had not missed any trials that USPSTF has cited, whereas we have detected several additional recent trials that USPSTF did not cite (not unexpected since the USPSTF updates the evidence periodically). Finally, we did not include evidence on the effectiveness of one screening test against another (i.e. comparative screening). Nevertheless, it is difficult to interpret a trial that shows that a screening test is better than an older comparator, when it is unknown whether the older comparator does more good than harm.
To avoid uncertainty and a continuing conundrum in the world of screening for disease, we need to choose the appropriate study design and outcome, depending on the disease, to evaluate the effectiveness of screening tests. We argue that for diseases where short- and medium-term mortality are a relatively common outcomes, RCT should be the default evaluation tool and disease-specific and all-cause mortality should be routinely considered as main outcomes. Our overview suggests that even then, all-cause mortality may hardly ever be improved. One may argue that a reduction in disease-specific mortality may sometimes be beneficial even in the absence of a reduction in all-cause mortality. Such an inference would have to consider the relative perception of different types of death by patients (e.g. death by cancer vs death by other cause), and it may entail also some subjectivity. For diseases where mortality outcomes are potentially important but only in the very long term, one has to consider whether the use of other, intermediate outcomes and/or other quasi-experimental designs that may be performed relatively quickly with very large sample sizes (e.g. before and after the introduction of a test) are meaningful alternatives to very long-term RCTs or may add more bias and confusion in a field that has already seen many hot debates. Screening may still be highly effective (and thus justifiable) for a variety of other clinical outcomes, besides mortality. However, our overview suggests that expectations of major benefits in mortality from screening need to be cautiously tempered.
References
.
.
;
:
–
,
.
.
.
;
:
–
.
.
.
;
:
.
.
.
;
:
–
.
.
.
;
:
.
.
.
;
:
.
et al.
.
.
;
:
–
.
.
.
;
:
–
.
.
.
;
:
–
.
et al.
.
.
;
:
.
.
.
;
:
–
.
.
.
;
:
–
.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
.
.
;
:
–
.
.
.
;
(
):
–
.
,
.
.
;
:
–
.
.
.
;
:
–
.
.
.
;
:
–
.
.
.
;
:
–
.
.
.
;
(
):
–
.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
.
.
;
:
–
.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
III
et al.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
,
.
.
;
:
.
et al.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
.
.
;
:
–
.
et al.
.
.
;
:
.
et al.
.
.
;
:
–
.
.
.
;
:
.
et al.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
.
.
;
:
–
.
.
.
;
:
–
.
.
.
;
:
–
.
.
.
;
:
–
.
.
.
;
:
–
;
.
Jr
.
.
;
:
–
.
et al.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
,
.
.
;
:
.
. [
.]
:
–
.
.
.
;
:
–
.
.
.
;
:
.
.
.
;
:
.
.
.
;
:
–
.
.
.
;
:
–
.
.
.
;
:
–
.
.
.
;
:
–
.
.
.
;
:
.
.
.
;
:
.
.
.
;
:
.
.
.
;
:
–
.
.
.
;
:
–
.
.
.
;
(
):
–
.
.
;
:
–
.
.
.
;
:
–
.
.
.
;
:
–
.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
III
.
.
;
:
–
.
III
.
.
;
:
–
.
.
.
;
.
.
.
;
:
–
.
.
.
;
:
.
.
.
;
:
–
.
.
.
;
:
–
.
.
.
;
:
–
.
.
.
.
.
.
;
:
.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
.
.
;
:
.
.
.
;
(
):
.
.
.
;
:
–
.
.
.
;
:
–
.
.
.
;
:
.
,
et al.
.
.
;
:
–
.
et al.
.
.
;
:
.
et al.
.
.
;
:
–
.
.
.
;
:
–
.
.
.
;
:
–
.
.
.
;
:
.
et al.
.
.
;
:
–
.
.
.
;
:
–
;
.
III
et al.
.
.
;
:
–
.
et al.
.
.
;
:
–
.
et al.
.
.
;
:
.
.
.
;
:
–
.
.
.
;
:
–
.
.
;
:
–
.