Ilovepdf Merged-4
Ilovepdf Merged-4
Ilovepdf Merged-4
Los estudios de salud pública son muy atractivos para los medios
de comunicación por sus a menudo sorprendentes relaciones y su
facilidad de comprensión. Son también los que más se prestan a las
alarmas infundadas, a las asociaciones frágiles y a los desmentidos y
contradicciones. Como explica Alex Berezow en la web del American
Council on Science and Health, entidad nacida en 1978 para apoyar la
medicina basada en la evidencia y desterrar mitos y falsedades
científicos, “eso se debe a que la epidemiología es una ciencia inexacta
que se complica por una gran variabilidad en la calidad de datos que
produce, así como por su dependencia de métodos estadísticos
avanzados”. Para tratar de aclarar la fortaleza de los distintos estudios y
su grado de confianza, Berezow ha resumido la pirámide de la evidencia
elaborada por la Biblioteca de Investigación Médica de la Universidad
Estatal de Nueva York como guía rápida para estudiantes y
profesionales. En la base estarían las investigaciones in vitro, las
llevadas a cabo con animales. y las opiniones y análisis de expertos
en la materia. Y de lo más débil a lo más fuerte, estos son los diseños
epidemiológicos más comunes:
Hola gente.
En esta clase hablaremos sobre los límites de la evidencia.
Una importante discusión surgió sobre este aspecto en 2003, con una edición del British
Medical Journal. Los autores buscaron, en una revisión, estudios que evaluaran la
efectividad del uso de paracaídas en la prevención de traumatismos. Buscaron en la
literatura tratando de identificar ensayos clínicos aleatorios que compararan un grupo
saltando con paracaídas y otro sin paracaídas. Como era de esperar, no se encontró ningún
estudio de este tipo en la literatura.
La crítica es muy inteligente y plantea esta discusión sobre los límites de la evidencia.
¿Realmente no tenemos evidencia de la efectividad del uso de paracaídas, a pesar de no
haber sido probado en ensayos clínicos aleatorios? Si buscas informes de la Asociación
Estadounidense de Paracaidismo, encontrarás datos como el récord de dieciocho muertes
en dos millones de saltos en paracaídas. Ahora bien, a mí esto me basta para creer en el
efecto paracaídas y, si fuera necesario, lo utilizaría.
Este es sólo un ejemplo de situaciones en las que un ensayo clínico aleatorio no es posible
o, a menudo, no es factible. Otras situaciones pueden converger en algo similar. Por ejemplo,
en los casos de enfermedades raras, es poco probable que se cuente con muestras grandes,
de las que se esperaría que tuvieran poder estadístico y evaluaran el efecto de una
intervención. Pero habrá que tomar decisiones incluso cuando se realicen estos estudios
con muestras pequeñas.
Así es chicos, comprenda que a menudo tendrá que lidiar con la mejor evidencia disponible,
a pesar de no ser el que querrías.
¡Hasta luego!
En salud, al ser situaciones que muchas veces representan la pérdida de la vida o la pérdida
de calidad de vida, no aceptamos perder. Cuando nos enfrentamos a una situación de
enfermedad, ya sea con nosotros mismos o con un familiar, no aceptamos que
simplemente no existe cura disponible en este momento.
En otras áreas fuera de la atención médica, aceptamos con calma y racionalidad que la
tecnología aún no ha evolucionado hasta el punto que deseamos. Por ejemplo, si quiero
hacer un viaje a un país que está en un hemisferio diferente al que vivo, sé que necesito
planificación para poder comprar el billete de avión, quedarme el tiempo que sea necesario,
viajar en el avión, y luego Sí, llegar a ese hemisferio.
Si por ejemplo quisiera estar en Japón esta noche, para asistir a un evento en el que
realmente quiero participar, podría preguntar si ya existe una técnica de teletransportación,
haría una búsqueda en Internet y comprobaría. No, la única manera de viajar más rápido es
en avión y en este caso, para ir a Japón, necesitaría al menos 20 horas en el avión y esta
noche no puedo llegar de todos modos. Entonces puedo resignarme y aceptar que este es
el estado actual de la evolución tecnológica.
Cuando esta presión sale del nivel individual y llega a los sistemas de salud, el problema es
aún mayor. Esta presión por la necesidad de una cura, algo más moderno que resuelva el
problema, desvía el foco de la objetividad de esta decisión.
La decisión, que alguna vez podría haberse tomado basándose en evidencia científica, ahora
cobra un alto precio en las emociones de las personas que quieren una cura, que quieren
ese tratamiento.
Entonces, cuando tenemos esta carga, este peso de esperanza en medio de la toma de
decisiones, este proceso de toma de decisiones se vuelve mucho más difícil.
Como regla general, comenzamos a invertir recursos financieros en algo que aún no se ha
demostrado que funcione y dejamos de gastar en tecnologías que ya sabemos que
funcionan, ya que los recursos son limitados. Si decido adquirir una nueva tecnología, estoy
tomando recursos de algún otro ámbito. Por lo tanto, debemos tener enfoque y
transparencia para evaluar las tecnologías cuando se utilizan, ya sea a nivel individual o
colectivo.
Las herramientas que estamos aprendiendo aquí en este curso de salud basado en evidencia
son útiles en este proceso: para aportar mayor objetividad al proceso de toma de decisiones,
eliminando la desesperación y otras presiones emocionales que dificultan la toma de
decisiones con mayor claridad.
Mario Mella Sousa: Niveles de evidencia clínica y grados de recomendación
MELLA SOUSA, MARIO1; ZAMORA NAVAS, PLÁCIDO2; MELLA LABORDE, MARIO3; BALLESTER
ALFARO, JUAN JOSÉ4; UCEDA CARRASCOSA, PILAR5
1
Editor Jefe Revista SATO
2
Servicio Traumatología y Cirugía Ortopédica. Hospital U. Virgen de la Victoria, Málaga
3
Servicio de Cirugía General y del Aparato Digestivo. Hospital U. San Juan, Alicante.
4
Servicio Traumatología y Cirugía Ortopédica. Hospital U. Puerto Real, Cádiz.
5
Servicio Traumatología y Cirugía Ortopédica. Hospital U. Reina Sofía, Córdoba.
RESUMEN
Se presenta una puesta al día de los niveles de evidencia científica mencionando los diversos grados de reco-
mendación para pacientes asintomáticos, indicando qué procedimientos son los más adecuados y cuáles debían
ser evitados. De todos los sistemas descritos, se busca aquel que cumpla el principio de sencillez y utilidad.
Elegimos para nuestro medio la valoracion del Centre for Evidence-Based Medicine, Oxford (OCEBM). Esta
clasificación tiene la ventaja que nos asegura el conocimiento más relativo a cada escenario, por su alto grado
de especialización. Además tiene la prerrogativa de aclarar cómo afecta la falta de rigurosidad metodológica al
diseño de los estudios, disminuyendo su valoración no sólo en la gradación de la evidencia, sino también en
la fuerza de las recomendaciones.
ABSTRACT
An update of the levels of scientific evidence stating the varying degrees of recommendation for asymptomatic patients, indi-
cating which procedures are most appropriate and what should be avoided all the systems described, we seek one that meets
the principle of simplicity and utility. We chose for our setting the valuation of the Centre for Evidence-Based Medicine,
Oxford (OCEBM). This classification has the advantage that assures us the knowledge on each scenario, its high degree of
specialization. It also has the prerogative to clarify how it affects the lack of methodological rigor to the study design, reducing
its assessment not only in the grading of the evidence, but also on the strength of recommendations.
pena aclarar algunos conceptos que seguirán utilizándose que los diversos grupos de expertos (autores de clasi-
de aquí en adelante: ficaciones de la evidencia), han ido adquiriendo y que
Se define como diseño de investigación a los distintos han adecuado, paulatinamente, estos fundamentos a
tipos de estudios que con sus características metodológicas los diferentes escenarios y diseños. Debemos advertir
propias, permiten llevar a cabo una investigación clínica(5,8). entonces, que sólo las clasificaciones propuestas por
Como escenario, ámbito o entorno, al ambiente en el Sackett, National Institute for Health and Clinical
que se desarrolla la situación clínica que se está evaluan- Excellence (NICE) y el Oxford Centre for Evidence-
do; es decir: tratamiento, prevención, etiología, daño, Based Medicine (OCEBM), consideran otras áreas de
pronóstico e historia natural, diagnóstico diferencial, la investigación clínica además de la concerniente a
prevalencia, estudios económicos y análisis de decisión. tratamiento. De esta forma, NICE adiciona evaluación
Como niveles de evidencia, a herramientas, instru- de la evidencia para diagnóstico; mientras que Sackett
mentos y escalas que clasifican, jerarquizan y valoran considera cuatro grandes grupos temáticos: terapia, pre-
la evidencia disponible, de forma tal que en base a su vención, etiología y daño; pronóstico e historia natural;
utilización se pueda emitir juicios de recomendación. diagnóstico; y estudios económicos. OCEBM, que es
Como grados de recomendación a una forma de clasi- una modificación “complementaria” de la clasificación
ficación de la sugerencia de adoptar o no la adquisición de Sackett, incluye terapia, prevención, etiología y daño
o puesta en marcha de tecnologías sanitarias según el en un subgrupo; pronóstico e historia natural en otro;
rigor científico de cada tipo de diseño(4). diagnóstico en el siguiente; diagnóstico diferencial y
Dependiendo de los tipos de diseños de investigación estudios de prevalencia en otro; y estudios económicos
clínica utilizados, podemos observar diferentes niveles y análisis de decisión en otro.
o gradación de la calidad de estos según el escenario de A continuación se mencionan y describen las pro-
investigación clínica a la que se refiera. Por una parte, puestas de jerarquización de la evidencia más utilizada
llama la atención que las intervenciones terapéuticas sean en la actualidad (Tabla 1).
las más abordadas desde esta concepción, situación que
posiblemente no sea por azar, puesto que es un hecho CANADIAN TASK FORCE ON PREVENTIVE
que entre el 50% y el 60% de las publicaciones versan HEALTH CARE (CTFPHC)(2,12)
sobre el ámbito del tratamiento o los procedimientos Esta propuesta de clasificación de la evidencia busca
terapéuticos(9,10,11). No obstante ello, es deseable que generar recomendaciones de una manera práctica, adop-
todo el quehacer en salud sea analizado bajo la misma tando una posición binaria, “hágalo o no”, pero sólo en
perspectiva. Lo anterior se relaciona al grado de avance el ámbito de la prevención. Este grupo de estudio generó
CTFPHC X
SACKETT X X X X X X X
USPSTF X
OCEBM X X X X X X X X
SIGN X
NICE X X
su primer informe en el año 1979, en el cual se divulgó debe llevarse a cabo una maniobra o acción deter-
el análisis de la evidencia hasta esa fecha para 78 enferme- minada (se recomienda no hacer); la letra C, indica
dades, lo que permitió ordenar y producir planes de salud que la evidencia es “conflictiva”, o sea, que existe
para la población canadiense desde la perspectiva de “la contradicción. Y la letra I que indica insuficiencia
prevención”. La metodología de este grupo hace énfasis en calidad y cantidad de evidencia para establecer
en el tipo de diseño utilizado y la calidad de los estudios una recomendación (Tabla 2).
publicados, basándose finalmente en tres elementos claves: t 2. Niveles de evidencia clasificados según diseño de
t 1. Un orden para los grados de recomendación, estudio de I a III, disminuyendo en calidad según
establecido por letras del abecedario donde, las letra se acrecienta numéricamente. Para el número II se
A y B indican que existe evidencia para ejercer una subdivide en números arábigos del 1 al 3 (Tabla 3).
acción (se recomienda hacer); D y E indican que no t 3. Niveles de evidencia clasificados según la validez
Grado de
Interpretación
recomendación
A Existe buena evidencia para recomendar la intervención clínica de prevención.
B Existe moderada evidencia para recomendar la intervención clínica de prevención.
Niveles de
Interpretación
evidencia
I Evidencia a partir de EC con asignación aleatoria.
II-1 Evidencia a partir de EC sin asignación aleatoria.
Evidencia a partir de estudios de cohortes y casos y controles, preferiblemente
II-2
realizados por más de un centro o grupo de investigación.
Evidencia a partir de comparaciones en el tiempo o entre sitios, con o sin la
II-3 intervención; podrían incluirse resultados espectaculares provenientes de estudios sin
asignación aleatoria.
Opinión de expertos, basados en la experiencia clínica; estudios descriptivos o informes
III
de comités de expertos.
interna o calidad metodológica del estudio, en buena, No contempla otro tipo de áreas de investigación
moderada e insuficiente (Tabla 4). como tratamiento, etiología, daño, pronóstico, etc.
Como todo sistema de clasificación, este presenta
algunas debilidades que se mencionan a continuación: CLASIFICACIÓN DE LA EVIDENCIA
No abarca toda la dimensionalidad de la proble- SEGÚN SACKETT(13)
mática de la “prevención”, respecto a las condiciones Esta sistematización propuesta por el epidemiólogo David
particulares de quienes son sujeto de la aplicación de L. Sackett (la que se emplea generalmente), jerarquiza
medidas preventivas. la evidencia en niveles que van del 1 a 5; siendo el nivel
En su análisis no se incorpora la evaluación del aspecto 1 la “mejor evidencia” y el nivel 5 la “peor, la más mala
financiero para la disponibilidad de las intervenciones o la menos buena”, según como se quiera leer (Tabla 5).
preventivas. Ésta fue la primera propuesta que consideró otros
La propuesta sólo se basó en población canadiense, escenarios clínicos o ámbitos de la práctica clínica
por ende, el uso de las recomendaciones sólo puede diferentes de la prevención. Incorporó los análisis
ser extrapolada a poblaciones similares a ésta; por ello, económicos, el diagnóstico y el pronóstico.
esta propuesta tiene un inconveniente relacionado con Hasta hoy, ha sido ampliamente utilizada por diferentes
su validez externa que ha de ser valorado al momento grupos científicos. A cada ámbito o escenario clínico
de pretender aplicarla en otros escenarios, pues de lo le otorga el diseño de estudio más apropiado para la
contrario se corre el riesgo de incurrir en esfuerzos elaboración de las recomendaciones. Así, en el escenario
económicos con resultados erráticos. de terapia, los diseños más puntuados corresponden
No contempla la relación del paciente, sus expecta- a las revisiones sistemáticas (RS) de ensayos clínicos
tivas y su medio, para establecer las recomendaciones. controlados con asignación aleatoria (EC); en escenarios
Puede inducir a errores al momento de valorar las de pronóstico, los estudios de cohortes; en escenarios
recomendaciones para su puesta en práctica en los de diagnóstico, los estudios de pruebas diagnósticas
sistemas estatales de salud, esto quiere decir que una con estándar de referencia, etc.
recomendación B puede ser menospreciada pudiendo Presenta desventajas que son comunes a todas las
tener un beneficio importante para la población. propuestas existentes, como que puede llevar a des-
Niveles de
Interpretación
evidencia
Un estudio (incluyendo la RS y el meta-análisis) que cumple los criterios específicos de
Buena
estudio bien diseñado.
Un estudio (incluyendo la RS y el meta-análisis) que no cumple (o no está claro que
Moderada cumpla) al menos uno de los criterios específicos de estudio bien diseñado, aunque no
tiene “defectos fatales”.
preciar recomendaciones que se basan en evidencias que dará «la mejor evidencia disponible actual».
inferiores a las de nivel 1; por ejemplo un estudio de Esta clasificación fue pionera y ha servido de base
nivel de evidencia 4, aún cuando se trate de un artículo para el desarrollo de clasificaciones más completas,
cuyo aporte sea novedoso. No obstante, los autores son como la propuesta por el OCEBM(14).
enfáticos en que lo que debe valorarse es «la mejor evi-
dencia disponible actual»; pues «lo actual puede variar U.S. PREVENTIVE SERVICES TASK FORCE
en el día a día»; y de este modo puede ocurrir que ante (USPSTF)(15)
determinadas situaciones «la mejor evidencia disponible Este grupo de expertos jerarquizó y estableció la fuerza
actual» sea una serie de casos y no un EC; y dos meses de sus recomendaciones a partir de la calidad de la evi-
después, aparezca un estudio de cohorte prospectivo dencia y del beneficio neto; es decir, beneficios menos
Terapia,
Recomen- Estudios
Nivel prevención, Pronóstico Diagnóstico
dación económicos
etiología y daño
RS con homogeneidad
RS con
y Meta-análisis de RS de estudios de diagnóstico RS de estudios
1a homogeneidad y
estudios de cohortes nivel 1 económicos de nivel 1
Meta-análisis de EC
concurrente
A Estudio individual de Comparación independiente y Análisis que compara
EC individuales cohorte concurrente enmascarada de un espectro de los desenlaces posibles,
1b con iintervalo de con seguimiento pacientes consecutivos sometidos a contra una medida
confianza estrecho superior al 80% de la la prueba diagnóstica y al estándar de costos. Incluye un
cohorte de referencia análisis de sensibilidad
RS con RS de estudios
RS de cohortes RS de estudios diagnósticos de
2a homogeneidad de económicos de nivel
históricas nivel mayor a 1
estudio de cohortes mayor a 1
Comparación independiente Comparación de un
Estudio de cohortes enmascarada de pacientes no número limitado de
Estudio individual de
2b individual. EC de baja consecutivos, sometidos a la desenlaces contra una
cohortes históricas
calidad prueba diagnóstica y al estándar medida de costo. Incluye
B de referencia análisis de sensibilidad
RS con homoge-
3a neidad de estudios de
casos y controles
Análisis sin una medida
Estudios no consecutivos o
Estudio de casos y exacta de costo, pero
3b carentes de un estándar de
controles individuales incluye análisis de
referencia
sensibilidad
Series de casos.
Series de casos. Estudios de casos y controles sin
Estudio de cohortes y Estudio sin análisis de
C 4 Estudios de cohortes la aplicación de un estándar de
casos y controles de sensibilidad
de mala calidad referencia
mala calidad
Opinión de expertos Opinión de expertos
Opinión de expertos sin Opinión de expertos
sin evaluación crítica sin evaluación crítica
evaluación crítica explícita, sin evaluación crítica
D 5 explícita, o basada explícita, o basada
o basada en fisiología, o en explícita, o basada en
en fisiología, o en en fisiología, o en
investigación teórica teoría económica
investigación teórica investigación teórica
Por homogeneidad se entiende que una RS que está libre de variaciones (heterogeneidad) en las direcciones o grados de
resultados entre los estudios individuales.
Tabla 6: Recomendaciones a partir de calidad de evidencia para exámenes periódicos de salud (USPSTF)
Recomen-
Interpretación
dación
La USPSTF recomienda claramente que los clínicos proporcionen la intervención a los pacientes que
A cumplan los criterios. La USPSTF ha encontrado buena evidencia de que la medida mejora de manera
importante los resultados en salud y concluye que los beneficios superan ampliamente a los riesgos.
La USPSTF recomienda que los clínicos proporcionen la intervención a los pacientes. La USPSTF ha
B encontrado evidencia moderada de que la medida mejora de manera importante los resultados en salud y
concluye que los beneficios superan a los riesgos.
La USPSTF recomienda en contra que los clínicos proporcionen la intervención a los pacientes
D asintomáticos. La USPSTF ha encontrado al menos evidencia moderada de que la medida es ineficaz o
que los riesgos superan a los beneficios.
La USPSTF concluye que la evidencia es insuficiente para recomendar a favor o en contra de la intervención. No
I existe evidencia de que la intervención es ineficaz, o de calidad insuficiente, o conflictiva y que el balance entre
los riesgos y los beneficios no se puede determinar.
Tabla 7: Niveles de evidencia e interpretación de estos para exámenes periódicos de salud (USPSTF)
Evidencia Interpretación
La evidencia incluye resultados consistentes a partir de estudios bien diseñados y realizados en poblaciones
Buena representativas que directamente evalúan efectos sobre resultados de salud.
La evidencia es suficiente para determinar efectos sobre resultados de salud, pero la fuerza de la evidencia
Moderada es limitada por el número, la calidad o la consistencia de los estudios individuales, la generalización a la
práctica rutinaria, o la naturaleza indirecta de la evidencia sobre los resultados de salud.
La evidencia es insuficiente para evaluar los efectos sobre los resultados de salud debido al número limitado
Insuficiente o al poder de estudios, defectos importantes en su diseño o realización, inconsistencias en la secuencia de
la evidencia, o falta de información sobre resultados de salud importantes.
Diagnóstico
Tratamiento, Estudios
Grado de Nivel diferencial
prevención, Pronóstico e historia económicos
recomen- de evi- Diagnóstico y estudios
etiología y natural y análisis de
dación dencia de
daño decisión
prevalencia
1a RS con homo- RS de estudios de cohor- RS de estudios diagnósticos RS con homo- RS con homogenei-
geneidad de EC tes, con homogeneidad, o de nivel 1 (alta calidad), con geneidad dad de estudios eco-
controlados con sea que incluya estudios homogeneidad, o sea que incluya de estudios nómicos de nivel 1
asignación alea- con resultados compara- estudios con resultados compara- de cohortes
toria bles, en la misma dirección bles y en la misma dirección y en prospectivas
y validadas en diferentes diferentes centros clínicos
poblaciones
A 1b EC individual con Estudios de cohortes Estudios de cohortes que validen Estudio de Análisis basado en
intervalo de con- individuales con un segui- la calidad de una prueba especí- cohortes costes o alterna-
fianza estrecho miento mayor de 80% de fica, con estándar de referencia prospectiva tivas clínicamente
la cohorte y validadas en adecuado (independientes de la con buen sensibles; RS de la
una sola población prueba) o a partir de algoritmos seguimiento evidencia; e inclu-
de estimación del pronóstico o de yendo análisis de la
categorización del diagnóstico o sensibilidad
probado en un centro clínico
1c Eficiencia demos- Resultados a partir de la Pruebas diagnósticas con especi- Series de Análisis absoluto en
trada por la efectividad y no de su efi- ficidad tan alta que un resultado casos todos o términos de mayor
práctica clínica. cacia demostrada a través positivo confirma el diagnóstico ninguno valor o peor valor
Considera cuando de un estudio de cohortes. y con sensibilidad tan alta que
algunos pacientes Series de casos todos o un resultado negativo descarta el
mueren antes de ninguno diagnóstico
ser evaluados
2b Estudio de cohortes Estudio de cohorte retros- Estudios exploratorios que, a Estudios de Análisis basados en
individual con pectiva o seguimiento de través de una regresion logística, cohortes costes o alternativas
seguimiento inferior controles no tratados en un determinan factores significativos, y retrospectivas o clínicamente sensibles;
a 80% (incluye EC EC, o GPC no validadas validados con estándar de referen- de seguimiento limitado a revisión de
de baja calidad) cia adecuado (independientes de insuficiente la evidencia; e inclu-
la prueba) yendo un análisis de
sensibilidad
2c Estudios ecológicos Investigación de resultados Estudios Auditorías o estudios
o de resultados en en salud ecológicos de resultados en salud
salud
B 3a RS de estudios de RS con homogeneidad de estudios RS con homo- RS con homogeneidad
casos y controles, 3b y de mejor calidad geneidad de de estudios 3b y
con homogeneidad estudios 3b y mejores
mejores
3b Estudios de casos Comparación enmascarada y obje- Estudio no consecutivo
y controles indivi- tiva de un espectro de una cohorte de cohorte, o análisis
duales de pacientes que podría normal- muy limitado de la
mente ser examinado trastorno, población basado en
pero el estándar de referncia no pocas alternativas o
se aplica a todos los pacientes del costes, estimaciones
estudio. Estudios no consecutivos o de datos de mala cali-
sin la aplicación de un estándar de dad, pero incluyendo
referencia análisis de la sensibi-
lidad que incorporan
variaciones clínicamen-
te sensibles
Contiuación de Tabla 8
Diagnóstico
Tratamiento, Estudios
Grado de Nivel diferencial
prevención, Pronóstico e historia económicos
recomen- de evi- Diagnóstico y estudios
etiología y natural y análisis de
dación dencia de
daño decisión
prevalencia
4 Serie de casos, Serie de casos y estudios de Estudio de casos y controles, con Series de casos Análisis sin análisis de
estudios de cohor- cohortes de pronóstico de escasos o sin estándares de refe- o estándares sensibilidad
C tes, y de casos y poca calidad rencia independiente de referencia
controles de baja obsoletos
calidad
5 Opinión de expertos Opinión de expertos sin Opinión de expertos sin evaluación Opinión de Opinión de expertos
sin evaluación evaluación crítica explícita, crítica explícita, ni basada en expertos sin sin evaluación crítica o
crítica explícita, ni ni basada en fisiología, ni fisiología, ni en trabajo de inves- evaluación basado en teoría eco-
basada en fisiolo- en trabajo de investigación tigación juicioso ni en “principios crítica explícita, nómica o en “principios
gía, ni en trabajo de juicioso ni en “principios fundamentales” ni basada en fundamentales”
D investigación juicio- fundamentales” fisiología, ni
so ni en “principios en trabajo de
fundamentales” investigación
juicioso ni en
“principios fun-
damentales”
GPC: Guía de práctica clínica. Estudios con homogeneidad: se refiere a que incluya estudios con resultados comparables y en
la misma dirección.
Tabla 9: Niveles de evidencia para estudio de tratamiento con análisis cuantitativo (SIGN)
Nivel de
Interpretación
evidencia
1++ Meta-análisis de alta calidad, RS de EC o EC de alta calidad con muy poco riesgo de sesgo
Estudios de cohortes o de casos y controles bien realizados con bajo riesgo de sesgo y con una moderada
2+ probabilidad de establecer una relación causal
Estudios de cohortes o de casos y controles con alto riesgo de sesgo y riesgo significativo de que la
2– relación no sea causal
4 Opinión de expertos
Los estudios clasificados como 1– y 2– no deben usarse en el proceso de elaboración de recomendaciones por su alto
potencial de sesgo.
Tabla 10: Grados de recomendación para estudios de tratamiento con análisis cuantitativo (SIGN)
Grados de
recomen- Interpretación
dación
Al menos un meta-análisis, RS o EC clasificado como 1++ y directamente aplicable a la población diana
A de la guía; o un volumen de evidencia científica compuesto por estudios clasificados como 1+ y con gran
consistencia entre ellos
Un volumen de evidencia científica compuesta por estudios clasificados como 2++, directamente aplicable
B a la población diana de la guía y que demuestran gran consistencia entre ellos; o evidencia científica
extrapolada desde estudios clasificados como 1++ o 1+
Un volumen de evidencia científica compuesta por estudios clasificados como 2+ directamente aplicables
C a la población diana de la guía y que demuestran gran consistencia entre ellos; o evidencia científica
extrapolada desde estudios clasificados como 2++
D Evidencia científica de nivel 3 o 4; o evidencia científica extrapolada desde estudios clasificados como 2+
Nivel de
Interpretación
evidencia
Meta-análisis de gran calidad, RS de EC con asignación aleatoria o EC con asignación aleatoria con muy
1++ bajo riesgo de sesgos
Meta-análisis de gran calidad, RS de EC con asignación aleatoria o EC con asignación aleatoria con bajo
1+ riesgo de sesgos
Meta-análisis de gran calidad, RS de EC con asignación aleatoria o EC con asignación aleatoria con alto
1– riesgo de sesgos*
Estudios de cohortes o de casos-controles bien realizados, con bajo riesgo de confusión, sesgos o azar y
2+ una moderada probabilidad de que la relación sea causal
4 Opinión de expertos
*Los estudios con un nivel de evidencia “–” no deberían utilizarse como base para elaborar una recomendación. Adaptado de
Scottish Intercollegiate Guidelines Network.
fica por ordenar y valorar de una manera exhaustiva el para que el conocimiento más válido sea conseguido de
conocimiento, siendo uno de los objetivos primordiales el manera expedita por el clínico. Paradójicamente, el desa-
contestar preguntas clínicas surgidas del quehacer médico rrollo de múltiples propuestas de clasificar la evidencia y
diario. En principio, la idea principal fue dar directrices formular recomendaciones y el lenguaje epidemiológico
Tabla 12: Grados de recomendación para estudios de tratamiento con análisis cuantitativo (SIGN)
Grados de
recomen- Interpretación
dación
Al menos un meta-análisis o un EC con asignación aleatoria categorizados como 1++, que sea
directamente aplicable a la población diana; o una RS o un EC con asignación aleatoria o un volumen de
A evidencia con estudios categorizados como 1+, que sea directamente aplicable a la población diana y
demuestre consistencia de los resultados. Evidencia a partir de la apreciación de NICE
Un volumen de evidencia que incluya estudios calificados de 2++, que sean directamente aplicables a
B la población objeto y que demuestren globalmente consistencia de los resultados, o extrapolación de
estudios calificados como 1++ o 1+
Un volumen de evidencia que incluya estudios calificados de 2+, que sean directamente aplicables a
C la población objeto y que demuestren globalmente consistencia de los resultados, o extrapolación de
estudios calificados como 2++
D (DPP): Un buen punto de práctica (BPP) es una recomendación para la mejor práctica basado en la experiencia del grupo
que elabora la guía. IP: Recomendación a partir del manual para procedimientos de intervención de NICE.
Grados de
recomen- Interpretación
dación
Ia RS con homogeneidad* de estudios de nivel 1+
Ib Estudios de nivel 1+
Consenso, informes de comités de expertos u opiniones y/o experiencia clínica sin valoración crítica
IV explícita; o en base a la psicología, difusión de la investigación o “principios básicos”
* Homogeneidad significa que no hay variaciones o estas son pequeñas en la dirección y grado de los resultados entre los
estudios individuales que incluye la RS. + Estudios de nivel 1 son aquellos que utilizan una comparación enmascarada de la
prueba con un estándar de referencia validado, en una muestra de pacientes que refleja a la población a quien se aplicaría
la prueba. ++ Estudios nivel 2 son aquellos que presentan una sola de esta características: población reducida (la muestra
no refleja las características de la población a la que se le va a aplicar la prueba; utilizan un estándar de referencia pobre
(definido como aquel donde la “prueba” es incluida en la “referencia”, o aquel en que las “pruebas” afectan a la “referencia”;
la comparación entre la prueba y la referencia no está enmascarada; o estudios de casos y controles. && Estudios de nivel 3
son aquellos que presentan al menos dos o tres de las características señaladas anteriormente.
empleado, ha llevado consigo confusión e incompren- Por otro lado, la enseñanza de las ciencias médicas
sión por parte de los clínicos, quienes ven en esta gran no incentiva la validación de instrumentos extranje-
variedad de opciones más conflictos que ayuda al desa- ros para la valoración de la lectura crítica, ni menos
rrollo de la práctica profesional. En este artículo hemos la creación de los propios. Así, nos vemos obligados
presentado y desarrollado de forma somera algunas de no sólo a traducir el lenguaje epidemiológico desde el
las clasificaciones existentes, utilizando como criterio de inglés, sino que también a adaptar e implementar esas
selección, el nivel de utilización de cada cual, el que se traducciones a las problemáticas sanitarias nacionales
asocia directamente con el grado de aceptación de ellas e incluso regionales.
por parte de la comunidad científica. Es cierto que el análisis de la evidencia incluye, la adap-
El problema de la jerarquización de la evidencia tación a diferentes realidades; pero, complicando un poco
también ha planteado desafíos a los comités editoriales más la contingencia ¿qué repercusiones podemos tener
de las revistas biomédicas respecto de cómo estanda- en el ámbito legal? En la actualidad vamos observando
rizar la valoración de la evidencia, para la aceptación cómo la lex artis ya no se basa en opiniones de expertos,
de trabajos científicos. Entendemos la necesidad de cada día se hace más próxima a la MBE, lo cual implica
simplificar y aunar criterios, incluso sería deseable la contemplación de recomendaciones y protocolos en
que las recomendaciones que nacen de la valoración el momento de fallos judiciales. Necesitamos establecer
de la evidencia tuvieran un carácter universal, pero el recomendaciones basadas en estudios propios. No pode-
generalizar también trae consigo algunos inconvenien- mos pretender que las recomendaciones establecidas por
tes. ¿Por qué hay políticas de salud que fracasan aún científicos con distinto grado de desarrollo tecnológico y
cuando han contemplado en su elaboración la evidencia de habilidades, puedan ser entendidas por quienes ejecutan
disponible? Una de las tantas razones es que algunas las leyes sin el riesgo de creerlas como determinantes.
recomendaciones basadas en la evidencia pueden no ser En nuestro entorno, nos preguntamos: ¿Cuál de
aplicables a nuestro medio. De esta forma, al momento las propuestas de clasificación de la evidencia es más
de acercarnos a la evidencia es necesario considerar la adecuada para nosotros? Desde nuestro punto de vista,
existencia de características propias de nuestra región, destacamos la clasificación ofrecida por OCEBM(14) sobre
tanto poblacionales, culturales, económicas, tecnológicas las otras, por ser capaz de asignar una valoración más
como ambientales; es decir, darle relevancia al concepto completa de la evidencia según cada tipo de escenario.
de validez externa y valorar nuestra realidad. Sin embargo, es absolutamente imprescindible entender
que las recomendaciones, son consejos desde la más
alta perspectiva científica, no importa qué propuesta
usemos sino cómo las empleemos, qué juicios hagamos
Tabla 14: Grados de recomendación para y cómo interrelacionamos la evidencia con los factores
estudios diagnóstico (NICE) propios de nuestro entorno.
De todos modos no hay que olvidar que el ejercicio
Grados de
de la medicina y la teoría medica, siempre se han basado
recomen- Interpretación
dación en la observación y en lo que hoy llamamos “evidencia”.
Hace 2.500 años Hipócrates(19) escribió: “[...] No es posi-
A (EPD) Estudios con un nivel de evidencia Ia o Ib
ble sacar provecho de lo que se cumple sólo de palabra,
B (EPD) Estudios con un nivel de evidencia II
sino de lo que llega a la demostración de la realidad...
C (EPD) Estudios con un nivel de evidencia III Por ello es menester atenerse por completo a los hechos
D (EPD) Estudios con un nivel de evidencia IV y ocuparse de ellos, y no con la mayor brevedad, si es
que se ha de poseer la actitud holgada e infalible que
* EPD: estudios de pruebas diagnósticas. titulamos, precisamente, hábito médico”.
BIBLIOGRAFÍA
1. Sackett Dl, Rosenberg WMC, Gary JAM, Haynes RB, Richardson WS. Evidence based medicine: what is
it and what it isn´t. BMJ 1996;312:71-2.
2. Canadian Task Force on Preventive Health Care. New grades for recommendations from the Canadian Task
Force on Preventive Health Care. CMAJ 2003; 169: 207-220
3. Upshur RE. Are all evidence-based practices alike? Problems in the ranking of evidence. CMAJ 2003; 169:
672-73
4. Evidence-based medicine Working Group. Evidence-based medicine. A new approach to teaching the practice
of medicine. JAMA 1992; 268: 2420-25.
5. Manterola C, Zavando D. Como interpretar los “Niveles de Evidencia” en los diferentes escenarios clínicos.
Rev Chil Cir 2009; vol 61, Nº 6: 582-95.
6. Sackett DL, Richardson WS, Rosenberg W, Haynes RB. Medicina Basada en la Evidencia. Como ejercer y
enseñar la MBE. Churchill Livingstone España. Madrid.1997.
7. West S, King V, Carey TS, Lohr KN, McKoy N, Sutton SF, et al. Systems to Rate the Strength of Scientific
Evidence. Health Services/Technology Assessment Text, National Library of Medicine. AHRQ Publication
No. 02-E016, 2002. Disponible en: http://www.ncbi.nlm.nih.gov/books/bv.fcgi?rid=hstat1.chapter.70996.
8. Hulley SB, Cummings SR, Browner WS, Grady DG, Newman TB. Diseño de Investigaciónes clínicas.
Traduccion de Mª Jesus del Sol Jaquotot. 3ª ed. Lippincott Williams and Wilkins. Barcelona, 2008.
9. Guyatt GH, Sackett DL, Sinclair JC, Hayward R, Cook DJ, Cook RJ. Users’ Guides to the Medical Litera-
ture: IX. A method for grading health care recommendations. JAMA 1995;274:1800-04.
10. Laupacis A, Sackett DL, Roberts RS. Assessment of clinically useful measures of the consequences of treatment.
N Engl J Med 1988; 318: 1728-33.
11. Cook DJ, Guyatt GH, Laupacis A, Sackett DL. Rules of evidence and clinical recommendations on the use
of antithrombotic agents. Chest 1992; 102 Supl 305-11.
12. Task Force Revitalization Process (CTFPHC). Evidence-Based Clinical Prevention, Updated August 17,
2005.Disponible en: http://www.ctfphc.org.
13. Sackett DL, Wennberg JE. Choosing the best research design for each question. BMJ 1997; 315(7123):
1636-40.
14. Oxford Centre for Evidence-based Medicine (CEBM). Centre for Evidence Based Medicine - Levels of
Evidence (March 2009). Disponible en: http://www.cebm.net/index.aspx?o=1025
15. Task Force Ratings. Guide to Clinical Preventive Services, Second Edition. Disponible: http://www.odphp.
osophs.dhhs.gov/pubs/guidecps/PDF/APPA.PDF.
16. Harbour R, Miller J. A new system for grading recommendations in evidence based guidelines. BMJ 2001;
323: 334-336
17. Scottish Intercollegiate Guidelines Network (SIGN). SIGN 50, A guideline developer’s handbook, revisited
edition 2008. Disponible en: http://www.sign.ac.uk/pdf/sign50.pdf
18. National Institute for Health and Clinical Excellence (NICE). The guidelines manual 2009. Disponible en:
http://www.nice.org.uk/media/5F2/44/The_guidelines_manual_2009.
19. Tratados Hipocráticos. Preceptos (2). Madrid: Editorial Gredos; 1990. Tomo I. p. 310-1.
¿Crees que cada estudio que se publica tiene la misma importancia clínica? ¿Has oído hablar
de la medicina basada en la evidencia? Si no sabes responder o quieres ampliar tus
conocimientos, sigue leyendo.
En la medicina basada en la evidencia, existen niveles de evidencia según el tipo de fuente del
que provenga. Asimismo, dentro de los estudios clínicos, la calidad de la evidencia varía
según el diseño del estudio.
¿Qué nivel de evidencia aportan las
diferentes fuentes bibliográficas?
En otro artículo te hemos explicado las fuentes bibliográficas que existen. El nivel de evidencia
de estas fuentes se suele representar con una pirámide:
Estudios preclínicos
En los estudios preclínicos se evalúa el efecto de una intervención en modelos celulares o
animales. Aportan menos evidencia que los estudios clínicos y tienen menos aplicabilidad para
los pacientes. Por lo tanto, los resultados tienen que confirmarse en estudios clínicos.
Sistema GRADE
Para evaluar el nivel de evidencia se pueden usar también sistemas de graduación de la
calidad de la evidencia, como el GRADE(del inglés Grading of Recommendations,
Assessment, Development and Evaluation).
Conclusiones y recomendaciones
Los metanálisis de ensayos clínicos aleatorizados aportan el mayor nivel de evidencia, aunque
siempre dependerá de qué estudios incluyan. Le siguen las revisiones sistemáticas y las guías
clínicas. Por su parte, los estudios clínicos aleatorizados proporcionan más evidencia que los
estudios observacionales.
Referencias
• Aguayo-Albasini JL, Flores-Pastor B, Soria-Aledo V. Sistema GRADE: clasificación
de la calidad de la evidencia y graduación de la fuerza de la recomendación.
Cirugía Española. 2014; 92 (2): 82-88.
• Diario Médico. La pirámide de evidencia científica. 2017. [Consultado en mayo
2019].
• Por una Medicina Interna de Alto Valor. Aplicando la Medicina Basada en la
Evidencia a la práctica clínica. 2018. [Consultado en mayo 2019].
• Características del sistema GRADE. 2017. [Consultado en mayo 2019].