Ilovepdf Merged-4

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 25

Diario Médico. La pirámide de evidencia científica. 2017.

JOSÉ RAMÓN ZÁRATE


La pirámide de la evidencia científica

Pirámide de evidencia científica


Actualizado Sáb, 15/04/2017 - 10:00

Los estudios de salud pública son muy atractivos para los medios
de comunicación por sus a menudo sorprendentes relaciones y su
facilidad de comprensión. Son también los que más se prestan a las
alarmas infundadas, a las asociaciones frágiles y a los desmentidos y
contradicciones. Como explica Alex Berezow en la web del American
Council on Science and Health, entidad nacida en 1978 para apoyar la
medicina basada en la evidencia y desterrar mitos y falsedades
científicos, “eso se debe a que la epidemiología es una ciencia inexacta
que se complica por una gran variabilidad en la calidad de datos que
produce, así como por su dependencia de métodos estadísticos
avanzados”. Para tratar de aclarar la fortaleza de los distintos estudios y
su grado de confianza, Berezow ha resumido la pirámide de la evidencia
elaborada por la Biblioteca de Investigación Médica de la Universidad
Estatal de Nueva York como guía rápida para estudiantes y
profesionales. En la base estarían las investigaciones in vitro, las
llevadas a cabo con animales. y las opiniones y análisis de expertos
en la materia. Y de lo más débil a lo más fuerte, estos son los diseños
epidemiológicos más comunes:

Un caso (case report). Un paciente con una enfermedad inusual. No


debe confundirse con una rareza o extravagancia, más difíciles de
encontrar, sino con un cuadro quizá de diagnóstico complicado y que
proporciona una lección para otros casos parecidos. Las series de
casos similares tienen lógicamente más fuerza científica.

Estudio transversal (cross-sectional study). Es una instantánea en el


tiempo. Responde a la pregunta ¿cuántas personas tienen una
característica particular (como la enfermedad X) en este momento? El
diseño del estudio no proporciona información sobre riesgo o causa.

Estudio ecológico. Examina la enfermedad en una población. Un buen


ejemplo es un estudio que utiliza un diagrama de dispersión para
correlacionar el consumo promedio de alcohol y la tasa de muertes
por enfermedad coronaria en varios países. Si bien proporciona
indicios para futuras investigaciones, no aporta datos sobre individuos, es
decir, no mide la exposición individual de una persona y el resultado de la
enfermedad. Este diseño de estudio podría ser fácilmente confundido por
variables externas.

Estudio de casos y controles. Compara a las personas que padecen


una enfermedad concreta con un grupo similar de personas sanas. Este
tipo de estudio es más útil para las enfermedades raras. Sin
embargo, los estudios de casos y controles son célebres por producir
falsos positivos, pues las personas con una enfermedad rara es más
probable que recuerden sus vidas de manera diferente que las sanas,
fenómeno llamado “sesgo de recuerdo”. En cáncer cerebral, por
ejemplo, muchos afectados informan de haber usado el móvil en el
lado de su cabeza donde desarrollaron el cáncer, sin importar si es
verdad o no.

Estudio de cohortes. Es el mejor estudio observacional posible. Las


personas se comparan en función de su nivel de exposición a un factor
de riesgo particular. Por ejemplo, fumadores con no fumadores para
determinar qué grupo tiene más probabilidades de desarrollar cáncer
diez o veinte años después. A pesar de que las variables de confusión
pueden dificultar la determinación de una causa, suele dar una
medida fiable del riesgo.

Ensayo controlado aleatorio (randomized controlled trial). Es el


estándar de oro en epidemiología. Puede determinar la causa y el
riesgo. Sin embargo, solo es ético realizarlo para determinar si las
intervenciones médicas son seguras y eficaces. No sería muy honesto
forzar a un grupo de personas a ver si desarrollan diabetes.

Revisión sistemática y metanálisis. La revisión sistemática examina


todas las pruebas relevantes publicadas sobre un tema dado, y el
metanálisis combina conjuntos de datos de estudios más pequeños en
un solo conjunto de datos grande. Debido a que los estudios más
pequeños a menudo producen resultados contradictorios, el
objetivo de la revisión y el metanálisis es llegar a un consenso.
LIMITES DE LA EVIDENCIA

Hola gente.
En esta clase hablaremos sobre los límites de la evidencia.

Tenga en cuenta que, a lo largo de su solicitud, en atención médica basada en evidencia,


también tendrá que lidiar con pruebas limitadas. No siempre serán la evidencia ideal que
esperaría para tomar una decisión. Sin embargo, deberá tomar esta decisión y desarrollar
recomendaciones, incluso si la evidencia disponible no es exactamente lo que le gustaría.

Una importante discusión surgió sobre este aspecto en 2003, con una edición del British
Medical Journal. Los autores buscaron, en una revisión, estudios que evaluaran la
efectividad del uso de paracaídas en la prevención de traumatismos. Buscaron en la
literatura tratando de identificar ensayos clínicos aleatorios que compararan un grupo
saltando con paracaídas y otro sin paracaídas. Como era de esperar, no se encontró ningún
estudio de este tipo en la literatura.

¿Cuál es la conclusión de los autores?


Ahora bien, si uno cree radicalmente que todas las intervenciones sanitarias deben ser
siempre basándose en la evidencia de ensayos clínicos aleatorios, se debe abolir el uso de
paracaídas, ya que no hay evidencia de su efectividad. Los autores sugieren además que las
personas que creen radicalmente en esta posición, deberían ser voluntarios para ensayos
clínicos aleatorios de esta manera.

La crítica es muy inteligente y plantea esta discusión sobre los límites de la evidencia.
¿Realmente no tenemos evidencia de la efectividad del uso de paracaídas, a pesar de no
haber sido probado en ensayos clínicos aleatorios? Si buscas informes de la Asociación
Estadounidense de Paracaidismo, encontrarás datos como el récord de dieciocho muertes
en dos millones de saltos en paracaídas. Ahora bien, a mí esto me basta para creer en el
efecto paracaídas y, si fuera necesario, lo utilizaría.

Este es sólo un ejemplo de situaciones en las que un ensayo clínico aleatorio no es posible
o, a menudo, no es factible. Otras situaciones pueden converger en algo similar. Por ejemplo,
en los casos de enfermedades raras, es poco probable que se cuente con muestras grandes,
de las que se esperaría que tuvieran poder estadístico y evaluaran el efecto de una
intervención. Pero habrá que tomar decisiones incluso cuando se realicen estos estudios
con muestras pequeñas.

Las enfermedades crónicas comúnmente requieren de un largo período de seguimiento


para que puedas observar los resultados de mortalidad, entre otros puntos que te
interesarían. Es difícil tener siempre disponible este ensayo clínico con un seguimiento
prolongado y es posible que deba utilizar otros resultados para tomar una decisión.
La realización de grandes ensayos clínicos aleatorios, con muestras de gran tamaño y
tiempos de seguimiento prolongados, requiere una cantidad sustancial de recursos, tanto
humanos como financieros. Y esto comúnmente estará asociado al patrocinio por parte del
propio fabricante, es decir, ten en cuenta que te encontrarás con situaciones de conflicto de
intereses.

También te encontrarás con situaciones de desinterés, intervenciones que ya no aportarán


tantos beneficios a la industria farmacéutica; por ejemplo, ya no se suelen estudiar
mediante ensayos clínicos aleatorios, a pesar de tener un efecto potencial. Tendrás que
tomar decisiones incluso cuando tengas estudios con una calidad potencialmente inferior a
la de un buen ensayo clínico aleatorizado.

Así es chicos, comprenda que a menudo tendrá que lidiar con la mejor evidencia disponible,
a pesar de no ser el que querrías.
¡Hasta luego!

EL PAPEL DE LAS EMOCIONES

En salud, al ser situaciones que muchas veces representan la pérdida de la vida o la pérdida
de calidad de vida, no aceptamos perder. Cuando nos enfrentamos a una situación de
enfermedad, ya sea con nosotros mismos o con un familiar, no aceptamos que
simplemente no existe cura disponible en este momento.

En otras áreas fuera de la atención médica, aceptamos con calma y racionalidad que la
tecnología aún no ha evolucionado hasta el punto que deseamos. Por ejemplo, si quiero
hacer un viaje a un país que está en un hemisferio diferente al que vivo, sé que necesito
planificación para poder comprar el billete de avión, quedarme el tiempo que sea necesario,
viajar en el avión, y luego Sí, llegar a ese hemisferio.

Si por ejemplo quisiera estar en Japón esta noche, para asistir a un evento en el que
realmente quiero participar, podría preguntar si ya existe una técnica de teletransportación,
haría una búsqueda en Internet y comprobaría. No, la única manera de viajar más rápido es
en avión y en este caso, para ir a Japón, necesitaría al menos 20 horas en el avión y esta
noche no puedo llegar de todos modos. Entonces puedo resignarme y aceptar que este es
el estado actual de la evolución tecnológica.

En cambio, en salud negamos la posibilidad de que todavía no exista un tratamiento eficaz.


Puede haber un tratamiento que no sea el que queremos y entonces gastamos nuestra
energía, nuestra esperanza en la búsqueda de algo que realmente lo solucione. La
tecnología debe haber evolucionado para resolver mi problema, ya sea a través de un
inversión que voy a hacer con mi familia o una solicitud al gobierno para financiar lo que
quiero.
En estas situaciones, una frase común es: la esperanza es lo último que muere. vale, pero
mientras la esperanza no muere, otros fenómenos ocurren en la vida del paciente o de sus
familiares. La deuda, la pérdida de enfoque en lo que realmente deberíamos priorizar en el
momento, como pasar un buen rato con tus seres queridos, hacer un buen viaje,
tener una comida de calidad o incluso cambiar el enfoque del tratamiento, invertir en
cuidados paliativos y abandonar tratamientos invasivos que reducen mucho la calidad de
vida del paciente.

Cuando esta presión sale del nivel individual y llega a los sistemas de salud, el problema es
aún mayor. Esta presión por la necesidad de una cura, algo más moderno que resuelva el
problema, desvía el foco de la objetividad de esta decisión.

La decisión, que alguna vez podría haberse tomado basándose en evidencia científica, ahora
cobra un alto precio en las emociones de las personas que quieren una cura, que quieren
ese tratamiento.

Entonces, cuando tenemos esta carga, este peso de esperanza en medio de la toma de
decisiones, este proceso de toma de decisiones se vuelve mucho más difícil.

Como regla general, comenzamos a invertir recursos financieros en algo que aún no se ha
demostrado que funcione y dejamos de gastar en tecnologías que ya sabemos que
funcionan, ya que los recursos son limitados. Si decido adquirir una nueva tecnología, estoy
tomando recursos de algún otro ámbito. Por lo tanto, debemos tener enfoque y
transparencia para evaluar las tecnologías cuando se utilizan, ya sea a nivel individual o
colectivo.

Las herramientas que estamos aprendiendo aquí en este curso de salud basado en evidencia
son útiles en este proceso: para aportar mayor objetividad al proceso de toma de decisiones,
eliminando la desesperación y otras presiones emocionales que dificultan la toma de
decisiones con mayor claridad.
Mario Mella Sousa: Niveles de evidencia clínica y grados de recomendación

Niveles de Evidencia Clínica y Grados de Recomendación


Levels of scientific evidence and degrees of recommendation

MELLA SOUSA, MARIO1; ZAMORA NAVAS, PLÁCIDO2; MELLA LABORDE, MARIO3; BALLESTER
ALFARO, JUAN JOSÉ4; UCEDA CARRASCOSA, PILAR5

1
Editor Jefe Revista SATO
2
Servicio Traumatología y Cirugía Ortopédica. Hospital U. Virgen de la Victoria, Málaga
3
Servicio de Cirugía General y del Aparato Digestivo. Hospital U. San Juan, Alicante.
4
Servicio Traumatología y Cirugía Ortopédica. Hospital U. Puerto Real, Cádiz.
5
Servicio Traumatología y Cirugía Ortopédica. Hospital U. Reina Sofía, Córdoba.

RESUMEN
Se presenta una puesta al día de los niveles de evidencia científica mencionando los diversos grados de reco-
mendación para pacientes asintomáticos, indicando qué procedimientos son los más adecuados y cuáles debían
ser evitados. De todos los sistemas descritos, se busca aquel que cumpla el principio de sencillez y utilidad.
Elegimos para nuestro medio la valoracion del Centre for Evidence-Based Medicine, Oxford (OCEBM). Esta
clasificación tiene la ventaja que nos asegura el conocimiento más relativo a cada escenario, por su alto grado
de especialización. Además tiene la prerrogativa de aclarar cómo afecta la falta de rigurosidad metodológica al
diseño de los estudios, disminuyendo su valoración no sólo en la gradación de la evidencia, sino también en
la fuerza de las recomendaciones.

ABSTRACT
An update of the levels of scientific evidence stating the varying degrees of recommendation for asymptomatic patients, indi-
cating which procedures are most appropriate and what should be avoided all the systems described, we seek one that meets
the principle of simplicity and utility. We chose for our setting the valuation of the Centre for Evidence-Based Medicine,
Oxford (OCEBM). This classification has the advantage that assures us the knowledge on each scenario, its high degree of
specialization. It also has the prerogative to clarify how it affects the lack of methodological rigor to the study design, reducing
its assessment not only in the grading of the evidence, but also on the strength of recommendations.

Palabras clave: niveles de evidencia, grados de recomendación, clasificación de Oxford.

Key words: evidence levels , recommendation grades, classification of Oxford.

CONTACTO: Mario Mella Sousa.


[email protected]

Rev. S. And. Traum. y Ort., 2012;29(1/2):59-72 59


Mario Mella Sousa: Niveles de evidencia clínica y grados de recomendación

INTRODUCCIÓN le otorga la comunidad científica a esta forma de hacer


El uso de la evidencia en ciencias se atribuye a la medicina; pero que, por otra parte contradice el princi-
medicina tradicional china, en los tiempos del empe- pio de sencillez y utilidad que inspiró al paradigma de
rador Qianlong, cuando ya se señalaba el método la MBE. Esta situación puede confundir al clínico en
“kaozheng” que representa la “búsqueda de evidencia la búsqueda de la mejor evidencia aplicable a su reali-
práctica”(1), pero su desarrollo, como se conoce en dad, debido a que, a lo anterior se agrega la dificultad
la actualidad, se originó con la creación en 1976 de propia del lenguaje epidemiológico en que se expresa
la Canadian Task Force on Preventive Health Care la información, siendo en ocasiones la comprensión de
(CTFPHC), quienes fueron los primeros en generar y estos tópicos, sólo privilegio de algunos.
organizar los niveles de evidencia y los grados de reco- El objetivo de este artículo es entregar información
mendación para pacientes asintomáticos, indicando referente a los niveles de evidencia para cada tipo
qué procedimientos eran los más adecuados y cuáles de estudio según el escenario clínico o ámbito de la
debían ser evitados(2). Esta metodología permitió tomar práctica clínica que corresponda, interpretándolos en
conciencia de la existencia de un orden jerárquico en un lenguaje clínico comprensible, especialmente para
la calidad de la evidencia entre los estudios científicos, quienes se acercan a la jerarquización de la evidencia y
donde lógicamente aquellos que presentan más sesgos, sus recomendaciones, desde la práctica clínica.
no debieran justificar acciones clínicas(3). También en
Canadá, desde 1992, un grupo de médicos internistas CLASIFICACIÓN DE LA EVIDENCIA
y epidemiólogos clínicos de la Facultad de Medicina de Y TIPOS DE ESTUDIO
la Universidad de McMaster, definieron, sistematizaron El nivel o grado de evidencia clínica es un sistema
y consolidaron el concepto de medicina basada en la jerarquizado, basado en las pruebas o estudios de
evidencia (MBE) o “medicina basada en pruebas”, investigación, que ayuda a los profesionales de la salud
contribuyendo al cambio paradigmático para estudiar a valorar la fortaleza o solidez de la evidencia asociada a
y ejercer las ciencias médicas, pues, entre otros tantos los resultados obtenidos de una estrategia terapéutica(1,6)
hechos, esta práctica se hacía cada vez más compleja, No todos los conocimientos provenientes de los artí-
debido al incremento progresivo y abrumador de las culos científicos publicados, tienen el mismo impacto
publicaciones científicas que no se asociaban a calidad o valor sobre la toma de decisiones en materia de
o a un aumento del tiempo necesario para leer y valorar salud; por ello, se hizo necesario evaluar la calidad de
de manera apropiada dicha información(4,5). la evidencia. Esto es, en términos simples, el análisis
El análisis constante de la evidencia disponible desde la de la validez de los hallazgos en virtud de la calidad
perspectiva de los diferentes escenarios clínicos, permite metodológica de las investigaciones que los soportan,
establecer grados de recomendación para el ejercicio de garantizándonos por una parte un acercamiento a la
procedimientos diagnósticos, terapéuticos, preventivos veracidad científica; y por otra, a que esta verdad pueda
y económicos en salud; e indica la forma de valorar el traducirse en recomendaciones que a partir de la valora-
conocimiento en función de etiología, daño, morbilidad ción crítica de los estudios, nos permitan aplicarlas a la
y complicaciones; pronóstico, historia natural y curso problemática clínica o evento de interés que nos ocupe.
clínico de una enfermedad o evento de interés. Estos Resulta importante señalar, en este momento, que no
han de actualizarse permanentemente en relación al todos los diseños tienen el mismo poder para formular
avance del conocimiento, del desarrollo tecnológico y una recomendación; y que más aún, un mismo diseño
al estado del arte(6). de investigación puede tener un nivel de evidencia y
Se estima que hasta la fecha se han descrito y pro- grado de recomendación diferente según el escenario
puesto alrededor de 100 sistemas distintos para valorar clínico o ámbito de la práctica clínica que corresponda.
la evidencia(7), lo que nos orienta acerca del valor que Por lo anteriormente expuesto, nos parece que vale la

60 Rev. S. And. Traum. y Ort., 2012;29(1/2):59-72


Mario Mella Sousa: Niveles de evidencia clínica y grados de recomendación

pena aclarar algunos conceptos que seguirán utilizándose que los diversos grupos de expertos (autores de clasi-
de aquí en adelante: ficaciones de la evidencia), han ido adquiriendo y que
Se define como diseño de investigación a los distintos han adecuado, paulatinamente, estos fundamentos a
tipos de estudios que con sus características metodológicas los diferentes escenarios y diseños. Debemos advertir
propias, permiten llevar a cabo una investigación clínica(5,8). entonces, que sólo las clasificaciones propuestas por
Como escenario, ámbito o entorno, al ambiente en el Sackett, National Institute for Health and Clinical
que se desarrolla la situación clínica que se está evaluan- Excellence (NICE) y el Oxford Centre for Evidence-
do; es decir: tratamiento, prevención, etiología, daño, Based Medicine (OCEBM), consideran otras áreas de
pronóstico e historia natural, diagnóstico diferencial, la investigación clínica además de la concerniente a
prevalencia, estudios económicos y análisis de decisión. tratamiento. De esta forma, NICE adiciona evaluación
Como niveles de evidencia, a herramientas, instru- de la evidencia para diagnóstico; mientras que Sackett
mentos y escalas que clasifican, jerarquizan y valoran considera cuatro grandes grupos temáticos: terapia, pre-
la evidencia disponible, de forma tal que en base a su vención, etiología y daño; pronóstico e historia natural;
utilización se pueda emitir juicios de recomendación. diagnóstico; y estudios económicos. OCEBM, que es
Como grados de recomendación a una forma de clasi- una modificación “complementaria” de la clasificación
ficación de la sugerencia de adoptar o no la adquisición de Sackett, incluye terapia, prevención, etiología y daño
o puesta en marcha de tecnologías sanitarias según el en un subgrupo; pronóstico e historia natural en otro;
rigor científico de cada tipo de diseño(4). diagnóstico en el siguiente; diagnóstico diferencial y
Dependiendo de los tipos de diseños de investigación estudios de prevalencia en otro; y estudios económicos
clínica utilizados, podemos observar diferentes niveles y análisis de decisión en otro.
o gradación de la calidad de estos según el escenario de A continuación se mencionan y describen las pro-
investigación clínica a la que se refiera. Por una parte, puestas de jerarquización de la evidencia más utilizada
llama la atención que las intervenciones terapéuticas sean en la actualidad (Tabla 1).
las más abordadas desde esta concepción, situación que
posiblemente no sea por azar, puesto que es un hecho CANADIAN TASK FORCE ON PREVENTIVE
que entre el 50% y el 60% de las publicaciones versan HEALTH CARE (CTFPHC)(2,12)
sobre el ámbito del tratamiento o los procedimientos Esta propuesta de clasificación de la evidencia busca
terapéuticos(9,10,11). No obstante ello, es deseable que generar recomendaciones de una manera práctica, adop-
todo el quehacer en salud sea analizado bajo la misma tando una posición binaria, “hágalo o no”, pero sólo en
perspectiva. Lo anterior se relaciona al grado de avance el ámbito de la prevención. Este grupo de estudio generó

Tabla 1: Propuestas de jerarquización de la evidencia analizadas

Propuesta Tratamiento Prevención Etiología Daño Pronóstico Diagnóstico Prevalencia Económicos

CTFPHC X
SACKETT X X X X X X X
USPSTF X
OCEBM X X X X X X X X
SIGN X
NICE X X

Rev. S. And. Traum. y Ort., 2012;29(1/2):59-72 61


Mario Mella Sousa: Niveles de evidencia clínica y grados de recomendación

su primer informe en el año 1979, en el cual se divulgó debe llevarse a cabo una maniobra o acción deter-
el análisis de la evidencia hasta esa fecha para 78 enferme- minada (se recomienda no hacer); la letra C, indica
dades, lo que permitió ordenar y producir planes de salud que la evidencia es “conflictiva”, o sea, que existe
para la población canadiense desde la perspectiva de “la contradicción. Y la letra I que indica insuficiencia
prevención”. La metodología de este grupo hace énfasis en calidad y cantidad de evidencia para establecer
en el tipo de diseño utilizado y la calidad de los estudios una recomendación (Tabla 2).
publicados, basándose finalmente en tres elementos claves: t 2. Niveles de evidencia clasificados según diseño de
t 1. Un orden para los grados de recomendación, estudio de I a III, disminuyendo en calidad según
establecido por letras del abecedario donde, las letra se acrecienta numéricamente. Para el número II se
A y B indican que existe evidencia para ejercer una subdivide en números arábigos del 1 al 3 (Tabla 3).
acción (se recomienda hacer); D y E indican que no t 3. Niveles de evidencia clasificados según la validez

Tabla 2: Grados de recomendación para intervenciones de prevención (CTFPHC)

Grado de
Interpretación
recomendación
A Existe buena evidencia para recomendar la intervención clínica de prevención.
B Existe moderada evidencia para recomendar la intervención clínica de prevención.

La evidencia disponible es conflictiva y no permite hacer recomendaciones a favor o


C en contra de la intervención clínica preventiva; sin embargo, otros factores podrían
influenciar en la decisión.

D Existe moderada evidencia para recomendar en contra de la intervención clínica de prevención.


E Existe buena evidencia para recomendar en contra de la intervención clínica de prevención.
Existe evidencia insuficiente (en cantidad y en calidad) para hacer una recomendación;
I
sin embargo, otros factores podrían influenciar en la decisión.

Tabla 3: Niveles de evidencia e interpretación de los tipos de estudio para intervenciones de


prevención (CTFPHC)

Niveles de
Interpretación
evidencia
I Evidencia a partir de EC con asignación aleatoria.
II-1 Evidencia a partir de EC sin asignación aleatoria.
Evidencia a partir de estudios de cohortes y casos y controles, preferiblemente
II-2
realizados por más de un centro o grupo de investigación.
Evidencia a partir de comparaciones en el tiempo o entre sitios, con o sin la
II-3 intervención; podrían incluirse resultados espectaculares provenientes de estudios sin
asignación aleatoria.
Opinión de expertos, basados en la experiencia clínica; estudios descriptivos o informes
III
de comités de expertos.

62 Rev. S. And. Traum. y Ort., 2012;29(1/2):59-72


Mario Mella Sousa: Niveles de evidencia clínica y grados de recomendación

interna o calidad metodológica del estudio, en buena, No contempla otro tipo de áreas de investigación
moderada e insuficiente (Tabla 4). como tratamiento, etiología, daño, pronóstico, etc.
Como todo sistema de clasificación, este presenta
algunas debilidades que se mencionan a continuación: CLASIFICACIÓN DE LA EVIDENCIA
No abarca toda la dimensionalidad de la proble- SEGÚN SACKETT(13)
mática de la “prevención”, respecto a las condiciones Esta sistematización propuesta por el epidemiólogo David
particulares de quienes son sujeto de la aplicación de L. Sackett (la que se emplea generalmente), jerarquiza
medidas preventivas. la evidencia en niveles que van del 1 a 5; siendo el nivel
En su análisis no se incorpora la evaluación del aspecto 1 la “mejor evidencia” y el nivel 5 la “peor, la más mala
financiero para la disponibilidad de las intervenciones o la menos buena”, según como se quiera leer (Tabla 5).
preventivas. Ésta fue la primera propuesta que consideró otros
La propuesta sólo se basó en población canadiense, escenarios clínicos o ámbitos de la práctica clínica
por ende, el uso de las recomendaciones sólo puede diferentes de la prevención. Incorporó los análisis
ser extrapolada a poblaciones similares a ésta; por ello, económicos, el diagnóstico y el pronóstico.
esta propuesta tiene un inconveniente relacionado con Hasta hoy, ha sido ampliamente utilizada por diferentes
su validez externa que ha de ser valorado al momento grupos científicos. A cada ámbito o escenario clínico
de pretender aplicarla en otros escenarios, pues de lo le otorga el diseño de estudio más apropiado para la
contrario se corre el riesgo de incurrir en esfuerzos elaboración de las recomendaciones. Así, en el escenario
económicos con resultados erráticos. de terapia, los diseños más puntuados corresponden
No contempla la relación del paciente, sus expecta- a las revisiones sistemáticas (RS) de ensayos clínicos
tivas y su medio, para establecer las recomendaciones. controlados con asignación aleatoria (EC); en escenarios
Puede inducir a errores al momento de valorar las de pronóstico, los estudios de cohortes; en escenarios
recomendaciones para su puesta en práctica en los de diagnóstico, los estudios de pruebas diagnósticas
sistemas estatales de salud, esto quiere decir que una con estándar de referencia, etc.
recomendación B puede ser menospreciada pudiendo Presenta desventajas que son comunes a todas las
tener un beneficio importante para la población. propuestas existentes, como que puede llevar a des-

Tabla 4: Validez interna e interpretación de los tipos de estudio para intervenciones de


prevención (CTFPHC)

Niveles de
Interpretación
evidencia
Un estudio (incluyendo la RS y el meta-análisis) que cumple los criterios específicos de
Buena
estudio bien diseñado.
Un estudio (incluyendo la RS y el meta-análisis) que no cumple (o no está claro que
Moderada cumpla) al menos uno de los criterios específicos de estudio bien diseñado, aunque no
tiene “defectos fatales”.

Un estudio (incluyendo la RS y el meta-análisis) que tiene en su diseño al menos


un “defecto fatal” o no cumple (o no está claro que cumpla) al menos uno de los
Insuficiente
criterios específicos de estudio bien diseñado, aunque no presenta “errores fatales”
III
o una acumulación de defectos menores que hagan que los resultados del estudio no
permitan elaborar las recomendaciones.

Rev. S. And. Traum. y Ort., 2012;29(1/2):59-72 63


Mario Mella Sousa: Niveles de evidencia clínica y grados de recomendación

preciar recomendaciones que se basan en evidencias que dará «la mejor evidencia disponible actual».
inferiores a las de nivel 1; por ejemplo un estudio de Esta clasificación fue pionera y ha servido de base
nivel de evidencia 4, aún cuando se trate de un artículo para el desarrollo de clasificaciones más completas,
cuyo aporte sea novedoso. No obstante, los autores son como la propuesta por el OCEBM(14).
enfáticos en que lo que debe valorarse es «la mejor evi-
dencia disponible actual»; pues «lo actual puede variar U.S. PREVENTIVE SERVICES TASK FORCE
en el día a día»; y de este modo puede ocurrir que ante (USPSTF)(15)
determinadas situaciones «la mejor evidencia disponible Este grupo de expertos jerarquizó y estableció la fuerza
actual» sea una serie de casos y no un EC; y dos meses de sus recomendaciones a partir de la calidad de la evi-
después, aparezca un estudio de cohorte prospectivo dencia y del beneficio neto; es decir, beneficios menos

Tabla 5: Clasificación de los niveles de evidencia según Sackett

Terapia,
Recomen- Estudios
Nivel prevención, Pronóstico Diagnóstico
dación económicos
etiología y daño
RS con homogeneidad
RS con
y Meta-análisis de RS de estudios de diagnóstico RS de estudios
1a homogeneidad y
estudios de cohortes nivel 1 económicos de nivel 1
Meta-análisis de EC
concurrente
A Estudio individual de Comparación independiente y Análisis que compara
EC individuales cohorte concurrente enmascarada de un espectro de los desenlaces posibles,
1b con iintervalo de con seguimiento pacientes consecutivos sometidos a contra una medida
confianza estrecho superior al 80% de la la prueba diagnóstica y al estándar de costos. Incluye un
cohorte de referencia análisis de sensibilidad
RS con RS de estudios
RS de cohortes RS de estudios diagnósticos de
2a homogeneidad de económicos de nivel
históricas nivel mayor a 1
estudio de cohortes mayor a 1
Comparación independiente Comparación de un
Estudio de cohortes enmascarada de pacientes no número limitado de
Estudio individual de
2b individual. EC de baja consecutivos, sometidos a la desenlaces contra una
cohortes históricas
calidad prueba diagnóstica y al estándar medida de costo. Incluye
B de referencia análisis de sensibilidad
RS con homoge-
3a neidad de estudios de
casos y controles
Análisis sin una medida
Estudios no consecutivos o
Estudio de casos y exacta de costo, pero
3b carentes de un estándar de
controles individuales incluye análisis de
referencia
sensibilidad
Series de casos.
Series de casos. Estudios de casos y controles sin
Estudio de cohortes y Estudio sin análisis de
C 4 Estudios de cohortes la aplicación de un estándar de
casos y controles de sensibilidad
de mala calidad referencia
mala calidad
Opinión de expertos Opinión de expertos
Opinión de expertos sin Opinión de expertos
sin evaluación crítica sin evaluación crítica
evaluación crítica explícita, sin evaluación crítica
D 5 explícita, o basada explícita, o basada
o basada en fisiología, o en explícita, o basada en
en fisiología, o en en fisiología, o en
investigación teórica teoría económica
investigación teórica investigación teórica

Por homogeneidad se entiende que una RS que está libre de variaciones (heterogeneidad) en las direcciones o grados de
resultados entre los estudios individuales.

64 Rev. S. And. Traum. y Ort., 2012;29(1/2):59-72


Mario Mella Sousa: Niveles de evidencia clínica y grados de recomendación

perjuicios de la medida evaluada para su aplicación en el concepto de “costo de sufrimiento de la condición


“exámenes periódicos de salud”. Por otro lado, analizó el estudiada”, las “características de la intervención” y la
coste-efectividad de las intervenciones, por ende su aporte “efectividad de la intervención” demostrada en inves-
vino a complementar lo que había generado el grupo tigaciones clínicas publicadas; recibiendo un especial
de CTFPHC(2,12). La fuerza de las recomendaciones va énfasis la efectividad de la intervención. En la revisión de
desde la letra A hasta la E, otorgándose una A cuando los estudios clínicos, se utilizan criterios estrictos para la
existe buena evidencia que respalda la recomendación; selección de la evidencia admisible y se otorga un acento
y una E, que indica que existe buena evidencia que sus- especial en la calidad de los diseños de los estudios. Para
tenta la recomendación de evitar la intervención (Tabla jerarquizar la calidad de la evidencia, se otorga mayor
6). La calidad de la evidencia es valorada en buena, justa peso a aquellos diseños que metodológicamente ofrecen
o insuficiente en la fuerza de las recomendaciones y se menor riesgo de sesgos y errores aleatorios (Tabla 7). Es
basa en la consideración sistemática de tres criterios: interesante observar que la correlación entre la fuerza de

Tabla 6: Recomendaciones a partir de calidad de evidencia para exámenes periódicos de salud (USPSTF)

Recomen-
Interpretación
dación
La USPSTF recomienda claramente que los clínicos proporcionen la intervención a los pacientes que
A cumplan los criterios. La USPSTF ha encontrado buena evidencia de que la medida mejora de manera
importante los resultados en salud y concluye que los beneficios superan ampliamente a los riesgos.

La USPSTF recomienda que los clínicos proporcionen la intervención a los pacientes. La USPSTF ha
B encontrado evidencia moderada de que la medida mejora de manera importante los resultados en salud y
concluye que los beneficios superan a los riesgos.

La USPSTF no recomienda a favor o en contra de la intervención. La USPSTF ha encontrado al menos


C evidencia moderada de que la medida puede mejorar los resultados en salud, pero los beneficios son muy
similares a los riesgos y no puede justificarse una recomendación general.

La USPSTF recomienda en contra que los clínicos proporcionen la intervención a los pacientes
D asintomáticos. La USPSTF ha encontrado al menos evidencia moderada de que la medida es ineficaz o
que los riesgos superan a los beneficios.

La USPSTF concluye que la evidencia es insuficiente para recomendar a favor o en contra de la intervención. No
I existe evidencia de que la intervención es ineficaz, o de calidad insuficiente, o conflictiva y que el balance entre
los riesgos y los beneficios no se puede determinar.

Tabla 7: Niveles de evidencia e interpretación de estos para exámenes periódicos de salud (USPSTF)

Evidencia Interpretación
La evidencia incluye resultados consistentes a partir de estudios bien diseñados y realizados en poblaciones
Buena representativas que directamente evalúan efectos sobre resultados de salud.
La evidencia es suficiente para determinar efectos sobre resultados de salud, pero la fuerza de la evidencia
Moderada es limitada por el número, la calidad o la consistencia de los estudios individuales, la generalización a la
práctica rutinaria, o la naturaleza indirecta de la evidencia sobre los resultados de salud.
La evidencia es insuficiente para evaluar los efectos sobre los resultados de salud debido al número limitado
Insuficiente o al poder de estudios, defectos importantes en su diseño o realización, inconsistencias en la secuencia de
la evidencia, o falta de información sobre resultados de salud importantes.

Rev. S. And. Traum. y Ort., 2012;29(1/2):59-72 65


Mario Mella Sousa: Niveles de evidencia clínica y grados de recomendación

Tabla 8: Clasificación de los niveles de evidencia de Oxford (OCEBM)

Diagnóstico
Tratamiento, Estudios
Grado de Nivel diferencial
prevención, Pronóstico e historia económicos
recomen- de evi- Diagnóstico y estudios
etiología y natural y análisis de
dación dencia de
daño decisión
prevalencia
1a RS con homo- RS de estudios de cohor- RS de estudios diagnósticos RS con homo- RS con homogenei-
geneidad de EC tes, con homogeneidad, o de nivel 1 (alta calidad), con geneidad dad de estudios eco-
controlados con sea que incluya estudios homogeneidad, o sea que incluya de estudios nómicos de nivel 1
asignación alea- con resultados compara- estudios con resultados compara- de cohortes
toria bles, en la misma dirección bles y en la misma dirección y en prospectivas
y validadas en diferentes diferentes centros clínicos
poblaciones

A 1b EC individual con Estudios de cohortes Estudios de cohortes que validen Estudio de Análisis basado en
intervalo de con- individuales con un segui- la calidad de una prueba especí- cohortes costes o alterna-
fianza estrecho miento mayor de 80% de fica, con estándar de referencia prospectiva tivas clínicamente
la cohorte y validadas en adecuado (independientes de la con buen sensibles; RS de la
una sola población prueba) o a partir de algoritmos seguimiento evidencia; e inclu-
de estimación del pronóstico o de yendo análisis de la
categorización del diagnóstico o sensibilidad
probado en un centro clínico

1c Eficiencia demos- Resultados a partir de la Pruebas diagnósticas con especi- Series de Análisis absoluto en
trada por la efectividad y no de su efi- ficidad tan alta que un resultado casos todos o términos de mayor
práctica clínica. cacia demostrada a través positivo confirma el diagnóstico ninguno valor o peor valor
Considera cuando de un estudio de cohortes. y con sensibilidad tan alta que
algunos pacientes Series de casos todos o un resultado negativo descarta el
mueren antes de ninguno diagnóstico
ser evaluados

2a RS de estudios RS de estudios de cohorte RS de estudios diagnósticos de RS (con homo- RS (con homoge-


de cohortes, con retrospectiva o de grupos nivel 2 (mediana calidad) con geneidad de neidad) de estudios
homogeneidad controles no tratados en un homogeneidad estudios 2b y económicos con nivel
EC, con homogeneidad mejores mayor a 2

2b Estudio de cohortes Estudio de cohorte retros- Estudios exploratorios que, a Estudios de Análisis basados en
individual con pectiva o seguimiento de través de una regresion logística, cohortes costes o alternativas
seguimiento inferior controles no tratados en un determinan factores significativos, y retrospectivas o clínicamente sensibles;
a 80% (incluye EC EC, o GPC no validadas validados con estándar de referen- de seguimiento limitado a revisión de
de baja calidad) cia adecuado (independientes de insuficiente la evidencia; e inclu-
la prueba) yendo un análisis de
sensibilidad
2c Estudios ecológicos Investigación de resultados Estudios Auditorías o estudios
o de resultados en en salud ecológicos de resultados en salud
salud
B 3a RS de estudios de RS con homogeneidad de estudios RS con homo- RS con homogeneidad
casos y controles, 3b y de mejor calidad geneidad de de estudios 3b y
con homogeneidad estudios 3b y mejores
mejores
3b Estudios de casos Comparación enmascarada y obje- Estudio no consecutivo
y controles indivi- tiva de un espectro de una cohorte de cohorte, o análisis
duales de pacientes que podría normal- muy limitado de la
mente ser examinado trastorno, población basado en
pero el estándar de referncia no pocas alternativas o
se aplica a todos los pacientes del costes, estimaciones
estudio. Estudios no consecutivos o de datos de mala cali-
sin la aplicación de un estándar de dad, pero incluyendo
referencia análisis de la sensibi-
lidad que incorporan
variaciones clínicamen-
te sensibles

66 Rev. S. And. Traum. y Ort., 2012;29(1/2):59-72


Mario Mella Sousa: Niveles de evidencia clínica y grados de recomendación

Contiuación de Tabla 8

Diagnóstico
Tratamiento, Estudios
Grado de Nivel diferencial
prevención, Pronóstico e historia económicos
recomen- de evi- Diagnóstico y estudios
etiología y natural y análisis de
dación dencia de
daño decisión
prevalencia
4 Serie de casos, Serie de casos y estudios de Estudio de casos y controles, con Series de casos Análisis sin análisis de
estudios de cohor- cohortes de pronóstico de escasos o sin estándares de refe- o estándares sensibilidad
C tes, y de casos y poca calidad rencia independiente de referencia
controles de baja obsoletos
calidad
5 Opinión de expertos Opinión de expertos sin Opinión de expertos sin evaluación Opinión de Opinión de expertos
sin evaluación evaluación crítica explícita, crítica explícita, ni basada en expertos sin sin evaluación crítica o
crítica explícita, ni ni basada en fisiología, ni fisiología, ni en trabajo de inves- evaluación basado en teoría eco-
basada en fisiolo- en trabajo de investigación tigación juicioso ni en “principios crítica explícita, nómica o en “principios
gía, ni en trabajo de juicioso ni en “principios fundamentales” ni basada en fundamentales”
D investigación juicio- fundamentales” fisiología, ni
so ni en “principios en trabajo de
fundamentales” investigación
juicioso ni en
“principios fun-
damentales”

GPC: Guía de práctica clínica. Estudios con homogeneidad: se refiere a que incluya estudios con resultados comparables y en
la misma dirección.

la recomendación y el nivel de evidencia no es exacta; las recomendaciones; por ejemplo no se considera la


por ejemplo, puede haber un buen nivel de evidencia disponibilidad de los recursos necesarios para llevar a
que no prueba que una intervención es efectiva, como el cabo los objetivos o metas señaladas. de cobertura de
caso de la mamografía en mujeres menores de 50 años; salud estatal.
que recibe una recomendación «C». Por otra parte una
recomendación tipo «A» fue otorgada al Papanicolaou CENTRE FOR EVIDENCE-BASED MEDICINE,
para detección precoz de cáncer cérvico-uterino basado OXFORD (OCEBM)(14)
en el «costo de sufrimiento de la enfermedad» y un nivel Esta propuesta se caracteriza por valorar la evidencia
II de evidencia sosteniendo dicha intervención(14). Así, según el área temática o escenario clínico y el tipo de
las recomendaciones permiten un cierto grado de flexi- estudio que involucra al problema clínico en cuestión.
bilidad y se amoldan de acuerdo al contexto imperante. Lo anterior es una innovación y es complementaria a lo
Esta clasificación tiene la ventaja de que contempla expuesto por las otras iniciativas. Esta, tiene la ventaja
nuevos aspectos que condicionan la elaboración de que gradúa la evidencia de acuerdo al mejor diseño para
recomendaciones ya no sólo a la calidad de la evidencia cada escenario clínico, otorgándole intencionalidad,
(siempre controvertido) sino también al beneficio neto agregando las RS en los distintos ámbitos. Así por
y al “costo de sufrimiento de padecer el evento de inte- ejemplo, al tratarse de un escenario clínico relacionado
rés en estudio”, aproximándose a una perspectiva más con pronóstico de un evento de interés, la evidencia será
global que emerge desde la posición de quien padece valorada a partir de una RS de estudios de cohortes con
la condición de salud o evento de interés en estudio. homogeneidad, o en su defecto de estudios de cohortes
Dentro de las desventajas podemos señalar que sólo se individuales con un seguimiento superior al 80% de la
consideran estudios para diagnóstico y, aún resultan cohorte; en cambio, si el escenario se refiere a terapia o
insuficientes los aspectos abordados para establecer tratamiento, la evidencia se valorará principalmente a

Rev. S. And. Traum. y Ort., 2012;29(1/2):59-72 67


Mario Mella Sousa: Niveles de evidencia clínica y grados de recomendación

partir de RS de EC, o en su defecto de EC individuales Presenta algunos inconvenientes para su práctica


con intervalos de confianza estrechos. habitual. Por una parte, vemos como en su estructura
Esta clasificación tiene la ventaja que nos asegura se presentan términos epidemiológicos poco amigables
el conocimiento más relativo a cada escenario, por su y con múltiples aclaraciones que hacen su lectura
alto grado de especialización. Además tiene la prerro- poco fluida y, que rápidamente pueden frustrar o
gativa de aclarar cómo afecta la falta de rigurosidad desanimar a quien se aproxima a ella por primera vez.
metodológica al diseño de los estudios, disminuyendo En su intento por abarcar todos los aspectos con la
su valoración no sólo en la gradación de la evidencia, máxima exhaustividad, pierde la simpleza para hacerla
sino que también en la fuerza de las recomendaciones. aplicable (Tabla 8).

Tabla 9: Niveles de evidencia para estudio de tratamiento con análisis cuantitativo (SIGN)

Nivel de
Interpretación
evidencia
1++ Meta-análisis de alta calidad, RS de EC o EC de alta calidad con muy poco riesgo de sesgo

1+ Meta-análisis bien realizados, RS de EC o EC bien realizados con pocos riesgo de sesgos

1– Meta-análisis, RS de EC o EC con alto riesgo de sesgos

RS de alta calidad de estudios de cohortes o de casos y controles. Estudios de cohortes o de casos y


2++ controles con riesgo muy bajo de sesgo y con alta probabilidad de establecer una relación causal

Estudios de cohortes o de casos y controles bien realizados con bajo riesgo de sesgo y con una moderada
2+ probabilidad de establecer una relación causal

Estudios de cohortes o de casos y controles con alto riesgo de sesgo y riesgo significativo de que la
2– relación no sea causal

3 Estudios no analíticos, como informes de casos y series de casos

4 Opinión de expertos

Los estudios clasificados como 1– y 2– no deben usarse en el proceso de elaboración de recomendaciones por su alto
potencial de sesgo.

Tabla 10: Grados de recomendación para estudios de tratamiento con análisis cuantitativo (SIGN)

Grados de
recomen- Interpretación
dación
Al menos un meta-análisis, RS o EC clasificado como 1++ y directamente aplicable a la población diana
A de la guía; o un volumen de evidencia científica compuesto por estudios clasificados como 1+ y con gran
consistencia entre ellos

Un volumen de evidencia científica compuesta por estudios clasificados como 2++, directamente aplicable
B a la población diana de la guía y que demuestran gran consistencia entre ellos; o evidencia científica
extrapolada desde estudios clasificados como 1++ o 1+

Un volumen de evidencia científica compuesta por estudios clasificados como 2+ directamente aplicables
C a la población diana de la guía y que demuestran gran consistencia entre ellos; o evidencia científica
extrapolada desde estudios clasificados como 2++

D Evidencia científica de nivel 3 o 4; o evidencia científica extrapolada desde estudios clasificados como 2+

68 Rev. S. And. Traum. y Ort., 2012;29(1/2):59-72


Mario Mella Sousa: Niveles de evidencia clínica y grados de recomendación

SCOTTISH INTERCOLLEGIATE GUIDELINES padecer una enfermedad o considerar las implicaciones


NETWORK (SIGN)(16,17) económicas de las medidas recomendadas.
Esta propuesta, se origina también teniendo como foco
de interés la temática del tratamiento. Se diferencia de NATIONAL INSTITUTE FOR HEALTH AND
las anteriores por su particular énfasis en el análisis cuan- CLINICAL EXCELLENCE (NICE)(18)
titativo que involucra a las RS y otorga importancia a la Esta iniciativa que nace del National Health Service
reducción del error sistemático. Se compone de niveles de del Reino Unido (NHS), abarca la temática de la terapia
evidencia y grados de recomendación según esos niveles y el diagnóstico. Adapta la clasificación hecha por SIGN
(Tablas 9 y 10). Como fortaleza, es interesante el hecho para terapia y utiliza la de la OCEBM para diagnóstico;
que considera la calidad metodológica de los estudios de tal modo que se efectúa una valoración de la evidencia
que componen las RS, situación que es de interés dada disponible con base en estas dos herramientas. Por lo
la alta producción anual de revisiones. Como debilidad tanto, queda patente la semejanza con las clasificaciones
podemos señalar que no considera en la elaboración de anteriores respecto a la importancia otorgada a las RS al
las recomendaciones la realidad científica y tecnológica momento de generar las recomendaciones (Tablas 11-14).
del momento, pues estas se crean con una rigidez que Presenta el inconveniente que hace una relación tan directa
puede ser peligrosa en el sentido de quienes usan con entre calidad de la evidencia y grado de recomendación
ortodoxia las recomendaciones para la implementación que puede generar confusión sobre esos constructos.
de políticas de salud, los que pueden evitar invertir
con argumento en la evidencia. Por otro lado, se basa DISCUSIÓN
de forma puntual en los aspectos metodológicos y de La evidencia ha tenido un desarrollo a lo largo del
diseño, pero no así en la dimensión de la perspectiva del tiempo marcado por el interés de la comunidad cientí-

Tabla 11: Niveles de evidencia para estudios terapia (NICE)

Nivel de
Interpretación
evidencia
Meta-análisis de gran calidad, RS de EC con asignación aleatoria o EC con asignación aleatoria con muy
1++ bajo riesgo de sesgos

Meta-análisis de gran calidad, RS de EC con asignación aleatoria o EC con asignación aleatoria con bajo
1+ riesgo de sesgos

Meta-análisis de gran calidad, RS de EC con asignación aleatoria o EC con asignación aleatoria con alto
1– riesgo de sesgos*

RS de alta calidad de estudios de cohortes o de casos-controles, o estudios de cohortes o de casos-


2++ controles de alta calidad, con muy bajo riesgo de confusión, sesgos o azar y una alta probabilidad de que
la relación sea causal

Estudios de cohortes o de casos-controles bien realizados, con bajo riesgo de confusión, sesgos o azar y
2+ una moderada probabilidad de que la relación sea causal

2– Estudios de cohortes o de casos y controles con alto riesgo de sesgo*

3 Estudios no analíticos, como informe de casos y series de casos

4 Opinión de expertos

*Los estudios con un nivel de evidencia “–” no deberían utilizarse como base para elaborar una recomendación. Adaptado de
Scottish Intercollegiate Guidelines Network.

Rev. S. And. Traum. y Ort., 2012;29(1/2):59-72 69


Mario Mella Sousa: Niveles de evidencia clínica y grados de recomendación

fica por ordenar y valorar de una manera exhaustiva el para que el conocimiento más válido sea conseguido de
conocimiento, siendo uno de los objetivos primordiales el manera expedita por el clínico. Paradójicamente, el desa-
contestar preguntas clínicas surgidas del quehacer médico rrollo de múltiples propuestas de clasificar la evidencia y
diario. En principio, la idea principal fue dar directrices formular recomendaciones y el lenguaje epidemiológico

Tabla 12: Grados de recomendación para estudios de tratamiento con análisis cuantitativo (SIGN)

Grados de
recomen- Interpretación
dación
Al menos un meta-análisis o un EC con asignación aleatoria categorizados como 1++, que sea
directamente aplicable a la población diana; o una RS o un EC con asignación aleatoria o un volumen de
A evidencia con estudios categorizados como 1+, que sea directamente aplicable a la población diana y
demuestre consistencia de los resultados. Evidencia a partir de la apreciación de NICE

Un volumen de evidencia que incluya estudios calificados de 2++, que sean directamente aplicables a
B la población objeto y que demuestren globalmente consistencia de los resultados, o extrapolación de
estudios calificados como 1++ o 1+

Un volumen de evidencia que incluya estudios calificados de 2+, que sean directamente aplicables a
C la población objeto y que demuestren globalmente consistencia de los resultados, o extrapolación de
estudios calificados como 2++

D Evidencia nivel 3 o 4, o extrapolación de estudios calificados como 2+, o consenso formal

D (DPP): Un buen punto de práctica (BPP) es una recomendación para la mejor práctica basado en la experiencia del grupo
que elabora la guía. IP: Recomendación a partir del manual para procedimientos de intervención de NICE.

Tabla 13: Niveles de evidencia para estudios diagnóstico (NICE)

Grados de
recomen- Interpretación
dación
Ia RS con homogeneidad* de estudios de nivel 1+

Ib Estudios de nivel 1+

II Estudios de nivel 2++ RS de estudios de nivel 2

III Estudios de nivel 3&& RS de estudios de nivel 3

Consenso, informes de comités de expertos u opiniones y/o experiencia clínica sin valoración crítica
IV explícita; o en base a la psicología, difusión de la investigación o “principios básicos”

* Homogeneidad significa que no hay variaciones o estas son pequeñas en la dirección y grado de los resultados entre los
estudios individuales que incluye la RS. + Estudios de nivel 1 son aquellos que utilizan una comparación enmascarada de la
prueba con un estándar de referencia validado, en una muestra de pacientes que refleja a la población a quien se aplicaría
la prueba. ++ Estudios nivel 2 son aquellos que presentan una sola de esta características: población reducida (la muestra
no refleja las características de la población a la que se le va a aplicar la prueba; utilizan un estándar de referencia pobre
(definido como aquel donde la “prueba” es incluida en la “referencia”, o aquel en que las “pruebas” afectan a la “referencia”;
la comparación entre la prueba y la referencia no está enmascarada; o estudios de casos y controles. && Estudios de nivel 3
son aquellos que presentan al menos dos o tres de las características señaladas anteriormente.

70 Rev. S. And. Traum. y Ort., 2012;29(1/2):59-72


Mario Mella Sousa: Niveles de evidencia clínica y grados de recomendación

empleado, ha llevado consigo confusión e incompren- Por otro lado, la enseñanza de las ciencias médicas
sión por parte de los clínicos, quienes ven en esta gran no incentiva la validación de instrumentos extranje-
variedad de opciones más conflictos que ayuda al desa- ros para la valoración de la lectura crítica, ni menos
rrollo de la práctica profesional. En este artículo hemos la creación de los propios. Así, nos vemos obligados
presentado y desarrollado de forma somera algunas de no sólo a traducir el lenguaje epidemiológico desde el
las clasificaciones existentes, utilizando como criterio de inglés, sino que también a adaptar e implementar esas
selección, el nivel de utilización de cada cual, el que se traducciones a las problemáticas sanitarias nacionales
asocia directamente con el grado de aceptación de ellas e incluso regionales.
por parte de la comunidad científica. Es cierto que el análisis de la evidencia incluye, la adap-
El problema de la jerarquización de la evidencia tación a diferentes realidades; pero, complicando un poco
también ha planteado desafíos a los comités editoriales más la contingencia ¿qué repercusiones podemos tener
de las revistas biomédicas respecto de cómo estanda- en el ámbito legal? En la actualidad vamos observando
rizar la valoración de la evidencia, para la aceptación cómo la lex artis ya no se basa en opiniones de expertos,
de trabajos científicos. Entendemos la necesidad de cada día se hace más próxima a la MBE, lo cual implica
simplificar y aunar criterios, incluso sería deseable la contemplación de recomendaciones y protocolos en
que las recomendaciones que nacen de la valoración el momento de fallos judiciales. Necesitamos establecer
de la evidencia tuvieran un carácter universal, pero el recomendaciones basadas en estudios propios. No pode-
generalizar también trae consigo algunos inconvenien- mos pretender que las recomendaciones establecidas por
tes. ¿Por qué hay políticas de salud que fracasan aún científicos con distinto grado de desarrollo tecnológico y
cuando han contemplado en su elaboración la evidencia de habilidades, puedan ser entendidas por quienes ejecutan
disponible? Una de las tantas razones es que algunas las leyes sin el riesgo de creerlas como determinantes.
recomendaciones basadas en la evidencia pueden no ser En nuestro entorno, nos preguntamos: ¿Cuál de
aplicables a nuestro medio. De esta forma, al momento las propuestas de clasificación de la evidencia es más
de acercarnos a la evidencia es necesario considerar la adecuada para nosotros? Desde nuestro punto de vista,
existencia de características propias de nuestra región, destacamos la clasificación ofrecida por OCEBM(14) sobre
tanto poblacionales, culturales, económicas, tecnológicas las otras, por ser capaz de asignar una valoración más
como ambientales; es decir, darle relevancia al concepto completa de la evidencia según cada tipo de escenario.
de validez externa y valorar nuestra realidad. Sin embargo, es absolutamente imprescindible entender
que las recomendaciones, son consejos desde la más
alta perspectiva científica, no importa qué propuesta
usemos sino cómo las empleemos, qué juicios hagamos
Tabla 14: Grados de recomendación para y cómo interrelacionamos la evidencia con los factores
estudios diagnóstico (NICE) propios de nuestro entorno.
De todos modos no hay que olvidar que el ejercicio
Grados de
de la medicina y la teoría medica, siempre se han basado
recomen- Interpretación
dación en la observación y en lo que hoy llamamos “evidencia”.
Hace 2.500 años Hipócrates(19) escribió: “[...] No es posi-
A (EPD) Estudios con un nivel de evidencia Ia o Ib
ble sacar provecho de lo que se cumple sólo de palabra,
B (EPD) Estudios con un nivel de evidencia II
sino de lo que llega a la demostración de la realidad...
C (EPD) Estudios con un nivel de evidencia III Por ello es menester atenerse por completo a los hechos
D (EPD) Estudios con un nivel de evidencia IV y ocuparse de ellos, y no con la mayor brevedad, si es
que se ha de poseer la actitud holgada e infalible que
* EPD: estudios de pruebas diagnósticas. titulamos, precisamente, hábito médico”.

Rev. S. And. Traum. y Ort., 2012;29(1/2):59-72 71


Mario Mella Sousa: Niveles de evidencia clínica y grados de recomendación

BIBLIOGRAFÍA

1. Sackett Dl, Rosenberg WMC, Gary JAM, Haynes RB, Richardson WS. Evidence based medicine: what is
it and what it isn´t. BMJ 1996;312:71-2.
2. Canadian Task Force on Preventive Health Care. New grades for recommendations from the Canadian Task
Force on Preventive Health Care. CMAJ 2003; 169: 207-220
3. Upshur RE. Are all evidence-based practices alike? Problems in the ranking of evidence. CMAJ 2003; 169:
672-73
4. Evidence-based medicine Working Group. Evidence-based medicine. A new approach to teaching the practice
of medicine. JAMA 1992; 268: 2420-25.
5. Manterola C, Zavando D. Como interpretar los “Niveles de Evidencia” en los diferentes escenarios clínicos.
Rev Chil Cir 2009; vol 61, Nº 6: 582-95.
6. Sackett DL, Richardson WS, Rosenberg W, Haynes RB. Medicina Basada en la Evidencia. Como ejercer y
enseñar la MBE. Churchill Livingstone España. Madrid.1997.
7. West S, King V, Carey TS, Lohr KN, McKoy N, Sutton SF, et al. Systems to Rate the Strength of Scientific
Evidence. Health Services/Technology Assessment Text, National Library of Medicine. AHRQ Publication
No. 02-E016, 2002. Disponible en: http://www.ncbi.nlm.nih.gov/books/bv.fcgi?rid=hstat1.chapter.70996.
8. Hulley SB, Cummings SR, Browner WS, Grady DG, Newman TB. Diseño de Investigaciónes clínicas.
Traduccion de Mª Jesus del Sol Jaquotot. 3ª ed. Lippincott Williams and Wilkins. Barcelona, 2008.
9. Guyatt GH, Sackett DL, Sinclair JC, Hayward R, Cook DJ, Cook RJ. Users’ Guides to the Medical Litera-
ture: IX. A method for grading health care recommendations. JAMA 1995;274:1800-04.
10. Laupacis A, Sackett DL, Roberts RS. Assessment of clinically useful measures of the consequences of treatment.
N Engl J Med 1988; 318: 1728-33.
11. Cook DJ, Guyatt GH, Laupacis A, Sackett DL. Rules of evidence and clinical recommendations on the use
of antithrombotic agents. Chest 1992; 102 Supl 305-11.
12. Task Force Revitalization Process (CTFPHC). Evidence-Based Clinical Prevention, Updated August 17,
2005.Disponible en: http://www.ctfphc.org.
13. Sackett DL, Wennberg JE. Choosing the best research design for each question. BMJ 1997; 315(7123):
1636-40.
14. Oxford Centre for Evidence-based Medicine (CEBM). Centre for Evidence Based Medicine - Levels of
Evidence (March 2009). Disponible en: http://www.cebm.net/index.aspx?o=1025
15. Task Force Ratings. Guide to Clinical Preventive Services, Second Edition. Disponible: http://www.odphp.
osophs.dhhs.gov/pubs/guidecps/PDF/APPA.PDF.
16. Harbour R, Miller J. A new system for grading recommendations in evidence based guidelines. BMJ 2001;
323: 334-336
17. Scottish Intercollegiate Guidelines Network (SIGN). SIGN 50, A guideline developer’s handbook, revisited
edition 2008. Disponible en: http://www.sign.ac.uk/pdf/sign50.pdf
18. National Institute for Health and Clinical Excellence (NICE). The guidelines manual 2009. Disponible en:
http://www.nice.org.uk/media/5F2/44/The_guidelines_manual_2009.
19. Tratados Hipocráticos. Preceptos (2). Madrid: Editorial Gredos; 1990. Tomo I. p. 310-1.

72 Rev. S. And. Traum. y Ort., 2012;29(1/2):59-72


Niveles de evidencia científica:
¿cuáles son los mejores
estudios?
• 16 marzo, 2020

¿Crees que cada estudio que se publica tiene la misma importancia clínica? ¿Has oído hablar
de la medicina basada en la evidencia? Si no sabes responder o quieres ampliar tus
conocimientos, sigue leyendo.

¿Qué es la medicina basada en la


evidencia?
La medicina basada en la evidencia se define como el uso de la evidencia clínica en la
práctica diaria para el cuidado del paciente individual. Por lo tanto, para ofrecer al paciente la
mejor atención clínica, hay que conocer los últimos avances en la especialidad. Sin embargo,
considerando la cantidad de artículos nuevos que se publican cada día y la falta de tiempo
para leerlos todos, se hace preciso aprender a determinar qué artículos son relevantes y
aportan una evidencia clínica de calidad.

En la medicina basada en la evidencia, existen niveles de evidencia según el tipo de fuente del
que provenga. Asimismo, dentro de los estudios clínicos, la calidad de la evidencia varía
según el diseño del estudio.
¿Qué nivel de evidencia aportan las
diferentes fuentes bibliográficas?
En otro artículo te hemos explicado las fuentes bibliográficas que existen. El nivel de evidencia
de estas fuentes se suele representar con una pirámide:

• Los metanálisis representan el mayor nivel de evidencia en la cúspide de la


pirámide.
• Las revisiones sistemáticas y las guías clínicas componen el segundo nivel.
• Los artículos originales con mayor nivel de evidencia son los que presentan
resultados de ensayos clínicos aleatorizados, y los de menor grado de evidencia
son los que presentan resultados de estudios preclínicos en modelos celulares.
• Casos clínicos, revisiones, opinión de expertos, cartas al editor: aportan el
menor nivel de evidencia.

¿Cómo evaluamos el nivel de


evidencia de un estudio clínico?
Como ya hemos dicho, los estudios clínicos suponen un nivel de evidencia diferente, en
función del diseño. A continuación, te los explicaremos con detalle, empezando por los que
tienen más fiabilidad y calidad. No obstante, ten en cuenta que el tipo de pregunta que quieres
responder también influye en el nivel de evidencia. Es decir, según la pregunta, el tipo de
estudio que mejor la responderá será diferente.

Estudios clínicos experimentales (con


intervención)
En general, en este tipo de estudio los pacientes se dividen en dos o más grupos: un grupo
recibe la intervención (medicamento, producto sanitario, intervención quirúrgica o similar) y se
compara con el grupo de control (que puede ser la intervención que se usa actualmente o
placebo), con el objetivo de evaluar la intervención. Hay varios tipos:

• Ensayo clínico aleatorizado. Es un estudio experimental prospectivo, en el cual la


asignación de los pacientes a cada grupo se realiza al azar. La intervención que
recibe cada paciente puede ser visible para todos (estudio sin
enmascaramiento), oculta solo al paciente (enmascaramiento simple), oculta al
paciente y al médico (enmascaramiento doble) o al paciente, al médico y al
personal que maneja las muestras (enmascaramiento triple).

El enmascaramiento es un aspecto importante para prevenir el sesgo consciente o


inconsciente de manipulación de resultados; por lo tanto, cuanto más enmascaramiento se
implemente, más fiabilidad aporta el estudio. Además, la fiabilidad del estudio se aumenta
incrementando el tamaño muestral y con la participación de varios centros nacionales o
incluso internacionales (estudios multicéntricos).
• Ensayo clínico no aleatorizado. Es un estudio experimental prospectivo en el cual
los pacientes no se asignan al azar al grupo de intervención o control; por lo tanto,
el médico sabe qué intervención recibe cada paciente. La información puede o no
estar oculta al paciente (enmascaramiento simple).

Estudios clínicos observacionales (sin


intervención)
• Estudio de cohortes. Es un estudio observacional en el cual se comparan de
manera prospectiva o retrospectiva dos o más cohortes (poblaciones) para evaluar
el efecto de un factor de riesgo o tratamiento sobre una enfermedad.
• Estudio de casos y controles. Es un estudio observacional en el cual se
seleccionan casos (por ejemplo, personas con cierta enfermedad) y de manera
retrospectiva se analiza su exposición a un factor de riesgo determinado.
• Estudio descriptivo. Identifica la frecuencia y las características de un problema
de salud. Puede ser la prevalencia en la población o la prevalencia entre personas
con cierta edad o hábitos.
• Casos clínicos aislados. Presentan un caso específico de un paciente con una
respuesta excepcional o inesperada. Tienen poca aplicabilidad a la población
general.

Estudios preclínicos
En los estudios preclínicos se evalúa el efecto de una intervención en modelos celulares o
animales. Aportan menos evidencia que los estudios clínicos y tienen menos aplicabilidad para
los pacientes. Por lo tanto, los resultados tienen que confirmarse en estudios clínicos.

Sistema GRADE
Para evaluar el nivel de evidencia se pueden usar también sistemas de graduación de la
calidad de la evidencia, como el GRADE(del inglés Grading of Recommendations,
Assessment, Development and Evaluation).

El sistema GRADE distribuye el nivel de evidencia en cuatro categorías: calidad alta,


moderada, baja y muy baja. De manera general, los ensayos clínicos aleatorizados tienen
calidad alta y los estudios observacionales calidad baja. Sin embargo, se pueden aplicar unos
factores adicionales para que un estudio baje o suba de calidad. Por ejemplo, las limitaciones
en el diseño o la inconsistencia entre los resultados disminuyen la calidad de la evidencia. A
su vez, una gran magnitud del efecto aumenta la calidad de la evidencia.

Conclusiones y recomendaciones
Los metanálisis de ensayos clínicos aleatorizados aportan el mayor nivel de evidencia, aunque
siempre dependerá de qué estudios incluyan. Le siguen las revisiones sistemáticas y las guías
clínicas. Por su parte, los estudios clínicos aleatorizados proporcionan más evidencia que los
estudios observacionales.
Referencias
• Aguayo-Albasini JL, Flores-Pastor B, Soria-Aledo V. Sistema GRADE: clasificación
de la calidad de la evidencia y graduación de la fuerza de la recomendación.
Cirugía Española. 2014; 92 (2): 82-88.
• Diario Médico. La pirámide de evidencia científica. 2017. [Consultado en mayo
2019].
• Por una Medicina Interna de Alto Valor. Aplicando la Medicina Basada en la
Evidencia a la práctica clínica. 2018. [Consultado en mayo 2019].
• Características del sistema GRADE. 2017. [Consultado en mayo 2019].

También podría gustarte