ARTÍCULOS ORIGINALES
Evaluación crítica de una guía de práctica clínica para el manejo de cáncer de cabeza y cuello utilizando el instrumento AGREE II
Juan Marcos Parise-Vasco[1], Jaime Angamarca-Iguago[2], Jaen Carlos Cagua-Ordoñez[2], Natali González[3],
Claudia Reytor-González[2], Daniel Simancas-Racines[1]
1. Facultad de Salud y Bienestar, Pontificia Universidad Católica del Ecuador, Quito 170143, Ecuador.
2. Escuela de Medicina, Sede Santo Domingo, Pontificia Universidad Católica del Ecuador, Santo Domingo 230203, Ecuador.
3. Universidad UTE, Facultad de Odontología, Santo Domingo, Ecuador.
DOI: https://doi.org/10.16921/pfr.v10i3.389
PRÁCTICA FAMILIAR RURAL│Vol.10│No.3│Noviembre 2025│Recibido: 12/10/2025│Aprobado: 25/11/2025
Cómo citar este artículoAngamarca-Iguago J, Parise-Vasco JM, Cagua-Ordoñez J, Reytor-González C, Simancas-Racines D. Evaluación crítica de la calidad de la Guía OMS Tuberculosis 2025 mediante el instrumento AGREE II. PFR [Internet]. Noviembre 2025; 10(3). Disponible en: https://practicafamiliarrural.org/index.php/pfr/article/view/388 |
Compartir en:
Resumen
Introducción: Las guías de práctica clínica (GPC) desempeñan un papel crucial en la estandarización de la atención médica y oncológica para mejorar los resultados de los pacientes. Las guías de la Red Nacional Integral del Cáncer (NCCN) se utilizan ampliamente en la práctica oncológica a nivel mundial. Sin embargo, la evaluación sistemática de su calidad metodológica mediante instrumentos validados sigue siendo limitada. Objetivo: Evaluar críticamente la calidad metodológica de la Guía de Práctica Clínica del National Comprehensive Cancer Network (NCCN) para cánceres de cabeza y cuello (versión 5.2025), utilizando el instrumento AGREE II. Métodos: Se realizó una evaluación crítica mediante el instrumento AGREE II, que contempla seis dominios: alcance y propósito, participación de los implicados, rigor en la elaboración, claridad de presentación, aplicabilidad e independencia editorial. Cada uno de los 23 ítems fue calificado en una escala de 7 puntos. Las calificaciones se analizaron en una matriz elaborada en Excel. Resultados: La GPC alcanzó una alta calidad metodológica general, con una puntuación media global del 83,3 % (DE: 5,1 %). Las puntuaciones por dominio oscilaron entre excelentes para la claridad de la presentación (97,5 %, DE: 5,0 %) y la independencia editorial (92,5 %, DE: 15,0 %), y entre aceptables para la aplicabilidad (62,5 %, DE: 12,3 %). El alcance y el propósito (92,1 %, DE: 6,5 %) y el rigor del desarrollo (77,8 %, DE: 12,8 %) mostraron un buen rendimiento, mientras que la participación de las partes interesadas (77,2 %, DE: 8,7 %) reveló oportunidades de mejora para las próximas actualizaciones. Conclusiones: La GPC de la NCCN sobre el cáncer de cabeza y cuello evidencia una alta calidad metodológica en múltiples dimensiones de la evaluación. Se recomienda el uso clínico de las recomendaciones, con adaptaciones contextuales, en particular en lo relativo a las consideraciones sobre los recursos y las barreras locales para la implementación.
Palabras clave: guías de práctica clínica; neoplasias de cabeza y cuello; AGREE II; medicina basada en la evidencia
A critical evaluation of a clinical practice guideline for the management of head and neck cancer, using the AGREE II tool
Abstract
Introduction: Clinical practice guidelines (CPGs) play a crucial role in standardizing medical and oncological care to improve patient outcomes. The National Comprehensive Cancer Network (NCCN) guidelines are widely used worldwide in cancer care. However, systematic evaluation of their methodological quality using validated instruments remains limited. Objective: This study aimed to critically evaluate the methodological quality of the NCCN Clinical Practice Guideline for head and neck cancers (version 5.2025) using the AGREE II instrument. Methods: A systematic evaluation was performed using the AGREE II instrument, which covers six domains: scope and purpose, stakeholder involvement, rigor of development, clarity of presentation, applicability, and editorial independence. Each of the 23 items was rated on a 7-point Likert scale and analyzed using an Excel-based data matrix. Results: The CPG demonstrated high overall methodological quality, achieving an average score of 83.3% (SD: 5.1%). Scores by domain ranged from excellent for clarity of presentation (97.5%, SD: 5.0%) and editorial independence (92.5%, SD: 15.0%), to acceptable for applicability (62.5%, SD: 12.3%). The scope and purpose (92.1%, SD: 6.5%) and the rigor of development (77.8%, SD: 12.8%) performed well. However, stakeholder involvement (77.2%, SD: 8.7%) revealed opportunities for improvement in future updates. Conclusions: The NCCN CPG on head and neck cancer demonstrates high methodological quality across multiple evaluation dimensions. The clinical use of the recommendations with contextual adaptations is recommended, particularly regarding resource considerations and local barriers to implementation.
Keywords: clinical practice guidelines, head and neck neoplasms, AGREE II, evidence-based medicine.
Introducción
Los cánceres de cabeza y cuello constituyen un grupo heterogéneo de neoplasias malignas que afectan a múltiples localizaciones anatómicas, incluyendo cavidad oral, faringe, laringe, senos paranasales y las glándulas salivales.(1,2) Estas condiciones representan una importante carga sanitaria a nivel mundial, con 482 000 muertes al año y aproximadamente 947 000 nuevos casos, lo que los convierte en el séptimo tipo de cáncer más frecuente en todo el mundo.(3)
Las guías de práctica clínica (GPC) son herramientas esenciales para estandarizar la atención médica, ya que sintetizan la mejor evidencia disponible y generan recomendaciones prácticas para los médicos y los responsables de la toma de decisiones.(4) La complejidad anatómica, las diversas histopatologías y los requisitos de tratamiento multimodal de estos cánceres hacen necesarias GPC exhaustivas y basadas en la evidencia para estandarizar las intervenciones y optimizar los resultados de los pacientes en diferentes entornos sanitarios.(5,6)
La National Comprehensive Cancer Network (NCCN) se ha consolidado como una de las principales autoridades en el desarrollo de guías clínicas oncológicas basadas en la evidencia, ampliamente adoptadas por instituciones de Estados Unidos y, progresivamente, incorporadas en el ámbito internacional a través de procesos de adaptación sistemática.(6,7) En particular, las guías NCCN para el manejo del cáncer de cabeza y cuello ofrecen recomendaciones integrales y multidisciplinares que abarcan todo el proceso asistencial, desde la prevención y el diagnóstico hasta el tratamiento y la atención de los supervivientes.(7)
Sin embargo, la utilidad clínica y la implementación de las GPC dependen fundamentalmente de su calidad metodológica y transparencia.(8,9) Las guías con errores metodológicos pueden propagar prácticas clínicas basadas en pruebas sesgadas o incompletas, lo que podría comprometer los resultados de los pacientes y la eficiencia en la utilización de los recursos.(10–12) La herramienta AGREE II (Appraisal of Guidelines for Research & Evaluation II) se ha convertido en el instrumento más ampliamente validado y adoptado internacionalmente para la evaluación sistemática de la calidad de las GPC.(13) AGREE II evalúa seis ámbitos críticos: alcance y finalidad, participación de las partes interesadas, rigor en la elaboración, claridad en la presentación, aplicabilidad e independencia editorial.(14)
A pesar de la relevancia internacional de las guías de práctica clínica de la NCCN y su amplia adopción en el tratamiento del cáncer de cabeza y cuello, no se ha publicado ninguna evaluación exhaustiva de la calidad utilizando el instrumento AGREE II para la versión más reciente de las directrices de la NCCN sobre el cáncer de cabeza y cuello.(15) Ante esto, el objetivo de este estudio fue evaluar críticamente la calidad metodológica de la Guía de Práctica Clínica del NCCN para cánceres de cabeza y cuello (versión 5.2025), utilizando el instrumento AGREE II.
Métodos
Se realizó un estudio metodológico de evaluación crítica de guías de práctica clínica utilizando la herramienta estandarizada AGREE II.(14,16) La guía seleccionada para la evaluación fue la NCCN Clinical Practice Guidelines in Oncology: Head and Neck Cancers, versión 5.2025, publicada el 12 de agosto de 2025 por el National Comprehensive Cancer Network.(15) Los criterios de selección fueron: relevancia clínica, actualidad, alcance internacional, accesibilidad e impacto en la práctica clínica.
El AGREE II comprende 23 ítems organizados en seis dominios de calidad que abordan aspectos esenciales del proceso de desarrollo de guías clínicas, incluyendo el alcance y los objetivos, la participación de los implicados, el rigor metodológico, la claridad de la presentación, la aplicabilidad y la independencia editorial. Cada ítem fue valorado mediante una escala tipo Likert de siete puntos.(16) Cuatro revisores (JMPV, JAI, JCCO, CRG), expertos en medicina, cirugía maxilofacial, odontología, salud pública y epidemiología, evaluaron de forma independiente cada ítem de los seis dominios en una escala de 1 (totalmente en desacuerdo) a 7 (totalmente de acuerdo), además de incluir una recomendación general para las guías. Las discrepancias se resolvieron por consenso y, en caso de persistir, se consultó a un quinto y sexto revisor (DSR, NG).
Las calificaciones fueron recogidas y analizadas en una matriz de Excel elaborada para este propósito. Las puntuaciones estandarizadas de cada dominio se calcularon utilizando la fórmula estándar de AGREE II. También se calculó la puntuación global promedio como la media aritmética de las puntuaciones de los seis dominios. Adicionalmente, la concordancia entre los evaluadores se analizó mediante el coeficiente de correlación intraclase (ICC), calculado mediante un modelo de efectos mixtos bidireccional con acuerdo absoluto (ICC[2,k]), para medir la consistencia de las puntuaciones de los revisores al evaluar los mismos ítems, y se aplicó el coeficiente kappa ponderado, calculado para cada ítem individual empleando ponderaciones cuadráticas, con el objetivo de estimar el grado de acuerdo más allá del esperado por azar y asignar mayor penalización a las discrepancias amplias entre evaluadores. La interpretación de los valores del ICC siguió los criterios propuestos por Koo y Li en el 2016, que clasifican la fiabilidad interevaluador en cuatro niveles: valores inferiores a 0,50 indican fiabilidad deficiente; entre 0,50 y 0,75, concordancia moderada; entre 0,75 y 0,90, concordancia buena; y superiores a 0,90, concordancia excelente.(17)
Resultados
Características de la guía evaluada
La guía NCCN para cánceres de cabeza y cuello (Versión 5.2025) fue desarrollada por un panel multidisciplinario de expertos de 33 instituciones oncológicas de excelencia, miembros del consorcio NCCN. La guía abarcó el manejo integral de los cánceres de cabeza y cuello, incluyendo la cavidad oral, la orofaringe, la hipofaringe, la nasofaringe, la laringe, los senos paranasales, las glándulas salivales y el melanoma mucosal. El documento principal incluyó principios de tratamiento específicos por modalidad como cirugía, radioterapia, y terapia sistémica. En la tabla 1 se resumen las principales características de la guía.
Tabla 1. Características de la guía evaluada
| Autor (Organización) | Alcance | Año de publicación | Objetivo | Cobertura específica por sitios anatómicos | Usuarios Diana |
| National Comprehensive Cancer Network (NCCN) | Global, con adaptaciones internacionales |
|
Proveer recomendaciones basadas en evidencia para:
|
1. Cavidad oral (incluyendo labio mucoso) 2. Orofaringe (estratificado por estado p16/HPV) 3. Hipofaringe 4. Nasofaringe (con consideración de estado EBV) 5. Laringe (glótica y supraglótica) 6. Senos paranasales (etmoides y maxilar) 7. Glándulas salivales 8. Melanoma mucoso |
Profesionales de la salud: • Médicos oncólogos. • Radio-oncólogos. • Cirujanos de cabeza y cuello. • Patólogos. • Radiólogos. • Odontólogos oncológicos. • Enfermeras especializadas en oncología. • Nutricionistas/dietistas • Terapeutas de lenguaje y deglución. • Trabajadores sociales. • Farmacéuticos oncológicos. Otros usuarios: • Tomadores de decisiones en sistemas de salud. • Pagadores y aseguradoras. • Pacientes y sus familias. |
Concordancia interevaluador
La concordancia general entre los cuatro evaluadores fue excelente, con un coeficiente de correlación intraclase global (ICC) = 0,83 (IC 95%: 0,74-0,89) para los 23 ítems de la herramienta AGREE II. Este nivel de concordancia indica una consistencia sustancial en la aplicación de los criterios de evaluación entre los revisores independientes. El análisis por dominios mostró valores de concordancia que oscilaron entre moderados y excelentes. Los dominios de alcance y objetivos (ICC = 0,89; kappa ponderado = 0,85), claridad de la presentación (ICC = 0,95; kappa = 0,92) y independencia editorial (ICC = 0,88; kappa = 0,83) alcanzaron niveles de concordancia clasificados como excelentes. Los dominios de participación de los implicados (ICC = 0,82; kappa = 0,76) y rigor en la elaboración (ICC = 0,75; kappa = 0,69) mostraron una concordancia considerada buena, mientras que la aplicabilidad presentó la menor consistencia (ICC = 0,71; kappa = 0,64), clasificada como moderada.
Evaluación de la calidad metodológica
La guía de práctica clínica sobre cáncer de cabeza y cuello de la NCCN demostró una alta calidad metodológica en general, con una puntuación global media del 83,3% (D.E.: 5,1%) entre los cuatro revisores, lo que refleja un consenso entre los evaluadores al recomendar el uso de la GPC. A continuación, se describe la evaluación de cada uno de los dominios:
Dominio 1: Alcance y objetivos (ítems 1-3)
La GPC alcanzó una puntuación de 92,1 % (D.E.: 6,5 %). Esto refleja la claridad excepcional de sus objetivos generales, la cobertura exhaustiva del continuo de atención (prevención, diagnóstico, tratamiento y seguimiento) y la definición precisa de la población diana delimitada por sitio anatómico, estadio clínico y biomarcadores moleculares. Los evaluadores concluyeron que el alcance está definido correctamente para orientar la práctica clínica oncológica multidisciplinaria en el manejo de los cánceres de cabeza y cuello.
Dominio 2: Participación de los implicados (ítems 4-6)
La puntuación en este dominio fue de 77,2 % (D.E.: 8,7 %), lo que indica una participación robusta de las partes interesadas en el desarrollo de la GPC. La guía evidencia la inclusión de un panel multidisciplinario representativo de todas las especialidades pertinentes (oncología médica, radiooncología, cirugía de cabeza y cuello, patología, radiología, odontología, enfermería especializada) proveniente de 33 centros oncológicos de excelencia. Sin embargo, se identificó una oportunidad de mejora en la documentación explícita de una metodología formal para recopilar de manera sistemática los valores y preferencias de los pacientes durante el desarrollo de la guía.
Dominio 3: Rigor en la elaboración (ítems 7-14)
Se obtuvo 77,8% (D.E: 12,8%) en este dominio, señalando rigor sustancial en el desarrollo metodológico de la guía. Destaca el procedimiento de actualización robusto con revisión anual obligatoria, consideración sistemática de beneficios y riesgos clínicos, y vínculo explícito entre recomendaciones y evidencia. No obstante, se identificaron limitaciones en la transparencia metodológica: la búsqueda de evidencia se limitó a PubMed (sin incluir otras bases de datos) y la documentación de los criterios de selección de estudios fue incompleta. Asimismo, se requiere la formalización de la revisión externa independiente por parte de expertos no afiliados al consorcio NCCN antes de la publicación.
Dominio 4: Claridad de la presentación (ítems 15-17)
Con una puntuación de 97,5 % (D.E.: 5,0 %), la guía muestra desempeño excepcional e inalcanzable en claridad de presentación. Esto refleja recomendaciones altamente específicas con detalles técnicos precisos, presentación transparente de opciones de tratamiento mediante un sistema de categorización de preferencias y formato visual de algoritmos clínicos intuitivos que facilita la identificación de recomendaciones clave.
Dominio 5: Aplicabilidad (ítems 18-21)
La GPC obtuvo 62,5% (D.E: 12,3%) en este dominio, señalando oportunidad significativa de mejora respecto a implementación práctica. Si bien la guía proporciona herramientas valiosas, como principios quirúrgicos, protocolos de radioterapia y algoritmos de terapia sistémica, así como criterios de seguimiento clínico, presenta limitaciones críticas: ausencia de análisis formales de costo-efectividad; falta de identificación sistemática de barreras de implementación organizacionales, financieras y culturales; indicadores de auditoría y calidad insuficientemente desarrollados; e inadecuada consideración de disparidades de acceso según el nivel socioeconómico. Estos déficits limitan la capacidad de los sistemas de salud para evaluar la adherencia a las recomendaciones e implementar mejoras contextualizadas.
Dominio 6: Independencia editorial (ítems 22-23)
La puntuación en este dominio fue de 92,5 % (D.E.: 15,0 %), indicando excelente independencia editorial y manejo de conflictos de interés. La guía demuestra política de barrera que prohíbe financiamiento de la industria directo para desarrollo de guías, financiamiento exclusivo mediante cuotas de membresía institucional, y sistema riguroso de divulgación obligatoria de conflictos de interés con límites monetarios cuantitativos estrictos. Existe una recusación obligatoria de los miembros del panel ante conflictos significativos y una transparencia pública en las divulgaciones, lo que garantiza objetividad y credibilidad excepcionales de las recomendaciones.
Para comparar las puntuaciones de todos los dominios evaluados, se creó un gráfico radial hexagonal, donde la puntuación máxima de cada dominio corresponde a cada vértice del hexágono interior (Figura 1).
Figura 1. Gráfico de las puntuaciones medias de la guía de práctica clínica evaluada en los seis dominios del instrumento AGREE II
Discusión
La evaluación sistemática de la guía de práctica clínica de la NCCN sobre el cáncer de cabeza y cuello, realizada con el instrumento AGREE II, evidenció que la guía alcanza una alta calidad metodológica general, con áreas de fortaleza en la claridad de la presentación, la independencia editorial y la definición del alcance y del objetivo. Sin embargo, la evaluación también identificó limitaciones de aplicabilidad, lo que representa un área crítica que requiere mejoras para optimizar la implementación de la guía y su utilidad clínica.
En cuanto a la claridad de la presentación, la guía demuestra una fortaleza que se traduce directamente en su utilidad clínica. El formato algorítmico ofrece una estructura visual intuitiva que facilita la toma de decisiones rápidas y precisas en la práctica clínica sin sacrificar la exhaustividad necesaria para abordar rutas terapéuticas complejas. Este hallazgo coincide con las evidencias de la ciencia de la implementación, que señalan que la claridad en la presentación de las recomendaciones es un factor clave para su adopción y cumplimiento en los entornos asistenciales.(18)
La alta puntuación en independencia editorial refleja estructuras de gobernanza sólidas que protegen la integridad de las recomendaciones. La política que prohíbe la financiación de las directrices por parte de la industria, junto con una gestión estricta de los conflictos de intereses que incluye umbrales financieros específicos y procedimientos de recusación obligatorios, supera los estándares establecidos por muchas organizaciones internacionales de directrices.(19) Esta independencia es especialmente crucial en el ámbito de la oncología, donde la rápida innovación terapéutica y los importantes intereses comerciales pueden dar lugar a sesgos.(20,21)
El dominio de alcance y objetivos evidenció otra fortaleza en la evaluación, caracterizada por la definición clara de los objetivos generales y una estratificación poblacional precisa, basada en el sitio anatómico, el estadio clínico y los marcadores moleculares. La distinción entre los cánceres orofaríngeos VPH positivos y VPH negativos refleja la comprensión actual de estas entidades como enfermedades biológicamente diferenciadas que requieren enfoques terapéuticos específicos.(22) Esta precisión en la definición de la población objetivo favorece la aplicación adecuada y contextualizada de las recomendaciones a escenarios clínicos particulares, mejorando la pertinencia y la efectividad potencial de la guía en la práctica asistencial.(23)
La identificación de la aplicabilidad como el domino con la puntuación más baja concuerda con los patrones sistemáticos observados en múltiples evaluaciones AGREE II, en las que la aplicabilidad obtiene sistemáticamente puntuaciones más bajas que otros ámbitos. Una revisión sistemática sobre las GPC de nutrición clínica informó puntuaciones medias de aplicabilidad del 35 al 46 %,(11) mientras que las GPC sobre psoriasis obtuvieron una puntuación del 39,93 %, lo que demuestra que las deficiencias de aplicabilidad representan un desafío generalizado en el desarrollo de las guías actuales.(10) Estudios cualitativos de los médicos oncólogos han identificado factores organizativos, factores sistémicos, factores socioeconómicos y barreras de acceso geográfico como los principales impedimentos para el cumplimiento de las GPC.(24,25)
Una de las principales fortalezas de este estudio es la participación de revisores independientes, lo que minimiza el riesgo de sesgo individual y aporta perspectivas metodológicas complementarias que enriquecen la evaluación. La excelente concordancia entre evaluadores respalda la consistencia y solidez del proceso de valoración, mientras que el acceso a la documentación metodológica completa permitió realizar un análisis más profundo y preciso de la calidad de la guía, superando el nivel de detalle habitualmente reportado en evaluaciones previas. Además, la integración sistemática de los comentarios cualitativos con las puntuaciones cuantitativas proporcionó una visión más amplia y matizada de las fortalezas y debilidades de la guía analizada.
No obstante, el estudio presenta algunas limitaciones que deben tenerse en cuenta al interpretar los resultados. En primer lugar, la evaluación constituye una instantánea metodológica en un momento concreto, por lo que podría no reflejar los cambios introducidos en futuras actualizaciones, especialmente considerando la dinámica de mejora continua propia de las guías NCCN. Además, es importante tener en cuenta que las diferencias culturales, organizativas y estructurales entre los sistemas sanitarios pueden influir en la percepción de la aplicabilidad y en el grado de implementación de las recomendaciones.
La guía de práctica clínica evaluada proporciona recomendaciones de alta calidad metodológica que se actualizan periódicamente. El formato algorítmico facilita la toma de decisiones en el momento de la atención, al tiempo que permite adaptarse a las circunstancias individuales de cada paciente. No obstante, el personal sanitario debe ser consciente de que muchas recomendaciones son consensuadas y deben adaptarse a los recursos locales y a las preferencias de los pacientes. Para los desarrolladores de guías de práctica clínica, el presente estudio destaca la importancia de equilibrar el rigor metodológico con consideraciones pragmáticas en campos en rápida evolución. Invertir en métodos de participación de los pacientes, en herramientas de apoyo a la implementación y en una mayor transparencia metodológica reforzaría el impacto de las recomendaciones.
Conclusiones
Esta evaluación sistemática de la calidad mediante el instrumento AGREE II evidencia que la Guía de Práctica Clínica en Oncología de la NCCN para Cánceres de Cabeza y Cuello (Versión 5.2025) alcanza una alta calidad metodológica global, con un desempeño sobresaliente en los dominios de claridad en la presentación, independencia editorial y definición del alcance y los objetivos. En conjunto, la guía se considera altamente recomendable para su aplicación clínica, ya que ofrece recomendaciones confiables, basadas en la evidencia y desarrolladas con transparencia, adecuadas para el manejo multidisciplinario de los cánceres de cabeza y cuello. No obstante, se identificaron deficiencias significativas en el dominio de aplicabilidad, en particular relacionadas con la ausencia de evaluaciones económicas formales, la falta de identificación sistemática de barreras para la implementación y la carencia de criterios de auditoría o de monitoreo que faciliten la evaluación de su adopción en la práctica clínica por parte de la autoridad sanitaria Estos aspectos representan áreas prioritarias de mejora, especialmente si se busca optimizar la utilidad real y la sostenibilidad de las recomendaciones en diversos contextos asistenciales y sistemas de salud.
Conflicto de intereses y financiamiento
Los autores declaran no presentar ningún conflicto de intereses en relación con el tema de estudio y que han autofinanciado este artículo.
Referencias