کدام مدل‌های احتمال عوارض بافت طبیعی (NTCP) برای پیش‌بینی خطر ایجاد عوارض جانبی ناشی از تابش اشعه پس‌از رادیوتراپی در بیماران مبتلا به سرطان سر و گردن در دسترس هستند، کیفیت آن‌ها چیست، و عملکرد پیش‌بینی‌کننده آن‌ها چیست؟

پیام‌های کلیدی

° بسیاری از مدل‌های احتمال عوارض بافت طبیعی (normal tissue complication probability; NTCP) برای پیش‌بینی عوارض ناخواسته پس‌از رادیوتراپی (radiotherapy) در بیماران مبتلا به سرطان سر و گردن توسعه یافته‌اند، اما اکثر آن‌ها به اندازه کافی از نظر بیرونی اعتبارسنجی نشده‌اند، یعنی با بیمارانی که در مطالعه توسعه مدل اصلی شرکت نداشتند، آزمایش نشدند تا مشخص شود که واقعا چقدر خوب عوارض ناخواسته را پیش‌بینی می‌کنند.

° برای مدل‌هایی که علاوه‌بر مطالعات اولیه توسعه مدل، در دو یا چند مطالعه دیگر آزمایش شدند، کیفیت تست و گزارش نتایج آن‌ها عموما ضعیف بود، بنابراین دانستن اینکه چقدر می‌توانند مفید باشند، دشوار است.

° برای بررسی این موضوع در حوزه سرطان سر و گردن، انجام مطالعات بیشتر و با طراحی بهتر مورد نیاز است.

چگونه می‌توانیم در مورد احتمال بروز عوارض ناخواسته ناشی از درمان تصمیم بگیریم؟

احتمال بروز عوارض ناخواسته ناشی از رادیوتراپی را می‌توان با استفاده از مدل‌هایی که به مدل‌های NTCP معروف هستند، محاسبه کرد. مدل‌های NTCP خطر بروز عوارض جانبی ناشی از تابش اشعه را براساس اطلاعات بیمار، بیماری و درمان آن‌ها، محاسبه می‌کنند.

ما به دنبال چه یافته‌ای بودیم؟

رادیوتراپی، درمان اصلی بیماران مبتلا به سرطان سر و گردن است. با این حال، رادیوتراپی بخش‌های سالم و گاهی حیاتی ناحیه سر و گردن را در معرض تابش قرار می‌دهد. این امر ممکن است منجر به آسیب به این اندام‌های طبیعی، مانند اختلال در تولید بزاق، شود که می‌تواند پیامدهای مهمی برای کیفیت زندگی بیماران مبتلا به سرطان سر و گردن تحت درمان با رادیوتراپی داشته باشد. برای رسیدن به تعادل مطلوب میان کنترل تومور و پیشگیری از بروز عوارض جانبی ناشی از تابش اشعه، استفاده از مدل‌های احتمال عوارض بافت طبیعی (NTCP) می‌توانند مفید باشند. این مدل‌ها خطر بروز عوارض جانبی ناشی از تابش اشعه را براساس اطلاعات بیمار، بیماری و درمان آن‌ها، پیش‌بینی می‌کنند. تعداد قابل توجهی از مدل‌های NTCP برای بیماران مبتلا به سرطان سر و گردن وجود داشته‌اند. هدف ما آن بود که بدانیم کیفیت طراحی، انجام، و آنالیز مطالعه (یعنی خطر سوگیری (bias)) چگونه است، و این مدل‌ها تا چه اندازه می‌توانند خطر بروز عوارض جانبی ناشی از تابش اشعه را پیش‌بینی کنند.

ما چه‌کاری را انجام دادیم؟

ما به دنبال مطالعاتی بودیم که مدل‌های NTCP را در بیماران مبتلا به سرطان سر و گردن توسعه داده و/یا اعتبارسنجی کردند.

ما به چه نتایجی رسیدیم؟

در اکثر 592 مدل توسعه‌یافته از 140,767 بیمار در 143 مقاله شناسایی‌شده، کیفیت مدل‌ها کافی نبود؛ و بررسی نشده که عملکرد آن‌ها در بیماران جدید برای 81% از این مدل‌ها چگونه است. برای 19% باقی‌مانده از مدل‌ها، 152 اعتبارسنجی بیرونی در 34,304 بیمار از 41 مقاله یافت شدند. فقط نه مدل با دو یا چند اعتبارسنجی بیرونی وجود داشتند. این مدل‌ها توانستند بیماران دارای پیامد و بدون پیامد را به‌خوبی تشخیص دهند، اما اغلب مشخص نبود که پیش‌بینی‌های آن‌ها با آنچه مشاهده ‌شد، مطابقت داشت یا خیر، زیرا مورد دوم همیشه ارزیابی و/یا گزارش نشد. در مجموع، کیفیت اکثر این مطالعات در سطح پائین بود.

این مرور تا چه زمانی به‌روز است؟

شواهد تا 8 ژانویه 2024 به‌روز است.

مطالعه چکیده کامل

پیشینه

رادیوتراپی (radiotherapy) درمان اصلی سرطان سر و گردن (head and neck cancer; HNC) است، اما ممکن است عوارض جانبی مختلفی را بر بافت‌های طبیعی اطراف ایجاد کند. برای رسیدن به تعادل مطلوب میان کنترل تومور و پیشگیری از ایجاد سمیّت، مدل‌های احتمال عوارض بافت طبیعی (normal tissue complication probability; NTCP)، خطر ایجاد عوارض جانبی ناشی از رادیوتراپی را در بیماران مبتلا به سرطان سر و گردن (HNC) پیش‌بینی می‌کنند. بااین‌حال، کیفیت طراحی، اجرا و آنالیز مطالعه (یعنی خطر سوگیری (risk of bias; ROB))، هم‌چنین عملکرد پیش‌بینی‌کننده این مدل‌ها، هم‌چنان نیاز به ارزیابی دارند.

اهداف

شناسایی، توصیف و ارزیابی مدل‌های NTCP برای پیش‌بینی خطر ایجاد عوارض جانبی ناشی از تابش اشعه در بیماران مبتلا به HNC.

روش‌های جست‌وجو

ما Ovid MEDLINE؛ Embase و پلتفرم بین‌المللی ثبت کارآزمایی‌های بالینی سازمان جهانی بهداشت را از زمان آغاز تا ژانویه 2024 جست‌وجو کردیم. علاوه‌بر این، منابع ذکرشده در مقالات بازیابی‌شده را غربالگری کردیم.

معیارهای انتخاب

دو نویسنده مرور به‌طور مستقل از هم مقالاتی را که در مورد توسعه و اعتبارسنجی بیرونی (external validation) مدل‌های NTCP برای پیش‌بینی هر نوع عوارض جانبی ناشی از تابش اشعه در بیماران مبتلا به HNC گزارش شدند، وارد کردند.

گردآوری و تجزیه‌وتحلیل داده‌ها

یکی از نویسندگان، داده‌ها را از هر مقاله بر اساس چک‌لیست ارزیابی نقادانه و استخراج داده‌ها برای مرورهای سیستماتیک از مطالعات مدل‌سازی پیش‌بینی استخراج کرد و قابلیت کاربرد و ROB آن‌ها را با استفاده از ابزار ارزیابی ROB مدل پیش‌بینی (Prediction model ROB Assessment Tool) بررسی کرد، درحالی‌که نویسنده دیگر نتایج را با دقت تائید کرد. برای مدل‌هایی که حداقل دوبار برای همان پیامد مطالعه توسعه‌ای اولیه خود، اعتبارسنجی بیرونی شدند، آنالیزهای کیفی را از عملکرد مدل انجام دادیم. سیستم درجه‌بندی توصیه، ارزیابی، توسعه و ارزشیابی (Grading of Recommendations Assessment, Development and Evaluation; GRADE) اعمال نشد، زیرا برای مرورهای مطالعات مدل پیش‌آگهی تعیین نشده است.

نتایج اصلی

میان 592 مدل توسعه‌یافته از 143 مقاله، شامل 140,767 بیمار HNC، فقط 49 مدل (8%) از شش مقاله، ROB پائین و نگرانی‌های کمی در مورد قابلیت کاربرد داشتند. هیچ اعتبارسنجی بیرونی برای 480 مدل (81%) انجام نشد. برای 112 مدل باقی‌مانده و شش مدل بیشتر که واجد شرایط برای مرور حاضر نبودند، 152 مورد اعتبارسنجی بیرونی در 34,304 بیمار مبتلا به HNC در 41 مقاله انجام شدند. نتایج مدل‌هایی که حداقل دوبار اعتبارسنجی بیرونی شدند، در زیر بحث می‌شوند.

مدل‌ها برای خشکی دهان

میان 275 مدل برای خشکی دهان (xerostomia)، دو مدل حداقل دوبار اعتبارسنجی بیرونی شدند.

مدل Beetz 2012b برای خشکی دهان شش‌ماه پس‌از رادیوتراپی در دو مطالعه اعتبارسنجی شد. آماره-c از 0.70 تا 0.74 متغیر بود. عملکرد کالیبراسیون (calibration performance) در یک مطالعه گزارش شد. یک مطالعه اعتبارسنجی، در تمام حوزه‌ها دارای ROB پائین ارزیابی شد، درحالی‌که مطالعه دیگر در حوزه آنالیز دارای ROB بالا ارزیابی شد.

مدل Cavallo 2021 برای خشکی دهان حاد در طول رادیوتراپی برای بیماران مبتلا به سرطان نازوفارنکس، در همان مطالعه، با استفاده از دو نوع گروه مختلف، اعتبارسنجی بیرونی شد. آماره-c از 0.68 تا 0.73 متغیر بوده و نمودارهای کالیبراسیون (calibration plots) در هر دو گروه گزارش شدند. هر دو اعتبارسنجی دارای ROB نامشخص در حوزه شرکت‌کنندگان بودند، زیرا هیچ اطلاعات دقیقی در مورد ورود آن‌ها ارائه نشد.

مدل‌هایی برای اختلال بلع

میان 86 مدل برای اختلال بلع (dysphagia)، دو مدل حداقل دوبار اعتبارسنجی بیرونی شدند.

مدل Christianen 2012 برای اختلال بلع شش‌ماه پس‌از رادیوتراپی در پنج مطالعه اعتبارسنجی شد. آماره-c از 0.66 تا 0.75 متغیر بود. عملکرد کالیبراسیون در همه آن‌ها ارزیابی شد، درحالی‌که چهار مورد از آن‌ها به دلیل حجم‌نمونه کم، ROB بالا در حوزه آنالیز داشتند.

مدل Wopken 2014b برای وابستگی به تغذیه لوله‌ای شش‌ماه پس‌از رادیوتراپی در سه مطالعه اعتبارسنجی بیرونی، تائید شد. آماره-c از 0.79 تا 0.95 متغیر بود، درحالی‌که کالیبراسیون در تمام مطالعات ارزیابی شد. با توجه به حجم کم مجموعه داده‌های اعتبارسنجی، آن‌ها ROB بالا در حوزه آنالیز داشتند.

مدل‌های کم‌کاری تیروئید

از 66 مدل برای کم‌کاری تیروئید (hypothyroidism)، دو مدل حداقل دوبار اعتبارسنجی بیرونی شدند. علاوه‌بر این، مدل دیگری وجود داشت که در ابتدا برای بیماران مبتلا به HNC توسعه داده نشد، اما در این حوزه اعتبارسنجی شد.

مدل Boomsma 2012 برای کم‌کاری تیروئید ظرف دو سال پس‌از رادیوتراپی در دو مطالعه اعتبارسنجی بیرونی شد. آماره-c از 0.64 تا 0.74 متغیر بود، درحالی‌که فقط یک مطالعه عملکرد کالیبراسیون آن را گزارش کرد. هر دو مطالعه اعتبارسنجی با ROB بالا در حوزه آنالیز همراه بودند.

مدل Ronjom 2013 برای کم‌کاری تیروئید ناشی از تابش اشعه در سه مطالعه اعتبارسنجی شد. آماره-c از 0.65 تا 0.69 متغیر بودند و نمودارهای کالیبراسیون فقط در یک مطالعه گزارش شدند. دو مطالعه اعتبارسنجی با ROB بالا و دیگری با ROB نامشخص در حوزه آنالیز ارزیابی شدند.

مدل Cella 2012 در ابتدا برای پیش‌بینی کم‌کاری تیروئید ناشی از تابش اشعه در بیماران مبتلا به لنفوم هوچکین توسعه داده شد. در دو مطالعه اعتبارسنجی در بیماران مبتلا به HNC، آماره-c از 0.65 تا 0.68 متغیر بود، اما عملکرد کالیبراسیون گزارش نشد. یک مطالعه اعتبارسنجی با ROB بالا و مطالعه دیگر با ROB نامشخص در حوزه آنالیز رتبه‌بندی شدند.

مدل‌هایی برای آسیب لوب گیجگاهی

میان شش مدل برای آسیب لوب گیجگاهی (temporal lobe injury)، دو مدل حداقل دوبار اعتبارسنجی بیرونی شدند.

مدل OuYang 2023، با استفاده از یادگیری عمیق در بیماران مبتلا به سرطان نازوفارنکس، در همان مقاله با استفاده از دو گروه مختلف، اعتبارسنجی شد. آماره-c از 0.80 تا 0.82 متغیر بود، درحالی‌که عملکرد کالیبراسیون در هر دو گروه ارزیابی شد. هر دو اعتبارسنجی در تمام حوزه‌ها با ROB پائین ارزیابی شدند.

مدل Wen 2021 برای پیش‌بینی آسیب لوب گیجگاهی در بیماران مبتلا به سرطان نازوفارنکس که به تازگی تشخیص داده شدند، توسعه یافت. این مدل توسط OuYang 2023 با استفاده از دو گروه اعتبارسنجی شد. آماره-c از 0.77 تا 0.79 متغیر بود، درحالی‌که عملکرد کالیبراسیون گزارش نشد. هر دو اعتبارسنجی با ROB نامشخص در حوزه آنالیز قضاوت شدند.

مدل‌هایی برای پیامدهای مربوط به گرفتگی صدا، خستگی، تهوع-استفراغ، درد گلو، آسپیراسیون

هیچ مدلی حداقل دوبار اعتبارسنجی بیرونی نشدند.

نتیجه‌گیری‌های نویسندگان

میان 592 مدل توسعه‌یافته، تعداد محدودی از کیفیت مناسبی برخوردار بودند. فقط یک‌پنجم آن‌ها به صورت بیرونی اعتبارسنجی شدند، که از این تعداد، فقط نه مدل حداقل دوبار اعتبارسنجی شدند. این نه مدل عملکرد تشخیصی قابل قبولی را در اعتبارسنجی بیرونی نشان دادند. بااین‌حال، عملکرد کالیبراسیون آن‌ها همیشه گزارش نشد. علاوه‌بر این، اکثر مطالعات اعتبارسنجی به‌دلیل مشکلات موجود در حوزه آنالیز، ROB بالایی داشتند. در نتیجه، این مرور نیاز به انجام بیشتر مطالعات اعتبارسنجی بیرونی را پیش‌از اجرای مدل‌های توسعه‌یافته در عملکرد بالینی و بهبود کیفیت انجام و ارائه گزارش را از مطالعات مدل پیش‌بینی نشان می‌دهد.

یادداشت‌های ترجمه

این متن توسط مرکز کاکرین ایران به فارسی ترجمه شده است.

استناد

Takada T, Tambas M, Clementel E, Leeuwenberg A, Sharabiani M, Damen JAAG, Dunias ZS, Nauta JF, Idema DL, Choi J, Meijerink LM, Langendijk JA, Moons KG, Schuit E. Prognostic models for radiation-induced complications after radiotherapy in head and neck cancer patients. Cochrane Database of Systematic Reviews 2025, Issue 9. Art. No.: CD014745. DOI: 10.1002/14651858.CD014745.pub2.

در دسترس به زیان‌های