پیامهای کلیدی
° بسیاری از مدلهای احتمال عوارض بافت طبیعی (normal tissue complication probability; NTCP) برای پیشبینی عوارض ناخواسته پساز رادیوتراپی (radiotherapy) در بیماران مبتلا به سرطان سر و گردن توسعه یافتهاند، اما اکثر آنها به اندازه کافی از نظر بیرونی اعتبارسنجی نشدهاند، یعنی با بیمارانی که در مطالعه توسعه مدل اصلی شرکت نداشتند، آزمایش نشدند تا مشخص شود که واقعا چقدر خوب عوارض ناخواسته را پیشبینی میکنند.
° برای مدلهایی که علاوهبر مطالعات اولیه توسعه مدل، در دو یا چند مطالعه دیگر آزمایش شدند، کیفیت تست و گزارش نتایج آنها عموما ضعیف بود، بنابراین دانستن اینکه چقدر میتوانند مفید باشند، دشوار است.
° برای بررسی این موضوع در حوزه سرطان سر و گردن، انجام مطالعات بیشتر و با طراحی بهتر مورد نیاز است.
چگونه میتوانیم در مورد احتمال بروز عوارض ناخواسته ناشی از درمان تصمیم بگیریم؟
احتمال بروز عوارض ناخواسته ناشی از رادیوتراپی را میتوان با استفاده از مدلهایی که به مدلهای NTCP معروف هستند، محاسبه کرد. مدلهای NTCP خطر بروز عوارض جانبی ناشی از تابش اشعه را براساس اطلاعات بیمار، بیماری و درمان آنها، محاسبه میکنند.
ما به دنبال چه یافتهای بودیم؟
رادیوتراپی، درمان اصلی بیماران مبتلا به سرطان سر و گردن است. با این حال، رادیوتراپی بخشهای سالم و گاهی حیاتی ناحیه سر و گردن را در معرض تابش قرار میدهد. این امر ممکن است منجر به آسیب به این اندامهای طبیعی، مانند اختلال در تولید بزاق، شود که میتواند پیامدهای مهمی برای کیفیت زندگی بیماران مبتلا به سرطان سر و گردن تحت درمان با رادیوتراپی داشته باشد. برای رسیدن به تعادل مطلوب میان کنترل تومور و پیشگیری از بروز عوارض جانبی ناشی از تابش اشعه، استفاده از مدلهای احتمال عوارض بافت طبیعی (NTCP) میتوانند مفید باشند. این مدلها خطر بروز عوارض جانبی ناشی از تابش اشعه را براساس اطلاعات بیمار، بیماری و درمان آنها، پیشبینی میکنند. تعداد قابل توجهی از مدلهای NTCP برای بیماران مبتلا به سرطان سر و گردن وجود داشتهاند. هدف ما آن بود که بدانیم کیفیت طراحی، انجام، و آنالیز مطالعه (یعنی خطر سوگیری (bias)) چگونه است، و این مدلها تا چه اندازه میتوانند خطر بروز عوارض جانبی ناشی از تابش اشعه را پیشبینی کنند.
ما چهکاری را انجام دادیم؟
ما به دنبال مطالعاتی بودیم که مدلهای NTCP را در بیماران مبتلا به سرطان سر و گردن توسعه داده و/یا اعتبارسنجی کردند.
ما به چه نتایجی رسیدیم؟
در اکثر 592 مدل توسعهیافته از 140,767 بیمار در 143 مقاله شناساییشده، کیفیت مدلها کافی نبود؛ و بررسی نشده که عملکرد آنها در بیماران جدید برای 81% از این مدلها چگونه است. برای 19% باقیمانده از مدلها، 152 اعتبارسنجی بیرونی در 34,304 بیمار از 41 مقاله یافت شدند. فقط نه مدل با دو یا چند اعتبارسنجی بیرونی وجود داشتند. این مدلها توانستند بیماران دارای پیامد و بدون پیامد را بهخوبی تشخیص دهند، اما اغلب مشخص نبود که پیشبینیهای آنها با آنچه مشاهده شد، مطابقت داشت یا خیر، زیرا مورد دوم همیشه ارزیابی و/یا گزارش نشد. در مجموع، کیفیت اکثر این مطالعات در سطح پائین بود.
این مرور تا چه زمانی بهروز است؟
شواهد تا 8 ژانویه 2024 بهروز است.
مطالعه چکیده کامل
رادیوتراپی (radiotherapy) درمان اصلی سرطان سر و گردن (head and neck cancer; HNC) است، اما ممکن است عوارض جانبی مختلفی را بر بافتهای طبیعی اطراف ایجاد کند. برای رسیدن به تعادل مطلوب میان کنترل تومور و پیشگیری از ایجاد سمیّت، مدلهای احتمال عوارض بافت طبیعی (normal tissue complication probability; NTCP)، خطر ایجاد عوارض جانبی ناشی از رادیوتراپی را در بیماران مبتلا به سرطان سر و گردن (HNC) پیشبینی میکنند. بااینحال، کیفیت طراحی، اجرا و آنالیز مطالعه (یعنی خطر سوگیری (risk of bias; ROB))، همچنین عملکرد پیشبینیکننده این مدلها، همچنان نیاز به ارزیابی دارند.
اهداف
شناسایی، توصیف و ارزیابی مدلهای NTCP برای پیشبینی خطر ایجاد عوارض جانبی ناشی از تابش اشعه در بیماران مبتلا به HNC.
روشهای جستوجو
ما Ovid MEDLINE؛ Embase و پلتفرم بینالمللی ثبت کارآزماییهای بالینی سازمان جهانی بهداشت را از زمان آغاز تا ژانویه 2024 جستوجو کردیم. علاوهبر این، منابع ذکرشده در مقالات بازیابیشده را غربالگری کردیم.
معیارهای انتخاب
دو نویسنده مرور بهطور مستقل از هم مقالاتی را که در مورد توسعه و اعتبارسنجی بیرونی (external validation) مدلهای NTCP برای پیشبینی هر نوع عوارض جانبی ناشی از تابش اشعه در بیماران مبتلا به HNC گزارش شدند، وارد کردند.
گردآوری و تجزیهوتحلیل دادهها
یکی از نویسندگان، دادهها را از هر مقاله بر اساس چکلیست ارزیابی نقادانه و استخراج دادهها برای مرورهای سیستماتیک از مطالعات مدلسازی پیشبینی استخراج کرد و قابلیت کاربرد و ROB آنها را با استفاده از ابزار ارزیابی ROB مدل پیشبینی (Prediction model ROB Assessment Tool) بررسی کرد، درحالیکه نویسنده دیگر نتایج را با دقت تائید کرد. برای مدلهایی که حداقل دوبار برای همان پیامد مطالعه توسعهای اولیه خود، اعتبارسنجی بیرونی شدند، آنالیزهای کیفی را از عملکرد مدل انجام دادیم. سیستم درجهبندی توصیه، ارزیابی، توسعه و ارزشیابی (Grading of Recommendations Assessment, Development and Evaluation; GRADE) اعمال نشد، زیرا برای مرورهای مطالعات مدل پیشآگهی تعیین نشده است.
نتایج اصلی
میان 592 مدل توسعهیافته از 143 مقاله، شامل 140,767 بیمار HNC، فقط 49 مدل (8%) از شش مقاله، ROB پائین و نگرانیهای کمی در مورد قابلیت کاربرد داشتند. هیچ اعتبارسنجی بیرونی برای 480 مدل (81%) انجام نشد. برای 112 مدل باقیمانده و شش مدل بیشتر که واجد شرایط برای مرور حاضر نبودند، 152 مورد اعتبارسنجی بیرونی در 34,304 بیمار مبتلا به HNC در 41 مقاله انجام شدند. نتایج مدلهایی که حداقل دوبار اعتبارسنجی بیرونی شدند، در زیر بحث میشوند.
مدلها برای خشکی دهان
میان 275 مدل برای خشکی دهان (xerostomia)، دو مدل حداقل دوبار اعتبارسنجی بیرونی شدند.
مدل Beetz 2012b برای خشکی دهان ششماه پساز رادیوتراپی در دو مطالعه اعتبارسنجی شد. آماره-c از 0.70 تا 0.74 متغیر بود. عملکرد کالیبراسیون (calibration performance) در یک مطالعه گزارش شد. یک مطالعه اعتبارسنجی، در تمام حوزهها دارای ROB پائین ارزیابی شد، درحالیکه مطالعه دیگر در حوزه آنالیز دارای ROB بالا ارزیابی شد.
مدل Cavallo 2021 برای خشکی دهان حاد در طول رادیوتراپی برای بیماران مبتلا به سرطان نازوفارنکس، در همان مطالعه، با استفاده از دو نوع گروه مختلف، اعتبارسنجی بیرونی شد. آماره-c از 0.68 تا 0.73 متغیر بوده و نمودارهای کالیبراسیون (calibration plots) در هر دو گروه گزارش شدند. هر دو اعتبارسنجی دارای ROB نامشخص در حوزه شرکتکنندگان بودند، زیرا هیچ اطلاعات دقیقی در مورد ورود آنها ارائه نشد.
مدلهایی برای اختلال بلع
میان 86 مدل برای اختلال بلع (dysphagia)، دو مدل حداقل دوبار اعتبارسنجی بیرونی شدند.
مدل Christianen 2012 برای اختلال بلع ششماه پساز رادیوتراپی در پنج مطالعه اعتبارسنجی شد. آماره-c از 0.66 تا 0.75 متغیر بود. عملکرد کالیبراسیون در همه آنها ارزیابی شد، درحالیکه چهار مورد از آنها به دلیل حجمنمونه کم، ROB بالا در حوزه آنالیز داشتند.
مدل Wopken 2014b برای وابستگی به تغذیه لولهای ششماه پساز رادیوتراپی در سه مطالعه اعتبارسنجی بیرونی، تائید شد. آماره-c از 0.79 تا 0.95 متغیر بود، درحالیکه کالیبراسیون در تمام مطالعات ارزیابی شد. با توجه به حجم کم مجموعه دادههای اعتبارسنجی، آنها ROB بالا در حوزه آنالیز داشتند.
مدلهای کمکاری تیروئید
از 66 مدل برای کمکاری تیروئید (hypothyroidism)، دو مدل حداقل دوبار اعتبارسنجی بیرونی شدند. علاوهبر این، مدل دیگری وجود داشت که در ابتدا برای بیماران مبتلا به HNC توسعه داده نشد، اما در این حوزه اعتبارسنجی شد.
مدل Boomsma 2012 برای کمکاری تیروئید ظرف دو سال پساز رادیوتراپی در دو مطالعه اعتبارسنجی بیرونی شد. آماره-c از 0.64 تا 0.74 متغیر بود، درحالیکه فقط یک مطالعه عملکرد کالیبراسیون آن را گزارش کرد. هر دو مطالعه اعتبارسنجی با ROB بالا در حوزه آنالیز همراه بودند.
مدل Ronjom 2013 برای کمکاری تیروئید ناشی از تابش اشعه در سه مطالعه اعتبارسنجی شد. آماره-c از 0.65 تا 0.69 متغیر بودند و نمودارهای کالیبراسیون فقط در یک مطالعه گزارش شدند. دو مطالعه اعتبارسنجی با ROB بالا و دیگری با ROB نامشخص در حوزه آنالیز ارزیابی شدند.
مدل Cella 2012 در ابتدا برای پیشبینی کمکاری تیروئید ناشی از تابش اشعه در بیماران مبتلا به لنفوم هوچکین توسعه داده شد. در دو مطالعه اعتبارسنجی در بیماران مبتلا به HNC، آماره-c از 0.65 تا 0.68 متغیر بود، اما عملکرد کالیبراسیون گزارش نشد. یک مطالعه اعتبارسنجی با ROB بالا و مطالعه دیگر با ROB نامشخص در حوزه آنالیز رتبهبندی شدند.
مدلهایی برای آسیب لوب گیجگاهی
میان شش مدل برای آسیب لوب گیجگاهی (temporal lobe injury)، دو مدل حداقل دوبار اعتبارسنجی بیرونی شدند.
مدل OuYang 2023، با استفاده از یادگیری عمیق در بیماران مبتلا به سرطان نازوفارنکس، در همان مقاله با استفاده از دو گروه مختلف، اعتبارسنجی شد. آماره-c از 0.80 تا 0.82 متغیر بود، درحالیکه عملکرد کالیبراسیون در هر دو گروه ارزیابی شد. هر دو اعتبارسنجی در تمام حوزهها با ROB پائین ارزیابی شدند.
مدل Wen 2021 برای پیشبینی آسیب لوب گیجگاهی در بیماران مبتلا به سرطان نازوفارنکس که به تازگی تشخیص داده شدند، توسعه یافت. این مدل توسط OuYang 2023 با استفاده از دو گروه اعتبارسنجی شد. آماره-c از 0.77 تا 0.79 متغیر بود، درحالیکه عملکرد کالیبراسیون گزارش نشد. هر دو اعتبارسنجی با ROB نامشخص در حوزه آنالیز قضاوت شدند.
مدلهایی برای پیامدهای مربوط به گرفتگی صدا، خستگی، تهوع-استفراغ، درد گلو، آسپیراسیون
هیچ مدلی حداقل دوبار اعتبارسنجی بیرونی نشدند.
نتیجهگیریهای نویسندگان
میان 592 مدل توسعهیافته، تعداد محدودی از کیفیت مناسبی برخوردار بودند. فقط یکپنجم آنها به صورت بیرونی اعتبارسنجی شدند، که از این تعداد، فقط نه مدل حداقل دوبار اعتبارسنجی شدند. این نه مدل عملکرد تشخیصی قابل قبولی را در اعتبارسنجی بیرونی نشان دادند. بااینحال، عملکرد کالیبراسیون آنها همیشه گزارش نشد. علاوهبر این، اکثر مطالعات اعتبارسنجی بهدلیل مشکلات موجود در حوزه آنالیز، ROB بالایی داشتند. در نتیجه، این مرور نیاز به انجام بیشتر مطالعات اعتبارسنجی بیرونی را پیشاز اجرای مدلهای توسعهیافته در عملکرد بالینی و بهبود کیفیت انجام و ارائه گزارش را از مطالعات مدل پیشبینی نشان میدهد.
این متن توسط مرکز کاکرین ایران به فارسی ترجمه شده است.