تخمین‌های مربوط به اثربخشی درمان به دست آمده از کارآزمایی‌های تصادفی‌سازی و کنترل‌شده و مطالعات مشاهده‌ای تا چه حد شبیه به هم هستند؟

پیام‌های کلیدی

- به‌طور میانگین، تفاوت در برآوردهای اثرگذاری (effect estimate) کارآزمایی‌های تصادفی‌سازی و کنترل‌شده (randomised controlled trials; RCTs) و مطالعات مشاهده‌ای بسیار اندک بود. برآوردهای اثرگذاری، مفاهیم آماری هستند که اندازه تاثیر یک مداخله را بر اساس تفاوت میان پیامدهای دو گروه از افراد در یک کارآزمایی یا مطالعه بالینی توصیف می‌کنند.
- به انجام پژوهش‌های بیشتر با بررسی دقیق عواملی که ممکن است بر شباهت‌ها و تفاوت‌های برآوردهای اثرگذاری میان انواع مختلف مطالعات تاثیر بگذارند، نیاز داریم.

RCTها و مطالعات مشاهده‌ای چه هستند، و چرا برآوردهای اثرگذاری آنها به‌طور بالقوه متفاوت است؟

کارآزمایی‌های تصادفی‌سازی و کنترل‌شده (randomised controlled trials; RCTs)، نوعی پژوهش تجربی در حوزه مراقبت سلامت هستند که در آنها شرکت‌کنندگان به‌طور تصادفی به یکی از دو (یا چند) گروه درمانی تقسیم می‌شوند. به یک گروه، درمان آزمایشی داده می‌شود (که تحت عنوان «مداخله» نیز نامیده می‌شود)؛ گروه دیگر که گروه «کنترل» است، مداخله دریافت نمی‌کند. RCTها این موضوع را تست می‌کنند که یک درمان آزمایشی در شرایط ایده‌آل تا چه حد موثر و بی‌خطر است.

مطالعات مشاهده‌ای سعی می‌کنند اثربخشی یک مداخله را در سناریوهای غیرتجربی و در «دنیای واقعی» اندازه‌گیری کنند. مطالعات مورد-شاهدی (یا گذشته‌نگر) و مطالعات کوهورت دو نوع شایع از مطالعات مشاهده‌ای هستند. مطالعات مورد-شاهدی، گروهی از افراد مبتلا به شرایط/بیماری خاص را با گروهی که مبتلا نیستند، اما مشابه یکدیگر هستند، مقایسه می‌کنند. مطالعات کوهورت، گروهی از افراد را با یک ویژگی مشترک در طول زمان دنبال می‌کنند تا مشخص شود که چه تعداد به پیامد سلامت مورد نظر دست می‌یابند.

گاهی اوقات، نتایج RCTها و مطالعات مشاهده‌ای که به یک سوال می‌پردازند، ممکن است متفاوت باشند. این نوع مطالعه در نحوه انجام و حساسیت به خطای سیستماتیک متفاوت هستند.

ما به دنبال چه یافته‌ای بودیم؟

ما خواستیم تاثیر نوع مطالعه (RCT در برابر مطالعات مشاهده‌ای) را بر جمع‌بندی برآورد اثرگذاری ارزیابی کرده و جنبه‌های روش‌شناسی (methodology) را که ممکن است تفاوت‌ها را توضیح دهند، بررسی کنیم.

ما چه کاری را انجام دادیم؟

بانک‌های اطلاعاتی را برای یافتن مرورهایی جست‌وجو کردیم که به‌طور سیستماتیک برآوردهای اثرگذاری گزارش‌شده را در RCTها و مطالعات مشاهده‌ای که به یک سوال مشابه پژوهشی سلامت پرداختند، مقایسه کردند. به دنبال مرورهایی بودیم که شامل هر گونه پیامد مراقبت سلامت بودند، بدون محدودیت در زبان نگارش مقاله. برای یافتن مرورها/بررسی‌های اجمالی منتشرشده میان 01 ژانویه 1990 تا 12 می 2022 به جست‌وجو پرداختیم. سپس نتایج مرورها را با هم مقایسه کرده، و شواهد به دست آمده را خلاصه کردیم. اطمینان خود را به این شواهد بر اساس عواملی مانند روش‌ها و حجم نمونه مرورها، و سازگاری یافته‌ها در طول مرورها ارزیابی کردیم.

ما به چه نتایجی رسیدیم؟

تعداد 47 مرور مرتبط را شناسایی کردیم؛ 34 مورد داده‌هایی را برای آنالیز اصلی ارائه دادند. این مرورها برآوردهای اثرگذاری RCTها را با مطالعات کوهورت، مطالعات مورد-شاهدی یا هر دو مقایسه کردند. آنها به موضوعات مختلف مرتبط با سلامت پرداختند. مطالعات در کشورهای سراسر جهان انجام شدند، اما بیشتر آنها از ایالات متحده آمریکا بودند. دوازده مرور هیچ اطلاعاتی را در مورد منبع حمایت مالی گزارش نکردند. در 8 مرور، نویسندگان عدم دریافت حمایت مالی را گزارش کردند. در 23 مرور، نویسندگان دریافت حمایت مالی عمومی را، مانند حمایت مالی دولتی یا از طرف دانشگاه‌ها یا بنیادها، گزارش کردند. دو مرور توسط اتحادیه اروپا تامین مالی شدند، دو مرور نیز دریافت حمایت مالی را از طرف صنعت گزارش کردند. اکثر مرورها، منابع حمایت مالی متعددی را گزارش کردند.

نتایج اصلی

- ما به این نتیجه رسیدیم که ممکن است تفاوت بسیار کمی در برآوردهای اثرگذاری RCTها و مطالعات مشاهده‌ای وجود داشته باشد یا هیچ تفاوتی وجود نداشته باشد.
- زمانی که برآوردهای اثرگذاری مطالعاتی را که فقط داروها را بررسی کردند (بر خلاف دیگر درمان‌های مراقبت سلامت، مانند جراحی یا فیزیوتراپی) مقایسه می‌کنیم، ممکن است تفاوت‌های کوچکی وجود داشته باشند.

همچنین تفاوت کمی در برآوردهای اثرگذاری که مبتنی بر داده‌های زیر بودند، پیدا کردیم:
- متاآنالیز RCTها و مطالعات مشاهده‌ای که دارای ناهمگونی آماری (statistical heterogeneity) قابل توجهی بودند؛ به عبارت دیگر، تنوع در تاثیرات مداخله‌ای که در مطالعات مختلف ارزیابی شدند؛
- مطالعات مشاهده‌ای که یا از روش‌هایی برای کنترل ویژگی‌های جمعیت که می‌توانستند بر اثربخشی مداخله تاثیر داشته باشند، استفاده نکردند یا نحوه به‌کارگیری این روش‌ها مشخص نبود (تطابق امتیاز تمایل (propensity score adjustment))؛
- مطالعات مشاهده‌ای که اطلاعات کافی را در مورد طراحی‌های مطالعه خود ارائه نکردند.

محدودیت‌های شواهد چه هستند؟

اعتماد چندانی به شواهد نداریم زیرا مرورهای در نظر گرفته شده ممکن است به دلیل نحوه انجام‌شان در معرض خطر خطاهای سیستماتیک قرار داشته باشند. علاوه بر این، مرورهای مذکور، مربوط به افراد و مداخلات متفاوتی بودند، به این معنا که یافته‌های فردی بین این مرورها تفاوت قابل توجهی داشتند.

این مرور تا چه زمانی به‌روز است؟

شواهد تا می‌ 2022 به‌روز است.

نتیجه‌گیری‌های نویسندگان: 

هیچ تفاوتی را میان برآوردهای اثرگذاری از RCTها و مطالعات مشاهده‌ای پیدا نکردیم یا تفاوت بسیار کمی به دست آمدند. این یافته‌ها تا حد زیادی با یافته‌های پژوهش‌هایی که اخیرا منتشر شدند، هم‌سو و سازگار هستند. هنگام بررسی دلایل عدم توافق میان نتایج RCTها و مطالعات مشاهده‌ای، مانند تفاوت در جمعیت، مداخله، مقایسه‌کننده و پیامدهای بررسی‌شده در مطالعات مربوطه، باید عواملی غیر از طراحی مطالعه در نظر گرفته شوند. نتایج ما تاکید می‌کنند که برای نویسندگان مرور مهم است که نه تنها طراحی مطالعه، بلکه سطح ناهمگونی را در متاآنالیز RCTها یا مطالعات مشاهده‌ای در نظر بگیرند. برای اطمینان از اینکه تخمین‌های انجام شده نشان‌دهنده اثربخشی واقعی مداخله هستند یا خیر، نیاز به درک بهتری از نحوه تاثیر این عوامل وجود دارد.

خلاصه کامل را بخوانید...
پیشینه: 

پژوهشگران و تصمیم‌گیرندگان اغلب از شواهد به دست آمده از کارآزمایی‌های تصادفی‌سازی و کنترل‌شده (randomised controlled trials; RCTs) برای تعیین کارآمدی یا اثربخشی یک درمان یا مداخله استفاده می‌کنند. مطالعاتی با طراحی‌های مشاهده‌ای اغلب برای اندازه‌گیری اثربخشی یک مداخله در سناریوهای «دنیای واقعی» استفاده می‌شوند. طراحی‌های متعدد مطالعات و تغییرات آنها (شامل طراحی‌های تصادفی‌سازی شده و مشاهده‌ای) برای بررسی اثربخشی مقایسه‌ای در تلاش برای ارائه تخمینی بی‌طرفانه از موثرتر یا بی‌خطرتر بودن یک درمان نسبت به دیگری برای یک جمعیت خاص استفاده می‌شود. انجام یک آنالیز سیستماتیک به‌روز شده برای شناسایی تفاوت در برآوردهای اثرگذاری (effect estimate) از RCTها و مطالعات مشاهده‌ای مورد نیاز است. این مرور به‌روز شده، نتایج مرورهای روش‌شناسی (methodology) را خلاصه می‌کند که برآورد اثرگذاری مطالعات مشاهده‌ای را با RCTهایی از سنتز شواهدی که به همان سوال پژوهشی سلامت پرداختند، مقایسه کردند.

اهداف: 

ارزیابی و مقایسه برآوردهای اثرگذاری سنتز شده بر اساس نوع مطالعه، تقابل RCTها با مطالعات مشاهده‌ای.

کشف عواملی که ممکن است تفاوت‌ها را در برآوردهای اثرگذاری سنتز شده از RCTها در برابر مطالعات مشاهده‌ای توضیح دهند (مانند ناهمگونی (heterogeneity)، نوع طراحی مطالعه مشاهده‌ای، نوع مداخله، و استفاده از تطابق امتیاز تمایل (propensity score adjustment)).

شناسایی شکاف پژوهش‌های موجود که به مقایسه برآوردهای اثرگذاری در انواع مختلف مطالعه پرداختند.

روش‌های جست‌وجو: 

MEDLINE، بانک اطلاعاتی مرورهای سیستماتیک کاکرین (Cochrane Database of Systematic Reviews)، بانک‌های اطلاعاتی Web of Science، و Epistemonikos را تا می 2022 جست‌وجو کردیم. منابع را بررسی کردیم، جست‌وجوهای استنادی را انجام دادیم و با نویسندگان مرور تماس گرفتیم تا مرورهای بیشتری را شناسایی کنیم.

معیارهای انتخاب: 

مرورهای روش‌شناسی سیستماتیکی را وارد کردیم که برآوردهای اثرگذاری کمّی را برای اندازه‌گیری کارآمدی یا اثربخشی مداخلات تست‌شده در RCTها در برابر مطالعات مشاهده‌ای مقایسه ‌کردند. مرورهای وارد شده، RCTها را با مطالعات مشاهده‌ای (شامل طراحی‌های کوهورت گذشته‌نگر و آینده‌نگر، مورد-شاهدی و مقطعی (cross-sectional)) مقایسه کردند. مرورهایی که RCTها را با مطالعاتی مقایسه ‌کردند که از نوعی تخصیص (allocation) همزمان استفاده کردند، برای ورود واجد شرایط نبودند.

گردآوری و تجزیه‌وتحلیل داده‌ها: 

با استفاده از نتایج حاصل از مطالعات مشاهده‌ای به ‌عنوان گروه مرجع، جمع‌بندی نسبی برآورد اثرگذاری (با محاسبه خطرات نسبی (RRs)، نسبت‌های شانس (ORs)، نسبت‌های خطر (HRs)، تفاوت‌های میانگین (MDs) و تفاوت‌های میانگین استانداردشده (SMDs)) را بررسی کردیم تا ببینیم که تاثیر مداخله بر نسبت نسبت‌های شانس (ratio of odds ratios; ROR) یا نسبت خطرات نسبی (ratio of risk ratios; RRR)، نسبت نسبت‌های خطر (ratio of hazard ratios; RHR) و تفاوت در تفاوت‌های میانگین (استانداردشده) (D(S)MD) به‌طور نسبی بزرگ‌تر بودند یا کوچک‌تر.

اگر مرور مذکور تخمینی را برای مقایسه نتایج حاصل از RCTها و مطالعات مشاهده‌ای ارائه نداد، خودمان با تجمیع تخمین‌های مربوط به مطالعات مشاهده‌ای و RCTها به ترتیب، چنین تخمینی را ایجاد کردیم. در تمام مرورها، این نسبت‌ها را سنتز کردیم تا نسبت تجمعی را از نسبت‌هایی تولید کنیم که برآورد اثرگذاری RCTها را با برآورد نتایج مطالعات مشاهده‌ای مقایسه کردند. در بررسی اجمالی مرورها، ROR یا RRR را برای هر بررسی اجمالی با استفاده از مطالعات مشاهده‌ای به‌ عنوان معیار مرجع تخمین زدیم.

خطر سوگیری (bias) را در مرورهای واردشده ارزیابی کردیم (در مجموع با استفاده از نه معیار). برای دریافت رتبه‌بندی کلی خطر پائین سوگیری، یک مرور لازم بود معیارهای صریح را برای انتخاب مطالعه، نمونه کامل از مطالعات داشته، و برای تفاوت‌های روش‌شناسی مطالعه و ناهمگونی مطالعه کنترل شده باشد. مرورها/بررسی‌های اجمالی را که این چهار معیار را نداشتند، در کل دارای خطر بالای سوگیری ارزیابی کردیم.

قطعیت شواهد را، متشکل از سنتز شواهد متعدد با رویکرد درجه‌بندی توصیه، ارزیابی، توسعه و ارزشیابی (Grading of Recommendations Assessment, Development and Evaluation; GRADE) ارزیابی کردیم.

نتایج اصلی: 

در مجموع 47 مورد، 39 مرور سیستماتیک و هشت بررسی اجمالی از مرورها، را در این مرور گنجاندیم. سی‌ و چهار مورد از آنها داده‌هایی را برای آنالیزهای اولیه ارائه کردند. بر اساس داده‌های موجود، متوجه شدیم که مرورها/بررسی‌های اجمالی، شامل 2869 RCT با 3،882،115 شرکت‌کننده، و 3924 مطالعه مشاهده‌ای با 19،499،970 شرکت‌کننده بودند.

تعداد 11 مرور/بررسی اجمالی را به‌طور کلی دارای خطر پائین سوگیری، و 36 مورد را دارای خطر نامشخص یا بالای سوگیری رتبه‌بندی کردیم. نگرانی اصلی در مورد مرورها/بررسی‌های اجمالی آن بود که برخی از آنها کیفیت مطالعات واردشده را ارزیابی نکردند، و برخی نتوانستند تفاوت‌های میان طراحی‌های مطالعه را به درستی ارزیابی کنند - برای مثال، آنها به جای آنالیزهای جداگانه برای مطالعات کوهورت و مورد-شاهدی، آنالیزهای کلی را از تمامی مطالعات مشاهده‌ای انجام دادند.

هنگام تجمیع RORها و RRRها، محاسبه نسبت نسبت‌ها (ratio of ratios) هیچ تفاوتی را میان برآوردهای اثرگذاری به دست آمده از RCTها در برابر مطالعات مشاهده‌ای نشان نداد یا تفاوت بسیار کمی را نشان داد (نسبت نسبت‌ها: 1.08؛ 95% فاصله اطمینان (CI): 1.01 تا 1.15). سطح قطعیت شواهد را پائین ارزیابی کردیم. بیست‌ و سه مورد از 34 مرور، برآوردهای اثرگذاری RCTها و مطالعات مشاهده‌ای را گزارش کردند که به‌طور میانگین ​​با هم هم‌خوانی داشتند.

در تعدادی از آنالیزهای زیرگروه، تفاوت‌های کوچکی در برآورد اثرگذاری شناسایی شد:

- فقط مداخلات دارویی (نسبت نسبت‌ها: 1.12؛ 95% CI؛ 1.04 تا 1.21)؛
- RCTها و مطالعات مشاهده‌ای با ناهمگونی قابل توجه یا بالا؛ یعنی I 2 ≥ 50% (نسبت نسبت‌ها: 1.11؛ 95% CI؛ 1.04 تا 1.18)؛
- عدم استفاده (نسبت نسبت‌های 1.07؛ 95% CI؛ 1.03 تا 1.11) یا استفاده نامشخص (نسبت نسبت‌ها: 1.13؛ 95% CI؛ 1.03 تا 1.25) از تطابق امتیاز تمایل در مطالعات مشاهده‌ای؛ و
- مطالعات مشاهده‌ای بدون تعیین مشخصات بیشتر طراحی‌های مطالعه (نسبت نسبت‌ها: 1.06؛ 95% CI؛ 0.96 تا 1.18).

هیچ تفاوت بارزی را در دیگر آنالیزهای زیرگروه شناسایی نکردیم.

یادداشت‌های ترجمه: 

این متن توسط مرکز کاکرین ایران به فارسی ترجمه شده است.

Tools
Information