تست تشخیصی هر نوع تست پزشکی است که برای کمک به تشخیص یا شناسایی بیماری انجام میشود. یک مرور سیستماتیک از یک تست تشخیصی خاص برای یک بیماری، با هدف گردآوری و ارزیابی تمام شواهد تحقیقاتی موجود انجام میشود. بانکهای اطلاعاتی کتابشناختی (bibliographic) معمولا با ترکیب اصطلاحات مربوط به بیماری با اصطلاحات مربوط به تست تشخیصی جستوجو میشوند. بااینحال، بسته به حوزه موضوعی، تعداد مقالات بازیابیشده توسط چنین جستوجوهایی ممکن است بسیار زیاد باشند. هنگامی که فیلترهای روششناسی متشکل از کلمات متنی (text words) و اصطلاحات نمایهسازی (indexing terms) بانک اطلاعاتی، به عبارات جستوجوی بیماری و تست تشخیصی اضافه میشوند، به امید بهبودی در جستوجوها با افزایش دقت آنها، توسعه داده شدهاند. از سوی دیگر، استفاده از فیلترها برای شناسایی رکوردها در مرورهای تشخیصی ممکن است مطالعات مرتبط را از دست بدهد، در عین حال که تفاوت زیادی را در تعداد مطالعاتی که باید برای ورود ارزیابی شوند، ایجاد نمیکند. این مرور عملکرد 70 فیلتر (گزارششده در 19 مطالعه) را برای شناسایی مطالعات تشخیصی در دو بانک اطلاعاتی کتابشناختی در سلامت، MEDLINE و EMBASE، ارزیابی کرد. نتایج نشان دادند که فیلترهای جستوجو بهطور منسجم عمل نمیکنند و نباید بهعنوان تنها رویکرد در جستوجوهای رسمی برای مرورهای سیستماتیک مطالعات تشخیصی استفاده شوند. هیچیک از فیلترها به حداقل معیارهای ما یعنی حساسیت بیشاز 90% و دقت بالای 10% دست نیافتند.
مطالعه چکیده کامل
در هر مرور سیستماتیک، جستوجوی نظاممند و گسترده برای یافتن هرچه بیشتر مطالعات واجد شرایط ضروری است. هنگام جستوجوی مطالعات صحت تست تشخیصی (diagnostic test accuracy; DTA) در بانکهای اطلاعاتی کتابشناختی (bibliographic databases)، توصیه میشود که اصطلاحات مربوط به بیماری (وضعیت هدف) با اصطلاحات مربوط به تست تشخیصی (تست شاخص (index test)) ترکیب شوند. محققان فیلترهای روششناسی را برای افزایش دقت این جستوجوها توسعه دادهاند. این موارد شامل کلمات متنی و اصطلاحات نمایهسازی (indexing terms) بانک اطلاعاتی بوده و به جستوجوهای شرایط هدف و تست شاخص اضافه میشوند.
شناسایی کارآمد گزارشهای مطالعات DTA چالشهایی را به همراه دارد، زیرا این روشها اغلب در عناوین و چکیدههای خود بهخوبی گزارش نشدهاند، ممکن است اصطلاحات نمایهسازی مناسب در دسترس نباشند و به نظر نمیرسد اصطلاحات نمایهسازی مرتبط بهطور مداوم اختصاص داده شده باشند. یکی از پیامدهای استفاده از فیلترهای جستوجو برای شناسایی رکوردها برای مرورهای تشخیصی آن است که ممکن است مطالعات مرتبط از قلم بیفتند، درحالیکه تعداد مطالعات غیرمرتبط که نیاز به ارزیابی دارند، کاهش نیابد. راهنمای فعلی برای مرورهای DTA کاکرین، افزودن یک فیلتر جستوجوی روششناسی را به جستوجوی شرایط هدف و تست شاخص، بهعنوان تنها رویکرد جستوجو، توصیه نمیکند.
اهداف
مرور سیستماتیک مطالعات تجربی که توسعه یا ارزیابی، یا هر دو، فیلترهای جستوجوی روششناسی طراحیشده را برای بازیابی مطالعات DTA در MEDLINE و EMBASE گزارش میدهند.
روشهای جستوجو
ما MEDLINE (1950 تا هفته 1 نوامبر 2012)؛ EMBASE (1980 تا هفته 48 سال 2012)؛ Cochrane Methodology Register (شماره 3، 2012)؛ ISI Web of Science (11 ژانویه 2013)؛ PsycINFO (13 مارچ 2013)؛ Library and Information Science Abstracts (LISA) (31 می 2010)؛ و Library, Information Science & Technology Abstracts (LISTA) (13 مارچ 2013) را جستوجو کردیم. ما جستوجوهای استنادی را در Web of Science انجام دادیم، فهرست منابع مطالعات مرتبط را بررسی کرده و وبسایت Search Filters Resource از InterTASC Information Specialists' Sub-Group (ISSG) را جستوجو کردیم.
معیارهای انتخاب
مطالعاتی که توسعه یا ارزیابی، یا هر دو، یک فیلتر جستوجوی MEDLINE یا EMBASE را با هدف بازیابی مطالعات DTA گزارش کردند، و معیاری از عملکرد فیلتر را گزارش کردند، واجد شرایط بودند.
گردآوری و تجزیهوتحلیل دادهها
پیامد اصلی، بررسی عملکرد فیلتر، مانند حساسیت (sensitivity) یا دقت (precision)، بود. ما دادههای مربوط به شناسایی مجموعه منابع (شامل استاندارد طلایی و در صورت استفاده، رکوردهای استاندارد غیرطلایی)، نحوه استفاده از مجموعه منابع و هرگونه محدودیت، شناسایی و ترکیب عبارات جستوجو در فیلترها، تست اعتبار داخلی و بیرونی، تعداد فیلترهای ارزیابیشده، تاریخ انجام مطالعه، تاریخ تکمیل جستوجوها و بانکهای اطلاعاتی و رابطهای جستوجوی مورد استفاده را استخراج کردیم. در مواردی که دادههای 2x2 در مورد عملکرد فیلتر موجود بود، از این دادهها برای محاسبه حساسیت، اختصاصیت (specificity)، دقت و تعداد موارد مورد نیاز برای خواندن (NNR) و 95% فواصل اطمینان (CI) استفاده کردیم. عملکرد یک فیلتر را همانطور که توسط مطالعه توسعه (development study) اولیه گزارش شد و هر مطالعه بعدی که همان فیلتر را ارزیابی کرد، مقایسه کردیم.
نتایج اصلی
نوزده مطالعه وارد شدند، که در مورد 57 فیلتر MEDLINE و 13 فیلتر EMBASE گزارش را ارائه دادند. در یک مطالعه ارزیابی (evaluation study)، سی فیلتر MEDLINE و چهار فیلتر EMBASE بررسی شدند که در آن عملکرد یک یا چند فیلتر در برابر یک یا چند استاندارد طلایی تست شدند. معیارهای پیامد گزارششده متفاوت بودند. برخی مطالعات، در صورت استفاده از مجموعه منابع حاوی رکوردهای استاندارد غیرطلایی علاوهبر رکوردهای استاندارد طلایی، علاوهبر حساسیت، اختصاصیت را نیز گزارش کردند. در برخی موارد، مطالعه توسعه اولیه هیچ داده عملکردی را در مورد فیلترها گزارش نکرد. عملکرد اولیه حاصل از مطالعه توسعه برای 17 فیلتر که متعاقبا در مطالعات ارزیابی تست شدند، در دسترس نبود. هر 19 مطالعه، حساسیت فیلترهایی را که توسعه داده یا ارزیابی کردند، گزارش کردند، نه مطالعه ویژگی و 14 مطالعه دقت را گزارش دادند.
هیچ فیلتری که دادههای عملکرد اولیه را از مطالعه توسعه خود داشت و متعاقبا در یک مطالعه ارزیابی تست شد، آنچه را که ما از قبل بهعنوان حساسیت (> 90%) و دقت (> 10%) قابل قبول تعریف کردیم، نشان نداد. در مطالعاتی که فیلترهای MEDLINE را توسعه دادند و در مطالعه دیگری ارزیابی شدند (n = 13)، حساسیت از 55% تا 100% (میانه (median): 86%) و اختصاصیت از 73% تا 98% (میانه: 95%) متغیر بودند. تخمین عملکرد در هشت مطالعه که همان 13 فیلتر MEDLINE را ارزیابی کردند، پائینتر بود، با حساسیتهایی از 14% تا 100% (میانه: 73%) و ویژگیها از 15% تا 96% (میانه: 81%). دقت در مطالعاتی که فیلترهای MEDLINE را توسعه دادند، از 1.1% تا 40% (میانه: 9.5%) و در مطالعاتی که این فیلترها را ارزیابی کردند، از 0.2% تا 16.7% (میانه: 4%) متغیر بود. طیف مشابهی از ویژگیها و دقت میان مطالعات ارزیابی فیلترهای MEDLINE بدون معیار عملکرد اصلی گزارش شدند. حساسیتها از 31% تا 100% (میانه: 71%)، اختصاصیتها از 13% تا 90% (میانه: 55.5%) و دقت از 1.0% تا 11.0% (میانه: 3.35%) متغیر بودند.
برای فیلترهای EMBASE، حساسیتهای اولیه گزارششده در دو مطالعه توسعه برای سه فیلتر از 74% تا 100% (میانه: 90%) و دقت از 1.2% تا 17.6% (میانه: 3.7%) متغیر بودند. مطالعات ارزیابی این فیلترها حساسیتهایی از 72% تا 97% (میانه: 86%) و دقتی از 1.2% تا 9% (میانه: 3.7%) داشتند. عملکرد فیلترهای جستوجوی EMBASE در مطالعات توسعه و ارزیابی، نسبت به عملکرد فیلترهای MEDLINE در مطالعات توسعه و ارزیابی، مشابهتر بود. هیچیک از فیلترهای EMBASE در هیچیک از دو نوع مطالعه، حساسیت بالای 90% و دقت بالای 10% نداشتند.
نتیجهگیریهای نویسندگان
هیچیک از فیلترهای روششناسی فعلی که برای شناسایی گزارشهای مطالعات اولیه DTA در MEDLINE یا EMBASE طراحی شدهاند، حساسیت به اندازه کافی بالا، مورد نیاز برای مرورهای سیستماتیک، را با درجه معقولی از دقت ترکیب نمیکنند. این یافته از توصیه فعلی در کتابچه راهنمای کاکرین برای مرورهای سیستماتیک صحت تست تشخیصی پشتیبانی میکند که ترکیبی از عبارات جستوجوی فیلتر روششناسی با عبارات مربوط به تست شاخص و شرایط هدف نباید بهعنوان تنها رویکرد هنگام انجام جستوجوهای رسمی برای مرورهای سیستماتیک DTA استفاده شوند.
این متن توسط مرکز کاکرین ایران به فارسی ترجمه شده است.
ین مرور کاکرین در ابتدا به زبان انگلیسی منتشر شد. مسوولیت صحت ترجمه بر عهده تیم ترجمه است که آن را تهیه کرده است. روند ترجمه با دقت انجام شده و از فرآیندهای استاندارد برای تضمین کنترل کیفیت پیروی میکند. با این حال، در صورت عدم تطابق، ترجمههای نادرست یا نامناسب، متن اصلی انگلیسی معتبر است.