استراتژی‌های جست‌وجو برای شناسایی مطالعات صحت تشخیصی در MEDLINE و EMBASE

تست تشخیصی هر نوع تست پزشکی است که برای کمک به تشخیص یا شناسایی بیماری انجام می‌شود. یک مرور سیستماتیک از یک تست تشخیصی خاص برای یک بیماری، با هدف گردآوری و ارزیابی تمام شواهد تحقیقاتی موجود انجام می‌شود. بانک‌های اطلاعاتی کتاب‌شناختی (bibliographic) معمولا با ترکیب اصطلاحات مربوط به بیماری با اصطلاحات مربوط به تست تشخیصی جست‌وجو می‌شوند. بااین‌حال، بسته به حوزه موضوعی، تعداد مقالات بازیابی‌شده توسط چنین جست‌وجوهایی ممکن است بسیار زیاد باشند. هنگامی که فیلترهای روش‌شناسی متشکل از کلمات متنی (text words) و اصطلاحات نمایه‌سازی (indexing terms) بانک اطلاعاتی، به عبارات جست‌وجوی بیماری و تست تشخیصی اضافه می‌شوند، به امید بهبودی در جست‌وجوها با افزایش دقت آن‌ها، توسعه داده شده‌اند. از سوی دیگر، استفاده از فیلترها برای شناسایی رکوردها در مرورهای تشخیصی ممکن است مطالعات مرتبط را از دست بدهد، در عین حال که تفاوت زیادی را در تعداد مطالعاتی که باید برای ورود ارزیابی شوند، ایجاد نمی‌کند. این مرور عملکرد 70 فیلتر (گزارش‌شده در 19 مطالعه) را برای شناسایی مطالعات تشخیصی در دو بانک اطلاعاتی کتاب‌شناختی در سلامت، MEDLINE و EMBASE، ارزیابی کرد. نتایج نشان دادند که فیلترهای جست‌وجو به‌طور منسجم عمل نمی‌کنند و نباید به‌عنوان تنها رویکرد در جست‌وجوهای رسمی برای مرورهای سیستماتیک مطالعات تشخیصی استفاده شوند. هیچ‌یک از فیلترها به حداقل معیارهای ما یعنی حساسیت بیش‌از 90% و دقت بالای 10% دست نیافتند.

مطالعه چکیده کامل

پیشینه

در هر مرور سیستماتیک، جست‌وجوی نظام‌مند و گسترده برای یافتن هرچه بیشتر مطالعات واجد شرایط ضروری است. هنگام جست‌وجوی مطالعات صحت تست تشخیصی (diagnostic test accuracy; DTA) در بانک‌های اطلاعاتی کتاب‌شناختی (bibliographic databases)، توصیه می‌شود که اصطلاحات مربوط به بیماری (وضعیت هدف) با اصطلاحات مربوط به تست تشخیصی (تست شاخص (index test)) ترکیب شوند. محققان فیلترهای روش‌شناسی را برای افزایش دقت این جست‌وجوها توسعه داده‌اند. این موارد شامل کلمات متنی و اصطلاحات نمایه‌سازی (indexing terms) بانک اطلاعاتی بوده و به جست‌وجوهای شرایط هدف و تست شاخص اضافه می‌شوند.

شناسایی کارآمد گزارش‌های مطالعات DTA چالش‌هایی را به همراه دارد، زیرا این روش‌ها اغلب در عناوین و چکیده‌های خود به‌خوبی گزارش نشده‌اند، ممکن است اصطلاحات نمایه‌سازی مناسب در دسترس نباشند و به نظر نمی‌رسد اصطلاحات نمایه‌سازی مرتبط به‌طور مداوم اختصاص داده شده باشند. یکی از پیامدهای استفاده از فیلترهای جست‌وجو برای شناسایی رکوردها برای مرورهای تشخیصی آن است که ممکن است مطالعات مرتبط از قلم بیفتند، درحالی‌که تعداد مطالعات غیرمرتبط که نیاز به ارزیابی دارند، کاهش نیابد. راهنمای فعلی برای مرورهای DTA کاکرین، افزودن یک فیلتر جست‌وجوی روش‌شناسی را به جست‌وجوی شرایط هدف و تست شاخص، به‌عنوان تنها رویکرد جست‌وجو، توصیه نمی‌کند.

اهداف

مرور سیستماتیک مطالعات تجربی که توسعه یا ارزیابی، یا هر دو، فیلترهای جست‌وجوی روش‌شناسی طراحی‌شده را برای بازیابی مطالعات DTA در MEDLINE و EMBASE گزارش می‌دهند.

روش‌های جست‌وجو

ما MEDLINE (1950 تا هفته 1 نوامبر 2012)؛ EMBASE (1980 تا هفته 48 سال 2012)؛ Cochrane Methodology Register (شماره 3، 2012)؛ ISI Web of Science (11 ژانویه 2013)؛ PsycINFO (13 مارچ 2013)؛ Library and Information Science Abstracts (LISA) (31 می 2010)؛ و Library, Information Science & Technology Abstracts (LISTA) (13 مارچ 2013) را جست‌وجو کردیم. ما جست‌وجوهای استنادی را در Web of Science انجام دادیم، فهرست منابع مطالعات مرتبط را بررسی کرده و وبسایت Search Filters Resource از InterTASC Information Specialists' Sub-Group (ISSG) را جست‌وجو کردیم.

معیارهای انتخاب

مطالعاتی که توسعه یا ارزیابی، یا هر دو، یک فیلتر جست‌وجوی MEDLINE یا EMBASE را با هدف بازیابی مطالعات DTA گزارش کردند، و معیاری از عملکرد فیلتر را گزارش کردند، واجد شرایط بودند.

گردآوری و تجزیه‌وتحلیل داده‌ها

پیامد اصلی، بررسی عملکرد فیلتر، مانند حساسیت (sensitivity) یا دقت (precision)، بود. ما داده‌های مربوط به شناسایی مجموعه منابع (شامل استاندارد طلایی و در صورت استفاده، رکوردهای استاندارد غیرطلایی)، نحوه استفاده از مجموعه منابع و هرگونه محدودیت، شناسایی و ترکیب عبارات جست‌وجو در فیلترها، تست اعتبار داخلی و بیرونی، تعداد فیلترهای ارزیابی‌شده، تاریخ انجام مطالعه، تاریخ تکمیل جست‌وجوها و بانک‌های اطلاعاتی و رابط‌های جست‌وجوی مورد استفاده را استخراج کردیم. در مواردی که داده‌های 2x2 در مورد عملکرد فیلتر موجود بود، از این داده‌ها برای محاسبه حساسیت، اختصاصیت (specificity)، دقت و تعداد موارد مورد نیاز برای خواندن (NNR) و 95% فواصل اطمینان (CI) استفاده کردیم. عملکرد یک فیلتر را همانطور که توسط مطالعه توسعه (development study) اولیه گزارش شد و هر مطالعه بعدی که همان فیلتر را ارزیابی کرد، مقایسه کردیم.

نتایج اصلی

نوزده مطالعه وارد شدند، که در مورد 57 فیلتر MEDLINE و 13 فیلتر EMBASE گزارش را ارائه دادند. در یک مطالعه ارزیابی (evaluation study)، سی فیلتر MEDLINE و چهار فیلتر EMBASE بررسی شدند که در آن عملکرد یک یا چند فیلتر در برابر یک یا چند استاندارد طلایی تست شدند. معیارهای پیامد گزارش‌شده متفاوت بودند. برخی مطالعات، در صورت استفاده از مجموعه منابع حاوی رکوردهای استاندارد غیرطلایی علاوه‌بر رکوردهای استاندارد طلایی، علاوه‌بر حساسیت، اختصاصیت را نیز گزارش کردند. در برخی موارد، مطالعه توسعه اولیه هیچ داده عملکردی را در مورد فیلترها گزارش نکرد. عملکرد اولیه حاصل از مطالعه توسعه برای 17 فیلتر که متعاقبا در مطالعات ارزیابی تست شدند، در دسترس نبود. هر 19 مطالعه، حساسیت فیلترهایی را که توسعه داده یا ارزیابی کردند، گزارش کردند، نه مطالعه ویژگی و 14 مطالعه دقت را گزارش دادند.

هیچ فیلتری که داده‌های عملکرد اولیه را از مطالعه توسعه خود داشت و متعاقبا در یک مطالعه ارزیابی تست شد، آنچه را که ما از قبل به‌عنوان حساسیت (> 90%) و دقت (> 10%) قابل قبول تعریف کردیم، نشان نداد. در مطالعاتی که فیلترهای MEDLINE را توسعه دادند و در مطالعه دیگری ارزیابی شدند (n = 13)، حساسیت از 55% تا 100% (میانه (median): 86%) و اختصاصیت از 73% تا 98% (میانه: 95%) متغیر بودند. تخمین عملکرد در هشت مطالعه که همان 13 فیلتر MEDLINE را ارزیابی کردند، پائین‌تر بود، با حساسیت‌هایی از 14% تا 100% (میانه: 73%) و ویژگی‌ها از 15% تا 96% (میانه: 81%). دقت در مطالعاتی که فیلترهای MEDLINE را توسعه دادند، از 1.1% تا 40% (میانه: 9.5%) و در مطالعاتی که این فیلترها را ارزیابی کردند، از 0.2% تا 16.7% (میانه: 4%) متغیر بود. طیف مشابهی از ویژگی‌ها و دقت میان مطالعات ارزیابی فیلترهای MEDLINE بدون معیار عملکرد اصلی گزارش شدند. حساسیت‌ها از 31% تا 100% (میانه: 71%)، اختصاصیت‌ها از 13% تا 90% (میانه: 55.5%) و دقت از 1.0% تا 11.0% (میانه: 3.35%) متغیر بودند.

برای فیلترهای EMBASE، حساسیت‌های اولیه گزارش‌شده در دو مطالعه توسعه برای سه فیلتر از 74% تا 100% (میانه: 90%) و دقت از 1.2% تا 17.6% (میانه: 3.7%) متغیر بودند. مطالعات ارزیابی این فیلترها حساسیت‌هایی از 72% تا 97% (میانه: 86%) و دقتی از 1.2% تا 9% (میانه: 3.7%) داشتند. عملکرد فیلترهای جست‌وجوی EMBASE در مطالعات توسعه و ارزیابی، نسبت به عملکرد فیلترهای MEDLINE در مطالعات توسعه و ارزیابی، مشابه‌تر بود. هیچ‌یک از فیلترهای EMBASE در هیچ‌یک از دو نوع مطالعه، حساسیت بالای 90% و دقت بالای 10% نداشتند.

نتیجه‌گیری‌های نویسندگان

هیچ‌یک از فیلترهای روش‌شناسی فعلی که برای شناسایی گزارش‌های مطالعات اولیه DTA در MEDLINE یا EMBASE طراحی شده‌اند، حساسیت به اندازه کافی بالا، مورد نیاز برای مرورهای سیستماتیک، را با درجه معقولی از دقت ترکیب نمی‌کنند. این یافته از توصیه فعلی در کتابچه راهنمای کاکرین برای مرورهای سیستماتیک صحت تست تشخیصی پشتیبانی می‌کند که ترکیبی از عبارات جست‌وجوی فیلتر روش‌شناسی با عبارات مربوط به تست شاخص و شرایط هدف نباید به‌عنوان تنها رویکرد هنگام انجام جست‌وجوهای رسمی برای مرورهای سیستماتیک DTA استفاده شوند.

یادداشت‌های ترجمه

این متن توسط مرکز کاکرین ایران به فارسی ترجمه شده است.

ین مرور کاکرین در ابتدا به زبان انگلیسی منتشر شد. مسوولیت صحت ترجمه بر عهده تیم ترجمه است که آن را تهیه کرده است. روند ترجمه با دقت انجام شده و از فرآیندهای استاندارد برای تضمین کنترل کیفیت پیروی می‌کند. با این حال، در صورت عدم تطابق، ترجمه‌های نادرست یا نامناسب، متن اصلی انگلیسی معتبر است.

استناد

Beynon R, Leeflang MM, McDonald S, Eisinga A, Mitchell RL, Whiting P, Glanville JM. Search strategies to identify diagnostic accuracy studies in MEDLINE and EMBASE. Cochrane Database of Systematic Reviews 2013, Issue 9. Art. No.: MR000022. DOI: 10.1002/14651858.MR000022.pub3.

فیلترها

شواهد

کتابچه‌های آموزشی و راهنماها

اخبار