مثالهایی که اصطلاحات آماری مورد استفاده در این خلاصه را نشان میدهند:
شما خواندید که یک مطالعه نشان داد یک داروی استئوپوروز خطر شکستگی مفصل ران را در سه سال آینده تا 50% کاهش میدهد. بهطور مشخص، 10% از افراد درماننشده در مقایسه با 5% از افرادی که داروی استئوپوروز را هر روز به مدت سه سال مصرف کردند، در عرض سه سال دچار شکستگی مفصل ران شدند. بنابراین، اگر افراد به مدت 3 سال این دارو را مصرف کنند، 5% (10% منهای 5%) افراد کمتری دچار شکستگی مفصل ران خواهند شد. به عبارت دیگر، برای جلوگیری از شکستگی مفصل ران در یک بیمار دیگر، لازم است 20 بیمار به مدت 3 سال داروی استئوپوروز مصرف کنند. «خطر شکستگی را تا 50% کاهش میدهد»، نشاندهنده کاهش نسبت خطر (relative risk) است. «پنج درصد کمتر دچار شکستگی میشوند»، نشاندهنده کاهش خطر مطلق است. «بیست بیمار باید داروی استئوپوروز را طی 3 سال مصرف کنند تا از شکستگی مفصل ران در یک بیمار دیگر جلوگیری شود»، که نشان دهنده تعداد افراد مورد نیاز برای درمان؛ numbers needed to treat; NNT) است.
شما خواندید که مطالعه دیگری نشان داد خطر شکستگی مفصل ران در یک دوره سه ساله بین افرادی که هیچ داروی پوکی استخوانی مصرف نمیکنند، 10% است؛ روش دیگر بیان این خطر میتواند به این صورت باشد: از هر 1000 نفری که هیچ داروی پوکی استخوانی مصرف نمیکنند، 100 نفر در طول یک دوره سه ساله دچار شکستگی مفصل ران خواهند شد. «%10» نشاندهنده درصد است، در حالی که «100 از 1000» نشاندهنده فراوانی است.
خلاصه:
متخصصان سلامت و مصرفکنندگان ممکن است انتخابهای خود را، زمانیکه همان خطرات و کاهش خطرات با استفاده از قالبهای آماری جایگزین ارائه میشوند، تغییر دهند. براساس نتایج 35 مطالعه که 83 مقایسه را گزارش کردند، دریافتیم که خطر یک پیامد سلامت زمانیکه بهعنوان یک فراوانی طبیعی به جای درصد برای تستهای تشخیصی و غربالگری ارائه میشود، بهتر درک میشود. در مورد مداخلات، و بهطور میانگین، افراد کاهش خطر را بیشتر درک میکنند و زمانی که تاثیر یک مداخله سلامت بهصورت نسبی؛ مثلا با استفاده از کاهش نسبت خطر که نشاندهنده کاهش متناسب است) ارائه میشود، بیشتر از زمانیکه بهصورت مطلق، مثلا با استفاده از کاهش خطر مطلق که نشاندهنده یک تفاوت ساده است) ارائه شود، برای پذیرش آن ترغیب میشوند. هیچ تفاوتی را میان متخصصان سلامت و مصرفکنندگان پیدا نکردیم . به دلیل فقدان پژوهش در مورد چگونگی تاثیر این ارائههای جایگزین بر رفتار واقعی، پیامدهای این موضوع برای اقدامات بالینی و سلامت عمومی محدود است. بااینحال، استدلالهای منطقی قوی برای عدم گزارشدهی از مقادیر نسبی بهتنهایی وجود دارد، زیرا آنها مانند مقادیر مطلق، امکان مقایسه منصفانه مزایا و آسیبها را فراهم نمیکنند.
برای توضیحات بیشتر در مورد اصطلاحات آماری استفادهشده در این مرور، لطفا به Cochrane Collaboration Glossary ؛ واژهنامه سازمان همکاری کاکرین) مراجعه کنید.
فراوانیهای طبیعی در زمینه تستهای تشخیصی یا غربالگری، احتمالا بهتر از درصدها قابل درک هستند. برای آگاهیرسانی در مورد کاهش خطر، کاهش نسبت خطر (RRR)، در مقایسه با کاهش خطر مطلق (ARR) و تعداد افراد مورد نیاز برای درمان (numbers needed to treat; NNT)، ممکن است بزرگتر به نظر برسد و احتمال متقاعدکننده بودن آن بیشتر باشد. بااینحال، مشخص نیست ارائه RRR احتمالا به افراد کمک میکند تا تصمیماتی بگیرند که با ارزشهای خودشان همسو و سازگارتر باشد یا خیر، و در واقع، میتواند منجر به تفسیر نادرست شود. برای بررسی بیشتر این سوال، انجام پژوهشهای بیشتری لازم است.
موفقیت در عملکرد مبتنی بر شواهد به ارتباط شفاف و موثر اطلاعات آماری بستگی دارد.
ارزیابی تاثیرات استفاده از روشهای آماری جایگزین برای ارائه خطرات و کاهش خطرات یکسان بر درک، استنباط، اقناعپذیری و رفتار متخصصان سلامت، سیاستگذاران و مصرفکنندگان.
پایگاههای Ovid MEDLINE (1966 تا اکتبر 2007)؛ EMBASE (1980 تا اکتبر 2007)؛ PsycLIT (1887 تا اکتبر 2007) و پایگاه مرکزی ثبت کارآزماییهای کنترلشده کاکرین ( کتابخانه کاکرین، سال 2007، شماره 3) را جستوجو کردیم. فهرست منابع مقالات مرتبط را بررسی کرده و با متخصصین این حوزه تماس گرفتیم.
مطالعات تصادفیسازیشده، تصادفیسازینشده و کنترلشده با طراحی موازی (parallel) و متقاطع (cross-over) را وارد این مرور کردیم. بر چهار مقایسه تمرکز کردیم: مقایسهای از ارائه آماری یک خطر (مثلا فراوانیها در مقایسه با درصدها) و سه مقایسه از ارائه آماری کاهش خطر: کاهش نسبت خطر (relative risk reduction; RRR) در مقایسه با کاهش خطر مطلق (absolute risk reduction; ARR)؛ RRR در مقایسه با تعداد افراد مورد نیاز برای درمان (numbers needed to treat; NNT) و ARR در مقایسه با NNT.
دو نویسنده بهطور مستقل از هم مطالعات را برای ورود به این مرور انتخاب کرده، دادهها را استخراج کرده، و خطر سوگیری (bias) را ارزیابی کردند. برای به دست آوردن اطلاعات ازدسترفته با محققان تماس گرفتیم. کیفیت شواهد مربوط به هر پیامد را با استفاده از رویکرد درجهبندی توصیه، ارزیابی، توسعه و ارزشیابی (Grading of Recommendations Assessment, Development and Evaluation; GRADE) رتبهبندی کردیم. تاثیرات پیامد را با استفاده از تفاوت میانگین استانداردشده (SMD) و تعدیلشده، استانداردسازی کردیم.
تعداد 35 مطالعه را وارد این مرور کردیم که 83 مقایسه را گزارش کردند. هیچیک از مطالعات، سیاستگذاران را مدنظر قرار ندادند. مطالعات مربوط به قالبهای جایگزین برای ارائه خطرات، بر تستهای تشخیصی یا غربالگری متمرکز بودند. شرکتکنندگان (متخصصان سلامت و مصرفکنندگان) فراوانیهای طبیعی را بهتر از درصدها درک کردند (SMD: 0.69؛ 95% فاصله اطمینان (CI): 0.45 تا 0.93). در مطالعات مربوط به قالبهای جایگزین برای ارائه کاهش خطر مداخلات، و در مقایسه با ARR، مقادیر RRR تفاوتی اندک یا عدم تفاوت را در درک ایجاد کردند (SMD: 0.02؛ 95% CI؛ 0.39- تا 0.43)، اما بزرگتر (SMD: 0.41؛ 95% CI؛ 0.03 تا 0.79) و متقاعدکنندهتر (SMD: 0.66؛ 95% CI؛ 0.51 تا 0.81) به نظر رسید. RRR در مقایسه با NNT، بهتر درک شد (SMD: 0.73؛ 95% CI؛ 0.43 تا 1.04)، بزرگتر به نظر رسید (SMD: 1.15؛ 95% CI؛ 0.80 تا 1.50) و متقاعدکنندهتر بود (SMD: 0.65؛ 95% CI؛ 0.51 تا 0.80). ARR در مقایسه با NNT، بهتر درک شد (SMD: 0.42؛ 95% CI؛ 0.12 تا 0.71)، بزرگتر به نظر رسید (SMD: 0.79؛ 95% CI؛ 0.43 تا 1.15)، و تفاوتی اندک یا عدم تفاوت در میزان اقناعپذیری وجود داشت (SMD: 0.05؛ 95% CI؛ 0.04- تا 0.15). آنالیزهای حساسیت (sensitivity) که فقط شامل مقایسههایی با کیفیت بالا بودند، نتایج همسو و سازگاری را برای اقناعپذیری در هر سه مقایسه نشان دادند. در مجموع هیچ تفاوتی میان متخصصان سلامت و مصرفکنندگان دیده نشد. کیفیت کلی شواهد به دلیل استفاده از پیامدهای جایگزین (surrogate outcome) و/یا ناهمگونی (heterogeneity)، به سطح متوسط کاهش یافت. هیچیک از مقایسهها رفتار را ارزیابی نکردند.
این متن توسط مرکز کاکرین ایران به فارسی ترجمه شده است.