استفاده از قالب‌های آماری مختلف برای ارائه اطلاعات سلامت

مثال‌هایی که اصطلاحات آماری مورد استفاده در این خلاصه را نشان می‌دهند:

شما خواندید که یک مطالعه نشان داد یک داروی استئوپوروز خطر شکستگی مفصل ران را در سه سال آینده تا 50% کاهش می‌دهد.  به‌طور مشخص، 10% از افراد درمان‌نشده در مقایسه با 5% از افرادی که داروی استئوپوروز را هر روز به مدت سه سال مصرف کردند، در عرض سه سال دچار شکستگی مفصل ران شدند.  بنابراین، اگر افراد به مدت 3 سال این دارو را مصرف کنند، 5% (10% منهای 5%) افراد کمتری دچار شکستگی مفصل ران خواهند شد. به عبارت دیگر، برای جلوگیری از شکستگی مفصل ران در یک بیمار دیگر، لازم است 20 بیمار به مدت 3 سال داروی استئوپوروز مصرف کنند. «خطر شکستگی را تا 50% کاهش می‌دهد»، نشان‌دهنده کاهش نسبت خطر (relative risk) است. «پنج درصد کمتر دچار شکستگی می‌شوند»، نشان‌دهنده کاهش خطر مطلق است. «بیست بیمار باید داروی استئوپوروز را طی 3 سال مصرف کنند تا از شکستگی مفصل ران در یک بیمار دیگر جلوگیری شود»، که نشان دهنده تعداد افراد مورد نیاز برای درمان؛ numbers needed to treat; NNT) است.

شما خواندید که مطالعه دیگری نشان داد خطر شکستگی مفصل ران در یک دوره سه ساله بین افرادی که هیچ داروی پوکی استخوانی مصرف نمی‌کنند، 10% است؛ روش دیگر بیان این خطر می‌تواند به این صورت باشد: از هر 1000 نفری که هیچ داروی پوکی استخوانی مصرف نمی‌کنند، 100 نفر در طول یک دوره سه ساله دچار شکستگی مفصل ران خواهند شد. «%10» نشان‌دهنده درصد است، در حالی که «100 از 1000» نشان‌دهنده فراوانی است.

خلاصه:

متخصصان سلامت و مصرف‌کنندگان ممکن است انتخاب‌های خود را، زمانی‌که همان خطرات و کاهش خطرات با استفاده از قالب‌های آماری جایگزین ارائه می‌شوند، تغییر دهند. براساس نتایج 35 مطالعه که 83 مقایسه را گزارش کردند، دریافتیم که خطر یک پیامد سلامت زمانی‌که به‌عنوان یک فراوانی طبیعی به جای درصد برای تست‌های تشخیصی و غربالگری ارائه می‌شود، بهتر درک می‌شود. در مورد مداخلات، و به‌طور میانگین، افراد کاهش خطر را بیشتر درک می‌کنند و زمانی که تاثیر یک مداخله سلامت به‌صورت نسبی؛ مثلا با استفاده از کاهش نسبت خطر که نشان‌دهنده کاهش متناسب است) ارائه می‌شود، بیشتر از زمانی‌که به‌صورت مطلق، مثلا با استفاده از کاهش خطر مطلق که نشان‌دهنده یک تفاوت ساده است) ارائه شود، برای پذیرش آن ترغیب می‌شوند. هیچ تفاوتی را میان متخصصان سلامت و مصرف‌کنندگان پیدا نکردیم . به دلیل فقدان پژوهش در مورد چگونگی تاثیر این ارائه‌های جایگزین بر رفتار واقعی، پیامدهای این موضوع برای اقدامات بالینی و سلامت عمومی محدود است. بااین‌حال، استدلال‌های منطقی قوی برای عدم گزارش‌دهی از مقادیر نسبی به‌تنهایی وجود دارد، زیرا آنها مانند مقادیر مطلق، امکان مقایسه منصفانه مزایا و آسیب‌ها را فراهم نمی‌کنند.

برای توضیحات بیشتر در مورد اصطلاحات آماری استفاده‌شده در این مرور، لطفا به Cochrane Collaboration Glossary ؛ واژه‌نامه سازمان همکاری کاکرین) مراجعه کنید.

نتیجه‌گیری‌های نویسندگان: 

فراوانی‌های طبیعی در زمینه تست‌های تشخیصی یا غربالگری، احتمالا بهتر از درصدها قابل درک هستند. برای آگاهی‌رسانی در مورد کاهش خطر، کاهش نسبت خطر (RRR)، در مقایسه با کاهش خطر مطلق (ARR) و تعداد افراد مورد نیاز برای درمان (numbers needed to treat; NNT)، ممکن است بزرگ‌تر به نظر برسد و احتمال متقاعدکننده بودن آن بیشتر باشد. بااین‌حال، مشخص نیست ارائه RRR احتمالا به افراد کمک می‌کند تا تصمیماتی بگیرند که با ارزش‌های خودشان هم‌سو و سازگارتر باشد یا خیر، و در واقع، می‌تواند منجر به تفسیر نادرست شود. برای بررسی بیشتر این سوال، انجام پژوهش‌های بیشتری لازم است.

خلاصه کامل را بخوانید...
پیشینه: 

موفقیت در عملکرد مبتنی بر شواهد به ارتباط شفاف و موثر اطلاعات آماری بستگی دارد.

اهداف: 

ارزیابی تاثیرات استفاده از روش‌های آماری جایگزین برای ارائه خطرات و کاهش خطرات یکسان بر درک، استنباط، اقناع‌پذیری و رفتار متخصصان سلامت، سیاست‌گذاران و مصرف‌کنندگان.

روش‌های جست‌وجو: 

پایگاه‌های Ovid MEDLINE (1966 تا اکتبر 2007)؛ EMBASE (1980 تا اکتبر 2007)؛ PsycLIT (1887 تا اکتبر 2007) و پایگاه مرکزی ثبت کارآزمایی‌های کنترل‌شده کاکرین ( کتابخانه کاکرین، سال 2007، شماره 3) را جست‌وجو کردیم. فهرست منابع مقالات مرتبط را بررسی کرده و با متخصصین این حوزه تماس گرفتیم.

معیارهای انتخاب: 

مطالعات تصادفی‌سازی‌شده، تصادفی‌سازی‌نشده و کنترل‌شده با طراحی موازی (parallel) و متقاطع (cross-over) را وارد این مرور کردیم. بر چهار مقایسه تمرکز کردیم: مقایسه‌ای از ارائه آماری یک خطر (مثلا فراوانی‌ها در مقایسه با درصدها) و سه مقایسه از ارائه آماری کاهش خطر: کاهش نسبت خطر (relative risk reduction; RRR) در مقایسه با کاهش خطر مطلق (absolute risk reduction; ARR)؛ RRR در مقایسه با تعداد افراد مورد نیاز برای درمان (numbers needed to treat; NNT) و ARR در مقایسه با NNT.

گردآوری و تجزیه‌وتحلیل داده‌ها: 

دو نویسنده به‌طور مستقل از هم مطالعات را برای ورود به این مرور انتخاب کرده، داده‌ها را استخراج کرده، و خطر سوگیری (bias) را ارزیابی کردند. برای به دست آوردن اطلاعات ازدست‌رفته با محققان تماس گرفتیم. کیفیت شواهد مربوط به هر پیامد را با استفاده از رویکرد درجه‌بندی توصیه، ارزیابی، توسعه و ارزشیابی (Grading of Recommendations Assessment, Development and Evaluation; GRADE) رتبه‌بندی کردیم. تاثیرات پیامد را با استفاده از تفاوت میانگین استانداردشده (SMD) و تعدیل‌شده، استانداردسازی کردیم.

نتایج اصلی: 

تعداد 35 مطالعه را وارد این مرور کردیم که 83 مقایسه را گزارش کردند. هیچ‌یک از مطالعات، سیاست‌گذاران را مدنظر قرار ندادند. مطالعات مربوط به قالب‌های جایگزین برای ارائه خطرات، بر تست‌های تشخیصی یا غربالگری متمرکز بودند. شرکت‌کنندگان (متخصصان سلامت و مصرف‌کنندگان) فراوانی‌های طبیعی را بهتر از درصدها درک کردند (SMD: 0.69؛ 95% فاصله اطمینان (CI): 0.45 تا 0.93). در مطالعات مربوط به قالب‌های جایگزین برای ارائه کاهش خطر مداخلات، و در مقایسه با ARR، مقادیر RRR تفاوتی اندک یا عدم تفاوت را در درک ایجاد کردند (SMD: 0.02؛ 95% CI؛ 0.39- تا 0.43)، اما بزرگ‌تر (SMD: 0.41؛ 95% CI؛ 0.03 تا 0.79) و متقاعدکننده‌تر (SMD: 0.66؛ 95% CI؛ 0.51 تا 0.81) به نظر رسید. RRR در مقایسه با NNT، بهتر درک شد (SMD: 0.73؛ 95% CI؛ 0.43 تا 1.04)، بزرگ‌تر به نظر ‌رسید (SMD: 1.15؛ 95% CI؛ 0.80 تا 1.50) و متقاعدکننده‌تر بود (SMD: 0.65؛ 95% CI؛ 0.51 تا 0.80). ARR در مقایسه با NNT، بهتر درک شد (SMD: 0.42؛ 95% CI؛ 0.12 تا 0.71)، بزرگ‌تر به نظر ‌رسید (SMD: 0.79؛ 95% CI؛ 0.43 تا 1.15)، و تفاوتی اندک یا عدم تفاوت در میزان اقناع‌پذیری وجود داشت (SMD: 0.05؛ 95% CI؛ 0.04- تا 0.15). آنالیزهای حساسیت (sensitivity) که فقط شامل مقایسه‌هایی با کیفیت بالا بودند، نتایج هم‌سو و سازگاری را برای اقناع‌پذیری در هر سه مقایسه نشان دادند. در مجموع هیچ تفاوتی میان متخصصان سلامت و مصرف‌کنندگان دیده نشد. کیفیت کلی شواهد به دلیل استفاده از پیامدهای جایگزین (surrogate outcome) و/یا ناهمگونی (heterogeneity)، به سطح متوسط ​​کاهش یافت. هیچ‌یک از مقایسه‌ها رفتار را ارزیابی نکردند.

یادداشت‌های ترجمه: 

این متن توسط مرکز کاکرین ایران به فارسی ترجمه شده است.

Tools
Information