무작위 대조 시험과 관찰 연구에서 도출된 치료 효과의 추정치는 얼마나 유사한가?

주요 메시지

- 평균적으로 무작위 대조 시험(RCT)과 관찰 연구의 효과 추정치는 아주 약간 다르다. 효과 추정은 임상 시험이나 연구에서 두 그룹의 사람들의 결과 간의 차이로 중재 효과의 크기를 설명하는 통계적 구성이다.
- 다양한 연구 유형 간 효과 추정치의 유사점과 차이점에 영향을 미칠 수 있는 요인을 면밀히 고려한 추가 연구가 필요하다.

RCT와 관찰 연구는 무엇이며, 효과 추정치가 잠재적으로 다른 이유는 무엇인가?

무작위 대조 시험(RCT)은 참가자를 두 개 이상의 치료 그룹 중 하나에 무작위로 할당하는 의료 실험의 한 유형이다. 한 그룹에는 실험적 치료('중재'라고도 함)가 제공된다. 다른 하나는 중재가 주어지지 않는 '대조' 그룹이다. RCT는 이상적인 조건에서 실험적 치료법이 얼마나 효과적이고 안전한지 테스트한다.

관찰 연구는 비실험적인 '현실' 시나리오에서 중재의 효과를 측정하려고 한다. 환자-대조군(또는 후향적) 연구와 코호트 연구는 관찰 연구의 두 가지 일반적인 유형이다. 환자-대조군 연구는 특정 상태/질병이 있는 사람 그룹을 해당 질환/질병이 없지만 다른 점은 유사한 그룹과 비교한다. 코호트 연구는 시간이 지남에 따라 공통된 특성을 가진 사람들 그룹을 추적하여 얼마나 많은 사람들이 관심 있는 특정 건강 결과에 도달하는지 알아냅니다.

때때로, 무작위 대조 연구와 관찰연구는 같은 연구질문에 대한 다른 결과를 보여주곤 한다. 이러한 유형의 연구는 수행 방법과 체계적 오류에 대한 민감성이 다르다.

무엇을 알아보고 싶었는가?

요약 효과 추정에 대한 연구 유형(RCT 대 관찰 연구)의 영향을 평가하고 차이점을 설명할 수 있는 방법론적 측면을 탐색하고 싶었다.

무엇을 했는가?

동일한 건강 연구 문제를 다루는 RCT와 관찰 연구에서 보고된 효과 추정치를 체계적으로 비교한 리뷰를 데이터베이스에서 검색했다. 출판 언어에 대한 제한 없이 모든 건강 관리 결과를 포함하는 리뷰를 찾았다. 1990년 1월 1일부터 2022년 5월 12일 사이에 게시된 리뷰/개요를 검색했다. 그런 다음 검토 결과를 비교하고 근거를 요약했다. 리뷰에 사용된 방법과 크기, 리뷰 전반에 걸친 결과의 일관성과 같은 요소를 기반으로 이 근거에 대한 신뢰도를 평가했다.

무엇을 찾았는가?

47개의 관련 리뷰를 확인했고, 34명이 주요 분석에 데이터를 제공했다. 검토에서는 RCT의 효과 추정치를 코호트 연구, 환자-대조군 연구 또는 둘 다의 효과 추정치와 비교했다. 리뷰에서는 다양한 건강 관련 주제를 다루었다. 그들은 전 세계 여러 나라에서 실시되었지만 대부분은 미국에서 이루어졌다. 12개의 리뷰에서는 자금 조달에 대한 정보가 보고되지 않았다. 8개의 리뷰에서 저자는 자금 지원을 받지 못했다고 보고했다. 23개의 리뷰에서 저자들은 정부 자금이나 대학이나 재단으로부터 자금 지원과 같은 공공 자금을 받았다고 보고했다. 2개의 리뷰는 유럽 연합의 자금 지원을 받았으며 2개의 리뷰는 업계 자금을 받았다고 보고했다. 대부분의 자금 지원 리뷰는 여러 자금 출처를 보고했다.

주요 결과

- RCT와 관찰 연구의 효과 추정치는 거의 다를 수도 있고 전혀 다를 수도 있음을 발견했다.
- 수술이나 물리치료 등 다른 의료치료와 달리 의약품만을 대상으로 한 연구의 효과 추정치를 비교하면 약간의 차이가 있을 수 있다.

또한 다음 데이터를 기반으로 한 효과 추정치에서는 거의 차이가 없음을 발견했다.
- 상당한 통계적 이질성을 보여준 RCT 및 관찰 연구의 메타 분석 즉, 다양한 연구에서 평가되는 중재 효과의 가변성.
- 중재의 효과에 영향을 미칠 수 있는 인구 특성을 설명하기 위해 방법을 사용하지 않았거나 어떻게 사용했는지에 대해 불분명한 관찰 연구(성향 점수 조정)
- 연구 설계에 대한 충분한 정보를 제공하지 않은 관찰 연구.

근거의 한계는 무엇인가?

포함된 검토가 수행된 방식으로 인해 체계적인 오류가 발생할 위험이 있을 수 있으므로 근거에 대한 확신이 거의 없다. 더욱이 리뷰는 다양한 유형의 사람들과 중재에 관한 것이었다. 즉, 리뷰 간의 개별 결과가 상당히 달랐음을 의미한다.

이 검토는 얼마나 최신인가?

근거는 2022년 5월까지 검색했다.

연구진 결론: 

RCT와 관찰 연구의 효과 추정치 간에 차이가 없거나 매우 작은 차이가 있음을 발견했다. 이러한 결과는 최근 발표된 연구 결과와 대체로 일치한다. RCT 결과와 관찰 연구 결과가 일치하지 않는 이유를 탐색할 때는 연구 설계 이외의 요소(예: 각 연구에서 조사된 모집단, 중재, 비교자 및 결과의 차이)를 고려해야 한다. 결과는 리뷰 작성자가 연구 설계뿐만 아니라 RCT의 메타 분석이나 관찰 연구에서 이질성 수준을 고려하는 것이 중요하다는 것을 강조한다. 이러한 요인이 실제 효과를 반영하는 추정치를 산출할 수 있는 방법에 대한 더 나은 이해가 필요하다

전체 초록 읽기
배경: 

연구자와 의사 결정자는 종종 무작위 대조 시험(RCT)의 근거를 사용하여 치료 또는 중재의 효능이나 효과를 결정한다. 관찰 설계를 사용한 연구는 '현실' 시나리오에서 중재의 효과를 측정하는 데 종종 사용된다. 특정 모집단에 대해 한 치료법이 다른 치료법보다 더 효과적이거나 안전한지에 대한 비뚤림 없는 추정을 제공하기 위한 비교 효과 연구에는 수많은 연구 설계와 그 수정(무작위 및 관찰 설계 포함)이 사용된다. RCT와 관찰 연구의 효과 추정치 차이를 확인하려면 최신의 체계적인 분석이 필요하다. 이 업데이트된 검토에서는 관찰 연구의 효과 추정치를 동일한 건강 연구 질문을 다룬 근거 종합의 RCT와 비교한 방법론적 검토 결과를 요약한다.

목적: 

RCT와 관찰 연구를 대조하여 연구 유형별로 합성 효과 추정치를 평가하고 비교한다.

RCT와 관찰 연구의 합성 효과 추정치의 차이를 설명할 수 있는 요인을 탐색한다(예: 이질성, 관찰 연구 설계 유형, 중재 유형 및 성향 점수 조정 사용).

다양한 연구 유형에 걸쳐 효과 추정치를 비교하는 기존 연구의 격차를 식별한다.

검색 전략: 

MEDLINE, Cochrane Database of Systematic Reviews, Web of Science 데이터베이스 및 Epistemonikos를 2022년 5월까지 검색했다. 추가 리뷰를 확인하기 위해 참고문헌을 확인하고 인용 검색을 수행했으며 리뷰 작성자에게 연락했다.

선정 기준: 

RCT와 관찰 연구에서 테스트된 중재의 효능 또는 효과를 측정하는 정량적 효과 추정치를 비교한 체계적인 방법론적 검토를 포함했다. 포함된 검토에서는 RCT를 관찰 연구(후향적 및 전향적 코호트, 환자-대조군 및 단면 설계 포함)와 비교했다. 일부 형태의 동시 할당을 사용한 연구와 RCT를 비교한 경우 검토는 적합하지 않았다.

자료 수집 및 분석: 

관찰 연구 결과를 대조 그룹으로 사용하여 상대적인 요약 효과 추정치(위험비(RR), 승산비(OR), 위험비(HR), 평균차(MD) 및 표준화된 평균차(SMD))를 조사하여 승산비(ROR) 또는위험비(RRR), 위해비(RHR) 및 (표준화된) 평균 차이(D(S)MD의 차이)에 상대적으로 더 크거나 작은 효과가 있는지 평가한다.

포함된 검토가 관찰 연구와 RCT의 결과를 비교하는 추정치를 제공하지 않은 경우 관찰 연구와 RCT에 대한 추정치를 각각 통합하여 하나를 생성했다. 모든 검토에서 RCT의 효과 추정치와 관찰 연구의 효과 추정치를 비교하는 풀링된 비율을 생성하기 위해 이러한 비율을 합성했다. 리뷰 개요에서는 관찰 연구를 참조 카테고리로 사용하여 각 개요에 대한 ROR 또는 RRR을 추정했다.

포함된 리뷰에서 비뚤림의 위험을 평가했다(총 9가지 기준 사용). 전반적으로 낮은 비뚤림 위험 등급을 받으려면 연구 선택을 위한 명시적인 기준, 전체 연구 샘플, 연구 방법론적 차이 및 연구 이질성에 대해 통제가 포함된 검토가 필요했다. 이 네 가지 기준을 충족하지 않는 리뷰/개요를 전반적으로 비뚤림 위험이 높은 것으로 평가했다.

GRADE 접근법을 사용하여 다중 근거 합성으로 구성된 근거의 확실성을 평가했다.

주요 결과: 

39개의 체계적인 리뷰와 8개의 리뷰 개요를 포함하여 총 47개의 리뷰를 포함했다. 이들 중 34개는 주요 분석에 데이터를 제공했다. 이용 가능한 데이터를 바탕으로 검토/개요에 3,882,115명의 참가자가 포함된 2,869개의 RCT와 19,499,970명의 참가자가 포함된 3,924개의 관찰 연구가 포함되어 있음을 확인했다.

11개의 리뷰/개요는 전반적으로 비뚤림 위험이 낮은 것으로 평가되었으며, 36개는 불분명하거나 비뚤림 위험이 높은 것으로 평가되었다. 포함된 리뷰/개요에 대한 주요 우려 사항은 일부는 포함된 연구의 품질을 평가하지 않았고 일부는 연구 설계 간의 차이점을 적절하게 설명하지 못했다는 것이다. 예를 들어, 코호트 및 환자-대조군 연구의 개별 분석이 아닌 모든 관찰 연구의 합계 분석을 수행했다.

ROR과 RRR을 통합할 때 비율 비율은 RCT와 관찰 연구의 효과 추정치 사이에 차이가 없거나 매우 작은 차이를 나타낸다(비율 1.08, 95% 신뢰 구간(CI) 1.01~1.15). 근거의 확실성을 낮음으로 평가했다. 34개 리뷰 중 23개 리뷰에서는 평균적으로 일치하는 RCT 및 관찰 연구의 효과 추정치를 보고했다.

여러 하위 그룹 분석에서 효과 추정치에 작은 차이가 발견되었다.

- 약물 중재만(비율 1.12, 95% CI 1.04~1.21)
- 이질성이 상당하거나 높은 RCT 및 관찰 연구 즉, I 2 ≥ 50%(비율 1.11, 95% CI 1.04 ~ 1.18);
- 성향 점수 조정을 사용하지 않거나(비율 1.07, 95% CI 1.03 ~ 1.11) 사용이 불분명한(비율 1.13, 95% CI 1.03 ~ 1.25) 관찰연구. 그리고
- 연구 설계에 대한 추가 지정이 없는 관찰 연구(비율 1.06, 95% CI 0.96 ~ 1.18).

다른 하위 그룹 분석에서는 명확한 차이가 발견되지 않았다.

역주: 

위 내용은 한국코크란에서 번역하였다.

Tools
Information