주요 메시지
-
유방암 위험 예측 모델 네 가지는 충분한 횟수의 검증 연구가 있어 자세히 평가할 수 있었다. 이들 모델은 Gail, Tyrer-Cuzick, BOADICEA, BRCAPRO 모델이었다.
-
BOADICEA 모델은 유방암 가족력이 있는 여성의 향후 유방암 위험을 추정하는 데 비교적 신뢰할 수 있는 도구 중 하나였으며, 여성과 의료진이 치료 및 위험 관리 방안을 결정하는 데 도움이 될 수 있다.
-
유방암 가족력이 있는 여성 가운데 실제로 유방암이 발생할 여성과 발생하지 않을 여성을 더 정확하게 구별할 수 있도록 기존 예측 모델의 정확성을 향상시키기 위한 추가 연구가 필요하다.
유방암 위험을 예측할 수 있으면 왜 도움이 되는가?
가족 중에 유방암 병력이 있는 여성은 평생 동안 유방암이 발생할 가능성이 더 높다. 진료 현장에서는 여성의 특정 기간 내 유방암 발생 가능성을 유방암 위험 예측 모델이라고 하는 통계적 도구를 사용하여 추정하는 경우가 많다.
유방암 가족력이 있는 여성의 유방암 발생 위험을 정확하게 추정하면 의료진과 당사자가 유방암 위험을 관리하거나 줄이기 위한 방법을 결정하는 데 도움이 된다. 관리 방법에는 다음이 포함될 수 있다:
-
유방암을 조기에 발견하기 위해 유방촬영술이나 자기공명영상(MRI, 유방 조직의 자세한 영상을 만드는 검사)을 정기적으로 받는 것;
-
유방암 위험을 줄이기 위한 약물을 복용하는 것; 또는
-
일부 경우에는 유방암을 예방하기 위해 양쪽 유방을 수술로 제거하는 것.
현재 이용 가능한 유방암 위험 예측 모델 가운데 어떤 모델이 유방암 가족력이 있는 여성에게 가장 적합한지는 분명하지 않다.
무엇을 확인하고 싶었는가?
다음을 확인하고자 하였다:
-
유방암 가족력이 있는 여성을 대상으로 개발되거나 검증된(또는 둘 다 수행된) 유방암 위험 예측 모델을 확인하고;
-
이러한 모델이 해당 여성들의 향후 유방암 발생 위험을 얼마나 정확하게 예측하는지 평가하고자 하였다.
무엇을 했는가?
이러한 모델을 개발하거나 검증한 연구를 검색하였다. 다음 두 측면에 초점을 맞추어 모델의 예측 정확성을 평가하였다:
-
예측된 유방암 발생 수가 실제 발생 수와 얼마나 일치하는지(보정, calibration); 그리고
-
유방암이 발생한 여성과 발생하지 않은 여성을 얼마나 잘 구별하는지(판별력, discrimination)
동일한 모델을 평가한 연구가 충분한 경우에는 결과를 통계적으로 통합하였다.
무엇을 찾았는가?
유방암 가족력이 있는 여성이 전부 또는 대부분을 차지하는 연구에서 검증된 유방암 위험 예측 모델 12개를 확인하였다. 모델 검증에 사용된 여성 수는 최소 134명에서 최대 130,058명이었다. 대부분의 여성은 북미, 유럽 또는 호주에 거주하였으며, 소수는 아시아 출신이었다.
연구비는 정부(25건), 대학(24건), 비영리기관(21건), 산업체(3건)에서 지원하였다. 6건의 연구는 연구비 출처를 보고하지 않았으며, 일부 연구는 두 곳 이상에서 지원을 받았다.
Gail, Tyrer-Cuzick, BOADICEA, BRCAPRO 모델의 네 가지에 대해서는 여러 연구의 결과를 통합할 수 있었다.
보정(calibration): 예측된 유방암 발생 수는 실제 발생 수와 비슷하였는가?
-
Gail 모델과 BOADICEA 모델은 특정 기간 내 유방암이 발생할 여성 수를 비교적 정확하게 예측하였다:
-
Gail 모델이 유방암 100건 발생을 예측할 때 실제로는 약 106건이 발생하였다;
-
BOADICEA 모델이 유방암 100건 발생을 예측할 때 실제로는 약 98건이 발생하였다.
-
-
Tyrer-Cuzick 모델은 실제보다 더 많은 여성이 유방암에 걸릴 것으로 예측하였다. 유방암 100건을 예측할 때 실제 발생은 약 86건이었다.
-
BRCAPRO 모델은 실제보다 적은 수의 여성이 유방암에 걸릴 것으로 예측하였다. 유방암 100건을 예측할 때 실제 발생은 약 144건이었다.
판별력(discrimination): 유방암이 발생할 여성과 발생하지 않을 여성을 얼마나 잘 구별하였는가?
-
네 가지 모델 모두 특정 기간 내 유방암이 발생할 여성과 발생하지 않을 여성을 구별하는 능력이 중간 정도였으나, 매우 우수한 수준은 아니었다.
-
Tyrer-Cuzick(버전 8), BOADICEA, BRCAPRO 모델은 약 100명 중 64~65명을 올바르게 구별하였다.
-
Gail 모델은 약간 낮은 성능을 보여 약 100명 중 61명을 올바르게 구별하였다.
근거의 한계는 무엇인가?
이번 문헌고찰에 포함된 대부분의 연구는 질이 낮거나 불분명하다고 평가되었으며, 따라서 결과가 신뢰할 만한지 확신하기 어렵다. 신뢰도를 낮춘 이유는 다음과 같다:
-
일부 연구에서는 유방암이 발생한 여성이 너무 적어 예측 모델의 정확성을 평가하기 어려웠다;
-
모든 연구가 검토에서 필요한 모델 성능 정보를 보고하지 않았다;
-
일부 연구에서는 자료가 누락되어 있었거나 누락된 자료를 어떻게 처리했는지 설명하지 않았다.
이 근거는 얼마나 최신인가?
이 문헌고찰에는 2024년 12월까지 발표된 연구가 포함되어 있다.
Read the full abstract
유방암 가족력이 있는 여성은 유방암이 발생할 위험이 높다. 임상 실무에서는 특정 기간 내 유방암이 발생할 확률을 유방암 위험 예측 모델을 사용하여 자주 추정한다. 현재 이용 가능한 모델 가운데 어떤 모델이 유방암 가족력이 있는 여성에서 가장 우수한 성능을 보이는지는 분명하지 않다.
목적
유방암 가족력이 있는 여성을 대상으로 개발되거나 검증된 유방암 위험 예측 모델을 확인하고, 기술하며, 평가하고, 유방암 발생 예측 성능을 메타분석하기 위함이다.
검색 전략
2022년 2월까지 MEDLINE, Embase, Cumulative Index to Nursing and Allied Health Literature(CINAHL), Institute of Scientific Information Web of Science를 검색하였고, 포함된 모델에 대한 추가 검증 연구를 확인하기 위해 2024년 12월 19일까지 MEDLINE에서 보완 검색을 수행하였다. 또한 포함된 연구의 참고문헌 목록을 검토하였다.
선정 기준
유방암 가족력이 있는 여성을 대상으로 유방암 위험 예측 모델을 개발하거나 검증한 연구를 포함하였다. 해당 모델은 예측 변수에 유방암 가족력을 포함하고 있어야 했다.
자료 수집 및 분석
자료 추출 양식은 CHARMS 체크리스트를 기반으로 하였다. 두 명의 저자가 독립적으로 문헌을 선별하고, 자료를 추출하며, Prediction model Risk Of Bias ASsessment Tool(PROBAST)을 사용하여 비뚤림 위험을 평가하였다. 대상 집단에서 개발되거나 검증된 위험 예측 모델을 요약하였다. 성능 통계량이 최소 4개 연구에서 보고된 경우 변량효과 메타분석을 통해 모델 성능을 통합하였다. 모델 성능은 보정(calibration; 예측 위험과 실제 유방암 발생 간의 일치 정도)과 판별력(discrimination; 유방암이 발생한 여성과 발생하지 않은 여성을 구별하는 능력)으로 평가하였다. 예후 모델 체계적 문헌고찰에 대한 지침이 아직 마련되지 않아 GRADE는 적용하지 않았다.
주요 결과
45편의 연구를 포함하였고, 17편은 ‘분류 대기 중(awaiting classification)’으로 목록화하였다. 대상 집단에서 외부 검증된 모델 12개를 확인하였다. 최소 4건의 외부 검증 연구가 있는 4개 모델에 대해 메타분석을 수행하였다.
연구 보고 방식에는 상당한 차이가 있었다. 여러 연구에서 추적 관찰 기간 또는 결측치 처리 방법을 충분히 보고하지 않았다. 대부분의 검증 연구는 최소 한 가지 성능 지표(보정 또는 판별력)를 보고하였으나, 일부는 두 지표를 함께 보고하지 않았다. 검증된 모델 버전과 같은 기본 정보도 종종 누락되어 있었다.
대부분의 연구는 PROBAST 평가에서 비뚤림 위험이 높거나 불분명하였으나, 적용 가능성에 대한 우려는 대체로 낮았다.
대상 집단에서 최소 4건의 외부 검증 연구 자료가 있는 4개 모델의 결과를 보고한다.
Gail/Breast Cancer Risk Assessment Tool (BCRAT)
보정(calibration): 대상 집단에서 Gail 모델(통합 버전)의 관찰값(O)/예측값(E) 비율의 통합 추정치는 1.06(95% 신뢰구간(CI) 0.91~1.25)이었으며, 이는 이 집단에서 모델의 보정이 양호함을 의미한다. 95% 예측구간(PI)은 0.65~1.74였다.
판별력(discrimination): 대상 집단에서 Gail 모델(통합 버전)의 C 통계량 통합 추정치는 0.61(95% CI 0.57~0.66)이었다. 95% PI는 0.47~0.74였다.
Tyrer-Cuzick/International Breast Cancer Intervention Study(IBIS)
보정(calibration): 대상 집단에서 Tyrer-Cuzick 모델의 O/E 비율 통합 추정치는 통합 버전에서 0.86(95% CI 0.74~0.98), 버전 8에서 0.90(95% CI 0.76~1.06)이었다. 이는 이 집단에서 유방암 위험을 과대예측함을 의미한다. 95% PI는 통합 버전에서 0.56~1.33, 버전 8에서 0.55~1.47이었다.
판별력(discrimination): 대상 집단에서 Tyrer-Cuzick 모델(통합 버전)의 C 통계량 통합 추정치는 0.62(95% CI 0.58~0.66)였다. 95% PI는 0.49~0.74였다. 버전 8의 C 통계량 통합 추정치는 0.64(95% CI 0.58~0.71)였다. 95% PI는 0.46~0.79였다.
Breast and Ovarian Analysis of Disease Incidence and Carrier Estimation Algorithm (BOADICEA)
보정(calibration): 대상 집단에서 BOADICEA(통합 버전)의 O/E 비율 통합 추정치는 0.98(95% CI 0.90~1.17)이었으며, 이는 이 집단에서 모델의 보정이 양호함을 의미한다. 95% PI는 0.89~1.09였다.
판별력(discrimination): 대상 집단에서 BOADICEA(통합 버전)의 C 통계량 통합 추정치는 0.65(95% CI 0.58~0.71)였다. 95% PI는 0.44~0.81이었다.
BRCAPRO
보정(calibration): 대상 집단에서 BRCAPRO 모델(통합 버전)의 O/E 비율 통합 추정치는 1.44(95% CI 1.25~1.62)였으며, 이는 이 집단에서 유방암 위험을 과소예측함을 의미한다. 95% PI는 1.02~2.04였다.
판별력(discrimination): 대상 집단에서 BRCAPRO 모델(통합 버전)의 C 통계량 통합 추정치는 0.64(95% CI 0.54~0.73)였다. 95% PI는 0.37~0.84였다.
연구진 결론
본 메타분석 결과, Gail(BCRAT) 모델과 BOADICEA 모델은 유방암 가족력이 있는 여성에서 보정이 양호하였다. Tyrer-Cuzick(IBIS) 모델은 위험을 과대예측하였고, BRCAPRO는 위험을 과소예측하였다.
대상 집단에서의 판별력 측면에서는 어느 모델도 명확하게 우수하지 않았다. Tyrer-Cuzick 버전 8, BOADICEA, BRCAPRO는 메타분석에서 유사한 수준의 제한적인 판별력을 보였으며, Gail 모델보다 약간 우수하였다.
보정과 판별력을 함께 고려할 때, BOADICEA 모델은 이 집단에서 보정이 양호하고 Tyrer-Cuzick(버전 8) 및 BRCAPRO와 유사한 수준의 (제한적인) 판별력을 보여 가족성 유방암 위험 평가 상황에서 환자 관리에 유용할 수 있음을 시사한다. 그러나 이를 확정적인 결론으로 해석할 수는 없다. 포함된 대부분의 연구는 비뚤림 위험이 높거나 불분명하다고 판단하였고, 메타분석에 포함된 검증 연구 수가 적었으며(각 모델당 10건 이하), 포함된 연구들은 예측 기간과 대상자 구성(case-mix) 측면에서 이질적이었다.
유방암 가족력이 있는 여성에서 기존 유방암 위험 예측 모델의 판별력은 여전히 개선의 여지가 있다. 현재 예후 모델 연구의 보고 수준은 최적이라고 보기 어렵다.
자금 제공
Health Research Board Cochrane Training Fellowship의 부분 지원을 받았다.
등록
프로토콜(2018): 10.1002/14651858.CD013185
위 내용은 한국코크란에서 번역하였다.
이 코크란 리뷰는 원래 영어로 작성되었다. 번역의 정확성은 번역을 수행한 팀의 책임이다. 이 번역은 세심하게 작성되었으며, 품질 관리를 보장하기 위해 표준 절차를 따른다. 그러나 번역본과 원문이 불일치하거나 번역이 부정확하거나 부적절한 경우에는 영어 원문이 우선한다.