주요 메시지
현재 이용 가능한 근거는 STAI를 선별 도구로 사용하는 것을 명확히 뒷받침하지 않는다. 그 이유는 다음과 같다.
-
STAI는 선별검사를 목적으로 특별히 개발된 도구가 아니며, 일반적으로 받아들여지는 절단값(역치 점수)이 없다.
-
STAI는 불안장애가 있는 사람을 찾아내는 경향이 있으나, 불안장애가 없는 많은 사람들까지 잘못 분류할 수 있다.
-
포함된 연구들의 질이 서로 달랐고, 대부분 병원과 유사한 환경에 있는 사람들을 대상으로 하여, 결과를 일반화하기가 확실하지 않다.
이러한 한계를 고려할 때, 현재로서는 STAI 대신 불안 선별을 목적으로 특별히 개발된 더 짧은 설문지를 사용하는 것이 더 타당해 보인다.
불안장애를 조기에 발견하는 것이 왜 중요한가?
불안장애는 흔하지만 진단되지 않는 경우가 많으며, 이로 인해 치료가 지연되고 삶의 질이 저하될 수 있다. 선별검사는 특히 스스로 불안을 인식하지 못하는 사람들에서 불안을 조기에 발견하는 데 도움이 될 수 있다. 그러나 검사는 완벽하지 않다. 실제로 불안이 있는 사람을 찾아내지 못하는 경우(‘위음성’)에는 적절한 시기에 치료할 기회를 놓칠 수 있다. 선별검사 결과는 진단 전에 다시 확인되어야 하지만, 불안이 없음에도 불안이 의심된다고 분류되는 경우(‘위양성’)에는 불필요한 걱정이나 추가 검사로 인한 의료 이용이 늘어날 수 있다.
상태-특성 불안 척도(STAI)란 무엇인가?
STAI는 불안을 측정하기 위해 널리 사용되는 설문지로, 두 개의 하위 척도로 구성되어 있다. 하나는 특정 상황에 대한 일시적인 불안 감정을 의미하는 상태 불안이고, 다른 하나는 시간과 상황 전반에 걸쳐 나타나는 개인의 일반적인 불안 경향을 의미하는 특성 불안이다. 각 하위 척도는 20문항으로 구성되어 있으며, 점수가 높을수록 불안 수준이 높음을 의미한다. 선별검사로 사용할 경우, 특정 점수 이상을 기준으로 하는 절단값(‘cut-off’)을 적용한다. 이 기준 이상 점수를 받은 사람은 불안 가능성에 대한 추가 평가를 위해 의뢰될 수 있다. STAI는 원래 이러한 목적을 위해 개발된 것은 아니지만, 여러 연구에서 선별 도구로서의 활용 가능성이 조사되었다. 일반적으로 받아들여지는 절단값은 없으나, 개별 연구들에서는 상태 불안 40점, 특성 불안 44점을 제안해 왔다.
무엇을 확인하고 싶었는가?
지금까지 STAI를 선별 도구로 사용했을 때의 수행 능력은 체계적 문헌고찰에서 평가된 적이 없었다. 이에 성인에서 STAI가 불안장애를 얼마나 정확하게 찾아내는지를 확인하고자 했다.
무엇을 했는가?
성인을 대상으로 STAI가 불안장애를 발견하는 정확도를 평가한 모든 연구를 검색하였다. 포함되기 위해서는 STAI 점수를 불안 진단에 가장 정확한 방법인 구조화된 임상 면담 결과와 비교한 연구여야 했다. 그 후, 두 하위 척도(STAI-S와 STAI-T)에 대해 가능한 모든 절단값을 고려하여, STAI의 전반적인 정확도를 평가하기 위해 결과를 종합하였다.
무엇을 찾았는가?
11개 국가에서 수행된 12개 연구를 포함하였으며, 총 2525명이 참여하였다(이 중 475명은 불안장애가 있는 것으로 확인되었다). 대부분의 연구는 다양한 기존 의학적 질환을 가진 사람들을 포함하였다. 한 연구만이 의학적 질환이 없는 사람들(암 환자의 배우자)을 포함하였다.
종합 결과에 따르면, STAI를 1000명에게 시행하고 이 중 153명이 진단되지 않은 불안장애를 가지고 있다고 가정할 때 다음과 같은 결과가 예상된다.
-
STAI-S ≥ 40: 총점이 40점 이상인 508명 중 127명은 불안이 있는 사람으로 올바르게 확인되어(‘진양성’) 추가 치료로 혜택을 받을 수 있다. 그러나 나머지 381명은 실제로는 불안이 없지만 불안이 있을 가능성이 있는 것으로 잘못 분류되어(‘위양성’) 추가 평가를 위해 의뢰될 가능성이 크다. 이는 일부 사람들에게는 도움이 될 수 있으나(예: 다른 원인을 탐색하는 경우), 다른 사람들에게는 불필요할 수 있다. 한편, 절단값 미만 점수를 받은 492명 중에서는 불안이 있음에도 치료가 필요할 수 있는 26명이 놓치게 되며(‘위음성’), 나머지 466명은 불안이 없는 사람으로 올바르게 분류된다(‘진음성’).
-
STAI-T ≥ 44: 절단값 이상 점수를 받은 463명 중 124명은 ‘진양성’, 339명은 ‘위양성’이다. 절단값 미만 점수를 받은 537명 중에서는 불안이 있는 29명이 놓치게 되며(‘위음성’), 508명은 ‘진음성’이다.
근거의 한계는 무엇인가?
연구들의 질이 서로 달랐고, 대부분 병원과 유사한 환경에서 수행되어, 일반 인구와 같은 다른 집단에서 STAI가 어떻게 작동할지에 대한 이해는 제한적이다. 또한 STAI는 선별을 목적으로 개발된 도구가 아니기 때문에, 이러한 용도로 결과를 해석하는 데 어려움이 있다.
결과의 의미
현재의 근거만으로는 STAI가 불안장애를 발견하는 신뢰할 수 있는 선별 도구인지에 대해 명확한 결론을 내리기 어렵다. 결과는 주로 전문화된 임상 환경에서의 수행 능력을 반영하며, 다른 집단에서도 동일하게 작동할지는 확실하지 않다. 확인된 근거가 모호하고 제한적이라는 점을 고려할 때, 불안 선별을 목적으로 특별히 개발된 더 짧은 도구들을 고려해 볼 필요가 있다.
이 근거는 얼마나 최신인가?
이 근거는 2024년 5월까지 최신이며, 포함된 연구들은 2008년부터 2023년 사이에 출판되었다.
Read the full abstract
불안장애는 매우 흔한 정신건강 질환이지만, 진단되지 않은 채로 남아 있는 경우가 많다. 상태-특성 불안 척도(State-Trait Anxiety Inventory, STAI)는 순간적인 불안(상태 불안)과 전반적인 불안 성향(특성 불안)의 중증도를 평가하기 위해 가장 널리 사용되는 자기보고식 설문 도구 중 하나이다. STAI는 선별검사로도 고려되어 왔으므로, 진단되지 않은 불안장애를 식별하는 데 있어 정확도를 평가하는 것이 중요하다.
목적
성인에서 불안장애를 발견하기 위한 상태-특성 불안 척도(STAI)의 진단검사 정확도(diagnostic test accuracy, DTA)를 평가한다. 특히 전체 합산 점수 절단값 범위에 대한 정확도 추정치를 산출하고, STAI의 두 하위 척도인 상태 불안 하위척도(STAI-S)와 특성 불안 하위척도(STAI-T)로 분석을 구분하였다. 표적 질환으로는 ‘모든 불안장애(any anxiety disorder, AAD)’와 그 하위 질환 중 하나인 ‘범불안장애(generalised anxiety disorder, GAD)’를 평가하였다.
검색 전략
Ovid Embase, MEDLINE, PubMed-not-MEDLINE, PsycINFO를 이용하여 1990년부터 2024년 5월 15일까지 포괄적으로 검색하였다. 또한 포함된 연구와 관련 체계적 문헌고찰의 참고문헌 목록을 추가로 검토하였다.
선정 기준
성인을 대상으로 STAI를 시행한 연구를 포함하였으며, 시행 방식, 언어, 참여자 수에 제한을 두지 않았다. 정신건강 진료 환경에서 도움을 구한 성인이나, 다른 환경에서 정신건강 증상으로 인해 특별히 모집된 참여자를 대상으로 한 연구는 제외하였다. 적격 연구는 지표 검사로 STAI를 사용하고, 구조화 또는 반구조화 진단 면담을 기준 검사(reference standard)로 사용하여 2×2 분할표를 생성할 수 있어야 했다. 환자-대조군 설계 연구와 STAI와 기준 검사 간의 시간 간격이 4주를 초과한 연구는 제외하였다.
자료 수집 및 분석
최소 두 명의 고찰 저자가 독립적으로 연구의 적합성을 평가하고 자료를 추출하였으며, QUADAS-2(Quality Assessment of Diagnostic Accuracy Studies, version 2) 도구를 사용하여 방법론적 질을 평가하였다. 다중 임계값 모형(multiple thresholds model)을 적용하여 모든 절단값(≥20~80)에 걸친 요약 민감도와 특이도를 95% 신뢰구간과 함께 산출하였다. 또한 다중 임계값 요약 수신자 작동 특성 곡선(summary receiver operating characteristic, SROC)을 이용하여 전체 정확도의 지표로 곡선 아래 면적(area under the curve, AUC)을 계산하였다.
주요 결과
11개 국가에서 수행된 12개 연구(총 2525명 참여자, 이 중 475명이 불안장애 진단)를 포함하였다. 이 중 11개 연구는 상태 불안 하위척도(STAI-S)를 평가하였고(2042명), 8개 연구는 특성 불안 하위척도(STAI-T)를 평가하였다(1906명). 기준 검사에 따른 진단은 모두 DSM-IV(Diagnostic and Statistical Manual of Mental Disorders, Fourth Edition) 기준에 근거하였으며, 7개 연구에서는 MINI(Mini-International Neuropsychiatric Interview), 5개 연구에서는 SCID(Structured Clinical Interview for DSM)가 사용되었다. 11개 연구는 다양한 특정 질환(예: 간질, 임신)을 가진 사람들을 대상으로 한 임상 환경에서 수행되었고, 1개 연구는 암 환자의 배우자를 포함하였다. 대부분의 연구에서 참여자 선정과 관련하여 비뚤림 위험이 높거나 불확실하였으며, 적용 가능성에 대한 우려도 있었다.
AAD를 탐지하는 데 있어, 모든 절단값에 대한 요약 정확도 추정치는 SROC 곡선에서 도출되었다. STAI-S의 AUC는 0.78(95% 신뢰구간 0.75~0.82; 11개 연구, 2042명), STAI-T의 AUC는 0.78(95% 신뢰구간 0.75~0.81; 8개 연구, 1906명)이었다. 흔히 사용되는 절단값인 STAI-S ≥40에서 요약 민감도는 0.83(95% 신뢰구간 0.77~0.88), 특이도는 0.55(95% 신뢰구간 0.45~0.65)였다. STAI-T ≥44에서는 요약 민감도 0.81(95% 신뢰구간 0.75~0.86), 특이도 0.60(95% 신뢰구간 0.44~0.74)이었다.
GAD 탐지에 대한 STAI의 정확도 분석은 연구 수가 적어 제한적이었다(STAI-S: 4개 연구, 1182명; STAI-T: 3개 연구, 988명). STAI-S ≥40에서 요약 민감도는 0.86(95% 신뢰구간 0.74~0.93), 특이도는 0.53(95% 신뢰구간 0.37~0.69)이었고, AUC는 0.80(95% 신뢰구간 0.74~0.86)이었다. STAI-T ≥44에서는 민감도 0.86(95% 신뢰구간 0.72~0.94), 특이도 0.57(95% 신뢰구간 0.36~0.75)이었으며, AUC는 0.81(95% 신뢰구간 0.79~0.82)이었다.
연구진 결론
현재 이용 가능한 근거만으로는 불안장애 선별검사로서 STAI의 정확도에 대해 확신 있는 판단을 내리기 어렵다. 근거는 연구 수가 제한적이고, 대부분 비뚤림 위험이 높거나 불확실하며, 거의 모두 다양한 기저 건강 상태를 가진 사람들을 대상으로 한 전문화된 임상 환경에서 수행되어 일반화 가능성이 제한된다. AUC에 대한 일반적인 해석에 근거할 때, 모든 절단값에 걸친 STAI-S와 STAI-T 하위척도의 전반적인 정확도는 중등도이며, 다른 불안 설문지와 대체로 유사하다. 제안된 절단값(STAI-S ≥40, STAI-T ≥44)은 충분한 민감도를 보이지만, 특이도가 낮아 특히 유병률이 낮은 환경에서 상당한 오분류 가능성에 대한 우려가 있다. 또한 STAI는 원래 중증도 측정을 목적으로 개발되었고, 대안적 설문지에 비해 문항 수가 많으며, 두 개의 하위척도 점수를 제공하지만 명확한 선별 지침이 없고, 근거에 기반한 절단값 권고가 부재하다는 점에서 선별검사로서의 적합성은 더욱 제한된다. 따라서 STAI는 현재로서는 불안 선별검사의 1차 선택 도구로 보이지 않으며, 특히 불안 선별을 목적으로 특별히 개발되었고 더 짧으며 근거가 더 잘 축적된 설문지들이 이용 가능하다는 점을 고려할 때 그러하다. 다만 근거 기반이 제한적이고 다른 설문지와의 공식적인 비교가 부족하므로, 이러한 결론은 잠정적이다.
자금 제공
이 Cochrane 리뷰는 독일 연방 교육연구부(German Federal Ministry of Education and Research)의 지원을 받아 수행되었다(과제 번호: 01KG2105).
등록
프로토콜(2022)은 doi.org/10.1002/14651858.CD015292에서 확인할 수 있다.
위 내용은 한국코크란에서 번역하였다.
이 코크란 리뷰는 원래 영어로 작성되었다. 번역의 정확성은 번역을 수행한 팀의 책임이다. 이 번역은 세심하게 작성되었으며, 품질 관리를 보장하기 위해 표준 절차를 따른다. 그러나 번역본과 원문이 불일치하거나 번역이 부정확하거나 부적절한 경우에는 영어 원문이 우선한다.