跳转到主要内容

GAD-7 和 GAD-2 问卷对于检测焦虑症的准确度有多高?

关键信息

• 单独使用 GAD-7 和 GAD-2 问卷不能用于诊断或排除焦虑症。

• 然而,它们可以提示是否有焦虑症。

• 个人问卷调查结果「阴性」或「阳性」的解释取决于具体情況。

什么是焦虑症?

「焦虑症」是一个总称,指的是心理健康狀況,包括(但不限于):

• 广泛性焦虑症:当某人在六个月内的大部分时间里感到过度焦虑,难以控制担忧,并且出现六种症状的至少三种:烦躁不安、疲劳、注意力不集中、易怒、肌肉紧张和睡眠障碍;

• 社交恐惧症:非常害怕在社交或表演场合受到评判、尴尬或羞辱;

• 恐慌症:反复经历意想不到的强烈恐惧或不适,可能伴随各种身体和情绪症状。

为什么早期诊断焦虑症很重要?

焦虑症很常见,而且经常未被发现,即使对于需要治疗的人也是如此。当焦虑症出现时未能识别(假阴性) 意味着您错过了及时接受药物治疗、心理治疗或两者结合治疗的机会。因此,一些专家和患者倡议组织提倡进行筛检;即对一个社会群体或人口进行系統性检查,以确定是否存在焦虑症,即使是那些沒有因为相应症状寻求帮助的人。其他专家反对筛检,因为沒有证据提示这种筛检的益处大于弊端(例如误诊和不必要开药的副作用)。

GAD-7 和 GAD-2 问卷是什么?

GAD-7(广泛性焦虑症 7 題量表)和 GAD-2(GAD-7 量表的前两项)是专为外行人设计的使用者友善自填问卷。它们帮助提供个人是否患有焦虑症的信息。填写问卷的人会以 0(从未出现)到 3(每天都出现)的等级表示他们出现重要焦虑症的频率。将答案相加可得出总分,分数范围为 0 至 21。当 GAD-7 总分达到 10 或以上时,即被视为“测试阳性”,表示可能存在焦虑症。GAD-2 评分为 3 分或更高则表示有相同情況。如果 GAD-7 总分低于 10 或 GAD-2 总分低于 3,则结果被视为「测试阳性」。

我们想要了解什么?

我们的目的是找出 GAD-7 和 GAD-2 量表能够多准确地判断一个人是否患有焦虑症。

我们做了什么?

我们检索了研究 GAD-7 或 GAD-2 量表(或两者)准确性的研究,通过将它们与医疗专业人员进行的完整诊断访谈进行比较,并将这些研究的结果结合起来。

我们发现了什么?

我们的综述纳入48项研究的结果,这些研究涉及来自 27 个不同国家的 19,228 人,以 24 种不同的语言评估了 GAD-7 和 GAD-2 问卷。其中七项研究是在非临床场所(例如一般人群)中进行的,九项研究是在临床场所进行的,招募了具有不同状况的受试者(例如寻求初级保健的人),32 项研究是在临床进行的,受试者具有特定状况(例如患有癫痫症的人)。许多研究调查了问卷对某一特定类型的焦虑症(广泛性焦虑症)的准确性,其他研究则调查了任何类型的焦虑症,或两者兼有。

总体而言,GAD-7 和 GAD-2 问卷是可接受的或很好地判断一个人是否患有焦虑症。

具体来说,如果一组 1000 人使用 GAD-7 问卷,事实上其中120 人(12%)患有广泛性焦虑症,那么可以预期以下结果:估计有 156 人(16%)将被 GAD-7 归类为「测试阳性」。然而,事实上其中只有大约一半(77 人或 8%)患有广泛性焦虑症,而另一半(79 人或 8%)则是「假阳性」。在 844 名(84%)检测結果为阴性的人中,绝大多数(801 人或 80%)被正确归类为未患广泛性焦虑症,但 43 名(4%)患有广泛性焦虑症的人属于「假阴性」。

在检测焦虑症方面,较短的 GAD-2 问卷似乎与较长的 GAD-7 量表一样准确。这两份问卷在检测广泛性焦虑症方面似乎比检测其它任何焦虑症都要好一些。

证据的局限性是什么?

这些研究在许多方面存在差异,整体而言方法学质量较差。这些差异包括纳入问卷调查的群体、问卷的语言、方法学质量以及最终诊断方法的差异。这些差异可能解释了为什么 GAD-7 和 GAD-2 的准确性在各个研究中存在显著不同。这意味着这些问卷在特定场所的诊断准确性可能比我们上面提供的总结更好或者更差。

证据的时效性如何?

文献证据更新至2024年1月。

研究背景

焦虑症常常无法被发现并可能造成巨大的负担。在众多的焦虑筛查工具中,7项广泛性焦虑症(Generalized Anxiety Disorder, GAD-7)量表及其简版2项广泛性焦虑症(GAD-2)量表是最常用的工具。

研究目的

主要: 确定 GAD-7 和 GAD-2 检测成人广泛性焦虑症 (generalised anxiety disorder,GAD) 和任何焦虑症 (any anxiety disorder,AAD) 的诊断准确性。

其次: 调查它们的诊断准确性是否因环境、焦虑症患病率、参考标准和偏倚风险而异;比较 GAD-7 和 GAD-2 的诊断准确性;调查诊断性能如何随测试阈值的变化而变化。

检索策略

我们检索了1990年至2024年1月18日的MEDLINE、Embase、PubMed-not-MEDLINE 子集和 PsycINFO。我们检查了所纳入研究和综述文章的参考文献列表。

纳入排除标准

我们纳入了在成年人中进行的横断面研究,其中包含针对目标病症广泛性焦虑症和/或任何焦虑症的 GAD-7 和/或 GAD-2 问卷的诊断准确性信息,并允许生成 2x2 表格。必须通过结构化或半结构化的临床访谈来诊断目标病症。我们排除了病例对照研究以及指标测试和参考标准之间的时间间隔超过四周的研究。我们排除了涉及(1)在心理健康环境中寻求帮助的人或(2)由于其他环境中的心理健康症状而被专门招募的人的研究。

资料收集与分析

至少两位综述作者独立筛选研究,提取资料和评估纳入研究的偏倚风险。对于每个问卷和每个目标条件,我们在森林图中展示了敏感度和特异性以及 95% 置信区间 (confidence intervals,CI)。我们使用双变量模型来获得基于最接近推荐值的截止值(即在核心范围内)的汇总估计值。在二次分析中,我们使用双变量模型和多阈值模型来获得所有可用截止点的汇总估计值。利用多阈值模型,我们还计算了受试者工作特征曲线下面积,以获得 GAD-7 和 GAD-2 诊断准确性的一般指标。

主要结果

我们纳入了 48 项研究,涉及来自 27 个不同国家的 19,228 名受试者,以 24 种不同的语言评估了 GAD-7 和 GAD-2。其中七项研究是在非临床场所中进行的,九项在临床场所进行的研究招募了不同状况下的受试者,32 项在临床进行的研究招募的受试者具有特定状况。即使分为三类场所,研究人群仍然存在很大差异。研究最多的人群是:癫痫患者(九项研究);癌症患者(五项研究);心血管疾病患者(五项研究);以及无论身体状况如何接受初级保健的人(五项研究)。我们认为八项研究中的偏倚风险较低,并且我们对三项研究结果的适用性不太担心。

35 项研究对 GAD-7 检测广泛性焦虑症进行了初步分析(中位患病率为 12%);22 项研究对 GAD-7 检测任意一种焦虑症进行了分析(中位患病率为 19%);24 项研究对 GAD-2 检测广泛性焦虑症进行了分析(中位患病率为 9%);19 项研究对 GAD-2 检测任意一种焦虑症进行了分析(中位患病率为 19%)。

在建议的截止值 10 或更高(或最接近的可用截止值)下,GAD-7 问卷在检测广泛性焦虑症时得出的总体敏感度为0.64,95% CI [0.56, 0.72],总体特异度为0.91,95% CI [0.87. 0.93]。对于检测任何焦虑症,总体敏感度为0.48, 95% CI [0.40, 0.57],总体特异性为0.91, 95% CI [0.89, 0.93]。

在建议的截止值 3 或更高(或最接近的可用截止值)下,GAD-2 对检测广泛性焦虑症的总体敏感度为0.68, 95% CI [0.59, 0.75],总体特异性为 0.86, 95% CI [0.82, 0.89]。对于检测任何焦虑症,总体敏感度为0.53, 95% CI [0.44, 0.62],总体特异度为 0.89,95% CI [0.86, 0.91]。

GAD-7 检测广泛性焦虑症的 95% 预测区域比其他三项分析的预测区域更大(表明存在明显的统计异质性)。在分析 GAD-7 和 GAD-2 以检测任何焦虑症时,特异性因场所而异,而在分析 GAD-2 以检测广泛性焦虑症时,特异性则根据参考标准而有所不同。在对广泛性焦虑症的 GAD-7 分析中,敏感性随患病率而变化。对潜在异质性来源的其他调查并未显示出与测试准确性有统计学上的显著关联。在所有分析中,与其他两种情况相比,具有特定条件的受试者的敏感性往往更高,特异性往往更低。总体而言,亚组分析的异质性仍然很高。

在多阈值模型中,GAD-7 量表在检测广泛性焦虑症时的受试者工作特征曲线下面积为 0.86,95% CI [0.84, 0.88],在检测任何焦虑症时的受试者工作特征曲线下面积为 0.80,95% CI [0.78, 0.82]。对于 GAD-2 量表,检测广泛性焦虑症的值为 0.82, 95% CI [0.81, 0.86],检测任何焦虑症的值为 0.77, 95% CI [0.76,0.82]。比较双变量分析显示,GAD-7 和 GAD-2 的诊断测试准确性之间没有统计学上的显著差异。

作者结论

GAD-7 和 GAD-2 量表已在多种语言和不同人群中进行了测试。总体而言,GAD-7 和 GAD-2 对于广泛性焦虑症和任何焦虑症似乎都具有可接受或良好的诊断准确性。GAD-2量表似乎具有与GAD-7量表相似的诊断准确性。然而,由于纳入研究的多样性及我们发现的异质性,我们对敏感性和特异性的总结估计值应解释为粗略平均值。在特定场所,GAD-7 和 GAD-2 的表现可能与这些值有很大偏差。

翻译笔记

译者:张宇(Cochrane Hong Kong,香港中文大学那打素护理学院),审校:徐添天(北京中医药大学循证医学中心),2025年4月5日。简体中文翻译由Cochrane中国协作网成员单位,北京中医药大学循证医学中心翻译传播工作组负责,联系方式:tina000341@163.com

引用文献
Aktürk Z, Hapfelmeier A, Fomenko A, Dümmler D, Eck S, Olm M, Gehrmann J, von Schrottenberg V, Rehder R, Dawson S, Löwe B, Rücker G, Schneider A, Linde K. Generalized Anxiety Disorder 7-item (GAD-7) and 2-item (GAD-2) scales for detecting anxiety disorders in adults. Cochrane Database of Systematic Reviews 2025, Issue 3. Art. No.: CD015455. DOI: 10.1002/14651858.CD015455.