关键信息
• 不同研究的结果有很大差异,但我们不知道原因。这意味着医院抑郁和焦虑量表焦虑分量表在实践中应用可能会更好或更差。
• 然而,根据综合结果,实际上,很多人会被贴上阳性的标签,但事实上并非如此,这可能会对医疗保健系统造成更大压力。
为什么准确检测焦虑症很重要?
焦虑症很常见,但常常未被发现,即使是那些可以从治疗中获益的人。通过筛检过程,受试者被分为两组,检测结果为阳性的人和检测结果为阴性的人。结果为阳性的需要进一步评估。最终诊断由有能力的医生做出。然而,筛选过程可能会产生不正确的结果。存在焦虑症而未能检测到称为假阴性结果。这可能意味着错过及时治疗的机会。假阳性结果错误地显示焦虑症,但实际上并不存在焦虑症。这可能给患者和公共卫生系统带来负担,因不必要的担心,进一步检测和治疗。焦虑症涵盖不同的情况,这些情况可以用「任何焦虑症」(Any Anxiety Disorder,AAD)来概括。其中包括广泛性焦虑症(Generalised Anxiety Disorder,GAD)和恐慌症。在我们的综述中,我们研究了三种状况。
什么是“HADS-A”分量表?
医院焦虑和抑郁量表(The Hospital Anxiety and Depression Scale,HADS)是一份问卷。它的构建是为检测有医疗问题的人的焦虑和抑郁情绪。它包含两部分:抑郁分量表(HADS-D)和焦虑分量表(HADS-A)。每个分量表有七题。受试者按照 0 到 3 的等级回答这些问题。回答完所有问题后,将分数相加得出总分。总分达到或超过指定分数(截断分数),表示有焦虑症。对于可能的焦虑症,建议的 HADS-A 截断值为 8 或更高(对于确定的焦虑症,则为 11 或更高)。HADS-A 可以简单快速地得出结果,因此 HADS-A 分数高的人可被转介进行进一步的评估。
我们想知道什么?
我们的目的是知道HADS-A 能够多好地判断成年人是否有焦虑症。
我们做了什么?
我们检索了使用 HADS-A 检测焦虑的研究。我们综合了这些研究的结果。
我们发现了什么?
本综述纳入了67 项研究的结果,涉及 18,467 名受试者。54项研究提供了HADS-A检测AAD的信息,35项研究提供了检测GAD的信息,10项研究提供了检测恐慌症的信息。
本综述的主要结果是什么?
仅检测 AAD 的综合结果表明,如果对 1000 名个体进行 HADS-A 测试,其中 170 人已确诊为AAD,那么:
• 在 325 名 AAD 检测呈阳性的人中,199 人被错误地标记为患有 AAD(假阳性),126 人被正确标记为阳性(真阳性)。
• 在 675 名检测结果为阴性的人中,有 44 人被错误地标记为未患有 AAD(假阴性),而 631 人被正确地标记为阴性(真阴性)。
证据的局限性是什么?
以上范例来自所有研究的综合结果。然后,所有研究的结果大相径庭。此外,大多数研究的开展方式存在问题。最后,并非所有研究都提供了足够的信息让我们判断其中是否也纳入有心理健康问题的受试者。因此,我们不确定 HADS-A 是否总是与上述综合结果相符。
证据的时效性如何?
证据检索更新至2024年7月10日。
阅读完整摘要
尽管焦虑症是一种非常普遍的精神健康疾病,但它经常无法诊断,因此使用问卷进行焦虑筛查是一种潜在的解决方案。本综述总结了医院焦虑和抑郁量表焦虑分量表(Hospital Anxiety and Depression Scale Anxiety subscale, HADS-A)用于筛查目的的测试准确性。
研究目的
评估 HADS-A 在筛查成人焦虑症(any anxiety disorder, AAD)、广泛性焦虑症(generalised anxiety disorder, GAD)和恐慌症方面的测试准确性,并研究测试准确性如何因异质性来源和所有截断值而变化。
检索策略
我们检索了 1990 年至 2024 年 7 月 10 日的 Embase、MEDLINE、PubMed-not-MEDLINE 子集和 PsycINFO。我们检查了所纳入研究和综述文章的参考文献列表。
纳入排除标准
我们纳入了对成年人进行横断面 HADS-A 测试的研究,同时进行了结构化或半结构化临床访谈,从而可以创建 2x2 表格。我们排除了病例对照研究、实施 HADS-A 与参考标准之间时间间隔超过四周的研究,以及基于 《精神障碍诊断和统计手册》第三版 或更早版本的诊断标准的研究。我们还排除了涉及根据心理健康症状招募受试者的研究。
资料收集与分析
至少有两位综述作者独立决定文章的合格性、提取资料并使用诊断准确性研究质量评估 (Quality Assessment of Diagnostic Accuracy Studies,QUADAS-2) 评估所纳入研究的方法学质量。对于每个目标症状,我们呈现每项研究的敏感性和特异性以及 95% 置信区间 (confidence intervals,CI)。对于主要分析,我们使用双变量模型来获得建议的 HADS-A 截止分数 8 或更高(≥ 8)的汇总估计值;如果双变量模型不收敛,我们使用多阈值模型。 对于二次分析,我们使用双变量和多阈值模型获得了所有截止值的汇总估计值。从多阈值模型中,我们从汇总接收器操作特性 (summary receiver operating characteristic,SROC) 曲线和曲线下面积 (area under the curve,AUC) 中得出所有可用截断值的汇总估计值,作为总体准确度的衡量标准。我们使用meta回归模型探索了异质性的来源。
主要结果
我们找到了 67 项研究,涵盖了 18,467 名受试者的数据,可供分析。54 项研究进行了 HADS-A 检测 AAD 的分析,35 项研究检测 GAD,10 项研究检测恐慌症。AAD、GAD 和恐慌症的中位患病率分别为 17%、7% 和 6%。纳入的研究显示出广泛的临床和方法学的差异。
我们认为 19 项研究中的总体偏倚风险较低。最常见的局限性与非连续患者选择和事后截止值确定有关。在九项研究中,三个领域的适用性都不太令人担忧。适用性的主要限制是存在预先诊断的焦虑症(在接受 HADS-A 之前)或未收集或报告此信息。
不同研究对敏感性和特异性的估计值存在很大差异。对于推荐的截止值≥8,HADS-A 分量表检测 AAD 的总体灵敏度为 0.74(95% CI [0.70, 0.78]),总体特异性为 0.76(95% CI [0.73, 0.79]);检测 GAD 的总体灵敏度为 0.82(95% CI [0.76, 0.87]),总体特异性为 0.74(95% CI [0.70, 0.77]);检测恐慌症的总体灵敏度为 0.80(95% CI [0.69, 0.88]),总体特异性为 0.66(95% CI [0.55, 0.76)。多阈值模型的结果显示,检测 AAD 的 AUC 为 0.81(95% CI [0.79, 0.82),检测 GAD 的 AUC 为 0.82(95% CI [0.80, 0.84]),检测恐慌症的 AUC 为 0.81(95% CI [0.77, 0.85])。
除了对 GAD 方面的异质性调查显示环境对特异性有显著影响外,观察到的异质性在很大程度上仍无法解释;患病率和参考标准对敏感性有显著影响。对于恐慌症,正式的异质性评估是不可行的。
作者结论
在 AAD 患病率为 17% 的 1000 名个体样本中,使用 HADS-A 进行筛查,截断值为 ≥ 8,将导致 675 名个体检测结果为阴性,其中 44 名呈假阴性,而 325 名呈阳性。其中 199 个是假阳性,可能会对现有的医疗资源造成压力。
然而,在解释综述结果时需要谨慎,因为证据的强度受到偏倚风险、适用性问题和大量无法解释的异质性的限制。从应用 HADS-A 的临床人群中得出的估计值是一种合理的方法。然而,由于每个人群类别的研究数量有限,目前无法按临床人群进行亚组分组。这表明未来研究需要进一步探索该领域。无法解释的异质性使得可靠地预测未来研究的结果变得具有挑战性。鉴于这些局限性,在不同环境和人群中普遍使用截断值≥8 的 HADS-A 进行筛查目前值得怀疑。
译者:张宇(Cochrane Hong Kong,香港中文大学那打素护理学院),审校:徐添天(北京中医药大学循证医学中心)。2025年7月18日。简体中文翻译由Cochrane中国协作网成员单位,北京中医药大学循证医学中心翻译传播工作组负责,联系方式:tina000341@163.com