远程虚拟评估诊断痴呆有多准确?

此问题为何重要?

痴呆是一种慢性进行性病况,会影响人们的记忆力和日常运作能力。痴呆的临床诊断通常包括脑部扫描、体格检查和病史采集。作为第一步,我们经常用记忆和思维测试以识别出需进一步评估者。传统上,这些测试是亲身执行的,但修改后的测试容许其通过电话或视频通话而使用,这有时谓为“远程评估”。

由于COVID-19,对远程评估的需求变得尤为急迫。然而,远程评估还有超出COVID-19大流行之外的各种潜在益处。对有些人来说,亲身赴约看诊会有困难,远程评估则提供了更大的便利。远程评估在研究中也很有用,因为可在相当短的时间内接触到大量的人。

通过电话进行的测试或许不像亲身等效测试那么好,正确进行这些测试也就很重要了。一方面,如果测试表明某人患有痴呆而其并没有(此谓假阳性),这可能会对个人及其家人产生情感影响。另一方面,如果记忆和思维出现问题时而未能识别出它们(此谓假阴性),意味着此人未得到其所需的治疗和支持。

本综述的目的是什么?

我们旨在评估通过电话或视频通话进行的记忆和思维测试是否可检出痴呆。

本综述研究了什么?

我们检视了各种记忆和思维测试。随着时间的推移,现已开发出诸多种测试,其内容及其应用各有相同,但多是基于对传统亲身测试的修改。

本综述的主要结果是什么?

本综述纳入了31项研究,采用了19种不同测试,共有3075名受试者。

只有7种测试与我们关于远程测试准确性的问题有关。以数量有限的研究,对这些测试准确性的估计是不准确的。我们的综述表明,远程测试可在26%到100%的时间内正确找出痴呆患者,还可在65%到100%的时间内正确排除痴呆。

其余24项研究比较了远程测试与面对面的等效测试。这些研究表明,远程测试分数通常与亲身测试一致,但这并不完美。

本综述研究结果的可靠性如何?

在这些研究中,痴呆的临床诊断被用作参考(金)标准。我们找到了些研究设计、实施和报告方面的问题。有个特别的问题是围绕研究受试者的选择。各研究通常不纳入有听障或语障者,这会复杂化远程检测。

此研究结果适用于谁?

大多数研究对65岁以上的老年人进行了探究。这些发现或许代表不了所有老年痴呆患者,因为有些研究仅查验了特定的人群(例如卒中后)。各研究通常由专家在专科中心执行。因此,我们不知道这些检测如何很好得在常规社区实践中找出痴呆。

本综述的意义是什么?

本综述强调了缺乏高质量的研究来描述基于电话和视频通话的记忆和思维测试的准确性。本综述纳入的各研究间有诸多差异,例如所用测试类型、纳入的受试者、研究实施环境以及研究的语言。这使各研究间的比较变得困难。我们的综述表明,远程评估和亲身评估并不总是等同的。亲身评估难行的情况下,远程测试可以是有用的第一步。理想情况下,随后则应在做出诊断前行亲身评估。由于研究数量有限,且研究方式存在差异,我们尚不能推荐一种特定的远程测试来评估痴呆。

本综述的时效性如何?

检索于2021年6月进行。

作者结论: 

尽管远程认知评估的使用较为普遍且越来越多,但有关测试准确性的支持证据有限。现有数据不允许我们就首选测试给出建议。远程测试很复杂,这反映在所用测试法、其应用情况及其分析中可见到的异质性。需要有更多的研究来描述当代远程认知评估方法的准确性。虽然比较远程和亲身测试数据令人放心,但当等效测试经调整以作远程使用时,亲身测试衍生的阈值和评分规则或许就不适用了。

阅读摘要全文……
研究背景: 

越来越需要远程认知评估来帮助检出认知障碍,但基于电话和视频的认知筛查的诊断准确性仍不清楚。

研究目的: 

评估远程施行的用于诊断任何形式痴呆的任何多域认知测试的测试准确性。

评估使用远程平台进行认知测试评分的潜在差异,而其中还有比较远程筛选工具与等效的面对面测试。

检索策略: 

2021年6月2日,我们检索了ALOIS、Cochrane痴呆和认知改善小组专业注册(Cochrane Dementia and Cognitive Improvement Group Specialized Register)、CENTRAL、MEDLINE、Embase、PsycINFO、CINAHL、科学引文数据库(Web of Science)、LILACS以及临床试验注册平台(www.clinicaltrials.gov)数据库。我们对纳入的引文进行了前向和后向检索。

纳入排除标准: 

我们纳入了横断面研究,其中远程多领域评估与痴呆的临床诊断或等效的面对面测试一起进行。

资料收集与分析: 

2名系统综述作者独立评估风险偏倚,并独立提取资料;第3名系统综述作者对分歧做出调整。我们的主要分析是远程评估相对于痴呆临床诊断的准确性。有可用数据的情况下,我们以敏感度和特异度来报告测试的准确性。我们未进行定量meta分析,因为个体测试水平的研究太少。

对于那些比较远程与亲身使用等效筛选测试的研究来说,若数据允许,我们就描述相关性、可靠性、得分差异以及每项测试被归类为有认知障碍的比例。

主要结果: 

本综述包含31项研究(19项不同的测试,3075名受试者),其中7项研究(6次电话,1次视频通话,756名受试者)与我们要描述相对于痴呆临床诊断的测试的准确性的主要目的有关。所有研究都在至少1个领域有不明确或高偏倚风险,但在适用于综述问题方面则为低风险。总体而言,远程工具的灵敏度在26%到100%之间变化,特异度则在65%到100%之间变化,并无有明显优效的测试。

24篇论文可见比较了等效远程和亲身测试(14次电话,10次视频通话),各测试之间的一致性良好,但很少是完美的(相关系数范围:0.48-0.98)。

翻译笔记: 

译者:臧渝梨(Cochrane Hong Kong, 香港中文大学医学院那打素护理学院),审校:徐添天(北京中医药大学循证医学中心)。2022年5月11日。简体中文翻译由Cochrane中国协作网成员单位,北京中医药大学循证医学中心翻译传播工作组负责,联系方式:tina000341@163.com。

Tools
Information