用于检测成人黑色素瘤的智能手机应用程序(applications, “apps”)的准确度如何?

本综述的目的是什么?

我们想明确智能手机应用程序在帮助人们了解他们的皮肤病变是否可能是黑色素瘤方面的表现如何。

为什么改善恶性黑色素瘤皮肤癌的诊断很重要?

黑色素瘤是最危险的皮肤癌之一。无法早期确认黑色素瘤(假阴性测试结果)可能会耽误患者寻求适当的治疗建议和延误手术切除的时机。这将增加癌症扩散到身体其他器官的风险并可能导致死亡。当皮肤病变不是黑色素瘤而被认为黑色素瘤(假阳性结果)可能引起患者焦虑并导致不必要的手术和进一步的检查。

本综述研究了什么?

智能手机用户可很便利地下载到专门的应用程序(applications, “apps”)来为用户提供皮肤病变或痣的相关分析建议。一些应用程序通过人们拍摄的可疑皮肤病变图像来指导人们是否要去就诊。一些应用程序可以自动将病变分类为高风险或低风险,另一些应用程序可以作为图像存储转发设备,人们可将图像发送给经验丰富的专业人士,例如皮肤科医生,他们可基于照片进行风险评估。Cochrane研究人员检索到两项研究,评价了能对可疑皮肤病变做出评估的应用程序,其中五个是自动分析图像程序,另一个是存储转发图像程序。

本综述的主要结论是什么?

该综述纳入了两项包括332个病变的研究,其中包括86例黑色素瘤,至少通过一种智能手机应用程序进行了分析。因为医生已经确定它们可能是黑色素瘤,所以两项研究都使用了即将被切除的痣或皮肤病变的照片。并且这些照片是由医生而不是患者拍摄的。出于这些原因,我们无法对应用程序的实际运行情况做出可靠的估计。

4个应用程序可以对智能手机拍摄的皮肤病变或痣进行即时(自动)评估,但漏掉了7到55个黑色素瘤。

一个通过将痣或皮肤病变照片发送给皮肤科医生进行评估的应用程序仅漏诊一个黑色素瘤。 另外6个黑色素瘤由皮肤科医生通过该应用程序分析未被分类为高风险;相反,皮肤科医生无法确定病变分类为“非典型”(可能是黑色素瘤)或“典型”(绝对不是黑色素瘤)。

本综述中各项研究结果的可信度如何?

纳入的研究数量少且质量差,降低了研究结果的可靠性。所纳入的人并不是那些在现实生活中使用这些应用程序的典型人群。黑色素瘤的最终诊断是通过组织学进行的,这可能是决定患者是否确实患有黑色素瘤*的可靠方法。然而,由于应用程序未能提出建议,该研究排除了2%到18%的图像。

本综述的结论受众是谁?

这些研究在美国和德国完成。研究者没有报告诸如患者年龄和性别这些关键信息。最终诊断为黑素瘤的百分比分别为18%和35%,远高于社区中观察到的百分比。与可能的应用程序用户相比,符合条件的患者的限定范围很窄。研究中使用的图像是由医生而不是智能手机用户拍摄的,这严重影响了结果的适用性。

本综述有何启示?

目前使用智能手机应用程序自动分析皮肤病损或痣很可能漏诊黑色素瘤(假阴性结果)。存储转发图像类应用程序可以通过促进可疑皮肤病变患者的早期参与来及时识别潜在恶性病变的人,但是这种方式存在资源和工作量的制约。

开发可帮助识别可疑黑色素瘤的应用程序是一个快速发展的领域。随着新的应用程序出现,更高质量和更好的研究可能会全面改变这项综述的结论。

本综述的最新进展如何?

综述作者检索并使用了截至2016年8月发表的研究。

*在这些研究中,组织活检是参考标准(确定最终诊断的方法)。

作者结论: 

使用基于人工智能分析的智能手机应用程序尚未在准确性方面表现出足够好的前景,并且这些应用程序漏诊黑色素瘤的可能性很高。基于存储转发图像的应用程序可以通过促进积极的自我健康管理和早期干预疑似的皮肤病变,及时发现具有潜在恶性病变的人;但是,这种方式可能会导致资源困境和工作量显著增加。鉴于现有研究证据的缺乏和方法学质量较低,不可能对实践产生任何影响。然而,这是一个快速发展的领域,如果能产生功能更强的新型图像分析应用程序,那么它将全面改变目前的结论。

阅读摘要全文……
研究背景: 

黑色素瘤占所有皮肤癌病例的一小部分,但却是大多数与皮肤癌相关的死亡原因。早期发现和治疗可以提高患者生存率。智能手机应用程序易于获取,可评估恶性肿瘤可能性的即时风险,以便疑似患者寻求临床医生的进一步诊治,从而获得更详细的评估结果。然而,如果应用程序向用户确定其病变风险比实际偏低,则存在漏诊黑素瘤并且延误治疗的风险。

研究目的: 

本综述的目的是评价智能手机应用程序对于成人可疑不良皮肤病变的诊断准确性,以便排除皮肤侵袭性黑色素瘤和非典型表皮内黑素细胞变异。

检索策略: 

从开始到2016年8月,我们对以下数据库进行了全面检索:Cochrane对照试验中心注册库(Cochrane Central Register of Controlled Trials);MEDLINE;Embase;CINAHL;CPCI;Zetoc;科学引文索引(Science Citation Index);美国国立卫生研究院正在进行的试验注册库(US National Institutes of Health Ongoing Trials Register);NIHR临床研究网络组合数据库(NIHR Clinical Research Network Portfolio Database);和世界卫生组织国际临床试验注册平台(World Health Organization International Clinical Trials Registry Platform)。我们还检索了参考文献列表和已发表的系统综述文章。

纳入排除标准: 

任何评估智能手机应用程序设计的研究,这些应用程序旨在供社区中的个体使用,人们可使用这些应用程序对疑似黑色素瘤或非典型表皮内黑素细胞变异进行评估,而不是组织学确认或临床随访和专家意见作为参考标准。

资料收集与分析: 

两位综述作者通过标准化资料提取和质量评价表(基于QUADAS-2)的方式独立提取所有资料。由于数据稀缺和研究质量差,我们没有对此次综述进行meta分析。为了便于说明,我们对相关的每种应用程序敏感性和特异性绘制了耦合森林图。

主要结果: 

本综述报告了两项研究中发表的两组病变资料。这两项研究都存在选择性招募受试者的高偏倚风险和不可评估图像的高发生率。由于仅包括在皮肤病诊所中已经选择用于切除的病变,并且由于图像是由临床医生而不是智能手机用户拍摄,因此作者对智能手机应用程序确认病变的普适性表示较高程度关切。

我们报告了两项研究中5个应用程序和332个可疑皮肤病变的数据,其中有86个黑色素瘤。在使用预编程算法将病变图像(照片)分类为黑素瘤(一种应用程序)或高风险或“有问题”病变(三种应用程序)的四种基于人工智能的应用中,敏感性范围为7%(95%CI=[2%, 16%])至73%(95%CI=[52%, 88%]),特异性从37%(95%CI=[29%, 46%])至94%(95%CI=[87%, 97%])。使用由皮肤科医生对病变图像进行存储转发的一项应用具有98%的敏感性(95%CI=[90%, 100%])和30%的特异性(95%CI=[22%, 40%])。

测试失败的次数(由应用程序分析的病变图像,但被归类为“无价值”并被研究者排除)的范围为3至31(或所分析病变的2%至18%)。存储转发应用程序具有最高的测试失败率(15%)。在四种应用程序中的三个中,至少有一个黑素瘤被应用程序归类为不可评价。

翻译笔记: 

译者:孙旗(北京中医药大学志愿者);审校:刘雪寒(北京中医药大学循证医学中心) 2019年4月9日

Tools
Information