据 MedCity News 报导,科技巨头亚马逊正在将其「饱受争议」的 Rekognition 图像辨识软体和影像分析服务,应用到医疗图像领域。
亚马逊称,Rekognition 将联合亚马逊 Amazon Comprehend Medical 医学语言处理服务,透过 Amazon Web 云端计算平台,以更有效的方式抽取医学图像中的个人健康资讯(PHI)。
饱受争议的 Rekognition
Rekognition 于 2016 年推出,是亚马逊最具争议的产品之一。
据了解,这是一款在亚马逊伺服器上执行的图像辨识 AI 软体,它可以辨识图像或影像上的文字、对象、场景、活动和人员。在美国,警方已经开始使用该软体寻找走失的儿童和被拐卖的人口。
但是,此举引发美国民众强烈的反对和民权倡导者的质疑,遭到亚马逊用户、民间组织、股东甚至亚马逊员工在内超过 15 万人联名抗议。
其中,最强烈的质疑声音来自美国公民自由联盟(ACLU)。该组织称,无处不在的脸部辨识软体可能侵犯人们的隐私,并造成一个无缝不入的政府监控系统。
2018 年,美国公民自由联盟(ACLU)使用亚马逊的这款人脸辨识软体进行了一项实验,结果软体错误地将 28 名国会议员判定为之前被捕的罪犯。
亚马逊对此结果回应称,是 ACLU 使用方法不对,才会造成上述看似荒诞的误判。
医学影像中的 PHI 问题
基于云端计算、大数据、人工智慧等技术,新一代医学影像系统达到了数位化、行动化和智慧化。
数位化的医学影像系统在很大程度上提高了医务人员诊疗过程中图像储存、共享、查看、搜寻和策划的能力。另外,随着数位化的推进,设备的类型也丰富起来,从电脑断层扫描到核磁共振再到超音波,用于医学研究的数据积累越来越多。
但医务人员在处理医学图像资讯时仍然面临一个问题,患者的隐私数据需要被保护。因此需要安全的数据标记和处理过程,但此过程往往需要人工操作。
个人健康资讯(PHI),包括个人过去、现在或未来的生理或心理健康状况、相关医疗过程、医疗费用三部分。资讯中涉及的通用标识,比如姓名、地址、生日、社会安全号码等,均受到 HIPAA(Health Insurance Portability and Accountability Act)隐私规则保护。
在医学图像档案中,一份医疗纪录、一份检验检查报告或医院帐单都可能是 PHI,每份文档都包含了患者姓名和其他能辨识个人的资讯。
医务人员手动去除个人健康资讯(PHI)的过程,十分耗时耗力。
2018 年,亚马逊推出 Amazon Comprehend Medical,该产品利用人工智慧自然语言处理(NLP)技术,帮助医务人员在医学文本中检测和辨识 PHI。
亚马逊的医学影像 PHI 辨识架构
日前,亚马逊官网称,其 Amazon Comprehend Medical 医学语言处理服务和 Rekognition 图像辨识软体及影像分析服务,将被联合应用于医学影像的 PHI 辨识及处理过程。
据了解,在实际的机器学习和预测结果过程中,Amazon Rekognition 可以从图像中提取文本,然后依托 Amazon Comprehend Medical 功能来帮助研究者辨识和检测 PHI。
另外,亚马逊表示,当使用 Amazon Comprehend Medical 来检测和辨识受保护的健康资讯时,该服务为每个已辨识的实体提供了置信度评分,表示被检测实体準确性的置信度水平。软体操作者可以结合系统置信度评分,对实体中 PHI 的辨识进行检查,必要时进行手动辨识,以确保準确度。