MIT用AI可通过咳嗽声来识别新冠肺炎,对无症状者准确率达100%

2020-11-07 MedSci原创 MedSci原创

早在今年4月份,麻省理工学院Auto-ID Labs研究小组研发了一个基于语音的新冠肺炎AI检测工具——Sigma。Sigma可以“听”出健康人和新冠肺

早在今年4月份,麻省理工学院Auto-ID Labs研究小组研发了一个基于语音的新冠肺炎AI检测工具——Sigma。Sigma可以“听”出健康人和新冠肺炎患者咳嗽声的差别,从而区分出用户是否感染COVID-19。研究小组用“众包”的方式获取模型训练数据,并根据实时训练数据同步更新模型。

4月9日,研究小组在学术网站arXiv上发表文章介绍Sigma计划,文章名称为《“嗨Sigma,我感染了冠状病毒吗?”呼吁用新的AI方法来支持应对新冠病毒大流行的专业医疗保健人员(“Hi Sigma,do I have the Coronavirus?”:Call for a New Artificial Intelligence Approach to Support Health Care Professionals Dealing With The COVID-19 Pandemi)》。

在针对神经类疾病患者的另一项研究中,语音识别算法也比人类专家更早判断出病人发病情况(样本量小于50的精神病患者和样本量小于1000的认知障碍患者)。因此,研究小组提议,可以设计一款AI语音识别工具,并用大规模收集的实时数据对其进行训练。

经过几次尝试,研究小组打造出了AI语音识别模型Sigma。Sigma模型基于一个卷积神经网络(CNN,convolutional neural network)进行训练。

首先,研究人员利用一个日常谈话数据库对CNN模型进行预训练;然后,研究人员用大量相似但不同的数据训练模型。这一过程被称为迁移学习,可以提高模型的预测能力。

在迁移学习的第一阶段中,模型需要学习分辨咳嗽和不咳嗽的声纹。研究人员认为这一阶段最为重要,因此,他们比较了支持向量机(SVM)、K-近邻算法(k-Nearest Neighbors algorithm)、随机森林(Random Fores)、逻辑回归(Logistic Regression)这4种浅层机器学习算法的准确性,试图找出最佳方案。结果显示,逻辑回归算法的准确性最高。

接下来,研究人员利用不到200个样本数据,借助主成分分析方法(Principal Component Analysis)制作出一个图表,对健康人咳嗽和新冠肺炎咳嗽分别进行了聚类分析(Cluster analysis),提取两种咳嗽的特征。

文章中并未给出准确率数值,但写到经过迁移学习后,Sigma模型能够主动区分出这两类人群。

模型发展:用大规模实时数据进行迁移学习

为了进一步提升Sigma模型的准确性,研究人员计划在未来收集大量真实数据,让模型进行深入迁移学习。他们强调:“如果我们有更多的临床数据和志愿者,我们就可以做更多”。他们将从4个主要渠道获取信息:招募150名新冠肺炎患者和3000名接触者,同时固定收集墨西哥、西班牙和美国这三个国家的感染者咳嗽声音频。

此外,研究人员呼吁更多新冠肺炎患者通过社交媒体渠道提交录音。文章中写明了对录音的要求:

1. 录制内容可以是咳嗽声、数字从0到9或语气词“Ommmmmmmmm”;

2. 录音时长为12秒。

研究人员称,如果能够建立一个足够大的实时数据来源,Sigma模型还能被开发出更多功能:

对于已经确诊新冠肺炎、但在居家隔离的患者来说,Sigma可以进行一项纵向音频测试,为用户提供是否需要医院就诊的建议;Sigma还可以筛选出病情最严重的新冠肺炎患者,优先为他们分配重症监护病房。

到现在11月份刚刚公布的结果显示:这款AI能识别与新冠肺炎特有的4个特征相关的咳嗽差异:肌肉退化、声带强度、情绪(例如怀疑和沮丧)、呼吸和肺功能。结果表明,该AI模型识别出新冠肺炎病患的准确率为98.5%;识别出无症状感染者的准确率为100%。

根据发表在《IEEE医学与生物学工程杂志》(IEEE Journal of Engineering In Medicine and Biology)上的一篇论文研究,研究小组报告了一种AI模型,能通过咳嗽录音(人们可以通过浏览器和手机、笔记本等设备自愿提交),将无症状人群与健康人区分开来。

研究人员根据数以万计的咳嗽样本和口语训练了这个模型,然后给模型提供新的咳嗽记录时,它能准确地识别出98.5%的咳嗽来自于被证实患有新冠的人,包括识别出100%的无症状者的咳嗽,后者报告他们没有症状,但病毒检测呈阳性。

如果FDA(美国食品药品监督管理局)批准并大规模采用这个App,将会成为一个免费、方便、无创的预筛选工具,用于识别可能对新冠无症状的人。



版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (3)
#插入话题
  1. 2020-12-05 gracezdd
  2. 2020-11-07 公卫新人

    新冠肺炎,疫情何时才能消失

    0

相关资讯

Cell Discovery:李兰娟团队研究,新冠病毒在时刻突变,复制和感染能力显著变化,并导致患者病情差异

目前,新型冠状病毒(SARS-CoV-2)引起的全球大流行,已累积感染超过4800万人,导致了超过120人死亡,而且,这一数字仍在快速增加中,随着北半球冬季的到来,疫情二次爆发也随之而来。

NEJM:5天或10天瑞德西韦疗法用于治疗无需机械通气的重度新冠肺炎患者

对于不需要机械通气的重度Covid-19患者,瑞德西韦治疗5或10天的疗效差异不显著,由于缺少安慰剂组,瑞德西韦的治疗收益无法确定

2020年11月6日全球新冠肺炎(COVID-19)疫情简报,确诊超4897万,新增与死亡均创新高,首次出现水貂传人,且已变异

据Worldometers实时统计数据显示,截至北京时间11月6日07时03分,全球新冠肺炎(COVID-19)确诊病例达4897万例,新增571,983例至48,978,318例,死亡病例达123万

南非新冠肺炎治愈率接近92%

截至南非当地时间11月6日,南非新冠肺炎确诊病例达到732414例,死亡病例达19677例。目前,南非新冠肺炎确诊病例总数依旧排名非洲首位。

2020年11月7日全球新冠肺炎(COVID-19)疫情简报,确诊超4963万,日新增超60万,美国确诊超1000万

据称Worldometers实时统计数据显示,截至北京时间11月7日07时30分,全球新冠肺炎(COVID-19)确诊病例达4963万例,新增605,347例至49,631,331例,死亡病例达124

内部披露:美国CDC实验室事先明知试剂盒有问题仍然发布?

世界上最大的公共卫生组织何以被病毒、总统和其领导人所屈服,造成的损害可能比新冠病毒持续的时间长得多。