如今,随着AI医疗发展,医工交叉——这个由来已久问题也延伸到这块新兴的土地上。隔行如隔山,这对于IT界和医疗界来说尤其贴切,当双方团队共同打造一个产品时,面临着话语体系不同、评价方式不同、谁来主导等诸多问题。
目前这个市场还处于初期,各路玩家相继入场,产品仍处于科研摸索期。相对于蜂拥而入的AI公司来说,愿意参与进来并且拥有丰富经验的医生专家是更加稀缺的资源。那么什么阻碍了他们?当医生想要参与时,他们考量什么、在意什么?
广东省人民医院放射科刘再毅教授称,“医生没有多少动力做研究,现在做科研的很少,就像是‘异类’,我做这个纯粹是兴趣驱使。”2016年,其课题组基于影像组学构建列线图(nomogram)对结直肠癌淋巴结转移术前预测的结果发表在临床肿瘤学领域顶级期刊《J Clin Oncol》上。“我们做的项目离传统的影像诊断越来越远,需要多个学科的交叉融合”,他告诉雷锋网(公众号:雷锋网),“很多医生对人工智能感兴趣,但真正做的很少”。这不仅需要医生从繁忙的临床中抽出时间,“搜集数据需要大量资金,与AI创业公司合作又不是那么简单。”
“这都不是那么简单的”是雷锋网与刘再毅交谈2个多小时内出现频率最高的句子。他表示,医工合作对双方都有很高的要求,一是要有共同的目标;二是有很好的合作机制,协调如何把利益最大化;三是双方团队质量都要高。
“医生与创业公司的要的东西不一样,说得好听点就是各取所需,说得不好听就是道不同不相为谋”,他说。
以下为刘再毅的口述。
「你让我写代码,这不是见鬼吗?」
在我们科室,目前还没有智能诊断系统这样的东西。目前确实有很多产品在往临床上推。但智能影像方面,目前国内还没有一款很成熟的产品。之前,媒体有报道一些产品在医院落地,我打听过一些,医生的评价也不是很好。也就是说,智能影像诊断方面还没有一个好的落地应用案例。
很多公司的产品交互很差,用起来非常繁琐。他们工科会说,我写两行代码就可以搞定了。你让我写代码,这不是见鬼吗?所以工科思维一定要转变,深入到临床一线,看我们究竟需要什么。
至于数据方面,影像只是很小一方面,我做影像也发了很多文章,但不觉得影像是最重要的,换言之,影像虽然重要,但不是唯一,要结合其他临床信息。我们做信息挖掘时,要结合病人的基因、病理、血液实验室检查等信息。比如病人在ICU,还会考虑结合患者心电图检测信息、电解质、血氧饱和度等诸多动态信息。
目前,很多公司只做图像识别、筛查,大部分集中在肺部,为什么?因为肺有天然的对比,大家都挑了一个容易攻克的方向做。虽然在临床中确实可能减少一些工作量,但这是很小的应用场景。
以肺癌为例,我们平常在医院看到的很多病例,大部分是复查的,一些三期、四期病人的肺部有很多转移灶,合并渗出、肺不张等,计算机方法很难实现自动对比,一定要人工对比,如果计算机看完还需要医生重新确认一遍,还不如自己看呢。至于很小的肺结节,医学界有个指南,建议了怎么处理,比如发现之后,3个月、半年分别复查;根据倍增时间多久等情况判断是恶性还是良性?不可能刚发现肺结节就做手术的,这不得了。
肺结节筛查是很好的开始,但目前还有很多问题,系统可以有假阳性,可以误判,这可以由医生来把关,但漏病灶的后果是很严重的。最重要的是,如何得到监管部门的认可?国家批准之后,其临床应用的责任才能理清,否则出了问题,谁来负责任?计算机?还是批准软件的人?还是采购的人?还是医生?
另外,病人就诊时,肺结节检出只是临床诊疗过程很小的一部分。我们看一个胸部的片子,看了肺之后,还要看淋巴结、骨格等,很多公司的系统只能检出肺结节。患者来医院就诊,如果医生只是把肺结节检测结果给他,没有报告同一份影像图像其他合并的影像诊断,是要负责任的,因为在临床上做检查偶然发现肿瘤也是常见的。
所以,这种系统用在体检中心还可以,但体检中心的市场能有多大?
「说实在的,我还找不到与AI公司合作的方式」
做医学图像挖掘,医生与AI创业公司的合作是必不可少的,但一定要以医生为主导来做,公司负责后续的产品化。其中最关键在于:要解决什么样的临床问题。
我是做研究的,思路与公司可能不太一样,双方都是要提升诊断率,差异就在于具体聚焦在什么地方?科研解决的是悬而未决的问题,而AI公司是要打造一个产品解决实际问题,双方目标不一样,我觉得很多东西不是想象的那么简单。
从科研的角度来讲,目的在于提出一个临床假设,并证明。比如我想通过影像数据挖掘判断某种疾病的愈后好不好或判断疗效,在这种情况下,我会搜集病例,用某些方法验证,最后得到一个结果。至于结果如何,我们并不知道,创业者的想法跟我们肯定完全不一样。
有公司找我合作,说实在的,我还找不到合适的方式,如果要合作,一定是深入的交流,其中需要有人起到桥梁、翻译的作用。比如深度学习的很多概念我们临床医生搞不懂,但同时工科的人也多半不懂什么叫预后,甚至不知道这样做的意义何在。
医学上很多问题和其他领域不一样,比如阿里要调研用户的购买习惯,这种数据多得不得了,但医学上很多疾病数据很少,一个单位可能仅有一两百病例符合标准。我想没有一家医院敢说有几千例这样的复合标准的图像。我们医院有数万病例,但基于不同的疾病、检查方式、研究目的区分之后,数据一下子就变得很少了。
工业界和学术界的合作,对双方都有很高的要求:一是有共同的目标;二是有很好的合作机制,协调如何把利益最大化;三是双方团队质量很重要,缺一不可。
如果我与创业公司合作,最关心的他们的人员构成和数据来源。
做医学数据挖掘,一定要有医疗背景的专家,他能起到桥梁作用,把临床问题转换为技术问题,让IT团队实现;同时,做技术的没有接触过医学,可能不明白人体分为几个系统、每个系统由什么组成、有哪些脏器,更不要说疾病了。我知道很多医院做的事情是把数据提供给公司,这个方法确实可行。但如果要真正挖掘,一定要深入,不是一方简单地提供数据,一方简单地提供算法,双方直接应该有深度的交流、沟通,共同发现问题,解决问题。
国内最常见的合作方式是医院提供数据,公司来分析,双方共享成果或是公司卖软件给医院。但我认为这样的合作不长久,目标不同,长期以往,估计会分道扬镳。我觉得目前的合作,肯定得以医生为主导,靠医生发现临床问题。但跟创业公司这么说,他们肯定不乐意,我的算法很先进,凭什么你做主导?所以我不是很愿意跟他们合作,我们自己有团队,我们团队做的东西在国际上是某些研究方面是很靠前的。如果我们没有团队,也没办法。除此之外,我也考虑过,跟创业公司合作,他们是否愿意配几个人给我,专门负责某个项目,我想这是不可能的事情,怎么可能呢?
还有的医院与公司合作打造出的产品,以专利授权的形式给了公司,这对医生有吸引力,但我没尝试过,没想过转化,这样很分散精力。我关心的是公司有没有好的范例,医生是否真正获得了收益,无论是以股份、顾问费等形式。但公司愿意给吗?
创业公司很难请到一个真正专业的医学人士,去了以后怎么做项目?除非公司能跟十几、二十多家医院合作了一个临床设计,但仅把各个项目的医学语言翻译成工科语言,工作量就相当大;其次,医生如何在里面起到真正的作用,这是很难定义的。
虽然现在市面上有AI公司与医生合作做一些事情,但在大部分情况下,他们的研究是小规模研究,但应用到临床的东西,需要前瞻的多中心试验验证,这是一个很漫长的过程。况且,图像只是很小一方面,只有深入去做,潜心做临床研究,才有可能得到好的结果。
「单从软件应用角度讲,我们开发的比他们还好用」
现在的AI公司都在拼算法,虽无可厚非,但如果没有实际的或重要的原创目的,这个算法有什么用呢?
我们平常的研究,关键在于临床设计,要以临床研究的方法来设计和评价应用,因为临床研究要有符合临床的研究标准,算法再先进,没有数据支撑,没有好的验证也是很难发好文章的。今年《Nature》和《JAMA》发了两篇AI医疗相关文章,一个是眼底病相关的,一个是做皮肤病的,虽然都用到了深度学习算法,但并不是多先进的技术,它们的特点在于数量大,有十几万个病例的数据。
我们最近在做肺癌、结直肠癌等几个肿瘤的研究,关注疗效评估方面,预测预后效果,评价治疗方案好不好。如果有明确的问题和高质量的数据,需要算法把有用信息挖掘出来,这种情况下,算法能起到重要的作用。实际上,有时候我们并不需要很炫的算法,常规的方法就能解决问题。
在我们的项目中,用到的还是传统的统计学方法,也借鉴了一些数据挖掘技术,比如深度学习。与创业公司不太一样的是,我们关注更偏临床目的,基于这个问题,再去组织材料、找方法,创业公司想做的是产品,比如做病灶的检出,但对于我们组来说检出没有任何价值,因为发不了好的paper。
我们的算法能力不及创业公司,我对于学生的要求就是用成熟的技术,进行二次研发、创新之后应用,目的只有一个,就是解决我们的问题。我可以说我们组的文章质量和数量算是有一定地位的,单从影像因子来说,我们发表在《临床肿瘤杂志》的文章是目前为止,全球范围内影响因子最高的,并且还是发表于临床肿瘤领域的顶级期刊,得到临床的认可,因此我们的研究很有自己的特色。
我认为很多智能医疗公司的产品是华而不实的。单从软件的应用角度看,我们开发的比他们的还好用,但是确实没有他们界面做得炫,我的目的不是为了卖产品,而是为了好用。
有些公司说他们有一千个特征,我吹牛说我有一万个特征、两万个特征都可以,目前,我们研发了一个新特征,这是影像组学界没有报道过,是我们借鉴了信息学领域的一些理论、概念,移植到医学领域,这是我们自己的创新。
我们做研究的动力来源于喜欢,这与公司完全不一样,当然我也想发更多更好的文章,但没那么急,我没有压力去变现,不会很激进地做事情,即使做不好也不影响我的生存。有些创业公司拿到几千万、几亿的风投,一下子得到那么多钱,我也很羡慕,但我现阶段没有这样的实力,也没有这样的想法。说不定有一天,我的团队强大了,我也会去创业。
「医疗数据非常稀缺,非常宝贵」
我在研究过程中发现:影像数据的质量和数量很难兼顾,很难找到满足要求的数据。除此之外,还要结合病人的其他信息来判断,比如实验室检测、病理标本等,这更是增加了难度。
我们现在做的一个项目,需要一些临床检测项目数据,像基因、血液等相关检查数据,预计能拿到500~600例可用的数据,但投入起码是上百万,这需要科研基金来支撑,医院和病人都不可能负担这个成本。
正因为难以获取基因、病理等方面数据,所以一大波创业公司才蜂拥进入影像领域,他们的很多研究是基于影像信息判断和推断基因、病理和临床信息情况,这是一种可行的方式,但还是需要很多数据去验证。
医疗数据非常稀缺,非常宝贵。
现在很多医院的PACS系统做得很好,尽管存在影像标准化的问题,至少有图像,但很多数据是没有的,比如病人做了检查、手术、治疗之后走掉了,没有完整的随访机制,没有后续数据评估临床疗效和预后等数据。我们自己做研究,要花很大力气搜集整理这些数据。
除此之外,数据质控也很关键。比如,通过电话随访,如果病人***变了,他就联系不到了;还有就是打电话随访的信息准确性问题,随访的信息有很多方面,比如肿瘤手术之后,有无复发?有没有死亡?化疗有没有进展?死亡的时间很明确,99%的亲人都记得,但有无进展是不好评估的。另外,每个随访工作人员的态度也影响随访质量。许多污染数据对我们不但没有意义,还有害处。
医疗数据不是那么简单的,不是挖掘一个点,而是很多方面。不像购物,调查消费者的购物习惯时,看其买了什么东西,价格多少,什么时候买的?数据很明确,也很容易找到。但医疗数据很多是不确定的,很难打通,这种情况下,具备完整信息的病人资料就尤其宝贵。
我感觉,医院能用的数据比例很小。判断数据是否有价值主要取决于具体研究目的。拿肺癌或其他肿瘤来说,在大医院,满足要求的可能只有10%~20%,这已经算不错的了;在二甲等地方医院,很多病人做了检查之后,去上级医院看病去了,有完整资料的病人可能只有1%~2%。
「一来就想上临床,对生命太不尊重了」
智能影像诊断还有非常长的路要走。
要真正应用在临床,要解决它的精度、实用范围和政策等问题,如果要政策批准,必须经过临床试验验证,耗资会很巨大。
我个人感觉,创业公司除了定位于肺结节检出等临床应用外,搭建科研平台也是不错的选择,要是我自己开公司,我就会这样做,帮助医生做科研的市场也不小,可以共同申请基金来维持,我知道有些创业公司就在合作申请基金。如果数据积累多了,再考虑做临床转化,像Watson这样的,这样才可能逐步走向临床。很多公司一来就想到临床,对生命太不尊重了,如果仅靠靠几百、几千例数据就取得了批准,我肯定不敢用这样的产品。
我个人觉得,医疗人工智能还非常漫长,目前无疑是过火的。