一位60多岁的日本女性患者被东京大学医学研究院诊断为急性骨髓性白血病,但对症治疗几个月后,病情并没有缓解,而后沃森救场,10分钟内对比几千万篇癌症研究论文,得出了结论:患者得的是另一种罕见白血病。
这是沃森刚进入中国时,常被经销商们用来宣传其先进性的案例。
然而,在业界内部,却流传着一个截然不同的故事:对于一名可能有严重出血症状的65岁男性肺癌患者,沃森在诊疗建议中却开出了一种可能导致出血等副作用的药物贝伐单抗。根据美国卫生系统药剂师协会的建议,对于有严重出血可能的患者,不建议使用这种有时会发生严重乃至致命的出血事件的药物。
万幸的是,这位65岁的男性肺癌患者不是真人,而是纪念斯隆-凯特琳癌症中心在训练沃森诊断能力时给出的虚拟病患。
今年以来,IBM的沃森项目接连受挫:先是大规模裁员、在美国损失许多医院客户,其中包括安德森肿瘤中心这样的重量级客户,并且第三季度的营收比去年同期下跌 6%。11月初,IBM沃森健康项目的负责人黛博拉宣布离职,为这个备受质疑的著名医疗AI项目再添一层疑云。
沃森发展进入低谷,无疑给眼下正热的人工智能医疗领域浇了一盆凉水。然而,在此背景下,沃森在中国的发展似乎并未受到影响,而国内的AI医疗产业还是形势一片大好。
沃森靠谱吗
“一些恶性肿瘤患者希望到北上广,甚至去美国寻找更先进的治疗方案,这时我们就会建议他们使用沃森。”赵铭(化名)对《中国新闻周刊》说。
赵铭是一名主任医师,广东某三甲医院分院沃森引进项目的负责人。他解释说,由于沃森是由美国纪念斯隆-凯特琳癌症中心、梅奥医院、奎斯特诊断公司这些著名医疗机构培训出来的,“用沃森看病,就相当于找美国医生会诊了。”
但沃森真的能代表美国肿瘤医疗的水平吗?
沃森陷入困境,主要源于外界对其技术的质疑。
今年7月,美国医疗媒体STAT声称拿到了IBM公司的内部文件。这份报告显示,使用沃森肿瘤解决方案的医生对其提出了强烈批评,多个案例表明,沃森常提供不准确的医疗建议,“在给出意见的过程和底层技术上存在严重问题”,甚至开错了药品。而问题主要集中在训练数据的问题上。
该报告显示:沃森系统的训练,使用的不是真实患者数据,而是虚拟患者的假想数据;沃森向虚拟患者推荐的治疗方案,都是基于纪念斯隆-凯特琳癌症中心专家的方案,并非医疗指南或真实证据;训练数据不足,8种癌症中,训练数据量最高的肺癌只有635例,而最低的卵巢癌仅有106例。
任何人工智能系统只有在得到充分的数据后才能发挥作用,但由纪念斯隆-凯特琳癌症中心训练的沃森在专家眼中是“存在巨大偏见的”。
韦恩州立大学医学院乳房外科主任大卫·戈尔斯基曾公开对媒体说,学院派医生用他们自己的理解来看待医学文献,并从他们的视角解读,这就意味着沃森沿用的是“纪念斯隆-凯特琳癌症中心”式治疗方法,而不是在任何情况下都正确的方法。
也就是说,遇到该癌症中心不拿手的癌种,沃森或许就不能给出合适的方案。
《华尔街日报》曾发文表示,在多数情况下,沃森并没有太多附加价值,而在某些情况下还可能不准确。
沃森的问题,一方面可能是因为缺乏罕见病或复发癌症的数据;另一方面,治疗方法的发展速度比沃森的人类训练者更新计算机的速度还快。
文章还指出,到目前为止,还没有公开发表的研究论文能充分证明沃森可以改善患者治疗。
“沃森只是一个工具,是一种医疗建议。” 大卫·戈尔斯基曾对美国医学网站Medscape表示,“如果医生牢记这一点,并在沃森‘想’错了的时候敢于否决它,那么肯定会有潜在用处的。”
位于青岛的百洋智能科技股份有限公司宣称拥有沃森的中国独家总代经销权,该公司首席营销官王必全在接受《中国新闻周刊》采访时一再强调,“沃森在中国属于决策支持产品,而不是诊断器械。”因为生产医疗诊断器械需要国家批准,而决策支持不用,后者就如同参考文献。
业界对沃森的失望,正是因为看清了沃森并没有宣传的那样完美。
这位“肿瘤治疗顾问”可以在17秒内阅读3469本医学专著、248000篇论文、69种治疗方案,并提出三个最优选治疗方案。“IBM在美国和中国的宣传中,把沃森说得非常完美,但应该注意,官方表述中,沃森只是辅助医生,而不能取代医生。”沃森在中国最早的战略合作伙伴、杭州认知网络科技有限公司首席运营官王泰峰对《中国新闻周刊》说。
王泰峰解释说,实际上,IBM的沃森健康部门除了提供“肿瘤解决方案”,还提供照护看管、药物研发、基因解决方案、医疗影像分析解决方案等产品。而选择研究肿瘤解决方案,是因为看到不同地区在肿瘤治疗上的巨大差异,这为高水准的肿瘤辅助AI产品提供了广泛空间。“IBM对沃森的定位在肿瘤筛查和治疗,而不是诊断,AI在诊断上的意义比较弱,这个决策是没错的,沃森最主要的问题在于单中心培训。”王泰峰说。
在6年10亿美元的投入后,沃森并没有拿到理想中的商业回报。对此,国内AI医疗领域的康夫子科技创始人张超评价说,“沃森做了很有意义的尝试,只是它没有找到好的使用场景和商业模式。”
沃森在中国
尽管沃森项目已经遭到IBM的“冷处理”,但它在中国的销售却并未受此影响——王必全说,现在推广沃森明显比以前顺利多了。
2017年,她与同事们参加全国临床肿瘤学大会时,他们连上台展示的时间都没有。但经过一年的推广与宣传,今年的全国临床肿瘤学大会将主会场三个报告的其中一个名额直接给了沃森。
据百洋科技向《中国新闻周刊》提供的数据,自2017年3月引进沃森后,截至2018年11月14日,已经在中国261家医院与医疗机构使用,其中已经签约落地的81家医疗机构分布在全国23个省的45座城市。
在这81家医院的名单里,鲜有中国一线城市顶级医院的身影,绝大部分都是国内二三线城市的三甲医院及省城里的非肿瘤专科医院。对此,王必全解释说,这些是真正需要提高水平、留住患者的医院,也是沃森的最佳应用场所。
多位受访者表示,沃森的使用非常简单,只需要把患者年龄、性别、体重、病理诊断等20多项监测结果输入电脑软件,系统会自动基于研究论文、医学指南、临床试验信息等,给出适当的治疗方案,供医生选择。因此,沃森常在多学科会诊时作为参照方案出场。
赵铭介绍说,目前,沃森可以提供乳腺癌、肺癌、直肠癌、结肠癌、胃癌、卵巢癌、宫颈癌、前列腺癌和膀胱癌等9种肿瘤的治疗方案。在他们医院试用一年后,赵铭对沃森的总体感觉是“一般”,“没有多大的促进作用,也没有不好的影响。”
对此,赵铭解释说,在治疗大方案上,医生与沃森存在较大差异,例如是先手术还是先化疗,最终方案是综合了患者意愿、治疗预期等因素后由医生决定的,但在用药剂量、疗程等细节上,则是沃森的强项。
“治疗肿瘤不是一个医生说了算,病人是先手术,还是先化疗,还是靶向治疗,我们需要多学科会诊。沃森出的方案可以提供参考,最终还是医生做主。”
由于沃森的“出场费”不能进入医保,只有经济条件允许的特诊患者提出要求时才会使用,自2017年年底引进以来的约一年时间里,赵铭所在的医院一共只使用过二三十例,占其总患者的病例数1%不到。他透露说,目前,沃森是由经销商免费提供给他们医院使用的,它的“出诊”费用——每次至少5000元。
沃森使用率偏低的另一个因素是“水土不服”。
以鼻咽癌为例,据世界卫生组织统计,全球 80% 的鼻咽癌发生在中国,又以广东省居多,因此又称广东癌。但这种癌症在美国发病率很低,不在沃森学习范围内。赵铭表示,“我们的鼻咽癌治疗是全世界最好的,治疗成熟,基本不用多学科诊治,更用不到沃森。”
在收费模式上,百洋科技最初尝试的是“按服务收费”,即对产品本身不收费,而是以每次使用收取2000元服务费的价格售卖给分销商,再由分销商加价销售给医院,但这种方式并没有取得比较好的推广效果。
现在,百洋改变了策略,销售沃森系统的ID,即医院根据需求采购一定数量的ID,每个ID使用人数不限。王必全告诉记者,每个ID售价范围,是几十万元。目前,百洋科技推广的261家医疗机构已经有81家签约,单家医院最多购买五六个ID。
多位业内受访者表示,目前,国内推销沃森的最大障碍是难以获得医院和医生的认可。因为只有让医生适应沃森的操作方式,养成使用习惯,才能实现收费目的。为推销沃森,分销商们不仅需要对医生进行培训,有时还要帮助医院建立新的沃森会诊中心,甚至承担起室内装修的工作。
对此,全球医生组织中国总代表时占祥却不以为然:“AI确实可以提供更多的参考辅助,但为什么要用AI节约时间、提高效率呢?有人会说之前的医生都干吗吃的?”
AI医疗到底能做什么
1999年冬天,美国人瑞克·克里格带喉咙痛的儿子到明尼阿波利斯的紧急护理中心看病,一等就是两小时。克里格感觉到,需要有一种更便捷的医疗服务来解决家庭常见病。
一年后,克里格与合伙人在当地一家食品店里创立了第一家快捷医疗Quick Medx,并于2002年改名为“分钟诊所”(Minute Clinic)。这家医疗连锁机构设计了一种标准化程序,帮助医生和护士快速看病,平均每位患者只需要15分钟。
当然了,“分钟诊所”并不是万能的,它主要解决普通疾病、轻微外伤和皮肤病这三类常见病,也就是感冒、过敏等40多种,并对糖尿病等慢性病患者进行健康监测。患者每次就医的记录会被记录,电子病历也可以共享到其他医疗机构。
据前CEO迈克尔·豪威公开表示,分钟诊所5万个咽炎病历的治疗程序有效性显示,99%符合最佳做法,远高于行业平均水平55%。
在全球医生组织中国总代表时占祥看来,诸如分钟诊所一类便是AI医疗产品最好的使用场景之一。“AI医疗系统需要帮助人们回答最简单也是最复杂的问题,它要能辨别人们对一种病的不同主诉,在大数据的支持下,最终给出一个合适的答案。”时占祥举例说,对于肠胃感冒患者,有的人说是肚子痛,有的人又说发烧,那么AI产品需要收集这些常见病的大量数据,并将非结构化表述结构化,做成标准化的问答,从而循证看诊。
按照“预防-诊断-治疗-康复”这四个阶段的划分,时占祥认为AI医疗最好的使用场景是治疗方案的选择,而不是诊断。“治疗方案的数量是有限的,但人不一定有办法、或许也不想把每一个都弄清楚,那么AI可以用大数据看看,这个患者的身体状况选择哪种方案最合适。”时占祥说。
诊断却很难说清楚。时占祥举例说,在临床诊断时,医生最常用的就是“待查?”例如有些患者所有指标都是阴性但就是发烧,只能“待查”,标注“?”则表示,患者很可能一觉醒来后症状就显现了,那时才能确定是什么病。
即便是可以确诊的病种,由于AI学习数据有限,也可能无法准确判断是哪种疾病。例如,一个精通乳腺癌分析却没有学习过鼻咽癌的AI系统,在1000份乳腺癌患者病例中塞入10份鼻咽癌患者的数据,AI可以分析出后者不是乳腺癌,却无法说出具体患了什么病。
病历数据可以分为门诊病历、病房病历和会诊中心记录三个来源。门诊病历的内容最空泛,很难获取有效信息;病房病历可筛选部分有效数据;质量最好的就是会诊中心的记录,“但对AI来说最重要的多学科交流的对话过程却往往被忽视,只存在录音或视频中,没有整理成可被读取的文字。”时占祥补充说。
现实数据质量堪忧也是一些AI医疗产品选择学习虚拟病历的原因。
“真实世界的病历错误太多,不能让AI按照不规范的样本学习,我想这也是沃森选择文献的原因。”王泰峰解释说,医疗诊断出错的后果是严重的,所以,即便AI进行了训练也无法取代医生成为责任主体。
除了疾病治疗,多位受访对象表示药物研发是AI在医疗领域运用最成功的场景。药物研发需要投入巨大的人力物力财力。
美国塔弗茨药物开发研究中心2014年的报告显示,一款成功上市的新药,平均花费约25.85亿美元,其中包括约13.95亿美元的直接资金投入和研发失败导致的约11.64亿美元的间接投入,以及其他投入。
AI药研系统能在医药研发过程中减少人力、物力的投入,节约时间,降低药品研发成本,同时基于数据模型,预测药品研发过程中的安全性、有效性和副作用等。以美国药品研发的公司Atomwise为例, 2015年,该公司宣布通过AI计算在一周内找到了两种或许能用来抗击埃博拉病毒的药物,成本不超过 1000 美元。
国内产业泡沫
“人工智能就是代替重复性劳动”,康夫子科技公司创始人张超对《中国新闻周刊》说,“如果工作是重复性的,人工智能就可以很好地解决,如果不是,我觉得目前没有好的解决方案。”
尽管有关AI在医疗领域的最佳应用场景与商业模式还在探索中,投资者与创业者们已蜂拥而至。政策利好是一大重要原因。
2015年8月,国务院发布《促进大数据发展行动纲要》,提出发展医疗健康服务大数据,构建综合健康服务应用。随后,国务院、卫计委相机发布多项政策,促进各省市政府将发展健康医疗大数据提高到战略层面。
在这些政策的刺激下,据前瞻产业研究院发布的《2018—2023年中国人工智能行业市场前瞻与投资战略规划分析报告》,2016 年中国人工智能+医疗市场规模达到 96.61 亿元,2017 年将超过 130 亿元,2018 年则有望达到 200 亿元。
另有数据显示,2013~2017年间,中国医疗人工智能行业共获得241笔融资。单就2017年,国内该领域融资事件就将近30起,总融资额超过18亿元。这一趋势于2018年还在持续,仅上半年就有18家公司获投,总金额超过31亿元。
在AI医疗的细分领域,2017年辅助决策类共发生17次投融资事件,仅2018年第一季度就有5起。另据艾瑞咨询《2018年大数据时代下的健康医疗行业——中国健康医疗大数据行业报告》的不完全统计,除了IBM的沃森,在中国与医院达成合作的辅助决策应用还有科大讯飞、依图、推想、羽衣甘蓝、体素科技、平安好医生等公司。
“我无法说这个行业是否有泡沫,但就像经济学中提到的,适当的通货膨胀有助于经济的发展。”张超说。但中山大学肿瘤防治中心副主任、肿瘤医院副院长钱朝南则在2018的一次会议上直言,“AI很热,泡沫也很多。”在他看来,掌握人工智能技术的计算机专家和公司兴奋活跃,这叫“一头热”,另外一头的医疗应用与临床却是冷的,而这种模式显然不利于行业发展。
“国内AI医疗的最大困难,一是不知道方向,二是没有标准。”时占祥对《中国新闻周刊》说,AI在生物医学领域的应用,公共卫生、生物、医药、大健康应是四个主要方向,“现在的问题是,既无标准、也无规范、更无验证,然后大家就开始谈产业化了,AI医疗所谓的市场和需求都是臆想的。”(李明子)
(《中国新闻周刊》2018年第44期)
最新评论