在已有的信息化基础建设上、在医疗服务需求不断升级的背景下、在大数据和人工智能等创新技术不断融合下,医疗信息化的范围与定义也不断扩大,从院内单机信息化不断延伸为区域间、不同机构间数据的互联互通与共享应用;从患者的病历信息,拓展到居民的全生命周期健康数据以及与健康息息相关的环境等信息,成为更加全面、更加数智化的智慧医疗建设。
近日,动脉网、蛋壳研究院发布《智慧医疗建设:走过数据收集与治理阶段,正进入医疗数据价值应用“战场”》报告(以下简称“报告”)。医渡科技作为首批凭借自然语言处理和知识图谱等人工智能技术进入医疗文本数据治理的企业,其在数据治理和数智化应用方面的创新实践为行业树立了典范,在报告中被多次提及,并作为企业案例重点展示。
高质量数据是一切数据应用的基础
报告指出,目前,医疗数据资产化,即建立高质量医疗数据库已逐步成为各医疗机构、研究学会、药械企业及公卫监管部门的刚需。
医疗数据数智化应用过程包括数据输入、数据治理、模型训练、应用开发和应用服务。对于不同类型的数据,治理过程往往拥有不同的难点和技术要求。
其中,文本数据的治理难点在于术语对齐。文本类数据有别于影像,没有统一的格式且表达非结构化,每个书写的医务工作者对同一名词有自己的表达习惯,病历内容主要以大段非结构化文本形式存在。因此,如何对同一名词的不同表达进行识别并归类为统一的表述方式,以及从大段非结构化病历中提取出结构化的信息,是文本类数据的治理难点。其中设立术语标准、快速识别文本并归于相应标准是核心环节。
在建立术语标准的环节,与临床各个专科专家的紧密合作必不可少,需要充分了解临床医务工作者的语言使用习惯,并从中总结出共性术语库,才能建立被行业认可的术语标准,从而在此基础上进行数据的清洗与归类。而在快速识别文本环节考验的是如何运用人工智能技术提升识别的准确度与速度。
文本数据治理需要技术实力、经验积累、临床专业资源缺一不可。医渡科技作为首批凭借自然语言处理和知识图谱等人工智能技术进入文本数据治理的企业,目前已携手行业专家及疾病联盟建立和出版了疾病数据标准19本,解决数据非标问题;并基于自研垂直领域大语言模型和高质量真实世界研究验证,不断迭代提升病历理解相关技术实力,截至2023年9月,医渡科技“医疗智能大脑”YiduCore已授权处理分析了40多亿份医疗记录。
以AI技术领跑医疗数智化赛道
医疗领域的高质量数据库作为应用潜力无限的数据资产,经其训练的人工智能与大模型等,能够在医疗服务水平、科研水平、管理水平、疾病预防水平等诸多维度带来极大的质量提升、效率提高以及成本费用的节约。但产品成熟到商业落地还需多因素支持,除了产品本身的应用价值,能够完美解决需求方痛点以外,还需要考量需求方、付费方的急迫程度及意愿强度等。
目前,医疗数据的数智化应用已逐步在多个应用场景完成市场化验证。
其中,对于医疗机构而言,高质量数据的最大刚需来自于智慧医院建设的需求。针对这一诉求,科室级别与全院级别的数据库建设是解决方案的基础。在此基础上,通过人工智能、大模型等技术打造的数智化应用将助力医院专家及医疗机构相关管理者达成科研及管理诉求。
医渡科技正是凭借强大的人工智能技术入局医疗数智化应用赛道。基于强大的技术实力,医渡科技对医疗机构多源异构数据的处理和识别方面有着天然的优势,并且通过 AI 快速掌握各不同医疗信息系统来源数据的存储与升级逻辑,从而精准、高效地完成高质量数据库建立。此外,基于对数据应用的深度理解,可快速将需求方的描述性诉求转化为“技术语言”,指导具体数智化产品应用的开发,以极佳的交互体验满足医疗数据数智化应用需求。
报告指出,目前医渡科技已在高质量医疗数据库建设领域稳定了头部地位,为94家高水平三甲医院提供了智能化解决方案,助力其在研究、临床诊断和治疗、医院管理方面提升效率与质量;尤其在科研方面,医渡科技凭借先进的自然语言处理技术及对于疾病的深度理解,为不同的临床科室建设了240+个单中心专病数据库,为10+家国家疾病临床研究中心建设了多中心专病数据平台,覆盖血液、肿瘤、心血管及眼科等领域的80+疾病。高质量的疾病数据库为临床科研提供了坚实的数据基础,大幅度提升临床科研的效率及质量。
除落地医疗机构外,数据资产商业化应用落地的另一优势场景是药物研发。众所周知,药物研发环节高投入、高风险、长周期且成功率低,药物的研发环节有着极强的医疗数据数智化应用的“需求”,且拥有雄厚的支付实力,是优势的应用落地环节。
目前,在智慧医疗建设服务企业,用技术推动高质量数据库应用,助力医药企业在药物设计、临床方案设计、方案可行性验证、临床试验、数据分析等药物研发全流程助力企业降本增效并已取得显著成绩,该类应用正快速成熟,成为医疗数据服务企业优势的、重要的收入和现金流来源。以医渡科技为例,其生命科学解决方案板块前十大客户收入留存率达 128.2%。
持续完善数据应用商业闭环
报告指出,医疗行业因其复杂性、特殊性和专业性,对于新兴技术的应用与融合往往经过更严谨的考量,也因此技术落地相较其他行业周期更长。2015年前后,人工智能的应用开始逐步渗透到医疗行业,企业凭借技术实力或数据基础,开始加速对医疗的理解或对技术的运用,探索人工智能与医疗数据应用的有效结合方式。数据治理,打造高质量、可应用的数据库是这一探索的基石。
高质量数据库的成功建立,需要掌握临床医疗数据书写习惯、留存方式,需要建立统一的数据治理标准并需要足够强大的技术实力快速处理海量的数据。这需要专业、技术和时间的积累。经过近年人工智能的快速发展、政策的大力支持,企业“熬”过了积累期,目前高质量数据库建立的条件与能力已成熟,基于此的数据价值应用也因此进入了快速发展通道,开始在多应用场景商业化落地。
医渡科技作为医疗数据治理领跑者,自2014年成立以来,截至2023年9月30日,已授权处理分析了40多亿份医疗记录,在医学知识、知识图谱和高质量医疗数据处理能力上都拥有大量积累。“熬”过积累期的医渡科技,正在加速完善针对医疗机构、药械企业、医疗保险等的数据服务商业闭环。
“医疗大数据平台和解决方案”为医院、监管机构及政策制定者提供数据驱动的解决方案,总体覆盖医疗机构 1700 余家、监管机构及政策制定者38个。
“生命科学解决方案”服务于药械企业,全面支持药物临床研发、真实世界研究和商业化 的全流程,为企业降本增效,助力药械企业从研发到商业化的全面成功。目前已拥有 131 家活跃生命科学领域客户,且前十大客户收入留存率达 128.2%。
“健康管理平台和解决方案”涵盖了慢病管理、商保及惠民保等,为居民提供闭环健康管理。目前,惠民保服务已经累计覆盖 4 省 12 市;“血糖管理软件”于 2022 年获二类医疗器械证,并被纳入天津惠民保健康管理付费服务、入选海南省“2+3”健康服务包项目。
此外,医渡科技于2023年发布了自研的医疗垂直领域大语言模型,持续迭代YiduCore核心算法,并基于大模型技术,对原有的数据治理、医院管理、临床科研、临床诊疗等多个场景的解决方案进行了焕新升级。
未来,围绕帮助医疗机构更高效、高质量运转,帮助患者更便捷、精准就医,帮助企业更极致降本增效,帮助相关监管部门更实时把控情况并制定相关决策等维度,医疗数据资产的应用价值将被不断挖掘,商业化落地场景也会逐步增多。凭借先行者优势,在这场医疗数据价值应用“战场”上,医渡科技具备强劲竞争力。