当前位置: > 行业快讯 > 医学资讯 >

瑞金病理大模型是怎样练成的

发布: 2025-04-10 12:07:37  | 来源:现代健康网综合  |编辑:www.xdjk.net  |查看:

华为DCS AI解决方案,将助推AI在不同的医院加速落地。

2025年2月18日,上海交通大学医学院附属瑞金医院(以下简称:瑞金医院)正式发布瑞智病理大模型RuiPath,一时吸引医学界目光。RuiPath覆盖了中国每年全癌种发病人数90%的常见癌种,不仅需要融合多模态数据,还要结合人群的疾病特征,从而为病理医生提供更精准、更高效的辅助诊断支持。

“对一家医院来讲,真正的堰塞湖、真正的堵点是图像分析。”瑞金医院院长宁光院士说。

在病理诊断领域,AI应用将有效缓解我国病理医生短缺的现状,显著提升病理切片检查效率和诊断准确率,为临床治疗提供更精准的决策支持。然而,要训练专业权威的医学大模型,并非一日之功。

病理大模型为何仅用两个月训练上线?

2024年11月底,华为数据存储产品线AI解决方案首席专家王帅所在团队接到任务——与瑞金医院共同打造下一代病理多模态大模型。王帅带上华为DCS AI解决方案来到现场,与医院一起研发,仅两个月就完成大模型训练并上线。

然而,病理大模型在建立过程中,需要克服四大痛点:

第一,要提高病理数字化程度,数字切片的积累是构建病理大模型的基石。

第二,数据质量与共享难题。传统病理的物理切片质量本身就存在一定的差异,而在切片数字化过程当中,由于国内外扫描仪种类繁多,加之WSI(Whole Slide Images,全视野数字切片)图像格式标准目前也不统一,从而形成数据孤岛。

第三,病理数据通常“很大”。一张WSI病理图像大小已经接近一部高清电影,医院每年新增病理数据达到PB级,面临快速访问和存储成本压力。

第四,病理模型训练所需算力高。由于GPU的GB级显存和病理数据PB级训练数据集之间的矛盾,医院往往算力不足,难以高效开展海量数据集的训练。

关于前两个难点,瑞金医院通过数年来建设“数字化智慧病理科”,矛盾已经逐步化解。一方面,2021年,瑞金医院“数字化智慧病理科”建设立项,开启病理的数字化、智能化之路,累积了数字病理切片数据库。另一方面,为解决不同格式病理数字切片导致的数据孤岛,瑞金医院从2023年开始,启动研制针对病理专用的CSP格式,目前已经纳入上海市地方标准以及国家级团体标准相关项目立项。

针对后两个新挑战,瑞金医院联合华为,创新性实施数字化病理存储方案,实现了全院毫秒级无卡顿病理阅片。通过存算协同模式,借助端到端的AI工具链(Model Engine),缩短大模型上线时间。

因此,上述痛点的克服,一方面得益于瑞金医院4年来持续推进“数字化智慧病理科”建设,另一方面则与支撑大模型训练的华为DCS AI解决方案密不可分。

华为DCS AI解决方案如何扫清障碍?

“病理,对我来说是一个非常陌生的领域。但是,它所面临的行业痛点,却又是十分熟悉的。”王帅坦言。

第一,数据工程的问题。病理科医生所见的每一张病理切片都是GB级,当处理上百万张切片时,也即总共PB级的数据,同时还有数十万份的病理报告需要进行时空对齐。“如果使用传统的数据工程手段,使用一个个Python脚本、工具和人工标注方式处理,效率非常低下,必须革新数据工程的手段。”

第二,图像训练、推理成本问题。在做图像训练时,如果不做任何优化,训练一轮就要上万的GPU hours,而到了推理阶段,分析一张完整的40倍镜下的WSI切片,需要计算上千万的Token。“这样的AI注定只是一个奢侈品,没有办法普惠大众。”

第三,应用上线问题。训练出来好的模型,并不代表有了好的应用。病理学诊断应当结合患者病史、基因组组学、分子学等多模态数据,这就要求AI系统能够开放地对接医院内部不同科室的不同业务信息系统,同时能够灵活地承载不同的业务数据,灵活响应用户需求。

能有效应对上述难题,正是DCS AI解决方案的核心价值所在。华为在数据工程上做了大量的革新,降低了80%的数据准备周期。在模型训推上,通过长期存储、调度引擎的创新,将资源利用率达到极致,模型的训练周期也降低了30%,系统的吞吐提升了一倍,同时还打造了一站式的应用开发平台,让用户可以实现低代码开发、零代码运维。

这些革新具体是怎么实现的?王帅如数家珍:

首先,在存储层面,通过Omni-Dataverse快速建立统一的数据视图,通过简单配置实现高效的数据归集,以及在不同系统之间的数据流转。同时,瑞金医院病理图像采用了统一的CSP格式,压缩率更高、读取速度更快,从而避免了图像多种格式在图像处理时协议转换带来的开销。

在数据治理阶段,华为积累了一批专项行业数据算子,无论是数据的去重、特征提取,还是分级工作,都能够快速找到对应的算子进行处理,并且基于数据平台可以灵活编排组装这些算子,进一步提升数据处理效率。

华为对病理学的图像处理还做了深度优化。考虑到病理图像一般在GB级,如果不经过优化就去处理百万级的图像,需要耗费数月,甚至超过花费在模型训练上的时间。为此,华为研制了专用的神经网络,实现病理学图像的免切分算法,将整个病理学图像处理时间从月级压缩到了天级,极大提升了数据的处理效率。

类似的工作,不一而足。华为DCS AI解决方案,堪比“清道夫”,帮助医院扫清大模型落地过程中面临的数据工程处理慢、模型/应用对接难、AI系统可用度低等障碍。

落地医疗AI应用为何要重视“数据工程”? 

华为公司副总裁、数据存储产品线总裁周跃峰认为,在人工智能的三大要素——“数据、算法、算力”中,数据的作用越来越重要。

华为公司副总裁、数据存储产品线总裁周跃峰

事实上,在AI落地过程中,并不是有了算力、算法模型,就能够一帆风顺,还要克服很多障碍。

一是数据工程。训练大模型的数据,一般不是原始数据,而是要做很多加工处理。这好比要让学生能够获得知识、获得成长,教材质量非常重要。而打磨教材和课程需要很长的过程。

二是模型的训练和应用的落地。模型在训练过程当中,怎样能够让它更好地理解知识,并且能够更好地让这些结果反映到应用中去,需要有提示工程等,这个过程同样漫长而复杂。

三是算力基础设施成本高。不可能让每一家医院都买一堆算力来实现AI应用。今天大部分AI集群系统的利用率不到50%,意味着一半以上的时间都是徒然在消耗电力。

如何突破这些极限?华为DCS AI解决方案,恰恰为各行各业落地AI应用提供了经济、高效的部署和训练环境。在与瑞金医院合作的过程中,华为DCS AI解决方案的关键组件Model Engine——AI全数据流程、应用对接以及模型对接的工具链,较好地解决了上述障碍。

作为欧拉社区开源的工具链,Model Engine能够大幅提升训推及精调过程效率,有效降低AI部署和训练成本,加速AI落地。

周跃峰表示,华为和瑞金医院在训练RuiPath大模型的过程中,DCS AI解决方案变得更加成熟。它不仅是硬件,更是一整套开放性的工具链,可供更多医疗行业集成商使用,助推AI在不同的医院加速落地。

“数智世界 一触即达” 选择华为,让您的企业轻松数智化。

免责声明:本站部分文章转载自网络,发布文章 为传递更多信息之用,另:文章 内容仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实, 对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

回到首页