- 2026-05-24 16:56
- 来源: 武汉市数据局
-
- 分享到
生物医学研究正进入多组学与人工智能深度融合的时代,然而高质量、标准化、多尺度数据的缺乏,以及公共数据来源复杂、整合困难等问题,严重制约了疾病智能诊疗与高效药物研发的进程。依托“天河二号”国家级超算平台,中山大学孙逸仙纪念医院等通过深度融合医疗临床、单细胞测序、基因组学、药物分子等多尺度海量数据,构建超大规模医学数据平台、单细胞大模型及知识图谱,旨在建立数据与知识双轮驱动的智能计算新范式,赋能精准诊疗与创新药物研发。

图1 计算平台与应用成效
一是汇聚多尺度生物医学数据,构建“宏-介-微”全景数据资源池。汇聚三大尺度的生物医学数据。在宏观层面,整合中山大学孙逸仙纪念医院超百万人、覆盖145个临床专科、历时10余年的高质量医学诊疗数据,构建“逸仙医学”大数据平台。在介观层面,与专业公司合作,汇聚涵盖1亿人类细胞的高通量单细胞测序数据。在微观层面,从公共数据库广泛收集疾病、基因、药物等分子水平数据。通过依法合规地采集与合作,形成可持续更新、维度互补的多模态数据资源体系。
二是构建知识驱动的融合计算体系,实现从数据到模型的智能治理。基于汇聚的多源异构数据,构建“数据汇聚-清洗标注-知识抽取-模型构建”的全流程治理与应用服务体系。核心技术支撑包括单细胞大模型CellFM、大规模基因-药物-疾病知识图谱PharmKG等。通过深度融合临床诊疗、组学、单细胞及公共数据库数据,并依托超算强大算力,实现从海量数据中提取知识、训练模型,并最终应用于辅助诊断、药物推荐与研发等核心环节。
三是驱动药物研发与临床诊疗场景落地,取得突破性应用成效。在药物研发端,极大加速了研发进程:例如在49天内(传统需2-3年)完成PROTAC药物设计,湿实验验证成功率50%,药代性能提升4倍;支持某药企公司在19个月内获得FDA临床批件;推动针对帕金森病的“老药新用”研究进入临床试验。在临床诊疗端,构建了实时心电监控分析系统与乳腺癌化疗疗效预测系统,有效提升诊疗效率与精准性。
四是形成开放服务平台与辐射效应,创造显著经济社会价值。通过模型开放服务平台,以“数据清洗-模型训练-部署应用”的全链条服务模式,向医院、药企等机构提供药物智能研发与疾病辅助诊断服务,已累计服务国内超过1500家生物医药用户单位,近三年年均服务收入超两千万元,经济效益显著。社会效益方面,项目通过建设“创新人工智能发展促进中心”辐射广西等西部地区,并计划向东南亚推广,提升了欠发达地区的医疗卫生水平,形成了良好的技术溢出与产业带动效应。
(本项目获得2025年“数据要素×”大赛全国总决赛医疗健康赛道优秀奖-技术创新奖)