11月27日,市经济和信息化委员会、市卫生健康委员会、上海市疾病预防控制局共同发布上海市首个卫生健康语料库。同时,会同上海申康医院发展中心指导,由中国电信股份有限公司上海分公司携手上海市人工智能行业协会、复旦大学附属中山医院、同济大学附属东方医院以及人工智能产业链上下游企业共同发起成立上海公共服务MaaS训练及成果转化联盟,并发布首批医疗应用场景MaaS平台。
首个行业专属语料库上线
支撑医疗行业大模型训练
11月12日召开的上海市政府常务会议原则同意《上海市发展医学人工智能工作方案(2025—2027年)》并指出,当前,医学和人工智能正处于快速融合阶段,成为国际科技竞争的新焦点。以大模型为代表的新一代人工智能加速发展,正在引领新兴产业和未来产业“范式创新”,加速整体性重构。MaaS作为一种新型人工智能服务模式应运而生。
上海市卫生健康行业语料库立足于健康中国国家战略,致力于打造医学人工智能高地,按照专业化、适配性,立足最全知识体系、最丰富的场景适配、最广泛的数据来源,构建卫生健康领域具有前瞻性的高质量“语料魔方”,同步构建语料专项治理规程和工具链体系,推动卫生健康领域数据治理从基于规则到模型驱动的模式转变。
其中,上海市卫生健康行业语料库(临床医学)1.0版,覆盖100多个二、三级专科科目,兼顾常见病、多发病、急难危重症、肿瘤和罕见病;适配智能化就医咨询、门急诊分诊、辅助诊疗、医疗质控、临床教学和临床研究等近20种应用场景,整合国内外权威专家共识、技术规范、诊疗指南和经典病例集等八个维度核心内容,语料规模达5TB。
而上海市卫生健康行业语料库(公共卫生)1.0版,聚焦基础资源、业务资源、主题资源三大类,细分至传染病动态监测、慢性病及其危险因素、免疫规划和疾病控制等61个科目。适配多样化应用场景,支持从基层社区到各级疾控中心的多层次应用需求,例如传染病监测预警、公共卫生风险处置、健康评估干预与服务等3大类15个典型应用场景,整合国内外公共卫生权威指南、行业知识库、行业数据库、行业场景库等4个维度的核心内容,语料规模达3TB。
后续本市还将面向基础医学、健康管理、药物研发、中医中药等领域不断发布完善行业语料库,推动卫生健康领域语料规模和结构质量持续迭代。同时,还将持续深化小模型+智能体、语料终端一体机等语料数据服务的模式创新,为行业拥抱人工智能和大模型构建全方位的语料数据能力基座,推动上海卫生健康领域从DATA4BI迈向DATA4AI时代。
5分钟生成电子病历
重塑医生临床文本书写流程
发布会还宣布搭建公共服务大MaaS平台,促进人工智能应用场景落地。基于公共服务大MaaS平台,包括中山医院、东方医院在内的首批5个医疗应用场景启动,充分利用人工智能大模型赋能医疗服务、医院管理、临床科研、医学教育。
由复旦大学附属中山医院和联影智能共同开发的“uAI 有爱小山-电子病历书写智能助手”,目前已在中山医院呼吸内科的一个病区进行应用研发和试点,累计使用量超370例,病历书写平均时间从20分钟缩减至5分钟,病历书写工作效率提升75%,临床医生对辅助书写的内容质量给予高度认可。
从患者问诊到病愈康复,病历书写是医疗环节中不可或缺的一部分。医生需要在繁忙的诊疗工作中,详细记录每位患者的病情、治疗过程和结果。据相关统计,医生手工书写一份完整的病历一般需要1-2小时,书写过程中易受主观因素影响,出现漏记、误记等现象,这不仅无形中增加医生的工作负担,也将影响病人的后续诊疗。且传统方式下,医生与患者沟通过程中经常需要长时间对着电脑打字记录,缺乏对患者的人文关怀与情感交流,患者体验不佳。
据介绍,”有爱小山-病历助手“使用自研千亿参数医疗大模型进行推理,模型使用百亿级医疗知识库,涵盖医学教材、专家共识、住院病历文本、医患对话录音、各类检查检验报告、病历质控标准等混合模态医学资料,结合ORPO、CoT Prompt Optimizer、Agent等AI技术,能将医患对话结构化为病历文书需要的结构化信息,一键辅助生成住院场景中多种类型的医疗病历,包括患者入院录、首程录、出院小结等,大幅提升住院场景下医疗记录的实时性、准确性和完整性。此外,该系统同步搭载的Advanced medRAG (高级医学检索增强生成)技术,可有效引导大模型控制幻觉,增强回答可解释性。
中山医院呼吸科医生石林使用“有爱小山-病历助手”有好几个月了。他说,“整体感受下来,我认为这个系统准确性是非常高。在我们问诊过程中,它能把我们跟患者间对话中的重要信息采集到,生成的内容与临床匹配度很高,让我们在病历书写上更方便,大大缩短了临床医生文书工作时间。”
头图为上海市卫生健康行业语料库发布。市卫健委供图