医疗领域存在大量的专业知识和医学术语, 人类经过长时间的学习才能成为一名优秀的医生。那机器如何才能“读懂”医疗文献呢? 尤其是面对电子病历、生物医疗文献中存在的大量非结构化、非标准化文本, 计算机是无法直接使用、处理的。这就需要自然语言处理和知识图谱技术大展身手了。
近日, 百度 AI 技术再次取得关键突破, 依托百度知识增强语义理解框架 ERNIE 研发的医疗预训练语言模型 ERNIE-Health, 以超越人类医学专家水平的成绩登顶中文医疗信息处理权威榜单 CBLUE 冠军, 验证了 ERNIE 在医疗行业应用的重要价值。AI 医疗迈向新的里程碑。
中文医疗信息处理 CBLUE 榜单排名
CBLUE: 检验中文医疗信息处理能力的“金标准”
医疗文本的处理与理解是医疗信息化的重要基础, 具有非常高的应用价值。为构建统一共识的医疗信息系统性能评估平台, 中国中文信息学会医疗健康与生物信息处理专业委员会在合法开放共享的理念下发起设立了中文医疗信息处理挑战榜 CBLUE (Chinese Biomedical Language Understanding Evaluation)。
CBLUE 是国内首个面向中文医疗文本处理的多任务榜单, 涵盖了医学信息抽取、医学术语归一化、医学文本分类、医学句子关系判定和医学问答共 5 大类任务、8 个子任务; 其数据来源分布广泛, 包括医学教材、电子病历、临床试验公示以及互联网用户真实查询等。该榜单一经推出便受到了学界和业界的广泛关注, 自 2021 年 4 月正式上线以来, 共吸引近 300 支队伍参与打榜, 已逐渐发展成为检验 AI 系统中文医疗信息处理能力的“金标准”。
百度医疗预训练语言模型 ERNIE-Health
近日, 随着百度医疗语言模型预训练技术取得关键突破, 百度团队在 CBLUE 榜单上登顶榜首, 以 8 个任务均分 77.808 的佳绩超越人类医学专家均分 77.1 的水平【1】, 标志着 AI 医疗正式迈向新的里程碑。
作为新纪录诞生背后的关键技术, 百度医疗预训练语言模型 ERNIE-Health 功不可没。ERNIE-Health 依托百度文心 ERNIE 先进的知识增强预训练语言模型打造, 通过医疗知识增强技术进一步学习海量的医疗数据, 精准地掌握了专业的医学知识。ERNIE-Health 利用医疗实体掩码策略对专业术语等实体级知识学习, 学会了海量的医疗实体知识。同时, 通过医疗问答匹配任务学习病患病状描述与医生专业治疗方案的对应关系, 获得了医疗实体知识之间的内在联系。
ERNIE-Health 共学习了 60 多万的医疗专业术语和 4000 多万的医疗专业问答数据, 大幅提升了对医疗专业知识的理解和建模能力。此外,ERNIE-Health 还探索了多级语义判别预训练任务, 提升了模型对医疗知识的学习效率。ERNIE-Health 模型也将在随后正式对外界公开发布, 希望借此进一步推动 AI 医疗技术的发展和创新。
ERNIE-Health
百度 AI 推动解决基层医疗难题, 助力健康中国
医疗资源不均、医生供需缺口大、临床工作压力持续增加已经成为当前我国医疗卫生事业面临的突出问题, 利用 AI 技术实现临床辅助具有重要的现实意义。
百度以循证 AI 为理念, 推出 AI 医疗品牌 —— 灵医智惠。灵医智惠依托百度自然语言处理与知识图谱技术的深厚积累, 构建了涵盖医学自然语言理解、医学知识体系、医学认知计算三大核心技术在内的循证医学认知引擎, 并在此基础上构建医疗 AI 中台、医疗知识中台和医疗数据中台, 面向医疗场景提供临床辅助决策、眼底筛查、智慧病案、智能审方、慢病管理、医疗大数据服务等 AI 医疗解决方案。
目前, 灵医智惠在 AI 医疗领域的产品和解决方案已触达 29 个省市自治区、400 多家医院、1600 多家基层医疗机构, 服务数万名医生, 惠及千万患者。未来, 百度还将持续推动自然语言处理及知识图谱等技术在生物医学领域的技术创新, 用科技的力量提升基层医疗水平, 为更多人提供更高效、更优质的医疗服务。
[1] Ningyu Zhang, Mosha Chen, Zhen Bi, and others. CBLUE: A Chinese biomedical language understanding evaluation benchmark. arXiv preprint arXiv:2106.08087.
来源:消费日报网
(原标题:百度 ERNIE-Health 荣登中文医疗信息处理 CBLUE 榜单冠军,助力健康中国)