高级检索
当前位置: 首页 > 详情页

中文影像学报告中的命名实体识别研究

Study on named entity recognition in Chinese radiology reports

| 认领 | 导出 |

文献详情

资源类型:

收录情况: ◇ 统计源期刊

单位: [1]首都医科大学生物医学工程学院 [2]临床生物力学应用基础研究北京市重点实验室 [3]首都医科大学附属北京友谊医院放射科
出处:
ISSN:

关键词: 影像学报告 自然语言处理 条件随机场 命名实体识别 信息提取

摘要:
目的探索对中文影像学报告进行命名实体识别的方法,特别是条件随机场算法的识别效果。方法随机收集98份腹部CT影像学报告。与影像学专家共同确定报告中影像所见部分的5类实体部位、形态、大小、密度和增强,并进行人工标注。将98份报告按7∶3的比例随机分为训练集样本和测试集样本,使用条件随机场中的三种特征模板进行命名实体识别,并比较识别结果。结果 98份CT影像学报告的影像所见共32 332个汉字及字符,训练集23 224字,测试集9 108字。分别利用3种条件随机场特征模板时,实体的总体识别结果F1值平均0.948 7,实体大小的识别的F1值最高达0.981 8。结论条件随机场算法在中文影像学报告的命名实体识别任务中具有很高的准确性,所识别的实体可用于进行后续信息提取等自然语言处理任务。

基金:
语种:
第一作者:
第一作者单位: [1]首都医科大学生物医学工程学院 [2]临床生物力学应用基础研究北京市重点实验室
通讯作者:
通讯机构: [1]首都医科大学生物医学工程学院 [2]临床生物力学应用基础研究北京市重点实验室
推荐引用方式(GB/T 7714):

资源点击量:1320 今日访问量:0 总访问量:816 更新日期:2025-04-01 建议使用谷歌、火狐浏览器 常见问题

版权所有:重庆聚合科技有限公司 渝ICP备12007440号-3 地址:重庆市两江新区泰山大道西段8号坤恩国际商务中心16层(401121)