资源类型:
收录情况:
◇ 统计源期刊
文章类型:
单位:
[1]首都医科大学生物医学工程学院
[2]临床生物力学应用基础研究北京市重点实验室
[3]首都医科大学附属北京友谊医院放射科
医技科室
影像中心
放射科
首都医科大学附属北京友谊医院
出处:
ISSN:
关键词:
影像学报告
自然语言处理
条件随机场
命名实体识别
信息提取
摘要:
目的探索对中文影像学报告进行命名实体识别的方法,特别是条件随机场算法的识别效果。方法随机收集98份腹部CT影像学报告。与影像学专家共同确定报告中影像所见部分的5类实体部位、形态、大小、密度和增强,并进行人工标注。将98份报告按7∶3的比例随机分为训练集样本和测试集样本,使用条件随机场中的三种特征模板进行命名实体识别,并比较识别结果。结果 98份CT影像学报告的影像所见共32 332个汉字及字符,训练集23 224字,测试集9 108字。分别利用3种条件随机场特征模板时,实体的总体识别结果F1值平均0.948 7,实体大小的识别的F1值最高达0.981 8。结论条件随机场算法在中文影像学报告的命名实体识别任务中具有很高的准确性,所识别的实体可用于进行后续信息提取等自然语言处理任务。
基金:
国家自然科学基金(81701792、81971707)资助;
第一作者:
第一作者单位:
[1]首都医科大学生物医学工程学院
[2]临床生物力学应用基础研究北京市重点实验室
通讯作者:
通讯机构:
[1]首都医科大学生物医学工程学院
[2]临床生物力学应用基础研究北京市重点实验室
推荐引用方式(GB/T 7714):
张志强,徐岩,黄艳群,等.中文影像学报告中的命名实体识别研究[J].北京生物医学工程.2020,39(6):609-614.