文章摘要:在深度学习技术不断发展和预训练语言模型不断改进的背景下,文章探讨面向数字人文研究需求的古文典籍文本词性自动标注问题。以校验后的高质量《四库全书》全文语料作为训练集,构建SIKU-BERT预训练语言模型,在源自多领域的16部古文典籍文本上开展词性自动标注实验。结果表明,SIKU-BERT预训练语言模型在词性自动标注任务中表现优良,词性标签总体预测准确率达到89.64%。文章还展示了单机版“SIKU-BERT典籍智能处理系统”的词性自动标注功能设计及应用。
文章关键词:词性自动标注,数字人文,SIKU-BERT,预训练技术,
论文作者:耿云冬1 张逸勤2 刘欢2 王东波2
作者单位:1. 华中农业大学外国语学院 2. 南京农业大学信息管理学院
论文分类号: TP391.1
相似文献:基于深度学习的人体图像半自动标注系统.....作者:高慧,张继威,来扬,王文东,刊载期刊:《北京邮电大学学报》视觉类深度神经网络的自动标注.....作者:李鸣,郭晨皓,陈星,刊载期刊:《计算机应用》基于深度学习的图像自动标注方法综述.....作者:常致富,周风余,王玉刚,沈冬冬,赵阳,刊载期刊:《山东大学学报(工学版)》基于情绪图标的弱监督情绪分类.....作者:张璐,王路,李寿山,刊载期刊:《郑州大学学报(理学版)》基于情绪图标的弱监督情绪分类.....作者:张璐,王路,李寿山,刊载期刊:《郑州大学学报(理学版)》基于多标签判别字典学习的图像自动标注.....作者:杨晓玲,李志清,刘雨桐,刊载期刊:《计算机应用》基于样本自动标注的隧道裂缝病害智能识别研究.....作者:王耀东,朱力强,余祖俊,史红梅,折昌美,刊载期刊:《西南交通大学学报》
相关文章:大数据的技术创新和应用—以人口普查为例.....作者:冯乃林大数据融合应用技术框架与行业应用.....作者:段飞虎大数据人工智能驱动图书馆知识服务和学科建设.....作者:姜爱蓉基于大数据的知识共享与协同创新.....作者:顾新建敦煌莫高窟文化遗产数字化保护——数字敦煌.....作者:夏生平Looking at People Through the Lens of Images 透过镜头理解人物行为.....作者:Li CHENGThe Role of Digitization in Post COVID Scenarios 数字化在后疫情场景中的角色.....作者:Rafiq AhmadComputational Analysis of the Voynich Manuscript 十五世纪伏尼契码的智能解析.....作者:Greg Kondrak
文章来源:中国统计 网址: http://zgtj.400zhicheng.com/lunwen/itemid-115557.shtml
上一篇: 农业经济论文_小农户在中国农业现代化进程中的作用及处境变化
下一篇: 金融论文_结构性违约、信用分层与评级机构的策略性反应——来自中国信用债市场的证据