融合大语言模型与多模态特征的古文命名实体识别

Named Entity Recognition for Ancient Chinese Texts Using LLMs and Multimodal Features

作者： 孟佳娜 ¹ 李丰毅 ¹ 刘爽 ¹ 赵迪 ¹ 王博林 ¹
作者单位：

1. 大连民族大学
通讯作者： 孟佳娜 Email:mengjn@dlnu.edu.cn
提交时间：2024-11-15 10:04:28

摘要: [目的/意义] 运用命名实体识别技术深入探索古籍文献，推进中文古籍数字化，便于提取和分析重要信息，提升文化遗产的获取与理解，弘扬传统文化。[方法/过程]提出融合大语言模型与多模态特征的古文命名实体识别方法。首先，利用大语言模型进行数据扩充，生成更丰富的样本；然后，使用滑动窗口将文本分割为固定长度的子序列，并将文本子序列输入编码层，得到文本的特征表示；通过卷积神经网络（CNN）提取字形的局部特征，再利用改进的迭代扩张卷积神经网络（IDCNN）提取长距离特征，从而获得字形的全局信息。最后，将文本特征和字形特征在特征感知层进行拼接，形成每个字的综合表示，将拼接后的综合特征传递到CRF层进行序列标注，完成实体预测。以《左传》和CHED_NER为研究语料，构建人名、地名、时间等命名实体识别任务。[结果/结论]实验结果表明，融合大语言模型与多模态特征的古文命名实体识别方法，相比主流的BERT-BiLSTM-CRF方法，F1值分别提升13.32%和1.03%。融合大语言模型与多模态特征的古文命名实体识别方法，能够精准地实现对古籍文本的命名实体识别。

古文实体识别迭代扩张卷积神经网络大语言模型特征融合

来自： 李丰毅
分类： 计算机科学 >> 自然语言理解与机器翻译
投稿状态： 已被期刊录用
引用： ChinaXiv:202411.00196 (或此版本 ChinaXiv:202411.00196V1)
DOI:10.12074/202411.00196
CSTR:32003.36.ChinaXiv.202411.00196
科创链TXID： 9e34293a-00fc-48ea-835a-9e6ed437becf
推荐引用方式： 孟佳娜,李丰毅,刘爽,赵迪,王博林.融合大语言模型与多模态特征的古文命名实体识别.null.[DOI:10.12074/202411.00196] (点此复制)

版本历史

[V3]	2024-11-20 09:59:08	ChinaXiv:202411.00196v3 查看此版本	下载全文
[V2]	2024-11-18 11:21:12	ChinaXiv:202411.00196v2 查看此版本	下载全文
[V1]	2024-11-15 10:04:28	ChinaXiv:202411.00196V1	下载全文

1. CREA-Eval：用于测试大语言模型理解稀土领域相关问题能力的评估基准	2026-04-13
2. 大语言模型驱动的科学假设生成研究综述	2026-04-02
3. 面向矢量图形生成的大语言模型研究综述	2026-01-08
4. 从概念识别到自动化测量：基于大语言模型的国家刻板印象评估	2025-03-11
5. 引导大语言模型生成计算机可解析内容	2024-04-21
6. LLAMA-2 大语言模型的数学形式	2023-08-31
7. 大语言模型旋转位置编码的简易推导	2023-07-12


公开评论匿名评论仅发给作者

融合大语言模型与多模态特征的古文命名实体识别

版本历史

相关论文推荐