中文信息学报

所属栏目:核心期刊 更新日期:2025-06-16 03:06:15

中文信息学报

中文信息学报

北大核心JSTCSCDWJCI

Journal of Chinese Information Processing

期刊周期:月刊
出版地:北京市
复合影响因子:2.336
综合影响因子:1.444
官网:http://jcip.cipsc.org.cn/
主编:孙茂松
平均出版时滞:444.1220

  中文信息学报最新期刊目录

文本风格迁移综述————作者:刘浦胜;吴连伟;饶元;高超;王震;

摘要:近年来,人工智能技术的不断突破极大地推动了可控文本生成领域的发展,其中文本风格迁移研究作为核心技术的代表,受到学术界和工业界的广泛关注。该文梳理了近年来文本风格迁移领域的发展脉络,首先给出了文本风格迁移的定义及其面临的挑战,从应用场景、目的需求两个视角详细阐述了该领域四大类型任务,并从数据来源、标签及数据规模三方面介绍了该领域常用平行数据集及非平行数据集。此外,该文从数据增强、词汇约束解码、解纠缠...

基于混合检索重排序策略的大模型增强方法————作者:张健;唐晋韬;王挺;李莎莎;

摘要:检索增强生成技术通过提供外部知识帮助大语言模型更准确地回答问题,现有研究表明大语言模型对输入中知识的位置敏感,这为研究输入窗口变长后重排序策略对大语言模型性能的潜在影响提供了动机。该文通过构建检索增强生成系统进行实验验证,以段落形式而不是固定长度切分存储知识更能提高大语言模型的准确率;同时发现在输入中将检索知识前置于问题时,逆序重排序更能提高大语言模型的准确率,且随着检索知识的数量增加效果会更明显...

基于注意力机制的多视图图神经网络社区问答专家推荐模型————作者:吴丽萍;熊玮楠;苏磊;王瑞;

摘要:社区问答专家推荐模型包括目标问题信息提取和专家信息提取两个子任务,现有研究通过计算目标问题与专家信息之间的相关性得分来为目标问题推荐合适的专家回答者。然而,现有研究通常在单一的问题标题视图上展开,往往忽略了问题标签、正文视图所蕴含的互补信息,并且没有从专家信息中学习出对应于目标问题的知识能力。为了充分计算目标问题与专家信息之间的相关性,该文提出了一种基于注意力机制的多视图图神经网络社区问答专家推荐...

融合句法结构和语义信息增强的方面提取方法————作者:付朝燕;黄贤英;邹世豪;

摘要:针对方面提取(Aspect Extraction, AE)研究中存在的评论文本句法结构不完整、方面词呈现长尾分布等问题,提出了句法结构和语义信息双通道增强的方面提取方法(Syntactic and Semantic Dual Reinforcement, SSDR)。首先利用语言模型建立辅助句子并结合领域词典嵌入进行语义增强;然后基于句法依存树信息、多头注意力机制和词间相对位置信息来增强图卷积神经...

WTSTC:基于广域时频采样和时序感知卷积的语音识别模型————作者:刘立波;王詠森;刘倩;邓箴;

摘要:针对现有语音识别模型存在的时频特征感受野不足、时序特征损失及模型结构扩展性较差等方面的问题,该文提出基于广域时频采样和时序感知卷积的语音识别模型WTSTC,在保证模型轻量化的同时提升识别精度。首先,通过结合RepLKNet模块和传统卷积下采样模块,构建了一种新型的广域时频采样模块,增大感受野的同时更加关注输入音频序列的时频特征;其次,设计了时序感知卷积模块,通过实现应用于时序特征的一维全局响应归一...

基于用户立场信息和数据增强的谣言检测————作者:谢冬冬;李霏;姬东鸿;滕冲;

摘要:社交网络中的谣言会给社会带来各种不良影响,通过技术手段进行谣言检测具有重要的研究意义和现实作用。谣言传播时,社交网络用户会通过回复表达自己对相关谣言的立场,这些回复可以为谣言检测提供重要的辅助信息,因此可以通过立场和谣言联合检测的建模方法来增强谣言检测的效果。另外,通过对谣言检测相关工作的梳理,我们发现当前研究对谣言检测数据集的对话结构利用还不够充分,包含立场标注的数据集规模也较小。因此,该文通过...

第二十四届中国计算语言学大会(CCL 2025)征稿启事

摘要:<正>“第二十四届中国计算语言学大会”(TheTwenty-fourth China National Conference on Computational Linguistics,CCL2025)将于2025年8月11—14日在山东济南举行,会议由中国中文信息学会主办,齐鲁工业大学(山东省科学院)承办。中国计算语言学大会创办于1991年,由中国中文信息学会计算语言学专业委员会负责组...

第五届中国情感计算大会(CCAC 2025)技术评测任务发布

摘要:<正>第五届中国情感计算大会(Chinese Conferenceon AffectC omputing,CCAC2025)由中国中文信息学会情感计算专委会主办,西华大学承办,将于2025年7月18日-20日在四川成都召开。中国情感计算大会每年举办一次,旨在聚焦情感计算领域的最新研究和技术成果,现已成为自然语言处理、社会计算领域的重要学术活动,聚集了情感计算的前沿研究,为促进学术界和产...

基于领域信息分解式学习的大语言模型修辞认知增强方法————作者:王雯;于东;刘鹏远;

摘要:中文修辞手法多样且概念差异性大,大语言模型对部分修辞手法的认知存在缺陷。针对该问题,该文提出了QAKAG框架,此框架首先引入信息分解式学习思想,通过问答形式检测大语言模型的修辞认知缺陷,然后以四种不同的知识组合方式探究最优信息补充机制,实现了大语言模型修辞认知能力的增强。该文构建了多类别中文修辞句数据集MCRSD和修辞知识库MCRKB,并在ChatGPT4等六个大语言模型上开展实验研究,验证了QA...

Self-Guide:一种基于自我规划的大语言模型推理增强方法————作者:刘艺彬;刘正皓;闫宇坤;于是;王硕;杨麟儿;陈慧敏;谷峪;于戈;

摘要:尽管大语言模型在自然语言处理任务中取得显著进展,但其在复杂问题推理等领域还面临着认知负荷问题,即大语言模型在推理过程中需要记忆并处理大量信息。因此,如何有效地减少大语言模型推理过程中的认知负荷,缓解推理过程中可能出现的认知过载,是一个亟待解决的问题。对此该文提出了Self-Guide方法,用于增强语言模型的推理能力。该方法通过指引大语言模型生成常识知识和推理指导,让大语言模型基于自我规划来增强其推...

对话状态追踪模型的数据增强方法研究————作者:刘舒曼;冯洋;

摘要:对话状态追踪模型能够支持任务型对话系统识别任务相关的槽位值。然而,由于标注难度大、领域多样化,对话状态追踪模型常面临训练语料稀少和类别难度不均衡等问题。为了解决这些问题,该文提出了使用数据增强的方法。针对类别难度不均衡问题,该文使用局部噪声强化槽位值的多样性,加强模型学习槽位无关对话结构的能力;针对训练语料稀少问题,该文根据语料中由槽位结构构成的任务逻辑序列,通过采样生成逻辑合法的槽位值序列,增强...

基于数据增强与主题知识共享的低资源情感分类————作者:蒋卓林;王宝乐;艾孜尔古丽·玉素甫;韦金矿;王鹏飞;

摘要:针对低资源语言社交媒体文本的情感分类是低资源语言舆情分析的基础。低资源语言数据集资源不足,标注困难。数据集的大小以及标签的不平衡会影响情感分类模型的性能。针对上述问题,该文提出了一种适用于低资源语言情感分析的数据增强方法,该方法改进了传统的数据增强方法,提高了数据增强样本生成的质量,用于缓解低资源和标签不平衡情况下的过拟合问题。同时,除了提取文本本身的情感特征,还通过引入主题特征,与语义信息进行融...

基于多视角特征融合的多模态虚假新闻检测————作者:肖聪;刘璟;王明文;王菲菲;邵佳兴;黄琪;罗文兵;

摘要:随着社交网络的广泛使用,信息分享变得非常便捷,但这同时也加剧了虚假新闻的传播。现有多模态虚假新闻检测方法在融合文本与图像等多种信息源时,未能充分挖掘和利用新闻内容中不同形式的信息,导致语义信息使用不充分;此外,在融合不同层次结构的语义信息时未能充分考虑不同视角和层次间语义信息的关联性,影响了对新闻内容的深入理解。为此,该文提出了一种多视角特征融合的多模态虚假新闻检测方法,该方法从单模态语义、情感信...

基于字节对编码的端到端藏语语音识别研究————作者:蔡郁青;仁增多杰;尼玛扎西;王超;朱宇雷;张瑾;

摘要:针对藏语端到端语音识别研究中存在的建模单元不统一和识别效果不理想的问题,该文提出了一种BPE-Conformer-CTC/Attention端到端藏语语音识别方法。首先,该方法采用了字节对编码算法进行语音建模,通过反复合并出现频率最高的字符对,将文本分割成易于管理、有意义的单元,平衡建模单元的粒度,从而解决藏语语音识别中建模单元不统一的问题。其次,使用了Conformer编码器,有效地融合了音频序...

全国知识图谱与语义计算大会(CCKS2025)

摘要:<正>2025年9月19日—21日全国知识图谱与语义计算大会(China Conference on Knowledge Graph and Semantic Computing,CCKS)由中国中文信息学会语言与知识计算专业委员会主办,大会源自中文知识图谱研讨会(Chinese Knowledge Graph Symposium,CKGS)和中国语义网与万维网科学大会(Chinese...

基于对比学习的转录文本翻译方法研究————作者:王世宁;刘宇宸;宗成庆;

摘要:神经机器翻译系统极易受到输入噪声的干扰,特别是在口语翻译场景中,翻译系统的输入来自语音识别模块的输出,而后者不可避免地存在着识别错误,最终影响翻译性能。现有方法多采用错误修正和翻译的级联式策略以减少识别错误造成的影响,但易导致系统时延增长,且可能引入额外的噪声。该文提出了一种基于对比学习的鲁棒神经机器翻译方法,将包含识别错误的样本作为正例,通过句子级别或词级别的对比损失,分别从整体和局部两种不同角...

词典释义增强的古文机器翻译————作者:李家欢;吴若纯;黄书剑;胡文菁;陈冀轩;徐维潞;陈家骏;

摘要:古文自动翻译技术可有效促进古籍的传承和发展,弘扬中华传统文化。然而,现有古籍翻译语料规模较小,知识缺乏,导致古文翻译系统性能不佳。该文提出使用词典注释资源增强古文翻译系统。作者收集古汉语常见汉字的释义,并设计了一个词典释义选择-融合的二阶段机器翻译框架,以从词典释义中获取有效信息,去除无效信息。在一个中等规模的古文翻译数据集上的实验表明,该文的方法相比于基线模型和前人的释义融合方法,显著提升了翻译...

基于参数分配的多语言神经机器翻译连续学习研究————作者:谷舒豪;冯洋;

摘要:多语言神经机器翻译的连续学习旨在让模型能够不断支持新的翻译方向,且保证原有翻译方向的性能不发生大幅下降。然而,现有的连续学习方法往往对新支持的翻译方向存在着若干限制或者模型参数爆炸等问题。为了解决这些问题,该文提出了一种基于参数对翻译模型重要性的“分而治之”方法。该文提出的方法首先对预训练翻译模型的不同参数关于当前翻译性能的重要性进行评估,然后将对当前翻译性能影响大的参数在原有翻译方向和新的翻译方...

期货领域知识图谱构建————作者:李雯昕;昝红英;关同峰;韩英杰;

摘要:期货领域是数据最丰富的领域之一,该文以商品期货的研究报告为数据来源构建了期货领域知识图谱(Commodity Futures Knowledge Graph, CFKG)。以期货产品为核心,确立了概念分类体系及关系描述体系,形成图谱的概念层;在MHS-BIA与GPN模型的基础上,通过领域专家指导对242万字的研报文本进行标注与校对,形成了CFKG数据层,并设计了可视化查询系统。该文所构建的CFKG...

面向房地产拍卖公告的长文本实体关系抽取方法————作者:韩郁;殷永峰;宋友;仵伟强;王宝会;

摘要:大多数实体关系联合抽取方法关注实体对在句子内反映的关系,忽略了长文本情景下存在的关系类型分布不均衡等问题。该文面向房地产拍卖公告,基于实体关系抽取思想,针对房地产拍卖公告实体长度较长、关系复杂的情况,设计了一种关系补充抽取机制,并结合全局指针网络和二部图匹配算法,最终形成了一个新的关系抽取模型LRCM,增强了模型对长实体和关系重叠三元组的抽取能力,减小了关系类型分布不均衡对关系抽取性能的影响。实验...

  中文信息学报来自网友的投稿评论:

  • 带头大哥666

    计算机中文T1级期刊,中科院软件研究所主办。稿件一大部分都是会议过来的,期刊对文章质量要求特别高,实验要充足。最重要的,感觉需要较为新颖的创新点,模型拼接的大概率不好使。专家评审很有针对性,编辑服务态度也都很好,中文NLP领域良心期刊。

    2023-11-23 15:37
  • 带头大哥666

    主要接受自然语言处理方向的中文期刊,文章质量在中文期刊中中上等。22年11月11日投稿,23年2月13日发录用通知。总耗时3个月左右,两个评审的意见都很有道理,对期刊修改有不少帮助。编辑部的速度非常快,基本当天投稿次日就能推进流程。版面费3600。整体的投稿流程和感受都很不错。

    2023-02-15 19:17
  • zhaohhhh

    投稿了一些 但是更多的是通过会议推荐过去的,发表速度比较慢

    2022-05-10 18:13
SCI服务

常见问题及解答

Q:中文信息学报是C刊吗?
A:该刊目前还未被CSSCI数据库收录。

搜论文知识网 冀ICP备15021333号-3