科研速递｜广东智慧教育研究院师生论文被人工智能领域重要会议IJCAI 2026录用

近日，第35届国际人工智能联合会议（International Joint Conference on Artificial Intelligence，IJCAI 2026）正式公布录用论文名单，暨南大学广东智慧教育研究院师生投稿3篇论文被录用（1篇Main Track、2篇AI And Social Good Track）。

IJCAI是人工智能领域历史悠久、影响广泛的国际学术会议之一，也是中国计算机学会（CCF）推荐B类学术会议。自1969年创办以来，持续展示人工智能领域的前沿研究成果，是国际人工智能学术交流的重要平台。

AI and Social Good Track是IJCAI为鼓励社会价值导向研究而设立的，研究者围绕真实社会问题开展AI创新与应用探索，具有较强的社会价值和应用价值。今年AI and Social Good Track共收到217篇有效投稿，录用率约为23.9%，该Track接收的论文将收录于IJCAI Proceedings。

入选论文介绍

论文题目：SRJudge: Empowering Large Language Models with Selective Reasoning for Fine-Grained Knowledge Concept Tagging

作者：杨志伟（暨南大学）、杨家华（暨南大学硕士研究生）、林惠茹（暨南大学）、陈星（吉林大学）、官全龙（暨南大学）

通讯作者：陈星、官全龙

摘要：知识概念标注旨在为教育内容分配特定的概念或主题标签，对教育教学过程具有重要意义。现阶段虽可直接依托大型语言模型（LLM）完成知识概念标注，但候选规模过大易引发高维空间下的决策难题，导致模型难以从海量候选概念中精准筛选出目标概念。为解决上述挑战，本研究提出一种新颖的三阶段选择-推理-判断（SRJudge）方法，协同大小模型与强化学习，赋予大语言模型选择性推理能力，以实现细粒度知识概念标注。该方法采用三阶段递进架构：1）通过微调BERT等小型语言模型构建选择器，从大规模候选集中筛选前K个高相关概念，有效压缩决策空间；2）依托融合剪枝机制改进的GRPO强化学习算法与动态任务奖励函数，对轻量级LLM进行优化以构建推理器，实现候选概念的细粒度推理，并对齐人类推理偏好；3）引入更大规模的LLM作为评判器，综合评估推理过程与解释内容的整体合理性，输出最终标注结果。同时，本研究构建生物数据集S_Bio与物理数据集S_Phy两类高质量学科数据集。实验结果表明，SRJudge在多个基准数据集上均显著优于现有最优方法，充分验证了该方法的有效性与优越性。项目开源地址：https://github.com/Nicozwy/SRJudge。

论文题目： PoemDirector: A Multi-Agent Context-Adaptive Instructional Mode Selection Framework for Chinese Classical Poetry Video Generation

作者： 程腾腾（暨南大学博士研究生）、曾小丽（暨南大学硕士研究生）、黄嘉璐（暨南大学硕士研究生）、侯明良（暨南大学）、刘子韬（暨南大学）、赵翔宇（香港城市大学）

通讯作者：曾小丽

摘要：古典诗词是中国 K-12 语文教育中美育与文化传承的重要组成部分，网络教学视频已经成为学生学习古典诗词的主要方式。然而，现有方法尚难同时生成高质量讲解内容和可规模化自动生产的古诗词教学视频。在半自动流程中，教师需要负责教学设计，但视频制作的时间和成本较高。端到端全自动生成虽然效率较高，但由于缺少系统化教学设计，往往存在逻辑不清和讲解浅层的问题。多数现有方法缺少一个同时具备深度理解层级化解释结构、情境自适应教学智能和清晰教学目标的端到端生成框架。本文提出了 PoemDirector，这是一个多智能体框架，将情境自适应策略、多层次解释和基于教学法的端到端生成整合到统一框架中。根据诗词内容和具体情境，PoemDirector 中的 Director Agent 会生成结构化创作蓝图，并组织其他智能体协同工作，从而构建古典诗词教学视频生成流程。与此同时，本文进一步建立了一个面向教学有效性和诗意呈现的多维度评价框架，并基于该框架和额外的客观视频质量指标开展对比实验。实验结果表明，PoemDirector 显著降低了人工成本，并在多个指标上优于基线方法，从而缓解了高质量教学与规模化生产之间的矛盾。

论文题目：Improving Scientific Formula Verbalization in Large Speech Language Models for Accessible Learning

作者：李薛毅（暨南大学博士研究生）、刘天乔（好未来）、刘子韬（暨南大学）、郭腾（暨南大学）、吴永东（暨南大学）

通讯作者：郭腾

摘要：在线学习系统为盲人或低视力学生提供了更加便捷的学习机会，为了帮助他们理解复杂的科学学习教材，这些系统中的语音模型需要能够准确地朗读科学公式。然而，尽管近年来的大语音模型（LSLMs）已经展现出很好的低延迟流式交互能力，但是其在科学公式朗读（Scientific Formula Verbalization）任务中的潜力仍缺乏充分探索。本文提出了Formula-Speech，首个面向科学公式朗读任务设计的端到端大语音模型。具体而言，我们联合教育专家构建了两个高质量科学公式数据集，用于使语音模型更好地学习科学公式的朗读模式。随后，我们采用了一种轻量且有效的两阶段训练框架：第一阶段通过监督微调实现基础的公式到语音对齐，第二阶段结合自定义奖励函数引导的强化学习，进一步优化模型生成更符合人类偏好的公式朗读结果。实验结果表明，我们的方法显著提升了大语音模型的公式朗读性能，并在多个科学学科领域取得了当前最优的效果。