学术报告
-
针对文本嵌入模型的模型反演攻击方法研究
研究针对文本嵌入模型的模型反演攻击,揭示了自然语言处理领域面临的隐私泄露风险。本次学术报告介绍了关于文本嵌入模型模型反演攻击的最新方法,并指明了现有的缺陷和未来发展方向。
-
人工智能模型的谈忘学习方法
遗忘学习被称为机器遗忘或取消学习,是指机器学习或深度学习系统中先前获取的知识随着时间推移而退化的现象。本次学习报告的主要讲解了两种人工智能模型的遗忘学习方法,遗忘训练数据中的特定样本或者特定类别样本,保护个人隐私。
-
增强认知诊断结果的可解释性
认知诊断通过挖掘学习者行为、心理和认知之间的关系,利用学习者的学习数据,对其认知状态进行综合评估和诊断,其输出结果,即学生对于不同知识概念的熟练程度应与实际情况相符,具有高度的可解释性。现有认知诊断模型深入分析学习者的认知状态,提高结果的可解释性,为教学设计、个性化学习路径推荐等下游任务提供更准确的支持和指导,具有重要的理论意义与实际价值。
-
二进制代码相似性检测技术
二进制函数相似性分析在1-Day漏洞检测、代码克隆检测、恶意软件检测、软件剽窃检测和自动软件修复等多个应用领域中具有广泛的应用。本次学术报告主要讲解了二进制代码相似性检测技术的基本概念、研究背景和意义,以及两种目前最先进的二进制代码相似性检测方法。
-
人工智能模型的公平性测试
人工智能技术发展迅速,不仅在图像领域,在决策系统等领域也发挥了重要作用。用于模型训练的数据集中含有显示或者隐式的敏感属性(如性别、种族等),模型往往会利用敏感属性的特征做出决策,这将导致人工智能模型在公平性方面出现偏差,产生严重的舆论影响和社会问题,因此需要测试模型的公平性并修复。本次学术报告介绍了人工智能模型公平性的定义和通用的歧视样本生成方法,并聚焦于两…
-
代码摘要技术
代码摘要(Code Summarization)是一项通过自动生成自然语言描述以解释目标代码的技术。其目标是帮助理解代码的功能和用途。通过本次学术报告对学习代码摘的学习,希望大家可以掌握其基本概念、理解代码表示的重要性、掌握其技术原理,并深入了解其在各领域的应用和未来发展趋势
-
基于视觉直觉的源代码表征
源代码表征是软件工程中的一个重要研究领域,主要关注如何有效地将源代码转化为可以支持各种软件工程任务(如代码搜索、克隆检测、代码自动生成等)的数学模型或数据结构。这些表征通常需要捕获源代码的语义、结构和语法特征。本次学术报告通过WySiWiM、CodeGrid两篇顶刊、顶会算法,介绍了一种新的源代码表征方法,探讨代码的布局结构在传统代码表征领域的应用潜力和创新…
-
极端多标签文本分类
极端多标签文本分类旨在为每个文本分配大量可能的标签,处理标签数量巨大和数据稀疏性问题。该技术通过高效的特征选择、标签嵌入和深度学习模型,提高分类准确性和速度。极端多标签文本分类广泛应用于搜索引擎、推荐系统和社交媒体分析等领域,能够应对大规模标签空间下的挑战,实现更精细和个性化的文本分类。