学术报告
-
小样本命名实体识别
在很多场景下,收集大量的有标签的数据是非常昂贵、困难、甚至不可能。因此在特定领域、小语种等缺乏标注资源的情况下,NER 任务往往得不到有效解决。为了解决少量标注数据的命名实体识别,人们开始研究小样本命名实体识别任务。本次报告介绍了小样本命名实体识别的基本概念,常用方法,以及CONTaiNER和COPNER两种方法的算法原理。
-
文本生成中的幻觉
本次报告讲解了文本生成中的幻觉问题。首先从文本生成的基本原理出发引入到幻觉问题,着重介绍了幻觉的概念、产生原因以及解决方法。然后从添加外部信息和幻觉数据处理两个角度入手分别介绍了KIDReview和CaPE两种处理幻觉的方法。最后介绍了幻觉的未来发展方向。
-
表格数据生成:GAN模型的演进与未来
表格数据生成能为深度学习扩充不平衡数据,同时也能避免隐私问题,研究如何生成高保真表格数据具有重要意义。本次报告分析了各个生成模型的优劣,以及GAN在表格数据领域的创新思路。
-
预训练加密流量表征方法-巩锟
本次报告从BERT框架入手,讲解基于预训练的加密流量表征方法。首先介绍加密流量分析的问题和挑战,在基本概念部分着重分析BERT输入表示、预训练过程中的MLM和NSP任务,然后以ET-BERT和PEAN为例讲解预训练加密流量表征方法,最后介绍加密流量表征方法的应用。
-
准确高效地检测安卓APP中的第三方库
本次报告主要讲述了如何准确高效地检测安卓APP内的第三方库。介绍了第三方库检测的基本概念和主要困难,解释了准确高效检测第三方库的意义,详细讲解布隆过滤器的原理与使用方法、基于熵的代码混淆分析方法。
-
代码变更表示学习及其应用研究
代码变更指对软件源代码的增加,删除,修改。软件项目的代码库可以视为一系列代码变更的有序组合,因此代码变更对理解代码库和分析软件演化过程十分重要。代码变更表示学习旨在将代码变更表示为低维稠密实值向量,具有自动学习,端到端训练,表示准确等优点。
-
融合多模态交互及语义一致性建模的社交机器人检测
社交机器人模仿人类在Twitter等社交平台上的行为。数以百万计的机器人通常基于平台API,通过自动化程序控制,通过模仿真实用户以实现恶意目标,检测社交机器人对于净化网络空间环境具有重要意义,本次报告重点讲述如何提升对于高级机器人的检测效果
-
Weakness Identification of Binary Program Function of Pseudo-code by Incorporating Structure and Sequence Information with Attention-Residual Connections
The research objectives are to identify weaknesses in binary program functions and combine deep learning theories to address these weaknesses. The analysis section provides definit…