学术报告

  • 小样本命名实体识别

    在很多场景下,收集大量的有标签的数据是非常昂贵、困难、甚至不可能。因此在特定领域、小语种等缺乏标注资源的情况下,NER 任务往往得不到有效解决。为了解决少量标注数据的命名实体识别,人们开始研究小样本命名实体识别任务。本次报告介绍了小样本命名实体识别的基本概念,常用方法,以及CONTaiNER和COPNER两种方法的算法原理。

    2023 年 8 月 30 日 283 0
  • 文本生成中的幻觉

    本次报告讲解了文本生成中的幻觉问题。首先从文本生成的基本原理出发引入到幻觉问题,着重介绍了幻觉的概念、产生原因以及解决方法。然后从添加外部信息和幻觉数据处理两个角度入手分别介绍了KIDReview和CaPE两种处理幻觉的方法。最后介绍了幻觉的未来发展方向。

    2023 年 8 月 20 日 323 0
  • 表格数据生成:GAN模型的演进与未来

    表格数据生成能为深度学习扩充不平衡数据,同时也能避免隐私问题,研究如何生成高保真表格数据具有重要意义。本次报告分析了各个生成模型的优劣,以及GAN在表格数据领域的创新思路。

    2023 年 8 月 15 日 432 0
  • 预训练加密流量表征方法-巩锟

    本次报告从BERT框架入手,讲解基于预训练的加密流量表征方法。首先介绍加密流量分析的问题和挑战,在基本概念部分着重分析BERT输入表示、预训练过程中的MLM和NSP任务,然后以ET-BERT和PEAN为例讲解预训练加密流量表征方法,最后介绍加密流量表征方法的应用。

    2023 年 8 月 7 日 218 0
  • 准确高效地检测安卓APP中的第三方库

    本次报告主要讲述了如何准确高效地检测安卓APP内的第三方库。介绍了第三方库检测的基本概念和主要困难,解释了准确高效检测第三方库的意义,详细讲解布隆过滤器的原理与使用方法、基于熵的代码混淆分析方法。

    2023 年 7 月 27 日 219 0
  • 代码变更表示学习及其应用研究

    代码变更指对软件源代码的增加,删除,修改。软件项目的代码库可以视为一系列代码变更的有序组合,因此代码变更对理解代码库和分析软件演化过程十分重要。代码变更表示学习旨在将代码变更表示为低维稠密实值向量,具有自动学习,端到端训练,表示准确等优点。

    2023 年 7 月 19 日 272 0
  • 融合多模态交互及语义一致性建模的社交机器人检测

    社交机器人模仿人类在Twitter等社交平台上的行为。数以百万计的机器人通常基于平台API,通过自动化程序控制,通过模仿真实用户以实现恶意目标,检测社交机器人对于净化网络空间环境具有重要意义,本次报告重点讲述如何提升对于高级机器人的检测效果

    2023 年 7 月 14 日 431 0
  • Weakness Identification of Binary Program Function of Pseudo-code by Incorporating Structure and Sequence Information with Attention-Residual Connections

    The research objectives are to identify weaknesses in binary program functions and combine deep learning theories to address these weaknesses. The analysis section provides definit…

    2023 年 7 月 4 日 246 0