bfs

  • 源代码自动化编辑方法

    代码自动编辑任务通过应用频繁出现的编辑模式对现有代码进行修改,能够提升软件开发的效率。 CODIT方法将代码编辑过程建模为树结构变换和标记生成两个阶段。MODIT方法输入整合需要编辑的代码片段、开发人员意图、编辑上下文三种信息模式,使用微调后的PLBART模型预测输出序列。

    2022 年 7 月 10 日 307 0
  • 面向深度学习软件库的动态漏洞挖掘方法

    针对开源软件库输入构建需要符合特定编程语言语法规范的问题,现有研究方法分别从构建模型输入和构建API输入两条路线出发,。LEMON方法针对缺陷引起的极小输出差异难以被察觉的问题,采用启发式的模型突变策略放大不同库上模型输出的差异值;FreeFuzz方法使用插桩工具,获取动态执行社区开源API代码和模型时的输入空间,实现更高的代码覆盖率,发现更多潜在缺陷。

    2022 年 7 月 3 日 446 0
  • 二进制代码开源成分分析

    二进制代码-源代码匹配是信息安全领域的重点研究方向之一。在给定二进制代码的情况下,逆向分析研究人员希望找到它对应的源代码,从而提升逆向分析的效率和准确率。但由于源代码和二进制代码的差异性,在此领域的研究较少。传统算法提取源代码和二进制代码的字符串、立即数等特征进行匹配。设计一种端到端模型,可以自动提取代码间的语义特征,从而提升匹配的准确率。

    2022 年 6 月 27 日 776 0
  • 论辩挖掘领域观点对识别以及抽取方法

    随着社交媒体、论坛产生的用户生成数据不断增长,从大规模信息流中发现、分离和分析论点的需求凸显了论辩挖掘的重要性。本次报告旨在了解此领域经典的系统处理流程,掌握观点对识别和抽取任务定义以及实现方法。

    2022 年 6 月 20 日 457 0
  • 利用图挖掘的内部威胁检测方法

    随着图神经网络的广泛应用,以及越来越多的组织和企业关注内部威胁,利用图挖掘的方法检测内部威胁受到越来越多研究者的重视。本次报告介绍了利用图挖掘内部威胁检测方法的整体架构,以及如何从用户日志中提取图结构信息。并详细介绍了用户级和操作级基于图的内部威胁检测方法各一种,最后介绍了内部威胁领域的实际应用场景。

    2022 年 6 月 14 日 556 0
  • 层次多标签文本分类方法

    随着互联网技术的高速发展和数据规模的快速增长,层次多标签分类应用场景越来越多,如文献组织、新闻标注、蛋白质功能分类等。层次多标签文本分类是多标签分类下的子任务,标记每个给定文本与最相关的多个层次标签。本次学术报告主要介绍了层次多标签分类的背景、主要解决方法、应用领域和未来发展方向。

    2022 年 6 月 6 日 590 0
  • 敏感文本数据脱敏方法

    本次报告对文本数据的脱敏方法展开介绍,介绍了目前常用的文本数据脱敏方法,重点讲解了文本数据泛化脱敏的基本概念,详细阐述了文本泛化脱敏方法和文本差分隐私噪声扰动脱敏方法,最后对比了文本数据和表格数据隐私保护的差异,并对发展方向做出了总结。

    2022 年 5 月 30 日 838 0
  • 表格数据隐私保护

    本次报告对表格数据的隐私保护方法展开介绍,介绍了目前常用的表格数据隐私保护方法,重点讲解生成对抗网络的基本原理及其和表格数据隐私保护间关系,详细阐述了经典的利用生成对抗网络生成新表格数据并保护数据隐私的方法,最后对其应用和发展方向做了总结。

    2022 年 5 月 25 日 272 0