bfs
-
基于图结构处理的文本生成
文本生成技术是自然语言处理中一个重要的研究领域,具有广阔的应用前景。传统文本生成的Seq2Seq框架不能有效地利用原始语料中的语义信息,而Graph2Seq模型可以丰富文本的语义知识表达,产生更加高质量的文本。本文报告重点介绍了与文本生成与注意力机制的基础知识,并介绍了两种经典的利用到了注意力机制的Graph2Seq模型,借此引发对图结构处理的思考。
-
基于NLP的软件漏洞检测方法
随着官方发布的漏洞数量呈现指数的增长趋势,针对漏洞检测技术的研究应运而生。漏洞种类的多样性以及检测方法的单一性导致漏洞检测结果呈现一定的局限性,随着自然语言处理技术的兴起和专家知识的不断扩展,人们开始使用自然语言处理技术辅助进行漏洞检测研究。本报告重点讲述了基于自然语言处理的漏洞检测技术目前的状况,以及介绍了两种用于漏洞检测的自然语言处理方法。
-
弱监督技术方法
当前监督学习技术已经取得了巨大的成功,但是值得注意的是,由于数据标注过程的成本太高,很多任务很难获得如全部真值标签这样的强监督信息。而无监督学习由于学习过程太过困难,它的发展缓慢。因此,希望机器学习技术能够在弱监督状态下工作。本报告介绍了弱监督学习中的三个问题及解决方法,以及半监督技术的前提假设和具体的三种算法,包括自训练,先聚类后标注和基于图的算法。
-
Dropout随机失活
具有大量参数的深度神经网络是非常强大的机器学习系统。然而,在这样复杂的网络中,过拟合的问题难以解决。复杂的网络结构和缓慢的运行速度导致我们很难在测试时通过组合许多不同大型神经网络的预测来处理过度拟合。本报告重点讲述了一种深度网络的正则化思想——Dropout方法的原理,并介绍了Dropout思想下相关算法的发展与应用。
-
深度生成模型
近年,机器学习已经在计算机视觉、语音识别、语音合成以及自然语言处理(NLP)领域取得了突破性成果,在机器翻译和情感计算中展现的能力也颇令人期待。 其中机器学习方法可以分为生成方法(generative approach)和判别方法(discriminative approach),所学到的模型分别称为生成式模型(generative model)和判别式模型…
-
神经网络模型的覆盖测试
人工智能系统在近年来取得丰硕的成果,其中神经网络在自动驾驶领域等图像处理方向应用较为广泛。但是神经网络存在安全隐患,容易受到攻击导致决策错误,比如对抗样本攻击和后门攻击。如何测试神经网络模型,提前发现模型潜在的缺陷成为亟待解决的问题。本报告重点讲述了人工智能系统的测试框架和测试指标,并介绍了应用覆盖测试思想对神经网络模型进行测试的方法。
-
结合溯源图的APT检测方法
APT攻击事件频发,严重危害着各国政府部门、组织、公司的网络信息安全。溯源图追踪日志之间的因果关系,保留了系统的丰富执行历史信息,便于检测长期且隐蔽的APT攻击。本次汇报首先讲解了APT攻击的基本概念和检测难点,介绍了网络安全领域常用的Kill-chain模型和ATT&CK框架,并对两种先进的结合溯源图的APT检测方法做了详细讲解,最后分析两种方法的…
-
软件缺陷自动修复方法
随着现代软件规模的不断扩大和复杂性的不断提高,软件缺陷调试所消耗的成本也在不断增加,软件缺陷的自动修复成为越来越迫切的需求。软件缺陷自动修复可以分为缺陷定位、补丁生成、补丁验证三个阶段。本次汇报分享了两种常见的补丁生成方法,基于修复模板的方法利用人工总结的模板生成补丁;基于神经机器翻译的方法则是将缺陷修复的过程视作是将缺陷程序翻译为修复程序的过程,使用自然语…