bfs
-
基于迁移学习的日志异常检测方法
本报告讲述了系统日志数据异常检测的基本框架,介绍了日志解析和迁移学习的基本概念和方法。通过分析日志数据特点和现有的基于深度学习的日志异常检测方法,详细讲解了两种基于迁移学习的日志异常检测方法,并启发思考跨领域日志异常检测问题。
-
强化学习基础与实战
本报告介绍了强化学习领域基本概念,详细介绍了Q-Learning算法和Deep Q Learning算法的原理,简要梳理了了两种算法的发展脉络,以经典案例windy grid-world演示了Q-Learning算法应用过程,介绍了强化学习方法在网络空间安全、自然语言处理等领域的应用。
-
高准确率的鲁棒加密恶意流量实时检测方法
本报告讲述了加密恶意流量检测领域基本概念,通过详细介绍基于频域分析的实时鲁棒恶意流量检测和基于自适应聚类的网络边缘恶意流量分类方法,启发思考通过统计聚类分析来提升加密恶意流量检测算法的鲁棒性、分类方法的泛化性以及检测的高吞吐量与实时性问题。
-
文本相似度度量方法
文本相似度度量是自然语言处理中的一个基础问题,是许多下游任务的基础,如文本分类、信息检索、对话系统、句义标注等。相似度匹配的过程包括了构造特征与度量特征两个基本步骤,其中构造特征是核心任务。报告的两篇论文讲述了构造特征的一些可供借鉴的方法。第一篇文章从逻辑表达与推理中构造特征来度量句子的相似度,第二篇从表征学习的角度来度量不同长度文本的相似度。
-
基于深度学习的文本分类方法
在自然语言处理任务中,文本分类旨在将文本文档分类为给定的类别,是一项基础而重要的任务。近年来,深度神经模型由于其表现力和对特征工程的最低要求而在文本分类中越来越受欢迎。然而,将深度神经网络应用于文本分类仍然具有挑战性,因为它们严重依赖于大量训练数据,并且未能有效利用文本的全局特征信息。本学术报告重点介绍了基于图神经网络的文本分类以及结合注意力机制有效提取文本…
-
基于图结构处理的文本生成
文本生成技术是自然语言处理中一个重要的研究领域,具有广阔的应用前景。传统文本生成的Seq2Seq框架不能有效地利用原始语料中的语义信息,而Graph2Seq模型可以丰富文本的语义知识表达,产生更加高质量的文本。本文报告重点介绍了与文本生成与注意力机制的基础知识,并介绍了两种经典的利用到了注意力机制的Graph2Seq模型,借此引发对图结构处理的思考。
-
基于NLP的软件漏洞检测方法
随着官方发布的漏洞数量呈现指数的增长趋势,针对漏洞检测技术的研究应运而生。漏洞种类的多样性以及检测方法的单一性导致漏洞检测结果呈现一定的局限性,随着自然语言处理技术的兴起和专家知识的不断扩展,人们开始使用自然语言处理技术辅助进行漏洞检测研究。本报告重点讲述了基于自然语言处理的漏洞检测技术目前的状况,以及介绍了两种用于漏洞检测的自然语言处理方法。
-
弱监督技术方法
当前监督学习技术已经取得了巨大的成功,但是值得注意的是,由于数据标注过程的成本太高,很多任务很难获得如全部真值标签这样的强监督信息。而无监督学习由于学习过程太过困难,它的发展缓慢。因此,希望机器学习技术能够在弱监督状态下工作。本报告介绍了弱监督学习中的三个问题及解决方法,以及半监督技术的前提假设和具体的三种算法,包括自训练,先聚类后标注和基于图的算法。