学术报告
-
网络爬虫技术介绍
网络爬虫,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本,它们被广泛用于互联网搜索引擎或其他类似网站,可以自动采集所有其能够访问到的页面内容,以获取或更新这些网站的内容和检索方式。本次报告介绍了网络爬虫的基本原理和关键技术,介绍了多个常用的爬虫框架,此外还介绍了常见的反爬虫技术…
-
网络表示学习-SDNE
真实的网络结构是高度非线性和复杂的,现有的浅层模型的网络嵌入方法都无法很好地表示更高级的非线性的网络结构。因此,本次报告介绍了一种深度神经网络模型的网络嵌入方法SDNE,它的创新点在于将可用于降维的深度自编码器应用到网络嵌入任务中来,在利用深度神经网络捕捉高阶相似性的同时,将LE算法提取…
-
网络表示学习-Deepwalk
网络表示是衔接网络原始数据和网络应用任务的桥梁。网络表示学习算法负责从网络数据中学习得到网络中每个节点的向量表示, 之后这些节点表示就可以作为节点的特征应用于后续的网络应用任务,如节点分类、链接预测等。如何使用神经网络来进行网络表示学习?deepwalk进行了一次成功的尝试。本次报告介绍…
-
Automated Machine Learning
机器学习是件很复杂的事情,在机器学习向更多领域扩展的时候,遇到了机器学习专家这一资源的限制。自动机器学习(Automated Machine Learning)就是尝试去解决这一问题,它试图用一个自动的系统代替人去做机器学习这整个过程。本次报告介绍了在自动机器学习中应用的各种搜索策略,并…
-
active self-paced learning
在机器学习中获得标注数据是一个重要的部分。但是在一些专业领域,标注成本高,成本高,导致了获得标注数据困难。主动学习的方法能够有效的节约标注成本。但是传统主动学习方法往往注重低置信度样本的挑选,而忽略高置信度样本的标注和使用。本次报告就讲述一个结合自步学习的主动学习模型框架ASPL,解决高…
-
高斯混合模型及求解算法
高斯混合模型(Gaussian mixture model,GMM)用于对样本的概率密度分布进行估计,而估计采用的模型(训练模型)是几个高斯模型的加权和。每个高斯模型就代表了一个类。对样本中的数据分别在几个高斯模型上投影,就会分别得到各个类上的概率,然后我们可以选取概率最大的类作为判决结…
-
Not all bytes are equal Neural byte siev
简单高效的漏洞检测方法一直是信息系统安全领域研究的热点,微软研究人员借助机器学习和深度神经网络开发出一种用于发现软件安全漏洞的新方法,这个名为“神经网络模糊测试”的最新研究项目旨在对传统模糊测试技术加以强化,而且早期实验已经显现出良好的效果。研究通过在灰箱模糊测试器的反馈回路中插入一个深…
-
Fast bin attack & Unsorted bin attack
简单介绍了堆的管理与分配,主要讲述了堆上两种典型的攻击方式,即fast bin attack 和 Unsorted bin attack,他们分别利用了单向链表和双向链表在卸载chunk时的操作机制,造成任意地址的写。最后通过一个结合fast bin chunk精巧构造Unsorted …