学术报告
-
LDA主题模型浅析
LDA主题模型可以将文档集中每篇文档的主题按照概率分布的形式给出。同时它是一种无监督学习算法,在训练时不需要手工标注的训练集,需要的仅仅是文档集以及指定主题的数量k即可。对于每一个主题LDA均可找出一些词语来描述它。 LDA首先由Blei, David M.、吴恩达和Jordan, Mi…
-
XSS跨站脚本攻击
XSS攻击是客户端脚本安全中的头号大敌,多次位列OWASP TOP 10榜首,严重威胁到web网络安全。XSS全称是跨站脚本攻击,指恶意攻击者往web页面里插入恶意script代码,当用户浏览该网页之时,嵌入其中的script代码被执行,从而达到恶意攻击用户的目的。本次学术报告主要介绍了…
-
二进制程序中加解密函数的定位
模糊测试是一种应用广泛的自动化漏洞挖掘方法,但当被测程序使用加密算法处理输入数据时,对输入数据的直接变异并不能达到很好的测试效果。此时需要分析程序中执行加解密操作的函数的位置,进而排除加解密函数的影响并对后续流程进行测试。本次报告主要介绍了四种加解密函数定位方法的原理和优劣势,并介绍了实…
-
计算机启动流程详解2
计算机从按下电源按钮到操作系统启动完成的过程其实相当复杂,大多数普通用户可能并不了解其中的过程和玄机。本次报告主要介绍了计算机启动中BIOS-MBR-PBR-OS这一主要流程及每个步骤中完成的工作,并介绍了磁盘工作、分区等相关知识。 附件-计算机启动流程详解2.pdf
-
特征选择方法
特征选择是指为了构建模型而选择相关特征子集的过程,目的是去除特征中的无关特征和冗余特征,进而达到简化模型,增强可解释性;减轻维度灾难;提高训练效率;改善通用性等效果。本次报告从特征选择基本框架入手,详细介绍了三种常见搜索策略以及过滤、包装、嵌入三种评价方法。 附件-特征选择方法.pdf
-
梯度消失和梯度爆炸的原因及解决方案
在训练层数较多的神经网络的过程中,使用基于反向传播的梯度优化算法来优化参数有可能会遇到梯度消失或梯度爆炸的问题。本次报告从公式推导角度剖析深度学习中发生梯度消失和爆炸的原因,并介绍相应的七种解决方案。 附件-梯度消失和梯度爆炸的原因及解决方案.pdf
-
数据挖掘中的数据清洗方法
数据清洗是数据挖掘工作中很重要的一部分工作,目的是解决数据的质量问题,将“脏”数据变成标准的、干净的数据,更加适合挖掘。本次报告从预处理阶段、缺失值处理、重复数据清理、格式清洗、异常值处理、数据转化等6个方面详细介绍常用的数据清洗方法。 附件-数据挖掘中的数据清洗方法.pdf
-
GBDT梯度提升决策树
梯度提升决策树(GBDT)是集成学习中梯度提升方法(Gradient Boost)与决策树(Decision Tree)的结合,算法实现难度低、准确率高,且其改进算法XGBoost具备优良的大数据处理能力,实际应用广泛。本次报告首先复习Bagging、Boosting等集成学习方法,进而…