学术报告

  • 缺乏先验知识条件下的模型窃取方法

    随着机器学习的快速发展,图像分类、恶意软件识别等多个领域都通过建立机器学习模型解决相应的问题。但由于一些训练出的模型可能涉及训练数据的隐私信息与模型的商业价值,所以其安全性一直备受关注。本次学术报告介绍了模型窃取技术的发展历程,重点讲解了在缺乏模型参数、模型结构以及训练数据等先验条件下,如何通过构造数据实现模型窃取的方法。

    2021 年 4 月 14 日 480 0
  • 基于T-Closeness的微聚集数据脱敏算法

    大数据时代的到来,同时也带来了隐私、敏感信息保护方面的棘手难题。数据脱敏措施层出不穷,K-Anonymity,L-Diversity,T-Closeness,以及相结合的微聚集算法,能够在保证数据效用的同时,最大化防止隐私数据泄露,本次学术报告详细讲解了T-Closeness的原理、用来计算两种概率分布距离的EMD(Earth Mover ‘s …

    2021 年 4 月 6 日 575 0
  • AFL–基于覆盖的模糊测试工具

    本次报告介绍了模糊测试以及各种分类方法,并且讲解了目前流行的模糊测试工具AFL的原理,阐明了AFL工具是如何提高代码覆盖率的。针对AFL存在的测试用例生成盲目性的问题,介绍了一种基于自适应随机测试的测试用例生成方法,实验结果表明使用改进后的方法显著提高了软件测试的效率和质量。

    2021 年 3 月 29 日 708 0
  • 智能化系统的安全测试方法

    智能化系统越来越多地部署在对安全性至关重要的领域中,包括无人驾驶汽车和恶意软件检测。在这些领域中,系统行为的正确性和可预测性对于极端案例输入是至关重要的。软件测试作为软件部署前的重要保障,应最大限度地找到可能引起系统出现问题的输入,如何将传统软件测试技术引入智能化系统测试是近年来软件测试研究的一个重要领域。在本次报告中,介绍了智能化系统的安全测试方法,重点说…

    2021 年 3 月 23 日 786 0
  • 程序的链接

    本次报告介绍了程序链接过程的基本概念,以及静态链接和动态链接中文件的结构和链接过程。基本概念包括程序构建(Build)过程、链接的历史和链接的作用等。链接的主要工作就是处理各个模块间的引用关系,使得各个模块可以正确的衔接,从而实现程序设计的模块化,提升程序的可维护性和复用性。

    2021 年 3 月 15 日 556 0
  • 用户画像建模

    本次报告介绍了用户画像建模的相关基本概念,以及用于短文本处理的用户画像构建LDA-RCC组合模型。基本概念包过用户画像的作用、构建过程、分类等。LDA-RCC组合模型解决了传统文本建模方法从短文本中提取主题时的稀疏性问题,并根据用户数据自动提取主题的个数,提高提取主题的质量,从而进一步提升用户画像词云密度和内容准确度。

    2021 年 3 月 9 日 454 0
  • 域自适应网络框架DANE

    本次报告介绍一种域自适应网络嵌入框架DANE,该框架解决了嵌入空间偏移和嵌入分布偏移的问题。在DANE中,来自多个网络的节点通过一组共享的可学习参数被编码为向量,以便向量共享对齐的嵌入空间。之后通过对抗学习正则化进一步调整嵌入在不同网络上的分布。

    2021 年 3 月 1 日 482 0
  • 预训练语言模型GPT3

    为了从网络上海量文本信息提取有价值信息,需要使用计算机处理文本数据,首要任务是将文本转换为计算机可以处理的向量化数据。单词是文本的最小单位,所以需要使用语言模型得到词向量表示成为文本语义分析的首要任务。但是传统的语言模型存在受专家规则限制或者存在零概率现象,为了构造更加智能的语言模型将深度学习应用于词向量预训练模型的构建中。本次学术报告围绕基于transfo…

    2021 年 2 月 19 日 671 0