学术报告

  • 频繁项集算法分析

    一、 什么是频繁项集 项集是指事项的集合,而频繁项集就是频繁出现在数据集中的项集,说白了就在数据集中“出现次数足够多”的项集。 其中,项集的出现频度是指包含项集的事务的数量,简称为项集的频度、支持度计数。如果项集I的支持度计数满足预定义的最小支持度计数阈值,则I是频繁项集。之前提到的“出现次数足够多”的衡量标准就是最小支持度计数阈值。如果频繁项集中共含有k个…

    2015 年 6 月 18 日 1.27K 0
  • 并查集算法及其在约束传递中的应用

    <img src="http://www.isclab.org.cn/wp-content/uploads/2015/06/41.png" alt="" title="4" width="700“

    2015 年 6 月 15 日 306 0
  • Floyd解决传递闭包

    传递闭包:在数学上的定义——在集合X上的二元关系R的传递闭包是包含R的X上的最小传递关系。其中定义域是数据集X,而运算关系是必须具有传递性,这里的最小传递关系指的是包含所有可达路径。 我们用一个简单的例子来说明一下这个问题 如上图是一张地图,上面有六个地点,我们已知的路线连接如图中箭头所示,传递闭包就是在原图上的连接关系的基础上,通过传递可以扩展出来的连线,…

    2015 年 3 月 10 日 566 0
  • 序列标注模型

    背景知识 序列标注模型被广泛应用于文本处理相关领域,例如分词、词性标注、命名实体识别等方面。现有的序列标注模型主要有HMM,MEMM 以及 CRF,通过对这几种自然语言处理中常用的序列标注模型进行对比,分析其各自的优缺点。 在介绍三种序列标注模型之前,首先需了解下产生式模型与判别式模型的概念,二者在分类器中经常被提及。假定输入,类别标签:产生式模型估计联合概…

    2015 年 2 月 2 日 604 0
  • 动态规划算法简介

    1 基本概念 维基百科对动态规划(Dynamic programming,DP)的定义:它是一种在数学、计算机科学和经济学中使用的,通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。 动态规划常常适用于有重叠子问题和最优子结构性质的问题,动态规划方法所耗时间往往远少于朴素解法。 动态规划是通过组合子问题的解而解决整个问题的,通过将问题分解为相互不独…

    2015 年 1 月 29 日 507 0
  • 音频事件识别信道自适应方法研究

    吕英 2015.1.28

    2015 年 1 月 28 日 387 0
  • 音频事件识别参数优化方法

    目前音频处理领域各种系统的参数优化研究,通常把系统的各个层次(一般包括特征提取、特征向量生成、模型训练等)割裂开来进行相互独立的参数寻优,再将独立寻优结果进行简单组合,构成系统的参数取值。这种方法的前提假设是各个层次的参数选取相互独立,跨层次不会对识别效果造成影响,而实际的研究和应用中,这一假设并不能得到满足,因此需要联合各个层次的参数,选择适当的优化算法进…

    2015 年 1 月 28 日 403 0
  • 层次聚类算法

    对聚类算法有一点点入门的时候就知道,几乎所有的“平面型”聚类算法都有一个共同的弱点-难以确定类别数(聚类停止条件),而层次聚类在一定程度上解决了这个问题(它算一种比较古老比较通用的聚类算法吧)。谈到层次这个词,很容易想象到聚类的过程是线性分阶段进行的。 1. 层次聚类两种基本方法:凝聚的和分裂的 凝聚的:从点作为个体簇开始,每一步合并两个最接近的簇。这里需要…

    2015 年 1 月 28 日 569 0