• 回答数

    2

  • 浏览数

    281

腊肉炒豆丝
首页 > 毕业论文答辩 > gmm模型毕业论文

2个回答 默认排序
  • 默认排序
  • 按时间排序

蛋蛋徐要发疯

已采纳

语音识别框架中的经典的声学模型是:基于隐马尔可夫(HMM)的声学模型 本文总结GMM-HMM在声学模型的对应关系及作用,不对GMM和HMM做过多介绍。 一个声学模型是一组HMM HMM参数:初始概率、转移概率、观察概率 基于HMM的声学模型需要人工定义的是:     中状态数     2.初始概率(实践中一般令其恒等于1)     3.转移概率(该项对识别结果影响很小,所以设为固定值,不在训练中更新)     4.每个状态的概率分布函数(一个HMM状态下一个帧的特征的PDF,本节的PDF是GMM) 基于HMM的声学模型主要包含的信息是:状态的定义、各状态的观察概率分布,本文为GMM,因此声学模型也叫GMM-HMM模型。其他的如:使用神经网络对HMM的观察概率分布建模的被称为NN-HMM模型。 HMM状态的物理意义可以认为是:音素的发声状态,习惯上分为“初始态”、“稳定态”、“结束态”,因此可以用三个状态建模一个音素的发音。也可以使用两个状态来表示“起始帧”、“其他帧”。 声学模型可以计算某一帧特征对应某一状态的 声学分 ,也就是该帧对应该状态的对数观察概率,或对数似然值。 一个音素:多个连续的HMM状态,一个HMM模型 一帧特征:一个HMM状态 一个音素:多个帧特征 输入连续的语音帧的声学特征如MFCC,例:o1 o2 o3 ... on. 识别过程:为特征序列匹配状态序列,例:s1 s2 s3 ... sn. 其中不同的s可能为相同的状态。 声学模型作用就是计算声学分 输入:特征序列、特征序列对应的状态序列(每一帧对应一个状态) 输出:HMM的观察概率GMM模型的参数 优化算法:EM算法 GMM参数可使用EM算法迭代,但是在训练过程中也需要 特征序列和标注文本(音素、状态)的对应关系,因此,需要对特征序列和标注文本 对齐 。 对齐 : 通过特征序列和标注文本获取每个帧对应的状态 对齐的过程需要声学模型,而声学模型的训练也需要对齐结果,因此这也是一个迭代地过程。 Kaldi中第一次训练声学模型均等地把语音帧对应到相应的状态,训练几轮后,使用训练中的声学模型通过维特比算法生成对齐结果,然后不断迭代。 单音子模型:一个音素对应一个HMM模型 多音子模型(常为三音子、双音子):多个音素对应一个HMM模型初入语音,如有错误,欢迎指出。

139 评论

仗剑拂衣去

高斯混合模型(Gaussian Mixed Model)指的是多个高斯分布函数的线性组合,理论上GMM可以拟合出任意类型的分布,通常用于解决同一集合下的数据包含多个不同的分布的情况(或者是同一类分布但参数不一样,或者是不同类型的分布,比如正态分布和伯努利分布)。 如图1,图中的点在我们看来明显分成两个聚类。这两个聚类中的点分别通过两个不同的正态分布随机生成而来。但是如果没有GMM,那么只能用一个的二维高斯分布来描述图1中的数据。图1中的椭圆即为二倍标准差的正态分布椭圆。这显然不太合理,毕竟肉眼一看就觉得应该把它们分成两类。 这时候就可以使用GMM了!如图2,数据在平面上的空间分布和图1一样,这时使用两个二维高斯分布来描述图2中的数据,分别记为N(μ1,Σ1)和N(μ2,Σ2) 。图中的两个椭圆分别是这两个高斯分布的二倍标准差椭圆。可以看到使用两个二维高斯分布来描述图中的数据显然更合理。实际上图中的两个聚类的中的点是通过两个不同的正态分布随机生成而来。如果将两个二维高斯分布N(μ1,Σ1)和N(μ2,Σ2) 合成一个二维的分布,那么就可以用合成后的分布来描述图2中的所有点。最直观的方法就是对这两个二维高斯分布做线性组合,用线性组合后的分布来描述整个集合中的数据。这就是高斯混合模型(GMM)。 高斯混合模型(GMM)的数学表示: 期望极大(Expectation Maximization)算法,也称EM算法,是一种迭代算法,由Dempster et. al 在1977年提出,用于含有隐变量的概率参数模型的极大似然估计。 EM算法作为一种数据添加算法,在近几十年得到迅速的发展,主要源于当前科学研究以及各方面实际应用中数据量越来越大的情况下,经常存在数据缺失或者不可用的的问题,这时候直接处理数据比较困难,而数据添加办法有很多种,常用的有神经网络拟合、添补法、卡尔曼滤波法等,但是EM算法之所以能迅速普及主要源于它算法简单,稳定上升的步骤能相对可靠地找到“最优的收敛值”。 (个人的理解就是用含有隐变量的含参表达式不断拟合,最终能收敛并拟合出不含隐变量的含参表达式) 模型的EM训练过程,直观的来讲是这样:我们通过观察采样的概率值和模型概率值的接近程度,来判断一个模型是否拟合良好。然后我们通过调整模型以让新模型更适配采样的概率值。反复迭代这个过程很多次,直到两个概率值非常接近时,我们停止更新并完成模型训练。现在我们要将这个过程用算法来实现,所使用的方法是模型生成的数据来决定似然值,即通过模型来计算数据的期望值。通过更新参数μ和σ来让期望值最大化。这个过程可以不断迭代直到两次迭代中生成的参数变化非常小为止。该过程和k-means的算法训练过程很相似(k-means不断更新类中心来让结果最大化),只不过在这里的高斯模型中,我们需要同时更新两个参数:分布的均值和标准差.[3] GMM常用于聚类。如果要从 GMM 的分布中随机地取一个点的话,实际上可以分为两步:首先随机地在这 K 个 Component 之中选一个,每个 Component 被选中的概率实际上就是它的系数Πk ,选中 Component 之后,再单独地考虑从这个 Component 的分布中选取一个点就可以了──这里已经回到了普通的 Gaussian 分布,转化为已知的问题。 根据数据来推算概率密度通常被称作 density estimation 。特别地,当我已知(或假定)概率密度函数的形式,而要估计其中的参数的过程被称作『参数估计』。 (推导和迭代收敛过程这里省略,可参考资料1)一个实际的例子:用GMM对iris数据集进行聚类,并通过make_ellipses表示出来 make_ellipses方法概念上很简单,它将gmm对象(训练模型)、坐标轴、以及x和y坐标索引作为参数,运行后基于指定的坐标轴绘制出相应的椭圆图形。在特定条件下,k-means和GMM方法可以互相用对方的思想来表达。在k-means中根据距离每个点最接近的类中心来标记该点的类别,这里存在的假设是每个类簇的尺度接近且特征的分布不存在不均匀性。 这也解释了为什么在使用k-means前对数据进行归一会有效果。高斯混合模型则不会受到这个约束 ,因为它对每个类簇分别考察特征的协方差模型。 K-means算法可以被视为高斯混合模型(GMM)的一种特殊形式。 整体上看,高斯混合模型能提供更强的描述能力,因为聚类时数据点的从属关系不仅与近邻相关,还会依赖于类簇的形状。n维高斯分布的形状由每个类簇的协方差来决定。在协方差矩阵上添加特定的约束条件后,可能会通过GMM和k-means得到相同的结果。 在k-means方法中使用EM来训练高斯混合模型时对初始值的设置非常敏感。而对比k-means,GMM方法有更多的初始条件要设置。实践中不仅初始类中心要指定,而且协方差矩阵和混合权重也要设置。可以运行k-means来生成类中心,并以此作为高斯混合模型的初始条件。由此可见并两个算法有相似的处理过程,主要区别在于模型的复杂度不同。高斯混合模型的基本假设是 已知类别的比例 和 类别的个数 ,但是不知道每个样例的具体标签,据此用EM的模式为每个样本进行最优的标注。也就是说它适合的是 无标签学习的分类问题 ,并且需要已知基本假设。 整体来看,所有无监督机器学习算法都遵循一条简单的模式:给定一系列数据,训练出一个能描述这些数据规律的模型(并期望潜在过程能生成数据)。 训练过程通常要反复迭代,直到无法再优化参数获得更贴合数据的模型为止。【1】  高斯混合模型(GMM)及其EM算法的理解 【2】    机器学习中的数学(4)-EM算法与高斯混合模型(GMM) 【3】    一文详解高斯混合模型原理

296 评论

相关问答

  • 毕业论文arima模型

    我看过的对ARMIA模型最简单明了的文章: 1,什么是 ARIMA模型 ARIMA模型的全称叫做自回归移动平均模型,全称是(ARIMA, Autoreg

    李大胆yao一起吧 2人参与回答 2024-12-02
  • 毕业论文定量模型

    就是论文的格式大学本科毕业论文格式标准1.引言 1.1制定本标准的目的是为了统一规范我省电大财经类本科毕业论文的格式,保证毕业论文的质量。 1.2毕业论文应采用

    张凉凉2779 2人参与回答 2024-12-02
  • 生成模型毕业论文

    智能三维虚拟试衣模特仿真系统设计* 摘要:针对服装物理仿真通常计算量庞大、在低端硬件平台或交互式环境进行高质量模拟的挑战,将人工生 命思想引入服装纹理生成,基于

    陳詞濫雕 2人参与回答 2024-12-02
  • dea模型做毕业论文

    论述了主要含煤盆地和井字型构造格局的形成,在此基础上进行煤炭地质分区与勘查开发地质条件对比;通过煤炭资源与煤类分布图以及资源量统计论述了煤炭资源空间、数量和煤类

    ai我家小乖 2人参与回答 2024-12-01
  • 毕业论文经济模型

    这个要看不同学校的吧……反正我们学校经济本科毕业论文不需要数据模型,但是需要一些数据来支撑你的论点,作为论据还是需要的。。。

    carryalong 2人参与回答 2024-12-02