发布网友 发布时间:2022-05-09 17:44
共1个回答
热心网友 时间:2023-10-11 02:34
60年代由日本学者提出,算法的思想是把未知量伸长或缩短(压扩),直到与参考模板的长度一致,在这一过程中,未知单词的时间轴会产生扭曲或弯折,以便其特征量与标准模式对应。 DTW 是把时间规整和距离测度计算结合起来。测试语音参数共有I帧矢量,而参考模板共有J帧矢量,I和J不等,寻找一个时间规整函数j=w(i),它将测试矢量的时间轴i非线性地映射到模板的时间轴j上,并使该函数w(i)满足: 第i帧测试矢量T(i)和第j帧模板矢量R(j)之间的距离测度D
最优时间规整情况下所有矢量帧间的距离,也称为代价函数计算两倒谱矢量帧(i和j) 间的欧氏距离,两矢量帧中分别具有p个倒谱参数。
为了使T(测试)的第i个样本与R(参考)的第j个样本对正,其对应的点不在直线对角线上,得到一条弯曲的曲线j=w(i) 。j=w(i)称为规整函数。 设 T={a1 , a2 , …… , ai , …… , aI} i=1~I
R={b1 , b2 , …… , bj , …… , bJ} j=1~J
I≠J
时间规整要解决的问题是使元素a和元素b之间匹配,使每对匹配样本之间的差别最小,达到欧氏距离最小。