<listing id="vjp15"></listing><menuitem id="vjp15"></menuitem><var id="vjp15"></var><cite id="vjp15"></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><menuitem id="vjp15"></menuitem></video></cite>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<menuitem id="vjp15"><strike id="vjp15"></strike></menuitem>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"></strike></var>
<var id="vjp15"></var>
<var id="vjp15"></var>
<var id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></var>
<menuitem id="vjp15"></menuitem><cite id="vjp15"><video id="vjp15"></video></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></cite>
<var id="vjp15"></var>
<var id="vjp15"></var>
<menuitem id="vjp15"><span id="vjp15"><thead id="vjp15"></thead></span></menuitem>
<cite id="vjp15"><video id="vjp15"></video></cite>
<menuitem id="vjp15"></menuitem>

一種快速說話人識別方法

文檔序號:2829049閱讀:433來源:國知局
專利名稱:一種快速說話人識別方法
技術領域
本發明涉及一種說話人識別方法。
背景技術
說話人識別,又稱為聲紋識別,是以語音對說話人進行區分,從而進行身份鑒別和認證的一種生物識別技術。目前基于支持向量的說話人識別方法已成為一種主流的說話人識別方法。對于支持向量機而言,它是一個兩類分類器,當要應用到說話人識別系統中、時,需要完成兩類到多類分類的轉化。兩類支持向量機分類器可以采用兩種方式實現多類分類,一種是一對一的實現方法。這種方式是比較常用的一種多類分類方式。專利CN1787075、專利CN102201237A中采用的支持向量機多類分類器就是采用這種方式實現的。對于一對一的多類分類方式,對于#個類樣本,分別進行兩兩分類,共需要構造叫3/-1)/2個分類器。盡管每個支持向量機分類器只需要兩類樣本訓練就可以得到,樣本
數據量小,但隨著分類類別數的增加,需要構造的兩類支持向量機分類器的數目急劇增加,使得系統的運算量和存儲量大大增加,同時其判決的速度也會較慢。當加入新的類別時,由于在分類的過程中,需要兩兩分類,因此新增加的類別樣本需要與所有的其余類樣本分別再設計#個分類器,當類別數#較大時,需要重新訓練分類器的個數較多,在實際的應用環境中可能導致系統更新速度慢。另一種多類支持向量機分類器的實現采用一對多對的方式。這種方式是支持向量機最早實現多類分類的方式,對于#個類樣本,構造#個分類器。每個分類器以其自己的對應的樣本為正樣本,剩余的所有樣本作為負樣本進行分類器的訓練。盡管一對多的實現方法簡單直觀,需要構造兩類支持向量機數量少,但它將所有其他類的樣本作為負樣本,導致正負樣本不均衡,負的訓練樣本過大,訓練時間較長。尤其是當加入新的類別時,負樣本發生變化,所有支持向量機都需要重新訓練,導致系統的可擴展性不好。

發明內容
本發明提供一種快速說話人識別方法,以解決上述技術存在的缺陷,以高斯混合模型超向量作為說話人的特征參數,設計一種一類分類的支持向量機分類器實現說話人識別。本發明采用的技術方案包括下列步驟
(一)語音信號的預處理包括語音信號的預濾波、端點檢測、預加重,分幀;
(二)特征參數提取的過程如下
(1)提取MFCC特征參數作為說話人的第一特征參數,Yc為IXd維矩陣,/為語音數據經預處理后的幀數,d為特征參數的維數;
(2)利用第一特征參數生成GMM超向量,首先,將第一特征參數Kr劃分為若干個小的矩陣,每個小的矩陣包含50幀語音數據的特征參數,表示為
權利要求
1.一種快速說話人識別方法,其特征在于包括下列步驟 (一)語音信號的預處理包括語音信號的預濾波、端點檢測、預加重,分幀; (ニ)特征參數提取的過程如下 (O提取MFCC特征參數作為說話人的第一特征參數Fe , 1 為/χゴ維矩陣,I為語音數據經預處理后的幀數,名力特征參數的維數; (2)利用第一特征參數生成GMM超向量,首先,將第一特征參數}t劃分為若干個小的矩陣,每個小的矩陣包含50幀語音數據的特征參數,表示為ん = \…Jnum , Jnum為小于或等于+的最大整數;其次,利用χ ..., 依次對UBM模型進行自適應,得到相應的GMM超向量特征參數Z =[ヱ1 ··ゝ』,其中UBM是ー個由與目標說話人無關的大量的語音數據訓練的混合度很高的GMM模型,具體的過程如下 I)UBM模型為
全文摘要
本發明提供一種快速說話人識別方法,屬于說話人識別方法該方法。結合高斯混合模型,以高斯混合模型超向量作為說話人的特征參數。將高斯混合模型超向量作為輸入,設計一種一類分類的支持向量機分類器。對于N個說話人,訓練N個分類器,每個分類器由一個說話人的語音樣本訓練得到。本發明提高了說話人識別的速度。每增加一個注冊說話人,只需要為新的說話人訓練一個一類支持向量機模型,使說話人識別系統有很好的擴展性。
文檔編號G10L15/08GK102664011SQ20121015243
公開日2012年9月12日 申請日期2012年5月17日 優先權日2012年5月17日
發明者姜宏, 孫曉穎, 林琳, 金煥梅, 陳建, 陳虹, 魏曉麗 申請人:吉林大學
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
韩国伦理电影