一種噪聲功率估計方法
【專利摘要】本發明公開了一種噪聲功率估計方法,該方法首先對輸入帶噪語音進行采樣得到輸入帶噪語音信號樣點,并按時間順序對樣點進行分幀,并得到一系列分析幀。隨后根據當前分析幀中的帶噪語音信號樣點計算得到當前分析幀的最大歸一化自相關值、當前分析幀中各頻點的帶噪語音功率和后驗信噪比,并計算當前分析幀中各頻點的語音存在概率。最后根據前一分析幀中各頻點的噪聲功率估計值、當前分析幀中各頻點的帶噪語音功率和語音存在概率計算得到當前分析幀中各頻點的噪聲功率估計值。本發明運算簡單,占用存儲資源小,能夠快速估計各種噪聲的功率。
【專利說明】一種噪聲功率估計方法
【技術領域】
[0001]本發明涉及噪聲抑制【技術領域】,具體地說,涉及一種噪聲功率估計方法。
【背景技術】
[0002]語音在通信過程中往往會受到各種各樣噪聲的干擾,例如環境噪聲、線路噪聲等。噪聲的存在不僅會影響通信質量,而且會嚴重干擾低速率語音編碼中參數的提取,降低合成語音質量。對于語音識別領域,噪聲的存在會大大降低識別的準確率,使得語音識別在實用化過程中難以取得令人滿意的結果。由此可見,噪聲抑制對語音通信、語音編碼、語音識別等領域有著重大的影響和深遠的意義。目前的噪聲抑制算法,雖然能夠對噪聲由一定的抑制作用,但往往對語音的損傷也比較厲害,大大降低語音的可懂度。
[0003]對于噪聲抑制,噪聲功率估計是其中最重要的組成部分之一。基于最優平滑和最小統計的噪聲估計,憑借著良好的性能得到了廣泛的使用。基于最優平滑和最小統計量的噪聲功率估計方法,具有良好的魯棒性和優越的性能,能夠準確估計平穩噪聲的功率。然而,該方法主要基于后驗信噪比進行噪聲功率估計,對于非平穩噪聲跟蹤較慢,往往需要
0.5s?1.5s的延時。同時,該方法需要保存過去多個幀中各頻點的噪聲功率,需要復雜的運算過程和較大的存儲資源。
[0004]基于上述情況,亟需一種能夠快速跟蹤平穩噪聲與非平穩噪聲,并對其噪聲功率進行估計方法。
【發明內容】
[0005]為解決上述問題,本發明提供了一種噪聲功率估計方法,該方法包括以下步驟:
[0006]帶噪語音分幀步驟,對輸入帶噪語音按照一預設的采樣頻率進行采樣得到輸入帶噪語音信號樣點,并按時間順序對所述樣點進行分幀,并得到一系列分析幀;
[0007]最大歸一化自相關值計算步驟,根據當前分析幀中的帶噪語音信號樣點計算得到當前分析幀的最大歸一化自相關值;
[0008]后驗信噪比計算步驟,根據當前分析幀中的帶噪語音信號樣點分別計算得到當前分析幀中各頻點的帶噪語音功率和后驗信噪比;
[0009]各頻點語音存在概率計算步驟,根據所述當前分析幀的最大歸一化自相關值和當前分析幀中各頻點的后驗信噪比計算所述當前分析幀中各頻點的語音存在概率;
[0010]各頻點噪聲功率估計值計算步驟,根據前一分析幀中各頻點的噪聲功率估計值、所述當前分析幀中各頻點的帶噪語音功率和當前分析幀中各頻點的語音存在概率計算得到所述當前分析幀中各頻點的噪聲功率估計值。
[0011]根據本發明的一個實施例,所述當前分析幀的帶噪語音信號樣點包括前一幀的部分帶噪語音信號樣點和當前幀的全部帶噪語音信號樣點。
[0012]根據本發明的一個實施例,所述最大歸一化自相關值計算步驟包括下列步驟:
[0013]S202a、利用一預設截止頻率的帶通濾波器對所述當前分析幀中的帶噪語音信號樣點進行濾波得到帶通語音信號樣點,記為當前分析幀的信號樣點;
[0014]S202b、根據所述當前分析幀的信號樣點計算當前分析幀能量和相關值;
[0015]S202c、根據所述當前分析幀能量和相關值計算所述當前分析幀的最大歸一化自相關值。
[0016]根據本發明的一個實施例,根據下列公式計算所述當前分析幀的相關值:
【權利要求】
1.一種噪聲功率估計方法,其特征在于,所述方法包括以下步驟: 帶噪語音分幀步驟,對輸入帶噪語音按照一預設的采樣頻率進行采樣得到輸入帶噪語音信號樣點,并按時間順序對所述樣點進行分幀,并得到一系列分析幀; 最大歸一化自相關值計算步驟,根據當前分析幀中的帶噪語音信號樣點計算得到當前分析幀的最大歸一化自相關值; 后驗信噪比計算步驟,根據所述當前分析幀中的帶噪語音信號樣點分別計算得到當前分析幀中各頻點的帶噪語音功率和后驗信噪比; 各頻點語音存在概率計算步驟,根據所述當前分析幀的最大歸一化自相關值和當前分析幀中各頻點的后驗信噪比計算所述當前分析幀中各頻點的語音存在概率; 各頻點噪聲功率估計值計算步驟,根據前一分析幀中各頻點的噪聲功率估計值、所述當前分析幀中各頻點的帶噪語音功率和當前分析幀中各頻點的語音存在概率計算得到所述當前分析幀中各頻點的噪聲功率估計值。
2.如權利要求1所述的方法,其特征在于,所述當前分析幀的帶噪語音信號樣點包括前一幀的部分帶噪語音信號樣點和當前幀的全部帶噪語音信號樣點。
3.如權利要求1所述的方法,其特征在于,所述最大歸一化自相關值計算步驟包括下列步驟: S202a、利用一預設截止頻率的帶通濾波器對所述當前分析幀中的帶噪語音信號樣點進行濾波得到帶通語音信號樣點,記為當前分析幀的信號樣點; S202b、根據所述當前分析幀的信號樣點計算當前分析幀能量和相關值; S202c、根據所述當前分析幀能量和相關值計算所述當前分析幀的最大歸一化自相關值。
4.如權利要求3所述的方法,其特征在于,根據下列公式計算所述當前分析幀的相關值:
其中,X(n, i)表示第η分析幀中的第i個信號樣點,x(n, i+ τ )表示第η分析幀中的第i+τ個信號樣點,τ表示在基音周期內進行取值的信號樣點的偏移量,I表示當前分析中貞中的信號樣點總數,r (η, τ )表不偏移量為τ時第η分析幀的相關值。
5.如權利要求1所述的方法,其特征在于,所述后驗信噪比計算步驟包括下列步驟: S203a、對當前分析幀的信號樣點進行離散傅里葉變換得到所述當前分析幀中各頻點的帶噪語音功率; S203b、根據所述當前分析幀中各頻點的帶噪語音功率和前一分析幀中對應的各頻點的噪聲功率估計值計算當前分析幀中各頻點的后驗信噪比。
6.如權利要求1所述的方法,其特征在于,根據下列公式計算當前分析幀中各頻點的語音存在概率:<img/其中,P (n,k)表示第η分析幀中的第k個頻點的語音存在概率,以~幻表示第η分析幀中的第k個頻點的后驗信噪比,α為常數,ε 1、ε 2、ε 3表示加權系數,exp表示求指數,rl、r2表示門限值。
7.如權利要求1所述的方法,其特征在于,所述各頻點噪聲功率估計值計算步驟包括下列步驟: S205a、根據所述當前分析幀中各頻點的帶噪語音功率、所述當前分析幀中各頻點的語音存在概率和前一分析幀中對應的各頻點的噪聲功率估計值計算當前分析幀的噪聲功率更新值; S205b、根據所述當前分析幀中各頻點的噪聲功率更新值和前一分析幀中對應的各頻點的噪聲功率估計值加權得到所述當前分析幀中各頻點的噪聲功率估計值。
8.如權利要求7所述的方法,其特征在于,根據下列公式計算所述當前分析幀中各頻點的噪聲功率更新值:
U (n, k) = P (n, k) XD (n-1, k) + [1-p (n, k) ] X Y (n, k) k = Ο, I,..., K-1 其中,U(n,k)表示第η分析幀中的第k個頻點的噪聲功率更新值,ρ (η, k)表示第η分析幀中的第k個頻點的語音存在概率,D (n-1,k)表示第n-Ι分析幀中的第k個頻點的噪聲功率估計值,Y(n, k)表示第η分析幀中的第k個頻點的帶噪語音功率,K表示第η分析幀中的頻點總數。
9.如權利要求7所述的方法,其特征在于,根據下列公式計算所述當前分析幀中各頻點的噪聲功率估計值:
D(n, k) = β XD(n-1 , k) + (1-β ) XU(n, k)k = O, I,..., K-1 其中,D (η, k)表示第η分析幀中的第k個頻點的噪聲功率估計值,U (n, k)表示第η分析幀中的第k個頻點的噪聲功率更新值,β表示一預設加權系數。
10.如權利要求1所述的方法,其特征在于,所述方法還包括更新所述當前分析幀中各頻點的后驗信噪比和先驗信噪比并計算最終增益系數步驟。
【文檔編號】G10L21/0216GK103646648SQ201310585440
【公開日】2014年3月19日 申請日期:2013年11月19日 優先權日:2013年11月19日
【發明者】徐敬德, 崔慧娟, 唐昆, 許科 申請人:清華大學, 信瑞遞(北京)科技有限公司