專利名稱:基于語音端點檢測的人工耳蝸自動增益控制方法和系統的制作方法
技術領域:
本發明涉及電子耳蝸技術領域,特別是指一種基于語音端點檢測的人工耳蝸自動增益控制方法和系統。
背景技術:
人的耳蝸毛細胞是接收聲音的感覺細胞。當耳蝸毛細胞損傷嚴重時,就會出現嚴重的聽力損傷。電子耳蝸就是替代已損傷毛細胞,通過電刺激聽覺神經重新獲得聲音信號的一種電子裝置。
圖1顯示的是電子耳蝸的結構示意圖。電子耳蝸由體外機部件和植入體部件兩部分組成,體外機部件主要包括傳聲器(如麥克風等)、言語處理器和發射線圈,植入體部件主要包括接收線圈、刺激器及多通道電極陣列組成。在系統連接正常的情況下,麥克風接收聲信號,通過言語處理器,將聲信號進行分析處理并編碼,通過頭件(發射線圈)透過皮膚傳送到植入體部件的接收線圈,經過刺激器的解碼處理后,產生相應頻率及電流強度的脈沖信號并傳送到各個刺激電極。通過電極刺激聽神經,將脈沖信號傳到聽覺中樞從而為使用者產生聽覺。對于正常聽力者而言,聲音的響度承受范圍是120dB,而對于人工耳蝸植入者,電刺激的動態范圍僅有5-15 dB左右。設計人工耳蝸言語處理的一個重要指標是輸入聲信號的動態范圍,這決定了將多少動態范圍的聲信號壓縮到5-15dB的電刺激動態范圍上。一般助聽器或人工耳蝸的自動增益系統以前一段時間輸入的聲信號聲強作為調整增益的依據,增益調整的啟動及恢復的時間是自動增益調整的核心參數。在助聽器中,一般認為20ms左右的啟動時間,200ms左右的恢復時間會讓佩戴者最為舒適。而在人工耳蝸中200ms左右的啟動時間,Is左右的恢復時間會讓人工耳蝸植入者較為舒適。但在復雜的聽音環境中,或是人工耳蝸植入者自己大聲說話時,傳統的自動增益系統可能會頻繁的啟動及恢復,會導致人工耳蝸植入者在聽音時感覺聲音忽大忽小。
發明內容
有鑒于此,本發明的目的在于提出一種基于語音端點檢測的人工耳蝸自動增益控制方法和系統,提升了人工耳蝸使用者的聽音能力,改善植入者對聲強輸入波動較大時的言語識別效果。基于上述目的本發明提供的一種基于語音端點檢測的人工耳蝸自動增益控制方法,包括以下步驟:采集外界的聲信號,并將采集的聲信號進行放大處理;其中,放大處理的增益值設置有默認增益和嘈雜環境默認增益;在對初次采集的聲信號進行放大處理時,初始增益值設置成默認增益;將放大后的聲信號轉換成數字信號;計算數字信號的短時能量,然后根據短時能量計算背景噪聲值;讀取當前增益值,若讀取的增益值為默認增益,則設置語音短時能量的高門限,將輸入的短時能量與語音短時能量的高門限進行比較,找出將放大處理時的初始增益值進行調整的語音端點的幀,即增益值調整的開始;若讀取的增益值為嘈雜環境默認增益,則設置語音短時能量的低門限和過零率的高門限,將輸入的短時能量與語音短時能量的低門限進行比較,再通過過零率的判斷,確定語音的間隙,并在語音間隙將放大處理的增益值恢復為初始值;對轉換的數字信號進行分頻處理,并將處理的結果合并為N個通道;對N個通道的每個包絡能量進行聲-電刺激壓縮并輸出。可選地,計算數字信號的短時能量:首先,令輸入的短時語音(通常取一幀20ms)信號為S(n);根據公式:Sw(n)=S(n)*G,得到放大后的語音信號Sw(n);其中,G為當前放大處理時的增益值;然后,根據放大后的語音信號Sw(n)得到短時能量E為:
權利要求
1.一種基于語音端點檢測的人工耳蝸自動增益控制方法,其特征在于,包括以下步驟: 采集外界的聲信號,并將采集的聲信號進行放大處理;其中,放大處理的增益值設置有默認增益和嘈雜環境默認增益;在對初次采集的聲信號進行放大處理時,初始增益值設置成默認增益; 將放大后的聲信號轉換成數字信號; 計算數字信號的短時能量,然后根據短時能量計算背景噪聲值; 讀取當前增益值,若讀取的增益值為默認增益,則設置語音短時能量的高門限,將輸入的短時能量與語音短時能量的高門限進行比較,找出將放大處理時的初始增益值進行調整的語音端點的幀,即增益值調整的開始;若讀取的增益值為嘈雜環境默認增益,則設置語音短時能量的低門限和過零率的高門限,將輸入的短時能量與語音短時能量的低門限進行比較,再通過過零率的判斷,確定語音的間隙,并在語音間隙將放大處理的增益值恢復為初始值; 對轉換的數字信號進行分頻處理,并將處理的結果合并為N個通道JiN個通道的每個包絡能量進行聲-電刺激壓縮并輸出。
2.根據權利要求1所述的方法,其特征在于,計算數字信號的短時能量:首先,令輸入的短時語音(通常取一幀20ms)信號為S(n);根據公式:Sw(n)=S(n)*G,得到放大后的語音信號Sw(n);其中,G為當前放大處理時的增益值; 然后,根據放大后的語音信號Sw(n)得到短時能量E為:
3.根據權利要求2所述的方法,其特征在于,根據短時能量計算背景噪聲值: 首先,分別計算4個連續的20ms短時能量的均值; 然后,對此連續80ms的短時能量進行累加平均:Εn=(Ε1+Ε2+Ε3+Ε4)/4 ;其中,El, E2,E3,E4分別為4個連續20ms短時能量的均值;根據上述方法計算8s左右的時間內,每連續80ms的短時能量的均值,即En(1)至En (100); 最后,在8s左右的時間內,找出短時能量最小值,即為En(I)至En(IOO)之間的最小值,作為聲信號背景噪聲值。
4.根據權利要求3所述的方法,其特征在于,讀取當前增益值,若讀取的增益值為默認增益,則設置語音短時能量的高門限: 當輸入的短時能量小于語音短時能量的高門限時,保持當前增益值; 當輸入的短時能量大于語音短時能量的高門限時,將下次對采集的聲信號進行放大處理時的增益值調整為嘈雜環境默認增益。
5.根據權利要求3所述的方法,其特征在于,若讀取的增益值為嘈雜環境默認增益,則設置語音短時能量的低門限: 當輸入的短時能量大于語音短時能量的低門限時,保持當前增益值; 當輸入的短時能量小于語音短時能量的低門限時,計算當前幀信號的過零率,并且設置過零率高門限: 其中,當所得的過零率大于過零率高門限時,保持當前增益值;其中,當所得的過零率小于過零率高門限時,保持當前增益值;當連續檢測到3幀信號的輸入的短時能量小于語音短時能量的低門限,且同時滿足得到的過零率小于過零率高門限,將放大處理的增益值恢復為初始值默認增益。
6.一種基于語音端點檢測的人工耳蝸自動增益控制系統,其特征在于,包括: 聲信號采集單元,用于采集外界的聲信號; 聲信號放大單元,與聲信號采集單元相連,用于將采集的聲信號進行放大處理;其中,放大處理的增益值設置有默認增益和嘈雜環境默認增益;在對初次采集的聲信號進行放大處理時,初始增益值設置成默認增益; 轉換單元,與聲信號放大單元相連,用于將放大后的聲信號轉換成數字信號; 短時能量和背景噪聲值獲取單元,與轉換單元相連,用于計算數字信號的短時能量,然后根據短時能量計算背景噪聲值; 增益狀態讀取單元,與短時能量和背景噪聲值獲取單元相連,用于讀取當前聲信號放大單元的增益值;若增益值為默認增益,則增益狀態讀取單元與增益狀態I處理單元相連;若增益值為嘈雜環境默認增,則增益狀態讀取單元與增益狀態2處理單元相連; 增益狀態I處理單元,用于設置語音短時能量的高門限,將輸入的短時能量與語音短時能量的高門限進行比較,找出將放大處理時的初始增益值進行調整的語音端點的幀,即增益值調整的開始; 增益狀態2處理單元,用于設置語音短時能量的低門限和過零率的高門限,將輸入的短時能量與語音短時能量的低門限進行比較,再通過過零率的判斷,確定即語音的間隙,并在語音間隙將放大處理的增益值恢復為初始值; 分頻和合并通道處理單元,用于對轉換的數字信號進行分頻處理,并將處理的結果合并為N個通道; 聲-電刺激壓縮單元,與聲-電刺激壓縮單元相連,用于對N個通道的每個包絡能量進行聲-電刺激壓縮并輸出。
7.根據權利要求6所述的系統,其特征在于,所述的短時能量和背景噪聲值獲取單元在計算數字信號的短時能量時,首先,令輸入的短時語音(通常取一幀20ms)信號為S(n);根據公式:Sw(n)=S(n)*G,得到放大后的語音信號Sw(η);其中,G為當前放大處理時的增益值; 然后,根據放大后的語音信號Sw(η)得到短時能量E為:
8.根據權利要求7所述的系統,其特征在于,所述的短時能量和背景噪聲值獲取單元在根據短時能量計算背景噪聲值時,首先,分別計算4個連續的20ms短時能量的均值; 然后,對此連續80ms的短時能量進行累加平均:Εη=(Ε1+Ε2+Ε3+Ε4)/4 ;其中,El, E2,E3,E4分別為4個連續20ms短時能量的均值;根據上述方法計算8s左右的時間內,每連續80ms的短時能量的均值,即En(I)至En (100); 最后,在8s左右的時間內,找出短時能量最小值,即為En(I)至En(IOO)之間的最小值,作為聲信號背景噪聲值。
9.根據權利要求8所述的系統,其特征在于,所述的增益狀態I處理單元設置語音短時能量的高門限,當輸入的短時能量小于語音短時能量的高門限時,保持當前增益值;當輸入的短時能量大于語音短時能量的高門限時,將下次對采集的聲信號進行放大處理時的增益值調整為嘈雜環境默認增益。
10.根據權利要求8所述的系統,其特征在于,所述的增益狀態2處理單元設置語音短時能量的低門限: 當輸入的短時能量大于語音短時能量的低門限時,保持當前增益值; 當輸入的短時能量小于語音短時能量的低門限時,計算當前幀信號的過零率,并且設置過零率高門限: 其中,當所得的過零率大于過零率高門限時,保持當前增益值; 其中,當所得的過零率小于過零率高門限時,保持當前增益值;當連續檢測到3幀信號的輸入的短時能量小于語音短時能量的低門限,且同時滿足得到的過零率小于過零率高門限,將放大處理的增益值恢復為初始值默認增益。
全文摘要
本發明公開了一種基于語音端點檢測的人工耳蝸自動增益控制方法和系統,包括以下步驟將采集的聲信號進行放大處理;放大的聲信號轉換成數字信號;計算數字信號的短時能量,根據短時能量計算背景噪聲值;讀取當前增益值,若增益值為默認增益,設置語音短時能量的高門限,將輸入的短時能量與語音短時能量的高門限進行比較,找出增益值調整的開始;若增益值為嘈雜環境默認增益,則設置語音短時能量的低門限,將輸入的短時能量與語音短時能量的低門限進行比較,找出語音間隙;對轉換的數字信號分頻處理,并合并為N個通道;進行聲-電刺激壓縮并輸出。通過本發明提升了人工耳蝸使用者的聽音能力,改善植入者對聲強輸入波動較大時的言語識別效果。
文檔編號A61F2/18GK103190965SQ201310062108
公開日2013年7月10日 申請日期2013年2月28日 優先權日2013年2月28日
發明者平利川, 陳洪斌, 唐國芳, 王松 申請人:杭州諾爾康神經電子科技有限公司