專利名稱:一種遠程音頻交互的多路聲學回音消除方法及系統的制作方法
技術領域:
本發明涉及語音通信技術領域,尤其涉及ー種遠程音頻交互的多路聲學回音消除方法及系統。
背景技術:
目前遠程音頻互換的多種應用領域,包括數字視頻會議,電話會議,手持終端等,其中的聲學回音消除系統,其多數為單路音頻回音處理,不能進行多路聲學同時處理。一般處理多路回音消除吋,需采用分布式消除方式,即每路音頻信號源端都放置一個回音消除 器,這樣給用戶成本和施工成本帶來了很大的提高。并且,其回音消除的時間也不能有限的提高到500ms,回音消除能力很難大于IOOdB以上,對回音消除的音質不能得到有效保證。而實際中對于超大型會議音頻應用領域需要以上三種技術參數全部能達到要求,才能滿足高質量的語音通信。
發明內容
本發明實施例提供ー種遠程音頻交互的多路聲學回音消除方法及系統,以較低成本消除多路聲學回音,并提供高質量的語音通信。一方面,本發明實施例提供了ー種遠程音頻交互的多路聲學回音消除方法,所述方法包括獲取輸入的多路音源聲學信號;對輸入的所述多路音源聲學信號進行聲學分離處理;分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理;將進行聲學回音消除處理后的每一路聲學信號進行組合并進行聲學合成;將進行聲學合成后的聲學信號進行輸出。優選的,在本發明ー實施例中,所述獲取輸入的多路音源聲學信號可以包括對輸入的多路音源聲學信號進行濾波處理;將進行濾波處理后的音頻信號進行音頻模數轉換;獲取進行音頻模數轉換后的多路音源聲學信號。優選的,在本發明ー實施例中,所述對輸入的所述多路音源聲學信號進行聲學分離處理可以包括根據聲學的頻率對輸入的所述多路音源聲學信號進行聲學分離處理。優選的,在本發明ー實施例中,所述根據聲學的頻率對輸入的所述多路音源聲學信號進行聲學分離處理可以包括根據聲學的頻率對輸入的所述多路音源聲學信號進行ー次聲學分離處理,然后根據預定時間內聲學音頻大小進行二次分離處理,井根據預定時間內聲學間斷進行三次分離處理。優選的,在本發明ー實施例中,所述分別對進行聲學分離處理后的姆一路聲學信號通過自適應濾波器進行聲學回音消除處理可以包括分別對進行聲學分離處理后的每ー路聲學信號通過自適應濾波器模擬實際環境中的回音路徑以預測回音信號,并從實際信號中減去預測到的回音信號,以進行聲學回音消除處理。優選的,在本發明ー實施例中,所述分別對進行聲學分離處理后的姆一路聲學信號通過自適應濾波器進行聲學回音消除處理可以包括在對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理過程中,利用雙向通話檢測器檢測是否有話音信號加入,當檢測到有話音信號時,暫時凍結所述自適應濾波器對其參數的更新處理行為。優選的,在本發明ー實施例中,所述分別對進行聲學分離處理后的姆一路聲學信號通過自適應濾波器進行聲學回音消除處理后,還可以包括分別通過非線性處理器模塊,利用非線性控制算法對進行聲學回音消除處理后的每一路聲學信號進行潤色處理。
優選的,在本發明一實施例中,所述將進行聲學合成后的聲學信號進行輸出可以包括將進行聲學合成后的聲學信號進行音頻數模轉換;對進行音頻數模轉換后的聲學信號進行濾波處理;將進行濾波處理后的聲學信號進行輸出。另ー方面,本發明實施例提供了ー種遠程音頻交互的多路聲學回音消除系統,所述系統包括DSP數字處理器模塊,用于獲取輸入的多路音源聲學信號;多路聲學分離合成器,用于對輸入的所述多路音源聲學信號進行聲學分離處理;自適應濾波器模塊,用于分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理;所述多路聲學分離合成器,還用于將進行聲學回音消除處理后的每一路聲學信號進行組合并進行聲學合成;所述DSP數字處理器模塊,還用于將進行聲學合成后的聲學信號進行輸出。優選的,在本發明一實施例中,所述系統還可以包括本地聲學輸入模塊,用于對輸入的多路音源聲學信號進行濾波處理;遠程聲學輸入模塊,用于對輸入的多路音源聲學信號進行濾波處理;音頻模數/數模轉換模塊,用于將進行濾波處理后的音頻信號進行音頻模數轉換;所述DSP數字處理器模塊,用于獲取進行音頻模數轉換后的多路音源聲學信號。優選的,在本發明ー實施例中,所述多路聲學分離合成器,進ー步可以用于根據聲學的頻率對輸入的所述多路音源聲學信號進行聲學分離處理。優選的,在本發明ー實施例中,所述多路聲學分離合成器,進ー步可以具體用于根據聲學的頻率對輸入的所述多路音源聲學信號進行一次聲學分離處理,然后根據預定時間內聲學音頻大小進行二次分離處理,井根據預定時間內聲學間斷進行三次分離處理。優選的,在本發明ー實施例中,所述自適應濾波器模塊,進一歩可以用于分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器模擬實際環境中的回音路徑以預測回音信號,并從實際信號中減去預測到的回音信號,以進行聲學回音消除處理。優選的,在本發明ー實施例中,所述系統還可以包括雙向通話檢測器模塊,用于所述自適應濾波器模塊在對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理過程中,利用雙向通話檢測器檢測是否有來自遠程聲學輸入模塊的話音信號加入,當檢測到有話音信號時,暫時凍結所述自適應濾波器對其參數的更新處理行為。優選的,在本發明ー實施例中,所述系統還可以包括非線性處理器模塊,用于所述自適應濾波器模塊分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理后,分別通過非線性處理器模塊,利用非線性控制算法對進行聲學回音消除處理后的每一路聲學信號進行潤色處理。優選的,在本發明ー實施例中,所述系統還可以包括所述音頻模數/數模轉換模塊,還用于將進行聲學合成后的聲學信號進行音頻數模轉換;本地聲學輸出模塊,用于對進行音頻數模轉換后的聲學信號進行濾波處理;然后將進行濾波處理后的聲學信號進行輸出;遠程聲學輸出模塊,用于對進行音頻數模轉換后的聲學信號進行濾波處理;然后將進行濾波處理后的聲學信號進行輸出。上述技術方案具有如下有益效果因為采用獲取輸入的多路音源聲學信號;對輸入的所述多路音源聲學信號進行聲學分離處理;分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理;將進行聲學回音消除處理后的每一路聲學信號進行組合并進行聲學合成;將進行聲學合成后的聲學信號進行輸出的技術手段,所以以較低成本消除了多路聲學回音,并提供了高質量的語音通信。本發明實施例可應用于各種復雜遠程音雙向語音交互領域中,能將回音處理拖尾時間提高到500ms,聲學帶寬范圍為20HZ至20KHZ,回音消除能力提高到大于100dB。
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。圖I為本發明實施例ー種遠程音頻交互的多路聲學回音消除方法流程圖;圖2為本發明實施例ー種遠程音頻交互的多路聲學回音消除系統結構示意圖;圖3為本發明應用實例遠程音頻交互的多路聲學回音消除系統結構示意圖;圖4為本發明應用實例DSP與SDRAM的連接原理示意圖;圖5為本發明應用實例聲學回音消除基本原理示意圖;圖6為本發明應用實例自適應濾波器作用示意圖;圖7為本發明應用實例FIR自適應濾波器基本結構示意圖;圖8為本發明應用實例雙向通話檢測器系統意圖;圖9為本發明應用實例聲學輸入濾波器電路示意圖;圖10為本發明應用實例聲學輸出模塊電路示意圖;圖11為本發明應用實例圖3中的各個模塊工作的推進流程圖;圖12為本發明應用實例圖3中的DSP數字處理器處理流程圖。
具體實施例方式下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。本發明實施例要解決的技術問題是實現多路聲學回音消除處理,回音消除時間提升到500ms,回音消除能力大于IOOdB。如圖I所示,為本發明實施例ー種遠程音頻交互的多路聲學回音消除方法流程圖,所述方法包括 101、獲取輸入的多路音源聲學信號;
優選的,所述獲取輸入的多路音源聲學信號可以包括對輸入的多路音源聲學信號進行濾波處理;將進行濾波處理后的音頻信號進行音頻模數轉換;獲取進行音頻模數轉換后的多路音源聲學信號。102、對輸入的所述多路音源聲學信號進行聲學分離處理;優選的,所述對輸入的所述多路音源聲學信號進行聲學分離處理可以包括根據聲學的頻率對輸入的所述多路音源聲學信號進行聲學分離處理。優選的,所述根據聲學的頻率對輸入的所述多路音源聲學信號進行聲學分離處理可以包括根據聲學的頻率對輸入的所述多路音源聲學信號進行一次聲學分離處理,然后根據預定時間內聲學音頻大小進行二次分離處理,井根據預定時間內聲學間斷進行三次分離處理。103、分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理;優選的,所述分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進 行聲學回音消除處理可以包括分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器模擬實際環境中的回音路徑以預測回音信號,并從實際信號中減去預測到的回音信號,以進行聲學回音消除處理。優選的,所述分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理可以包括在對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理過程中,利用雙向通話檢測器檢測是否有話音信號加入,當檢測到有話音信號時,暫時凍結所述自適應濾波器對其參數的更新處理行為。優選的,所述分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理后,還可以包括分別通過非線性處理器模塊,利用非線性控制算法對進行聲學回音消除處理后的每一路聲學信號進行潤色處理。104、將進行聲學回音消除處理后的每一路聲學信號進行組合并進行聲學合成;105、將進行聲學合成后的聲學信號進行輸出。優選的,所述將進行聲學合成后的聲學信號進行輸出可以包括將進行聲學合成后的聲學信號進行音頻數模轉換;對進行音頻數模轉換后的聲學信號進行濾波處理;將進行濾波處理后的聲學信號進行輸出。本發明實施例上述方法技術方案具有如下有益效果因為采用獲取輸入的多路音源聲學信號;對輸入的所述多路音源聲學信號進行聲學分離處理;分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理;將進行聲學回音消除處理后的每一路聲學信號進行組合并進行聲學合成;將進行聲學合成后的聲學信號進行輸出的技術手段,所以以較低成本消除了多路聲學回音,并提供了高質量的語音通信。本發明實施例可應用于各種復雜遠程音雙向語音交互領域中,能將回音處理拖尾時間提高到500ms,聲學帶寬范圍為20HZ至20KHZ,回音消除能力提高到大于100dB。對應于上述方法實施例,如圖2所示,為本發明實施例ー種遠程音頻交互的多路聲學回音消除系統結構示意圖,所述系統包括DSP數字處理器模塊21,用于獲取輸入的多路音源聲學信號;多路聲學分離合成器22,用于對輸入的所述多路音源聲學信號進行聲學分離處理;
自適應濾波器模塊23,用于分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理;所述多路聲學分離合成器22,還用于將進行聲學回音消除處理后的每一路聲學信號進行組合并進行聲學合成;所述DSP數字處理器模塊21,還用于將進行聲學合成后的聲學信號進行輸出。如圖3所示,為本發明應用實例遠程音頻交互的多路聲學回音消除系統結構示意圖,本發明應用實例依據硬件平臺模塊和硬件平臺上算法模塊接合完成,主要包括DSP數字處理器模塊,音頻AD/DA (模數/數模)轉換模塊,多路聲學分離合成器,雙向通話檢測器模塊,非線性處理器模塊,自適應濾波器模塊,本地聲學輸入模塊,遠程聲學輸入模塊,本地 聲學輸出模塊,遠程學輸出模塊;其中,圖3中的AD轉換模塊和DA轉換模塊都可以通過一音頻AD/DA轉換模塊實現,可通過ー多路聲學分離合成器完成多路聲學分離和多路聲學合成操作。優選的,本地聲學輸入模塊,用于對輸入的多路音源聲學信號進行濾波處理;遠程聲學輸入模塊,用于對輸入的多路音源聲學信號進行濾波處理;音頻模數/數模轉換模塊,用于將進行濾波處理后的音頻信號進行音頻模數轉換;所述DSP數字處理器模塊,用于獲取進行音頻模數轉換后的多路音源聲學信號。優選的,所述多路聲學分離合成器,進ー步可以用于根據聲學的頻率對輸入的所述多路音源聲學信號進行聲學分離處理。優選的,所述多路聲學分離合成器,進ー步可以具體用于根據聲學的頻率對輸入的所述多路音源聲學信號進行一次聲學分離處理,然后根據預定時間內聲學音頻大小進行二次分離處理,井根據預定時間內聲學間斷進行三次分離處理。優選的,所述自適應濾波器模塊,進一歩可以用于分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器模擬實際環境中的回音路徑以預測回音信號,并從實際信號中減去預測到的回音信號,以進行聲學回音消除處理。優選的,雙向通話檢測器模塊,用于所述自適應濾波器模塊在對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理過程中,利用雙向通話檢測器檢測是否有來自遠程聲學輸入模塊的話音信號加入,當檢測到有話音信號吋,暫時凍結所述自適應濾波器對其參數的更新處理行為。優選的,非線性處理器模塊,用于所述自適應濾波器模塊分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理后,分別通過非線性處理器模塊,利用非線性控制算法對進行聲學回音消除處理后的每一路聲學信號進行潤色處理。優選的,所述音頻模數/數模轉換模塊,還用于將進行聲學合成后的聲學信號進行音頻數模轉換;本地聲學輸出模塊,用于對進行音頻數模轉換后的聲學信號進行濾波處理;然后將進行濾波處理后的聲學信號進行輸出;遠程聲學輸出模塊,用于對進行音頻數模轉換后的聲學信號進行濾波處理;然后將進行濾波處理后的聲學信號進行輸出。以下進行詳細說明DSP數字處理器模塊是32位的高速處理器,內存使用SDRAM 512M,以提高數量交換量。在DSP數字處理器模塊上將設計雙向通話檢測器算法模塊,自適濾波器算法模塊和非線性處理器算法模塊。本發明實施例對DSP數字處理器模塊的選型需要考慮運算速度、成本、硬件資源以及算法的可移植性等多個問題。由于算法的浮點特性,本發明應用實例可采用了美國德州儀器(TI)的浮點DSP作為核心處理器來完成系統的設計,具有32位的外部存儲器接ロ。與SDRAM等無縫連接,可以尋址512MB。圖4為本發明應用實例DSP與SDRAM的連接原理示意圖。多路聲學分離合成器,為解決多路回音消除,本發明需先進行解決多路的問題,在多路聲學輸入端一般會有多路的原始音源和多路的回聲音源混合在一起。而進行回音處理時必須以一路為主體完成回音消除,從而就必須解決將多路分離出來,再進行單路的回音消除處理,處理后再進行聲學組合合成。在合成時將進一歩完成回音消除后的本地端聲學輸出和遠程端聲學輸出,以達 到最終多路回音消除的目的。本聲學分離器工作原理就是將多路聲學分離開,在其分離的過程中,先必須完成AD轉換,并送入DSP數字處理器模塊。分離的原則最先以聲學的頻率為分離參數,第個人講話的頻率一定不相同,就算相同也一定不會同時,這里的同時指ns級時間。根據此原理,本發明先進行頻率分離。將不同頻率的聲學進行一次分離。同時本發明為確保分離的正確性,根據一定時間內聲學音頻大小不同進行二次分離,根據一段時間內聲學間斷進行三次分離。二次,三次分離都是一次分離的輔助分離。同時,將回音消除后的與消除之前的進行對比,以驗證經三次分離后的正確性。最后,經過分離的多路聲學分別送到對應的下一處理單元模塊中進行回音消除。每一路分別進行單路的回音消除處理后再進行聲學組合合成。在合成時將進一歩完成回音消除后的本地端聲學輸出和遠程端聲學輸出,以達到最終多路回音消除的目的。如圖5所示,為本發明應用實例聲學回音消除基本原理示意圖。根據聲學回音消除的基本原理,本發明應用實例可先構建ー個模型來模擬實際環境中的回音路徑。依靠此模型準確地仿真回音路徑,它的輸出結果就是對實際回音信號的預測。從實際信號中減去預測到的回音信號,就消除了回音。本發明應用實例解決聲學回音消除技術的方法就是用一個自適應濾波器(Adaptive Filter)來模擬回音路徑。而自適應濾波器是本發明的回音消除核心技術。在圖5中,H(X)可以看作是ー個函數,由實際環境所決定。這個函數的輸入是音源信號X,輸出是帶有回音的混合信號y。自適應濾波器同樣也是ー個函數及(X),它需要盡可能地接近H(X),在輸入相同時,應產生差不多相同的輸出。所謂“自適應”,是指函數的參數是可調的,它會不斷地自我調整,使得當實際環境發生變化,H(x)發生改變時,片(X)總能夠保持對H(X)的模擬。如圖6所示,為本發明應用實例自適應濾波器作用示意圖。自適應濾波器的原理很簡單。比如常用的離散時間抽頭有限脈沖響應(FIR-Finite Impulse Response)濾波器,采用過去一段時間信號的線性組合來表示未來的輸出信號預測值
N-Iy(n) = ^ W1 (n)x(n - i)
i=0在上式中,n代表預測信號出現的時刻,N是自適應濾波器的階次,W(l,…,
個可調參數。i指可調參數調整后的次數記錄,這樣的濾波器結構示意圖如圖7所示,其為本發明應用實例FIR自適應濾波器基本結構示意圖。圖7中,z—1代表滯后一歩的意思。濾波器的具體結構取決于N個可調參數Wtl,…,的取值。自適應濾波器能實時動態地改變這些參數的值,這些值常表示成濾波器的參數向量W (n) = [w0 (n) W1 (n) W2 (n)…Wh (n) ]T其中n代表離散時刻。如何調整這些參數的值由誤差e(n)所決定。當預測信號和實際信號相同吋,e(n) =0,說明濾波器已經能夠很好地模擬實際回音通路,所以不需要更新%,…,Wim的取值。當環境發生變化,回音通路改變時,或者回音消除系統剛開始運行吋,自適應濾波器就需要ー個適應過程,以調整參數向量W(n)直至合適。各種不同的自適應濾波算法的主要區別就是如何更新參數向量W(n)的方式不同。其中最基本的自適應濾波器的算法是LMS (Least Mean Square,最小均方差)算法。此方法的最大特點是計算復雜度低,且在平穩信號情況下具有可靠的收斂性。就是說,理論上已經證明,當原始信號為平穩隨機信號時,基于LMS算法的自適應濾波器經過一段時間的運行后,其輸出量能夠漸近跟蹤實際信號,誤差e(n)將趨于零。LMS是最佳算法,平均回音衰減接近30dB,而計算復雜度卻很低,可在DSP上編程 實現。雙向通話檢測器模塊如果在回音消除的過程中突然出現話音信號,自適應濾波器的工作會受到新加入的話音信號的干擾,導致參數不正常地調整,嚴重的話會造成濾波器發散,輸出信號混亂。所以需要雙向通話檢測器,檢測是否有話音信號加入,當檢測到有話音信號吋,就暫時凍結自適應濾波器對其參數的更新處理行為。如圖8所示,為本發明應用實例雙向通話檢測器系統示意圖。在本發明應用實例過程中對回音消除的過程中突然出現近端話音信號,自適應濾波器的工作會將受到新加入的近端話音信號的干擾,導致參數向量W(n)不正常地調整,嚴重的話會造成濾波器發散,就是W(n)波動很大,輸出信號混亂。為解決此問題,本發明如圖8設計了雙向通話檢測器,用于檢測是否有近端話音信號加入。當檢測到有近端話音信號時,就暫時凍結自適應濾波器對參數向量W(n)的更新行為。這樣能使本發明完美解決濾波發散而引起的信號干擾問題。非線性處理器模塊此模塊主要對最終的輸出信號進行潤色處理,如消除噪音雜波,消除殘余回音,添加背景效果等。以保證能輸出高保真,高品質的音頻信號。本發明應用實例中,在近端信號通道上加入了一個非線性處理器,就能采用非線性控制算法,就突發的環境變化做出調整,如背景中的關門聲或用戶拿電話的手突然做出什么手勢或動作等。由于在主控制器下同時優化了不同控制算法,從而進一歩以降低回音和噪聲,提高了音質。音頻AD/DA (模數/數模)轉換模塊,此模塊主要將輸入的模擬音頻信號轉換成數字音頻信號,采用16位的AD/DC轉換模塊,可保證音頻最大不失真轉換。本發明應用實例可選用的TI公司生產的ー款高性能的多媒體數字語音編解碼器,它的內部ADC和DAC轉換模塊帶有完整的數字濾波器,其數據傳輸寬度可以是16位、20位、24位和32位,采樣頻率范圍為8 96kHz,并可通過控制接ロ來編輯該器件的控制寄存器,同時可支持SPI (SerialPeripheral Interface,串行外設接 ロ)和 H (Inter-Integrated Circuit,兩線式串行總線)兩種控制模式。本發明應用實例選用I2C模式。當系統進行初始化配置吋,DSP通過I2C總線將配置命令發送到音頻AD/DA (模數/數模)轉換芯片,并在配置完成后開始エ作。輸入語音信號時,音頻AD/DA (模數/數摸)轉換芯片先通過其中的AD轉換采集輸入的語音信號,每采集完ー個信號便將數據發送到DSP的數字接口上,以便DSP可以讀取語音數據。每個數據均為16位無符號整數,左右通道各有ー個數值。語音信號輸出時,可由DSP將語音數據通過McBSP (Multichannel Buffered Serial Port,多通道緩沖串行ロ)接ロ發送給音頻AD/DA (模數/數模)轉換芯片,再由音頻AD/DA (模數/數模)轉換芯片的DA器件將他們變成模擬信號輸出。本地聲學輸入模塊此模塊主要包括本地端輸入音頻濾波電路對本地端聲學音源進行濾波處理。并將處理后的音頻信號送入音頻AD/DA轉換模塊。如圖9所示,為本發明應用實例聲學輸入濾波器電路示意圖,本模塊在發明應用實例時,主要由模擬音頻濾波電路與本地端用戶輸入接ロ組成,如圖9所示,模擬音頻信號經過本地端用戶輸入接ロ,經音頻噪聲濾波器后,將背景噪聲進行濾除處理,使輸入到音頻AD/DA轉換模塊的音質更 好得到保證。音頻濾波電路采購IT公司專用噪聲濾波芯片進行處理,能有效將20KHZ以外的音頻噪聲進行濾除。遠程聲學輸入模塊,此模塊主要包括遠程端輸入音頻濾波電路對遠程端聲學音頻進行濾波處理。并將處理后的音頻信號送入AD/DA音頻模數/數模轉換模塊。本模塊在發明應用實例中,主要由模擬音頻濾波電路與遠程端用戶輸入接ロ組成,如圖9所示,遠程端模擬音頻信號經過遠程端用戶輸入接ロ,經音頻濾波器后,將背噪聲進行濾除處理,使輸入到音頻AD/DA轉換模塊的音質更好得到保證。音頻濾波電路采購IT公司專用噪聲濾波芯片進行處理,能有效將20KHZ以外的音頻噪聲進行濾除。本地聲學輸出模塊,將音頻AD/DA轉換模塊輸出后的本地端音頻輸出進行濾波處理,并最終輸出到本地用戶端輸出處理。如圖10所示,為本發明應用實例聲學輸出模塊電路示意圖,本發明應用實例中,對于本地聲學輸出模塊,如圖10,使用了一個濾波器,采用了兩個電感和三個電容器件,組成橋接式負載輸出。本濾波器主要作為電感,在電壓交換時使用輸出電流保持ー不致,減少了低狀態功能或無輸入信號時的功耗。同時本電路在為整個發明節約了成本,但通過全面了解其原理,高精度調整電感,電容器件參考,能達到輸出調整靈活,質量保證高。遠程聲學輸出模塊,將音頻AD/DA轉換模塊輸出后的遠程端音頻輸出進行濾波處理,并最終輸出到遠程端輸入處理。在本發明應用實例中,對于遠程聲學輸出模塊,同樣也采用了如圖10的負載輸出電路,以達到相同的音頻輸出效果。如圖11所示,為本發明應用實例圖3中的各個模塊工作的推進流程圖,本地端多路聲學輸入依次進入噪聲濾波器,AD轉換模塊,多路聲學分離合成器,自適應濾波器模塊,非線性處理器模塊,多路聲學分離合成器,DA轉換模塊,LC濾波器,本地端聲學輸出模塊和遠程端聲學輸出模塊進行處理;其中,在自適應濾波器模塊進行回音消除過程中,雙向通話檢測器模塊檢測是否有來自遠程聲學輸入模塊的語音信號,當檢測到有話音信號時,暫時凍結所述自適應濾波器對其參數的更新處理行為。如圖12所示,為本發明應用實例圖3中的DSP數字處理器處理流程圖開始時,初始化初如化音頻AD/DA轉換模塊,然后分別啟動自適應濾波器模塊,雙向通話檢測器模塊,非線性處理器模塊,多路聲學分離合成器,判斷是否有聲學輸入如果有,則進行多路聲學分離,否則,繼續判斷。隨后進行路數選擇,分為I路、2路、3路,隨后通過自適應濾波器模塊,非線性處理器模塊,多路聲學分離合成器進行處理直至事件處理結束進行輸出,然后重新檢測是否有新的聲學輸入;其中,在自適應濾波器模塊進行回音消除過程中,雙向通話檢測器模塊檢測是否有來自遠程聲學輸入模塊的語音信號,當檢測到有話音信號吋,暫時凍結所述自適應濾波器對其參數的更新處理行為。在本發明應用實例中,使用更先進的回音處理算法和選擇高速浮點數字信號處理器,針對現有技術進行有效果的改進,設計出更方面,綜合,高效,音質高保真的聲學回音消除處理系統。本發明ー種用于遠程音頻交互吋,對多路聲學回音進行消除的數字音頻處理系統。通過以DSP數字處理器為硬件核心平臺,包括AD/DA音頻模數/數模轉換模塊,多路聲學分離器,雙向通話檢測器,非線性處理器,自適應濾波器,本地聲學輸入模塊,遠程聲學輸入模塊,本地聲學輸出模塊,遠程學輸出模塊。本發明采用多引擎回音路徑,高速浮點數字信號處理器為算法和硬件基礎,可應用于各種復雜遠程音雙向語音交互領域中,能將回音處理拖尾時間提高到500ms,聲學帶寬范圍為20HZ至20KHZ,回音消除能力提高到大于 IOOdB。本領域技術人員還可以了解到本發明實施例列出的各種說明性邏輯塊(illustrative logical block),單元,和步驟可以通過電子硬件、電腦軟件,或兩者的結合進行實現。為清楚展示硬件和軟件的可替換性(interchangeability),上述的各種說明性部件(illustrative components),單元和步驟已經通用地描述了它們的功能。這樣的功能是通過硬件還是軟件來實現取決于特定的應用和整個系統的設計要求。本領域技術人員可以對于每種特定的應用,可以使用各種方法實現所述的功能,但這種實現不應被理解為超出本發明實施例保護的范圍。本發明實施例中所描述的各種說明性的邏輯塊,或単元都可以通過通用處理器,數字信號處理器,專用集成電路(ASIC),現場可編程門陣列(FPGA)或其它可編程邏輯裝置,離散門或晶體管邏輯,離散硬件部件,或上述任何組合的設計來實現或操作所描述的功能。通用處理器可以為微處理器,可選地,該通用處理器也可以為任何傳統的處理器、控制器、微控制器或狀態機。處理器也可以通過計算裝置的組合來實現,例如數字信號處理器和微處理器,多個微處理器,一個或多個微處理器聯合一個數字信號處理器核,或任何其它類似的配置來實現。本發明實施例中所描述的方法或算法的步驟可以直接嵌入硬件、處理器執行的軟件模塊、或者這兩者的結合。軟件模塊可以存儲于RAM存儲器、閃存、ROM存儲器、EPROM存儲器、EEPROM存儲器、寄存器、硬盤、可移動磁盤、⑶-ROM或本領域中其它任意形式的存儲媒介中。示例性地,存儲媒介可以與處理器連接,以使得處理器可以從存儲媒介中讀取信息,并可以向存儲媒介存寫信息。可選地,存儲媒介還可以集成到處理器中。處理器和存儲媒介可以設置于ASIC中,ASIC可以設置于用戶終端中。可選地,處理器和存儲媒介也可以設置于用戶終端中的不同的部件中。在一個或多個示例性的設計中,本發明實施例所描述的上述功能可以在硬件、軟件、固件或這三者的任意組合來實現。如果在軟件中實現,這些功能可以存儲與電腦可讀的媒介上,或以ー個或多個指令或代碼形式傳輸于電腦可讀的媒介上。電腦可讀媒介包括電腦存儲媒介和便于使得讓電腦程序從ー個地方轉移到其它地方的通信媒介。存儲媒介可以是任何通用或特殊電腦可以接入訪問的可用媒體。例如,這樣的電腦可讀媒體可以包括但不限于RAM、ROM、EEPR0M、CD-ROM或其它光盤存儲、磁盤存儲或其它磁性存儲裝置,或其它任何可以用于承載或存儲以指令或數據結構和其它可被通用或特殊電腦、或通用或特殊處理器讀取形式的程序代碼的媒介。此外,任何連接都可以被適當地定義為電腦可讀媒介,例如,如果軟件是從ー個網站站點、服務器或其它遠程資源通過ー個同軸電纜、光纖電腦、雙絞線、數字用戶線(DSL)或以例如紅外、無線和微波等無線方式傳輸的也被包含在所定義的電腦可讀媒介中。所述的碟片(disk)和磁盤(disc)包括壓縮磁盤、鐳射盤、光盤、DVD、軟盤和藍光光盤,磁盤通常以磁性復制數據,而碟片通常以激光進行光學復制數據。上述的組合也可以包含在電腦可讀媒介中。以上所述的具體實施方式
,對本發明的目的、技術方案和有益效果進行了進ー步詳細說明,所應理解的是,以上所述僅為本發明的具體實施方式
而已,并不用于限定本發明 的保護范圍,凡在本發明的精神和原則之內,所做的任何修改、等同替換、改進等,均應包含在本發明的保護范圍之內。
權利要求
1.ー種遠程音頻交互的多路聲學回音消除方法,其特征在于,所述方法包括 獲取輸入的多路音源聲學信號; 對輸入的所述多路音源聲學信號進行聲學分離處理; 分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理; 將進行聲學回音消除處理后的每一路聲學信號進行組合并進行聲學合成; 將進行聲學合成后的聲學信號進行輸出。
2.如權利要求I所述方法,其特征在于,所述獲取輸入的多路音源聲學信號包括 對輸入的多路音源聲學信號進行濾波處理; 將進行濾波處理后的音頻信號進行音頻模數轉換; 獲取進行音頻模數轉換后的多路音源聲學信號。
3.如權利要求I所述方法,其特征在于,所述對輸入的所述多路音源聲學信號進行聲學分離處理包括 根據聲學的頻率對輸入的所述多路音源聲學信號進行聲學分離處理。
4.如權利要求3所述方法,其特征在于,所述根據聲學的頻率對輸入的所述多路音源聲學信號進行聲學分離處理包括 根據聲學的頻率對輸入的所述多路音源聲學信號進行一次聲學分離處理,然后根據預定時間內聲學音頻大小進行二次分離處理,井根據預定時間內聲學間斷進行三次分離處理。
5.如權利要求I所述方法,其特征在于,所述分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理包括 分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器模擬實際環境中的回音路徑以預測回音信號,并從實際信號中減去預測到的回音信號,以進行聲學回音消除處理。
6.如權利要求5所述方法,其特征在于,所述分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理包括 在對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理過程中,利用雙向通話檢測器檢測是否有話音信號加入,當檢測到有話音信號吋,暫時凍結所述自適應濾波器對其參數的更新處理行為。
7.如權利要求6所述方法,其特征在于,所述分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理后,還包括 分別通過非線性處理器模塊,利用非線性控制算法對進行聲學回音消除處理后的每ー路聲學信號進行潤色處理。
8.如權利要求I所述方法,其特征在于,所述將進行聲學合成后的聲學信號進行輸出包括 將進行聲學合成后的聲學信號進行音頻數模轉換; 對進行音頻數模轉換后的聲學信號進行濾波處理; 將進行濾波處理后的聲學信號進行輸出。
9.ー種遠程音頻交互的多路聲學回音消除系統,其特征在于,所述系統包括DSP數字處理器模塊,用于獲取輸入的多路音源聲學信號; 多路聲學分離合成器,用于對輸入的所述多路音源聲學信號進行聲學分離處理; 自適應濾波器模塊,用于分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理; 所述多路聲學分離合成器,還用于將進行聲學回音消除處理后的每一路聲學信號進行組合并進行聲學合成; 所述DSP數字處理器模塊,還用于將進行聲學合成后的聲學信號進行輸出。
10.如權利要求9所述系統,其特征在于,所述系統還包括 本地聲學輸入模塊,用于對輸入的多路音源聲學信號進行濾波處理; 遠程聲學輸入模塊,用于對輸入的多路音源聲學信號進行濾波處理; 音頻模數/數模轉換模塊,用于將進行濾波處理后的音頻信號進行音頻模數轉換; 所述DSP數字處理器模塊,用于獲取進行音頻模數轉換后的多路音源聲學信號。
11.如權利要求9所述系統,其特征在干, 所述多路聲學分離合成器,進ー步用于根據聲學的頻率對輸入的所述多路音源聲學信號進行聲學分離處理。
12.如權利要求11所述系統,其特征在干, 所述多路聲學分離合成器,進ー步具體用于根據聲學的頻率對輸入的所述多路音源聲學信號進行一次聲學分離處理,然后根據預定時間內聲學音頻大小進行二次分離處理,并根據預定時間內聲學間斷進行三次分離處理。
13.如權利要求9所述系統,其特征在干, 所述自適應濾波器模塊,進ー步用于分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器模擬實際環境中的回音路徑以預測回音信號,并從實際信號中減去預測到的回音信號,以進行聲學回音消除處理。
14.如權利要求13所述系統,其特征在于,所述系統還包括 雙向通話檢測器模塊,用于所述自適應濾波器模塊在對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理過程中,利用雙向通話檢測器檢測是否有來自遠程聲學輸入模塊的話音信號加入,當檢測到有話音信號吋,暫時凍結所述自適應濾波器對其參數的更新處理行為。
15.如權利要求14所述系統,其特征在于,所述系統還包括 非線性處理器模塊,用于所述自適應濾波器模塊分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理后,分別通過非線性處理器模塊,利用非線性控制算法對進行聲學回音消除處理后的每一路聲學信號進行潤色處理。
16.如權利要求9所述系統,其特征在于,所述系統還包括 所述音頻模數/數模轉換模塊,還用于將進行聲學合成后的聲學信號進行音頻數模轉換; 本地聲學輸出模塊,用于對進行音頻數模轉換后的聲學信號進行濾波處理;然后將進行濾波處理后的聲學信號進行輸出; 遠程聲學輸出模塊,用于對進行音頻數模轉換后的聲學信號進行濾波處理;然后將進行濾波處理后的聲學信號進行輸出。
全文摘要
本發明提供一種遠程音頻交互的多路聲學回音消除方法及系統,所述遠程音頻交互的多路聲學回音消除方法包括獲取輸入的多路音源聲學信號;對輸入的多路音源聲學信號進行聲學分離處理;分別對進行聲學分離處理后的每一路聲學信號通過自適應濾波器進行聲學回音消除處理;將進行聲學回音消除處理后的每一路聲學信號進行組合并進行聲學合成;將進行聲學合成后的聲學信號進行輸出。所述系統包括DSP數字處理器模塊,多路聲學分離合成器,自適應濾波器模塊。本發明以較低成本消除了多路聲學回音,并提供了高質量的語音通信。本發明可應用于各種復雜遠程音雙向語音交互領域中,能將回音處理拖尾時間提高到500ms,聲學帶寬范圍為20HZ至20KHZ,回音消除能力提高到大于100dB。
文檔編號G10L21/02GK102646418SQ201210088640
公開日2012年8月22日 申請日期2012年3月29日 優先權日2012年3月29日
發明者劉衛國, 方斌, 段克, 謝泳江, 賈瑞明 申請人:北京華夏電通科技股份有限公司