專利名稱:統一標準的麥克風預處理系統和方法
技術領域:
本發明涉及聲音處理,尤其是在車內的聲音處理。
背景技術:
目前,對于汽車應用,不同的麥克風和處理元件可用于通話、語音識別和主動噪聲消除。例如,單個的單向心形麥克風可放置在駕駛員上方的車頂內襯里從而為通話提供最佳接收;和全向麥克風可放置在后視鏡上從而為自動語音識別(ASR)提供最佳接收。另外的麥克風(通常是每個乘客一個)可放置在駕駛員和乘客頭部上方以使得主動噪聲消除能消除例如發動機噪聲的影響。多個麥克風和處理元件的使用可能很貴,而且可能質量會打折,原因在于可用于每個目的的麥克風的數量受到成本和設計條件的限制。
發明內容
方案I. 一種統一標準的麥克風預處理系統包括布置在車輛乘客艙內的多個麥克風;構造為接收來自多個麥克風的信號的處理系統;并且該處理系統構造為處理信號以產生增強信號以由通話處理應用、自動語音識別處理應用和噪聲消除處理應用中的至少兩個使用。方案2.方案I的系統,該處理系統包括構造為轉換來自多個麥克風的模擬信號的模擬-數字轉換器;構造為儲存已轉換的模擬信號的存儲單元;和構造為在已轉換的模擬信號上實施預處理增強技術的控制處理器。方案3.方案I的系統,其中該處理系統包括構造為成形多個麥克風的一個或多個接收波束的波束形成器單元。方案4.方案3的系統,其中波束形成器單元用于成形多個接收波束,并基于車輛乘客艙的聲音條件中的變化自適應性地成形多個接收波束。方案5.方案I的系統,該處理系統包括構造為在已接收的信號上實施模擬-數字轉換的預處理單元;聲音回聲消除預處理單元;和以下預處理單元中的至少兩個構造為增強數字化的已接收的信號以便增加在電話通信中噪聲和殘余回聲的衰減的通話預處理單元;構造為增強數字化的已接收的信號以
3便優化包括Mel對數倒頻譜距離或字訶識別率的語音識別指標的語音識別預處理單元;和構造為獲得聲壓的精確測量值以及將測量值提供給主動噪聲消除系統的噪聲消除預處理單元。方案6.方案I的系統,其中多個麥克風以幾何圖案布置。方案7.方案6的系統,其中幾何圖案是半球形。方案8.方案I的系統,其中該處理是構造為通過以下步驟處理信號以產生由噪聲消除處理應用所使用的增強信號的方法定位目標車內人員;重新得到用于目標車內人員附近位置的麥克風排列參數;內插排列參數。方案9. 一種用于統一標準的麥克風預處理的方法,該方法包括接收來自車輛乘客艙內布置的多個麥克風的信號;和增強已接收的信號以由通話處理應用、自動語音識別處理應用和噪聲消除處理應用中的至少兩個使用。方案10.方案9的方法,進一步包括在信號上實施預處理增強技術;和成形多個麥克風的多個接收波束。方案11.方案10的方法,進一步包括將已成形的多個接收波束引導至駕駛員和車輛乘客艙內的一個或多個乘客中的至少一個。方案12.方案9的方法,進一步包括實施用于聲音回聲消除的已接收的信號。方案13.方案9的方法,進一步包括通過引導多個接收波束中的至少一個到說話者的嘴部而實施噪聲和殘余回聲衰減;和施加信號增強和信號重建技術。方案14.方案9的方法,進一步包括在已接收的信號上實施語音識別增強預處理以優化包括Mel對數倒頻譜距離或字詞識別率的語音識別指標。方案15.方案9的方法,其中多個麥克風以幾何圖案布置。方案16.方案9的方法,包括通過以下步驟產生由噪聲消除處理應用所使用的增強信號定位目標車內人員;重新得到用于目標車內人員附近位置的麥克風排列參數;內插排列參數。方案17. —種方法包括接收來自空間位置完全不同的多個麥克風的信號;處理信號以產生已處理的信號;和將已處理的信號提供給多個音頻應用,多個音頻應用包括通話應用、自動語音識別應用和噪聲消除應用中的至少兩個。方案18.方案17的方法,包括成形用于一個或多個預處理增強技術的多個麥克風的多個接收波束。
方案19.方案18的方法,包括將已成形的多個接收波束引導到駕駛員和車輛乘客艙內的一個或多個乘客中的至少一個。方案20.方案17的方法,包括實施用于聲音回聲消除的已接收的信號的增強;通過引導多個接收波束中的至少一個到說話者的嘴部而實施噪聲和殘余回聲衰減,并施加信號增強和信號重建技術;使用Mel對數倒頻譜距離或字詞識別率指標在已接收的信號上實施語音識別增強預處理;和在車內人員的頭部附近實施聲壓測量。
被認為是本發明的主題內容在說明書的最后部分特別地指出并清楚地要求保護。 但是,本發明,關于操作的組織和方法,以及目標、特征及其優點,在結合附圖閱讀時參考以下詳細說明可以得到最好地理解。圖I示出了根據本發明實施例的系統;圖2示意地示出了根據圖I中系統的部件;圖3A和3B描述了用于根據本發明的一個實施例的主動噪聲消除方法和系統的噪聲測量方法和系統;和圖4示出了根據本發明實施例的過程。可以理解,為了說明的簡化和清楚,圖中所示元件沒有必要按比例畫出。例如,為了清楚起見一些元件的尺寸相對于其它元件被夸大了。此外,在適當考慮的情況下,在圖中的參考數字可重復以表示相應或相似元件。
具體實施例方式在以下詳細說明中,提出許多特定細節以便提供對本發明完整的理解。然而,可以理解,對于本領域技術人員來說,本發明在沒有這些特定細節時也可實施。在其它例子中, 已知的方法、過程和部件將不詳細描述以不會模糊本發明。除非特別說明,否則對于以下討論顯然的是,在整個說明書討論中使用的術語如 “處理”、“用計算機計算”、“存儲”、“計算”、“確定”、“估算”、“測量”、“提供”、“轉移”、“輸出”、
“輸入”等等,是指計算機或計算系統或相似的電子計算裝置的操作和/或處理,其將表示為計算系統寄存器和/或存儲器內物理(如電子的)量的數據處理和/或轉換成類似地表示為計算系統的存儲器、寄存器或其它這樣的信息儲存、傳輸或顯示裝置內的物理量的其它數據。根據本發明實施例的系統可提供一種統一標準的麥克風處理系統,以提供音頻數據并能實現通話(例如,蜂窩電話裝置)、語音識別、主動噪聲控制和/或其它功能。在一個實施例中,相同或重疊的麥克風組,例如以諸如部分球形、半球體或半球形的幾何圖案布置,可在相同或基本相同的時間或同時地向在車輛內的不同音頻處理功能(例如,通話、語音識別、主動噪聲控制等等)并發地平行提供輸入。可選地,重疊的麥克風組可在不同的時間使用相同的麥克風向不同的音頻處理功能提供輸入。不同種類的輸入信號可以是并發平行地在相同的或基本相同的時間或同時地被處理和產生并提供給這些應用,例如,音頻應用或首頻定向應用。圖I示出了根據本發明實施例的統一標準的麥克風處理(UMP)系統100。UMP系統100可以輸出增強的或處理后的信號給相關應用(例如,音頻應用或音頻定向應用)如通話處理應用、ASR處理應用和噪聲消除處理應用。使用相同或重疊的處理或使用相同或重疊的麥克風組已形成的分開的已處理的信號(例如,三個不同的信號)或其它數量的已處理的信號可以被提供給各應用。UMP系統100可包括布置在車輛乘客艙內或周圍的麥克風 130a-h的排列130。根據本發明的實施例,麥克風130a-h的排列130可以布置在放置在乘客艙的內飾頂或車頂內襯上的半球體或半球形單元130內,例如在駕駛員和乘客之間,或在通常的座位位置或供車內人員(例如,駕駛員和零個或多個乘客)使用的座椅之間。雖然麥克風130a-h可共同定位在一個單元內,但它們可分開一些距離以便在空間位置上完全不同。在一個實施例中,使用八個麥克風,但是也可使用其它數量的麥克風。可以使用其它麥克風位置、布置形狀或布置以及麥克風的數量。在一個實施例中,半球形單元可以是大約10-15厘米的直徑。麥克風130a-h可以例如通過諸如有線連接、網絡或其它系統之類的連接裝置135連接到處理電路110。在一個單元中包括用于多個目的的多個麥克風與具有展開的均要求其自身配線系統的麥克風的系統相比可以減少配線。在其它實施例中,麥克風130a-h可以不在同一單元中的情況下在車輛內分配。處理電路110可包括信號放大器122以增加麥克風信號電平。根據本發明的實施例,麥克風130a_h均可包括放大器或與放大器連接。根據本發明的實施例,處理電路可在硬件中(例如,離散模擬電路、包括現場可編程門陣列(FPGA)的數字電路、特殊應用集成電路(ASIC)、數字信號處理器(DSP)和/或處理單元)、軟件中或硬件和軟件的結合中(例如, 由諸如中央處理器單元118之類的處理器或控制器執行的代碼或指令)實現。處理電路110可包括模擬-數字(A/D)轉換器112、閃存單元114、隨機存取存儲單元116、控制或中央處理器單元118和連接這些部件的內部總線120。存儲單元116可包括存儲例如在噪聲消除或其它功能校準期間產生的數據的表或數據庫124。在操作中,可以確定使用者或使用者的耳朵的實際位置。來自相機410、排列130和/或A/D轉換器112的輸入可以接收來自一個或多個麥克風130a_h的模擬信號。接收的模擬信號可以被轉換為例如適合在RAM單元116或閃存單元114內處理或儲存的數字信號。控制處理器單元118 可存取已儲存的數字信號并實施音頻預處理信號增強技術以改善例如通話、主動噪聲衰減或消除、ASR和/或其它應用的性能。這些增強的信號可制成能在數據總線140上獲取以由這些或其它應用存取。在處理電路110內的波束形成器可接收來自N麥克風的信號并輸出單個增強質量的信號。在這個實施例中輸出信號包括例如用于通話的信號、用于ASR的信號和用于主動噪聲消除的一個或多個信號;可選擇地,統一標準的波束形成信號可以被提供給多個單元,且波束形成可以不用于所有應用。統一標準的波束形成可以不應用在噪聲消除處理應用的預處理中。—個或多個揚聲器145可輸出例如噪聲消除聲音、電話或收音機輸出或其它輸出 (不同的或相同的或重疊的揚聲器可以與每個應用相關聯)的聲音。根據本發明的實施例,數字信號可以由控制處理器單元118處理,原因在于從麥克風130a-h接收的信號已通過A/D單元112轉換。后處理數字信號可以例如儲存在RAM單元116和/或閃存單元114內和/或傳遞到其它單元或應用。閃存單元114或RAMl 16可儲存或容納軟件代碼,當由控制處理器單元118執行時,其可使得控制處理器執行本文所述過程,例如處理已儲存的或正輸入的數字信號、波束形成、噪聲消除、ASR等等。在一個實施例中,閃存114可包括通過控制處理器118經由輸入/輸出端口(未示出)存取的外部閃存。閃存單元114或RAM116可儲存或容納中間信號或數據,或用于其它單元(例如應用)的數據。根據本發明實施例的多個麥克風的緊湊布置可通過形成或成形多個引導向車內人員(例如,駕駛員和乘客)的接收波束使得能進行空間濾波,其中每一個接收波束可以同時使用所有麥克風。波束形成、空間濾波或其它信號處理技術可以通過例如在某種程度上組合麥克風輸入用來達到定向聲音接收,其中在特定角度的信號經歷相長干涉而其它信號經歷相消干涉。可以使用其它技術,例如使用來自一個麥克風的噪聲信號去消除或清理來自另一麥克風的噪聲。分開的接收波束式樣可以形成用于每個目的,例如,通話、ASR、主動噪聲衰減或消除等等。這些分開的接收波束式樣中的每個可以構造為使用所有麥克風以便獲得用于每個目的的最佳接收的信號以實現優化的處理性能。在一些實施例中,可以使用附屬組的麥克風用于特定應用。如本發明實施例中使用的空間濾波、波束形成和信號增強可以自適應于乘客艙內音頻條件的變化并可由乘客艙內音頻條件的變化作出反應或控制,例如,乘員的實際數量、 他們在乘客艙內的準確位置、噪聲條件等等。圖2示意地示出了根據本發明實施例的UMP系統100的部件。這些部件可以是處理電路100的一部分,或由控制處理器118執行或處于其內。因此部件210、220、230、240、250可以在硬件中、軟件中或硬件和軟件的組合中實現。雖然在一個實施例中一組麥克風向通話、主動噪聲衰減或消除ASR應用提供輸入,但在其他實施例中,可以使用不同的一組應用。預處理單元210可以構造為執行從麥克風130a_h接收的麥克風信號的A/D轉換。 (A/D轉換也可以或可選擇地由圖I中的A/D單元112實施)預處理單元210可以包括例如增益控制、分解成處理結構、信號轉換為頻率域、聲音活躍性檢測和/或其它功能性。預處理可以例如通過由處理器(例如,執行存儲在RAMl 16內的軟件的處理器118)執行的軟件或專門硬件單元或兩者組合實施。回聲消除預處理單元220可以通過例如使用利用實時揚聲器信號的揚聲器反饋、 消除在乘客艙內由揚聲器產生的音頻來增強數字化的麥克風信號。聲音回聲消除預處理單元220可被供給來自預處理單元210的輸出信號以及來自乘客艙內一個或多個揚聲器的輸入222,例如揚聲器輸入或揚聲器反饋信號。在一個實施例中聲音回聲消除預處理單兀220 向ASR預處理或ASR應用和通話預處理或通話應用提供輸出但不向噪聲消除預處理或應用提供輸出;可以使用其它配置。波束形成步驟或過程可以通過由處理器(例如,執行存儲在RAM116內的軟件的處理器118)執行的軟件或通過專門硬件單元或通過兩者組合實施。波束形成步驟或過程可以接受輸入和接收到的聲音數據并且可以形成特定的接收波束樣式。在一個實施例中, 分開的接收波束樣式可以成形或形成用于每個相關的目的,例如,通話和ASR;在其它實施例中僅僅使用一個波束樣式。在一個實施例中,統一標準的波束形成單元使用相同的波束形成步驟輸出到通話(例如,經由電話預處理單元230)和ASR(例如,經由ASR預處理單元 240)但不輸出到主動噪聲控制。在其它實施例中,波束形成可以輸入到不同組應用。可以使用統一標準的波束形成,用于多個應用的一個波束形成過程。在其它實施例中,某些應用可以包括或使用分開的波束形成。用于通話或其它單元增強的波束形成可以包括利用所有麥克風130a_h或附屬組的麥克風,并且可以具有被導向(例如,使用波束形成)車內人員嘴部期望位置的初始缺省接收樣式。根據本發明的實施例,波束的方向可以是自適應的,以便車內人員聲音的信號質量被優化。最小方差無失真響應波束形成可以用來盡可能減少干擾而不在排列注視方向弓I 入失真。電話預處理單元230可以構造為執行用于通話應用的數字化麥克風信號的預處理增強。電話預處理單元230可以在通過構建在乘客車艙內的通話系統、連接上的個人電話和/或智能電話執行的電話通信中衰減噪聲和殘余回聲。通過通話預處理單元230的處理可以包括例如其中波束被朝向說話者的嘴部引導的波束形成(統一標準的或其它方式);信號增強;信號重建和/或其它功能。通過通話增強單元230的信號重建可以將語音從頻率域轉換到時間域,例如使用傅立葉轉換技術。通過通話預處理單元230的處理可以包括噪聲衰減過濾器,如單通道噪聲衰減。 通話預處理單元230可使用諸如功率譜或對數譜幅度的指標進行優化。通話預處理單元 230可以是自適應的,如在廣義旁瓣對消器中。通話預處理單元230可以使用后置過濾器以衰減由回聲消除剩下的殘余回聲。可以使用不同的處理,或各自用于不同的目的或應用的不同的處理模塊。可以使用除通話、ASR和噪聲衰減或消除之外的與應用相關的處理模塊。當可以使用統一標準波束形成時,ASR預處理單元240可實施不同的波束形成,或與通過電話預處理單元230完成但是為了不同的目的和指標(例如,字詞識別率或精確度) 的處理相似的波束形成器和信號增強算法。ASR預處理單元240可以使用與語音識別前端相關的信號特征,其可以不同于用于通話增強的信號特征。ASR預處理單元240可以包括噪聲衰減過濾器如單通道噪聲衰減。ASR預處理單元240可以在mel對數倒頻譜域內的過濾器優化指標信號失真時使用。mel對數倒頻譜經常用于語音識別系統的前端。ASR預處理單元240可以優化包括字詞識別率的語音識別指標。語音重建技術如音樂噪聲、殘余回聲和全雙工性能對于語音識別不那么重要。ASR 增強單元240可以最大化字詞識別精確度。噪聲消除預處理單元250可以構造為執行預處理以獲得聲壓、噪聲或殘余噪聲的精確測量,并為主動噪聲消除系統提供信號以增強其性能。外部或集成主動噪聲消除系統可以使用該信號。噪聲消除可在例如20-250Hz的范圍或其他范圍內執行。主動噪聲消除增強可包括在耳朵附近測量由例如汽車發動機產生的典型的低頻噪聲或其它噪聲。噪聲測量可通過由麥克風130a-h形成的一組麥克風來執行。消除可通過經由揚聲器產生“反相噪聲”來執行。聲壓可以在車內人員(例如,駕駛員和乘客)的頭部(例如,耳朵)附近測量以獲得良好的消除。各種位置的測量,每個位置對應于駕駛員或乘客,可以例如使用相機大致獲得。可以使用其它定位方法,例如,波束形成。不同的波束可以形成用于每個乘客和用于駕駛員。
圖3A和3B描述了根據本發明一個實施例的用于主動噪聲消除方法和系統的噪聲測量方法和系統。噪聲消除預處理單元250 (圖2)或噪聲消除系統255 (圖2)可以在使用前在工廠或其它地方校準。在工廠,參考麥克風400、402和404(可以使用其它數量的麥克風,并用通常使用多于三個的麥克風)可以如在柵格上或虛擬柵格上放置在特定位置。車輛也可包括麥克風130a-h的排列130。車輛可以是用來校準如用于許多其它車輛的噪聲消除預處理單元的系統的測試車輛,或車輛可以是將要單獨校準的個別車輛。通常,麥克風 400,402和404根據柵格(相應于或位于點401、403、405處)布置在期望被定位的使用者頭部附近的位置,以模擬可選的使用者的位置。(可以使用多于三個的柵格點和麥克風數量)。實時噪聲(例如,發動機噪聲)可以在如20-250HZ的頻率范圍內或其它范圍內由一個或多個噪聲源415提供。每個點401、403和405的噪聲衰減參數可以使用由麥克風130a_h 獲得的輸入進行計算。對于每個點401、403和405和相應的麥克風400、402和404點位置, 可以優化噪聲衰減系統參數如波束形成參數,并存儲在表或數據庫中或可存取到噪聲消除預處理單元250。優化可包括優化用于每個點401、403和405和相應的麥克風400、402和 404位置的參數以便使用排列130的信號最接近麥克風400、402和404的信號。在這樣的表中的每條記錄可包括對應于柵格或排列點401、403和405的參數G(例如,G可以是由三維坐標定義的點),并且對于每個參數G,相應組的排列參數H對應于位置G。G和H均是針對這些參數的索引或指示器。例如,以下的表I可以存儲在數據庫124內并可包括
權利要求
1.統一標準的麥克風預處理系統,包括布置在車輛乘客艙內的多個麥克風;構造為接收來自多個麥克風的信號的處理系統;并且該處理系統構造為處理信號以產生增強信號以由通話處理應用、自動語音識別處理應用和噪聲消除處理應用中的至少兩個使用。
2.如權利要求I所述的系統,所述處理系統包括構造為轉換來自多個麥克風的模擬信號的模擬-數字轉換器;構造為儲存已轉換的模擬信號的存儲單元;和構造為在已轉換的模擬信號上實施預處理增強技術的控制處理器。
3 如權利要求I所述的系統,其中所述處理系統包括構造為成形多個麥克風的一個或多個接收波束的波束形成器單元。
4.如權利要求3所述的系統,其中波束形成器單元用于成形多個接收波束,并基于車輛乘客艙的聲音條件中的變化自適應性地成形多個接收波束。
5.如權利要求I所述的系統,所述處理系統包括構造為在已接收的信號上實施模擬-數字轉換的預處理單元;聲音回聲消除預處理單元;和以下預處理單元中的至少兩個構造為增強數字化的已接收的信號以便增加在電話通信中噪聲和殘余回聲的衰減的通話預處理單元;構造為增強數字化的已接收的信號以便優化包括Mel對數倒頻譜距離或字詞識別率的語音識別指標的語音識別預處理單元;和構造為獲得聲壓的精確測量值以及將測量值提供給主動噪聲消除系統的噪聲消除預處理單元。
6.如權利要求I所述的系統,其中多個麥克風以幾何圖案布置。
7.如權利要求6所述的系統,其中幾何圖案是半球形。
8.如權利要求I所述的系統,其中所述處理是構造為通過以下步驟處理信號以產生由噪聲消除處理應用所使用的增強信號的方法定位目標車內人員;重新得到用于目標車內人員附近位置的麥克風排列參數;內插排列參數。
9.用于統一標準的麥克風預處理的方法,所述方法包括 接收來自車輛乘客艙內布置的多個麥克風的信號;和增強已接收的信號以由通話處理應用、自動語音識別處理應用和噪聲消除處理應用中的至少兩個使用。
10.一種方法包括接收來自空間位置完全不同的多個麥克風的信號;處理信號以產生已處理的信號;和將已處理的信號提供給多個音頻應用,多個音頻應用包括通話應用、自動語音識別應用和噪聲消除應用中的至少兩個。
全文摘要
統一標準的麥克風預處理系統和方法。所述系統包括布置在車輛乘客艙內的多個麥克風,構造為從多個麥克風中的一個或多個接收信號的處理電路或系統,并且該處理電路構造增強已接收的信號以由通話處理應用、自動語音識別處理應用和噪聲消除處理應用中的至少兩個所使用。該方法包括接收來自布置在車輛乘客艙內的多個麥克風中的一個或多個的信號;并且增強已接收的信號以由通話處理應用、自動語音識別處理應用和噪聲消除處理應用中的至少兩個所使用。還描述了包含可執行指令以使得處理器執行根據本發明實施例的方法的計算機可讀介質。
文檔編號H04R3/02GK102595281SQ20121005157
公開日2012年7月18日 申請日期2012年1月13日 優先權日2011年1月14日
發明者E·齊爾克爾-漢科克, O·尖霍尼 申請人:通用汽車環球科技運作有限責任公司