車用陣列話筒的語音識別水平提升系統及其方法

文檔序號：2826133閱讀：397來源：國知局

車用陣列話筒的語音識別水平提升系統及其方法
【專利摘要】本發明提供一種車用陣列話筒的語音識別水平提升系統及其方法，其利用從多個話筒傳感器接收的音源信號，估算音源信號的發出地點，向覆蓋估算的發出地點的區域調整陣列話筒波束形成區，即使因用戶的多種身體特性或活動而發話地點出現變化，也可以主動調整波束形成區，從而提升陣列話筒系統的語音識別效率以及通話質量。
【專利說明】車用陣列話筒的語音識別水平提升系統及其方法
【技術領域】
[0001]本發明涉及車用陣列話筒系統，尤其是跟蹤發聲地點改變波束形成的車用陣列話筒的語音識別水平提升系統及其方法。
【背景技術】
[0002]陣列話筒系統是利用多重話筒使周邊雜音或干擾音的影響最小化的系統，適用于車用免提系統或語音識別系統。一般車輛等空間較窄的室內使用兩個話筒陣列。
[0003]例如，傳統的免提系統用陣列話筒系統如圖1所示，其組成包括:由多重話筒組成采集音源信號的陣列話筒10、處理在陣列話筒10采集的音源信號只提取用戶的語音信號的處理器裝置20。
[0004]具有所述結構的傳統的陣列話筒系統中提取用戶音源的運行動作如下。
[0005]陣列話筒10是用戶的音源信號A和收音機廣播、散熱風扇、發動機噪聲等周邊的各種雜音成分即接口音源信號B以及配套環境/電路上噪聲C等同時被提取施加于處理單元20。此時處理單元20實施估算輸入的各種信號參數的第一處理，實施從估算的參數分離出實際用戶的語音信號、周邊雜音即接口噪聲、配套環境/電路上噪聲的第二處理。
[0006]然后實施通過濾波清除周邊雜音即接口噪聲，只提取為用戶的語音信號和配套/電路上噪聲的第三處理，并實施對于經過第三處理的信號實施濾波清除配套/電路上噪聲只提取純用戶語音信號的第四處理。
[0007]該處理單元20中的純用戶語音信號提取是利用輸入于各個話筒的音源信號(sound signal)之間發生的延時(time delay)實施固定音源流入方向的波束形成(beamforming)只提取從特定方向輸入的音源信號，從而使用戶語音對陣列話筒的流入方向被固定。
[0008]所述陣列話筒系統是波束形成區域的調諧完成后以調諧的條件固定住波束形成的區域和方向，而如圖2所示只從特定方向接收音源信號而限制說話者(用戶)發話位置的
自由度。
[0009]為解決所述自由度受限制的問題，傳統的陣列話筒系統將音源信號的流入方向即波束形成區域形成得較寬(Broad)，即使說話者發話位置改變也可以很好地接收。
[0010]但波束形成區域變寬時，如果從波束形成區域內的特定方向發生噪聲或變大時，因不能適當地清除，導致最終提取的語音信號中含有噪聲，而且利用雙信道陣列話筒而使利用音源信號之間延時估算音源流入方向的準確性下降。最終，不能提供可靠的免提功能而無法提供優質的通話服務。

【發明內容】

[0011]本發明的目的在于提供一種車用陣列話筒的語音識別水平提升系統及其方法，估算用戶的語音發出地點，以向覆蓋估算的發話地點的區域主動調整陣列話筒的波束形成區域。[0012]為解決所述課題，本發明一方面涉及的車用陣列話筒的語音識別水平提升系統的組成包括:多個話筒傳感器，形成多個信道；音響本體，利用從所述多個話筒傳感器輸入的語音信號，估算所述語音信號的發出地點，向所述估算的發出地點移動所述多個話筒傳感器的波束形成區。所述音響本體是使所述波束形成區移動到包括多個區域的覆蓋已設定的波束區矩陣內所述估算的發出地點所處區域的區。所述波束區矩陣由默認區域和圍繞所述默認區域的擴展區域組成。
[0013]所述音響本體是所述估算的發出地點位于所述擴展區域時，將覆蓋所述波束區域矩陣內默認區域的波束形成區域移動到覆蓋所述發出地點所在的擴展區域的區。所述音響本體利用輸入于所述多個話筒傳感器的各個信道的語音信號的時間差，估算所述語音信號的發出地點。所述多個話筒傳感器至少是三個陣列話筒傳感器。
[0014]為解決所述課題，本發明另一方面涉及的車用陣列話筒的語音識別水平提升方法，該方法的實施步驟包括:接收從多個話筒傳感器輸入的語音信號；利用所述輸入的語音信號估算所述語音信號的發出地點；使所述多個話筒傳感器的波束形成區移動到所述估算的發出地點。
[0015]估算所述發出地點的步驟具體為利用輸入于所述多個話筒傳感器的各信道的語音信號之間的時間差，估算所述語音信號的發出地點。移動所述波束形成區的步驟具體為，在由默認區域和圍繞所述默認區域的擴展區組成的已設定的波束區矩陣內，所述發出地點位于所述擴展區時，使覆蓋所述默認區域的波束形成區移動到所述發出地點所處的擴展區域。
[0016]本發明具有的優點在于:
本發明是利用從多個話筒傳感器接收的音源信號估算音源信號的發話地點，以向覆蓋估算的發話地點的區域調整陣列話筒的波束形成區域，根據用戶的各種身體特性或者活動，即使發話地點出現變化，也可以主動調整波束形成區域，從而提高陣列話筒系統的語音識別效率和通話質量。
【專利附圖】

【附圖說明】
[0017]圖1是傳統的陣列話筒系統結構參照圖；
圖2是表示傳統的陣列話筒系統的波束形成區域的例示圖；
圖3是本發明一個實施例的車用陣列話筒的語音識別水平提升系統框圖；
圖4是表示本發明的虛擬波束形成矩陣的例示圖；
圖5是表示本發明的車內虛擬波束區域矩陣位置的例示圖；
圖6是根據本發明的發話地點位置的各調整模式的波束形成區域例示圖；
圖7是本發明一個實施例的車用陣列話筒的語音識別水平提升方法的流程圖。
[0018]圖中:
100:話筒傳感器；200:音響本體；
210:估算部；220:存儲部；
230:調整部。
【具體實施方式】[0019]為使本發明實施例的目的、技術方案和優點更加清楚，下面將結合本發明實施例中的附圖，對本發明實施例中的技術方案進行清楚、完整地描述，顯然，所描述的實施例是本發明一部分實施例，而不是全部的實施例。基于本發明中的實施例，本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例，都屬于本發明保護的范圍。
[0020]圖3是本發明一個實施例的車用陣列話筒的語音識別水平提升系統框圖。如圖3所示，語音識別水平提升系統包括多個話筒傳感器100和音響本體200。
[0021]話筒傳感器100接收用戶語音的裝置，裝配在車內既定位置。話筒傳感器100是至少由三個話筒陣列構成的，優選地，話筒傳感器100可以是由信道1-4組成的話筒。
[0022]音響本體200利用從話筒傳感器100輸入的音源信號，估算音源信號的發出地點，根據估算結果利用波束形成(beam forming)算法對輸入話筒傳感器100的音源信號的波束形成區域實施變量調整。波束形成(Beam Forming)是指形成具有方向性的波束,只接收從所需方向傳播過來的信號，從其它方向傳播過來的語音信號或噪聲則清除。
[0023]具體是，音響本體200包括估算部210、存儲部220以及調整部230。
[0024]估算部210分析從話筒傳感器100接收的音源信號，對低于基礎級別以下的信號作為噪聲清除。估算部210根據語音頻率特點，從被清除的信號中提取200Hz -3000Hz內的信號，利用提取的音源信號估算音源信號的發出地點。
[0025]一般，利用從三個以上的話筒傳感器100接收的音源信號估算三維空間的音源發出地點。發出地點可以利用信道之間的時間差、強度差異及相位差異估算。
[0026]本發明中估算部210利用從話筒傳感器100輸入的音源信號的到達時間差(TimeDifference of Arrival，TD0A)估算音源信號的發出位置。利用音源信號的到達時間差估算語音發出位置的方法有多種算法。一般利用到達時間差的方法是利用相互相關函數的方法和利用自適應過濾器的方法，利用到達時間差的算法已被廣為人知。
[0027]存儲部220是存儲數據的存儲器，可以使用閃存。存儲部220可以在音響本體200內實現，也可以與音響本體200分別實現。該存儲部220如圖4所示，儲存波束區矩陣的虛擬坐標值。該波束區矩陣如圖5所示，是對用戶的語音可能發出的位置的虛擬區矩陣。該波束區矩陣是由默認區(A、B、C、D區)和默認區周邊的擴展區((Weak area)組成的。存儲部220如下述還可以儲存優化調諧算法，以調整各調整模式(圖6的(I) - (5))的各波束區，進而調整波束區。
[0028]調整部230對估算部210估算的音源信號發出地點坐標和存儲部220上儲存的矩陣坐標進行比較，根據比較結果利用存儲部220上儲存的波束形成調諧算法，利用五個模式中的一個模式調整波束形成區。具體是，調整部230平時如圖6的(5)在覆蓋默認區的默認模式狀態下，如估算部210估算的發出地點位于默認區以外的擴展區時，調整部230會用覆蓋估算的發出地點所處擴展區的模式(圖6的(I) - (4)之一)調整波束形成區。
[0029]如圖7所示，是本發明一個實施例的車用陣列話筒的語音識別水平提升方法的流程圖。
[0030]首先，音響本體200在波束控制模式狀態下接收通過四個話筒傳感器100輸入的音源信號(步驟S100)。音響本體200對接收的四個音源信號進行分析估算音源信號的發出位置(步驟S200)。具體是，音響本體200對從話筒傳感器100接收的音源信號進行分析，對于基礎級別以下的信號作為噪聲清除。音響本體200根據語音的頻率特性，從清除的信號中提取200Ηζ-3000Ηζ內的信號，利用提取的音源信號之間時間差估算音源信號的發出地點。
[0031]音響本體200是對在S200估算的音源信號的發出地點坐標和已存儲的波束形成矩陣(見圖4圖示)的坐標進行比較(步驟S300)。音響本體200根據比較結果利用已儲存模式中的一個模式調諧算法調整波束形成區(步驟S400)。
[0032]具體是，估算的音源信號的發出地點位于圖4的波束形成矩陣的AA、NA、WA區內時，音響本體200如圖6 (I)所示，用可覆蓋默認區即A區和A區的擴展區即AA、NA、WA區的A模式調整波束形成區。如上所述，音響本體200是發出地點位于BB、NB、EB區內部時，將波束形成區如圖6 (2)所示用B模式調整。發出地點在CC、EC、WC區內時，音響本體200將波束形成區如圖6 (3)所示用C模式調整。發出地點位于DD、SD、ED區內時，音響本體200對于波束形成區如圖6 (4)所示用D模式調整。另一方面，估算的音源信號的發出地點位于A、B、C、D區內時，音響本體200如圖6 (5)所示，用默認模式調整波束形成區。
[0033]以上實施例僅用以說明本發明的技術方案，而非對其限制；盡管參照前述實施例對本發明進行了詳細的說明，本領域的普通技術人員應當理解:其依然可以對前述各實施例所述的技術方案進行修改，或者對其中部分技術特征進行等同替換；而這些修改或者替換，并不使相應技術方案的本質脫離本發明各實施例所述技術方案的范圍。本發明的保護范圍應根據下述的權利要求范圍進行解釋，而且在其同等范圍內的所有技術方案應都屬于本發明的權利要求范圍。
【權利要求】
1.一種車用陣列話筒的語音識別水平提升系統，其特征在于，包括: 多個話筒傳感器，形成多個信道；音響本體，利用從所述多個話筒傳感器輸入的語音信號，估算所述語音信號的發出地點，向所述估算的發出地點移動所述多個話筒傳感器的波束形成區。
2.根據權利要求1所述的車用陣列話筒的語音識別水平提升系統，其特征在于，所述音響本體使所述波束形成區移動到包括多個區域的覆蓋已設定的波束區矩陣內所述估算的發出地點所處區域的區。
3.根據權利要求2所述的車用陣列話筒的語音識別水平提升系統，其特征在于，所述波束區矩陣由默認區域和圍繞所述默認區域的擴展區域組成。
4.根據權利要求3所述的車用陣列話筒的語音識別水平提升系統，其特征在于，所述音響本體是所述估算的發出地點位于所述擴展區域時，將覆蓋所述波束區域矩陣內默認區域的波束形成區域移動到覆蓋所述發出地點所在的擴展區域的區。
5.根據權利要求1所述的車用陣列話筒的語音識別水平提升系統，其特征在于，所述音響本體利用輸入于所述多個話筒傳感器的各個信道的語音信號的時間差，估算所述語音信號的發出地點。
6.根據權利要求1所述的車用陣列話筒的語音識別水平提升系統，其特征在于，所述多個話筒傳感器為至少三個陣列話筒傳感器。
7.一種車用陣列話筒的語音識別水平提升方法，其特征在于，該方法的實施步驟包括: 接收從多個話筒傳感器輸入的語音信號；利用所述輸入的語音信號估算所述語音信號的發出地點；使所述多個話筒傳感器的波束形成區移動到所述估算的發出地點。
8.根據權利要求7所述的車用陣列話筒的語音識別水平提升方法，其特征在于，估算所述發出地點的步驟具體為利用輸入于所述多個話筒傳感器的各信道的語音信號之間的時間差，估算所述語音信號的發出地點。
9.根據權利要求7所述的車用陣列話筒的語音識別水平提升方法，其特征在于，所述使波束形成區移動的步驟具體為使所述波束形成區移動到包括多個區域的覆蓋已設定的波束區矩陣內所述估算發出地點所在的區域的區。
10.根據權利要求7所述的車用陣列話筒的語音識別水平提升方法，其特征在于，移動所述波束形成區的步驟具體為，在由默認區域和圍繞所述默認區域的擴展區組成的已設定的波束區矩陣內，所述發出地點位于所述擴展區時，使覆蓋所述默認區域的波束形成區移動到所述發出地點所處的擴展區域。
【文檔編號】G10L21/02GK103680512SQ201310349297
【公開日】2014年3月26日申請日期:2013年8月12日優先權日:2012年9月3日
【發明者】金惠珍申請人:現代摩比斯株式會社

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業用途，請聯系技術所有人。
技術研發人員：金惠珍;
技術所有人：現代摩比斯株式會社;
我是此專利的發明人

上一篇：一種語音信號處理方法和裝置制造方法
下一篇：語音操控方法、移動終端裝置及語音操控系統的制作方法

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！