一種智能家居語音控制系統及其語音識別方法與流程

文檔序號：12736580閱讀：1085來源：國知局

本發明涉及一種語音系統，具體是一種智能家居語音控制系統及其語音識別方法。

背景技術：

語音是人類最常用的交流方式，也是人類和計算機交流最渴望的方式。因此用語音同計算機交流也成為了最近研究的熱點，計算機對語音的理解是計算機科學中的一個引人人勝的、富有挑戰性的課題。

隨著科技的發展，語音交互模塊被越來越多的應用到智能家居系統里面。考慮到智能家居的應用性、便捷性和小型化需求，目前應用于智能家居的語音交互系統基本都是用嵌入式系統，這些嵌入式系統大都采用專門的語音識別芯片，如 MCU、DSP和語音識別專用芯片。

目前業界的智能家居語音控制系統及其語音識別方法識別的語音指令，都是前期預設在嵌入式系統中，目前主流的的語音識別方法是基于HTK（Hidden Markov Model Toolkit）進行開發的，HTK是一套專門的建立和處理隱馬可夫模型（HMMs）的實驗工具包，由英國劍橋大學工程系開發，主要應用于語音識別領域。HTK經過劍橋大學、 Entropic公司及 Microsoft公司的不斷增強和改進，使其在語音識別領域處于世界領先水平。

然而基于HTK的語言識別時，識別結果只能顯示在DOS或終端上，而且不利于將結果保存、移植或者二次開發利用。

技術實現要素：

本發明的目的在于提供一種智能家居語音控制系統及其語音識別方法，以解決上述背景技術中提出的問題。

為實現上述目的，本發明提供如下技術方案：

一種智能家居語音控制系統，通過麥克風拾取聲音信號，并經AD轉換電路完成模數轉換后送到語音處理模塊，經語音處理模塊完成編解碼過程后分成兩路，一路直接送控制器，控制器采用語音識別算法進行運算；另一路送到DA轉換電路進行數模轉換后送功率放大電路放大，放大后的語音信號通過揚聲器對外輸出；所述語音處理模塊還為控制器、AD轉換電路、DA轉換電路、功率放大電路供電。

優選的，所述控制器采用芯片OMAP3530。

優選的，所述語音處理模塊采用集電源管理、ADC、嵌入式電源控制和全功能音頻編解碼器于一體的芯片TPS65930。

優選的，所述語音識別算法采用語音識別軟件應用系統，具體包括語音信號采集模塊、基于DMA的雙向高速RAM存取模塊、語音識別模塊、系統管理模塊和語音輸出模塊。

優選的，所述系統管理模塊負責系統的總體管理調度，是應用系統的調度中心。

優選的，所述語音信號采集模塊負責控制芯片TPS65930。

優選的，所述基于DMA的雙向RAM存取模塊負責實現DMA驅動及雙向RAM的讀寫存取，使用通道1來實現高速地把語音信號采集到的數據存儲到RAM存儲模塊上，并使用通道2實現高速地把RAM存儲模塊上的數據取出來，用于語音的識別。

優選的，所述語音輸出模塊負責把相應的音頻數據送到芯片TPS65930，并控制芯片TPS65930對接收到的音頻解碼輸出到功率放大電路，實現語音輸出的功能。

優選的，所述語音識別模塊采用如下方法對語音進行識別：（1）將智能家居電器的語音控制功能與相應的語音信息建立對應關系；（2）控制器接收到語音處理模塊送來的語音信號，此時的語音信號已經被語音處理模塊進行了解碼，控制器將上述解碼后的語音信號進行傅里葉變換，從而將上述語音信號從時間域變換到頻率域；（3）對上述頻率域的頻譜進行劃分，提取劃分后每個小方格的梯度直方圖特征，劃分的個數在識別效率和識別精度間取平衡；建立與RAM存儲模塊上預存儲語音對象相適應的基于數值估計的模型，根據所述梯度直方圖特征計算每個小方格對應于該模型的評分；采用下式計算每個小方格對應于所述模型的局部評分：

Sk(I,gi,pk)＝wk*φ(I,gi)

其中，I表示當前語音信息，gi表示當前語音信息中第i個小方格，pk表示所述模型的第k個部位，φ(I,gi)表示當前語音信息中小方格gi的梯度直方圖特征；

針對所述模梯度直方圖特征，篩選幾個局部評分較高的小方格，篩選的個數在識別效率和識別精度間取平衡；

對篩選出的小方格進行組合，結合組合中每個小方格的局部評分和小方格間的空間邏輯關系，計算每種小方格組合的全局評分；

將最高的全局評分與閾值比較，若超出所述閾值則判定語音中存在待識別的語音信息；

（4）根據識別出來的語音信息指令，根據（1）中所述的對應關系，控制相應的執行機構工作；實現智能語音控制功能。

與現有技術相比，本發明的有益效果是：本發明智能家居語音控制系統及其語音識別方法，基于傅里葉變換對語音信息進行識別，配合由芯片OMAP3530擔任控制器的控制系統，在保證語音識別精度的情況下，還能夠實現高速的存儲功能，方便保存、移植或者二次開發利用；另外本發明還采用集電源管理、ADC、嵌入式電源控制和全功能音頻編解碼器于一體的芯片TPS65930為系統供電，相對于獨立的電源，具有集成度高、體積小的優點，適應于小型化的發展。

附圖說明

圖1為智能家居語音控制系統的結構示意圖。

圖2為智能家居語音控制系統控制流程圖。

具體實施方式

下面將結合本發明實施例中的附圖，對本發明實施例中的技術方案進行清楚、完整地描述，顯然，所描述的實施例僅僅是本發明一部分實施例，而不是全部的實施例。基于本發明中的實施例，本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例，都屬于本發明保護的范圍。

請參閱圖1～2，本發明實施例中，一種智能家居語音控制系統及其語音識別方法，通過麥克風拾取聲音信號，并經AD轉換電路完成模數轉換后送到語音處理模塊，經語音處理模塊完成編解碼過程后分成兩路，一路直接送控制器，控制器采用語音識別算法進行運算；另一路送到DA轉換電路進行數模轉換后送功率放大電路放大，放大后的語音信號通過揚聲器對外輸出；所述語音處理模塊還為控制器、AD轉換電路、DA轉換電路、功率放大電路供電。所述控制器采用芯片OMAP3530；所述語音處理模塊采用集電源管理、ADC、嵌入式電源控制和全功能音頻編解碼器于一體的芯片TPS65930；所述語音識別算法采用語音識別軟件應用系統，具體包括語音信號采集模塊、基于DMA的雙向高速RAM存取模塊、語音識別模塊、系統管理模塊和語音輸出模塊；所述系統管理模塊負責系統的總體管理調度，是應用系統的調度中心。所述語音信號采集模塊負責控制芯片TPS65930；所述基于DMA的雙向RAM存取模塊負責實現DMA驅動及雙向RAM的讀寫存取，使用通道1來實現高速地把語音信號采集到的數據存儲到RAM存儲模塊上，并使用通道2實現高速地把RAM存儲模塊上的數據取出來，用于語音的識別；所述語音輸出模塊負責把相應的音頻數據送到芯片TPS65930，并控制芯片TPS65930對接收到的音頻解碼輸出到功率放大電路，實現語音輸出的功能。

所述語音識別模塊采用如下方法對語音進行識別：（1）將智能家居電器的語音控制功能與相應的語音信息建立對應關系；（2）控制器接收到語音處理模塊送來的語音信號，此時的語音信號已經被語音處理模塊進行了解碼，控制器將上述解碼后的語音信號進行傅里葉變換，從而將上述語音信號從時間域變換到頻率域；（3）對上述頻率域的頻譜進行劃分，提取劃分后每個小方格的梯度直方圖特征，劃分的個數在識別效率和識別精度間取平衡；建立與RAM存儲模塊上預存儲語音對象相適應的基于數值估計的模型，根據所述梯度直方圖特征計算每個小方格對應于該模型的評分；采用下式計算每個小方格對應于所述模型的局部評分：

Sk(I,gi,pk)＝wk*φ(I,gi)

其中，I表示當前語音信息，gi表示當前語音信息中第i個小方格，pk表示所述模型的第k個部位，φ(I,gi)表示當前語音信息中小方格gi的梯度直方圖特征；

針對所述模梯度直方圖特征，篩選幾個局部評分較高的小方格，篩選的個數在識別效率和識別精度間取平衡；

對篩選出的小方格進行組合，結合組合中每個小方格的局部評分和小方格間的空間邏輯關系，計算每種小方格組合的全局評分；

將最高的全局評分與閾值比較，若超出所述閾值則判定語音中存在待識別的語音信息；

（4）根據識別出來的語音信息指令，根據（1）中所述的對應關系，控制相應的執行機構工作；實現智能語音控制功能。

本發明中揚聲器用于播放識別的語音信息，在無法找到預存儲的語音指令時，播放“無關語句”語音提示操作者，使操作者能夠及時發現識別失誤的情況，從而對受控的智能家居電器重新下語音指令。

在實驗中總共進行了3輪話語測試，每輪500句話語測試，其中250句為系統需要識別的話語，250句話語為機器人不予置理的無關話語。本系統只設置10個需要識別的話語，由25名測試者分別讀音進行測試。同時對無關話語也是由該25名測試者，每人10句分別隨機讀音測試。第1輪中，先測試的250句無關話語中，能正確識別出無關話語數為250句，識別出無關話語率為100%,但對需識別的話語中，正確識別出247句，3句識別出錯，識別率為98.8%；在第2輪中，同樣先測試的250句無關話語中，能正確識別出無關話語數為250句，識別出為無關話語率為100%，但對需識別的話語中，正確識別出245句，5句識別出錯，識別率為98%；在第3輪中，同樣先測試的250句無關話語中，能正確識別出無關語句數為250句，識別出為無關話語率為100%，但對需識別的話語中，正確識別出246句，識別率為98.4%。并且在試驗測試的過程中，系統的響應速度都非常快，感官上沒有時間延遲，與真人交流速度相當。

綜上所述，本發明智能家居語音控制系統及其語音識別方法，基于傅里葉變換對語音信息進行識別，配合由芯片OMAP3530擔任控制器的控制系統，在保證語音識別精度的情況下，還能夠實現高速的存儲功能，方便保存、移植或者二次開發利用；另外本發明還采用集電源管理、ADC、嵌入式電源控制和全功能音頻編解碼器于一體的芯片TPS65930為系統供電，相對于獨立的電源，具有集成度高、體積小的優點，適應于小型化的發展。

對于本領域技術人員而言，顯然本發明不限于上述示范性實施例的細節，而且在不背離本發明的精神或基本特征的情況下，能夠以其他的具體形式實現本發明。因此，無論從哪一點來看，均應將實施例看作是示范性的，而且是非限制性的，本發明的范圍由所附權利要求而不是上述說明限定，因此旨在將落在權利要求的等同要件的含義和范圍內的所有變化囊括在本發明內。不應將權利要求中的任何附圖標記視為限制所涉及的權利要求。

此外，應當理解，雖然本說明書按照實施方式加以描述，但并非每個實施方式僅包含一個獨立的技術方案，說明書的這種敘述方式僅僅是為清楚起見，本領域技術人員應當將說明書作為一個整體，各實施例中的技術方案也可以經適當組合，形成本領域技術人員可以理解的其他實施方式。

完整全部詳細技術資料下載

當前第1頁1 2 3