一種語音采集中回路消噪的裝置及方法與流程

文檔序號：11097908閱讀：980來源：國知局

本發明涉及音頻技術領域，尤其涉及一種語音采集中回路消噪的裝置及方法。

背景技術：

經過數十年的發展，越來越多的電子產品離不開語音的采集，來獲取用戶的語音數據信息。作為人機交互的一部分，語音采集在現在的電子產品顯得格外重要，與其是進入人工智能時代，各種智能產品迫切需求語音采集的高效與高質量。但在實際應用中，語音采集面臨著許多問題，如背景噪聲問題、產品本身的回聲問題，所以高質量的語音采集都會采取背景降噪，回路消除等降噪手法。目前，在回路消除降噪的處理中，通常存在著硬件復雜、采集到的語音數據在時間起點上不同步的問題，導致硬件成本和軟件計算量的提高。

圖1為現有的語音采集中回路消噪裝置的結構示意圖，如圖1中所示：MIC電路1采集到的環境背景聲音經AD轉換模塊2轉換后發送給語音識別處理器3；編譯碼器(CODEC)4接語音識別處理器3的播放通路上采集回路聲音，并將采集到的回路聲音處理為數字信號后發送給語音識別處理器3；語音識別處理器3獲取到環境背景聲音數字信號數據與回路聲音數字信號數據后，通過相關軟件處理，把環境背景聲音數據中的回路聲音數據部分去掉，就達到了消噪(消除回聲)的目的。

圖1所示回路消噪方案的主要缺點是：系統在獲取環境背景聲音與回路聲音時必須設計兩部分采集電路，語音識別處理器3在分別獲取環境背景聲音數據與回路聲音數據時，由于環境背景聲音與回路聲音分別由AD轉換模塊2和CODEC4采集，語音識別處理器3需要分別獲取AD轉換模塊2和CODEC4準備好的音頻數據，由于執行順序先后的原因或者多線程之間切換的原因，必然會導致獲取的兩路數據在時間起點上是不同步的。因此，為了保證回路消噪的效果，必須采用軟件處理來保證環境背景聲音與回路聲音時間起點的同步，這會導致在回聲消噪的算法上需要額外增加計算量，增加系統的開銷；同時由于時間的不同步，也會給消噪的處理帶來一定的誤判操作。

技術實現要素：

本發明提供一種語音采集中回路消噪的裝置及方法，用于解決現有的回路消噪方案無法保證環境背景聲音與回路聲音時間起點的同步的問題，本發明提供的語音采集中回路消噪方案能夠采集到時間起點同步的環境背景聲音與回路聲音，能夠簡化消噪算法，減少計算量，減少系統開銷。

本發明提供一種語音采集中回路消噪的裝置，包括MIC電路、語音識別處理器、編譯碼器CODEC，所述MIC電路連接所述CODEC的左聲道，所述語音識別處理器的播放回路連接所述CODEC的右聲道；所述CODEC的輸出端與所述語音識別處理器的輸入端連接；

所述MIC電路采集環境背景聲音模擬信號并輸出給所述CODEC的左聲道；

所述CODEC的右聲道采集回路聲音模擬信號，所述CODEC對左聲道接收的所述環境背景聲音模擬信號和右聲道采集的回路聲音模擬信號進行處理后得到I2S格式的雙通道數字音頻數據，并將所述雙通道數字音頻數據通過I2S數字音頻接口發送給所述語音識別處理器；

所述語音識別處理器通過I2S數字音頻接口接收所述雙通道數字音頻數據，并根據I2S協議，從所述雙通道數字音頻數據中分離出環境背景聲音數字信號和回路聲音數字信號，隨后將環境背景聲音數字信號中的回路聲音數字信號去掉，得到消噪后的環境聲音。

本發明實施例的一些有益效果可以包括：

上述語音采集中回路消噪的裝置中，環境背景聲音與回路聲音使用同一CODEC采集并將二者編碼為I2S格式的雙通道數字音頻數據，語音識別處理器采集數據過程中根據I2S協議提取出所需的聲音，可以做到回路聲音與環境背景聲音在時間起點上同步，得到的數據可以完美提供給消噪算法處理，解決了軟件處理回路消噪時在時間起點不同步方面帶來的困擾，減小了因時間起點不同步帶來的軟件開銷，同時增強了軟件算法在消除回路聲音時的效果。該方案可以在需要做回路消除的語音采集方案中使用，對降低硬件成本、縮小軟件開發周期有很大幫助。

在一個實施例中，所述CODEC包括：

采集模塊，用于通過右聲道采集所述語音識別處理器的播放回路上的回路聲音模擬信號，并通過左聲道采集所述MIC電路輸出的環境背景聲音模擬信號；

模數轉換模塊，用于將所述環境背景聲音模擬信號和回路聲音模擬信號分別轉換為左聲道數字音頻信號和右聲道數字音頻信號；

編碼模塊，用于將所述左聲道數字音頻信號和右聲道數字音頻信號按I2S協議編碼為I2S格式的雙通道數字音頻數據。

該實施例中，編譯碼器CODEC同時采集環境聲音數據和回路聲音數據，將其轉換為數字信號后編碼為I2S格式的雙通道數字音頻數據發送給語音識別處理器，利用CODEC采集音頻數據時的編碼特性與I2S協議的特性，相比傳統的硬件回路設計，不受語音識別處理器提取數據的先后影響，在時間起點同步方面更加有保障。

在一個實施例中，所述語音識別處理器包括：

I2S數字音頻接口，用于接收所述CODEC發來的雙通道數字音頻數據；

分離模塊，用于根據I2S協議，將所述I2S數字音頻接口接收的雙通道數字音頻數據中的左、右聲道音頻數據分離，得到左聲道音頻片段數據集合和右聲道音頻片段數據集合；

重組模塊，用于將所述分離模塊得到的左聲道音頻片段數據集合中的音頻片段數據重組為環境背景聲音數字信號，將所述右聲道音頻片段數據集合中的音頻片段數據重組為回路聲音數字信號；

消噪模塊，用于將所述重組模塊得到的環境背景聲音數字信號中的回路聲音數字信號去掉，得到消噪后的環境聲音。

該實施例中，語音識別處理器通過I2S數字音頻接口采集雙通道數字音頻數據，并根據I2S協議的特殊數據格式，將雙通道數字音頻數據的左聲道音頻數據與右聲道音頻數據分離出來，重新組成單通道數據，得到所需的回路聲音與環境背景聲音；且環境背景聲音與回路聲音在時間起點上保持同步。

本發明提供一種語音采集中回路消噪的方法，包括：

采集環境背景聲音模擬信號和回路聲音模擬信號；

編譯碼器CODEC對所述環境背景聲音模擬信號和回路聲音模擬信號進行處理后得到I2S格式的雙通道數字音頻數據；

語音識別處理器根據I2S協議，從所述雙通道數字音頻數據中分離出環境背景聲音數字信號和回路聲音數字信號；

語音識別處理器將所述環境背景聲音數字信號中的回路聲音數字信號去掉，得到消噪后的環境聲音。

在一個實施例中，所述編譯碼器CODEC對所述環境背景聲音模擬信號和回路聲音模擬信號進行處理后得到I2S格式的雙通道數字音頻數據，包括：

所述CODEC將所述環境背景聲音模擬信號通過模數轉換為左聲道數字音頻信號，并將回路聲音模擬信號通過模數轉換為右聲道數字音頻信號；

所述CODEC將所述左聲道數字音頻信號和右聲道數字音頻信號按I2S協議編碼為I2S格式的雙通道數字音頻數據。

在一個實施例中，所述語音識別處理器根據I2S協議，從所述雙通道數字音頻數據中分離出環境背景聲音數字信號和回路聲音數字信號，包括：

所述語音識別處理器根據I2S協議，將所述雙通道數字音頻數據中的左、右聲道音頻數據分離，得到左聲道音頻片段數據集合和右聲道音頻片段數據集合；

所述語音識別處理器將所述左聲道音頻片段數據集合中的音頻片段數據重組為環境背景聲音數字信號，將所述右聲道音頻片段數據集合中的音頻片段數據重組為回路聲音數字信號。

在一個實施例中，所述采集環境背景聲音模擬信號和回路聲音模擬信號，包括：

通過MIC電路采集環境背景聲音模擬信號并輸入給所述CODEC的左聲道，所述CODEC的右聲道通過接所述語音識別處理器的播放回路上采集回路聲音。

該實施例中，通過常用的MIC電路采集環境背景聲音，方便快捷，易于實現。

本發明的其它特征和優點將在隨后的說明書中闡述，并且，部分地從說明書中變得顯而易見，或者通過實施本發明而了解。本發明的目的和其他優點可通過在所寫的說明書、權利要求書、以及附圖中所特別指出的結構來實現和獲得。

下面通過附圖和實施例，對本發明的技術方案做進一步的詳細描述。

附圖說明

附圖用來提供對本發明的進一步理解，并且構成說明書的一部分，與本發明的實施例一起用于解釋本發明，并不構成對本發明的限制。在附圖中：

圖1為現有的語音采集中回路消噪裝置的結構示意圖；

圖2為本發明實施例提供的一種語音采集中回路消噪的裝置的結構示意圖；

圖3為本發明實施例提供的另一種語音采集中回路消噪的裝置的結構示意圖；

圖4為I2S數據格式示意圖；

圖5為本發明實施例提供的另一種語音采集中回路消噪的裝置的結構示意圖；

圖6為本發明實施例中一種語音采集中回路消噪的方法的流程圖。

具體實施方式

以下結合附圖對本發明的優選實施例進行說明，應當理解，此處所描述的優選實施例僅用于說明和解釋本發明，并不用于限定本發明。

圖2為本發明實施例提供的一種語音采集中回路消噪的裝置的結構示意圖，如圖2中所示，包括：MIC電路21、語音識別處理器22、編譯碼器CODEC23，MIC電路21連接CODEC23的左聲道，語音識別處理器22的播放回路連接CODEC23的右聲道，語音識別處理器22的輸入端與CODEC23的輸出端連接。

圖2中，MIC電路21采集環境背景聲音模擬信號并輸出給CODEC23的左聲道。CODEC23的右聲道采集回路聲音模擬信號，CODEC23對左聲道接收的環境背景聲音模擬信號和右聲道采集的回路聲音模擬信號進行處理后得到I2S格式的雙通道數字音頻數據，并將雙通道數字音頻數據通過I2S數字音頻接口發送給語音識別處理器22。語音識別處理器22通過I2S數字音頻接口采集CODEC23輸出的雙通道數字音頻數據，并根據I2S協議，從雙通道數字音頻數據中分離出環境背景聲音數字信號和回路聲音數字信號，隨后將環境背景聲音數字信號中的回路聲音數字信號去掉，得到消噪后的環境聲音。

本發明實施例提供的語音采集中回路消噪的裝置中，環境背景聲音與回路聲音使用同一CODEC采集并將二者編碼為I2S格式的雙通道數字音頻數據，相對于現有技術，可以少使用一個AD轉換模塊，此外，環境背景聲音使用CODEC的左聲道采集，可以減少一個語音識別處理器的數字音頻接口；語音識別處理器采集數據過程中根據I2S協議提取出所需的聲音，可以做到回路聲音與環境背景聲音在時間起點上同步，得到的數據可以完美提供給消噪算法處理，解決了軟件處理回路消噪時在時間起點不同步方面帶來的困擾，減小了因時間起點不同步帶來的軟件開銷，同時增強了軟件算法在消除回路聲音時的效果。該方案可以在需要做回路消除的語音采集方案中使用，對降低硬件成本、縮小軟件開發周期有很大幫助。

圖3為本發明實施例提供的另一種語音采集中回路消噪的裝置的結構示意圖，如圖3所示，本實施例的裝置在圖2所示裝置的基礎上，進一步的，CODEC23包括：

采集模塊231，用于通過右聲道采集語音識別處理器22的播放回路上的回路聲音模擬信號，此外，并通過左聲道采集接收MIC電路2輸出的環境背景聲音模擬信號；

模數轉換模塊232，用于將采集模塊231采集到的環境背景聲音模擬信號和回路聲音模擬信號分別轉換為左聲道數字音頻信號和右聲道數字音頻信號；

編碼模塊233，用于將模數轉換模塊232得到的左聲道數字音頻信號和右聲道數字音頻信號按I2S協議編碼為I2S格式的雙通道數字音頻數據并輸出。

如圖4所示，根據I2S協議，CODEC23的編碼模塊233把左聲道數據和右聲道數據組成為“左+右+左+…”形式的雙通道數據。

圖5為本發明實施例提供的另一種語音采集中回路消噪的裝置的結構示意圖，如圖5所示，本實施例的裝置在圖3所示裝置的基礎上，進一步的，語音識別處理器22包括：

I2S數字音頻接口221，用于接收CODEC23發來的雙通道數字音頻數據；

分離模塊222，用于根據I2S協議，將I2S數字音頻接口221接收的雙通道數字音頻數據中的左、右聲道音頻數據分離，得到左聲道音頻片段數據集合和右聲道音頻片段數據集合；

重組模塊223，用于將分離模塊222得到的左聲道音頻片段數據集合中的音頻片段數據重組為環境背景聲音數字信號，將右聲道音頻片段數據集合中的音頻片段數據重組為回路聲音數字信號；

消噪模塊224，用于將重組模塊223得到的環境背景聲音數字信號中的回路聲音數字信號去掉，得到消噪后的環境聲音。

圖5所示實施例中，由于編碼模塊233將左聲道數字音頻信號和右聲道數字音頻信號編碼為“左+右+左+…”形式的雙通道數據，因此分離模塊222可以把左聲道音頻數據與右聲道音頻數據從I2S數字音頻接口221收到的雙通道數字音頻數據中分離出來，由重組模塊223重新組成單通道數據，得到所需的回路聲音與環境背景聲音，且環境背景聲音與回路聲音在時間起點上保持同步，因此，消噪模塊224直接將得到的環境背景聲音數字信號中的回路聲音數字信號去掉，即可得到消噪后的環境聲音。

對應于本發明實施例提供的語音采集中回路消噪的裝置，本發明實施例還提供一種語音采集中回路消噪的方法。圖6為本發明實施例中一種語音采集中回路消噪的方法的流程圖，如圖6所示，該方法包括以下步驟S101-S104：

步驟S101：采集環境背景聲音模擬信號和回路聲音模擬信號。

其中，可以通過MIC電路采集環境背景聲音模擬信號并輸入給CODEC的左聲道，將CODEC的右聲道連接語音識別處理器的播放回路上采集回路聲音。

步驟S102：CODEC對環境背景聲音模擬信號和回路聲音模擬信號進行處理后得到I2S格式的雙通道數字音頻數據。

其中，CODEC首先將環境背景聲音模擬信號通過模數轉換為左聲道數字音頻信號，將回路聲音模擬信號通過模數轉換為右聲道數字音頻信號；隨后CODEC將左聲道數字音頻信號和右聲道數字音頻信號按I2S協議編碼為I2S格式的雙通道數字音頻數據發送給語音識別處理器，即將左聲道數字音頻信號和右聲道數字音頻信號按照“左+右+左+…”的形式編碼。

步驟S103：語音識別處理器根據I2S協議，從雙通道數字音頻數據中分離出環境背景聲音數字信號和回路聲音數字信號。

其中，語音識別處理器首先根據I2S協議(即“左+右+左+…”的編碼形式)，將所述雙通道數字音頻數據中的左、右聲道音頻數據分離，得到左聲道音頻片段數據集合和右聲道音頻片段數據集合；隨后，將所述左聲道音頻片段數據集合中的音頻片段數據重組為環境背景聲音數字信號，將所述右聲道音頻片段數據集合中的音頻片段數據重組為回路聲音數字信號。

步驟S104：語音識別處理器將所述環境背景聲音數字信號中的回路聲音數字信號去掉，得到消噪后的環境聲音。

上述語音采集中回路消噪的方法中，環境背景聲音與回路聲音使用同一CODEC采集并將二者編碼為I2S格式的雙通道數字音頻數據，語音識別處理器采集數據過程中根據I2S協議提取出所需的聲音，可以做到回路聲音與環境背景聲音在時間起點上同步，得到的數據可以完美提供給消噪算法處理，解決了軟件處理回路消噪時在時間起點不同步方面帶來的困擾，減小了因時間起點不同步帶來的軟件開銷，同時增強了軟件算法在消除回路聲音時的效果。該方案可以在需要做回路消除的語音采集方案中使用，對降低硬件成本、縮小軟件開發周期有很大幫助。

本領域內的技術人員應明白，本發明的實施例可提供為方法、系統、或計算機程序產品。因此，本發明可采用完全硬件實施例、完全軟件實施例、或結合軟件和硬件方面的實施例的形式。而且，本發明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(包括但不限于磁盤存儲器和光學存儲器等)上實施的計算機程序產品的形式。

本發明是參照根據本發明實施例的方法、設備(系統)、和計算機程序產品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數據處理設備的處理器以產生一個機器，使得通過計算機或其他可編程數據處理設備的處理器執行的指令產生用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。

這些計算機程序指令也可存儲在能引導計算機或其他可編程數據處理設備以特定方式工作的計算機可讀存儲器中，使得存儲在該計算機可讀存儲器中的指令產生包括指令裝置的制造品，該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。

這些計算機程序指令也可裝載到計算機或其他可編程數據處理設備上，使得在計算機或其他可編程設備上執行一系列操作步驟以產生計算機實現的處理，從而在計算機或其他可編程設備上執行的指令提供用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。

顯然，本領域的技術人員可以對本發明進行各種改動和變型而不脫離本發明的精神和范圍。這樣，倘若本發明的這些修改和變型屬于本發明權利要求及其等同技術的范圍之內，則本發明也意圖包含這些改動和變型在內。

完整全部詳細技術資料下載

當前第1頁1 2 3