1.一種音頻信號的噪聲檢測方法,其特征在于,包括:
轉換音頻信號為多個音頻幀,其中上述多個音頻幀以目標音頻幀為中心依時間順序排列;
計算每一上述音頻幀的多個頻譜分量分別對應的多個幅度;
計算在時間頻率域中相鄰的上述多個幅度之間的差異,以獲得在該時間頻率域中互為正交的至少兩個方向上分別對應的多個差異量,其中該時間頻率域根據上述多個音頻幀所定義;
根據上述多個差異量決定上述多個幅度在該時間頻率域中的最大差異程度;以及
根據該最大差異程度判斷該音頻信號對應該目標音頻幀的部分是否為噪聲。
2.如權利要求1所述的音頻信號的噪聲檢測方法,其特征在于,其中該時間頻率域的時間軸根據采樣上述多個音頻幀的時間順序所決定,且該時間頻率域的頻率軸根據采樣上述多個音頻幀的上述多個頻譜分量決定。
3.如權利要求1所述的音頻信號的噪聲檢測方法,其特征在于,其中上述至少兩個方向包括第一方向以及第二方向,且獲得在該時間頻率域中互為正交的上述至少兩個方向上分別對應的上述多個差異量的步驟包括:
兩兩計算在該第一方向上相鄰的上述多個幅度以獲得在該第一方向上的多個梯度分量;
累加在該第一方向上的上述多個梯度分量以獲得在該第一方向上的該差異量;
兩兩計算在該第二方向上相鄰的上述多個幅度以獲得在該第二方向上的多個梯度分量;以及
累加在該第二方向上的上述多個梯度分量以獲得在該第二方向上的該差異量。
4.如權利要求3所述的音頻信號的噪聲檢測方法,其特征在于,其中根據上述多個差異量決定上述多個幅度在該時間頻率域中的該最大差異程度的步驟包括:
比較上述多個差異量以獲得上述多個差異量中的最大值及最小值;以及
計算該最大值及該最小值的比例以獲得該最大差異程度。
5.如權利要求3所述的音頻信號的噪聲檢測方法,其特征在于,其中這些音頻幀根據采樣時間順序并以該目標音頻幀對應的采樣時間為界而分成兩個集合,且獲得在該時間頻率域中互為正交的上述至少兩個方向上分別對應的上述多個差異量的步驟還包括:
對于在上述多個幅度中對應每一上述集合的部分,計算在該部分中相鄰的上述多個幅度之間的差異以獲得每一上述集合在互為正交的該至少兩個方向上分別對應的上述多個差異量。
6.如權利要求5所述的音頻信號的噪聲檢測方法,其特征在于,其中根據上述多個差異量決定上述多個幅度在該時間頻率域中的該最大差異程度的步驟包括:
比較每一上述集合在互為正交的上述至少兩個方向上分別對應的上述多個差異量以獲得每一上述集合的上述多個差異量中的最大值及最小值;
計算每一上述集合的該最大值及該最小值的比例;以及
比較上述多個集合分別對應的上述多個比例以設定最大的該比例為該最大差異程度。
7.如權利要求3所述的音頻信號的噪聲檢測方法,其特征在于,其中該至少兩個方向還包括第三方向以及第四方向,其中該第三方向及該第四方向互為正交,該第三方向與該第一方向之間的夾角為45度角,且根據相鄰的這些幅度之間的差異以獲得這些差異量的步驟還包括:
兩兩計算在該第三方向上相鄰的上述多個幅度以獲得在該第三方向上的多個梯度分量;
累加在該第三方向上的上述多個梯度分量以獲得在該第三方向上的該差異量;
兩兩計算在該第四方向上相鄰的上述多個幅度以獲得在該第四方向上的多個梯度分量;以及
累加在該第四方向上的上述多個梯度分量以獲得在該第四方向上的該差異量。
8.如權利要求7所述的音頻信號的噪聲檢測方法,其特征在于,其中根據上述多個差異量決定上述多個幅度在該時間頻率域中的該最大差異程度的步驟包括:
將該至少兩個方向中互為正交的上述兩個方向視為一個方向組合;
在每一方向組合中,根據比較分別在互為正交的上述兩個方向上的上述多個差異量,以獲得每一上述方向組合對應的最大比例;以及
根據上述多個方向組合分別對應的上述多個最大比例,以設定上述多個最大比例的總和為該最大差異程度。
9.如權利要求8所述的音頻信號的噪聲檢測方法,其特征在于,其中這些音頻幀根據采樣時間順序并以該目標音頻幀對應的采樣時間為界而分成兩個集合,且根據比較分別在互為正交的上述兩個方向上的上述多個差異量,以獲得每一上述方向組合對應的該最大比例的步驟包括:
對于在上述多個幅度中對應每一上述集合的部分,計算在該部分中相鄰的上述多個幅度之間的差異,以獲得每一上述集合在每一上述方向組合中互為正交的上述兩個方向上分別對應的上述多個差異量;
比較每一上述集合的每一上述方向組合所對應的上述多個差異量以獲得最大值及最小值;
計算該最大值及該最小值以獲得每一上述集合的每一上述方向組合所對應的比例;以及
比較每一上述方向組合在每一上述集合分別對應的上述多個比例,以設定最大的該比例為該方向組合對應的該最大比例。
10.如權利要求1所述的音頻信號的噪聲檢測方法,其特征在于,其中根據該最大差異程度判斷該音頻信號對應該目標音頻幀的部分是否為該噪聲的步驟包括:
當該最大差異程度低于閾值時,判定該音頻信號對應該目標音頻幀的部分為該噪聲。
11.如權利要求1所述的音頻信號的噪聲檢測方法,其特征在于,還包括:
對該時間頻率域的上述多個幅度執行二維低通濾波動作,以獲得第二時間頻率域;以及
根據在該第二時間頻率域中相鄰的多個幅度之間的差異,決定該第二時間頻率域中的最大差異程度。
12.如權利要求11所述的音頻信號的噪聲檢測方法,其特征在于,其中該時間頻率域的該最大差異程度為第一差異程度,該第二時間頻率域的該最大差異程度為第二差異程度,且根據該最大差異程度判斷該音頻信號對應該 目標音頻幀的部分是否為該噪聲的步驟包括:
比較該第一差異程度及該第二差異程度,以設定該第一差異程度及該第二差異程度中較大的一個為該最大差異程度。
13.一種音頻信號的噪聲檢測裝置,其特征在于,包括:
存儲裝置;以及
處理器,耦接該存儲裝置,轉換音頻信號為多個音頻幀,其中上述多個音頻幀以目標音頻幀為中心依時間順序排列,該處理器計算每一上述音頻幀的多個頻譜分量分別對應的多個幅度,并將上述多個幅度存入該存儲裝置,該處理器計算在時間頻率域中相鄰的上述多個幅度之間的差異,以獲得在該時間頻率域中互為正交的至少兩個方向上分別對應的多個差異量,其中該時間頻率域根據上述多個音頻幀定義,該處理器根據上述多個差異量決定上述多個幅度在該時間頻率域中的最大差異程度,以及根據該最大差異程度判斷該音頻信號對應該目標音頻幀的部分是否為噪聲。
14.如權利要求13所述的音頻信號的噪聲檢測裝置,其特征在于,其中該時間頻率域的時間軸根據采樣上述多個音頻幀的時間順序決定,且該時間頻率域的頻率軸根據采樣上述多個音頻幀的上述多個頻譜分量決定。
15.如權利要求13所述的音頻信號的噪聲檢測裝置,其特征在于,其中上述至少兩個方向包括第一方向以及第二方向,且該處理器兩兩計算在該第一方向上相鄰的上述多個幅度以獲得在該第一方向上的多個梯度分量,累加在該第一方向上的上述多個梯度分量以獲得在該第一方向上的該差異量,并且兩兩計算在該第二方向上相鄰的上述多個幅度以獲得在該第二方向上的多個梯度分量,以及累加在該第二方向上的上述多個梯度分量以獲得在該第二方向上的該差異量。
16.如權利要求15所述的音頻信號的噪聲檢測裝置,其特征在于,其中該處理器比較上述多個差異量以獲得上述多個差異量中的最大值及最小值,以及計算該最大值及該最小值的比例以獲得該最大差異程度。
17.如權利要求15所述的音頻信號的噪聲檢測裝置,其特征在于,其中這些音頻幀根據采樣時間順序并以該目標音頻幀對應的采樣時間為界而分成兩個集合,且對于在上述多個幅度中對應每一上述集合的部分,該處理器計算在該部分中相鄰的上述多個幅度之間的差異以獲得每一上述集合在互為正交的該至少兩個方向上分別對應的上述多個差異量。
18.如權利要求17所述的音頻信號的噪聲檢測裝置,其特征在于,其中該處理器比較每一上述集合在互為正交的上述至少兩個方向上分別對應的上述多個差異量以獲得每一上述集合的上述多個差異量中的最大值及最小值,計算每一上述集合的該最大值及該最小值的比例,以及比較上述多個集合分別對應的上述多個比例以設定最大的該比例為該最大差異程度。
19.如權利要求15所述的音頻信號的噪聲檢測裝置,其特征在于,其中該至少兩個方向還包括第三方向以及第四方向,其中該第三方向及該第四方向互為正交,該第三方向與該第一方向之間的夾角為45度角,且該處理器兩兩計算在該第三方向上相鄰的上述多個幅度以獲得在該第三方向上的多個梯度分量,累加在該第三方向上的上述多個梯度分量以獲得在該第三方向上的該差異量,并且兩兩計算在該第四方向上相鄰的上述多個幅度以獲得在該第四方向上的多個梯度分量,以及累加在該第四方向上的上述多個梯度分量以獲得在該第四方向上的該差異量。
20.如權利要求19所述的音頻信號的噪聲檢測裝置,其特征在于,其中該處理器將該至少兩個方向中互為正交的上述兩個方向視為一個方向組合,在每一方向組合中,該處理器根據比較分別在互為正交的上述兩個方向上的上述多個差異量,以獲得每一上述方向組合對應的最大比例,以及根據上述多個方向組合分別對應的上述多個最大比例,以設定上述多個最大比例的總和為該最大差異程度。
21.如權利要求20所述的音頻信號的噪聲檢測裝置,其特征在于,其中這些音頻幀根據采樣時間順序并以該目標音頻幀對應的采樣時間為界而分成兩個集合,且對于在上述多個幅度中對應每一上述集合的部分,該處理器計算在該部分中相鄰的上述多個幅度之間的差異,以獲得每一上述集合在每一上述方向組合中互為正交的上述兩個方向上分別對應的上述多個差異量,比較每一上述集合的每一上述方向組合所對應的上述多個差異量以獲得最大值及最小值,計算該最大值及該最小值以獲得每一上述集合的每一上述方向組合所對應的比例,以及比較每一上述方向組合在每一上述集合分別對應的上述多個比例,以設定最大的該比例為該方向組合對應的該最大比例。
22.如權利要求13所述的音頻信號的噪聲檢測裝置,其特征在于,其中當該最大差異程度低于閾值時,該處理器判定該音頻信號對應該目標音頻幀的部分為該噪聲。
23.如權利要求13所述的音頻信號的噪聲檢測裝置,其特征在于,其中該處理器更對該時間頻率域的上述多個幅度執行二維低通濾波動作,以獲得第二時間頻率域,并將在該第二時間頻率域中的多個幅度存入該存儲裝置,以及根據在該第二時間頻率域中相鄰的上述多個幅度之間的差異,決定該第二時間頻率域中的最大差異程度。
24.如權利要求23所述的音頻信號的噪聲檢測裝置,其特征在于,其中該時間頻率域的該最大差異程度為第一差異程度,該第二時間頻率域的該最大差異程度為第二差異程度,且該處理器比較該第一差異程度及該第二差異程度,以設定該第一差異程度及該第二差異程度中較大的一個為該最大差異程度。