<listing id="vjp15"></listing><menuitem id="vjp15"></menuitem><var id="vjp15"></var><cite id="vjp15"></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><menuitem id="vjp15"></menuitem></video></cite>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<menuitem id="vjp15"><strike id="vjp15"></strike></menuitem>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"></strike></var>
<var id="vjp15"></var>
<var id="vjp15"></var>
<var id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></var>
<menuitem id="vjp15"></menuitem><cite id="vjp15"><video id="vjp15"></video></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></cite>
<var id="vjp15"></var>
<var id="vjp15"></var>
<menuitem id="vjp15"><span id="vjp15"><thead id="vjp15"></thead></span></menuitem>
<cite id="vjp15"><video id="vjp15"></video></cite>
<menuitem id="vjp15"></menuitem>

用于增益因子限制的系統、方法及設備的制作方法

文檔序號:2830520閱讀:598來源:國知局
專利名稱:用于增益因子限制的系統、方法及設備的制作方法
技術領域
本發明涉及語音編碼。
背景技術
經由公共交換電話網絡(PSTN)的話音通信的帶寬傳統上限于300-3400 kHz的頻 率范圍。用于話音通信的新網絡(例如蜂窩電話及IP話音(因特網協議,VoIP))可能 不具有相同的帶寬限制,且其可能需要經由所述網絡來傳輸及接收包括寬帶頻率范圍的 話音通信。舉例來說,可能需要支持延伸低達50 Hz及/或高達7 kHz或S kHz的音頻范 圍。還可能需要支持例如高質量音頻或音頻/視頻會議的其它應用,其可具有在傳統PSTN 限制以外的范圍內的音頻語音內容。
語音編碼器所支持的范圍延伸到更高頻率可改進可懂度。舉例來說,區分例如"s" 與"f"的摩擦音的信息大多在高頻率下。高帶延伸還可改進其它語音質量,例如真實度。 舉例來說,即使是有聲元音也可具有遠遠超出PSTN限制的頻譜能量。
一種寬帶語音編碼方法涉及按比例縮放窄帶語音編碼技術(例如, 一種經配置以編 碼0-4kHz的范圍的技術)以重疊寬帶頻譜。舉例來說,可以較高速率對語音信號進行 取樣以包括在高頻率的分量,且窄帶編碼技術可經重配置以使用更多濾波器系數來表示 此寬帶信號。然而,例如CELP (碼簿激發線性預測)的窄帶編碼技術在計算上為密集 的,且寬帶CELP編碼器可能耗費過多處理循環而對許多移動及其它嵌入式應用不實用。 使用此技術將寬帶信號的整個頻譜編碼到所要質量還可能導致帶寬不可接受地大幅增 加。此外,甚至在此經編碼信號的窄帶部分可被傳輸到僅支持窄帶編碼的系統中及/或由 所述系統解碼之前,將需要對此經編碼信號進行碼變換。
可能需要實施寬帶語音編碼,以使得至少經編碼信號的窄帶部分可經由窄帶信道
7(例如PSTN信道)發送而無需碼變換或其它顯著修改。還可能需要寬帶編碼延伸的效 率,(例如)以避免顯著減少例如經由有線及無線信道的無線蜂窩電話及廣播的應用中 可服務的用戶的數目。
寬帶語音編碼的另一方法涉及將語音信號的窄帶及高帶部分編碼為單獨的子帶。在 此類型的系統中,可通過從已在解碼器處可用的信息(例如,窄帶激發信號)導出用于 高帶合成濾波器的激發來實現提高的效率。可通過將一系列增益因子包括在經編碼信號 中來提高此系統中的質量,所述增益因子指示原始高帶信號的電平與合成的高帶信號的 電平之間的時間變化關系。

發明內容
一種根據一配置的語音處理方法包括基于(A)基于語音信號的第一子帶的第一 信號的時間的一部分與(B)基于從所述語音信號的第二子帶導出的分量的第二信號的 時間的對應部分之間的關系而計算增益因子;及根據所述增益因子值將第一索引選擇到 量化值的一有序集合中。所述方法包括評估所述增益因子值與由所述第一索引所指示 的量化值之間的關系;及根據所述評估的結果來將第二索引選擇到量化值的所述有序集 合中。
一種根據另一配置的用于語音處理的設備包括計算器,其經配置以基于(A)基 于語音信號的第一子帶的第一信號的時間的一部分與(B)基于從所述語音信號的第二
子帶導出的分量的第二信號的時間的對應部分之間的關系而計算增益因子值;及量化
器,其經配置以根據所述增益因子值將第一索引選擇到量化值的一有序集合中。所述設
備包括限制器,所述限制器經配置(A)以評估所述增益因子值與由所述第一索引所指 示的量化值之間的關系,及(B)以根據所述評估的結果來將第二索引選擇到量化值的
所述有序集合中。
一種根據另一配置的用于語音處理的設備包括用于基于(A)基于語音信號的第
一子帶的第一信號的時間的一部分與(B)基于從所述語音信號的第二子帶導出的分量 的第二信號的時間的對應部分之間的關系而計算增益因子值的裝置;及用于根據所述增
益因子值將第一索引選擇到量化值的一有序集合中的裝置。所述設備包括用于評估所述 增益因子值與由所述第一索引所指示的量化值之間的關系及用于根據所述評估的結果 來將第二索引選擇到量化值的所述有序集合中的裝置。
8


圖la展示寬帶語音編碼器A100的框圖。
圖lb展示寬帶語音編碼器A100的實施方案A102的框圖。
圖2a展示寬帶語音解碼器B100的框圖。
圖2b展示寬帶語音解碼器B100的實施方案B102的框圖。
圖3a展示用于濾波器組A110的一實例的低帶及高帶的帶寬重疊。
圖3b展示用于濾波器組AUO的另一實例的低帶及高帶的帶寬重疊。
圖4a展示語音信號的頻率對對數振幅的曲線的實例。
圖4b展示基本線性預測編碼系統的框圖。
圖5展示窄帶編碼器A120的實施方案A122的框圖。
圖6展示窄帶解碼器B110的實施方案B112的框圖。
圖7a展示有聲語音的殘余信號的頻率對對數振幅的曲線的實例。
圖7b展示有聲語音的殘余信號的時間對對數振幅的曲線的實例。
圖8展示還執行長期預測的基本線性預測編碼系統的框圖。
圖9展示高帶編碼器A200的實施方案A202的框圖。
圖10展示用于編碼高帶部分的方法M10的流程圖。
圖11展示增益計算任務T200的流程圖。
圖12展示增益計算任務T200的實施方案T210的流程圖。
圖13a展示開窗函數的圖。
圖13b展示如圖13a中所示的開窗函數應用于語音信號的子幀。
圖Ma展示高帶增益因子計算器A230的實施方案A232的框圖。
圖14b展示包括高帶增益因子計算器A232的布置的框圖。
圖15展示高帶增益因子計算器A232的實施方案A234的框圖。
圖16展示高帶增益因子計算器A232的另一實施方案A236的框圖。
圖17展示如可由標量量化器執行的一維映射的實例。
圖18展示由向量量化器執行的多維映射的一簡單實例。
圖19a展示如可由標量量化器執行的一維映射的另一實例。
圖19b展示輸入空間映射成不同大小的量化區域的實例。
圖19c說明其中用于增益因子值R的經量化的值大于原始值的實例。
圖20a展示根據一一般實施方案的增益因子限制的方法M100的流程圖。
9圖20b展示用于方法M100的實施方案M110的流程圖。 圖20c展示用于方法M100的實施方案M120的流程圖。 圖20d展示用于方法M100的實施方案M130的流程圖。 圖21展示高帶編碼器A202的實施方案A203的框圖。 圖22展示高帶編碼器A203的實施方案A204的框圖。 圖23a展示用于限制器L10的實施方案L12的操作圖。 圖23b展示用于限制器L10的另一實施方案L14的操作圖。 圖23c展示用于限制器L10的另一實施方案L16的操作圖。 圖24展示高帶解碼器B200的實施方案B202的框圖。
具體實施例方式
可聽假象可出現于(例如)經解碼的信號的子帶之中的能量分布不準確時。此假象 可顯著地使得用戶不愉快且因此可能降低編碼器的感覺質量。
除非由上下文明確限制,否則術語"計算"在本文中用于指示其通常意義中的任一 者,例如計算、產生值列表及從值列表中進行選擇。在本描述及權利要求書中使用術語 "包含"之處,其并不排除其它元件或操作。術語"A基于B"用于指示其通常意義中的 任一者,包括如下情況(i)"A等于B"及(ii) "A基于至少B"。術語"因特網協議" 包括如在IETF (因特網工程工作小組)RFC (意見請求)791中所描述的版本4,及后 續版本(例如,版本6)。
圖la展示可經配置以執行本文所描述的方法的寬帶語音編碼器A100的框圖。濾波 器組A110經配置以濾波寬帶語音信號S10以產生窄帶信號S20及高帶信號S30。窄帶 編碼器A120經配置以編碼窄帶信號S20以產生窄帶(NB)濾波器參數S40及窄帶殘余 信號S50。如本文進一步詳細描述,窄帶編碼器A120通常經配置以產生作為碼簿索引 或為另一量化形式的窄帶濾波器參數S40及經編碼窄帶激發信號S50。高帶編碼器A200 經配置以根據經編碼窄帶激發信號S50中的信息而編碼高帶信號S30以產生高帶編碼參 數S60。如本文進一步詳細描述,高帶編碼器A200通常經配置以產生作為碼簿索引或 為另一量化形式的高帶編碼參數S60。寬帶語音編碼器A100的一特定實例經配置而以 約8.55 kbps (千位每秒)的速率來編碼寬帶語音信號S10,其中約7.55 kbps用于窄帶 濾波器參數S40及經編碼窄帶激發信號S50,且約1 kbps用于高帶編碼參數S60。
可能需要將經編碼窄帶信號與高帶信號組合為單一位流。舉例來說,可能需要將所述經編碼信號一起多路復用以作為經編碼寬帶語音信號而進行傳輸(例如,經由有線、 光學或無線傳輸信道)或存儲。圖lb展示寬帶語音編碼器A100的實施方案A102的框 圖,其包括經配置以將窄帶濾波器參數S40、經編碼窄帶激發信號S50及高帶濾波器參 數S60組合為經多路復用信號S70的多路復用器A130。
包括編碼器A102的設備還可包括電路,所述電路經配置以將經多路復用信號S70 傳輸到例如有線、光學或無線信道的傳輸信道中。此設備還可經配置以對信號執行一個 或一個以上信道編碼操作(例如誤差校正編碼(例如,速率兼容巻積編碼)及/或誤差檢 測編碼(例如,循環冗余編碼)),及/或一個或一個以上W絡協議編碼層(例如,以太網、 TCP/IP、 cdma2000)。
可能需要配置多路復用器A130以嵌入經編碼窄帶信號(包括窄帶濾波器參數S40 及經編碼窄帶激發信號S50)作為多路復用信號S70的可分子流,以使得經編碼窄帶信 號可獨立于經多路復用信號S70的另一部分(例如高帶及/或低帶信號)而經恢復并解碼。 舉例來說,經多路復用信號S70可經布置,以使得經編碼窄帶信號可通過去除高帶濾波 器參數S60而得以恢復。此特征的潛在優勢在于避免對在將經編碼寬帶信號傳遞到支持 窄帶信號的解碼但不支持高帶部分的解碼的系統之前對其進行編碼轉換的需要。
圖2a為寬帶語音解碼器B100的框圖,其可用于解碼由寬帶語音編碼器A100所編 碼的信號。窄帶解碼器B110經配置以解碼窄帶濾波器參數S40及經編碼窄帶激發信號 S50以產生窄帶信^ S90。高帶解碼器B200經配置以根據窄帶激發信號S80基于經編碼 窄帶激發信號S50來解碼高帶編碼參數S60,以產生高帶信號SIOO。在此實例中,窄帶 解碼器B110經配置以將窄帶激發信號S80提供到高帶解碼器B200。濾波器組B120經 配置以將窄帶信號S90與高帶信號S100組合,以產生寬帶語音信號SllO。
圖2b為寬帶語音解碼器B100的實施方案B102的框圖,其包括經配置以從經多路 復用信號S70產生經編碼信號S40、 S50及S60的解多路復用器B130。包括解碼器B102 的設備可包括電路,所述電路經配置以從例如有線、光學或無線信道的傳輸信道接收經 多路復用信號S70。此設備還可經配置以對信號執行一個或一個以上信道解碼操作(例 如誤差校正解碼(例如,速率兼容巻積解碼)及/或誤差檢測解碼(例如,循環冗余解碼)), 及/或一個或一個以上網絡協議解碼層(例如,以太網、TCP/IP、 cdma2000)。
濾波器組A110經配置以根據帶分割方案(split-band scheme)濾波輸入信號,以產 生低頻率子帶及高頻率子帶。視特定應用的設計準則而定,輸出子帶可能具有相等或不 等帶寬且可為重疊或非重疊的。產生兩個以上子帶的濾波器組A110的配置也為可能的。 舉例來說,此濾波器組可經配置以產生一個或一個以上低帶信號,所述信號包括低于窄
11帶信號S20的頻率范圍的頻率范圍(例如50-300 Hz的范圍)內的分量。此濾波器組還 可能經配置以產生一個或一個以上額外高帶信號,所述信號包括高于高帶信號S30的頻 率范圍的頻率范圍(例如14-20 kHz、 16-20 kHz或16-32 kHz的范圍)內的分量。在此 情況下,寬帶語音編碼器A100可經實施以單獨編碼此信號或這些信號,且多路復用器 A130可經配置以將額外經編碼信號包括于經多路復用信號S70中(例如,作為可分部 分)。
圖3a及圖3b展示兩個不同實施方案實例中的寬帶語音信號SIO、窄帶信號S20及 高帶信號S30的相對帶寬。在這些特定實例的兩者中,寬帶語音信號S10具有16 kHz 的取樣速率(表示在0到8 kHz的范圍內的頻率分量),且窄帶信號S20具有8 kHz的 取樣速率(表示0到4 kHz的范圍內的頻率分量),但所述速率及范圍不為對本文所描 述的原理的限制,可將其應用于任何其它取樣速率及/或頻率范圍。
在圖3a的實例中,在兩個子帶之間不存在顯著重疊。可將如在此實例中的高帶信 號S30向下取樣為8 kHz的取祥速率。在圖3b的替代實例中,上部子帶與下部子帶具 有明顯重疊,使得兩個子帶信號均描述3.5到4 kHz的區域。可將如在此實例中的高帶 信號S30向下取樣為7 kHz的取樣速率。如在圖3b的實例中提供子帶之間的重疊可允 許編碼系統使用在重疊區域上具有平滑滾落(ralloff)的低通及/或高通濾波器及/或可提 高重疊區域中的再現頻率分量的質量。
在用于電話通信的典型手機中,轉換器(即,麥克風及耳機或揚聲器)中的一者或 一者以上缺乏7-8kHz的頻率范圍內的明顯響應。在圖3b的實例中,經編碼信號中不包 括寬帶語音信號S10的在7 kHz與8 kHz之間的部分。高通濾波器130的其它特定實例 具有3.5-7.5 kHz及3.5-8 kHz的通帶。
編碼器可經配置以產生感知上類似于原始信號但實際上顯著不同于原始信號的合 成信號。舉例來說,從如本文所述的窄帶殘余導出高帶激發的編碼器可產生此信號,因 為實際高帶殘余可完全不存在于經解碼信號中。在這些情況下,在子帶之間提供重疊可 支持低帶與高帶的平滑摻合,此摻合可導致較少可聽假象及/或從一頻帶到另一頻帶的較 不顯著的過渡。
濾波器組AU0及B120的低帶及高帶路徑可經配置以具有除兩個子帶的重疊以外完 全無關的頻譜。我們將兩個子帶的重疊界定為從高帶濾波器的頻率響應下降到-20dB的 點直到低帶濾波器的頻率響應下降到-20 dB的點的距離。在濾波器組A110及/或B120 的各種實例中,此重疊在約200 Hz到約1 kHz的范圍內。約400 Hz到約600 Hz的范圍
可表示編碼效率與感知平滑度之間的所要折衷。在以上提及的一特定實例中,重疊在500
12可能需要實施濾波器組A110及/或B120以在若干階段中計算如圖3a及圖3b中所 說明的子帶信號。可在沃斯(Vos)等人于2006年4月3日申請的標題為"用于語音信 號濾波的系統、方法和設備(SYSTEMS, METHODS, AND APPARATUS FOR SPEECH SIGNAL FILTERING)"的代理人案號050551的美國專利申請案中的圖3a、圖3b、圖 4c、圖4d及圖33到圖39b及所附文本(包括段落
-
)處找到關于濾波器 組A110及B120的特定實施方案的元件的響應的額外描述及圖,且出于提供關于濾波器 組A110及/或B120的額外揭示內容的目的,此材料藉此在允許以引用的方式并入的美 國及任何其它管轄區中以引用的方式并入。
高帶信號S30可包括可能對于編碼不利的高能量的脈沖("突發")。例如寬帶語音 編碼器A100的語音編碼器可經實施以包括突發抑制器(例如,如在沃斯(Vos)等人于 2006年4月3 bJ申請的標題為"用于高帶突發抑制的系統、方法和設備SYSTEMS, METHODS, AND APPARATUS FOR HIGHBAND BURST SUPPRESSION"的代理人案號 050549的美國專利申請案中所描述)以在(例如,通過高帶編碼器A200)編碼之前濾 波高帶信號S30。
通常根據源-濾波器模型來各自實施窄帶編碼器A120及高帶編碼器A200,所述源-濾波器模型將輸入信號編碼為(A)描述濾波器的一組參數及(B)驅動所描述的濾波器 產生輸入信號的經合成再現的激發信號。圖4a展示語音信號的頻譜包絡的實例。表現 此頻譜包絡的特征的峰值表示聲道的共振且被稱為共振峰。大多數語音編碼器將至少此 粗略頻譜結構編碼為例如濾波器系數的一組參數。
圖4b展示如應用于窄帶信號S20的頻譜包絡編碼的基本源-濾波器布置的實例。分 析模塊計算表現對應于一時間周期(通常20毫秒(msec))內的語音的濾波器的特征的 一組參數。根據那些濾波器參數而配置的白化濾波器(還稱為分析或預測誤差濾波器) 移除頻譜包絡,從而以頻譜方式平坦化信號。所得白化信號(還稱為殘余)具有較少能 量,且因此具有較小變化且比原始語音信號更容易編碼。由殘余信號的編碼產生的誤差 還可更均勻地散布于頻譜上。濾波器參數及殘余通常經量化以經由信道有效傳輸。在解 碼器處,根據濾波器參數而配置的合成濾波器由信號基于殘余而激發,以產生原始語音 的經合成版本。合成濾波器通常經配置以具有傳遞函數,所述傳遞函數為白化濾波器的 傳遞函數的倒數。
圖5展示窄帶編碼器A120的基本實施方案A122的框圖。在此實例中,線性預測 編碼(LPC)分析模塊210將窄帶信號S20的頻譜包絡編碼為一組線性預測(LP)系數
13(例如,全極濾波器的系數1/A (z))。分析模塊通常將輸入信號處理為一系列非重疊幀,其中針對每一幀計算一組新系數。幀周期一般為在其內信號可被預期為在位置上固定的周期; 一常見實例為20毫秒(等效于以8kHz的取樣速率的160個樣本)。在一實例中,LPC分析模塊210經配置以計算一組十個LP濾波器系數來表現每一20毫秒幀的共振峰結構的特征。還可能實施分析模塊以將輸入信號處理為一系列重疊幀。
分析模塊可經配置以直接分析每一幀的樣本,或所述樣本可根據開窗函數(例如,漢明窗口 (Hamming window))而先加權。還可在一大于幀的窗口 (例如30毫秒的窗口)上執行分析。此窗口可為對稱的(例如5-20-5,使得其在20毫秒幀之前及之后立即包括5毫秒)或非對稱的(例如10-20,使得其包括先前幀的最后IO毫秒)。一LPC分析模塊通常經配置以使萊文森-德賓(用Levinson-Durbin)遞歸或勒魯-古伊古恩(Leroux-Gueguen)算法來計算LP濾波器系數。在另一實施方案中,分析模塊可經配置以針對每一幀計算一組倒頻譜系數而并非一組LP濾波器系數。
通過量化濾波器參數,編碼器A120的輸出速率可顯著降低,艮對再現質量具有相對較少影響。線性預測濾波器系數難以有效量化且通常映射為量化及/或熵編碼的另一表示,例如線頻譜對(LSP)或線頻譜頻率(LSF)。在圖5的實例中,LP濾波器系數到LSF變換220將所述組LP濾波器系數變換為一組對應的LSF。 LP濾波器系數的其它一對一表示包括部分自相關系數;對數面積比值;導抗頻譜對(ISP);及導抗頻譜頻率(ISF),以上均用于GSM (全球移動通信系統)AMR-WB (自適應多速率寬帶)編解碼器。通常, 一組LP濾波器系數與一組對應的LSF之間的變換為可逆的,但配置還包括編碼器A120的實施方案,其中變換不能無誤差地可逆。
量化器230經配置以量化所述組窄帶LSF (或其它系數表示),目.窄帶編碼器A122經配置以將此量化結果作為窄帶濾波器參數S40而輸出。此量化器通常包括將輸入向量編碼為表或碼簿中的對應向量條目的索引的向量量化器。
圖9展示高帶編碼器A200的實施方案A202的框圖。高帶編碼器A202的分析模塊A210、變換410及量化器420可根據如上文所述的窄帶編碼器A122的對應元件(即,分別為LPC分析模塊210、變換220及量化器230)來實施,但可能需要將較低階LPC分析用于高帶。甚至可能在不同時間使用相同結構(例如,門陣列)及/或指令集合(例如,若干行碼)實施這些窄帶及高帶編碼器元件。如下文所描述,窄帶編碼器A120及高帶編碼器A200的操作相對于殘余信號的處理而不同。
如圖5中所見,窄帶編碼器A122還通過使窄帶信號S20通過白化濾波器260 (還
稱為分析或預測誤差濾波器)而產生殘余信號,所述白化濾波器260根據所述組濾波器
14系數而經配置。在此特定實例中,白化濾波器260經實施為FIR濾波器,但也可使用IIR 實施方案。此殘余信號通常將含有語音幀的感知上重要信息(例如與音高相關的長期結 構),其未表示在窄帶濾波器參數S40中。量化器270經配置以計算此殘余信號的量化 表示以作為經編碼窄帶激發信號S50而輸出。此量化器通常包括將輸入向量編碼為一表 或碼簿中的對應向量條目的索引的向量量化器。或者,此量化器可經配置以發送一個或
一個以上參數,向量可在解碼器處叢所述一個或一個以上參數動態產生,而并非如稀疏 碼簿方法中叢存儲裝置檢索。此方法用于例如代數CELP (碼簿激發線性預測)的編碼 方案中及例如3GPP2 (第三代合作伙伴計劃2) EVRC (增強型可變速率編解碼器)的 編解碼器中。
需要窄帶編碼器A120根據將可用于對應窄帶解碼器的相同濾波器參數值而產生經 編碼窄帶激發信號。以此方式,所得經編碼窄帶激發信號可已在某種程度上計及所述參 數值的非理想性,例如量化誤差。因此,需要使用將可用于解碼器處的相同系數值來配 置白化濾波器。在如圖5所示的編碼器A122的基本實例中,逆量化器240去量化窄帶 編碼參數S40, LSF到LP濾波器系數變換250將所得值映射回到一組對應的LP濾波器 系數,且此組系數用于配置白化濾波器260以產生由量化器270量化的殘余信號。
窄帶編碼器A120的某些實施方案經配置以通過識別一組碼簿向量中與殘余信號最 佳匹配的一者來計算經編碼窄帶激發信號S50。然而,注意到,窄帶編碼器A120還可 經實施以計算殘余信號的經量化表示,而實際上并不產生殘余信號。舉例來說,窄帶編 碼器A120可經配置以使用若干個碼簿向量來產生對應經合成信號(例如,根據一組當 前濾波器參數),且選擇與在感知加權域中與原始窄帶信號S20最佳匹配的所產生信號 相關聯的碼簿向量。
即使在白化濾波器已叢窄帶信號S20移除粗略頻譜包絡之后,仍可保留一相當量的 精密諧波結構(尤其對于有聲語音來說)。圖7a展示例如元音的有聲信號的殘余信號(如 可由白化濾波器產生)的一實例的頻譜曲線。此實例中可見的周期性結構與音高相關, 且由同一說話者所說的不同有聲聲音可具有不同共振峰結構但具有類似音高結構。圖7b 展示此殘余信號的一實例的時域曲線,其按時間展示一音高脈沖序列。
窄帶編碼器A120可包括經配置以編碼窄帶信號S20的長期諧波結構的一個或一個 以上模塊。如圖8所示, 一可使用的典型CELP范例包括一開環LPC分析模塊,其編碼 短期特征或粗略頻譜包絡,之后為一閉環長期預測分析階段,其編碼精細音高或諧波結 構。短期特征經編碼為濾波器系數,且長期特征經編碼為例如音高滯后及音高增益的參 數值。舉例來說,窄帶編碼器A120可經配置以輸出為包括一個或一個以上碼簿索引(例
15如,固定碼簿索引及自適應碼簿索引)及對應增益值的形式的經編碼窄帶激發信號S50。 窄帶殘余信號的此經量化表示的計算(例如,由量化器270進行)可包括選擇所述索引 及計算所述值。音高結構的編碼還可包括內插音高原型波形,此操作可包括計算連續音 高脈沖之間的差值。可針對對應于無聲語音(其通常像噪聲且未結構化)的幀停用長期 結構的模型化。
圖6展示窄帶解碼器B110的實施方案B112的框圖。逆量化器310去量化窄帶濾波 器參數S40 (在此情況下,到一組LSF),且LSF到LP濾波器系數變換320將LSF變換 成一組濾波器系數(例如,如上文參考窄帶編碼器A122的逆量化器240及變換250所 描述)。逆量化器340去量化窄帶殘余信號S40以產生窄帶激發信號S80。基于濾波器系 數及窄帶激發信號S80,窄帶合成濾波器330合成窄帶信號S90。換句話說,窄帶合成 濾波器330經配置以根據所述經去量化的濾波器系數而頻譜成形窄帶激發信號S80,以 產生窄帶信號S90。窄帶解碼器B112還向高帶編碼器A200提供窄帶激發信號S80,所 述高帶編碼器A200使用信號S80而導出如本文所述的高帶激發信號S120。在如下文所 述的某些實施方案中,窄帶解碼器BU0可經配置以向高帶解碼器B200提供與窄帶信號 相關的額外信息,例如頻譜傾斜、音高增益及滯后,及語音模式。
窄帶編碼器A122與窄帶解碼器B112的系統為一分析合成語音編解碼器 (analysis-by-synthesis speech codec)的基本實例。碼簿激發線性預測(CELP)編碼為一 系列普遍的分析合成編碼,且所述編碼器的實施方案可執行殘余的波形編碼,包括例如 叢固定及自適應碼簿中選擇條目、誤差最小化操作及/或感知加權操作的操作。分析合成 編碼的其它實施方案包括混合激發線性預測(MELP)、代數CELP(ACELP)、松弛CELP (RCELP)、規則脈沖激發(RPE)、多脈沖CELP(MPE)及向量和激發線性預測(VSELP) 編碼。相關編碼方法包括多帶激發(MBE)及原型波形內插(PWI)編碼。標準化分析 合成語音編解碼器的實例包括ETSI(歐洲電信標準協會)-GSM全速率編解碼器(GSM 06.10),其使用殘余激發線性預測(RELP); GSM增強型全速率編解碼器(ETSI-GSM 06.60); ITU (國際電信聯合會)標準11.8 kb/sG.729附錄E編碼器;用于IS-I36(時分 多址方案)的IS (臨時標準)-641編解碼器;GSM自適應多速率(GSM-AMR)編解碼 器;及4GV (第四代聲碼器 )編解碼器(QUALCOMM公司(QUALCOMM Incorporated),加利福尼亞,圣地亞哥(San Diego, CA))。窄帶編碼器A120及對應解 碼器B110可根據這些技術中的任一者、或將語音信號表示為(A)描述濾波器的一組參 數及(B)用以驅動所述濾波器以再現語音信號的激發信號的任何其它語音編碼技術(無 論已知的還是待研發的)而實施。
16高帶編碼器A200經配置以根據源-濾波器模型編碼高帶信號S30。舉例來說,高帶 編碼器A200通常經配置以執行高帶信號S30的LPC分析以獲取描述信號的頻譜包絡的 一組濾波器參數。如在窄帶方面,用于激發此濾波器的源信號可從LPC分析的殘余導出 或另外基于LPC分析的殘余。然而,高帶信號S30通常感知上不如窄帶信號S20顯著, 且對于經編碼語音信號包括兩個激發信號可能為高代價的。為了減小傳遞經編碼寬帶語 音信號所需的位速率,對于高帶可能需要替代地使用一模型化激發信號。舉例來說,用 于高帶濾波器的激發可基于經編碼窄帶激發信號S50。
圖9展示高帶編碼器A200的實施方案A202的框圖,所述高帶編碼器A200經配置 以產生高帶編碼參數S60的流,包括高帶濾波器參數S60a及高帶增益因子S60b。高帶 激發產生器A300從經編碼窄帶激發信號S50導出高帶激發信號S120。分析模塊A210 產生表現高帶信號S30的頻譜包絡的特征的一組參數值。在此特定實例中,分析模塊 A210經配置以執行LPC分析來產生高帶信號S30的每一幀的一組LP濾波器系數。線 性預測濾波器系數到LSF變換410將所述組LP濾波器系數變換為一組對應的LSF。如 上文參考分析模塊210及變換220所述,分析模塊A210及/或變換410可經配置以使用 其它系數組(例如,倒頻譜系數)及/或系數表示(例如,ISP)。
量化器420經配置以量化所述組高帶LSF (或其它系數表示,例如ISP),且高帶編 碼器A202經配置以輸出此量化結果作為高帶濾波器參數S60a。此量化器通常包括將輸 入向量編碼為表或碼簿中的對應向量條目的索引的向量量化器。
高帶編碼器A202還包括合成濾波器A220,所述合成濾波器A220經配置以根據高 帶激發信號S120及由分析模塊A210產生的經編碼頻譜包絡(例如,所述組LP濾波器 系數)而產生經合成高帶信號S130。合成濾波器A220通常經實施為IIR濾波器,但還 可使用FIR實施方案。在一特定實例中,合成濾波器A220經實施為六階線性自回歸濾 波器。
在寬帶語音編碼器A100的根據如圖8所示的范例的實施方案中,高帶編碼器A200 可經配置以接收如由短期分析或白化濾波器產生的窄帶激發信號。換句話說,窄帶編碼 器A120可經配置以在編碼長期結構之前將窄帶激發信號輸出到高帶編碼器A200。然而, 需要高帶編碼器A200從窄帶信道接收將由高帶解碼器B200接收的相同編碼信息,以使 得由高帶編碼器A200產生的編碼參數可己在某種程度上計及所述信息的非理想性。因 此,可優選使高帶編碼器A200從待由寬帶語音編碼器A100輸出的相同經參數化及/或 經量化的編碼窄帶激發信號S50重構窄帶激發信號S80。此方法的一潛在優勢在于更準 確地計算高帶增益因子S60b (下文描述)。高帶增益因子計算器A230計算原始高帶信號S30的電平與經合成高帶信號S130 的電平之間的一個或一個以上差值來指定幀的增益包絡。量化器430 (其可實施為將輸 入向量編碼為表或碼簿中的對應向量條目的索引的向量量化器)量化指定增益包絡的 值,且高帶編碼器A202經配置以輸出此量化結果作為高帶增益因子S60b。
本文所述的元件的量化器中的一者或一者以上(例如,量化器230、 420或430)可 經配置以執行分類向量量化。舉例來說,此量化器可經配置以基于已在窄帶信道及/或高 帶信道中的同一幀內經編碼的信息而選擇一組碼簿中的一者。此技術通常以額外碼簿存 儲為代價來增加編碼效率。
在如圖9中所展示的高帶編碼器A200的一實施方案中,合成濾波器A220經布置 以從分析模塊A210接收濾波器系數。高帶編碼器A202的一替代性實施方案包括經配 置以解碼來自高帶濾波器參數S60a的濾波器系數的逆量化器及逆變換,且在此情況下, 替代地,合成濾波器A220經布置以接收經解碼的濾波器系數。此替代性布置可支持高 帶增益計算器A230對增益包絡進行更準確的計算。
在一特定實例中,分析模塊A210及高帶增益計算器A230分別輸出每幀一組六個 LSF與一組五個增益值,以使得僅以每幀十一個額外值即可實現窄帶信號S20的寬帶延 伸。在另一實例中,針對每一幀添加另一增益值以僅以每幀十二個額外值提供寬帶延伸。 耳朵傾向于對高頻率下的頻率誤差較不敏感,使得較低LPC階處的高帶編碼可產生具有 可與較高LPC階處的窄帶編碼相比的感知質量的信號。高帶編碼器A200的典型實施方 案可經配置以輸出每幀8到12位用于頻譜包絡的高質量重構,且輸出每幀另外8到12 位用于臨時包絡的高質量重構。在另一特定實例中,分析模塊A210輸出每幀一組八個 LSF。
高帶編碼器A200的某些實施方案經配置以通過產生具有高帶頻率分量的隨機噪聲 信號并根據窄帶信號S20、窄帶激發信號S80或高帶信號S30的時域包絡來振幅調制所 述噪聲信號而產生高帶激發信號S120。在此情況下,可能需要噪聲產生器的狀態為經編 碼語音信號中的其它信息(例如,同一幀中的信息,例如窄帶濾波器參數S40或其一部 分,及/或經編碼窄帶激發信號S50或其一部分)的確定性函數,使得經編碼的及解碼器 的高帶激發產生器中的對應噪聲產生器可具有相同狀態。雖然基于噪聲的方法可針對無 聲聲音產生適當結果,然而,對于有聲聲音來說可能為不合需要的,其殘余通常為諧波 的目.因此具有某周期結構。
高帶激發產生器A300經配置以獲得窄帶激發信號S80 (例如,通過去量化經編碼 窄帶激發信號S50)及基于窄帶激發信號S80產生高帶激發信號S120。舉例來說,高帶
18激發產生器A300可經實施以使用窄帶激發信號S80的非線性處理來執行一種或一種以 上技術,例如諧波帶寬延伸、頻譜折疊、頻譜平移,及/或諧波合成。在一特定實例中, 高帶激發產生器A300經配置以通過與延伸的信號與經調制噪聲信號的自適應混合相結 合的窄帶激發信號S80的非線性帶寬延伸來產生高帶激發信號S120。高帶激發產生器 A300還可經配置以執行延伸及/或混合信號的抗稀疏(anti-sparseness)濾波。
可在于2006年4月3日申請的標題為"用于高帶激發產生的系統、方法和設備 (SYSTEMS, METHODS, AND APPARATUS FOR HIGHBAND EXCITATION GENERATION)"的美國專利申請案第11/397,870號(沃斯(Vos)等人)中,在圖11 到圖20及所附文本(包括段落


)處找到關于高帶激發產 生器A300及高帶激發信號S120的產生的額外描述及圖,目.出于提供關于高帶激發產生 器A300及/或關于從用于另一子帶的編碼激發信號產生用于一個子帶的激發信號的額外 揭示內容的目的,此材料于此在允許以引用的方式并入的美國及任何其它管轄區中以引 用的方式并入。
圖10展示編碼具有窄帶部分及高帶部分的語音信號的高帶部分的方法M10的流程 圖。任務X100計算表現高帶部分的頻譜包絡的特征的一組濾波器參數。任務X200通 過將非線性函數應用于從窄帶部分導出的信號來計算頻譜延伸信號。任務X300根據(A) 所述組濾波器參數及(B)基于頻譜延伸信號的高帶激發信號來產生經合成高帶信號。 任務X400基于(C)高帶部分的能量與(D)從窄帶部分導出的信號的能量之間的關系 來計算增益包絡。
通常將需要經解碼的信號的臨時特征來使得其表示的原始信號的那些類似。此外, 對于單獨編碼不同子帶的系統來說,可能需要經解碼的信號中的相對臨時特征來使得原 始信號中的那些子帶的相對臨時特征類似。對于經編碼語音信號的準確再現來說,可能 需要經合成寬帶語音信號S100的高帶部分與窄帶部分的電平之間的比率類似于原始寬 帶語音信號S10中的比率。高帶編碼器A200可經配置以包括經編碼語音信3中的描述 或另外基于原始高帶信號的臨時包絡的信息。對于其中高帶激發信號基于來自另一子帶 的信息的情況(例如,經編碼窄帶激發信號S50),可能尤其需要經編碼參數包括描述經 合成高帶信號與原始高帶信號的臨時包絡之間的差值的信息。
除了關于高帶信號S30的頻譜包絡的信息(g卩,如由LPC系數或類似參數值所描述)
之外,可能需要寬帶信號的經編碼參數包括高帶信號S30的臨時信息。除了如由高帶編
碼參數S60a表示的頻譜包絡以外,例如,高帶編碼器A200可經配置以通過指定臨時或
增益包絡來表現高帶信號S30的特征。如圖9所示,高帶編碼器A202包括高帶增益因子計算器A230,所述高帶增益因子計算器A230經配置和布置以根據高帶信號S30與經 合成高帶信號S130之間的關系(例如在一幀或其某部分上兩個信號的能量之間的差值 或比率)來計算一個或一個以上增益因子。在高帶編碼器A202的其它實施方案中,高 帶增益計算器A230可經同樣配置但經替代地布置以根據高帶信號S30與窄帶激發信號 S80或高帶激發信號S120之間的此時間變化關系來計算增益包絡。
窄帶激發信號S80與高帶信號S30的臨時包絡很可能為類似的。因此,基于高帶信 號S30與窄帶激發信號S80 (或從其導出的信號,例如高帶激發信號S120或經合成高 帶信號S130)之間的關系的增益包絡一般將比僅基于高帶信號S30的增益包絡更適于編 碼。
高帶編碼器A202包括經配置以針對高帶信號S30的每一幀計算一個或一個以上增 益因子的高帶增益因子計算器A230,其中每一增益因子基于經合成高帶信號S130與高 帶信號S30的對應部分的臨時包絡之間的關系。舉例來說,高帶增益因子計算器A230 可經配置以計算每一增益因子作為信號的振幅包絡之間的比率或作為信號的能量包絡 之間的比率。在一典型實施方案中,高帶編碼器A202經配置以輸出針對每一幀指定五 個增益因子(例如, 一個用于五個連續子幀中的每一者)的八到十二個位的經量化索弓L 在另一實施方案中,高帶編碼器A202經配置以輸出針對每一幀指定一幀級增益因子的 額外經量化索引。
可將增益因子計算為規范化因子,例如原始信號的能量的測量與經合成信號的能量 的測量之間的比率R。可將所述比率R表達為線性值或為對數值(例如,以一分貝尺度)。 高帶增益因子計算器A230可經配置以針對每一幀計算此規范化因子。替代地或另外, 高帶增益因子計算器A230可經配置以針對每一幀的若干個子幀中的每一者計算一系列 增益因子。在一實例中,高帶增益因子計算器A230經配置以將每一幀(及/或子幀)的 能量計算為平方的和的平方根。
高帶增益因子計算器A230可經配置以將增益因子計算執行為包括一個或一個以上 系列的子任務的任務。圖U展示此任務的實例T200的流程圖,其根據高帶信號S30及 經合成高帶信號S130的對應部分的相對能量來計算經編碼高帶信號的對應部分(例如, 一幀或子幀)的增益值。任務220a及220b計算相應信號的對應部分的能量。舉例來說, 任務220a及220b可經配置以將所述能量計算為相應部分的樣本的平方的和。任務T230 將增益因子計算為那些能量的比率的平方根。在此實例中,任務T230將部分的增益因 子計算為所述部分上的高帶信號S30的能量與所述部分上的經合成高帶信號S130的能 量的比率的平方根。
20可能需要高帶增益因子計算器A230經配置以根據一開窗函數來計算能量。圖12展 示增益因子計算任務T200的此實施方案T210的流程圖。任務T215a將開窗函數應用于 高帶信號S30,目.任務T215b將同一開窗函數應用于經合成高帶信號S130。任務220a 及220b的實施方案222a及222b計算相應窗口的能量,目.任務T230將部分的增益因子 計算為能量比率的平方根。
在針對幀計算增益因子的過程中,可能需要應用重疊相鄰幀的開窗函數。在針對子 幀計算增益因子的過程中,可能需要應用重疊相鄰子幀的開窗函數。舉例來說,產生可 以重疊相加方式應用的增益因子的開窗函數可幫助減小或避免子幀之間的不連續性。在 一實例中,高帶增益因子計算器A230經配置以應用如圖13a所示的梯形開窗函數,其 中窗口重疊兩個相鄰子幀中的每一者達一毫秒。圖13b展示將此開窗函數應用于一 20 毫秒幀的五個子幀中的每一者。高帶增益因子計算器A230的其它實施方案可經配置以 應用具有不同重疊周期及/或可為對稱或非對稱的不問窗口形狀(例如,矩形、漢明)的 開窗函數。高帶增益因子計算器A230的一實施方案還可能經配置以將不同開窗函數應 用于一幀內的不同子幀,及/或一幀也可能包括具有不同長度的子幀。在一特定實施方案 中,高帶增益因子計算器A230經配置以使用如圖13a及圖13b中所展示的梯形開窗函 數計算子幀增益因子目.還經配置以在不使用開窗函數的情況下計算幀級增益因子。
在無限制的情況下,將下列值呈現為特定實施方案的實例。假設這些情況使用一20 毫秒幀,但可使用任何其它持續時間。對于以7kHz取樣的高帶信號來說,每一幀具有 140個樣本。如果將此幀分成具有相等長度的五個子幀,則每一子幀將具有28個樣本, 且如圖13a中所示的窗口將為42個樣本寬。對于以8kHz取樣的高帶信號來說,每一幀 具有160個樣本。如果將此幀分成具有相等長度的五個子幀,則每一子幀將具有32個 樣本,且如圖13a所示的窗口將為48個樣本寬。在其它實施方案中,可使用具有任何 寬度的子幀,目.高帶增益計算器A230的實施方案甚至可能經配置以針對幀的每一樣本 產生一不同增益因子。
如上所述,高帶編碼器A202可包括高帶增益因子計算器A230,所述高帶增益因子 計算器A230經配置以根據高帶信號S30與基于窄帶信號S20的信號(例如窄帶激發信 號S80、高帶激發信號S120或經合成高帶信號S130)之間的時間變化關系來計算一系 列增益因子。圖14a展示高帶增益因子計算器A230的實施方案A232的框圖。高帶增益 因子計算器A232包括包絡計算器G10的實施方案G10a,其經布置以計算第一信號的 包絡;及包絡計算器G10的實施方案G10b,其經布置以計算第二信號的包絡。包絡計
算器G10a及G10b可為等同的或可為包絡計算器G10的不同實施方案的實例。在某些
21情況下,可將包絡計算器G10a及G10b實施為經配置以在不同時間處理不同信號的相同
結構(例如,門陣列)及/或指令集合(例如,若干行碼)。
包絡計算器G10a及G10b可各經配置以計算振幅包絡(例如,根據絕對值函數)或 能量包絡(例如,根據平方函數)。通常,每一包絡計算器G10a、 G10b經配置以計算相 對于輸入信號而子取樣的包絡(例如,針對輸入信號的每一幀或子幀具有一值的包絡)。 如以上參看(例如)圖11到圖13b所述,包絡計算器G10a及/或G10b可經配置以根據 開窗函數(其可經布置以重疊相鄰幀及/或子幀)來計算包絡。
因子計算器G20經配置以根據隨時間的兩個包絡之間的時間變化關系來計算一系 列增益因子。在上文所述的一實例中,因子計算器G20將每一增益因子計算為對應子幀 上的包絡的比率的平方根。或者,因子計算器G20可經配置以基于包絡之間的距離(例 如在對應子幀期間包絡之間的差值或有正負號的平方差值)來計算每一增益因子。可能 需要配置因子計算器G20,從而以分貝或其它以對數方式按比例縮放形式來輸出增益因 子的經計算值。舉例來說,因子計算器G20可經配置以將兩個能量值的比率的對數計算 為能量值的對數的差值。
圖14b展示包括高帶增益因子計算器A232的一般化布置的框圖,其中包絡計算器 G10a經布置以基于窄帶信號S20計算信號的包絡,包絡計算器G10b經布置以計算高帶 信號S30的包絡,且因子計算器G20經配置以輸出高帶增益因子S60b (例如,到量化 器430)。在此實例中,包絡計算器G10a經布置以計算從中間處理Pl所接收的信號的 包絡,其可包括如本文所述的經配置以執行窄帶激發信號S80的計算、高帶激發信號 S120的產生,及/或高帶信號S130的合成的結構及/或指令。為方便起見,假設包絡計 算器G10a經布置以計算經合成高帶信號S130的包絡,但其中包絡計算器G10a經布置 以計算窄帶激發信號S80或高帶激發信號S120的包絡的實施方案替代地被明確地涵蓋 并在此被揭示。
如上所述,可能需要以兩個或兩個以上不同時間分辨率獲得增益因子。舉例來說, 可能需要高帶增益因子計算器A230經配置以針對待編碼的高帶信號S30的每一幀計算 幀級增益因子及一系列子幀增益因子兩者。圖15展示高帶增益因子計算器A232的實施 方案A234的框圖,其包括包絡計算器G10的實施方案G10af、 G10as,實施方案G10af、 G10as經配置以分別計算第一信號(例如,經合成高帶信號S130,雖然其中包絡計算器 G10af、 G10as經布置以計算窄帶激發信號S80或高帶激發信號S120的包絡的實施方案 被明確地涵蓋并在此被揭示)的幀級包絡及子幀級包絡。高帶增益因子計算器A234還 包括包絡計算器G10b的實施方案G10bf、 G10bs,實施方案G10bf、 G10bs經配置以分別計算第二信號(例如,高帶信號S30)的幀級包絡及子幀級包絡。
包絡計算器G10af及G10bf可為等同的或可為包絡計算器G10的不同實施方案的實 例。在某些情況下,可將包絡計算器G10af及G10bf實施為經配置以在不同時間處理不 同信號的相同結構(例如,門陣列)及/或指令集合(例如,若干行碼)。同樣,包絡計 算器G10as及G10bs可為等同的,可為包絡計算器G10的不同實施方案的實例,或可被 實施為相同結構及/或指令集合。甚至可能在不同時間將所有四個包絡產生器G10af、 G10as、 G10bf及G10bs實施為相同可配置結構及/或指令集合。
如本文所描述的因子計算器G20的實施方案G20f、 G20s經布置以基于相應包絡計 算幀級增益因子S60bf及子幀級增益因子S60bs。可被實施為乘法器或除法器以適合特 定設計的規范化器N10經布置以根據對應幀級增益因子S60bf (例如,在量化子幀增益 因子之前)規范化每-一組子幀增益因子S60bs。在某些情況下,可能需要通過量化幀級 增益因子S60bf及接著使用對應去量化值來規范化子幀增益因子S60bs來獲得可能更精 確的結果。
圖16展示高帶增益因子計算器A232的另一實施方案A236的框圖。在此實施方案 中,如圖15中所展示的各種包絡及增益計算器經重新布置,使得在計算包絡之前對第 一信號執行規范化。可將規范化器N20實施為乘法器或除法器以適合特定設計。在某些 情況下,可能需要通過量化幀級增益因子S60bf及接著使用對應去量化值來規范化第一 信號來獲得可能更精確的結果。
量化器430可根據任何已知技術來實施或經開發以執行被認為適用于特定設計的標 量及/或向量量化的一個或一個以上方法。量化器430可經配置以從子幀增益因子分別量 化幀級增益因子。在一實例中,使用四位查找表量化器量化每一幀級增益因子S60bf, 且使用四個位向量量化每一幀的所述組子幀增益因子S60bs。此方案用于有聲語音幀的 EVRC-WR編碼器中(如在3GPP2文件C.S0014-C版本0.2的節4.18.4中所述,在 www.3gpp2.org處可得)。在另一實例中,使用七位標量量化器來量化每一幀級增益因子 S60bf,目.使用每級具有四個位的多級向量量化器來向量量化每一幀的所述組子幀增益 因子S60bs。此方案用于無聲語音幀的EVRC-WB編碼器中(如在上文所引用的3GPP2 文件C.S0014-C版本0.2的節4.18.4中所述)。在其它方案中,還可能將每一幀級增益因 子與用于所述幀的子幀增益因子一起量化。
量化器通常經配置以將輸入值映射到一組離散輸出值中的一者。有限數目的輸出值 可用,使得一范圍的輸入值被映射到單一輸出值。量化增加了編碼效率,因為指示對應 輸出值的索引可以少于原始輸入值的位而被傳輸。圖17展示可由標量量化器執行的一
23維映射的一實例,其中(2nD-l) /2與(2nD+l) /2之間的輸入值被映射到輸出值nD (對 于整數n)。
還可將量化器實施為向量量化器。舉例來說,通常使用向量量化器來量化每一幀的 所述組子幀增益因子。圖18展示由向量量化器執行的多維映射的一簡單實例。在此實 例中,輸入空間被分成若干個沃羅諾伊(Voronoi)區域(例如,根據最鄰近準則)。量 化將每一輸入值映射到表示對應沃羅諾伊(Voronoi)區域(通常為質心)(此處展示為 一點)的值。在此實例中,輸入空間分成六個區域,以使得任何輸入值可由僅具有六個 不同狀態的索引來表示。
圖19a展示如可由標量量化器執行的一維映射的另一實例。在此實例中,將從某初 始值a (例如,0dB)延伸到某終點值b (例如,6dB)的輸入空間劃分為n個區域。n 個區域中的每一者中的值由n個量化值q
到q[n-l]中的對應值表示。在一典型應用中, 所述組n個量化值可用于編碼器及解碼器,使得量化索引(0到n-l)的傳輸足以將量化 值從編碼器傳遞到解碼器。舉例來說,可將所述組量化值存儲于每一裝置內的有序列表、 表或碼簿中。
盡管圖19a展示劃分為n個有相等大小的區域的輸入空間,但可能需要替代地使用 不同大小的區域來劃分輸入空間。可通過根據輸入數據的預期分布來分配量化值來獲得 更精確的平均結果是可能的。舉例來說,可能需要獲得輸入空間的預期被更頻繁觀測的 區域中的較高分辨率(即,較小量化區域),及其它區域處的較低分辨率。圖19b展示 此映射的一實例。在另一實例中,量化區域的大小隨振幅從a增長到b (例如,以對數 方式)而增加。不同大小的量化區域還可用于向量量化中(例如,如圖18中所展示)。 在量化幀級增益因子S60bf的過程中,量化器430可經配置以按需要應用一均勻或不均 勻的映射。同樣,在量化子幀增益因子S60bs的過程中,量化器430可經配置以按需要 應用一均勻或不均勻的映射。量化器430可經實施以包括用于因子S60bf及S60bs的單 獨量化器及/或可經實施以使用相同可配置結構及/或指令集合來在不同時間量化不同的 增益因子流。
如上文所述,高帶增益因子S60b編碼原始高帶信號S30的包絡與基于窄帶激發信 號S80的信號(例如,經合成高帶信號S130)的包絡之間的時間變化關系。此關系可在 解碼器處經重構,使得經解碼的窄帶及高帶信號的相對電平近似原始寬帶語音信號S10 的窄帶及高帶分量的相對電平。
如果經解碼的語音信號中的各種子帶的相對電平不準確,可出現可聽假象。舉例來 說,當經解碼的高帶信號相對于對應的經解碼窄帶信號具有比在原始語音信號中更高的
24電平(例如,更高能量)時,可出現顯著假象。可聽假象可能有損于用戶的體驗且降低 編碼器的感覺質量。為了獲得感知上良好的結果,可能需要子帶編碼器(例如,高帶編 碼器A200)在將能量分配給經合成信號的過程中為守恒的。舉例來說,可能需要使用 一守恒量化方法來編碼經合成信號的增益因子值。
由電平不平衡引起的假象對于其中從另一子帶導出對經放大子帶的激發的情形可 能尤其有害。此假象可發生于(例如)高帶增益因子S60b被量化成大于其原始值的值 時。圖19c說明增益因子值R的經量化的值大于原始值的一實例。所述經量化的值在本 文中表示為q[iR],其中iR指示與值R相關聯的量化索引且q卜]指示獲得由給定索引識別 的量化值的運算。
圖20a展示根據一一般實施方案的增益因子限制的方法M100的流程圖。任務TQ10 針對子帶信3的一部分(例如, 一幀或子幀)的增益因子計算值R。舉例來說,任務TQIO 可經配置以將所述值R計算為原始子帶幀的能量與經合成子帶幀的能量的比率。或者, 增益因子值R可為此比率的對數(例如,以10為底)。任務TQ10可由如上文所描述的 高帶增益因子計算器A230的實施方案來執行。
任務TQ20量化增益因子值R。此量化可由標量量化(例如,如本文所描述)的任 何方法或被認為適用于特定編碼器設計的任何其它方法(例如,向量量化方法)來執行。 在一典型應用中,任務TQ20經配置以識別對應于輸入值R的量化索引iR。舉例來說, 任務TQ20可經配置以通過根據所要的搜索策略(例如,最小誤差算法)將R的值與量 化列表、表或碼簿中的條目進行比較來選擇索引。在此實例中,假設量化表或列表是以 搜索策略的下降次序(即,使得q[i-l]《q[i])布置的。
任務TQ30評估經量化增益值與原始值之間的關系。在此實例中,任務TQ30將經 量化增益值與原始值進行比較。如果任務TQ30發現R的經量化值不大于R的輸入值, 則方法M100結束。然而,如果任務TQ30發現R的量化值超過R的輸入值,則任務TQ50 執行為R選擇一不同的量化索弓l。舉例來說,任務TQ50可經配置以選擇一指示小于q[iR] 的量化值的索引。
在一典型實施方案中,任務TQ50選擇量化列表、表或碼簿中的下一最低值。圖20b 展示包括任務TQ50的此實施方案TQ52的方法M100的一實施方案M110的流程圖,其 中任務TQ52經配置以遞減量化索引。
在某些情況下,可能需要允許R的經量化值超過R的值某一標稱量。舉例來說,可 能需要允許R的經量化值超過R的值預期對感知質量具有可接受的較低影響的某一量或 比例。圖20c展示用于方法M100的此實施方案M120的流程圖。方法M120包括將R
25的經量化值與大于R的上限進行比較的任務TQ30的一實施方案TQ32。在此實例中, 任務TQ32將q[iR]與R與閾值T!的乘積進行比較,其中T,具有大于但接近一 (例如, 1.1或1.2)的值。如果任務TQ32發現經量化值小于(或者,不大于)乘積,則任務TQ50 的實施方案執行。任務TQ30的其它實施方案可經配置以確定R的值與R的經量化值之 間的差值是否符合及/或超過 一 閾值。
在某些情況下,與原始量化值相比,針對R選擇一較低量化值將引起經解碼的信號 之間的較大差異為可能的。舉例來說,此情形可發生于q[^-l]遠小于R的值時。方法 M100的其它實施方案包括任務TQ50的執行或配置是視候選量化值(例如,q[iR-l])的 測試而定的方法。
圖20d展示方法M100的此實施方案M130的流程圖。方法M130包括將候選量化 值(例如,q[iR-l])與小于R的下限進行比較的任務TQ40。在此實例中,任務TQ40 將q[W與R與閾值T2的乘積進行比較,其中T2具有小于但接近一 (例如,0.8或0.9) 的值。如果任務TQ40發現候選量化值不大于(或者,小于)乘積,則方法M130結束。 如果任務TQ40發現經量化值大于(或者,不小于)乘積,則任務TQ50的實施方案執 行。任務TQ40的其它實施方案可經配置以確定候選量化值與R的值之間的差值是否符 合及/或超過一閾值。
可將方法M100的一實施方案應用于幀級增益因子S60bf及/或子幀增益因子S60bs。 在一典型應用中,僅將此方法應用于幀級增益因子。在方法針對幀級增益因子選擇新量 化索引的情況下,可能需要基于幀級增益因子的新的經量化值來重新計算對應子幀增益 因子S60bs。或者,子幀增益因子S60bs的計算可經布置以在已對對應幀級增益因子執 行增益因子限制的方法之后發生。
圖21展示高帶編碼器A202的實施方案A203的框圖。編碼器A203包括增益因子 限制器L10,所述增益因子限制器L10經布置以接收經量化的增益因子值及其原始(即, 預量化)值。限制器L10經配置以根據那些值之間的關系輸出高帶增益因子S60b。舉 例來說,限制器L10可經配置以執行如本文所描述的方法M100的實施方案來將高帶增 益因子S60b輸出為一個或一個以上量化索引流。圖22展示高帶編碼器A203的實施方 案A204的框圖,其經配置以輸出如由量化器430所產生的子幀增益因子S60bs及經由 限制器L10輸出幀級增益因子S60bf。
圖23a展示限制器L10的實施方案L12的操作圖。限制器L12將R的預量化值與
后量化值進行比較以確定q[W是否大于R。如果此表達為真,則限制器L12通過將索引
iK的值遞減一來選擇另一量化索引以產生R的新量化值。否則,不改變索引iR的值。圖23b展示限制器L10的另一實施方案L14的操作圖。在此實例中,將經量化值與 R的值與閾值T,的乘積進行比較,其中T,具有大于但接近一 (例如,1.1或1.2)的值。 如果q[iR]大于(或者,不小于)T,R,則限制器L14遞減索引iR的值。
圖23c展示限制器L10的另一實施方案L16的操作圖,其經配置以確定提議替代當 前量化值的量化值是否足夠接近R的原始值。舉例來說,限制器L16可經配置以執行一 額外比較以確定下一最低索引量化值(例如,q[iR-l])是否在距R的預量化值的指定距 離內,或在R的預量化值的指定比例內。在此特定實例中,將候選量化值與R的值與閾 值T2的乘積進行比較,其中T2具有小于但接近一 (例如,0.8或0.9)的值。如果q[iR-l] 小于(或者,不大于)T2R,則比較失敗。如果對q[W及q[iK-l]執行的比較中的任一者 失敗,則不改變索引k的值。
增益因子之中的變化可能產生經解碼的信號的假象,且可能需要配置高帶編碼器 A200來執行增益因子平滑的方法(例如,通過應用例如一分接頭IIR濾波器(one-tap IIR filter)的平滑濾波器)。可將此平滑應用于幀級增益因子S60bf及/或應用于子幀增益因 子S60bs。在此情況下,如本文所描述的限制器L10及/或M100的實施方案可經布置以 將經量化值iR與R的經預平滑值進行比較。可在于2006年4月21申請的標題為"用于 增益因子平滑的系統、方法和設備(SYSTEMS, METHODS, AND APPARATUS FOR GAIN FACTOR SMOOTHING)"的美國專利申請案第11/408,390號(沃斯(Vos)等人) 中的圖48到圖55b及所附文本(包括段落

)處找到關于此增益因子 平滑的額外描述及圖,且出于提供關于增益因子平滑的額外揭示內容的目的,此材料在 此在允許以引用的方式并入的美國及任何其它管轄區中以引用的方式并入。
如果到量化器的輸入信號非常平滑,則根據量化的輸出空間中的值之間的最小步 長,可能有時經量化的輸出要不平滑得多。此效應可導致可聽假象,且可能需要為增益 因子減小此效應。在某些情況下,增益因子量化性能可通過實施量化器430以并有臨時 噪聲成形來改進。可將此成形應用于幀級增益因子S60bf及/或應用于子幀增益因子 S60bs。可在美國專利申請案第11/408,390號中的圖48到圖55b及所附文本文(包括段 落

)處找到關于使用臨時噪聲成形量化增益因子的額外描述及圖,且 出于提供關于使用臨時噪聲成形量化增益因子的額外揭示內容的目的,此材料在此在允 許以引用的方式并入的美國及任何其它管轄區中以引用的方式并入。
對于高帶激發信號S120是從已被調整的激發信號導出的情況,可能需要根據源激 發信號的時間彎曲來時間彎曲高帶信號S30的臨時包絡。可在沃斯(Vos)等人于2006 年4月3 U申請的標題為"用于高帶時間彎曲的系統、方法和設備(SYSTEMS, METHODS,
27AND APPARATUS FOR HIGHBAND TIME WARPING)"的代理人案號050550的美國專 利申請案中的圖25到圖29及所附文本(包括段落

)處找到關于此時 間彎曲的額外描述及圖,且出于提供關于高帶信號S30的臨時包絡的時間彎曲的額外揭 示內容的目的,此材料在此在允許以引用的方式并入的美國及任何其它管轄區中以引用 的方式并入。
高帶信號S30與經合成高帶信號S130之間的類似程度可指示經解碼高帶信號S100 與高帶信號S30相似的程度。特定來說,高帶信號S30的臨時包絡與經合成高帶信號 S130的臨時包絡之間的類似性可指示可預期經解碼高帶信號S100具有良好聲音質量且 與高帶信號S30感知上類似。可將包絡之間在時間上的大變化認為是經合成信號非常不 同于原始的指示,且在此情況下,可能需要在量化之前識別及衰減那些增益因子。可在 沃斯(Vos)等人于2006年4月21申請的標題為"用于增益因子衰減的系統、方法和 設備(SYSTEMS, METHODS, AND APPARATUS FOR GAIN FACTOR ATTENUATION)" 的代理人案號050558的美國專利申請案中的圖34到圖39及所附文本(包括段落
到[000236p處找到關于此增益因子衰減的額外描述及圖,且出于提供關于增益因子衰 減的額外揭示內容的目的,此材料在此在允許以引用的方式并入的美國及任何其它管轄 區域中以引用的方式并入。
圖24展示高帶解碼器B200的實施方案B202的框圖。高帶解碼器B202包括高帶 激發產生器B300,所述高帶激發產生器B300經配置以基于窄帶激發信號S80而產生高 帶激發信號S120。視特定系統設計選擇而定,高帶激發產生器B300可根據如本文所提 及的高帶激發產生器A300的實施方案中的任一者而被實施。通常需要實施高帶激發產 生器B300以與特定編碼系統的高帶編碼器的高帶激發產生器具有相同響應。然而,因 為窄帶解碼器B110通常將執行經編碼窄帶激發信號S50的去量化,所以在大多情況下, 高帶激發產生器B300可經實施以從窄帶解碼器BUO接收窄帶激發信號S80,且無需包 括經配置以去量化經編碼窄帶激發信號S50的逆量化器。窄帶解碼器B110還可能經實 施以包括反稀疏濾波器600的實例,其經布置以在經去量化的窄帶激發信號被輸入到窄 帶合成濾波器(例如濾波器330)之前對其進行濾波。
逆量化器560經配置以去量化高帶濾波器參數S60a (在此實例中,去量化為一組 LSF),且LSF到LP濾波器系數變換570經配置以將LSF變換為一組濾波器系數(例如, 如上文參考窄帶編碼器A122的逆量化器240及變換250所述)。如上所提及,在其它實 施方案中,可使用不同系數組(例如,倒頻譜系數)及/或系數表示(例如,ISP)。高帶 合成濾波器B200經配置以根據高帶激發信號S120及所述組濾波器系數而產生經合成高
28帶信號。對于高帶編碼器包括合成濾波器的系統來說(例如,如在上文所述的編碼器 A202的實例中),可能需要實施高帶合成濾波器B200以與所屬合成濾波器具有相同響 應(例如,同一傳遞函數)。
高帶解碼器B202還包括逆量化器580,其經配置以去量化高帶增益因子S60b; 及增益控制元件590 (例如,乘法器或放大器),其經配置和布置以將所述經去量化的增 益因子應用于經合成高帶信號以產生高帶信號S100。對于幀的增益包絡由一個以上增益 因子指定的情況來說,增益控制元件590可包括經配置以可能根據與由對應高帶編碼器 的增益計算器(例如,高帶增益計算器A230)所應用的開窗函數相同或不同的開窗函 數而將增益因子應用于相應子幀的邏輯。在高帶解碼器B202的其它實施方案中,增益 控制元件590經類似配置但經布置以將所述經去量化的增益因子應用于窄帶激發信號 S80或高帶激發信號S120。增益控制元件590還可經實施而以一個以上臨時分辨率應用 增益因子(例如,以根據幀級增益因子規范化輸入信號,及根據一組子幀增益因子成形 所得信號)。
窄帶解碼器B110的根據如圖8所示的范例的實施方案可經配置以在已恢復長期結 構(音高或諧波結構)之后將窄帶激發信號S80輸出到高帶解碼器B200。舉例來說, 此解碼器可經配置以輸出窄帶激發信號S80作為經編碼窄帶激發信號S50的經去量化的 版本。當然,還可能實施窄帶解碼器BllO,以使得高帶解碼器B200執行經編碼窄帶激 發信號S50的去量化以獲得窄帶激發信號S80。
盡管將本文所揭示的原理主要描述為應用于高帶編碼,但可將本文所揭示的原理應 用于相對于語音信號的另一子帶的語音信號的一子帶的任何編碼。舉例來說,編碼器濾 波器組可經配置以將低帶信號輸出到低帶編碼器(替代或除一個或一個以上高帶信號之 外),且所述低帶編碼器可經配置以執行所述低帶信號的頻譜分析、延伸經編碼窄帶激 發信號,及相對于原始低帶信號針對經編碼低帶信號計算增益包絡。對于這些操作中的 每一者來說,明確涵蓋及在此揭示低帶編碼器可經配置以根據如本文所描述的全范圍的 變化中的任一者來執行此操作。
提供所描述的配置的前述表達以使得所屬領域的技術人員能夠進行或使用本文所 揭示的結構及原理。對這些配置的各種修改為可能的,且本文中所呈現的一般原理也可 應用于其它配置。舉例來說, 一配置可部分或整體實施為硬連線電路、制造于專用集成 電路中的電路配置、或加載到非易失性存儲裝置中的固件程序或作為機器可讀碼從數據 存儲媒體加載或加載到數據存儲媒體中的軟件程序,此碼為可由邏輯元件的陣列(例如 微處理器或其它數字信號處理單元)執行的指令。數據存儲媒體可為存儲元件的陣列,
29例如半導體存儲器(其可包括(無限制)動態或靜態RAM (隨機存取存儲器)、ROM (只 讀存儲器)及/或快閃RAM),或鐵電、磁阻、雙向、聚合或相變存儲器;或盤媒體,例 如磁盤或光盤。術語"軟件"應理解為包括源碼、匯編語言碼、機器碼、二進制碼、固 件、宏碼、微碼、可由邏輯元件的陣列執行的指令的任何一個或一個以上集合或序列, 及所述實例的任何組合。
高帶增益因子計算器A230、高帶編碼器A200、高帶解碼器B200、寬帶語音編碼器 A100及寬帶語音解碼器B100的實施方案的各種元件可實施為駐留于(例如)同一芯片 上或芯片組中的兩個或兩個以上芯片之間的電子及/或光學裝置,但還涵蓋不具有此限制 的其它布置。此設備的一個或一個以上元件(例如,高帶增益因子計算器A230、量化 器430及/或限制器L10)可整體或部分實施為一組或一組以上指令,所述一組或一組以 上指令經布置以執行于邏輯元件(例如,晶體管、門)的一個或一個以上固定或可編程 陣列,例如微處理器、嵌入式處理器、IP核心、數字信號處理器、FPGA (現場可編程 門陣列)、ASSP (專用標準產品)及ASIC (專用集成電路)上。 一個或一個以上所述元 件還可能具有共同結構(例如,用于在不同時間執行對應于不同元件的碼的部分的處理 器、經執行以在不同時間執行對應于不同元件的任務的一組指令、或在不同時間針對不 同元件執行操作的電子及/或光學裝置的布置)。此外, 一個或一個以上所述元件可能用 于執行任務或執行不與所述設備的操作直接相關的其它組指令,例如與設備嵌入于其中 的裝置或系統的另一操作相關的任務。
配置還包括如本文明確揭示(例如,通過描述經配置以執行所述方法的結構)的語 音編碼、編碼及解碼的額外方法。這些方法中的每一者還可切實地具體化(例如,在上 文列出的一個或一個以上數據存儲媒體中)為可由包括邏輯元件陣列的機器(例如,處 理器、微處理器、微控制器或其它有限狀態機器)讀取及/或執行的一組或一組以上指令。 因此,本發明不希望限于上文所示的配置,但符合與在本文中以任何方式揭示的原理及 新穎特征一致的最廣范圍,包括在如所申請的附加權利要求書中,所述權利要求書形成 原始揭示內容的一部分。
權利要求
1.一種語音處理方法,所述方法包含基于(A)基于語音信號的第一子帶的第一信號的時間的一部分與(B)基于從所述語音信號的第二子帶導出的分量的第二信號的時間的對應部分之間的關系,計算增益因子值;根據所述增益因子值,將第一索引選擇到量化值的有序集合中;評估所述增益因子值與所述第一索引所指示的量化值之間的關系;以及根據所述評估的結果,將第二索引選擇到量化值的所述有序集合中。
2. 根據權利要求1所述的語音處理方法,其中所述第一信號的時間的所述部分為所述 第一信g的幀,目.其中所述第二信號的時間的所述對應部分為所述第二信號的幀。
3. 根據權利要求1所述的語音處理方法,其中所述第一子帶為高帶信號,目.其中所述第二子帶為窄帶信s-。
4. 根據權利要求l所述的語音處理方法,其屮所述第一子帶為高帶信號,且其中所述第二信號為所述高帶信號的經合成版本。
5. 根據權利要求1所述的語音處理方法,其中所述第二信號基于從所述第一子帶導出 的分量。
6. 根據權利要求5所述的語音處理方法,其中所述從所述第一子帶導出的分量為所述 第一子帶的頻譜包絡。
7. 根據權利要求l所述的語音處理方法,其中所述從所述語音信號的第二子帶導出的分量為經編碼激發信s-。
8. 根據權利要求7所述的語音處理方法,其中所述第二信號基于所述第一子帶的頻譜 包絡。
9. 根據權利要求1所述的語音處理方法,其中所述第一信號的時間的一部分與所述第二信號的時間的對應部分之間的所述關系為所述第一信號的時間的所述部分的能 量的測量與所述第二信號的時間的所述對應部分的能量的測量之間的關系。
10. 根據權利要求9所述的語音處理方法,其中所述計算增益因子值包含基于所述第一 信3的時間的所述部分的能量的所述測量與所述第二信號的時間的所述對應部分 的能量的所述測量之間的比率來計算所述增益因子值。
11. 根據權利要求1所述的語音處理方法,其中所述選擇第一索引包含將所述增益因子 值與多個所述量化值中的每一者進行比較。
12. 根據權利要求1所述的語音處理方法,其中所述第一索引指示所述有序集合之中最 接近所述增益因子值的所述量化值。
13. 根據權利要求1所述的語音處理方法,其中所述評估關系包含確定所述第一索引所指示的所述量化值是否超過所述增益因子值。
14. 根據權利要求1所述的語音處理方法,其中所述評估關系包含以下各項中的至少一 者(C)確定所述第一索引所指示的所述量化值是否超過所述增益因子值一特定 量,及(D)確定所述第一索引所指示的所述量化值是否超過所述增益因子值所述 增益因子值的一特定比例。
15. 根據權利要求1所述的語音處理方法,其中所述選擇第二索引包含遞減所述第一索 引。
16. 根據權利要求1所述的語音處理方法,其中所述第二索引指示小于所述第一索引所 指示的所述量化值的量化值。
17. 根據權利要求1所述的語音處理方法,其中所述第二索引指示所述有序集合之中最 接近所述增益因子值而不超過所述增益因子值的所述量化值。
18. 根據權利要求1所述的語音處理方法,其中所述選擇第二索引包含評估所述增益因子值與所述第二索引所指示的量化值之間的關系。
19. 根據權利要求18所述的語音處理方法,其中所述評估所述增益因子值與所述第二 索引所指示的量化值之間的關系包含確定所述第二索引所指示的所述量化值是否 在所述增益因子值的一特定比例內。
20. —種計算機程序產品,其包含計算機可讀媒體,所述計算機可讀媒體包含用于致使至少一個計算機基于(A)基于語音信^的第一子帶的第一信號的時 間的一部分與(B)基于從所述語音信號的第二子帶導出的分量的第二信號的時 間的對應部分之間的關系來計算增益因子值的碼;用于致使至少一個計算機根據所述增益因子值將第一索引選擇到量化值的有 序集合中的碼;用于致使至少一個計算機評估所述增益因子值與所述第一索引所指示的量化 值之間的關系的碼;以及用于致使至少一個計算機根據所述評估的結果將第二索引選擇到量化值的所 述有序集合中的碼。
21. —種用于語音處理的設備,所述設備包含計算器,其經配置以基于(A)基于語音信號的第一子帶的第一信號的時間的一 部分與(B)基于從所述語音信號的第二子帶導出的分量的第二信號的時間的對應 部分之間的關系來計算增益因子值;量化器,其經配置以根據所述增益因子值將第一索引選擇到量化值的有序集合中;以及限制器,其經配置(A)以評估所述增益因子值與所述第一索引所指示的量化 值之間的關系,及(B)以根據所述評估的結果來將第二索引選擇到量化值的所述 有序集合中。
22. 根據權利要求21所述的設備,其中所述第一信號的時間的所述部分為所述第一信 弓-的幀,且其中所述第二信號的時間的所述對應部分為所述第二信號的幀。
23. 根據權利要求21所述的設備,其中所述第一子帶為高帶信號,且其中所述第二子帶為窄帶信號。
24. 根據權利要求21所述的設備,其中所述從所述語音信號的第二子帶導出的分量為 經編碼激發信號。
25. 根據權利要求24所述的設備,其中所述第二信號基于所述第一子帶的頻譜包絡。
26. 根據權利要求21所述的設備,其中所述計算器經配置以基于所述第一信號的時間 的所述部分的能量的測量與所述第二信號的時間的所述對應部分的能量的測量之 間的比率來計算所述增益因子值。
27. 根據權利要求21所述的設備,其中所述限制器經配置以通過確定所述第一索引所 指示的量化值是否超過所述增益因子值來評估所述增益因子值與所述第一索引所 指示的所述量化值之間的關系。
28. 根據權利要求21所述的設備,其中所述限制器經配置以通過以下各項中的至少一 者來評估所述增益因子值與所述第一索引所指示的量化值之間的關系(C)確定 所述第一索引所指示的所述量化值是否超過所述增益因子值一特定量,及(D)確 定所述第一索引所指示的所述量化值是否超過所述增益因子值所述增益因子值的 一特定比例。
29. 根據權利要求21所述的設備,其中所述第二索引指示所述有序集合之中最接近所 述增益因子值而不超過所述增益因子值的所述量化值。
30. 根據權利要求21所述的設備,其中所述限制器經配置以確定所述第二索引所指示 的所述量化值是否在所述增益因子值的一特定比例內。
31. 根據權利要求21所述的設備,所述設備包含具有編碼器的蜂窩電話,所述編碼器 包括所述計算器、所述量化器及所述限制器。
32. 根據權利要求21所述的設備,所述設備包含經配置以傳輸具有符合因特網協議的 版本的格式的多個包的裝置,其中所述多個包包括編碼所述第一子帶的參數、編碼 所述第二子帶的參數及所述第二索引。
33. —種用于語音處理的設備,所述設備包含用于基于(A)基于語音信號的第一子帶的第一信號的時間的一部分與(B)基 于從所述語音信號的第二子帶導出的分量的第二信號的時間的對應部分之間的關 系計算增益因子值的裝置;用于根據所述增益因子值將第一索引選擇到量化值的有序集合中的裝置;以及 用于評估所述增益因子值與所述第一索引所指示的量化值之間的關系及用于根 據所述評估的結果將第二索引選擇到量化值的所述有序集合中的裝置。
34. 根據權利要求33所述的設備,其中所述從所述語音信號的第二子帶導出的分量為 經編碼激發信號。
35. 根據權利要求34所述的設備,其中所述第二信號基于所述第一子帶的頻譜包絡。
36. 根據權利要求33所述的設備,其中所述用于計算的裝置經配置以基于所述第一信 號的時間的所述部分的能量的測量與所述第二信號的時間的所述對應部分的能量 的測量之間的比率來計算所述增益因子值。
37. 根據權利要求33所述的設備,其中所述第二索引指示所述有序集合之中最接近所 述增益因子值而不超過所述增益因子值的所述量化值。
全文摘要
所揭示的配置的范圍包括單獨編碼語音信號的子帶的方法,其中第一子帶的激發是從第二子帶導出。增益因子經計算以指示原始第一子帶的包絡與經合成第一子帶的包絡之間的時間變化關系。所述增益因子經量化,且超過預量化值的經量化值被重新編碼。
文檔編號G10L21/02GK101496101SQ200780028037
公開日2009年7月29日 申請日期2007年7月31日 優先權日2006年7月31日
發明者文卡特什·克里希南, 阿南塔帕德馬那伯罕·A·坎達哈達伊 申請人:高通股份有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
韩国伦理电影