一種電影數字節目的存儲和提取方法與流程

文檔序號：12497282閱讀：1219來源：國知局

本發明涉及一種電影數字節目的存儲和提取方法，是一種計算機數據存儲的方法，是一種將電影膠片或磁帶錄制的電影節目，更改為面向多語種、多渠道便捷利用的制式后，存儲和提取的方法。

背景技術：

電影前期拍攝主要采用膠片拍攝，或近年逐漸興起的數字拍攝。拍攝記錄的聲音、畫面采用分離方式存儲，畫面記錄在膠片中，聲音記錄在錄音帶中。影片后期剪輯過程中，會產生不同語種語音、字幕，電影畫面與多語種語音、字幕組合，形成影片的多種母版，作為后繼影片制作、發行、價值再挖掘的基礎，影片母版需采用盡量高的質量進行存儲。

現有方式是采用錄像帶進行存儲。錄像帶可以同時存儲畫面和聲音，制作人員先將影片畫面錄制到錄像帶中，再尋找畫面聲音的同步點，將聲音逐一錄制到錄像帶的音頻軌道，以便回放時聲音和畫面可以同步還原。同一部影片，不同的語種，需要按照以上方法分別制作多盤錄像帶進行保存。如果要求影片畫面顯示對白字幕，還需錄制更多的錄像帶。

因為影片節目存在多語種多版本的特點，現有錄像帶存儲方式，所需錄像帶量會很大，成本高昂。導致不得不舍棄部分母版的存儲，取而代之的是在將來利用時重新制作。同時錄像帶只能存儲HD規格的影片，對于2K、4K、3D等新的影片規格則無法支持。

技術實現要素：

為解決現有技術的問題，本發明提出一種電影數字節目存儲和提取方法。所述的方法旨在最大程度保證影片聲畫質量的前提下，縮小影片多版本的存儲空間，優化影片存儲制作過程，提高影片應用時的效率。

本發明的目的是這樣實現的：一種電影數字節目的存儲方法，所述方法所使用的系統包括：畫面文件壓縮子系統、音頻采集子系統、聲畫同步子系統、低碼率轉碼子系統、編目子系統、媒資數據庫、多種語言采集子系統、對白字幕制作子系統，所述方法的步驟如下：

畫面文件采集的步驟：用于采集影片畫面母版，如果影片母版畫面源為膠轉磁，則掃描生成圖像序列文件，如果影片母版為數字電影母版，則直接采集為圖像序列文件；

畫面文件壓縮的步驟：用于畫面文件壓縮子系統將圖像序列文件轉碼為無損壓縮視頻文件；

聲音文件采集的步驟：用于音頻采集子系統對影片的錄音帶進行數字化采集，采集生成PCM取樣的多聲道的聲音文件，本步驟或與“畫面文件采集的步驟”和“畫面文件壓縮的步驟”同步進行；

聲畫同步的步驟：用于將分離采集的畫面文件和聲音文件，在聲畫同步子系統中進行聲畫同步，主要方法是在時間線上瀏覽視頻和音頻，以畫面內容為參照物，通過聲音波形、聲音回放尋找音頻與視頻在時間上的偏移量，反復調整便宜量，使得畫面口型與聲音達成匹配，確認偏移量后，鎖定聲音與視頻的同步關系；

轉低碼率的步驟：用于轉碼集群子系統讀取影片的無損壓縮視頻和聲音文件，根據同步關系生成低碼率視音頻流媒體文件，該低碼率文件的時碼與無損壓縮視頻文件的時碼幀幀對應；

編目的步驟：用于參照低碼率視音頻文件，可以對影片進行編目著錄，包括：

對影片的節目層進行編目，填寫影片的基本信息；

瀏覽低碼率視音頻內容，在播放器上標記入點、出點，將入出點間內容記錄為一個片段，對片段進行編目，填寫片段的屬性信息；或基于低碼率標記場景、鏡頭，分別進行詳細編目；編目信息使用媒資數據庫進行存儲；

入庫發布的步驟：用于編目完成后，影片即入庫并對外發布，供用戶檢索瀏覽。

進一步的，所述的存儲方法還包括：

增補多語種聲音采集的步驟：用于音頻采集子系統將每個新增的語種聲音采集為多聲道聲音文件；

多語種聲畫同步的步驟：用于采用庫中母版的低碼率視頻為參照物，在聲畫同步系統中尋找新增語種聲音的時碼便宜量，調整便宜量，使得畫面口型與聲音達成匹配，并鎖定新增語種聲音與畫面的同步關系；

增補文件入庫的步驟：用于將增補的各語種的聲音文件入媒資數據庫存儲；入媒資數據庫后，每部影片存儲的文件分別為一個高分辨率的無損壓縮視頻文件、多語種聲音文件、多聲道聲音文件、多個語種的對白字幕文件、一個低碼率視音頻文件，這些文件間在時碼上是幀幀對應的。

進一步的，所述的存儲方法還包括：

制作對白字幕的步驟：用于采用庫中母版的低碼率視音頻為參照物，在字幕制作系統中，回放視音頻，并根據畫面、聲音逐句制作對白字幕，形成帶時碼信息的對白字幕文件；

增補文件入庫的步驟：用于將增補的各語種的對白字幕文件分別入媒資數據庫存儲；入媒資數據庫后，每部影片存儲的文件分別為一個高分辨率的無損壓縮視頻文件、多語種聲音文件、多聲道聲音文件、多個語種的對白字幕文件、一個低碼率視音頻文件，這些文件間在時碼上是幀幀對應的。

一種提取上述存儲文件的電影數字節目的提取方法，所述方法所使用的系統包括：檢索子系統、瀏覽子系統、下載子系統、轉碼合成子系統、輸出端，所述方法包括如下步驟：

檢索影片的步驟：用于在檢索子系統通過全文、關鍵詞的方式在媒資數據庫中對影片進行檢索，檢索結果將列出所有影片節目；

瀏覽影片內容的步驟：用于進入影片詳情，查看影片詳細編目信息，同時播放瀏覽影片的低碼率視音頻內容；

提交下載請求的步驟：對于所選中的瀏覽影片母版，申請下載；下載時選擇：

影片視音頻文件、某語種音頻文件、某語種字幕文件，并設定下載目標文件的格式；

視頻格式可選擇：4K、2K、HD、SD或其他低碼率格式；

整篇下載或選擇下載：選擇整篇下載則下載完整的影片，選擇下載則選取片段或場景或鏡頭進行下載；

轉碼合成的步驟：用于轉碼子系統根據下載請求，讀取視音頻、音頻、字幕文件以及時碼關系，進行轉碼合成，生成預先設定的影片格式文件；

輸出的步驟：用于將合成的影片格式文件通過輸出端輸出。

本發明產生的有益效果是：本發明通過畫面壓縮和瀏覽增加多種語言等方式，在最大程度保證影片聲畫質量的前提下，縮小影片多版本的存儲空間，優化影片存儲制作過程，提高影片應用時的效率。同時通過言語和畫面分開存儲的方式，允許多種言語的對白和字幕產生，形成畫面和字幕、語言的多種版本，以適應多種用戶的需要。

附圖說明

下面結合附圖和實施例對本發明作進一步說明。

圖1是本發明實施例一所述方法所使用的系統原理圖；

圖2是本發明實施例一所述方法的流程圖；

圖3是本發明實施例二、三所述方法的流程圖；

圖4是本發明實施例四所述方法所使用的系統原理圖；

圖5是本發明實施例四所述方法的流程圖。

具體實施方式

實施例一：

本實施例是一種電影數字節目的存儲方法。本實施例所述方法所使用的系統包括：畫面文件壓縮子系統、音頻采集子系統、聲畫同步子系統、低碼率轉碼子系統、編目子系統、媒資數據庫、多種語言采集子系統、對白字幕制作子系統，如圖1所示，所述方法的流程如圖2所示。

本實施例所述的系統采取雙網結構和以標清素材進行預編輯的方式。

雙網結構：雙網結構使得視音頻數據交換和信息數據交換各自使用不同的鏈路。避免了浪費投資或鏈路阻塞，確保各種數據暢通無阻。

以標清素材進行預編輯：標清設備要比高清設備便宜的多，節省投資；標清素材流量小得多，減少對網絡、存儲器的帶寬要求；標清編輯速度快，先用標清作編輯，可以減少審片可能造成的重新編輯所花費的時間，有利于提高效率。

畫面文件壓縮子系統：電影數字節目平臺及應用管理系統（高清部分）中視頻信號采用無損壓縮（lossless）算法，因此，壓縮后的節目碼率比較高。對1920×1080分辨率的節目來說，其碼率會在400Mbps（50MB/s）左右。如此高的碼率在以太網絡中快速傳輸是不可能實現的，本實施例采用光纖與以太網相結合的存儲區域網絡技術，組織成雙網結構，實現視音頻數據和控制信息的共同傳輸。

同時，考慮到高清節目碼率非常高，如果每一個編輯站點都采用高清素材進行編輯，不僅使設備投資高（高清設備都非常昂貴），站點的數量也受到在線存儲體帶寬的限制無法擴展，編輯和處理速度也大受影響。從優化系統方案的角度，本實施例引入了雙碼率編輯技術。

在電影數字節目平臺及應用管理系統中的視頻素材保存了高標清兩種格式：一種是高碼率的無損壓縮高清素材，用來產生最終的成片節目，細分為24psf與50i兩個版本；另一種是碼率較低的標清素材，用來進行高清預編輯或者標清電視播出，采用成熟的MPEG2格式，分辨率選擇720×576，碼率限制在50Mbps；

在高清編輯過程中，先使用標清素材進行預編輯。因為高標清素材存在幀幀對應的鏡像關系，所以預編輯后，根據EDL碼單信息，通過后臺合成系統進行高清素材的合成，就可以得到制作好的高清節目。

在電影數字節目平臺的編輯應用中，電影節目的雙網、雙碼率編輯技術是首選制作方式，它將帶來低成本、高效率等眾多好處。

低碼率轉碼子系統：主要實現不同格式的視音頻文件之間的轉換，提供多種碼流轉換選擇，并可以完成自動抽取關鍵幀的工作；該子系統的另外一個重要任務是完成電影數字節目庫與外部應用系統之間的影片資料內容交換工作，是與外部系統的一個接口。

音頻采集子系統：如果把所有版本的視音頻數據都直接進行存儲，由于無損壓縮高清視頻具有400Mbps左右的碼率，將給存儲多版本成片節目帶來強大阻礙。

為此，本實施例使用多軌技術實現多版本節目優化存儲，即完整視頻文件＋多語種音頻文件＋多語種字幕文件＋EDL碼單的多種組合，對應不同版本的方式解決這個問題。

由于不同語種的電影版本只是對白聲音和對白字幕不同，一部影片以50i版本的完整的視頻文件與國際聲音頻文件為基礎，結合多語種的聲音和字幕文件就可組成各種需要的電影版本。

對于部分內容需要限制的影片，根據審核需求，通過編輯軟件進行剪輯后，形成一個版本，實際上這種剪輯是對時碼信息的編輯。存儲系統不需要存儲成片節目，而是存儲包含了該版本所有剪輯信息的EDL碼單。通過該EDL碼單的信息和影片素材，在任何時候都可以直接產生對應的成片節目。當某個版本的成片節目需要被調用時，系統將原始高清視音頻、字幕素材遷回，并將相應的EDL碼單調回，通過后臺合成系統，自動形成所需的節目。

對于24psf版本，由于與50i版本有明確的時碼對應關系，通過后臺算法支持也可以比較精確的進行幀定位，保證再利用的效率。

對于電影節目的多版本現象，本實施例的這個方法可以節省大量的存儲空間，應用起來也更加靈活。該技術的使用，對于節目庫來說，具有重要的實際意義。

聲畫同步子系統：電影對白字幕一般以場記字幕的形式存在，正規的制片廠的場記字幕不僅會記錄對白的內容，也會記錄對白發生的時間，這個時間將會以電影膠片的畫面格數來計量。電影節目數字化以后，對白字幕作為一種獨立的素材也將被納入平臺中來管理。數字平臺要求對白字幕和視音頻節目的時碼相對應，因此需要電影場記字幕與節目庫對白字幕之間的格式轉換。

當一部影片存在多個語言版本時，不需要存儲多個視頻文件，只需要存儲不帶字幕的原始視頻，再配以相應的字幕版本，通過混合字幕與視頻即可得到所需語言版本的影片。

對白字幕與視頻分開存儲，并攜帶時碼信息，使得制作不同語言版本字幕的工作變得比較簡單。

多語種對白字幕處理技術的應用，對于降低成本，豐富應用及簡化流程都起到了重要的作用。

本實施例多語種對白處理技術特點：

對白字幕與視音頻分別存儲、隨意組合，減少因對白字幕不同而造成的存儲量增加。

場記字幕自動轉換為電影節目對白字幕，避免了手工編輯對白字幕的工作，降低了編輯對白字幕的工作強度，提高了對白字幕的準確度。

存儲的對白字幕以獨立文件形式存在，可以根據需要選擇字體、字號，靈活性大，使得改變字幕效果、改變語種等工作簡單化。

對白字幕格式中包含了足夠信息，以應對高清電影播出或者字幕與畫面的疊加。

媒資數據庫：為了實現電影的價值最大化，媒資數據庫中保存的節目素材將是完整的影片素材。而從應用的角度出發，對于不同的發布方向、不同的用戶群，一部高清電影節目素材可能對應多個成片版本。由于采取單獨的語種文件存儲的方式，多語種、多版本節目同時共存，但是卻不增加存儲空間。修改節目時，可以基于上次的編輯基礎，比重新制作編輯的效率要高得多，快捷方便。查找、刪除處理都比存儲整個成片要方便，便于管理。

本實施例所述的媒資數據庫面向于電影應用，也面向于高清電視應用，因此，從檢索查詢的角度講，不同應用使用的編目標準不同。為了實現節目庫的增值利用最大化，應該充分結合電影的編目特點與電視編目標準。

原有的電視與電影編目標準中，主要描述了對電影膠片和標清電視視音頻的編目。節目庫中是以數字高清電影節目為核心的資料庫，原有編目體系對這個領域并沒有建立相應的編目標準。因此，需要基于節目庫的特點，對原有編目標準進行吸收和擴展，既要滿足數字高清電影的新特點，又要繼承原有的電影及電視編目標準。具體來說，本實施例的編目設計有如下特點：

1）樹形的編目結構：樹形的編目結構可以支持電影節目的多版本，有利于降低成本及再利用。

2）電影標準到電視標準的對應：電影標準與電視標準在字段描述上有很大差別，為了能夠適應兩個領域的檢索用戶，電影節目庫在編目時將根據情況自動建立電影標準字段到電視編目標準的對應關系。不論是廣播電視工作者還是電影工作者都可以根據專業習慣輕松檢索到所需資源。

3）可擴展的編目內容：隨著編目標準的發展可以擴展庫存中影片的編目字段。

4）可配置的多層編目流程：提供節目層、視頻層（鏡頭、場景、片段）的多層次編目。

上述的編目標準和檢索系統特點：針對節目庫的要求，兼收并蓄，同時又有發展創新，滿足電影和電視的交叉應用。編目設計上充分考慮易用性、擴展性，為將來的使用和升級留出空間。編目結構設計詳盡，為多層次綜合利用電影素材提供了技術基礎。

本實施例所述方法的詳細步驟如下，所述方法的流程如圖2所示：

1.畫面文件采集的步驟：用于采集影片畫面母版，如果影片母版畫面源為膠轉磁，則掃描生成圖像序列文件，此過程中采用的無損壓縮算法，可以保證視頻壓縮文件可逐bit還原為原始DPX圖片，如果影片母版為數字電影母版，則直接采集為圖像序列文件。

采集包括高清和標清版本的獲取和瀏覽版本節目獲取。

目前的高清節目源，其分辨率都是1920x1080，幅寬比是16:9（保留影片實際幅寬比）。高清素材應用有兩個，一個是數字電影應用，另一個是高清電視應用，因此頻率是24psf和50i兩種。獲取高清版本的素材，涉及到的過程是編碼。

高清膠轉磁采集：高清上下載服務器采集由Da Vinci輸出的HD-SDI視頻信號，生成Zaxel無損壓縮格式的AVI視頻文件。由于膠轉磁系統節目源為多本翻正膠片，因此采集需要進行多次，生成多個無損壓縮視頻文件。

從高清版本的素材得到標清版本，其處理過程涉及到兩個方面，一是畫面縮小，即下變換，二是編碼。下變換的方法和標清版本素材的后續使用有關，需要結合后續業務流程來設計，建議采用硬件下變換的方式獲得。標清素材的分辨率是720x576，畫面選擇為16:9幅寬比（保留影片實際幅寬比）。標清素材應用于標清電視頻道，頻率應該為標準的50i。

瀏覽素材用于檢索，它應當反映高清素材的整體畫面。而從應用要求上來講，其分辨率可以是任意的（但是要滿足MPEG壓縮的要求，即寬高比是16的倍數）。瀏覽素材應該被設計成16:9的幅寬比。建議采用352x208分辨率，其幅寬比近似為16:9。瀏覽版本素材可以從標清版本素材獲得。2.畫面文件壓縮的步驟：用于畫面文件壓縮子系統將圖像序列文件轉碼為無損壓縮視頻文件。視頻編碼格式的選擇一方面取決于對于畫面質量及應用的要求，另一方面取決于存儲容量的限制，綜合考慮現有的編碼技術的優劣以及可行性，本系統2K/4K素材及高清視頻素材采用無損壓縮（lossless）編碼格式、標清視頻素材采用MPEG－2編碼格式；瀏覽素材應用于網絡檢索，采用主流的流媒體WMV格式。

3.聲音文件采集側步驟：用于音頻采集子系統對影片的錄音帶進行數字化采集，采集生成PCM取樣的多聲道的聲音文件，本步驟或與“畫面文件采集的步驟”和“畫面文件壓縮的步驟”同步進行。

高清節目源的音頻信號包括非壓縮信號（最多8個通道）、5.1聲道、立體聲、單聲道；主要載體為8軌錄音帶或者D5錄像帶。不管是哪種信號都采集成PCM的WAV文件保存。

A．主語言音頻獲取：

主語言音頻若與視頻同時進行采集時，生成的文件為視音頻交織的混合文件，為進行分離存儲和管理，需要進行視音頻分離。分離后形成獨立的視頻文件（Zaxel文件）和音頻文件（多個WAV文件），獨立存儲。

B．多語言音頻獲取：

多語言音頻可能為國際聲（左右聲道）、也可能是完整5.1的聲道；采集一般是獨立進行，所以通過音頻工作站直接采集生成WAV文件。

C．立體聲音頻獲取：

立體聲音頻需要由主語言或者多語言無損壓縮音頻下混（Down Mix）獲得，從簡化流程考慮，Down Mix最好使用軟件算法（參照《ATSC AC3標準》①）直接進行，音頻質量完全能夠保證。

D．流媒體獲取：

標清視頻與立體聲音頻進行流媒體轉碼獲得WMV文件。

4.聲畫同步的步驟：用于將分離采集的畫面文件和聲音文件，在聲畫同步子系統中進行聲畫同步，主要方法是在時間線上瀏覽視頻和音頻，以畫面內容為參照物，通過聲音波形、聲音回放尋找音頻與視頻在時間上的偏移量，反復調整便宜量，使得畫面口型與聲音達成匹配，確認偏移量后，鎖定聲音與視頻的同步關系。

5.轉低碼率的步驟：用于轉碼集群子系統讀取影片的無損壓縮視頻和聲音文件，根據同步關系生成低碼率視音頻流媒體文件，該低碼率文件的時碼與無損壓縮視頻文件的時碼幀幀對應。

為使編輯更加方面并節省網絡資源，本實施例采取編制低碼率的流媒體文件。在編輯過程中使用低碼率的流媒體文件，當編輯完成后，使用了高清播放，這樣可以有效的節約編輯過程中的硬件資源。

6.編目的步驟：用于參照低碼率視音頻文件，可以對影片進行編目著錄，包括：對影片的節目層進行編目，填寫影片的基本信息。

編目是通過建立Metadata對象，對影片數字資源進行組織、整理和充分的揭示，建立電影各種格式資料之間的對象耦合形式的聯系，從而使影片資產的管理更加規范和方便。

瀏覽低碼率視音頻內容，在播放器上標記入點、出點，將入出點間內容記錄為一個片段，對片段進行編目，填寫片段的屬性信息；或基于低碼率標記場景、鏡頭，分別進行詳細編目；編目信息使用媒資數據庫進行存儲。

一般來說，一段視頻由一些描述獨立故事單元的場景構成；一個場景由一些語義相關的鏡頭組成；而每個鏡頭是由一些連續的幀構成，它可由一個或多個關鍵幀表示。

文本索引使用關鍵詞作為標識句子、段落、文檔的指針，同樣在視頻流信息中，關鍵幀起著與關鍵詞類似的作用。人們常用關鍵幀來標識場景、故事等高層語義單元。比幀高級一些的視頻基本單元是鏡頭，通常視頻流中的鏡頭由在時間上連續的視頻幀組成，它代表一個場景中在時間上和空間上連續的動作，對應著攝像機的一次紀錄起停操作。鏡頭之間可存在多種類型的過渡方式，最常見的是切變(Cut)，表現為在相鄰幀之間發生突變性的鏡頭轉換。此外，還存在一些較復雜的過渡方式，如漸變等。

自動化提取關鍵幀：

典型的關鍵幀抽取算法主要可分下面幾類：

基于鏡頭的方法：為每個鏡頭選取一個關鍵幀，例如將每個鏡頭的第一幀選作關鍵幀，這種方法的運算量小，非常適合于內容活動性小或保持不變的鏡頭，但對于攝像機不斷運動的鏡頭，該方法抽取的關鍵幀無法有效地表達其主要內容。

基于內容分析的方法：這種方法通過分析視頻內容(顏色直方圖、運動信息)隨時間的變化情況來選取所需關鍵幀的數目，并按照一定的規則為鏡頭抽取關鍵幀。

基于運動分析的方法：該方法通過對每幀光流的計算，尋找攝像機運動的局部最小點，對應的幀將選作關鍵幀，這種選擇基于如下的觀察，當攝像機停留時通常意味著重要人物或事件的存在。

當然還有其他的方法，例如用基于鏡頭活動性的方法，無監督聚類技術來選擇關鍵幀等等。

鏡頭分割：

通常視頻流中的鏡頭，是由時間連續的視頻幀組成的。它對應著攝像機一次記錄的起停操作，代表一個場景在時間上和空間上的連續的動作。鏡頭之間有多種類型的過渡方式，最常見的是“切變”，表現為在相鄰兩幀間發生的突變性的鏡頭轉換。此外，還存在一些較復雜的過渡方式，如淡入、淡出等。

鏡頭分割方法分為非壓縮域和壓縮域兩類。

非壓縮域方法有基于幀差（frame difference）的點到點比較和直方圖2種，由于點到點的幀差比較算法對于噪聲過于敏感，目前大多非壓縮域算法都是基于直方圖的。壓縮域方法基于視頻幀圖像的壓縮基礎之上，切分的依據是比較前后視頻幀圖像的壓縮系數（一般為DCT系數），當滿足一定條件時即把它們切分為2組鏡頭。

目前基于非壓縮域的抽幀軟件，可以在視頻上載同時提取切變幀或漸變幀，也可以實現對已上載完成的MPEG2 I幀，IBP幀，MPEG4和DV等視頻格式文件的自動化抽幀。同時我們正在尋求廣泛的技術合作，也可以在自己的編目和上載系統中集成如VIRAGE和KONAN等公司的技術。

通過采用主題分類對照表以及后控詞表，可以實現系統的自動主題標引或自動分類標引。如果系統采用了前面提到的基于內容的關鍵詞提取（CKM）技術，則自動分類標引技術可以在關鍵詞提取的同時對編目記錄進行自動分類，大大提高編目工作效率。

當編目對象具有多層次的結構時，我們可以根據每一個層次的特點采用不同的描述項（或屬性）來對編目對象的內容特征和形式特征進行清晰、完整和準確的描述與揭示，這就是分層編目。分層編目的另一層意義在于：對編目對象進行逐步分析和標引，對于不同類型和再利用價值的對象按照不同的層次深度來分析和標引。

就視頻本身而言，可以分為如下幾個層次：完整視頻、片段、場景、鏡頭、關鍵幀。針對這種復雜的層次等級結構，如果只是采用簡單的沒有層次的標引，將會造成描述信息的雜亂無章。因為，對整個完整視頻文件的概要內容的描述信息將會與對鏡頭的技術細節的描述信息混雜在一起。無論是從編目和檢索再利用的角度來講都是非常不利的。這樣一方面會在檢索時造成查準率的降低，而另一方面也會將大量非常有價值的場景、鏡頭埋沒在完整視頻文件中。

由于分層編目方式比較靈活，可以滿足不同層次的編目需求。一方面可以根據各單位的業務能力來確定編目標引深度。對于人力物力資源非常有限的單位，他們可以只作第一層次的編目，也可以基本滿足檢索的需要。如果有較為豐厚的實力，可以進行非常細致的編目標引工作，提高資源再利用的效率，減少制作成本。另一個方面，還可以根據不同的節目類型確定不同的編目標引深度。例如，新聞中可能會包含比較多的具有再利用價值的鏡頭，在對新聞類節目進行標引時就可以深入到鏡頭層。而綜藝類或游戲類的節目的場景鏡頭可能并沒有太大價值，在標引時就可以只進行完整視頻層的標引。這種靈活的處理方式，可以大大提高編目的效率，避免不必要的勞動。

另外，不同層面的內容在編目中需要的專業技能差別非常大，有些內容例如：題名，語種，責任項等較為簡單，有些內容則需要經過一定的歸納總結如：內容簡介，主題詞，分類等，還有一些內容則非常專業如：拍攝手法等，對于這些不同層次的內容的編目對編目人員的要求相差深遠，通過采用流水線方式對節目資料進行流程化編目可以充分利用現有資源，提高編目效率以及數據質量，是一個很好的解決方案。采用流程化，層次化的編目具備以下特點：

對編目對象進行逐步分析和標引，對于不同類型和再利用價值的對象按照不同的層次深度來分析和標引。

編目方式比較靈活，可以滿足不同層次的編目需求。

編目結構和工作流程清晰。

資源使用效率較高，專業編目人員可以只從事高層次編目工作，避免資源浪費。

數據處理層層把關，編目質量較易控制。

編目責任明確，工作管理較為方便。

7.入庫發布的步驟：用于編目完成后，影片即入庫并對外發布，供用戶檢索瀏覽。

增補多語種聲音采集的步驟：用于其他語種的錄音帶可能在第一個母版入庫后才獲得，音頻采集子系統將每個新增的語種聲音采集為多聲道聲音文件。

實施例二：

本實施例是實施例一的改進，是實施例一的細化。本實施例所述的存儲方法還包括：

增補多語種聲音采集的步驟：用于音頻采集子系統將每個新增的語種聲音采集為多聲道聲音文件。一部電影往往會翻譯成多種語言，供不同母語的觀眾欣賞，因此，一部影片有多種語言版本，采集不同語言版本，將其制作為不同語言的聲音文件存儲。

多語種聲畫同步的步驟：用于采用庫中母版的低碼率視頻為參照物，在聲畫同步系統中尋找新增語種聲音的時碼便宜量，調整便宜量，使得畫面口型與聲音達成匹配，并鎖定新增語種聲音與畫面的同步關系。

如獲取來自影片生產管理系統的相關信息，填充影片生產任務信息等；完成每部影片50i版本高清視頻和標清視頻素材及標清視頻和立體聲音頻素材的同步，完成每部影片24psf版本高清視頻和音頻素材的同步，同時生成同步信息。

增補文件入庫的步驟：用于將增補的各語種的聲音文件入媒資數據庫存儲。入媒資數據庫后，每部影片存儲的文件分別為一個高分辨率的無損壓縮視頻文件、多語種聲音文件、多聲道聲音文件、多個語種的對白字幕文件、一個低碼率視音頻文件，這些文件間在時碼上是幀幀對應的。

實施例三：

本實施例是上述實施例的改進，是上述實施例的細化。本實施例所述的存儲方法還包括：

制作對白字幕的步驟：用于采用庫中母版的低碼率視音頻為參照物，在字幕制作系統中，回放視音頻，并根據畫面、聲音逐句制作對白字幕，形成帶時碼信息的對白字幕文件。

為節省存儲容量及適應DVB的需求，電影數字節目平臺及應用管理系統將對影片的對白字幕進行存儲。

字幕內容將從制片廠獲得，通過格式轉換，使之變為非線性設備可以識別的高清標準對白字幕文件，該字幕文件將以Unicode格式進行保存，以便字體修改及替換。

電影的場記字幕一般是以膠片尺寸作為標準的，而非線性的字幕是以時間碼作為標準的，兩者之間要進行格式轉換。因此字幕文件中不僅含有對白內容，也會含有轉換過來的高清時碼信息，可以與視音頻素材實現幀幀對應。

電影數字節目庫中存儲的數據對象除視音頻、字幕等媒體類數據對象外，還包括用于說明及描述這些數據的索引信息（元數據）。索引類數據對象主要是素材的元數據索引信息，其中部分信息在媒體類數據對象生成同時建立，其余大部分信息需要由編目人員進行補充。

實施例四：

本實施例是一種提取上述存儲文件的電影數字節目的提取方法，所述方法所使用的系統包括：檢索子系統、瀏覽子系統、下載子系統、轉碼合成子系統、輸出端，如圖3所示。

檢索子系統：檢索子系統的目的是通過提供盡可能多的檢索手段和檢索方式為用戶提供檢索服務，例如參量檢索，全文檢索，分類檢索，圖像檢索等。參量檢索就是我們通常所說的指定范圍的關鍵詞檢索，如：題名檢索，日期檢索，欄目檢索等。全文檢索則不關心檢索范圍，一般是針對所有的文字信息進行關鍵詞檢索，這種技術使用起來非常簡單，在互聯網上使用的最為普遍。分類檢索實際上是參量檢索的一種，通過使用標準的分類體系結構，可以方便準確的進行資料檢索。圖像檢索屬于較為前沿的技術，目前較為常用的方式是根據圖像的紋理，色調等特征進行圖像檢索，基于內容的圖像檢索技術目前還尚未成熟。

對于全文檢索方式，如果加入中文智能搜索引擎，可實現包括中文按詞索引、字索引的基于語義辭典等語言學知識的智能檢索，鑒于系統初期業務不大，先采用數據庫本身自有的全文檢索功能。

瀏覽子系統：瀏覽素材用于檢索，它應當反映高清素材的整體畫面。而從應用要求上來講，其分辨率可以是任意的（但是要滿足MPEG壓縮的要求，即寬高比是16的倍數）。瀏覽素材應該被設計成16:9的幅寬比。建議采用352x208分辨率，其幅寬比近似為16:9。瀏覽版本素材可以從標清版本素材獲得。

下載子系統：下載的內容包括：文件下載和高清影片下載。

文件下載：節目庫中高標清視頻、音頻、字幕等素材以文件形式輸出到多種存儲介質上。本期完成數字電影素材、高清素材、標清素材的文件下載，2K/4K文件下載下一期完成。

高清影片下載：高清上下載服務器輸出的HD-SDI視音頻信號錄制到HD－D5或HDCAM－SR。

影片下載需要視音頻、字幕疊加輸出，由于高清影片素材采用無損壓縮（Lossless）編碼，進行這種疊加不僅需要強大的計算能力，也占據了很多的帶寬資源。本實施例采用兩種方法解決字幕版影片下載的問題：

后臺的字幕分布式合成方法，這種方法采用后臺處理方式，對于用戶透明，得到的即是最終下載需要的文件。缺點是下載前需要一定的等待時間。

高清字幕機同步疊加方法，這種方法優點就是無需等待直接下載，但需要對下載系統做簡單設置，保證字幕機聯動輸出。

轉碼合成子系統：在電影數字節目平臺及應用管理系統中，視音頻媒體需要不同格式支持，如素材保存和再利用需要高質量的視音頻編碼格式的支持，節目編輯則需要各種標清視音頻編碼支持，為了便于檢索和Internet視音頻瀏覽，則需要流媒體支持。對于不斷擴展的平臺增值業務，也需要從素材庫中獲得相應格式的素材，以符合不同應用環境的需要。

應對不斷變化的多種視音頻格式的需求，采用純軟件轉碼及合成系統將比較適合。處理整個節目庫的高清、標清素材格式轉換，不僅需要優秀的編解碼算法，硬件環境也顯得很重要，碼率越大需要的CPU運算量越大，若只依靠單臺設備進行高清轉碼及合成，效率就會很低。因此，本實施例采用了多臺轉碼及合成服務器分布式運算的方式，使高清轉碼及合成的方案可行。

轉碼及合成系統的工作任務由Manager進行統一調度，分配給空閑的轉碼及合成服務器，眾多的轉碼及合成服務器組成一個集群，通過分布式計算，可以共同來完成同一個轉碼或合成任務；Manager通過監控轉碼及合成服務器的狀態，來動態調配分段的任務，以使系統運算資源得到最大利用。

通過這種方式可以使原本龐大的高清視音頻數據量被分割處理，通過協同工作，加快轉碼與合成的進程。這樣以廉價的PC Server組成轉碼及合成集群，就可以完成昂貴的UNIX小型機才能處理的工作。

另外，轉碼及合成子系統采用開發式架構設計，系統支持XML、MXF等標準化交換格式，使其不僅能應用于電影數字節目平臺內部、更是整個電影數字節目平臺對外部擴展業務的重要接口，各種外部應用系統通過轉碼及合成系統可以方便的與節目庫進行節目交換。

轉碼合成子系統特點：建立標準系統接口，實現多系統互聯；服務器后臺工作，集群分布式處理，自動地動態調配任務，低成本，高效率；純軟件處理，升級前景好，隨時可以更新算法，而且增加功能時無需增加額外的設備。

輸出端：

本實施例所述方法（流程如圖4所示），包括如下具體步驟：

1.檢索影片的步驟：用于檢索子系統通過全文、關鍵詞的方式在媒資數據庫中對影片進行檢索，檢索結果將列出所有影片節目。

檢索是通過檢索查詢，實現電影數字節目庫中影片數字資源的再利用，其在應用上并不是獨立的，而是緊密融合在各個子系統中，提供方便的資源檢索調用。

2.瀏覽影片內容的步驟：用于進入影片詳情，查看影片詳細編目信息，同時播放瀏覽影片的低碼率視音頻內容。

3.提交下載請求的步驟：對于所選中的瀏覽影片母版，申請下載；下載時選擇：

影片視音頻文件、某語種音頻文件、某語種字幕文件，并設定下載目標文件的格式。

視頻格式可選擇：4K、2K、HD、SD或其他低碼率格式。

整篇下載或選擇下載：選擇整篇下載則下載完整的影片，選擇下載則選取片段或場景或鏡頭進行下載。影片下載申請時，還可選取某個片段、場景或鏡頭，申請下載，后臺轉碼集群系統將根據入出點信息，合成該部分的視音頻內容，生成目標影片文件。

4.轉碼合成步驟：用于轉碼子系統根據下載請求，讀取視音頻、音頻、字幕文件以及時碼關系，進行轉碼合成，生成預先設定的影片格式文件，并通過輸出端輸出。

5. 輸出的步驟：用于將合成的影片格式文件通過輸出端輸出。

最后應說明的是，以上僅用以說明本發明的技術方案而非限制，盡管參照較佳布置方案對本發明進行了詳細說明，本領域的普通技術人員應當理解，可以對本發明的技術方案（比如系統的構成，步驟的先后順序等）進行修改或者等同替換，而不脫離本發明技術方案的精神和范圍。

完整全部詳細技術資料下載

當前第1頁1 2 3

該技術已申請專利。僅供學習研究，如用于商業用途，請聯系技術所有人。
技術研發人員：張紅;郝鵬程;徐宏;牛小明;王曉西;張明;王雅懿;呂鵬;姜博
技術所有人：國家新聞出版廣電總局電影數字節目管理中心;北京中科大洋科技發展股份有限公司
我是此專利的發明人

上一篇：一種智能鞋的制作方法與工藝
下一篇：一種具有防走失功能的硅膠定位鞋的制作方法與工藝

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、王老師：1.數字信號處理 2.傳感器技術及應用 3.機電一體化產品開發 4.機械工程測試技術 5.逆向工程技術研究
2、王老師：1.機器人 2.嵌入式控制系統開發
3、孫老師：1.振動信號時頻分析理論與測試系統設計 2.汽車檢測系統設計 3.汽車電子控制系統設計
4、畢老師：機構動力學與控制
5、袁老師：1.計算機視覺 2.無線網絡及物聯網
如您是高校老師，可以點此聯系我們加入專家庫。

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

數字存儲示波器相關技術

以文本形式存儲的數字相關技術